INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 622

第 30 / 32 页

非代码面试题

显示 20 / 622 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

4465宣布分散化之前在说“再加 5 个信号就更分散”之前，第一步应该先检查什么？机器学习中等essay未尝试面试订阅 5016由后验责任度反推竞争分量密度 1在一个双高斯混合模型中，分量 1 的权重为 0.6，分量 2 的权重为 0.4，且某个观测 x 在分量 1 下的密度值为 g1(x)=0.3。E 步给分量 1 分配的后验责任度为 0.75。由此隐含的分量 2 密度值 g2(x) 是多少？机器学习简单数值题未尝试面试订阅 5021由 EM 均值更新反推缺失观测 6某高斯混合模型在 M 步把一个分量的均值更新为 0.875。有三个观测以责任度 0.8、0.6 和 0.1 贡献给该分量。已知其中两个观测值为 0 和 1，第三个观测 x 在日志里缺失。由更新后的均值可反推出 x 是多少？机器学习中等数值题未尝试面试订阅 5023由 EM 均值更新反推缺失观测 8某高斯混合模型在 M 步把一个分量的均值更新为 0.4。有三个观测以责任度 0.4、0.4 和 0.2 贡献给该分量。已知其中两个观测值为 -1 和 1，第三个观测 x 在日志里缺失。由更新后的均值可反推出 x 是多少？机器学习中等数值题未尝试面试订阅 5026由更新后的混合权重反推有效成员数 11一次 EM 拟合使用了 80 个观测，而在 M 步之后某个分量的更新权重为 0.35。分配给该分量的总责任度质量是多少？机器学习简单数值题未尝试面试订阅 5031额外分量的 BIC 改进阈值 16一个多出来的混合分量会在样本量 n = 100 上增加 Delta k = 3 个自由参数。在 BIC = -2 log L + k log n 的定义下，较大模型要被偏好，最少需要多大的对数似然改进 Delta log L？机器学习中等数值题未尝试面试订阅 5036EM 混合模型诊断 21为什么在混合模型训练中，某个 EM 分量有时会塌缩到单个点并伴随接近零的方差？机器学习困难essay未尝试面试订阅 5037EM 混合模型诊断 22为什么同一份数据上的两次 EM 运行，即使到达了相近的似然值，也可能落在明显不同的混合参数上？机器学习困难essay未尝试面试订阅 5038EM 混合模型诊断 23为什么标签交换在混合模型里并不是 bug，但在比较不同运行结果时仍然很麻烦？机器学习困难essay未尝试面试订阅 5039EM 混合模型诊断 24为什么 k-means 与“共享球形协方差”的高斯混合模型常会给出相似聚类，但在边界样本上仍可能意见不同？机器学习困难essay未尝试面试订阅 5040EM 混合模型诊断 25为什么一个交易台在把混合模型分量解释成经济状态之前，应当格外谨慎？机器学习困难essay未尝试面试订阅 5041反推缺失折的性能差 1一项 5 折交叉验证比较记录了四个配对得分差（模型 A 减模型 B）：[0.02, 0.01, -0.01, 0.03]。交易台报告说 5 折的总体平均差为 0.01。缺失的第 5 折差值是多少？机器学习中等数值题未尝试面试订阅 5042反推缺失折的性能差 2一项 5 折交叉验证比较记录了四个配对得分差（模型 A 减模型 B）：[0.05, 0.02, 0.04, -0.01]。交易台报告说 5 折的总体平均差为 0.026。缺失的第 5 折差值是多少？机器学习中等数值题未尝试面试订阅 5043反推缺失折的性能差 3一项 5 折交叉验证比较记录了四个配对得分差（模型 A 减模型 B）：[-0.02, 0.01, 0.0, -0.01]。交易台报告说 5 折的总体平均差为 0.002。缺失的第 5 折差值是多少？机器学习中等数值题未尝试面试订阅 5044反推缺失折的性能差 4一项 5 折交叉验证比较记录了四个配对得分差（模型 A 减模型 B）：[0.01, 0.01, 0.02, 0.0]。交易台报告说 5 折的总体平均差为 0.014。缺失的第 5 折差值是多少？机器学习中等数值题未尝试面试订阅 5045反推缺失折的性能差 5一项 5 折交叉验证比较记录了四个配对得分差（模型 A 减模型 B）：[0.04, -0.02, 0.01, 0.02]。交易台报告说 5 折的总体平均差为 0.01。缺失的第 5 折差值是多少？机器学习中等数值题未尝试面试订阅 5046由 McNemar 摘要反推不一致计数 6两个分类器在同一测试集上比较。已知不一致样本总数为 b+c=16，且模型 A 更好，因此 b>c。同时连续性修正后的 McNemar 统计量为 3.0625。由此隐含的 (b,c) 是多少？机器学习中等数值题未尝试面试订阅 5051成本敏感部署选择 11模型 A 在验证集上产生 8 个假阳性和 2 个假阴性；模型 B 产生 6 个假阳性和 5 个假阴性。若一个假阴性的成本是 10，一个假阳性的成本是 1，哪一个模型的验证成本更低？两者成本分别是多少？机器学习中等数值题未尝试面试订阅 5061为什么嵌套评估重要为什么把两个已经调过参的模型，直接拿在同一组“调参时用过的验证折”上比较，会是不公平的？机器学习困难essay未尝试面试订阅 5062为什么相关性重要为什么当模型评分来自相互重叠的滚动窗口时，标准 iid 显著性论证往往会过于乐观？机器学习困难essay未尝试面试订阅