INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
622

30 / 32

非代码面试题

显示 20 / 622 道匹配题目

答题状态:未尝试未正确已正确
4465宣布分散化之前在说“再加 5 个信号就更分散”之前,第一步应该先检查什么?机器学习中等essay未尝试面试订阅5016由后验责任度反推竞争分量密度 1在一个双高斯混合模型中,分量 1 的权重为 0.6,分量 2 的权重为 0.4,且某个观测 x 在分量 1 下的密度值为 g1(x)=0.3。E 步给分量 1 分配的后验责任度为 0.75。由此隐含的分量 2 密度值 g2(x) 是多少?机器学习简单数值题未尝试面试订阅5021由 EM 均值更新反推缺失观测 6某高斯混合模型在 M 步把一个分量的均值更新为 0.875。有三个观测以责任度 0.8、0.6 和 0.1 贡献给该分量。已知其中两个观测值为 0 和 1,第三个观测 x 在日志里缺失。由更新后的均值可反推出 x 是多少?机器学习中等数值题未尝试面试订阅5023由 EM 均值更新反推缺失观测 8某高斯混合模型在 M 步把一个分量的均值更新为 0.4。有三个观测以责任度 0.4、0.4 和 0.2 贡献给该分量。已知其中两个观测值为 -1 和 1,第三个观测 x 在日志里缺失。由更新后的均值可反推出 x 是多少?机器学习中等数值题未尝试面试订阅5026由更新后的混合权重反推有效成员数 11一次 EM 拟合使用了 80 个观测,而在 M 步之后某个分量的更新权重为 0.35。分配给该分量的总责任度质量是多少?机器学习简单数值题未尝试面试订阅5031额外分量的 BIC 改进阈值 16一个多出来的混合分量会在样本量 n = 100 上增加 Delta k = 3 个自由参数。在 BIC = -2 log L + k log n 的定义下,较大模型要被偏好,最少需要多大的对数似然改进 Delta log L?机器学习中等数值题未尝试面试订阅5036EM 混合模型诊断 21为什么在混合模型训练中,某个 EM 分量有时会塌缩到单个点并伴随接近零的方差?机器学习困难essay未尝试面试订阅5037EM 混合模型诊断 22为什么同一份数据上的两次 EM 运行,即使到达了相近的似然值,也可能落在明显不同的混合参数上?机器学习困难essay未尝试面试订阅5038EM 混合模型诊断 23为什么标签交换在混合模型里并不是 bug,但在比较不同运行结果时仍然很麻烦?机器学习困难essay未尝试面试订阅5039EM 混合模型诊断 24为什么 k-means 与“共享球形协方差”的高斯混合模型常会给出相似聚类,但在边界样本上仍可能意见不同?机器学习困难essay未尝试面试订阅5040EM 混合模型诊断 25为什么一个交易台在把混合模型分量解释成经济状态之前,应当格外谨慎?机器学习困难essay未尝试面试订阅5041反推缺失折的性能差 1一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[0.02, 0.01, -0.01, 0.03]。交易台报告说 5 折的总体平均差为 0.01。缺失的第 5 折差值是多少?机器学习中等数值题未尝试面试订阅5042反推缺失折的性能差 2一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[0.05, 0.02, 0.04, -0.01]。交易台报告说 5 折的总体平均差为 0.026。缺失的第 5 折差值是多少?机器学习中等数值题未尝试面试订阅5043反推缺失折的性能差 3一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[-0.02, 0.01, 0.0, -0.01]。交易台报告说 5 折的总体平均差为 0.002。缺失的第 5 折差值是多少?机器学习中等数值题未尝试面试订阅5044反推缺失折的性能差 4一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[0.01, 0.01, 0.02, 0.0]。交易台报告说 5 折的总体平均差为 0.014。缺失的第 5 折差值是多少?机器学习中等数值题未尝试面试订阅5045反推缺失折的性能差 5一项 5 折交叉验证比较记录了四个配对得分差(模型 A 减模型 B):[0.04, -0.02, 0.01, 0.02]。交易台报告说 5 折的总体平均差为 0.01。缺失的第 5 折差值是多少?机器学习中等数值题未尝试面试订阅5046由 McNemar 摘要反推不一致计数 6两个分类器在同一测试集上比较。已知不一致样本总数为 b+c=16,且模型 A 更好,因此 b>c。同时连续性修正后的 McNemar 统计量为 3.0625。由此隐含的 (b,c) 是多少?机器学习中等数值题未尝试面试订阅5051成本敏感部署选择 11模型 A 在验证集上产生 8 个假阳性和 2 个假阴性;模型 B 产生 6 个假阳性和 5 个假阴性。若一个假阴性的成本是 10,一个假阳性的成本是 1,哪一个模型的验证成本更低?两者成本分别是多少?机器学习中等数值题未尝试面试订阅5061为什么嵌套评估重要为什么把两个已经调过参的模型,直接拿在同一组“调参时用过的验证折”上比较,会是不公平的?机器学习困难essay未尝试面试订阅5062为什么相关性重要为什么当模型评分来自相互重叠的滚动窗口时,标准 iid 显著性论证往往会过于乐观?机器学习困难essay未尝试面试订阅