INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 82

第 2 / 5 页

非代码面试题

显示 20 / 82 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

2667面对重复实体时，按类别分层还不够当同一发行人反复出现且发行人身份本身带有预测信息时，为什么按类别分层的交叉验证仍然可能失败得很厉害？机器学习简单essay未尝试免费 2668即使特征只看过去，为什么仍然需要禁运假设特征只使用过去价格，但标签依赖于一个未来事件窗口内的收益。为什么在验证块周围仍然可能需要设置禁运区？机器学习中等essay未尝试面试订阅 2669为什么 purge 和 embargo 解决的是不同问题为什么在时间序列验证里，purge 与 embargo 并不是同一件事？机器学习中等essay未尝试面试订阅 2670为什么最佳 CV 设计取决于部署单元为什么折分规则应该去贴近模型在生产环境里真正需要泛化的那个单元？机器学习困难essay未尝试面试订阅 4341由流行率与 TPR/FPR 推精确率 1在某个固定阈值下，正例流行率为 20%，TPR 为 80%，FPR 为 10%。这对应的 precision 是多少？机器学习简单数值题未尝试面试订阅 4342流行率漂移下的 precision 2某个欺诈模型在新市场里仍保持 TPR = 0.90、FPR = 0.03，但正例流行率从 10% 降到了 2%。在同一阈值下，现在应预期什么 precision？机器学习简单数值题未尝试面试订阅 4343Brier 分数计算 3预测概率为 [0.8, 0.6, 0.3, 0.1]，真实标签为 [1, 0, 1, 0]。Brier score 是多少？机器学习简单数值题未尝试面试订阅 4344ECE 分箱计算 4使用等样本权重的 expected calibration error。现在有两个非空分箱：A 箱的预测概率是 [0.2, 0.3]，标签是 [0, 1]；B 箱的预测概率是 [0.8, 0.9]，标签是 [1, 1]。按 ECE = 各箱 (样本占比)*|平均置信度 - 准确率| 计算，结果是多少？机器学习简单数值题未尝试面试订阅 4345校准概率对应的期望正例数 5某个模型对一个包含 200 个标的的分组给出的平均预测概率是 0.18。如果模型是校准的，那么这个分组里平均应出现多少个正例？机器学习简单数值题未尝试面试订阅 4346由 ROC 点映射到 PR 点 6在某个阈值下，正例流行率是 5%，TPR 是 80%，FPR 是 10%。这个 ROC 空间中的点对应到 PR 空间时，(recall, precision) 是什么？机器学习中等数值题未尝试面试订阅 4347总体平均概率对应的期望正例 7在 500 个样本上，一个校准模型的平均预测概率是 0.12。总体上平均应出现多少个正例？机器学习中等数值题未尝试面试订阅 4348整体校准偏差 8在一个验证集上，模型的平均预测概率是 9%，而实际正例比例是 6%。这意味着多大的整体校准偏差（calibration-in-the-large error）？机器学习中等数值题未尝试面试订阅 4349按错判成本算期望损失 9某个阈值规则运行在一个正例流行率为 10% 的样本空间里，其 TPR 为 70%，FPR 为 5%。若漏判一个正例的成本是 4，误报一个负例的成本是 1，那么每个样本的期望错判成本是多少？机器学习中等数值题未尝试面试订阅 4350分箱经验频率与平均预测的偏差 10某个校准分箱包含 80 个标的，平均预测概率为 0.35。如果实际只观察到 20 个正例，那么这个分箱的经验正例率是多少？它相对平均预测低了多少个百分点？机器学习中等数值题未尝试面试订阅 4351非对称代价阈值选择 1同一个分类器的三个候选阈值表现为：t=0.3 -> FP=18, FN=4; t=0.5 -> FP=9, FN=7; t=0.7 -> FP=4, FN=14。若一次 false negative 的代价是 5，一次 false positive 的代价是 1，哪个阈值在这个样本上使分类总成本最小？机器学习中等数值题未尝试面试订阅 4356排序质量与概率质量的取舍模型 A 的 ROC AUC 略高，但概率明显过度自信；模型 B 的 ROC AUC 略低，但校准明显更好。如果你需要把预测概率直接拿去做头寸规模决策，通常哪个模型更安全？机器学习中等essay未尝试面试订阅 4357极端不平衡下的指标选择你在筛查极其罕见的欺诈案例，基准发生率低于 1%。为什么在业务讨论里，PR 分析通常比 ROC 分析更有信息量？机器学习中等essay未尝试面试订阅 4358AUC 相同但可靠性不同两个模型的 ROC AUC 几乎一样。一个校准良好，另一个把大多数概率都推到接近 0 或 1。你在选择后者之前，首先应该担心什么？机器学习中等essay未尝试面试订阅 4359阈值需要业务语境为什么在没有给出代价比或者下游资源约束时，就问“最优阈值是什么”是个错误问题？机器学习中等essay未尝试面试订阅 4360分布变化后的校准模型是在去年的数据上做过校准的，但今年事件的基准发生率显然已经改变。你第一步应该重新检查什么校准问题？机器学习中等essay未尝试面试订阅