INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 738

第 17 / 37 页

非代码面试题

显示 20 / 738 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

4363选阈值之前在优化分类阈值之前，第一步应该明确哪一个量？机器学习中等essay未尝试面试订阅 4364信任 AUC 之前重训后 AUC 略有提升。在宣布新模型“实际更好”之前，第一步应该问什么？机器学习中等essay未尝试面试订阅 4365只有校准还不够为什么面对一个校准完美但排序能力很弱的模型时，你仍然应该犹豫？机器学习中等essay未尝试面试订阅 4376极度不平衡且有审查额度时先看什么指标 11正例只占 1%，而业务团队每天只能人工核查前 100 个告警。此时在调阈值时，应该优先强调 PR 类指标还是 ROC 类指标？机器学习中等essay未尝试面试订阅 4377标准化放在 CV 外面的主要问题 12如果先在全量数据上拟合标准化，再去做交叉验证，而不是把标准化放到每个 fold 里重做，这个调参流程的主要问题是什么？机器学习中等essay未尝试面试订阅 4378预算有限时随机搜还是网格搜 13你最多只能承担 30 次评估，而经验表明只有少数几个超参数真正重要，其他都比较弱。在这种情况下，通常应先试 grid search 还是 random search？机器学习中等essay未尝试面试订阅 4379小样本大搜索时是否适合嵌套 CV 14数据很少，但超参数搜索空间很大，你又希望在调参之后得到尽量无偏的性能估计。尽管成本高，这时从概念上看 nested CV 是否合适？机器学习中等essay未尝试面试订阅 4380反复盯着 CV 调参的核心风险 15某位研究员不断重复调参循环，直到某个超参数设置在交叉验证上以极小优势胜出。这种做法的核心风险是什么？机器学习中等essay未尝试面试订阅 4381时段差异很大时的第一反应 16由于不同时间段的行为差异很大，各个 fold 的分数波动剧烈。在轻信一个平均 CV 分数之前，调参时首先该考虑什么？机器学习中等essay未尝试面试订阅 4382最优点落在边界时下一步做什么 17当前搜索里，最优分数出现在正则强度网格的最大取值上。这通常说明下一步应该做什么？机器学习中等essay未尝试面试订阅 4383训练升验证平时的调参方向 18随着模型容量增加，训练表现持续提高，但验证表现基本不动。从调参角度看，下一步更应该往什么方向测试？机器学习中等essay未尝试面试订阅 4384好区域很宽时还要不要加密搜索 19某次 random search 在一个很宽的超参数区域里都不断找到相近的好结果。这通常说明把那个区域的搜索网格继续大幅加密，边际价值如何？机器学习中等essay未尝试面试订阅 4385单个小 fold 主导波动时先改什么 20如果某个交叉验证 fold 明显比其他 fold 小得多，并且主导了平均分的波动，那么调参时首先该处理什么设计问题？机器学习中等essay未尝试面试订阅 4386训练高验证低时先查什么 21训练 AUC 很高，但交叉验证 AUC 接近随机。在继续尝试更多超参数值之前，第一步应该检查什么？机器学习中等essay未尝试面试订阅 4387差距远小于标准误时如何解读 22两个超参数设置的平均 CV 分数只差 0.001，而估计标准误却有 0.010。第一反应应该如何解读这种结果？机器学习中等essay未尝试面试订阅 4388短窗口在回测赢了但实盘变差时先查什么 23某次时间序列调参表明很短的 lookback window 表现最好，但最近的实盘表现却明显恶化。在扩大搜索范围之前，首先应检查什么？机器学习中等essay未尝试面试订阅 4389编码器放错位置时的立刻修正 24某个类别编码器先在全量样本上拟合了一次，然后被重复用于交叉验证里的各个 fold。立即应该如何修正？机器学习中等essay未尝试面试订阅 4390双边界同时命中时下一步 25当前最优设置同时落在学习率网格和正则网格的边界极值上。下一步搜索最合理的动作是什么？机器学习中等essay未尝试面试订阅 4401收盘到收盘泄露你在今天收盘前做出预测，目标是明天的 close-to-close 收益率，但某个特征使用了今天正式收盘竞价后的最终收盘价。为什么这构成泄露？机器学习中等essay未尝试面试订阅 4402标签重叠陷阱你每天都构造一个未来 5 日收益标签，然后把相邻样本当作独立样本来用。这里的结构性问题是什么？机器学习中等essay未尝试面试订阅