第 17 / 37 页
非代码面试题
显示 20 / 738 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
4363选阈值之前在优化分类阈值之前,第一步应该明确哪一个量?机器学习中等essay未尝试面试订阅4364信任 AUC 之前重训后 AUC 略有提升。在宣布新模型“实际更好”之前,第一步应该问什么?机器学习中等essay未尝试面试订阅4365只有校准还不够为什么面对一个校准完美但排序能力很弱的模型时,你仍然应该犹豫?机器学习中等essay未尝试面试订阅4376极度不平衡且有审查额度时先看什么指标 11正例只占 1%,而业务团队每天只能人工核查前 100 个告警。此时在调阈值时,应该优先强调 PR 类指标还是 ROC 类指标?机器学习中等essay未尝试面试订阅4377标准化放在 CV 外面的主要问题 12如果先在全量数据上拟合标准化,再去做交叉验证,而不是把标准化放到每个 fold 里重做,这个调参流程的主要问题是什么?机器学习中等essay未尝试面试订阅4378预算有限时随机搜还是网格搜 13你最多只能承担 30 次评估,而经验表明只有少数几个超参数真正重要,其他都比较弱。在这种情况下,通常应先试 grid search 还是 random search?机器学习中等essay未尝试面试订阅4379小样本大搜索时是否适合嵌套 CV 14数据很少,但超参数搜索空间很大,你又希望在调参之后得到尽量无偏的性能估计。尽管成本高,这时从概念上看 nested CV 是否合适?机器学习中等essay未尝试面试订阅4380反复盯着 CV 调参的核心风险 15某位研究员不断重复调参循环,直到某个超参数设置在交叉验证上以极小优势胜出。这种做法的核心风险是什么?机器学习中等essay未尝试面试订阅4381时段差异很大时的第一反应 16由于不同时间段的行为差异很大,各个 fold 的分数波动剧烈。在轻信一个平均 CV 分数之前,调参时首先该考虑什么?机器学习中等essay未尝试面试订阅4382最优点落在边界时下一步做什么 17当前搜索里,最优分数出现在正则强度网格的最大取值上。这通常说明下一步应该做什么?机器学习中等essay未尝试面试订阅4383训练升验证平时的调参方向 18随着模型容量增加,训练表现持续提高,但验证表现基本不动。从调参角度看,下一步更应该往什么方向测试?机器学习中等essay未尝试面试订阅4384好区域很宽时还要不要加密搜索 19某次 random search 在一个很宽的超参数区域里都不断找到相近的好结果。这通常说明把那个区域的搜索网格继续大幅加密,边际价值如何?机器学习中等essay未尝试面试订阅4385单个小 fold 主导波动时先改什么 20如果某个交叉验证 fold 明显比其他 fold 小得多,并且主导了平均分的波动,那么调参时首先该处理什么设计问题?机器学习中等essay未尝试面试订阅4386训练高验证低时先查什么 21训练 AUC 很高,但交叉验证 AUC 接近随机。在继续尝试更多超参数值之前,第一步应该检查什么?机器学习中等essay未尝试面试订阅4387差距远小于标准误时如何解读 22两个超参数设置的平均 CV 分数只差 0.001,而估计标准误却有 0.010。第一反应应该如何解读这种结果?机器学习中等essay未尝试面试订阅4388短窗口在回测赢了但实盘变差时先查什么 23某次时间序列调参表明很短的 lookback window 表现最好,但最近的实盘表现却明显恶化。在扩大搜索范围之前,首先应检查什么?机器学习中等essay未尝试面试订阅4389编码器放错位置时的立刻修正 24某个类别编码器先在全量样本上拟合了一次,然后被重复用于交叉验证里的各个 fold。立即应该如何修正?机器学习中等essay未尝试面试订阅4390双边界同时命中时下一步 25当前最优设置同时落在学习率网格和正则网格的边界极值上。下一步搜索最合理的动作是什么?机器学习中等essay未尝试面试订阅4401收盘到收盘泄露你在今天收盘前做出预测,目标是明天的 close-to-close 收益率,但某个特征使用了今天正式收盘竞价后的最终收盘价。为什么这构成泄露?机器学习中等essay未尝试面试订阅4402标签重叠陷阱你每天都构造一个未来 5 日收益标签,然后把相邻样本当作独立样本来用。这里的结构性问题是什么?机器学习中等essay未尝试面试订阅