INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 4169

第 146 / 209 页

非代码面试题

显示 20 / 4169 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

4371更密的对数网格带来多少额外训练 6某个正则强度 C 的搜索网格从 5 个对数间隔值扩展到 9 个，而其他设置不变。若另一个超参数有 4 个取值，并使用 6 折交叉验证，那么更密的 C 网格会额外带来多少次模型训练？机器学习中等数值题未尝试面试订阅 4372随机搜索命中好区域的概率 7某个随机搜索会独立抽取 20 个配置，而真正好的区域占整个超参数空间的 8%。至少命中一次该区域的概率是多少？机器学习中等数值题未尝试面试订阅 4373不同保留比例下的训练节省 8successive halving 从 64 个配置开始。比较两种总共 3 轮的保留策略：每轮保留一半 vs 每轮保留四分之一。后者会少训练多少次模型？机器学习中等数值题未尝试面试订阅 4374折数减半带来的训练节省 9一次调参运行要测试 30 个配置。如果在配置集合不变的情况下，把 10 折交叉验证改成 5 折，会节省多少次模型训练？机器学习中等数值题未尝试面试订阅 4375预算增加后的额外耗时 10某个随机搜索的预算从 40 个配置增加到 55 个。每个配置都使用 4 折交叉验证，并且每次训练耗时 12 分钟。如果串行执行，这会额外增加多少训练时间？机器学习中等数值题未尝试面试订阅 4376极度不平衡且有审查额度时先看什么指标 11正例只占 1%，而业务团队每天只能人工核查前 100 个告警。此时在调阈值时，应该优先强调 PR 类指标还是 ROC 类指标？机器学习中等essay未尝试面试订阅 4377标准化放在 CV 外面的主要问题 12如果先在全量数据上拟合标准化，再去做交叉验证，而不是把标准化放到每个 fold 里重做，这个调参流程的主要问题是什么？机器学习中等essay未尝试面试订阅 4378预算有限时随机搜还是网格搜 13你最多只能承担 30 次评估，而经验表明只有少数几个超参数真正重要，其他都比较弱。在这种情况下，通常应先试 grid search 还是 random search？机器学习中等essay未尝试面试订阅 4379小样本大搜索时是否适合嵌套 CV 14数据很少，但超参数搜索空间很大，你又希望在调参之后得到尽量无偏的性能估计。尽管成本高，这时从概念上看 nested CV 是否合适？机器学习中等essay未尝试面试订阅 4380反复盯着 CV 调参的核心风险 15某位研究员不断重复调参循环，直到某个超参数设置在交叉验证上以极小优势胜出。这种做法的核心风险是什么？机器学习中等essay未尝试面试订阅 4381时段差异很大时的第一反应 16由于不同时间段的行为差异很大，各个 fold 的分数波动剧烈。在轻信一个平均 CV 分数之前，调参时首先该考虑什么？机器学习中等essay未尝试面试订阅 4382最优点落在边界时下一步做什么 17当前搜索里，最优分数出现在正则强度网格的最大取值上。这通常说明下一步应该做什么？机器学习中等essay未尝试面试订阅 4383训练升验证平时的调参方向 18随着模型容量增加，训练表现持续提高，但验证表现基本不动。从调参角度看，下一步更应该往什么方向测试？机器学习中等essay未尝试面试订阅 4384好区域很宽时还要不要加密搜索 19某次 random search 在一个很宽的超参数区域里都不断找到相近的好结果。这通常说明把那个区域的搜索网格继续大幅加密，边际价值如何？机器学习中等essay未尝试面试订阅 4385单个小 fold 主导波动时先改什么 20如果某个交叉验证 fold 明显比其他 fold 小得多，并且主导了平均分的波动，那么调参时首先该处理什么设计问题？机器学习中等essay未尝试面试订阅 4386训练高验证低时先查什么 21训练 AUC 很高，但交叉验证 AUC 接近随机。在继续尝试更多超参数值之前，第一步应该检查什么？机器学习中等essay未尝试面试订阅 4387差距远小于标准误时如何解读 22两个超参数设置的平均 CV 分数只差 0.001，而估计标准误却有 0.010。第一反应应该如何解读这种结果？机器学习中等essay未尝试面试订阅 4388短窗口在回测赢了但实盘变差时先查什么 23某次时间序列调参表明很短的 lookback window 表现最好，但最近的实盘表现却明显恶化。在扩大搜索范围之前，首先应检查什么？机器学习中等essay未尝试面试订阅 4389编码器放错位置时的立刻修正 24某个类别编码器先在全量样本上拟合了一次，然后被重复用于交叉验证里的各个 fold。立即应该如何修正？机器学习中等essay未尝试面试订阅 4390双边界同时命中时下一步 25当前最优设置同时落在学习率网格和正则网格的边界极值上。下一步搜索最合理的动作是什么？机器学习中等essay未尝试面试订阅