INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
4169

146 / 209

非代码面试题

显示 20 / 4169 道匹配题目

答题状态:未尝试未正确已正确
4371更密的对数网格带来多少额外训练 6某个正则强度 C 的搜索网格从 5 个对数间隔值扩展到 9 个,而其他设置不变。若另一个超参数有 4 个取值,并使用 6 折交叉验证,那么更密的 C 网格会额外带来多少次模型训练?机器学习中等数值题未尝试面试订阅4372随机搜索命中好区域的概率 7某个随机搜索会独立抽取 20 个配置,而真正好的区域占整个超参数空间的 8%。至少命中一次该区域的概率是多少?机器学习中等数值题未尝试面试订阅4373不同保留比例下的训练节省 8successive halving 从 64 个配置开始。比较两种总共 3 轮的保留策略:每轮保留一半 vs 每轮保留四分之一。后者会少训练多少次模型?机器学习中等数值题未尝试面试订阅4374折数减半带来的训练节省 9一次调参运行要测试 30 个配置。如果在配置集合不变的情况下,把 10 折交叉验证改成 5 折,会节省多少次模型训练?机器学习中等数值题未尝试面试订阅4375预算增加后的额外耗时 10某个随机搜索的预算从 40 个配置增加到 55 个。每个配置都使用 4 折交叉验证,并且每次训练耗时 12 分钟。如果串行执行,这会额外增加多少训练时间?机器学习中等数值题未尝试面试订阅4376极度不平衡且有审查额度时先看什么指标 11正例只占 1%,而业务团队每天只能人工核查前 100 个告警。此时在调阈值时,应该优先强调 PR 类指标还是 ROC 类指标?机器学习中等essay未尝试面试订阅4377标准化放在 CV 外面的主要问题 12如果先在全量数据上拟合标准化,再去做交叉验证,而不是把标准化放到每个 fold 里重做,这个调参流程的主要问题是什么?机器学习中等essay未尝试面试订阅4378预算有限时随机搜还是网格搜 13你最多只能承担 30 次评估,而经验表明只有少数几个超参数真正重要,其他都比较弱。在这种情况下,通常应先试 grid search 还是 random search?机器学习中等essay未尝试面试订阅4379小样本大搜索时是否适合嵌套 CV 14数据很少,但超参数搜索空间很大,你又希望在调参之后得到尽量无偏的性能估计。尽管成本高,这时从概念上看 nested CV 是否合适?机器学习中等essay未尝试面试订阅4380反复盯着 CV 调参的核心风险 15某位研究员不断重复调参循环,直到某个超参数设置在交叉验证上以极小优势胜出。这种做法的核心风险是什么?机器学习中等essay未尝试面试订阅4381时段差异很大时的第一反应 16由于不同时间段的行为差异很大,各个 fold 的分数波动剧烈。在轻信一个平均 CV 分数之前,调参时首先该考虑什么?机器学习中等essay未尝试面试订阅4382最优点落在边界时下一步做什么 17当前搜索里,最优分数出现在正则强度网格的最大取值上。这通常说明下一步应该做什么?机器学习中等essay未尝试面试订阅4383训练升验证平时的调参方向 18随着模型容量增加,训练表现持续提高,但验证表现基本不动。从调参角度看,下一步更应该往什么方向测试?机器学习中等essay未尝试面试订阅4384好区域很宽时还要不要加密搜索 19某次 random search 在一个很宽的超参数区域里都不断找到相近的好结果。这通常说明把那个区域的搜索网格继续大幅加密,边际价值如何?机器学习中等essay未尝试面试订阅4385单个小 fold 主导波动时先改什么 20如果某个交叉验证 fold 明显比其他 fold 小得多,并且主导了平均分的波动,那么调参时首先该处理什么设计问题?机器学习中等essay未尝试面试订阅4386训练高验证低时先查什么 21训练 AUC 很高,但交叉验证 AUC 接近随机。在继续尝试更多超参数值之前,第一步应该检查什么?机器学习中等essay未尝试面试订阅4387差距远小于标准误时如何解读 22两个超参数设置的平均 CV 分数只差 0.001,而估计标准误却有 0.010。第一反应应该如何解读这种结果?机器学习中等essay未尝试面试订阅4388短窗口在回测赢了但实盘变差时先查什么 23某次时间序列调参表明很短的 lookback window 表现最好,但最近的实盘表现却明显恶化。在扩大搜索范围之前,首先应检查什么?机器学习中等essay未尝试面试订阅4389编码器放错位置时的立刻修正 24某个类别编码器先在全量样本上拟合了一次,然后被重复用于交叉验证里的各个 fold。立即应该如何修正?机器学习中等essay未尝试面试订阅4390双边界同时命中时下一步 25当前最优设置同时落在学习率网格和正则网格的边界极值上。下一步搜索最合理的动作是什么?机器学习中等essay未尝试面试订阅