INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 811

第 23 / 41 页

非代码面试题

显示 20 / 811 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

4336为什么 CNN 会赢为什么在一个小样本、标签主要取决于短局部模式的任务上，一个中等规模的 CNN 可能打败更大的 Transformer？机器学习中等essay未尝试面试订阅 4337为什么 RNN 仍有价值为什么即使 Transformer 离线 benchmark 更强，生产里的事件流模型仍可能更适合用 RNN？机器学习中等essay未尝试面试订阅 4338什么时候注意力值得其成本什么样的任务结构会让注意力的二次成本变得值得？机器学习中等essay未尝试面试订阅 4339为什么结构错配很伤为什么在性能很差时，结构错配往往比参数量更致命？机器学习中等essay未尝试面试订阅 4340混合结构还是纯结构什么时候比起坚持纯 CNN、纯 RNN 或纯 Transformer，更适合考虑混合架构？机器学习中等essay未尝试面试订阅 4356排序质量与概率质量的取舍模型 A 的 ROC AUC 略高，但概率明显过度自信；模型 B 的 ROC AUC 略低，但校准明显更好。如果你需要把预测概率直接拿去做头寸规模决策，通常哪个模型更安全？机器学习中等essay未尝试面试订阅 4357极端不平衡下的指标选择你在筛查极其罕见的欺诈案例，基准发生率低于 1%。为什么在业务讨论里，PR 分析通常比 ROC 分析更有信息量？机器学习中等essay未尝试面试订阅 4358AUC 相同但可靠性不同两个模型的 ROC AUC 几乎一样。一个校准良好，另一个把大多数概率都推到接近 0 或 1。你在选择后者之前，首先应该担心什么？机器学习中等essay未尝试面试订阅 4359阈值需要业务语境为什么在没有给出代价比或者下游资源约束时，就问“最优阈值是什么”是个错误问题？机器学习中等essay未尝试面试订阅 4360分布变化后的校准模型是在去年的数据上做过校准的，但今年事件的基准发生率显然已经改变。你第一步应该重新检查什么校准问题？机器学习中等essay未尝试面试订阅 4361比较曲线之前在比较不同模型的 ROC 和 PR 曲线之前，你首先应该检查数据集的什么属性？机器学习中等essay未尝试面试订阅 4362重做校准之前一个模型看起来校准很差。在断言模型本身坏掉之前，第一步应该先检查什么？机器学习中等essay未尝试面试订阅 4363选阈值之前在优化分类阈值之前，第一步应该明确哪一个量？机器学习中等essay未尝试面试订阅 4364信任 AUC 之前重训后 AUC 略有提升。在宣布新模型“实际更好”之前，第一步应该问什么？机器学习中等essay未尝试面试订阅 4365只有校准还不够为什么面对一个校准完美但排序能力很弱的模型时，你仍然应该犹豫？机器学习中等essay未尝试面试订阅 4376极度不平衡且有审查额度时先看什么指标 11正例只占 1%，而业务团队每天只能人工核查前 100 个告警。此时在调阈值时，应该优先强调 PR 类指标还是 ROC 类指标？机器学习中等essay未尝试面试订阅 4377标准化放在 CV 外面的主要问题 12如果先在全量数据上拟合标准化，再去做交叉验证，而不是把标准化放到每个 fold 里重做，这个调参流程的主要问题是什么？机器学习中等essay未尝试面试订阅 4378预算有限时随机搜还是网格搜 13你最多只能承担 30 次评估，而经验表明只有少数几个超参数真正重要，其他都比较弱。在这种情况下，通常应先试 grid search 还是 random search？机器学习中等essay未尝试面试订阅 4379小样本大搜索时是否适合嵌套 CV 14数据很少，但超参数搜索空间很大，你又希望在调参之后得到尽量无偏的性能估计。尽管成本高，这时从概念上看 nested CV 是否合适？机器学习中等essay未尝试面试订阅 4380反复盯着 CV 调参的核心风险 15某位研究员不断重复调参循环，直到某个超参数设置在交叉验证上以极小优势胜出。这种做法的核心风险是什么？机器学习中等essay未尝试面试订阅