INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
811

22 / 41

非代码面试题

显示 20 / 811 道匹配题目

答题状态:未尝试未正确已正确
4306稀疏权重爆炸一个宽 MLP 在 8k 条表格数据上把训练 AUC 拉到 0.99,但验证 AUC 卡在 0.76。特征语义又不支持标签保持的数据增强,而且最大的权重集中在稀疏 one-hot 输入上。你首先应该尝试哪种正则化控制?机器学习中等essay未尝试面试订阅4307验证集见顶后下滑训练损失在每个 epoch 都继续下降,但验证 Sharpe 在大约第 11 个 epoch 见顶后持续缓慢下滑。你既不打算改结构,也不改数据集。最合理的正则化动作是什么?机器学习中等essay未尝试面试订阅4308噪声标签与过度自信一个分类器准确率已经不错,但对边界样本过于频繁地给出 99% 的置信度,而且标签中被认为含有少量噪声。哪种正则化调整最能针对这个失效模式?机器学习中等essay未尝试面试订阅4309隐藏单元共适应两层隐藏层会记住成对同时出现的信号。样本内指标很好,但只要样本外其中一个信号稍有偏移,性能就会崩。哪种控制最适合抑制这种共适应?机器学习中等essay未尝试面试订阅4310存在安全不变性你在一个很小的图像式信号数据集上训练模型,已知轻微平移和镜像翻转天然保持标签不变。网络又很容易把训练集拟合得过好。哪种正则化手段应该优先提到最前面?机器学习中等essay未尝试面试订阅4311提高 Dropout 之前在一次效果一般的训练后,你很想把 dropout 从 0.2 直接加到 0.6。动手前最先应该回答的诊断问题是什么?机器学习中等essay未尝试面试订阅4312加入增强之前同事把激进的数据增强当作万能解。你在接受这个方案前,第一步应该检查什么?机器学习中等essay未尝试面试订阅4313当 Weight Decay 开始伤害性能随着 weight decay 增强,模型表现开始下降。你在下结论说“正则化不好”之前,应该先问关于信号结构的什么问题?机器学习中等essay未尝试面试订阅4314信任 Early Stopping 之前你的验证指标每天噪声都很大。在把第一个局部峰值当作停止点之前,应该先校准什么?机器学习中等essay未尝试面试订阅4315正则不是孤立存在在过参数化网络里,为什么脱离优化器和数据流程单独谈正则强度是错误的?机器学习中等essay未尝试面试订阅4321流式订单流局部模式你需要对实时订单流做毫秒级延迟预测。大部分有用结构都来自最近 20 到 40 个事件中的局部模式,而且模型必须在线更新,不能等整块数据。哪一类架构应当作为你的第一版 baseline?机器学习中等essay未尝试面试订阅4322在线状态型序列模型必须逐 tick 处理无限长事件流,并维护一个可持续更新的紧凑隐藏状态,不能反复回看历史输入。哪一类架构最自然契合这个要求?机器学习中等essay未尝试面试订阅4323长上下文离线交互你在做一个离线 4000 token 文档模型,答案经常依赖于跨很远段落的短语匹配。此时延迟不如长程交互建模重要。哪种架构应该成为首选?机器学习中等essay未尝试面试订阅4324小样本局部平稳你只有有限标注数据,而目标主要取决于二维信号图中的局部平移等变模式。哪类架构通常能提供最强的内建归纳偏置?机器学习中等essay未尝试面试订阅4325稀少但关键的全局联系一个序列问题大部分时候只有局部结构,但有一小部分标签会因为相隔数百步的位置之间的相互作用而翻转,而漏掉这类依赖的代价非常高。你更该偏向哪类架构?机器学习中等essay未尝试面试订阅4331先量化什么在一个新序列任务上于 CNN、RNN 和 Transformer 之间做选择之前,最先应该量化哪两个结构量?机器学习中等essay未尝试面试订阅4332默认选 Transformer 之前同事因为上次 benchmark 是 Transformer 赢了,就想直接从 Transformer 开始。你最先应该反问什么?机器学习中等essay未尝试面试订阅4333在淘汰 RNN 之前在交易系统流水线里,为什么你不该轻易把 RNN 完全排除掉?机器学习中等essay未尝试面试订阅4334使用 CNN 之前在把 CNN 作为主要架构之前,你首先应该确认哪种结构性质?机器学习中等essay未尝试面试订阅4335混合结构思维如果你怀疑一个任务既有很强的局部模式,又有偶发的长距离依赖,那么在争论模型家族之前,你第一步应该做什么分解?机器学习中等essay未尝试面试订阅