INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
1751

78 / 88

非代码面试题

显示 20 / 1751 道匹配题目

答题状态:未尝试未正确已正确
4314信任 Early Stopping 之前你的验证指标每天噪声都很大。在把第一个局部峰值当作停止点之前,应该先校准什么?机器学习中等essay未尝试面试订阅4315正则不是孤立存在在过参数化网络里,为什么脱离优化器和数据流程单独谈正则强度是错误的?机器学习中等essay未尝试面试订阅4316注意力分数数量一个 Transformer 层处理 L=256 个 token,头数 H=8。不考虑 value 维度时,所有头总共会形成多少个原始注意力分数条目?机器学习简单数值题未尝试面试订阅4317堆叠 CNN 感受野一个 1D CNN 叠了 6 层因果卷积,kernel size 为 3,stride 为 1,且没有 dilation。感受野是多少个 token?机器学习简单数值题未尝试面试订阅4318空洞 CNN 覆盖范围一个因果 CNN 使用 4 层、kernel size 为 3、dilation 依次为 1、2、4、8。一个输出 token 最多可以直接聚合多长的依赖范围?机器学习简单数值题未尝试面试订阅4319串行深度比较对于长度为 512 的序列,一个普通 RNN 需要执行多少个串行处理步骤?如果整段序列已经拿到,一个标准全序列 Transformer 在推理时需要多少个按 token 串行的步骤?机器学习简单数值题未尝试面试订阅4320注意力矩阵内存一个全注意力模型使用 L=1024 个 token,并以 float16 存储每个头的一张注意力分数矩阵。一个头的分数矩阵大约占多少内存?机器学习简单数值题未尝试面试订阅4321流式订单流局部模式你需要对实时订单流做毫秒级延迟预测。大部分有用结构都来自最近 20 到 40 个事件中的局部模式,而且模型必须在线更新,不能等整块数据。哪一类架构应当作为你的第一版 baseline?机器学习中等essay未尝试面试订阅4322在线状态型序列模型必须逐 tick 处理无限长事件流,并维护一个可持续更新的紧凑隐藏状态,不能反复回看历史输入。哪一类架构最自然契合这个要求?机器学习中等essay未尝试面试订阅4323长上下文离线交互你在做一个离线 4000 token 文档模型,答案经常依赖于跨很远段落的短语匹配。此时延迟不如长程交互建模重要。哪种架构应该成为首选?机器学习中等essay未尝试面试订阅4324小样本局部平稳你只有有限标注数据,而目标主要取决于二维信号图中的局部平移等变模式。哪类架构通常能提供最强的内建归纳偏置?机器学习中等essay未尝试面试订阅4325稀少但关键的全局联系一个序列问题大部分时候只有局部结构,但有一小部分标签会因为相隔数百步的位置之间的相互作用而翻转,而漏掉这类依赖的代价非常高。你更该偏向哪类架构?机器学习中等essay未尝试面试订阅4326序列长度翻倍的成本冲击一个局部 CNN 的交互规模约为 7L,而一个 Transformer 注意力块的分数对规模约为 L 2。若 L 从 256 翻倍到 512,两者的交互数量分别增长多少倍?哪类架构碰到更陡的扩展墙?机器学习中等essay未尝试面试订阅4327更长依赖所需的 CNN 深度一个 stride=1、kernel size=3、无 dilation 的 CNN,要覆盖 9 步依赖需要 4 层。如果所需依赖范围升到 41 步,需要多少层?这说明了什么结构压力?机器学习中等essay未尝试面试订阅4328小样本制度切换假设任务仍然强烈依赖局部且具有平移等变性,但你的标注数据量缩小到原来的十分之一。哪类架构会变得更有吸引力?为什么数据制度的变化会影响这个选择?机器学习中等essay未尝试面试订阅4329延迟预算放松一个任务原先必须完全在线处理,因此递归或因果卷积更合适。若部署方式改成离线批量打分,整段序列都可一次性获得,哪类架构会从这种放松中获益最大?机器学习中等essay未尝试面试订阅4330从局部结构变成全局结构一个预测问题原本只依赖短局部模式,但产品改版后,标签现在要看序列前四分之一和后四分之一信息是否匹配。哪类架构应当在备选排序中上升?机器学习中等essay未尝试面试订阅4331先量化什么在一个新序列任务上于 CNN、RNN 和 Transformer 之间做选择之前,最先应该量化哪两个结构量?机器学习中等essay未尝试面试订阅4332默认选 Transformer 之前同事因为上次 benchmark 是 Transformer 赢了,就想直接从 Transformer 开始。你最先应该反问什么?机器学习中等essay未尝试面试订阅4333在淘汰 RNN 之前在交易系统流水线里,为什么你不该轻易把 RNN 完全排除掉?机器学习中等essay未尝试面试订阅