INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 23

第 1 / 2 页

非代码面试题

显示 20 / 23 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

4291反向 dropout 保留时的激活值 1某个隐藏单元在 dropout 之前的激活值为 3.2。现在使用 keep probability 为 0.8 的 inverted dropout。如果这次训练中该单元被保留，那么 dropout 之后向前传递的值是多少？机器学习简单数值题未尝试面试订阅 4292标签平滑目标向量 2一个 4 分类器使用标签平滑，epsilon = 0.2，并且把 epsilon 均匀分配到全部 4 个类别上，包括真实类别。如果正确类别是第 3 类，训练时使用的平滑目标向量是什么？机器学习简单数值题未尝试面试订阅 4293解耦权重衰减一步更新 3某个参数当前取值 w = 2.0，梯度 g = 0.3。采用解耦权重衰减更新公式 w new = (1 - eta*lambda) w - eta*g，其中 eta = 0.1、lambda = 0.05。一步更新后的参数是多少？机器学习简单数值题未尝试面试订阅 4294max-norm 裁剪后的权重 4某层的权重向量为 w = (3, 4)，其范数为 5。现在使用上限 c = 4 的 max-norm 正则，并在范数超标时按比例缩放。裁剪后保存的向量是什么？机器学习简单数值题未尝试面试订阅 4295L1 软阈值收缩 5某个优化器使用 proximal L1 收缩步骤 sign(w)*max(|w| - tau, 0)。如果更新前的权重是 w = 0.7，tau = 0.2，那么收缩后的权重是多少？机器学习简单数值题未尝试面试订阅 4296权重衰减增强后的额外收缩 6保持 eta = 0.1、梯度 g = 0.3、当前权重 w = 2.0 不变。若在解耦更新 w new = (1 - eta*lambda)w - eta*g 中，把 lambda 从 0.05 提高到 0.10，那么相对于旧 lambda 情形，更新后权重会再下降多少？机器学习中等数值题未尝试面试订阅 4297标准 dropout 的期望激活变化 7某个单元在标准 dropout 之前的激活值为 2.0，也就是说被丢弃时输出 0，被保留时输出仍为 2.0。如果 keep probability 从 0.8 降到 0.5，那么 dropout 后的期望激活会变成多少？机器学习中等数值题未尝试面试订阅 4298标签平滑加重后的真实类目标变化 8一个 5 分类模型把 epsilon 均匀分配到全部类别上做标签平滑。如果 epsilon 从 0.1 提高到 0.3，那么真实类别对应的目标值会变化多少？机器学习中等数值题未尝试面试订阅 4300L1 阈值加大后的输出 10某个 proximal L1 步骤使用 sign(w)*max(|w| - tau, 0)。若更新前的权重是 0.6，当 tau 从 0.2 提高到 0.5 时，新的输出是多少？机器学习中等数值题未尝试面试订阅 4301mixup 标签混合 11在一个 4 分类问题里，mixup 以 lambda = 0.3 混合“类别 1 的样本”和“类别 4 的样本”的 one-hot 标签。最终得到的目标向量是什么？机器学习中等数值题未尝试面试订阅 4302随机深度下的平均激活层数 12某个网络对 12 个残差块使用 stochastic depth，并让每个块在训练中的生存概率都是 0.75。一次训练前向传播中，平均会有多少个块处于激活状态？机器学习中等数值题未尝试面试订阅 4303DropConnect 的平均活跃权重数 13某层共有 400 个权重。训练时使用 DropConnect，并让每个权重以 0.9 的概率独立保留。一次前向传播中，平均会有多少个权重处于活跃状态？机器学习中等数值题未尝试面试订阅 4304inverted dropout 输出方差 14某个单元在 dropout 前的激活为 a = 3，使用 keep probability q = 0.75 的 inverted dropout。训练时输出要么是 0，要么是 a/q。该输出的方差是多少？机器学习中等数值题未尝试面试订阅 4306稀疏权重爆炸一个宽 MLP 在 8k 条表格数据上把训练 AUC 拉到 0.99，但验证 AUC 卡在 0.76。特征语义又不支持标签保持的数据增强，而且最大的权重集中在稀疏 one-hot 输入上。你首先应该尝试哪种正则化控制？机器学习中等essay未尝试面试订阅 4307验证集见顶后下滑训练损失在每个 epoch 都继续下降，但验证 Sharpe 在大约第 11 个 epoch 见顶后持续缓慢下滑。你既不打算改结构，也不改数据集。最合理的正则化动作是什么？机器学习中等essay未尝试面试订阅 4308噪声标签与过度自信一个分类器准确率已经不错，但对边界样本过于频繁地给出 99% 的置信度，而且标签中被认为含有少量噪声。哪种正则化调整最能针对这个失效模式？机器学习中等essay未尝试面试订阅 4309隐藏单元共适应两层隐藏层会记住成对同时出现的信号。样本内指标很好，但只要样本外其中一个信号稍有偏移，性能就会崩。哪种控制最适合抑制这种共适应？机器学习中等essay未尝试面试订阅 4310存在安全不变性你在一个很小的图像式信号数据集上训练模型，已知轻微平移和镜像翻转天然保持标签不变。网络又很容易把训练集拟合得过好。哪种正则化手段应该优先提到最前面？机器学习中等essay未尝试面试订阅 4311提高 Dropout 之前在一次效果一般的训练后，你很想把 dropout 从 0.2 直接加到 0.6。动手前最先应该回答的诊断问题是什么？机器学习中等essay未尝试面试订阅 4312加入增强之前同事把激进的数据增强当作万能解。你在接受这个方案前，第一步应该检查什么？机器学习中等essay未尝试面试订阅