INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
215

7 / 11

非代码面试题

显示 20 / 215 道匹配题目

答题状态:未尝试未正确已正确
2402低偏差灵活模型的第二个交叉点一个更灵活的模型的额外误差是 0.02 + 24/n,而一个更简单的模型的额外误差是 0.14 + 6/n。它们在什么样本量下打平?机器学习中等derivation未尝试面试订阅2404把方差压到噪声阈值以下所需的数据倍数某模型当前的方差项是 0.30,不可约噪声是 0.05。若方差严格按 1/n 缩放,那么数据集需要扩大多少倍,才能把方差项降到 0.05?机器学习中等derivation未尝试面试订阅2405反推出不可约噪声某模型的测试 MSE 是 0.92,偏差平方是 0.15,方差是 0.27。隐含的不可约噪声项是多少?机器学习简单数值题未尝试面试订阅2408三个独立模型平均后的方差3 个独立训练的模型方差都为 1.8,且偏差可以忽略。它们等权平均后的方差是多少?机器学习简单数值题未尝试面试订阅2409为什么更多数据往往先帮助“方差占主导”的模型为什么增加更多数据时,高方差模型通常比高偏差模型受益更大?机器学习困难essay未尝试面试订阅2412为什么模型优劣会随着样本量增长而翻转为什么一个简单模型会在小样本时赢过复杂模型,却在大样本时明显落后?机器学习中等essay未尝试面试订阅2413为什么 bagging 主要针对的是方差为什么 bagging 通常被描述为降方差工具,而不是降偏差工具?机器学习中等essay未尝试面试订阅2414为什么不可约噪声会封顶最佳可达测试误差为什么即使偏差和方差看起来都已经很小,模型改进仍可能停滞?机器学习困难essay未尝试面试订阅2420为什么部署偏好会和基准 MSE 排名不同为什么在基准数据上最小化 MSE 的模型,并不一定是最终被生产团队部署的那个模型?机器学习困难essay未尝试面试订阅2425为什么非对称损失会改变最优预测目标 21为什么一旦改变高估与低估的相对惩罚,Bayes 最优预测通常就会偏离条件均值?机器学习困难essay未尝试面试订阅2429一组残差的总 Huber 损失使用 delta = 1 的 Huber 损失,计算残差 0.5、-1.2、3.0 的总损失。机器学习中等数值题未尝试面试订阅2433pinball 损失在拐点处的次梯度 9对 pinball 损失 rho tau(r)=tau r(当 r>=0)且 (tau-1)r(当 r<0),在 r=0 处的次梯度集合是什么?机器学习中等derivation未尝试面试订阅2434为什么严格真诚损失必须偏好真实概率 10为什么概率分类损失最好是严格真诚的,而不只是“分类准确”?机器学习困难derivation未尝试面试订阅2435为什么对数损失比 Brier 损失更惩罚过度自信为什么当模型以接近确定性的方式押错类别时,对数损失会比 Brier 损失反应更猛烈?机器学习困难essay未尝试面试订阅2439为什么不对称损失会把最优目标从均值推开为什么不对称损失通常会让最优常数预测偏离目标分布的均值?机器学习困难essay未尝试面试订阅2444为什么分位数损失在风险预测里有用 17为什么当目标是类 VaR 的预测而不是均值预测时,pinball 损失会显得自然?机器学习中等derivation未尝试面试订阅2445为什么尾部预测需要与尾部对齐的损失 25为什么当真实业务任务关心的是极端尾部分位数时,去优化普通平方损失往往是一个错误?机器学习困难essay未尝试面试订阅2452把未来重述数据并入历史特征研究员把几个月后才公布的重述财务数据接到原始交易日上,再对这些原始日期做回测。即使完全没碰测试标签,这为什么仍然是切分纪律失败?机器学习中等essay未尝试面试订阅2454切分前先做特征筛选团队先在全数据集上按与目标的相关性给 5,000 个候选特征排序,保留前 30 个,然后才切分训练集和测试集。为什么之后再切分也救不了这个实验?机器学习中等essay未尝试面试订阅2455研究过程中反复偷看验证集研究员不断尝试新的特征变换,并只保留那些能提升同一个验证分数的变换。为什么验证集此时不再是一个干净的模型选择工具?机器学习困难essay未尝试面试订阅