第 6 / 10 页
非代码面试题
显示 20 / 184 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
2438为什么凸性会让“平均预测”变得安全为什么损失函数的凸性会支持这样一种直觉:把相似的预测做平均通常不会太吃亏?机器学习困难essay未尝试面试订阅2439为什么不对称损失会把最优目标从均值推开为什么不对称损失通常会让最优常数预测偏离目标分布的均值?机器学习困难essay未尝试面试订阅2440为什么重尾噪声会让人远离纯平方损失 15为什么当残差分布带有罕见但极端的异常值时,纯平方损失通常不是一个好的默认选项?机器学习中等derivation未尝试面试订阅2442为什么严格真诚损失的重要性不止体现在排序 24为什么即使最终系统还会自己挑选操作阈值,严格真诚的概率损失仍然很有价值?机器学习简单essay未尝试免费2443加权对数损失会把 Bayes 概率拉向代价更高的类别 16为什么类别加权的对数损失会把最优报告概率推向权重更大的那一类?机器学习中等derivation未尝试面试订阅2444为什么分位数损失在风险预测里有用 17为什么当目标是类 VaR 的预测而不是均值预测时,pinball 损失会显得自然?机器学习中等derivation未尝试面试订阅2445为什么尾部预测需要与尾部对齐的损失 25为什么当真实业务任务关心的是极端尾部分位数时,去优化普通平方损失往往是一个错误?机器学习困难essay未尝试面试订阅2457在交叉验证之前一次性拟合 PCA某个笔记本先在全特征矩阵上做 PCA,再把得到的主成分送进每个交叉验证折。为什么这不是无害的提速优化?机器学习简单essay未尝试免费2494中心化后一元回归化成过原点回归 24在带截距的一元回归里,把 x 和 y 都中心化之后,斜率对应的优化问题会变成什么?机器学习中等derivation未尝试面试订阅2508为什么 elastic net 保留 lasso 阈值又额外加入 ridge 收缩 14为什么 elastic net 仍然需要 |z| 先跨过一个 L1 阈值,坐标才会激活,但在激活之后又会比 lasso 收缩得更多?机器学习中等derivation未尝试面试订阅2524为什么 logistic 回归没有闭式解 5为什么 logistic 回归通常需要迭代优化,而不像 OLS 那样有正规方程式的闭式解?机器学习中等essay未尝试免费2550不对称交易代价下叶节点的最优标签一个分类叶节点里有 6 个正样本和 14 个负样本。预测为正时,每个假阳性的代价是 1;预测为负时,每个假阴性的代价是 4。这个叶节点应该预测哪一类,才能最小化叶节点损失?机器学习困难derivation未尝试面试订阅2559代理切分带来的期望错分数在主特征和代理特征都存在的 40 条训练样本中,代理切分有 34 条与主切分一致。若生产中有 12 条样本缺失主切分特征,只能靠代理切分路由,期望会有多少条被路由错?机器学习困难derivation未尝试面试订阅2596平方损失下叶节点最优更新值 1在平方误差的梯度提升里,某个终端区域 R 会被赋予一个常数更新 gamma。推导能使 sum i in R (r i-gamma) 2 最小的 gamma,其中 r i 是当前残差。机器学习简单derivation未尝试免费2597带权区域更新值 2若 boosting 某个区域 R 内的样本带有正权重 w i,推导能使 sum i in R w i (r i-gamma) 2 最小的常数更新 gamma。机器学习简单derivation未尝试免费2598三轮 boosting 之后的最终预测 23某个 boosting 模型从 F 0(x)=10 开始。对某个观测而言,连续三轮落到的叶节点更新分别是 +1.2、-0.5、+0.8,且每轮学习率 eta=0.1。最终预测是多少?机器学习中等数值题未尝试免费2599为什么 boosting 主要是在压偏差 9为什么 boosting 通常被描述成“主要降偏差”的方法,而不是“主要降方差”的方法?机器学习中等essay未尝试免费2602为什么即使训练损失下降也需要早停 12为什么即使 boosting 的训练目标还在持续改善,验证表现也可能已经开始恶化?机器学习中等essay未尝试免费2604为什么标签噪声对 boosting 特别伤 13为什么在标签有噪声时,boosting 往往会受伤特别严重?机器学习中等essay未尝试免费2607为什么过深的基树会抵消 shrinkage 的纪律性 15为什么一个非常深的基树,会削弱“小学习率”本来带来的正则化效果?机器学习简单essay未尝试免费