第 20 / 88 页
非代码面试题
显示 20 / 1751 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
2577为什么 OOB 不适用于分组或时间数据 13为什么当样本之间由实体或时间联系在一起,而不是可交换抽样时,out-of-bag 误差会具有误导性?机器学习中等essay未尝试面试订阅2578为什么过小的 max_features 会抬高偏差 14为什么把 max features 设得过小,虽然能降低相关性,却仍可能伤害随机森林?机器学习中等essay未尝试免费2579由方差地板反推树相关性 23单棵树的方差是 6,而一个非常大的森林的方差似乎稳定在 1.8。隐含的树间相关系数 rho 是多少?机器学习中等数值题未尝试面试订阅2580为什么增加树数通常不会制造经典意义上的过拟合 15为什么给随机森林继续加树,通常只是收益趋于平台,而不会出现某些单模型家族那种爆炸式过拟合?机器学习困难essay未尝试面试订阅2584再加一棵树带来的边际方差下降 3在等相关树模型下,推导把树的数量从 B 增加到 B+1 时,集成方差会下降多少。机器学习困难derivation未尝试面试订阅2585达到目标方差上限所需的树数 4设每棵树的方差为 sigma 2,任意两棵树的相关系数为 rho。假设目标上限 V 满足 V > rho sigma 2,推导要把集成方差压到不超过 V 所需的最小 B。机器学习困难derivation未尝试面试订阅2589偏差不变时 bagging 后的 MSE 7假设每棵树的偏差平方都是 b 2,预测噪声底为 nu,而 bagging 只会按等相关树公式改变方差项。请推导拥有 B 棵树时的 bagged 测试 MSE。机器学习困难derivation未尝试面试订阅2596平方损失下叶节点最优更新值 1在平方误差的梯度提升里,某个终端区域 R 会被赋予一个常数更新 gamma。推导能使 sum i in R (r i-gamma) 2 最小的 gamma,其中 r i 是当前残差。机器学习简单derivation未尝试免费2597带权区域更新值 2若 boosting 某个区域 R 内的样本带有正权重 w i,推导能使 sum i in R w i (r i-gamma) 2 最小的常数更新 gamma。机器学习简单derivation未尝试免费2598三轮 boosting 之后的最终预测 23某个 boosting 模型从 F 0(x)=10 开始。对某个观测而言,连续三轮落到的叶节点更新分别是 +1.2、-0.5、+0.8,且每轮学习率 eta=0.1。最终预测是多少?机器学习中等数值题未尝试免费2599为什么 boosting 主要是在压偏差 9为什么 boosting 通常被描述成“主要降偏差”的方法,而不是“主要降方差”的方法?机器学习中等essay未尝试免费2602为什么即使训练损失下降也需要早停 12为什么即使 boosting 的训练目标还在持续改善,验证表现也可能已经开始恶化?机器学习中等essay未尝试免费2604为什么标签噪声对 boosting 特别伤 13为什么在标签有噪声时,boosting 往往会受伤特别严重?机器学习中等essay未尝试免费2608两次 shrinkage 更新后的残差 24某个点当前的残差是 6。两轮 boosting 中,它所在区域的叶节点更新分别为 1.5 和 0.8,且两轮学习率都为 eta=0.2。两轮之后还剩多少残差?机器学习中等数值题未尝试免费2613带 L2 正则的区域更新值 7在某个 boosting 区域内,选择一个常数更新 gamma 来最小化 sum i in R (r i-gamma) 2 + lambda gamma 2。记 S = sum i in R r i,n = |R|。推导 gamma。机器学习困难derivation未尝试面试订阅2615为什么校准可能比排序更早恶化 19为什么 boosting 后期有时还能把样本排得很好,但预测分数本身的校准却已经变差?机器学习困难essay未尝试面试订阅2618为什么很多次小修正能打败一棵大树 21为什么一串小步加性的 boosting 修正,能打败一棵样本内灵活度相近的大树?机器学习中等essay未尝试面试订阅2620总函数移动量的上界 8设每一轮 boosting 对任意一个点的预测改变量绝对值都不超过 eta A。这个条件会给 M 轮之后的总预测移动量带来什么上界?机器学习困难derivation未尝试面试订阅2645为什么全局范数裁剪会保留方向 14为什么在触发裁剪时,全局范数裁剪只会改变梯度向量的大小,而不会改变它的方向?机器学习困难derivation未尝试面试订阅2646嵌套交叉验证中的模型拟合次数某团队使用 5 个外层折。在每个外层训练集内部,他们用 4 折 CV 评估 6 组超参数,随后再用整个外层训练集把选中的模型重拟合一次。总共会发生多少次模型拟合?机器学习简单数值题未尝试免费