第 5 / 9 页
非代码面试题
显示 20 / 171 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
2528为什么对数损失奖励校准 9为什么一个校准良好的概率预测器,在对数损失下通常会比一个“只会排对顺序”的预测器表现更好?机器学习中等essay未尝试免费2538为什么训练时 logistic 比硬阈值规则更好 23为什么一个平滑的概率损失,比直接对一个硬分类规则训练更容易优化?机器学习中等essay未尝试免费2552数据扰动后哪一个切分变成最优 19切分 A 原本的增益是 1.20,切分 B 的增益是 1.05。修正一行数据之后,A 的增益下降 0.10,B 的增益上升 0.08。现在哪个切分更优?机器学习中等数值题未尝试免费2559代理切分带来的期望错分数在主特征和代理特征都存在的 40 条训练样本中,代理切分有 34 条与主切分一致。若生产中有 12 条样本缺失主切分特征,只能靠代理切分路由,期望会有多少条被路由错?机器学习困难derivation未尝试面试订阅2564保留一次切分所需的验证惩罚阈值一个 stump 的验证损失是 30。把它切成两个叶子后,验证损失降到 22,但每增加一个叶子都要付出 lambda 的不稳定性惩罚。lambda 最大取到多少时,这次切分仍然值得保留?机器学习困难derivation未尝试面试订阅2567为什么两个几乎打平的首切分会在后续完全分叉 13为什么两个即时增益几乎相同的根切分,最后却可能长成完全不同的树?机器学习简单essay未尝试免费2569为什么轴对齐树在旋转边界上会吃力 14为什么一个决策树会需要很多小矩形,才能逼近一条其实很简单的对角线边界?机器学习中等essay未尝试面试订阅2571相关树平均后的方差公式 1设有 B 棵树,每棵树的方差都是 sigma 2,并且任意两棵树之间的相关系数都是 rho。推导它们简单平均后的方差。机器学习简单derivation未尝试免费2573无限森林的方差地板 2利用等相关树平均的方差公式,推导当树的棵数 B 趋于无穷时预测方差会收敛到什么值。机器学习中等derivation未尝试免费2575为什么 bagging 很少能修复高偏差 11为什么不应指望 bagging 单独去拯救一个“单树本身就系统性失配”的学习器?机器学习困难essay未尝试面试订阅2576为什么强势单因子场景下特征子采样更有价值 12为什么当某个非常强的特征本来会出现在几乎每棵树的顶部时,随机特征子采样反而能提升森林表现?机器学习简单essay未尝试免费2578为什么过小的 max_features 会抬高偏差 14为什么把 max features 设得过小,虽然能降低相关性,却仍可能伤害随机森林?机器学习中等essay未尝试免费2579由方差地板反推树相关性 23单棵树的方差是 6,而一个非常大的森林的方差似乎稳定在 1.8。隐含的树间相关系数 rho 是多少?机器学习中等数值题未尝试面试订阅2580为什么增加树数通常不会制造经典意义上的过拟合 15为什么给随机森林继续加树,通常只是收益趋于平台,而不会出现某些单模型家族那种爆炸式过拟合?机器学习困难essay未尝试面试订阅2584再加一棵树带来的边际方差下降 3在等相关树模型下,推导把树的数量从 B 增加到 B+1 时,集成方差会下降多少。机器学习困难derivation未尝试面试订阅2585达到目标方差上限所需的树数 4设每棵树的方差为 sigma 2,任意两棵树的相关系数为 rho。假设目标上限 V 满足 V > rho sigma 2,推导要把集成方差压到不超过 V 所需的最小 B。机器学习困难derivation未尝试面试订阅2591为什么小样本下 OOB 可能很吵 19为什么在小数据集上,即使森林本身还算稳定,OOB 误差也可能波动很大?机器学习简单essay未尝试免费2592等效独立树棵数 8定义 B eff,使得相关森林的方差 sigma 2 [rho + (1-rho)/B] 与独立树平均的方差 sigma 2 / B eff 相等。请推导 B eff。机器学习简单derivation未尝试免费2593为什么平均无法治愈系统性标签噪声 20为什么当训练标签本身存在系统性污染时,单纯把森林做大可能并不能修复性能?机器学习中等essay未尝试面试订阅2599为什么 boosting 主要是在压偏差 9为什么 boosting 通常被描述成“主要降偏差”的方法,而不是“主要降方差”的方法?机器学习中等essay未尝试免费