INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 171

第 5 / 9 页

非代码面试题

显示 20 / 171 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

2528为什么对数损失奖励校准 9为什么一个校准良好的概率预测器，在对数损失下通常会比一个“只会排对顺序”的预测器表现更好？机器学习中等essay未尝试免费 2538为什么训练时 logistic 比硬阈值规则更好 23为什么一个平滑的概率损失，比直接对一个硬分类规则训练更容易优化？机器学习中等essay未尝试免费 2552数据扰动后哪一个切分变成最优 19切分 A 原本的增益是 1.20，切分 B 的增益是 1.05。修正一行数据之后，A 的增益下降 0.10，B 的增益上升 0.08。现在哪个切分更优？机器学习中等数值题未尝试免费 2559代理切分带来的期望错分数在主特征和代理特征都存在的 40 条训练样本中，代理切分有 34 条与主切分一致。若生产中有 12 条样本缺失主切分特征，只能靠代理切分路由，期望会有多少条被路由错？机器学习困难derivation未尝试面试订阅 2564保留一次切分所需的验证惩罚阈值一个 stump 的验证损失是 30。把它切成两个叶子后，验证损失降到 22，但每增加一个叶子都要付出 lambda 的不稳定性惩罚。lambda 最大取到多少时，这次切分仍然值得保留？机器学习困难derivation未尝试面试订阅 2567为什么两个几乎打平的首切分会在后续完全分叉 13为什么两个即时增益几乎相同的根切分，最后却可能长成完全不同的树？机器学习简单essay未尝试免费 2569为什么轴对齐树在旋转边界上会吃力 14为什么一个决策树会需要很多小矩形，才能逼近一条其实很简单的对角线边界？机器学习中等essay未尝试面试订阅 2571相关树平均后的方差公式 1设有 B 棵树，每棵树的方差都是 sigma 2，并且任意两棵树之间的相关系数都是 rho。推导它们简单平均后的方差。机器学习简单derivation未尝试免费 2573无限森林的方差地板 2利用等相关树平均的方差公式，推导当树的棵数 B 趋于无穷时预测方差会收敛到什么值。机器学习中等derivation未尝试免费 2575为什么 bagging 很少能修复高偏差 11为什么不应指望 bagging 单独去拯救一个“单树本身就系统性失配”的学习器？机器学习困难essay未尝试面试订阅 2576为什么强势单因子场景下特征子采样更有价值 12为什么当某个非常强的特征本来会出现在几乎每棵树的顶部时，随机特征子采样反而能提升森林表现？机器学习简单essay未尝试免费 2578为什么过小的 max_features 会抬高偏差 14为什么把 max features 设得过小，虽然能降低相关性，却仍可能伤害随机森林？机器学习中等essay未尝试免费 2579由方差地板反推树相关性 23单棵树的方差是 6，而一个非常大的森林的方差似乎稳定在 1.8。隐含的树间相关系数 rho 是多少？机器学习中等数值题未尝试面试订阅 2580为什么增加树数通常不会制造经典意义上的过拟合 15为什么给随机森林继续加树，通常只是收益趋于平台，而不会出现某些单模型家族那种爆炸式过拟合？机器学习困难essay未尝试面试订阅 2584再加一棵树带来的边际方差下降 3在等相关树模型下，推导把树的数量从 B 增加到 B+1 时，集成方差会下降多少。机器学习困难derivation未尝试面试订阅 2585达到目标方差上限所需的树数 4设每棵树的方差为 sigma 2，任意两棵树的相关系数为 rho。假设目标上限 V 满足 V > rho sigma 2，推导要把集成方差压到不超过 V 所需的最小 B。机器学习困难derivation未尝试面试订阅 2591为什么小样本下 OOB 可能很吵 19为什么在小数据集上，即使森林本身还算稳定，OOB 误差也可能波动很大？机器学习简单essay未尝试免费 2592等效独立树棵数 8定义 B eff，使得相关森林的方差 sigma 2 [rho + (1-rho)/B] 与独立树平均的方差 sigma 2 / B eff 相等。请推导 B eff。机器学习简单derivation未尝试免费 2593为什么平均无法治愈系统性标签噪声 20为什么当训练标签本身存在系统性污染时，单纯把森林做大可能并不能修复性能？机器学习中等essay未尝试面试订阅 2599为什么 boosting 主要是在压偏差 9为什么 boosting 通常被描述成“主要降偏差”的方法，而不是“主要降方差”的方法？机器学习中等essay未尝试免费