INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
91

4 / 5

非代码面试题

显示 20 / 91 道匹配题目

答题状态:未尝试未正确已正确
2575为什么 bagging 很少能修复高偏差 11为什么不应指望 bagging 单独去拯救一个“单树本身就系统性失配”的学习器?机器学习困难essay未尝试面试订阅2576为什么强势单因子场景下特征子采样更有价值 12为什么当某个非常强的特征本来会出现在几乎每棵树的顶部时,随机特征子采样反而能提升森林表现?机器学习简单essay未尝试免费2578为什么过小的 max_features 会抬高偏差 14为什么把 max features 设得过小,虽然能降低相关性,却仍可能伤害随机森林?机器学习中等essay未尝试免费2579由方差地板反推树相关性 23单棵树的方差是 6,而一个非常大的森林的方差似乎稳定在 1.8。隐含的树间相关系数 rho 是多少?机器学习中等数值题未尝试面试订阅2580为什么增加树数通常不会制造经典意义上的过拟合 15为什么给随机森林继续加树,通常只是收益趋于平台,而不会出现某些单模型家族那种爆炸式过拟合?机器学习困难essay未尝试面试订阅2584再加一棵树带来的边际方差下降 3在等相关树模型下,推导把树的数量从 B 增加到 B+1 时,集成方差会下降多少。机器学习困难derivation未尝试面试订阅2585达到目标方差上限所需的树数 4设每棵树的方差为 sigma 2,任意两棵树的相关系数为 rho。假设目标上限 V 满足 V > rho sigma 2,推导要把集成方差压到不超过 V 所需的最小 B。机器学习困难derivation未尝试面试订阅2591为什么小样本下 OOB 可能很吵 19为什么在小数据集上,即使森林本身还算稳定,OOB 误差也可能波动很大?机器学习简单essay未尝试免费2592等效独立树棵数 8定义 B eff,使得相关森林的方差 sigma 2 [rho + (1-rho)/B] 与独立树平均的方差 sigma 2 / B eff 相等。请推导 B eff。机器学习简单derivation未尝试免费2593为什么平均无法治愈系统性标签噪声 20为什么当训练标签本身存在系统性污染时,单纯把森林做大可能并不能修复性能?机器学习中等essay未尝试面试订阅2599为什么 boosting 主要是在压偏差 9为什么 boosting 通常被描述成“主要降偏差”的方法,而不是“主要降方差”的方法?机器学习中等essay未尝试免费2602为什么即使训练损失下降也需要早停 12为什么即使 boosting 的训练目标还在持续改善,验证表现也可能已经开始恶化?机器学习中等essay未尝试免费2604为什么标签噪声对 boosting 特别伤 13为什么在标签有噪声时,boosting 往往会受伤特别严重?机器学习中等essay未尝试免费2607为什么过深的基树会抵消 shrinkage 的纪律性 15为什么一个非常深的基树,会削弱“小学习率”本来带来的正则化效果?机器学习简单essay未尝试免费2611为什么 boosting 比随机森林更难并行 16为什么 boosting 在轮次之间天生就比随机森林更难并行?机器学习简单essay未尝试免费2614为什么初始预测会影响前几轮学习轨迹 18为什么 boosting 的初始预测 F 0 会影响前几轮的学习轨迹?机器学习中等essay未尝试面试订阅2615为什么校准可能比排序更早恶化 19为什么 boosting 后期有时还能把样本排得很好,但预测分数本身的校准却已经变差?机器学习困难essay未尝试面试订阅2616为什么叶子优先生长会有更高方差 20为什么在 boosting 系统里,叶子优先生长往往比层级式生长更容易带来高方差?机器学习简单essay未尝试免费2618为什么很多次小修正能打败一棵大树 21为什么一串小步加性的 boosting 修正,能打败一棵样本内灵活度相近的大树?机器学习中等essay未尝试面试订阅2619为什么后期验证收益变平仍意味着该停了 22如果 boosting 在训练后期每一轮带来的验证收益已经非常小而且忽上忽下,为什么这通常就是该停下来的强信号?机器学习中等essay未尝试面试订阅