INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 415

第 15 / 21 页

非代码面试题

显示 20 / 415 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

2547最弱链接 alpha 的数值计算 16某个节点若被剪成单个叶节点，误差为 18；它当前子树的训练误差为 10，且有 3 个叶节点。该子树对应的最弱链接 alpha 是多少？机器学习简单数值题未尝试免费 2549回归节点上是否切分的带惩罚决策 18某个回归叶节点的 SSE 为 260。若切分后左右子节点的总 SSE 会变成 230，并且每多一个叶节点要付出 12 的复杂度惩罚，那么是否应保留该切分？机器学习中等数值题未尝试免费 2550不对称交易代价下叶节点的最优标签一个分类叶节点里有 6 个正样本和 14 个负样本。预测为正时，每个假阳性的代价是 1；预测为负时，每个假阴性的代价是 4。这个叶节点应该预测哪一类，才能最小化叶节点损失？机器学习困难derivation未尝试面试订阅 2551为什么预剪枝会错过一个好的两步切分 9为什么很激进的预剪枝规则，可能会拒绝一个“眼前看起来不够强”的首个切分，但这个切分其实能打开一个更好的二层结构？机器学习简单essay未尝试免费 2552数据扰动后哪一个切分变成最优 19切分 A 原本的增益是 1.20，切分 B 的增益是 1.05。修正一行数据之后，A 的增益下降 0.10，B 的增益上升 0.08。现在哪个切分更优？机器学习中等数值题未尝试免费 2553最大平衡深度的数值计算 20某棵树的根节点有 96 个样本，并且每次切分都完全平衡。若每个叶节点至少要有 12 个样本，最大深度是多少？机器学习中等数值题未尝试面试订阅 2554带代价时叶节点应输出的类别 21某个叶节点里有 7 个正样本和 13 个负样本。若预测为负类，则每个被错分的正样本要付出 4 的假阴性代价；若预测为正类，则每个被错分的负样本要付出 1 的假阳性代价。该叶节点应预测哪个类别？机器学习中等数值题未尝试面试订阅 2555最小叶节点约束下的最佳合法切分同一个节点上有三个候选切分，它们的 Gini 增益分别是 0.18、0.16 和 0.11，对应较小子节点的样本数分别是 3、4 和 7。若最小允许叶节点样本数是 4，实际会选择哪个切分？机器学习困难derivation未尝试面试订阅 2556分组重复值下的可行阈值数量 22一个已排序特征由 5 个不同取值块组成，块大小分别是 [3, 5, 2, 4, 6]，并且只允许在不同取值块之间切分。若每个子叶节点至少要有 6 个样本，那么合法阈值有多少个？机器学习简单数值题未尝试免费 2557为什么很小的数据扰动会重写整棵树 10为什么深层决策树常被称为“不稳定学习器”？机器学习简单essay未尝试免费 2559代理切分带来的期望错分数在主特征和代理特征都存在的 40 条训练样本中，代理切分有 34 条与主切分一致。若生产中有 12 条样本缺失主切分特征，只能靠代理切分路由，期望会有多少条被路由错？机器学习困难derivation未尝试面试订阅 2560全局样本权重同比缩放不会改变切分排序 5如果某个节点里的每个样本权重都同时乘上同一个常数 c>0，那么每个候选切分的加权纯度下降会如何变化？机器学习困难derivation未尝试面试订阅 2566选择应该先剪掉的最弱链接节点 24节点 A 若被剪成单叶，误差为 12；其当前子树误差为 7，且有 3 个叶节点。节点 B 若被剪成单叶，误差为 9；其当前子树误差为 6，且有 2 个叶节点。在 cost-complexity 剪枝下，哪个节点是更弱的链接、应更早被剪掉？机器学习简单数值题未尝试免费 2568比较带惩罚的树结构选项 25一个父节点如果不切分，其 SSE 为 70。若切成 2 个叶节点，总 SSE 为 44；若长成 3 个叶节点的子树，总 SSE 为 36。若相对于未切分节点，每多一个叶节点要付出 10 的复杂度惩罚，那么哪种结构的带惩罚目标最小？机器学习中等数值题未尝试免费 2570替代切分的一致率公式 8某个主切分在部分样本上缺失，因此用主特征可见的 M 个样本训练一个替代切分。若其中有 A 个样本被送到了与主切分相同的一侧，那么它的一致率是多少？机器学习困难derivation未尝试面试订阅 2572集成方差的数值计算 22每棵树的方差为 9，任意两棵树的相关系数为 0.2，森林共有 25 棵树。森林平均预测的方差是多少？机器学习简单数值题未尝试免费 2577为什么 OOB 不适用于分组或时间数据 13为什么当样本之间由实体或时间联系在一起，而不是可交换抽样时，out-of-bag 误差会具有误导性？机器学习中等essay未尝试面试订阅 2581为什么随机森林回归外推能力差 16为什么随机森林回归通常无法把趋势外推到远超训练范围的区域？机器学习简单essay未尝试免费 2589偏差不变时 bagging 后的 MSE 7假设每棵树的偏差平方都是 b 2，预测噪声底为 nu，而 bagging 只会按等相关树公式改变方差项。请推导拥有 B 棵树时的 bagged 测试 MSE。机器学习困难derivation未尝试面试订阅 2592等效独立树棵数 8定义 B eff，使得相关森林的方差 sigma 2 [rho + (1-rho)/B] 与独立树平均的方差 sigma 2 / B eff 相等。请推导 B eff。机器学习简单derivation未尝试免费