INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
1751

19 / 88

非代码面试题

显示 20 / 1751 道匹配题目

答题状态:未尝试未正确已正确
2540部署先验变化引起的截距修正某个逻辑回归模型是在类别先验 0.5 下训练的,截距为 -0.4。部署时基准率下降到 0.2,并假设特征似然比保持不变。调整后的截距应该是多少?机器学习困难数值题未尝试面试订阅2546带叶节点下限时的合法阈值数量 15一个已排序特征有 31 个观测,并且每个子叶节点至少要有 6 个观测。合法切分位置有多少个?机器学习简单数值题未尝试免费2547最弱链接 alpha 的数值计算 16某个节点若被剪成单个叶节点,误差为 18;它当前子树的训练误差为 10,且有 3 个叶节点。该子树对应的最弱链接 alpha 是多少?机器学习简单数值题未尝试免费2549回归节点上是否切分的带惩罚决策 18某个回归叶节点的 SSE 为 260。若切分后左右子节点的总 SSE 会变成 230,并且每多一个叶节点要付出 12 的复杂度惩罚,那么是否应保留该切分?机器学习中等数值题未尝试免费2550不对称交易代价下叶节点的最优标签一个分类叶节点里有 6 个正样本和 14 个负样本。预测为正时,每个假阳性的代价是 1;预测为负时,每个假阴性的代价是 4。这个叶节点应该预测哪一类,才能最小化叶节点损失?机器学习困难derivation未尝试面试订阅2551为什么预剪枝会错过一个好的两步切分 9为什么很激进的预剪枝规则,可能会拒绝一个“眼前看起来不够强”的首个切分,但这个切分其实能打开一个更好的二层结构?机器学习简单essay未尝试免费2552数据扰动后哪一个切分变成最优 19切分 A 原本的增益是 1.20,切分 B 的增益是 1.05。修正一行数据之后,A 的增益下降 0.10,B 的增益上升 0.08。现在哪个切分更优?机器学习中等数值题未尝试免费2553最大平衡深度的数值计算 20某棵树的根节点有 96 个样本,并且每次切分都完全平衡。若每个叶节点至少要有 12 个样本,最大深度是多少?机器学习中等数值题未尝试面试订阅2554带代价时叶节点应输出的类别 21某个叶节点里有 7 个正样本和 13 个负样本。若预测为负类,则每个被错分的正样本要付出 4 的假阴性代价;若预测为正类,则每个被错分的负样本要付出 1 的假阳性代价。该叶节点应预测哪个类别?机器学习中等数值题未尝试面试订阅2555最小叶节点约束下的最佳合法切分同一个节点上有三个候选切分,它们的 Gini 增益分别是 0.18、0.16 和 0.11,对应较小子节点的样本数分别是 3、4 和 7。若最小允许叶节点样本数是 4,实际会选择哪个切分?机器学习困难derivation未尝试面试订阅2556分组重复值下的可行阈值数量 22一个已排序特征由 5 个不同取值块组成,块大小分别是 [3, 5, 2, 4, 6],并且只允许在不同取值块之间切分。若每个子叶节点至少要有 6 个样本,那么合法阈值有多少个?机器学习简单数值题未尝试免费2559代理切分带来的期望错分数在主特征和代理特征都存在的 40 条训练样本中,代理切分有 34 条与主切分一致。若生产中有 12 条样本缺失主切分特征,只能靠代理切分路由,期望会有多少条被路由错?机器学习困难derivation未尝试面试订阅2560全局样本权重同比缩放不会改变切分排序 5如果某个节点里的每个样本权重都同时乘上同一个常数 c>0,那么每个候选切分的加权纯度下降会如何变化?机器学习困难derivation未尝试面试订阅2564保留一次切分所需的验证惩罚阈值一个 stump 的验证损失是 30。把它切成两个叶子后,验证损失降到 22,但每增加一个叶子都要付出 lambda 的不稳定性惩罚。lambda 最大取到多少时,这次切分仍然值得保留?机器学习困难derivation未尝试面试订阅2565带 alpha 收费的验证剪枝决策 23把一个单叶节点替换成一个 3 叶子树后,验证损失下降了 4.5。若每增加一个叶节点要付出 alpha = 1.2 的复杂度收费,是否应保留该子树?机器学习困难数值题未尝试面试订阅2571相关树平均后的方差公式 1设有 B 棵树,每棵树的方差都是 sigma 2,并且任意两棵树之间的相关系数都是 rho。推导它们简单平均后的方差。机器学习简单derivation未尝试免费2572集成方差的数值计算 22每棵树的方差为 9,任意两棵树的相关系数为 0.2,森林共有 25 棵树。森林平均预测的方差是多少?机器学习简单数值题未尝试免费2573无限森林的方差地板 2利用等相关树平均的方差公式,推导当树的棵数 B 趋于无穷时预测方差会收敛到什么值。机器学习中等derivation未尝试免费2574为什么 bagging 最能帮助不稳定学习器 10为什么 bagging 通常对深树帮助很大,却对本来就稳定的学习器帮助较小?机器学习中等essay未尝试免费2575为什么 bagging 很少能修复高偏差 11为什么不应指望 bagging 单独去拯救一个“单树本身就系统性失配”的学习器?机器学习困难essay未尝试面试订阅