INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 215

第 9 / 11 页

非代码面试题

显示 20 / 215 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

2520为什么 L1 与 L2 在零附近的拉力不同 25为什么在接近原点时，L1 正则会比 L2 产生更强的“精确压到零”的趋势？机器学习困难derivation未尝试面试订阅 2522由正样本比例求截距 2在仅截距的 logistic 模型里，若拟合概率为 p hat，什么样的截距 b 满足 sigma(b)=p hat？机器学习简单derivation未尝试免费 2523logistic 负对数似然的梯度 3对单个观测 (x,y)，其中 y in 0,1 ，打分为 z = w T x。其负对数似然关于 w 的梯度是什么？机器学习中等derivation未尝试免费 2524为什么 logistic 回归没有闭式解 5为什么 logistic 回归通常需要迭代优化，而不像 OLS 那样有正规方程式的闭式解？机器学习中等essay未尝试免费 2525只含截距的逻辑回归做一次牛顿更新一个只含截距的逻辑回归模型拟合 7 个正样本和 3 个负样本。从 b 0 = 0 出发，最小化负对数似然时做一次牛顿更新得到的 b 1 是多少？机器学习困难数值题未尝试面试订阅 2535不对称分类代价下的判决阈值某交易台对假阳性的代价为 1，对假阴性的代价为 5。在校准好的逻辑回归概率 p = P(Y=1|x) 下，应该在大于什么阈值时预测类别 1，才能最小化期望代价？机器学习困难derivation未尝试面试订阅 2540部署先验变化引起的截距修正某个逻辑回归模型是在类别先验 0.5 下训练的，截距为 -0.4。部署时基准率下降到 0.2，并假设特征似然比保持不变。调整后的截距应该是多少？机器学习困难数值题未尝试面试订阅 2550不对称交易代价下叶节点的最优标签一个分类叶节点里有 6 个正样本和 14 个负样本。预测为正时，每个假阳性的代价是 1；预测为负时，每个假阴性的代价是 4。这个叶节点应该预测哪一类，才能最小化叶节点损失？机器学习困难derivation未尝试面试订阅 2553最大平衡深度的数值计算 20某棵树的根节点有 96 个样本，并且每次切分都完全平衡。若每个叶节点至少要有 12 个样本，最大深度是多少？机器学习中等数值题未尝试面试订阅 2555最小叶节点约束下的最佳合法切分同一个节点上有三个候选切分，它们的 Gini 增益分别是 0.18、0.16 和 0.11，对应较小子节点的样本数分别是 3、4 和 7。若最小允许叶节点样本数是 4，实际会选择哪个切分？机器学习困难derivation未尝试面试订阅 2559代理切分带来的期望错分数在主特征和代理特征都存在的 40 条训练样本中，代理切分有 34 条与主切分一致。若生产中有 12 条样本缺失主切分特征，只能靠代理切分路由，期望会有多少条被路由错？机器学习困难derivation未尝试面试订阅 2560全局样本权重同比缩放不会改变切分排序 5如果某个节点里的每个样本权重都同时乘上同一个常数 c>0，那么每个候选切分的加权纯度下降会如何变化？机器学习困难derivation未尝试面试订阅 2564保留一次切分所需的验证惩罚阈值一个 stump 的验证损失是 30。把它切成两个叶子后，验证损失降到 22，但每增加一个叶子都要付出 lambda 的不稳定性惩罚。lambda 最大取到多少时，这次切分仍然值得保留？机器学习困难derivation未尝试面试订阅 2574为什么 bagging 最能帮助不稳定学习器 10为什么 bagging 通常对深树帮助很大，却对本来就稳定的学习器帮助较小？机器学习中等essay未尝试免费 2575为什么 bagging 很少能修复高偏差 11为什么不应指望 bagging 单独去拯救一个“单树本身就系统性失配”的学习器？机器学习困难essay未尝试面试订阅 2577为什么 OOB 不适用于分组或时间数据 13为什么当样本之间由实体或时间联系在一起，而不是可交换抽样时，out-of-bag 误差会具有误导性？机器学习中等essay未尝试面试订阅 2580为什么增加树数通常不会制造经典意义上的过拟合 15为什么给随机森林继续加树，通常只是收益趋于平台，而不会出现某些单模型家族那种爆炸式过拟合？机器学习困难essay未尝试面试订阅 2584再加一棵树带来的边际方差下降 3在等相关树模型下，推导把树的数量从 B 增加到 B+1 时，集成方差会下降多少。机器学习困难derivation未尝试面试订阅 2585达到目标方差上限所需的树数 4设每棵树的方差为 sigma 2，任意两棵树的相关系数为 rho。假设目标上限 V 满足 V > rho sigma 2，推导要把集成方差压到不超过 V 所需的最小 B。机器学习困难derivation未尝试面试订阅 2589偏差不变时 bagging 后的 MSE 7假设每棵树的偏差平方都是 b 2，预测噪声底为 nu，而 bagging 只会按等相关树公式改变方差项。请推导拥有 B 棵树时的 bagged 测试 MSE。机器学习困难derivation未尝试面试订阅