INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
453

10 / 23

非代码面试题

显示 20 / 453 道匹配题目

答题状态:未尝试未正确已正确
2415为什么一个稳定但有偏的模型在实务上仍可能更受青睐为什么交易台可能更偏好一个略有偏差、但行为稳定的模型,而不是一个偏差更低、却在每次重训之间剧烈波动的模型?机器学习困难essay未尝试面试订阅2430为什么加权 Brier 的 Bayes 解仍是加权均值 7对于二元变量 Y,考虑加权平方损失 alpha Y (1-q) 2 + beta (1-Y) q 2。把 Bayes 概率 q 表示成 p=P(Y=1|X) 的函数。机器学习困难derivation未尝试面试订阅2438为什么凸性会让“平均预测”变得安全为什么损失函数的凸性会支持这样一种直觉:把相似的预测做平均通常不会太吃亏?机器学习困难essay未尝试面试订阅2463调完 bug 之后继续复用测试集模型先在测试集上评估,随后发现一个 bug,修复代码后又用同一测试集来验证修复并在两个修正版之间做选择。为什么第二次使用已经不是干净的测试?机器学习中等essay未尝试面试订阅2470看到测试集构成后再定稀有类别阈值如果你在看到测试集中出现了多少稀有类别之后,才决定保留类别所需的最小频数阈值,为什么这已经是被污染的设计决策?机器学习困难essay未尝试面试订阅2483为什么中心化不会改变斜率 13为什么在带截距的一元 OLS 中,对 x 和 y 做中心化不会改变拟合斜率?机器学习中等derivation未尝试面试订阅2488为什么带截距时残差均值为零 18为什么只要模型里包含截距项,OLS 残差就必须求和为零?机器学习困难derivation未尝试面试订阅2525只含截距的逻辑回归做一次牛顿更新一个只含截距的逻辑回归模型拟合 7 个正样本和 3 个负样本。从 b 0 = 0 出发,最小化负对数似然时做一次牛顿更新得到的 b 1 是多少?机器学习困难数值题未尝试面试订阅2552数据扰动后哪一个切分变成最优 19切分 A 原本的增益是 1.20,切分 B 的增益是 1.05。修正一行数据之后,A 的增益下降 0.10,B 的增益上升 0.08。现在哪个切分更优?机器学习中等数值题未尝试免费2565带 alpha 收费的验证剪枝决策 23把一个单叶节点替换成一个 3 叶子树后,验证损失下降了 4.5。若每增加一个叶节点要付出 alpha = 1.2 的复杂度收费,是否应保留该子树?机器学习困难数值题未尝试面试订阅2610eta 与 gamma 的缩放互逆不变性 6为什么把每一轮的叶节点更新 gamma m 都乘以 c,同时把学习率 eta 除以 c,会让最终加性得分保持不变?机器学习困难derivation未尝试面试订阅2615为什么校准可能比排序更早恶化 19为什么 boosting 后期有时还能把样本排得很好,但预测分数本身的校准却已经变差?机器学习困难essay未尝试面试订阅2618为什么很多次小修正能打败一棵大树 21为什么一串小步加性的 boosting 修正,能打败一棵样本内灵活度相近的大树?机器学习中等essay未尝试面试订阅2650清除重叠和禁运后剩下的训练天数一个 100 天的事件研究样本把中间连续 20 天作为验证块。标签向前看 5 天,并且在验证块两侧各加 2 天禁运。最终还能用于训练的天数是多少?机器学习困难数值题未尝试面试订阅2659单侧 purge 后的训练集大小一个数据集有 500 个按时间排序的观测。某次验证块使用第 301 到 350 个观测。如果只在验证块前方额外 purge 掉 10 个观测,而不在其他地方 purge,那么还剩多少个观测可用于训练?机器学习困难数值题未尝试面试订阅2664外层 CV 最多会产出多少个不同的超参数赢家某个嵌套 CV 使用 7 个外层折,并且每个外层折内都会选出恰好 1 组超参数。不同外层折上的“赢家超参数”最多可能有多少种?机器学习困难derivation未尝试面试订阅2668即使特征只看过去,为什么仍然需要禁运假设特征只使用过去价格,但标签依赖于一个未来事件窗口内的收益。为什么在验证块周围仍然可能需要设置禁运区?机器学习中等essay未尝试面试订阅2669为什么 purge 和 embargo 解决的是不同问题为什么在时间序列验证里,purge 与 embargo 并不是同一件事?机器学习中等essay未尝试面试订阅2678净信号相对成本噪声的比率某策略每笔交易的毛期望边际收益是 5bp,但执行成本不确定性的标准差是每笔 12bp。毛边际收益相对于成本噪声的比率是多少?机器学习中等数值题未尝试面试订阅2680为什么很低的 R 平方仍可能有价值却很难验证为什么一个解释力很小的信号仍可能有经济价值,但同时又特别难被有说服力地验证?机器学习困难essay未尝试面试订阅