INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
333

9 / 17

非代码面试题

显示 20 / 333 道匹配题目

答题状态:未尝试未正确已正确
2573无限森林的方差地板 2利用等相关树平均的方差公式,推导当树的棵数 B 趋于无穷时预测方差会收敛到什么值。机器学习中等derivation未尝试免费2575为什么 bagging 很少能修复高偏差 11为什么不应指望 bagging 单独去拯救一个“单树本身就系统性失配”的学习器?机器学习困难essay未尝试面试订阅2576为什么强势单因子场景下特征子采样更有价值 12为什么当某个非常强的特征本来会出现在几乎每棵树的顶部时,随机特征子采样反而能提升森林表现?机器学习简单essay未尝试免费2579由方差地板反推树相关性 23单棵树的方差是 6,而一个非常大的森林的方差似乎稳定在 1.8。隐含的树间相关系数 rho 是多少?机器学习中等数值题未尝试面试订阅2580为什么增加树数通常不会制造经典意义上的过拟合 15为什么给随机森林继续加树,通常只是收益趋于平台,而不会出现某些单模型家族那种爆炸式过拟合?机器学习困难essay未尝试面试订阅2589偏差不变时 bagging 后的 MSE 7假设每棵树的偏差平方都是 b 2,预测噪声底为 nu,而 bagging 只会按等相关树公式改变方差项。请推导拥有 B 棵树时的 bagged 测试 MSE。机器学习困难derivation未尝试面试订阅2596平方损失下叶节点最优更新值 1在平方误差的梯度提升里,某个终端区域 R 会被赋予一个常数更新 gamma。推导能使 sum i in R (r i-gamma) 2 最小的 gamma,其中 r i 是当前残差。机器学习简单derivation未尝试免费2599为什么 boosting 主要是在压偏差 9为什么 boosting 通常被描述成“主要降偏差”的方法,而不是“主要降方差”的方法?机器学习中等essay未尝试免费2613带 L2 正则的区域更新值 7在某个 boosting 区域内,选择一个常数更新 gamma 来最小化 sum i in R (r i-gamma) 2 + lambda gamma 2。记 S = sum i in R r i,n = |R|。推导 gamma。机器学习困难derivation未尝试面试订阅2648为什么带重叠滚动特征时随机 k 折无效为什么当每个特征向量都依赖一个 20 天滚动历史时,随机 k 折交叉验证会失效?机器学习简单essay未尝试免费2651为什么重复 CV 的多次结果不是独立实验为什么从业者不应该把 20 次重复 CV 的得分当成 20 个相互独立的实验?机器学习简单essay未尝试免费2654重复 k 折中单个样本进入验证集的期望次数在重复 R 次的普通 k 折交叉验证中,每个样本在每一次重复里都会恰好进入一个验证折。请推导某个样本在全部重复中总共进入验证集多少次。机器学习中等derivation未尝试面试订阅2658反复查看各折结果本身就是调参通道研究员反复查看每一折里哪些日期表现差,再据此修改特征。即使没有正式的超参数优化器,为什么这仍然是过拟合?机器学习中等essay未尝试面试订阅2664外层 CV 最多会产出多少个不同的超参数赢家某个嵌套 CV 使用 7 个外层折,并且每个外层折内都会选出恰好 1 组超参数。不同外层折上的“赢家超参数”最多可能有多少种?机器学习困难derivation未尝试面试订阅2671共同因子相关下的有效广度某研究员跟踪了 100 个横截面 alpha 子策略,它们两两相关系数大约为 0.20。使用粗略的等相关广度近似 n eff =n/(1+(n-1) ),有效独立下注数是多少?机器学习简单数值题未尝试免费2672考虑自相关之后的有效样本量某个月频特征一共观测了 60 个月,并且近似服从滞后 1 自相关系数为 =0.6 的 AR(1) 过程。用启发式近似 n eff \approx n(1- )/(1+ ),有效样本量是多少?机器学习简单数值题未尝试面试订阅2673相反市场状态下的平均边际收益某个信号在平静市场的 70% 日期里赚 +6bp,而在压力市场的 30% 日期里亏 -10bp。它的无条件日均边际收益是多少(单位:bp)?机器学习中等数值题未尝试面试订阅2676很小的尾部概率也能主导平均收益某策略在 98% 的日期里赚 +0.04%,在剩下 2% 的日期里亏 -2.5%。它的无条件日均收益是多少?机器学习简单数值题未尝试免费2677旧状态数据的半衰期折现假设预测相关性按 6 个月的半衰期衰减。在这个指数衰减启发式下,相对于当前状态数据,18 个月前的观测应该赋予多大权重?机器学习中等derivation未尝试面试订阅2679为什么几百只股票不等于几百个独立标签为什么一个每天有几百只股票的横截面样本,实际提供的信息量往往远小于行数看上去那么多?机器学习中等essay未尝试面试订阅