INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
622

13 / 32

非代码面试题

显示 20 / 622 道匹配题目

答题状态:未尝试未正确已正确
2665为什么过小的折会夸大正则化的吸引力为什么当训练折很小时,强正则模型看起来可能会比它们在完整训练集上更有优势?机器学习困难essay未尝试面试订阅2666为什么外层折之间的分歧本身就有信息如果嵌套 CV 的不同外层折总是选出不同的超参数,这通常说明了什么?机器学习简单essay未尝试免费2667面对重复实体时,按类别分层还不够当同一发行人反复出现且发行人身份本身带有预测信息时,为什么按类别分层的交叉验证仍然可能失败得很厉害?机器学习简单essay未尝试免费2668即使特征只看过去,为什么仍然需要禁运假设特征只使用过去价格,但标签依赖于一个未来事件窗口内的收益。为什么在验证块周围仍然可能需要设置禁运区?机器学习中等essay未尝试面试订阅2669为什么 purge 和 embargo 解决的是不同问题为什么在时间序列验证里,purge 与 embargo 并不是同一件事?机器学习中等essay未尝试面试订阅2670为什么最佳 CV 设计取决于部署单元为什么折分规则应该去贴近模型在生产环境里真正需要泛化的那个单元?机器学习困难essay未尝试面试订阅2671共同因子相关下的有效广度某研究员跟踪了 100 个横截面 alpha 子策略,它们两两相关系数大约为 0.20。使用粗略的等相关广度近似 n eff =n/(1+(n-1) ),有效独立下注数是多少?机器学习简单数值题未尝试免费2672考虑自相关之后的有效样本量某个月频特征一共观测了 60 个月,并且近似服从滞后 1 自相关系数为 =0.6 的 AR(1) 过程。用启发式近似 n eff \approx n(1- )/(1+ ),有效样本量是多少?机器学习简单数值题未尝试面试订阅2673相反市场状态下的平均边际收益某个信号在平静市场的 70% 日期里赚 +6bp,而在压力市场的 30% 日期里亏 -10bp。它的无条件日均边际收益是多少(单位:bp)?机器学习中等数值题未尝试面试订阅2674稀有 alpha 事件探测器的精确率只有 2% 的日期包含真正值得交易的错价事件。某分类器能抓住其中 65% 的日期,但也会在 4% 的正常日期上误报。正向警报的精确率是多少?机器学习中等derivation未尝试面试订阅2675考虑交易成本后的盈亏平衡命中率某个方向性模型在判断正确时每笔赚 +1 单位,判断错误时每笔亏 -1 单位,以上都还没扣成本。每次往返交易无论输赢还要额外支付 0.08 单位成本。使期望净收益为 0 的命中率 p 是多少?机器学习困难derivation未尝试面试订阅2676很小的尾部概率也能主导平均收益某策略在 98% 的日期里赚 +0.04%,在剩下 2% 的日期里亏 -2.5%。它的无条件日均收益是多少?机器学习简单数值题未尝试免费2677旧状态数据的半衰期折现假设预测相关性按 6 个月的半衰期衰减。在这个指数衰减启发式下,相对于当前状态数据,18 个月前的观测应该赋予多大权重?机器学习中等derivation未尝试面试订阅2678净信号相对成本噪声的比率某策略每笔交易的毛期望边际收益是 5bp,但执行成本不确定性的标准差是每笔 12bp。毛边际收益相对于成本噪声的比率是多少?机器学习中等数值题未尝试面试订阅2679为什么几百只股票不等于几百个独立标签为什么一个每天有几百只股票的横截面样本,实际提供的信息量往往远小于行数看上去那么多?机器学习中等essay未尝试面试订阅2680为什么很低的 R 平方仍可能有价值却很难验证为什么一个解释力很小的信号仍可能有经济价值,但同时又特别难被有说服力地验证?机器学习困难essay未尝试面试订阅2681为什么上线部署会改变生成标签的环境为什么一个在回测里看起来有预测力的模型,一旦交易台真的开始按它交易,预测力反而可能下降?机器学习简单essay未尝试免费2682为什么被公开的信号最容易因拥挤而衰减为什么那些最容易解释、最容易复制的信号,在公开之后通常会比更脆弱的小众边际优势衰减得更快?机器学习简单essay未尝试面试订阅2683为什么过长的训练窗口可能学到的是错误的世界为什么在金融问题里,增加更多历史年份虽然会降低估计方差,却仍可能让模型表现更差?机器学习中等essay未尝试面试订阅2684为什么短窗口虽然自适应却也更容易来回打脸为什么短滚动窗口虽然能更快适应新状态,但又会让参数估计明显更不稳定?机器学习困难essay未尝试面试订阅