INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题;编程题使用独立的 LeetCode 式 coding lab。

题目
4169
领域
8
当前筛选
333

14 / 17

非代码面试题

显示 20 / 333 道匹配题目

答题状态:未尝试未正确已正确
4401收盘到收盘泄露你在今天收盘前做出预测,目标是明天的 close-to-close 收益率,但某个特征使用了今天正式收盘竞价后的最终收盘价。为什么这构成泄露?机器学习中等essay未尝试面试订阅4402标签重叠陷阱你每天都构造一个未来 5 日收益标签,然后把相邻样本当作独立样本来用。这里的结构性问题是什么?机器学习中等essay未尝试面试订阅4403偷看的滚动均值时间 t 的一个特征使用了从 t-19 到 t+1 的滚动均值。即使只多看了一天,为什么也不可接受?机器学习中等essay未尝试面试订阅4404横截面残差化时点为什么对日收益特征做因子残差化时,必须使用特征时点已知的暴露,而不是用之后的收益再估出来的暴露?机器学习中等essay未尝试面试订阅4405公司行为错位某个特征用原始价格,而标签用的是拆股调整后的未来收益率。这会带来什么问题?机器学习中等essay未尝试面试订阅4406horizon 越长,平滑越强如果你把未来收益标签从 1 天拉长到 20 天,但依然按日采样,那么重叠程度和有效样本独立性会怎样变化?机器学习中等essay未尝试面试订阅4407残差特征漂移为什么一个样本内看起来很稳定的残差化收益特征,在制度切换后可能突然变得不稳定?机器学习中等essay未尝试面试订阅4408归一化窗口长度如果你缩短用于 z-score 标准化的滚动窗口,特征通常会如何响应近期冲击?机器学习中等essay未尝试面试订阅4409原始收益还是缩放收益为什么直接用原始多资产收益训练模型,相比用标准化收益特征,更容易让模型在不同资产之间分配错误注意力?机器学习中等essay未尝试面试订阅4410采样频率当你在中等 horizon 收益特征上把采样频率从日频降到周频时,重叠程度和微观结构噪声通常会怎样变化?机器学习中等essay未尝试面试订阅4411加新特征之前在往模型里加入一个新的收益类特征之前,第一步应该先问什么对齐问题?机器学习中等essay未尝试面试订阅4412残差化之前在把收益对因子做残差化、并把残差当成新特征之前,第一步应该澄清什么?机器学习中等essay未尝试面试订阅4413拉长 horizon 之前因为 1 日标签看起来太噪声,你想拉长未来收益 horizon。在动手前第一步应该检查什么?机器学习中等essay未尝试面试订阅4414标准化之前在标准化一个收益特征之前,首先应该检查你混在一起做标准化的资产池有什么性质?机器学习中等essay未尝试面试订阅4415相信特征重要性之前一个收益特征在训练好的模型里看起来非常重要。在认定它抓住了真实 alpha 之前,第一步应该检查什么?机器学习中等essay未尝试面试订阅4416滚动回测中的可交易测试覆盖 1一个滚动 walk-forward 方案使用 24 个月训练、随后 1 个月 embargo、再接 6 个月测试,并且每次前移 6 个月,总历史长度为 61 个月。每个测试块的前 2 个月只用于预热滚动特征,不能交易。最终一共能得到多少个月的可交易样本外月份?机器学习简单数值题未尝试面试订阅4417扩展训练窗的最终长度 2一个 expanding-window 的 walk-forward 从 18 个月训练开始,随后使用 1 个月 embargo 和 4 个月测试块,并且每轮前移 4 个月,总历史长度为 59 个月。最后一个完整折里的训练窗长度是多少?机器学习简单数值题未尝试面试订阅4418多折回测中的 embargo 总预算 3某个 walk-forward 回测一共产生 7 个完整折,并且研究流程要求在每个训练块和后续测试块之间插入 3 天 embargo。整个回测一共会因为 embargo 损失多少个日历日?机器学习简单数值题未尝试面试订阅4419扩展窗口下的平均训练长度 4一个 expanding walk-forward 以 12 个月训练开始,并且在 5 个完整测试折之间每次前移 6 个月。5 个折里使用的平均训练窗长度是多少?机器学习简单数值题未尝试面试订阅4420标签安全的最后训练日 5某个测试块从第 121 天开始。训练标签使用 5 日前瞻收益,并且在测试块前还额外设置 2 天 embargo。哪个训练日是仍然能够保留完整前瞻标签的最后一天?机器学习简单数值题未尝试面试订阅