INTERVIEW PREP

数学与非代码面试题

覆盖数学、概率、统计、脑筋急转弯、机器学习和金融。这里负责筛选和进入单题；编程题使用独立的 LeetCode 式 coding lab。

做诊断按领域练习按面试风格练习代码题库

题目: 4169
领域: 8
当前筛选: 89

第 4 / 5 页

非代码面试题

显示 20 / 89 道匹配题目

答题状态：未尝试未正确已正确

ID题目领域难度题型进度权限

2704穿过筛选漏斗的零假设策略期望数某研究平台跑了 200 个零假设策略。只有样本内 p 值低于 15% 的策略会被晋级，而每个晋级策略还必须通过一次新的 5% 确认检验。若在零假设下假设两阶段独立，最终穿过两阶段的伪策略期望数是多少？机器学习中等数值题未尝试面试订阅 4183没有 OOF 逻辑的目标编码一个类别特征先用全样本里该类别的平均标签做 target encoding，然后把这些编码拿去做交叉验证。这样安全吗？机器学习中等derivation未尝试面试订阅 4366一倍标准误规则选模 1三个模型复杂度对应的平均交叉验证 AUC 分别为 0.790、0.802 和 0.808。最佳分数的标准误是 0.010。按 one-standard-error rule，应该保留哪个最简单的模型？机器学习简单数值题未尝试面试订阅 4367网格搜索组合数 2某个搜索网格包含 4 个学习率、3 个树深度和 5 个正则强度。一共有多少个超参数组合？机器学习简单数值题未尝试面试订阅 4368successive halving 总训练次数 3successive halving 从 27 个配置开始。每一轮保留三分之一的配置，并让所有幸存者各训练一次。如果总共运行 3 轮，会执行多少次模型训练？机器学习简单数值题未尝试面试订阅 4369重复交叉验证的总评分数 4你要比较 12 个超参数设置，使用 5 折交叉验证并重复 3 次。所有设置和所有折一共产生多少个验证分数？机器学习简单数值题未尝试面试订阅 4370时间序列切分下的训练次数 5某个时间序列超参数搜索要在 6 个 expanding-window 切分上评估 8 个设置。如果每个设置在每个切分上都重训一次，总共需要多少次模型训练？机器学习简单数值题未尝试面试订阅 4377标准化放在 CV 外面的主要问题 12如果先在全量数据上拟合标准化，再去做交叉验证，而不是把标准化放到每个 fold 里重做，这个调参流程的主要问题是什么？机器学习中等essay未尝试面试订阅 4389编码器放错位置时的立刻修正 24某个类别编码器先在全量样本上拟合了一次，然后被重复用于交叉验证里的各个 fold。立即应该如何修正？机器学习中等essay未尝试面试订阅 4416滚动回测中的可交易测试覆盖 1一个滚动 walk-forward 方案使用 24 个月训练、随后 1 个月 embargo、再接 6 个月测试，并且每次前移 6 个月，总历史长度为 61 个月。每个测试块的前 2 个月只用于预热滚动特征，不能交易。最终一共能得到多少个月的可交易样本外月份？机器学习简单数值题未尝试面试订阅 4417扩展训练窗的最终长度 2一个 expanding-window 的 walk-forward 从 18 个月训练开始，随后使用 1 个月 embargo 和 4 个月测试块，并且每轮前移 4 个月，总历史长度为 59 个月。最后一个完整折里的训练窗长度是多少？机器学习简单数值题未尝试面试订阅 4418多折回测中的 embargo 总预算 3某个 walk-forward 回测一共产生 7 个完整折，并且研究流程要求在每个训练块和后续测试块之间插入 3 天 embargo。整个回测一共会因为 embargo 损失多少个日历日？机器学习简单数值题未尝试面试订阅 4419扩展窗口下的平均训练长度 4一个 expanding walk-forward 以 12 个月训练开始，并且在 5 个完整测试折之间每次前移 6 个月。5 个折里使用的平均训练窗长度是多少？机器学习简单数值题未尝试面试订阅 4420标签安全的最后训练日 5某个测试块从第 121 天开始。训练标签使用 5 日前瞻收益，并且在测试块前还额外设置 2 天 embargo。哪个训练日是仍然能够保留完整前瞻标签的最后一天？机器学习简单数值题未尝试面试订阅 4421预热期之后的有效标签数 6一个 30 天的测试块使用 7 日前瞻收益作为评分标签，但前 4 天只用于预热滚动特征。最终还有多少个测试日信号能够拿到完整可观测的标签？机器学习中等数值题未尝试面试订阅 4422带执行滞后的标签容量 7一个测试块有 25 个交易日。第 t 天产生的信号会在第 t+1 天执行，并用第 t+1 天到第 t+4 天的 open-to-close 收益来评价。块内一共有多少个信号能够在不越过测试块末尾的前提下完成评分？机器学习中等数值题未尝试面试订阅 4423降频重平衡下的可用起点数 8一个 40 天的测试块只会每隔 5 天发出一次信号，并且从第 1 天开始发。每个信号都使用必须完整落在测试块内的 10 日前瞻标签。最终真正可评分的发射信号有多少个？机器学习中等数值题未尝试面试订阅 4424测试块可用比例 9一个 30 天的测试块使用 10 日前瞻收益来评估。如果要求每个完整标签都必须留在测试块内部，那么测试块中的起始日期有多少比例是真正可用的？机器学习中等数值题未尝试面试订阅 4425季度测试块下的月度重训次数 10一个 walk-forward 流程先使用 24 个月训练，然后评估 3 个月测试块，并且在总长 39 个月的历史上每次只前移 1 个月。整个流程一共会重训多少次模型？机器学习中等数值题未尝试面试订阅 5041反推缺失折的性能差 1一项 5 折交叉验证比较记录了四个配对得分差（模型 A 减模型 B）：[0.02, 0.01, -0.01, 0.03]。交易台报告说 5 折的总体平均差为 0.01。缺失的第 5 折差值是多少？机器学习中等数值题未尝试面试订阅