第 1 / 2 页
非代码面试题
显示 20 / 24 道匹配题目
答题状态:未尝试未正确已正确
ID题目领域难度题型进度权限
2696穿过两道独立研究关卡的伪策略概率某交易台尝试了 80 个真正无效的策略想法。只有先通过 10% 的样本内筛选、再通过 5% 的独立样本外确认,策略才会被保留,并假设在零假设下两次检验相互独立。至少有一个无效想法同时穿过两道关卡的概率是多少?机器学习简单derivation未尝试面试订阅2697把 240 个变体聚成 24 个家族后的伪赢家概率研究员生成了 240 个高度相关的策略变体,但认为它们只相当于 24 个“有效独立”的策略家族。若交易台仍把任何 p 值低于 8% 的家族都当作发现,那么在零假设下至少出现一个伪家族赢家的近似概率是多少?机器学习简单数值题未尝试面试订阅2698把家族层面伪发现概率压到 10% 所需的单次显著性阈值某交易台计划尝试 60 个有效独立的策略想法。若采用独立近似,要让至少出现一个伪赢家的概率恰好为 10%,单次检验显著性水平 alpha 应取多少?机器学习中等数值题未尝试面试订阅2699零假设在两道独立筛查中幸存的概率某个零假设策略必须先通过 10% 水平的探索性筛查,再通过 5% 水平的最终独立留出集检验。若在零假设下两次测试相互独立,则它同时幸存的概率是多少?机器学习中等derivation未尝试面试订阅2700用有效独立簇而不是原始变体计算整体错误率某研究员产生了 120 个参数变体,但它们大致只相当于 6 个有效独立的策略簇。若粗略地对每个簇使用 5% 阈值,则 6 个簇中至少出现一个假赢家的概率是多少?机器学习困难数值题未尝试面试订阅2701隐藏在设计旋钮中的搜索深度某团队在报告最佳结果之前,尝试了 4 个股票池、5 种再平衡频率和 6 套交易成本假设。它实际上隐式搜索了多少种设计组合?机器学习简单数值题未尝试面试订阅270250 个零假设变体里最佳 t 统计量超过 2.4 的概率假设 50 个真正零假设下的标准化 t 统计量近似独立且服从 N(0,1)。它们的最大值超过 2.4 的概率是多少?机器学习中等数值题未尝试面试订阅2703零假设 Sharpe 扫描中出现大赢家的概率假设 25 个彼此独立的零假设策略,各自产生的样本内 Sharpe 近似服从标准正态分布。最佳观测 Sharpe 超过 1.5 的概率是多少?机器学习中等derivation未尝试面试订阅2704穿过筛选漏斗的零假设策略期望数某研究平台跑了 200 个零假设策略。只有样本内 p 值低于 15% 的策略会被晋级,而每个晋级策略还必须通过一次新的 5% 确认检验。若在零假设下假设两阶段独立,最终穿过两阶段的伪策略期望数是多少?机器学习中等数值题未尝试面试订阅2706为什么“没碰过的留出集”一旦反复看就不再没碰过为什么研究者在想法迭代过程中反复查看最终留出集后,它就失去了原本的证据价值?机器学习简单essay未尝试面试订阅2707为什么成本假设本身也算超参数为什么在看过回测表现之后再去调整滑点曲线、费用表或融券假设,也算额外的模型搜索?机器学习简单essay未尝试面试订阅2708为什么股票池选择也是搜索树的一部分为什么改变可交易股票池应该被视为研究搜索树上的一个额外分支,而不是无害的背景设定?机器学习中等essay未尝试面试订阅2709为什么按样本内 Sharpe 排名会偏爱噪声峰值为什么即使所有候选策略都很平庸,按样本内 Sharpe 最高者来选,也会系统性地把被选中的策略往上偏?机器学习困难essay未尝试面试订阅2710为什么 CPCV 有帮助但治不了自适应创意生成为什么组合式路径验证能改善稳健性检验,但仍无法彻底解决研究者在看到旧结果后继续发明新点子的过拟合问题?机器学习困难essay未尝试面试订阅2711为什么纸上交易有时比再做一次回测更有信息量为什么一段前向纸上交易期,有时会比在历史样本里再挤出一个更花哨的切片更有证据价值?机器学习简单essay未尝试面试订阅2712为什么很多“小修改”合起来仍然是深度搜索为什么仅仅因为最终策略只是相对基线做了很多“小修改”,就声称不存在严重过拟合,这是误导性的?机器学习中等essay未尝试面试订阅2713为什么高换手策略更容易被过拟合为什么对于非常高换手的策略,回测过拟合会格外危险?机器学习中等essay未尝试面试订阅2714为什么搜索深度往往大于“命名策略”的数量为什么一个声称自己只测试过 5 个“命名策略”的团队,实际搜索深度仍可能远远大于 5?机器学习困难essay未尝试面试订阅2715为什么经济逻辑像一个对抗噪声的先验为什么一个背后有可信经济机制的策略,会比一个统计表现类似但没有连贯故事的策略更值得信任?机器学习困难essay未尝试面试订阅2716为什么止损规则调参同样属于多重检验为什么在看完整段历史权益曲线之后再去选止损阈值,应该被视为回测搜索,而不是单纯的风控卫生?机器学习简单essay未尝试免费