测试块可用比例 9
一个 30 天的测试块使用 10 日前瞻收益来评估。如果要求每个完整标签都必须留在测试块内部,那么测试块中的起始日期有多少比例是真正可用的?
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
English questions一个 30 天的测试块使用 10 日前瞻收益来评估。如果要求每个完整标签都必须留在测试块内部,那么测试块中的起始日期有多少比例是真正可用的?
打开 →线上系统在测试时经常会缺失一个传感器特征,但你的模型族可以很干净地分解联合特征似然。在这种情况下,哪一类模型会获得更现实的优势?
打开 →周五下班前你在私募的 CI 仪表盘上看到一片绿: xyzprice 的 86 个测试全过,行覆盖率显示 95%。周一开盘九点二十,研究系统在喂一段空盘后行情时崩在了 mean price([]) 上——你写过的测试里,从来没有一个把空列表喂进去。覆盖率告诉你「这一行跑过」,但不会告诉你「这一行只在 happy path 上跑过」。上一课的 pytest 让你...
打开 →某沪深300指增私募的策略部署组组长周一早会带着三份交付物走进风控委员会。PM 刚审批通过一只新主动股票策略,研究组把 4.2 alpha 管线(截面动量 + 质量 + 价值的复合 alpha,样本内 IR 约 0.5)、4.3 因子暴露矩阵 B (Barra 风格 5 个 + 中信一级行业 10 个 + 国家因子)、4.4.2 Barra 风险模型 (Si...
打开 →python · packaging · pyproject · venv · uv · pip · dependencies · testing
打开 →portfolio-optimization · constrained-mv · quadratic-programming · qp · cvxpy · osqp · long-only · leverage-cap
打开 →有人辩称不存在泄漏,因为代码从未访问测试标签。给出这个辩护在真实机器学习流水线里为什么会失效的核心原因。
打开 →某产品上线在市场接受时收益 $+30$,不接受时收益 $-12$;接受的先验概率为 $\frac{3}{10}$。你也可以选择搁置产品,收益为 $0$。一位顾问提供一项完全准确的测试,可在你决策前揭示真实市场状态。你最多应为这项测试支付多少?
打开 →为什么即使真实预测信号完全没变,加入大量灵活特征仍可能恶化测试误差?
打开 →为什么在原始测试资源相同的情况下,自适应提问策略通常比非自适应测试电池能区分更多状态?
打开 →为什么在这里用测试集调 lambda,与任何其他 ML 流水线里一样有问题?
打开 →一个流程在划分训练集和测试集之前,先用全量数据的均值和标准差对每个特征做标准化。这样干净吗?
打开 →国内某头部私募(类似鸣熙资产)C++ 团队的第二个 sprint,组长把一个迷你定价库交给你独立负责。上一任留给你一份 600 行的 main.cpp ,能编、能跑、打印三个数,零测试。下个 sprint 的任务清单里包括加上一个 put call parity 的健全性检查、把库挂到一个策略二进制里、并通过一次把「单文件 C++ 工程」列为 P2 反模式的...
打开 →一个 walk-forward 流程先使用 24 个月训练,然后评估 3 个月测试块,并且在总长 39 个月的历史上每次只前移 1 个月。整个流程一共会重训多少次模型?
打开 →第一个测试有三个结果。若出现结果 A,你还可以再问两个二元问题;若出现结果 B,你还可以再问一个三元问题;若出现结果 C,流程必须停止。最多能区分多少个等概率状态?
打开 →若在训练块固定时把测试块拉长,评分方差和制度纯度通常会怎样变化?
打开 →团队训练了一个模型,画出随 boosting 轮数变化的测试损失曲线,并汇报测试值最好的那个轮数。为什么这个测试分数已经不能作为最终检验?
打开 →一个滚动 walk-forward 方案使用 24 个月训练、随后 1 个月 embargo、再接 6 个月测试,并且每次前移 6 个月,总历史长度为 61 个月。每个测试块的前 2 个月只用于预热滚动特征,不能交易。最终一共能得到多少个月的可交易样本外月份?
打开 →如果你在看到测试集中出现了多少稀有类别之后,才决定保留类别所需的最小频数阈值,为什么这已经是被污染的设计决策?
打开 →模型先在测试集上评估,随后发现一个 bug,修复代码后又用同一测试集来验证修复并在两个修正版之间做选择。为什么第二次使用已经不是干净的测试?
打开 →周三晚上 11 点,你在某 私募 量化组里维护着一个内部小包 xyzprice :封装 涨跌停 价计算、复权因子拼接、T+1 持仓核算这三件每周都要做的事。组里另外两位 PM 想直接 pip install xyzprice 就能用,而不是每次复制粘贴你脚本里那几个函数。 pyproject.toml 已经写好,pytest 测试全绿——下一步只剩四件事:构...
打开 →周三下午两点。一家 A 股 私募 的资深同事打开你的 MR,标题是 feat(risk): 添加 沪深300 因子 z 列至业绩归因 。改了 12 个文件。二十秒之内审查线上铺满了「文件末尾多一个空行」「这个 import 没用到」「第 47 行行尾有空白」「import 没排序」之类的评论。你能感到审查时间正在漏走——这些评论没一条是关于你因子逻辑对不对的...
打开 →某 H 股 + A 股双地区运营私募的首席风险官:周五下午三件事压在桌上。(1) 风控部要把当前持仓在「2015 年 A 股股灾再来一次」情景下重定价——CEO 周一下午开战略会要听数;(2) 监管要求按 2023 年新修《商业银行资本管理办法》算 FRTB 市场风险资本(基金有港股账户接入银行同业柜台,部分敞口需要并表);(3) 投委会要一张「一页式风险报...
打开 →国内某私募中频组新加入的应届工程师周一第一天克隆了项目仓库。仓库的 Cargo.toml 声明一个 library crate 加一个 binary crate; src/lib.rs 暴露一个 pricing 模块; src/pricing.rs 装着 Lesson 2 写过的 510300.SH 沪深300 ETF 期权闭式 Black Scholes ...
打开 →周三晚上九点,你在一家上海私募的策略组里,把白天调好的 A 股因子算子打包发给同事,让他在另一台机器上跑同样的回测。他 git clone 完,进到目录里直接 python main.py ,立刻就崩了: ModuleNotFoundError: No module named 'xyzprice' 。你叫他先 cd src && python main.p...
打开 →周一开盘前一刻钟,你在私募的研究服务器上 merge 了一段对 mean price 的「无害重构」——只是把 sum(...) / len(...) 拆成两步,方便在中间加日志。脚本照常跑完,回测照常出图。下午两点你才发现 PnL 报表上 XYZ001.SH 的当日均价对不上:你在重构时把 sum 与 len 的参数搞反了,函数对所有非空输入都返回 1 。...
打开 →某沪深300指增私募的中级量化研究员把 L2 的成本感知优化器跑了三年。样本内纸面 Sharpe = 1.4,实盘 Sharpe = 0.7。她把回测净值拆开,发现两件事:12 1 截面动量 mu hat 的标准误差是均值的 3 5 倍——Chopra Ziemba(1993)《The effect of errors in means, variances...
打开 →为什么 Sherman-Morrison 公式恰好在 1 + v^T A^(-1)u = 0 时失效?
打开 →为什么即使偏差和方差看起来都已经很小,模型改进仍可能停滞?
打开 →为什么正则化让训练集拟合变差、却改善样本外 MSE,这完全可能且合理?
打开 →