金融量化中的机器学习
machine-learning · financial-ml · cross-validation · purged-cv · cpcv · deflated-sharpe · multiple-testing · backtest-overfitting
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 17 个结果
中文题目machine-learning · financial-ml · cross-validation · purged-cv · cpcv · deflated-sharpe · multiple-testing · backtest-overfitting
打开 →钩子:五十条弱 alpha 与一个总组合 你在一家中证500 中频量化私募(private fund)工作。研究团队在过去六个月里训练出了五十条独立的 ML alpha:有用 LightGBM 在 沪深300 / 中证500 因子风格暴露上做次日 alpha 的,有 1 D CNN 在分钟线上做日内动量(momentum)的,有 Transformer 在卖...
打开 →Five family-level winners have ordered p-values 0.004, 0.011, 0.018, 0.031, and 0.070. For what range of BH target levels q would Benjamini-Hochberg keep exactly the first three discoveries?
打开 →A research grid contains 60 model variants, but the desk argues they amount to only 15 effectively distinct families. If it wants family-wise error at most 10% using a Bonferroni family-level rule, what p-value cutoff should it apply to each effective family?
打开 →A desk uses the same per-bucket cutoff 0.0045 across 20 independent event buckets. What family-wise false-positive probability does that imply?
打开 →Three ordered family p-values are 0.012, 0.027, and 0.030. The desk uses Holm at 5% family-wise error. By how much must the middle p-value fall so that all three themes pass?
打开 →A desk tries 10 lags for a genuinely null signal, keeps the best in-sample lag if any lag has p-value below alpha, and then requires a fresh holdout p-value below 10%. What alpha makes the overall false-launch probability exactly 2%, assuming independence under the null?
打开 →A researcher always reports the smallest p-value among 25 genuinely null backtests. Under independence and exact Uniform(0,1) null p-values, what is the median of that reported minimum?
打开 →A desk believes its many correlated parameter tweaks boil down to 18 effectively independent research choices. What Sidak per-choice cutoff controls family-wise error at 5%?
打开 →A PM tests 40 signals built from only a few common macro themes, so the p-values are strongly dependent. Why is 'just divide alpha by 40' often too crude, and what is the right conceptual response?
打开 →某私募的量化研究员把新风控流程在 60 个交易日上跑出的日收益序列丢到屏幕上,样本均值比对照组高出 12 bp,样本标准差 35 bp。组合经理只关心一个问题:这 12 bp 究竟是流程改造带来的真效应,还是 60 个数里凑巧抖出来的噪声?把「凑巧」翻译成数学,就是本课要交付的工具:在一个明确的概率模型下,把「真效应」与「凑巧」分到拒绝域与接受域两边,并给做...
打开 →某周三 下午,上海 量化 私募 明汯 / 幻方 风格 的 投决会。研究员 上 来 一个 动量 策略:L1 引擎 是 事件驱动(干净);L2 真实性 清单 每 一 项 都 过(PIT 数据、survivorship free 沪深300 股票池、下根 K 线 开盘 成交、双边 10 bps 成本、不 做 空)。报告 的 夏普比率 在 2014 2023 上 是...
打开 →国内某多空选股私募的资深研究员把一篇顶刊工作论文转给了基金经理:「作者在沪深300成分股范围内构造了一个基于净经营资产应计的因子,样本内夏普 1.8,t 值 2.4。是否纳入生产合成因子?」基金经理翻到方法论页只回了三行字:「三个问题。(1) 论文 t 值 2.4——文献已经发了大概 300 个这种因子,多重检验调整后的门槛是多少?(2) 用了断点宇宙断点和...
打开 →一位 头部 量化 私募 基金 经理 周五 走 进 研究 总监 的 办公室 端 着 一 张 幻灯片 —— 五 年 评估 窗口 上 沪深 300 横截面 净 扣 成本 后 夏普 比率 2.0,t 统计量 4.5,样本外 净 值 曲线 漂亮 至极。研究 总监 翻 到 方法 学 那 页。"你 的 N 是 多少?" "我 在 相同 窗口 上 筛 了 大约 100 个 ...
打开 →钩子:一笔 5000 手的 IF 单与一个等待你的 4 小时 周二上午 10:00,你的私募(private fund)风控屏上闪着一个标红:旗下中证500 多因子产品需要在午盘后到收盘前,把一个 5000 手的 CFFEX IF(沪深300 股指期货, stock index future)空头头寸全部减仓。合约乘数 ¥300/点,IF 当前 3,520 ...
打开 →钩子:连续八周下跌的明星 alpha 2023 年 2 月最后一个周五下午,你在一家私募(private fund)做模型风险(MRM)。屏幕上挂着上一年表现最好的策略:中证500 全量股票的 LightGBM 多因子模型,2022 年 Q3 经净化 CPCV 验证,样本外中位夏普(Sharpe ratio)1.5;2022 年 Q4 通过影子交易上线;20...
打开 →金融机器学习的陷阱与验证:净化交叉验证与多重检验 钩子:在 Sharpe 2.5 面前下班的那位实习生 周三下午,某沪深300 多因子私募基金(private fund)的研究室。一位刚从海外回来的实习生把笔记本电脑转过来给你看:XGBoost、5 折交叉验证、特征包括过去 5 日收益、20 日 RSI、北向资金净流入、卖方分析师评级修订,因子模型层面用 F...
打开 →