另类数据:分类法与评估
某上海私募 200 亿规模的多空基金,研究主管周二下午把一份每年 280 万人民币的供应商材料推到你桌上:「沪深300 全部零售消费股的卫星停车场计数。raw IC = 0.06。先做一个季度试用,年合同 280 万。周五之前给 Go / No Go。」你的因子库已经有一个 Wind / 通联 集成的「盈利预期修正」因子,同一标的池 raw IC = 0.0...
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 17 个结果
English questions某上海私募 200 亿规模的多空基金,研究主管周二下午把一份每年 280 万人民币的供应商材料推到你桌上:「沪深300 全部零售消费股的卫星停车场计数。raw IC = 0.06。先做一个季度试用,年合同 280 万。周五之前给 Go / No Go。」你的因子库已经有一个 Wind / 通联 集成的「盈利预期修正」因子,同一标的池 raw IC = 0.0...
打开 →某 私募 事件驱动组的盘后会议。Q3 季报披露季刚开始,组里负责 沪深300 的研究员准备做一条 PEAD 信号:盈利惊喜后 60 个交易日的漂移。负责数据的同事翻出来一份 Wind 的盈利数据库,里面 actual eps、consensus eps、announcement date 三列齐全;研究员说,把 SUE 算出来,按 announcement ...
打开 →某上海私募的股票多空基金组合经理周一上午盯着一份回测:沪深300 截面 P/E long cheap / short expensive 价值策略,12 年夏普比率 1.4,最大回撤 11%,可以放到周三投决会上。同一策略半年前由资深量化跑出来夏普只有 0.7。信号、标的池、交易成本模型 全部相同——区别仅在:新回测读 fundamentals curren...
打开 →周二早上 8:47。某上海私募的股票策略组组长在数据团队飞书里点了 @:「我们 fundamentals pit 表里 600519 以后的股票全部缺失。今早策略对沪深300 后 30% 的标的完全没头寸。」值班数据工程师调出昨晚的入库日志。Wind 数据 服务 SFTP 文件 02:14 完成下载——SFTP close() 返回成功、cron 日志写「入...
打开 →周四 09:15。某上海私募 200 亿规模的多空基金,风控研究员发现:实盘 PnL 比昨晚研究端对当日的回测 投影 落后 47 bp。同样的标的池、同样的持仓、同样的执行切片。差距太干净,不像噪声。数据团队的第一动作不是去翻策略代码、不是去看执行层、不是去查券商成交回报——而是查 数据血缘 图 :回测看到的每个输入是哪个版本?实盘看到的每个输入是哪个...
打开 →周一上午十点,你在上海一家私募(private fund)做跨境配置的研究员。基金经理把一笔 USD 1,000 万的赎回需求扔到你桌上:客户要求三天后换成人民币交付。你打开 CFETS 终端,屏幕上跳出 USD/CNY 中间价 7.2010,旁边券商报盘 7.2010 / 7.2020。你需要回答三个问题:报价里的两个数字分别意味着什么?这笔换汇该走哪条通...
打开 →周二下午三点,你在上海一家私募(private fund)下设的出口型集团做财资管理外包。销售台刚签下一笔合同:90 天后客户付 USD 1,000 万。问题是公司账本以人民币记账,老板要的不是「拍脑袋猜 USD/CNY 会涨会跌」,而是「现在就锁定 90 天后的换汇价」。你打开屏幕,CFETS 上 USD/CNY 即期 7.2000(这是你今天最重要的现货...
打开 →周四上午,你在上海一家私募(private fund)的多策略组里写一份给资金端的备忘录。基金经理刚和一位 LP 见过面,对方提了一个直接的问题:「过去十年我能买到的所有商品指数 ETF,几乎全部跑输它们追踪的现货指数。我们要不要在多元配置里加一块商品?」桌面上摆着 DCE 铁矿石(I)的期货曲线和一份 BCOM 历史超额收益拆解表。这一课要回答这个问题:为...
打开 →周三下午,你在一家上海的私募(private fund)做大类资产配置。基金经理盯着两块屏幕:一块是上期所(SHFE, 上海期货交易所)铜(CU)主力合约的曲线,另一块是 LBMA 现货金价。她问你两个问题:为什么 SHFE 铜近月和远月只差 100 元/吨,但隔夜 WTI 原油近远月差超过 1 美元/桶?同样是「大宗商品」,铜、黄金、原油、铁矿石的期货曲线...
打开 →钩子:五十条弱 alpha 与一个总组合 你在一家中证500 中频量化私募(private fund)工作。研究团队在过去六个月里训练出了五十条独立的 ML alpha:有用 LightGBM 在 沪深300 / 中证500 因子风格暴露上做次日 alpha 的,有 1 D CNN 在分钟线上做日内动量(momentum)的,有 Transformer 在卖...
打开 →某沪上 私募 量化 团队 第三周,基金经理把一份 Jupyter notebook 递给你,结果是:2010 2020 沪深300 + 中证500 全市场上 Sharpe = 2.4 ,问你为何 2022 以来实盘版本只跑出 Sharpe = 0.5 。你审数据,发现三个 bug:历史 成分股 表是按 今天的 沪深300 拉出来的(测试样本里每只标的都是...
打开 →Hook(开场场景). 某资管公司多策略组合的固收风险经理,在月末复盘时盯着账上三笔头寸:(A)规模 5 亿元的 5 年期 FR007 利率互换(IRS),付固收浮,固定端 2.45%;(B)一笔参考某城投平台的 CRMW 1 亿元名义;(C)一只挂钩中证500 的 18 个月雪球结构化产品,由头部券商收益凭证渠道发出,规模 3 亿元,敲入线 75%、月...
打开 →某周二,上海某 量化 私募 的策略评审会上。一位 研究员 把 5 日 动量 信号 的回测报告投到屏幕上:在 沪深300 ETF 510300 上从 2014 01 01 到 2023 12 31 的回测,扣费后年化 夏普比率 1.8。曲线穿过 2015 股灾、穿过 2018 中美贸易摩擦、穿过 2022 疫情 + 房地产 双杀,姿态优雅。投资 决策 委员会 ...
打开 →某 私募 量化研究组的季末复盘。组长把 沪深300 上跑了一个季度的两条信号摊在桌上:一条是上一课构造的 12 1 月动量,样本外 21 日 rank IC 约 0.03;另一条是组里 ML 工程师用 LightGBM 训出来的 ranker,同一个 universe、同一段样本外、同一个 21 日远期 rank return,样本外 rank IC 跳到 ...
打开 →钩子:连续八周下跌的明星 alpha 2023 年 2 月最后一个周五下午,你在一家私募(private fund)做模型风险(MRM)。屏幕上挂着上一年表现最好的策略:中证500 全量股票的 LightGBM 多因子模型,2022 年 Q3 经净化 CPCV 验证,样本外中位夏普(Sharpe ratio)1.5;2022 年 Q4 通过影子交易上线;20...
打开 →一块白板、四列、44 年。格林威治某多策略平台的资深 PM 用「带访客逛博物馆」的方式给一位刚入职的暑期实习生讲美国与全球量化行业。第一列贴着 1982 2000,起点是一个点:1982 年 Jim Simons 在纽约长岛东塞托基特创立 Renaissance Technologies,他招的是密码学家与数学家而不是华尔街老兵。六年后 Medallion ...
打开 →金融机器学习的陷阱与验证:净化交叉验证与多重检验 钩子:在 Sharpe 2.5 面前下班的那位实习生 周三下午,某沪深300 多因子私募基金(private fund)的研究室。一位刚从海外回来的实习生把笔记本电脑转过来给你看:XGBoost、5 折交叉验证、特征包括过去 5 日收益、20 日 RSI、北向资金净流入、卖方分析师评级修订,因子模型层面用 F...
打开 →