← 返回训练目录

量化全流程 / 量化数据

4.1.2 · 基本面、另类数据与数据基础设施

该模块已接入真实课节内容。beta 阶段优先展示中文版本,内容团队会继续校对和补充练习。

阶段

核心

课节

4 节

预计时长

240 分钟

未来正式边界

1 节未来免费

课节

beta 阶段所有课节默认可读;免费/付费标签仅标记正式发布后的权限边界。

4.1.2.1基本面数据:财务报表与时点纪律某上海私募的股票多空基金组合经理周一上午盯着一份回测:沪深300 截面 P/E long cheap / short expensive 价值策略,12 年夏普比率 1.4,最大回撤 11%,可以放到周三投决会上。同一策略半年前由资深量化跑出来夏普只有 0.7。信号、标的池、交易成本模型 全部相同——区别仅在:新回测读 fundamentals curren...未来免费校验中4.1.2.2另类数据:分类法与评估某上海私募 200 亿规模的多空基金,研究主管周二下午把一份每年 280 万人民币的供应商材料推到你桌上:「沪深300 全部零售消费股的卫星停车场计数。raw IC = 0.06。先做一个季度试用,年合同 280 万。周五之前给 Go / No Go。」你的因子库已经有一个 Wind / 通联 集成的「盈利预期修正」因子,同一标的池 raw IC = 0.0...未来付费校验中4.1.2.3数据供应商接口与数据采集周二早上 8:47。某上海私募的股票策略组组长在数据团队飞书里点了 @:「我们 fundamentals pit 表里 600519 以后的股票全部缺失。今早策略对沪深300 后 30% 的标的完全没头寸。」值班数据工程师调出昨晚的入库日志。Wind 数据 服务 SFTP 文件 02:14 完成下载——SFTP close() 返回成功、cron 日志写「入...未来付费校验中4.1.2.4量化数据基础设施:数据湖与时点数据库周四 09:15。某上海私募 200 亿规模的多空基金,风控研究员发现:实盘 PnL 比昨晚研究端对当日的回测 投影 落后 47 bp。同样的标的池、同样的持仓、同样的执行切片。差距太干净,不像噪声。数据团队的第一动作不是去翻策略代码、不是去看执行层、不是去查券商成交回报——而是查 ​数据血缘 图​ ​:回测看到的每个输入是哪个版本?实盘看到的每个输入是哪个...未来付费校验中