面向量化研究的关系型 SQL
某个周二早晨,沪深 300 量化私募的基金经理走过来:『把过去两周 510050 、 510500 、 510300 的日 VWAP 拉给我,按当日收益做横截面排名,只要 close 非空的行』。数据存在研究数据仓库里——一台部署在内网的 Postgres / PolarDB O 上, bars 1m 1 分钟 K 线表和 instrument 维度表通过外...
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 16 个结果
English questions某个周二早晨,沪深 300 量化私募的基金经理走过来:『把过去两周 510050 、 510500 、 510300 的日 VWAP 拉给我,按当日收益做横截面排名,只要 close 非空的行』。数据存在研究数据仓库里——一台部署在内网的 Postgres / PolarDB O 上, bars 1m 1 分钟 K 线表和 instrument 维度表通过外...
打开 →某 沪深 300 私募 的 风控 在 飞书 上 找你:『我 昨晚 在 笔记本 样本 上 跑 30 毫秒 出结果 的 按 标的 回撤 查询,今天 打到 生产 上 跑 了 12 分钟。同样 的 SQL,同样 的 方言,同样 的 bars 1m 表——到底 什么 变了?』SQL 没变。变 的 是 行数:笔记本 5 万 行,生产 14 亿 行。『样本 上 快、生产 ...
打开 →某 沪深 300 私募 的 交易员 提单:『上 一 季 在 ticks 表 上 15 秒 出结果 的 1 分钟 VWAP per symbol 查询,今天 跑 了 11 分钟。Postgres 仓库 正在 维持 每秒 9 万 写入 来自 沪深 行情 网关,EXPLAIN 在 一条 仅 触 三日 数据 的 查询 上 报 1.8 亿 缓冲 读取』。L2 的 卫生...
打开 →下午 15:30 CST,某 A 股 量化 私募。沪深 收盘 加 15:00 行情 结算 落定 之后 半 小时,行情 vendor 的 tick 510300 20260523.csv.gz 落 在 共享 挂载 /data/market data/ 上。cron 调起 ingest ticks.sh 。接下来 九十 秒 内,文件 必须 被 加载 到 暂存 表...
打开 →3.5.3 L4 你交付了一个测得过 tick to trade 延迟的撮合引擎,内部跑 SPSC 环、SIMD、 core affinity CPU 绑核, hdrhistogram 报分位。现在中信建投自营 IT 跟你坐下来,屏幕上是上线检查清单: "它会和我们的会话网关讲 FIX 4.4 吗?TCP 断了能续上吗?对接的同事问你要 NewOrder...
打开 →一位 私募 量化 团队 的 资深 研究员 在 原 研究 PR 上 线 半 年 之后 把 报告 递 给 一 位 初级 队友。"重新 跑 一 遍。基金 经理 在 问 这 个 信号 在 2024 年 数据 上 是否 还 work。" 初级 从 共享 盘 拉 出 notebook 打 开,第一 个 错误 立 刻 撞 上 来: ImportError: cannot ...
打开 →某私募的固定收益研究员要把过去三个月的 10 年期中国国债收益率拉成时间序列,放进久期模型的样本。AKShare 的公开接口 ak.bond china yield 不要 token、本地能跑、数据按日更新——但研究 notebook 一旦在用户面前演示时撞上 429,整场会议就要等十分钟手动 retry。本课把 AKShare 调用包成一个 fetch y...
打开 →某沪上 私募 量化 团队 第三周,基金经理把一份 Jupyter notebook 递给你,结果是:2010 2020 沪深300 + 中证500 全市场上 Sharpe = 2.4 ,问你为何 2022 以来实盘版本只跑出 Sharpe = 0.5 。你审数据,发现三个 bug:历史 成分股 表是按 今天的 沪深300 拉出来的(测试样本里每只标的都是...
打开 →周三下午两点。一家 A 股 私募 的资深同事打开你的 MR,标题是 feat(risk): 添加 沪深300 因子 z 列至业绩归因 。改了 12 个文件。二十秒之内审查线上铺满了「文件末尾多一个空行」「这个 import 没用到」「第 47 行行尾有空白」「import 没排序」之类的评论。你能感到审查时间正在漏走——这些评论没一条是关于你因子逻辑对不对的...
打开 →某上海私募的股票多空基金组合经理周一上午盯着一份回测:沪深300 截面 P/E long cheap / short expensive 价值策略,12 年夏普比率 1.4,最大回撤 11%,可以放到周三投决会上。同一策略半年前由资深量化跑出来夏普只有 0.7。信号、标的池、交易成本模型 全部相同——区别仅在:新回测读 fundamentals curren...
打开 →一位 头部 量化 私募 基金 经理 周五 走 进 研究 总监 的 办公室 端 着 一 张 幻灯片 —— 五 年 评估 窗口 上 沪深 300 横截面 净 扣 成本 后 夏普 比率 2.0,t 统计量 4.5,样本外 净 值 曲线 漂亮 至极。研究 总监 翻 到 方法 学 那 页。"你 的 N 是 多少?" "我 在 相同 窗口 上 筛 了 大约 100 个 ...
打开 →A 股 一家 私募 的 quant,下午 三点半 收盘 之后 收到 数据团队 的 一条 消息:「今天 沪深300 ETF 的 tick 文件 落到 /data/market data/cn/equity/tick/20250424/ 了,你 看看 行数 对不对、品种 有没有 缺、总成交额 大概 多少。」她 不打算 写一个 Python 脚本——这种 「看一眼...
打开 →上海一家 私募 的 风控 主管 批准 了 你 的 L3 manifest,但 在 部署 步 上 停 住:「开发者 把 一行 修复 合 入 main,这 时 镜像 从 哪 来?谁 打 tag?谁 扫描?谁 推 到 Aliyun ACR?谁 对 feed dev 跑 kubectl apply ?明天 生产 上 在 1.0.1 里 发现 bug,谁 把 它 翻 ...
打开 →上海一家 私募 中等频率股票策略团队的量化开发收到任务:两周内从零搭一条 沪深300 ETF 的 ticker plant。手头握住 3.6.3 的仓库(TimescaleDB hypertable, ticks raw(symbol, ts, price, size, side) , (symbol, ts) 主键)、L1 的消息词汇、L2 的 Kafka...
打开 →一位 三十亿 规模 私募 量化 基金 的 新 研究员 周一 早会 端 PPT 走 进 会议室。"上周 我 在 沪深300 上 找到 夏普 等于 2 的 信号 —— 5 日 动量 加 行业 中性化,扣 5 bp 交易 成本,回测 2015 到 2023。" 基金 经理 问 四 个 问题。第一,"你 开始 之前 的 待 检验 假设 是 什么?" 沉默 —— 假设...
打开 →周四 09:15。某上海私募 200 亿规模的多空基金,风控研究员发现:实盘 PnL 比昨晚研究端对当日的回测 投影 落后 47 bp。同样的标的池、同样的持仓、同样的执行切片。差距太干净,不像噪声。数据团队的第一动作不是去翻策略代码、不是去看执行层、不是去查券商成交回报——而是查 数据血缘 图 :回测看到的每个输入是哪个版本?实盘看到的每个输入是哪个...
打开 →