模式设计、索引与 EXPLAIN — SQL 与时序数据库

某沪深 300 私募的风控在飞书上找你：『我昨晚在笔记本样本上跑 30 毫秒出结果的按标的回撤查询，今天打到生产上跑了 12 分钟。同样的 SQL，同样的方言，同样的 bars_1m 表——到底什么变了？』SQL 没变。变的是行数：笔记本 5 万行，生产 14 亿行。『样本上快、生产上慢』几乎永远是三件事之一造成的：WHERE 过滤的列上没索引，规划器统计过期导致它选错了 join 算法，或者模式形状逼着数据库做它本不该做的工作。本课教你把这三件都诊断出来并修好。

纵向事实表是对的形状

量化仓库的标准模式是纵向事实表：每行一条 (symbol, ts) 在某频率上的观测，每个频率一张事实表。ticks(symbol, ts, price, size, side) 装原始 tick，bars_1m(symbol, ts, open, high, low, close, volume) 装 1 分钟 bar，bars_1d 装日线。错的模式（点名一次后丢弃）是把标的拉成列（AAPL_close、MSFT_close、600519_close ……）：那种形状产生列数爆炸（千标的宇宙就是千列表），每次调整标的池都要 schema 迁移，并且让 L1 的 RANK() OVER (PARTITION BY ts ORDER BY ret) 横截面查询无法写。维度表小、用代理键连接。研究仓库的星型模式：

-- fact table (tall; one row per observation)
CREATE TABLE bars_1m (
  symbol TEXT NOT NULL,
  ts     TIMESTAMPTZ NOT NULL,
  open   NUMERIC(18,6),
  high   NUMERIC(18,6),
  low    NUMERIC(18,6),
  close  NUMERIC(18,6),
  volume BIGINT,
  PRIMARY KEY (symbol, ts)
);

-- dimension: instrument metadata (skinny; one row per symbol)
CREATE TABLE instrument (
  id             BIGINT GENERATED ALWAYS AS IDENTITY PRIMARY KEY,
  symbol         TEXT NOT NULL UNIQUE,
  exchange       TEXT NOT NULL,
  tick_size      NUMERIC,
  multiplier     NUMERIC,
  listing_date   DATE,
  delisting_date DATE
);

-- dimension: trading calendar
CREATE TABLE calendar (
  d              DATE PRIMARY KEY,
  is_trading_day BOOLEAN NOT NULL,
  session_open   TIME,
  session_close  TIME
);

-- dimension: corporate actions
CREATE TABLE corp_action (
  id             BIGINT GENERATED ALWAYS AS IDENTITY PRIMARY KEY,
  symbol         TEXT NOT NULL,
  effective_date DATE NOT NULL,
  action_type    TEXT NOT NULL,
  ratio          NUMERIC
);

A 股场景下，instrument.exchange 的取值集合是 {'SSE', 'SZSE', 'CFFEX'}；calendar 表每年从上交所 / 深交所公布的交易日历或内部 vendor 抓一遍。星型纪律：事实表连维度表，维度表之间不互连。完整的 Kimball / snowflake / SCD 理论留给 Track 4。

主键：事实自然、维度代理

规则一句话：事实表用唯一标识观测的自然复合键；维度表用代理身份键，跨标的改名也稳定。 所以 bars_1m 用 PRIMARY KEY (symbol, ts)——这个复合是『一个标的在一分钟上一根 bar』的自然表达，并兼任聚簇访问路径（Postgres 不会在 INSERT 之后自动维护聚簇顺序，但一次性跑 CLUSTER bars_1m USING bars_1m_pkey 重排堆，之后范围扫描命中连续页）。instrument、calendar、corp_action 用代理 BIGINT GENERATED ALWAYS AS IDENTITY PRIMARY KEY——经得起标的改名。instrument 同时带一个 UNIQUE (symbol) 给事实表外键用。

索引：B 树、BRIN、局部、覆盖

B 树是默认答案，约 80% 场景都正确——支持等值与范围查询，并且顺带提供排序输出，于是 WHERE symbol = '510050' ORDER BY ts 不用 Sort 节点就能出结果。BRIN（块范围索引）按数据块存一对 min/max 范围——磁盘占用极小，对追加写入且自然按索引列有序的表极快。100 GB 的 bar 表上一个 ts BRIN 只几 MB，『取两个时间戳之间的所有行』就是一次廉价范围走读。局部索引只覆盖表的一片：WHERE delisting_date IS NULL 让热门在册标的集合始终紧凑。覆盖索引通过 INCLUDE (...) 携带附加 payload 列，让规划器仅用索引就满足查询、不必回堆——『仅索引扫描』把一条 12 分钟查询压到一秒。仓库上四个标准索引，按创建顺序：

CREATE INDEX idx_bars_symbol_ts_inc ON bars_1m (symbol, ts) INCLUDE (close, volume);
CREATE INDEX idx_bars_ts_brin       ON bars_1m USING BRIN (ts) WITH (pages_per_range = 32);
CREATE INDEX idx_instr_active       ON instrument (symbol) WHERE delisting_date IS NULL;
CREATE INDEX idx_corp_symbol_date   ON corp_action (symbol, effective_date);

复合索引列序不容商量：等值列在前，范围 / 排序列在后。(symbol, ts) 对『取一个标的在一段时间窗口的所有 bar』这种负载正确——规划器一次性下探到 symbol = '510050'，然后沿 ts 连续范围走。(ts, symbol) 会让每条查询都变成部分范围扫描加过滤。同一条查询在两种列序上跑一遍看计划，差异一目了然；规则是经验总结的，但每次都落在同一边。

逐行读 `EXPLAIN (ANALYZE, BUFFERS)`

EXPLAIN (ANALYZE, BUFFERS) <query>; 会真的跑这条查询，并打印一棵计划树，附带实际行数、每个节点耗时、缓冲命中 / 读取计数。每个节点是一个算子。每个量化开发者都必须认出的十个算子名：Seq Scan（全表扫描）、Index Scan（索引查找 + 回堆取行）、Index Only Scan（覆盖索引或可见性映射让查询仅靠索引满足）、Bitmap Heap Scan（先收集匹配行到位图、再按磁盘顺序取）、Nested Loop（外侧循环、内侧探测）、Hash Join（一侧建哈希、一侧探测）、Merge Join（两个已排序输入并行走）、Sort（显式排序节点）、Hash Aggregate（用哈希表实现 GROUP BY）、Group Aggregate（在已排序输入上实现 GROUP BY）。

加索引前后都要在工作例子上跑的三条诊断查询：

EXPLAIN (ANALYZE, BUFFERS) SELECT close FROM bars_1m
  WHERE symbol = '510050' AND ts BETWEEN '2026-04-13' AND '2026-04-17' ORDER BY ts;

EXPLAIN (ANALYZE, BUFFERS) SELECT b.symbol, b.ts, b.close, i.exchange
  FROM bars_1m b JOIN instrument i ON i.symbol = b.symbol
  WHERE b.ts BETWEEN '2026-04-13' AND '2026-04-17';

EXPLAIN (ANALYZE, BUFFERS) SELECT symbol,
  AVG(close) OVER (PARTITION BY symbol ORDER BY ts ROWS BETWEEN 19 PRECEDING AND CURRENT ROW)
  FROM bars_1m WHERE symbol = '510050';

三种病理与对症。病理一：查询 (1) 加索引前显示 Seq Scan on bars_1m，扫整张十亿行堆。处方：建 idx_bars_symbol_ts_inc；事后计划显示 Index Only Scan using idx_bars_symbol_ts_inc，缓冲读取数下降三个数量级。病理二：查询 (2) 显示 Nested Loop，bars_1m 在外侧，因为 pg_class.reltuples 是一年前的一百万行估计——实际 14 亿。处方：跑 ANALYZE bars_1m;；规划器拿到真实基数，切到 Hash Join。病理三：查询 (1) 在只有 (symbol, ts)（无 INCLUDE）时显示 Index Scan 加 Heap Fetch 取 close。处方：drop 后重建索引加 INCLUDE (close, volume)；计划升级为 Index Only Scan，回堆消失。

任何节点上估计行数与实际行数相差 10 倍，都是 ANALYZE 统计过期的普遍信号——规划器用一年前的基数选出的 join 顺序，是在给上一份数据形状选的，不是给现在的。

操作纪律：ANALYZE、VACUUM、pg_stat_statements、事务

统计过期出烂计划；UPDATE / DELETE 留的死元组拖慢扫描。每个运维都在跑的四条单行命令：

ANALYZE bars_1m;
VACUUM (ANALYZE) bars_1m;
BEGIN; CREATE INDEX ...; ANALYZE bars_1m; COMMIT;
SELECT query, calls, mean_exec_time FROM pg_stat_statements ORDER BY mean_exec_time DESC LIMIT 10;

每次大批加载之后 ANALYZE bars_1m;——单一杠杆最高的习惯；它拦下的性能回归比任何其他一条习惯都多。大 DELETE 后跑 VACUUM (ANALYZE) bars_1m; 回收空间。autovacuum 处理稳态。BEGIN; ... COMMIT; 包裹让多语句迁移原子：半应用的 CREATE INDEX + ANALYZE 在出错时整体回滚，绝不停在半应用态。pg_stat_statements 是标准慢查询日志——『仓库慢』突然变一句话时，第一个该看的地方。事务隔离一段话：Postgres 默认 READ COMMITTED，几乎所有量化批处理与研究工作都正确；SERIALIZABLE 的少数用场是跨表对账任务需要看到两张表的单一时间点快照。一条提醒：A 股量化团队使用的 PolarDB-O 兼容 PostgreSQL 的 EXPLAIN 语法，本课索引与计划知识直接复用。

纪律总结

事实表纵向建、维度表横向建。事实用自然复合主键，维度用代理身份主键。默认 B 树、追加时序用 BRIN、热切片用局部、仅索引扫描用覆盖。每次大批加载之后 ANALYZE。多语句迁移用 BEGIN; ... COMMIT; 包起来。在信任一条查询快之前先读 EXPLAIN (ANALYZE, BUFFERS)。第 3 课把负载再推一档：当持续 tick 摄入突破 10 万行/秒，答案是专门的时序数据库。

本课构件清单。Fenced ```sql 代码块：星型 DDL（事实表 bars_1m 加三张维度 instrument、calendar、corp_action）；四条 CREATE INDEX；三条 EXPLAIN (ANALYZE, BUFFERS) 诊断查询；操作卫生单行（ANALYZE、VACUUM、BEGIN; ... COMMIT;、pg_stat_statements）。Inline-code：十个算子名量化开发必须认识。一个 Exercise。Two Hints。市场数据锚在 A 股沪深 300 标的 '510050'、'510500'、'510300' 在上证 / 深证 / CFFEX 的私募 / 量化私募体系，T+1 结算、涨跌停制度、SSE / SZSE 流通的 50ETF 与 300ETF。

练习

Exercise

从 L1 的 bars_1m(symbol TEXT NOT NULL, ts TIMESTAMPTZ NOT NULL, open NUMERIC(18,6), high NUMERIC(18,6), low NUMERIC(18,6), close NUMERIC(18,6), volume BIGINT, PRIMARY KEY (symbol, ts)) 出发，灌入至少一百万行跨五个标的的 1 分钟数据。(a) 加本课四个索引（idx_bars_symbol_ts_inc 携带 INCLUDE (close, volume) 的覆盖复合索引、idx_bars_ts_brin 在 ts 上 pages_per_range = 32 的 BRIN，加两个维度表索引）以及 instrument、calendar、corp_action 三张维度表。(b) 对本课三条诊断查询跑 EXPLAIN (ANALYZE, BUFFERS)，捕获加索引前后的计划输出。(c) 在加索引前输出里找出恰好一个 Seq Scan 节点和一个 Sort 节点，确认加索引后它们已被 Index Scan 或 Index Only Scan 替换。(d) 在 (a) 与 (b) 之间跑 ANALYZE bars_1m;，并用一句话解释为什么这一步是规划器考虑新索引的前置条件。(e) 把索引创建与 ANALYZE 写成 BEGIN; ...; COMMIT; 事务让整个操作原子。

提示

覆盖复合索引的列序必须是 (symbol, ts)——等值在前、范围在后；INCLUDE (close, volume) 让只选这两列的查询仅靠索引就满足（Index Only Scan）。

提示

没跑 ANALYZE 之前，pg_class.reltuples 和各列直方图仍是插入前的值；规划器用这些过期数估成本，可能即便索引已在也继续走 Seq Scan。