GLOBAL SEARCH

搜索课程、模块、题目与收藏题单

搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。

找到 15 个结果

中文题目
课程市场与微观结构数据 · 量化数据

Tick 数据工程与清洗

某沪上 私募 量化 团队 第三周,基金经理把一份 Jupyter notebook 递给你,结果是:2010 2020 沪深300 + 中证500 全市场上 Sharpe = 2.4 ,问你为何 2022 以来实盘版本只跑出 Sharpe = 0.5 。你审数据,发现三个 bug:历史 成分股 表是按 ​今天的​ 沪深300 拉出来的(测试样本里每只标的都是...

打开 →
课程市场与微观结构数据 · 量化数据

微观结构现象:价差、冲击与订单流

周二上午 11:14,某沪上 私募 量化 团队的研究员刚跑完 沪深300 ETF(510300)上 5 秒级订单流信号的回测:样本内 Sharpe 5.2,样本外 Sharpe 4.8。基金经理盯着权益曲线只问一句:「上规模交易会发生什么?」研究员不知道——回测假设每一笔成交都按中价(mid)拿到、零市场冲击。在 200,000 份的元订单(metaorde...

打开 →
课程市场与微观结构数据 · 量化数据

行情数据产品分类与采集

周一早盘,某上海私募的量化研究员盯着屏幕:你昨天回测的沪深300日线截面动量因子,年化收益比上周报表显示的低了 280bp。同样的标的池、同样的回看窗口、同样的代码——但 bug 不在信号里,而在数据里。供应商的「复权收盘价」字段在隔夜悄悄又重算了一轮分红复权(back adjustment),你的损益列于是双重计入了复权调整。本课要交给你的,就是看 5 分...

打开 →
课程市场与微观结构数据 · 量化数据

限价委托簿的机制

周三上午 9:47,某沪上 私募 的执行交易员告诉你:你在沪深300 ETF(510300)上挂的那笔 4.130 元、10000 份的买入限价委托已经躺了 10 分钟没成交,明明屏幕上的 BBO 在这十分钟里触碰 4.130 元至少一打次。他想知道为什么。答案在 L1 报价下面那一层——委托簿(order book)本身。4.130 元上排在你前面的是 1...

打开 →
课程SQL 与时序数据库 · 量化开发的软件工程

模式设计、索引与 EXPLAIN

某 沪深 300 私募 的 风控 在 飞书 上 找你:『我 昨晚 在 笔记本 样本 上 跑 30 毫秒 出结果 的 按 标的 回撤 查询,今天 打到 生产 上 跑 了 12 分钟。同样 的 SQL,同样 的 方言,同样 的 bars 1m 表——到底 什么 变了?』SQL 没变。变 的 是 行数:笔记本 5 万 行,生产 14 亿 行。『样本 上 快、生产 ...

打开 →
课程SQL 与时序数据库 · 量化开发的软件工程

面向量化研究的关系型 SQL

某个周二早晨,沪深 300 量化私募的基金经理走过来:『把过去两周 510050 、 510500 、 510300 的日 VWAP 拉给我,按当日收益做横截面排名,只要 close 非空的行』。数据存在研究数据仓库里——一台部署在内网的 Postgres / PolarDB O 上, bars 1m 1 分钟 K 线表和 instrument 维度表通过外...

打开 →
课程并发与性能 · 高级 Python

asyncio 与 I/O 密集型并发

Hook 周二下午三点,一家上海私募的量化研究员要在 T+1 风控窗口前把沪深300 成分股当日的分钟线快照拉下来,作为隔夜组合 VaR 的输入。上节课用 ThreadPoolExecutor 把 100 个同步 requests.get 压到了 1.8 秒;现在策略组想把每天的拉取面扩到 1500 只 A 股、外加 200 只港股通(Stock Conne...

打开 →
题目215 · 概率

Distribution of Dice Sums via Probability Generating Functions

Let $X_1, X_2, \ldots, X_n$ be iid rolls of a fair $d$-sided die, so each $X_i$ is uniform on $\{1, 2, \ldots, d\}$. Let $S_n = X_1 + X_2 + \cdots + X_n$. (a) Derive the PGF $G_{X_1}(s) = E[s^{X_1}]$ in closed form. (b) Write the PGF of $S_n$ and use it to derive $E[S_n]$ and $

打开 →
课程设计模式与工具 · 高级 Python

Python 风格的设计模式

开场 某私募周四下午,团队为沪深300 ETF 期权准备了四个定价器口味——Black Scholes 看涨、Black Scholes 看跌、二叉树、蒙特卡洛。研究主管开了一次代码评审,发现生产代码里有一个 StrategyFactoryAbstract 抽象类、两个 AbstractPricerBuilder 子类、Confluence 上一张 60 行...

打开 →
课程SQL 与时序数据库 · 量化开发的软件工程

时序数据库:TimescaleDB、QuestDB、InfluxDB 与 kdb+

某 沪深 300 私募 的 交易员 提单:『上 一 季 在 ticks 表 上 15 秒 出结果 的 1 分钟 VWAP per symbol 查询,今天 跑 了 11 分钟。Postgres 仓库 正在 维持 每秒 9 万 写入 来自 沪深 行情 网关,EXPLAIN 在 一条 仅 触 三日 数据 的 查询 上 报 1.8 亿 缓冲 读取』。L2 的 卫生...

打开 →
课程设计模式与工具 · 高级 Python

类、双下方法与协议

开场 某私募周二上午九点四十二,一位实习研究员把自写的 PriceQuote 类提交进团队研究包,基金经理顺手抓了一千个想往 set 里塞,做当天 510300.SH 早盘 tick 的去重。 TypeError: unhashable type: 'PriceQuote' 。十分钟后他想按时间戳排序,调用又换了一种方式挂掉。类能编译,对单个 quote 的...

打开 →
课程基本面、另类数据与数据基础设施 · 量化数据

量化数据基础设施:数据湖与时点数据库

周四 09:15。某上海私募 200 亿规模的多空基金,风控研究员发现:实盘 PnL 比昨晚研究端对当日的回测 投影 落后 47 bp。同样的标的池、同样的持仓、同样的执行切片。差距太干净,不像噪声。数据团队的第一动作不是去翻策略代码、不是去看执行层、不是去查券商成交回报——而是查 ​数据血缘 图​ ​:回测看到的每个输入是哪个版本?实盘看到的每个输入是哪个...

打开 →
课程SQL 与时序数据库 · 量化开发的软件工程

量化数据管道:从 tick 文件到数据仓库

下午 15:30 CST,某 A 股 量化 私募。沪深 收盘 加 15:00 行情 结算 落定 之后 半 小时,行情 vendor 的 tick 510300 20260523.csv.gz 落 在 共享 挂载 /data/market data/ 上。cron 调起 ingest ticks.sh 。接下来 九十 秒 内,文件 必须 被 加载 到 暂存 表...

打开 →