AR、MA 与 ARMA 过程
周一开盘前,某沪深300 量化私募的研究员把昨天打捞回来的 1500 个日内对数收益样本(log returns)丢进 R,画了一张样本 ACF:lag 1 大约 0.18,lag 2 大约 0.05,再往后几乎全部落进 Bartlett 带里。她想问的是:这条「拖尾」曲线像不像一阶自回归(autoregressive, AR)模型该有的样子?如果是 AR,...
打开 →GLOBAL SEARCH
搜索在服务端完成,题目解析与答案不会进入搜索结果。登录后可搜索自己的收藏题单。
找到 30 个结果
中文题目周一开盘前,某沪深300 量化私募的研究员把昨天打捞回来的 1500 个日内对数收益样本(log returns)丢进 R,画了一张样本 ACF:lag 1 大约 0.18,lag 2 大约 0.05,再往后几乎全部落进 Bartlett 带里。她想问的是:这条「拖尾」曲线像不像一阶自回归(autoregressive, AR)模型该有的样子?如果是 AR,...
打开 →周一早盘,某私募的时间序列研究员把过去 200 个交易日的对冲组合超额收益丢进 statsmodels。她想确认这条曲线是不是一个干净的 ARMA 过程——若是,残差就是一组白噪声,可以挂上下一阶段的 GARCH;若不是,她得回去重做特征工程。问题是:用 AR(1)、MA(1)、ARMA(1, 1) 还是 ARMA(2, 1)?拟合完之后怎么知道这一支模型确...
打开 →某私募(private fund)的风控会上,研究员甩出沪深300 日收益的实证表:日内收益序列本身的自相关系数 公式 在滞后 公式 时几乎全部落在 公式 的 Bartlett 带内;可一旦把同一条序列 平方 再画一次 ACF,从滞后 1 到滞后 60 全是正值、缓慢衰减。再算样本峰度:5.8——远大于正态分布(Gaussian distributi...
打开 →周三下午两点半,你在上海某私募(private fund)的统计套利(statistical arbitrage)团队碰到一桩争执。两只沪深300 成份股里的地产龙头,对数价格(log price)序列各自带强烈趋势,放在同一张图上几乎平行。新来的研究员把两条序列直接做 OLS,跑出 公式、系数 公式 值 18,准备开仓。资深 PM 一句话拦下他:「先做单位...
打开 →周一早盘九点二十,你接手了离职同事留下的 alpha 模型——一棵深度 15 的 CART(Classification and Regression Tree, CART)树,在三年 沪深300 成分股日度面板上训练,特征是动量、价值、质量、低波、5 日收益、20 日波动率、换手率等 12 个变量,目标是预测下一日超额收益方向(涨/跌)。样本内训练精度 1...
打开 →一家头部 私募 量化 公司带着 3 年期 "中证500 中性" 业绩材料来谈尽调:Sharpe 1.8 净值口径,贝塔 0.03(真的市场中性),信息比率 1.5 相对 R007 现金基准。表面看是机构级别的纯 alpha。然后你跑一遍 Barra CNE5 + 申万 行业 因子回归,结果是 公式、公式、公式,而 alpha 月度 0.018% (t = 1...
打开 →某沪深300指增私募的中级量化:把 4.4.1 L4 的 Ledoit Wolf 收缩协方差直接套到 500 只 A 股、5 年月度数据上,公式 条件数压到 800——可以接受。把宇宙扩到 1500 只(中证1000 + 沪深300),条件数又跳回 5000;再做一轮调参也压不下去。她去问做风控的资深同事:「机构生产栈到底用什么?」对面甩出三个字:「Barr...
打开 →周三盘后,一位上海私募 (private fund) 的研究员把当日中金所 IF 四个到期合约抓下来作图:当月 3,841、下月 3,838、当季 3,830、下季 3,815。曲线向右下倾斜,差距随期限拉大——这是教科书上的 backwardation,但她隔壁桌的商品组研究员当天看到的 SHFE 铜 (CU) 曲线却是反向的:当月 67,500、下月 6...
打开 →国内某私募中频组新加入的应届工程师周一第一天克隆了项目仓库。仓库的 Cargo.toml 声明一个 library crate 加一个 binary crate; src/lib.rs 暴露一个 pricing 模块; src/pricing.rs 装着 Lesson 2 写过的 510300.SH 沪深300 ETF 期权闭式 Black Scholes ...
打开 →周五下午两点,沪深300 当日累计跌幅已经放大到 2.8%、还在加速。你在一家中型私募(private fund)做日内风险报表,上周用对称 GARCH(1, 1) 给组合估的次日条件方差,在过去三次类似的放量下跌之后,滚动校准里都低估了实际 realised vol 将近 30%——而向上的同尺度日子,模型反而略偏高。问题不在样本,也不在 公式 是否服从正...
打开 →周一早盘前,你接手了一笔策略回测:沪深300 ETF(510300.SH)一年的日线,要算每日对数收益率(daily log return)。上一课你已经能把 CSV 流过来、用生成器逐行解析、再用 dataclass 装好。可一旦真要算数,你写下的还是那段熟悉的循环: 十二行能写完,对一年 252 个交易日尚可。可同样一段逻辑会出现在每一份回测脚本里——一...
打开 →上海陆家嘴某头部私募的中频组用了七年的 C++ 报单 / 回测框架, 这一周决定把对接券商 CTP 柜台的协议适配层用 Rust 重写。组里资深工程师拿到任务的第一天敲了四条命令:装工具链、新建项目、构建、运行。九十秒后磁盘上多了一个二进制文件并打印了一行字。同样的循环在 C++ Fundamentals (3.4.1) 里要写 CMakeLists.txt...
打开 →周三下午 15:05,SSE 主板刚收盘。某 私募 vol 套利团队的基金经理在 T+1 结算窗口前打开两个数字。第一是当天早盘 中金所 公布的 iVX 读数:18.3。第二是 沪深300 指数过去 30 个交易日的已实现波动率,按收盘到收盘对数收益率的年化标准差算:13.8。这 4.5 个 vol 点的缺口——隐含波动率(implied volatilit...
打开 →某私募(private fund)交易日下午四点,你的 PM 把过去 500 个交易日的策略净值推过来,问:这条曲线的均值真的稳定吗?波动率有没有结构性变化?只看一条路径,凭什么相信估出来的均值与自相关有意义?这是时间序列分析(time series analysis)的元问题。横截面统计里你有 公式 个独立同分布(i.i.d.)样本,推断建立在「重复抽样」...
打开 →周五午盘,一家 50 亿规模的 CN 私募把一份沪深300 alpha 数据甩到你工位:30 个特征、日频次日超额收益作标签。上一课那棵深度 15 的 CART 树样本内方向准确率 100%、样本外只有 51%——比抛硬币好不了多少,Sharpe 几乎为零。你把它换成 500 棵在 bootstrap 样本上独立训练的深树取平均,样本外跳到 57%。这一跳,...
打开 →某私募的固定收益研究员要把过去三个月的 10 年期中国国债收益率拉成时间序列,放进久期模型的样本。AKShare 的公开接口 ak.bond china yield 不要 token、本地能跑、数据按日更新——但研究 notebook 一旦在用户面前演示时撞上 429,整场会议就要等十分钟手动 retry。本课把 AKShare 调用包成一个 fetch y...
打开 →周二下午两点,某上海私募的股票池经理把你叫到工位前:要 600519.SH 对沪深300 ETF(510300.SH)的市场 β,日简单收益(daily simple return),近252个交易日窗口,今晚9点前要见。教科书答案一行就能解决: beta = Cov(r stock, r mkt) / Var(r mkt) 。工程答案稍长:把 [1, r ...
打开 →沪深300 期权做市的私募,盘中 14:23 出现单边行情,CFFEX IF 主力合约成交骤增。值班 quant developer 在飞书智能助手里收到一条钉钉机器人推送:『KafkaConsumerLagHigh:feedhandler warehouse 消费组 lag 10000,持续 5m』。打开 Grafana,dashboard 名字叫 fee...
打开 →周一上午十点,你坐在一家中型私募的研究台。3.2.2 收尾那张 tear sheet 昨晚跑完了,落到磁盘的中间产物里有一行 returns = (closes['510300.SH'].pct change().dropna()).to numpy() ——一根长度 252 的 np.ndarray ,是沪深300 ETF(510300.SH)在 2024...
打开 →某沪上 私募 量化 团队 第三周,基金经理把一份 Jupyter notebook 递给你,结果是:2010 2020 沪深300 + 中证500 全市场上 Sharpe = 2.4 ,问你为何 2022 以来实盘版本只跑出 Sharpe = 0.5 。你审数据,发现三个 bug:历史 成分股 表是按 今天的 沪深300 拉出来的(测试样本里每只标的都是...
打开 →Hook:两个看起来都「会优化」的求解器 上海某私募基金的两位研究员同时打开 Python,一位在跑一个标的为沪深300 成分股、目标为均值方差优化(mean variance optimization)的组合优化(portfolio optimization)问题,另一位在调一个三层的因子神经网络。两人用的迭代算法是同一份梯度下降代码,第一位 200 步就...
打开 →某 量化 私募 在境内 上证 路办公的 PB 业务 负责人,凌晨四点接到电话。2021 年 3 月 26 日,Archegos 这家家族办公室客户在 Credit Suisse / Nomura / Morgan Stanley / UBS / Goldman Sachs 五家券商同时违约保证金催缴;持仓集中在 若干 大盘 单一标的 等少数标的上,通过总收益...
打开 →某沪深300指增私募的中级量化研究员,用 L1 的「无成本」约束 MV 优化器跑 30 只 CSI 300 行业龙头基础上的 12 1 截面动量信号,样本内纸面 Sharpe(paper Sharpe)= 1.4。她把同样的换仓单丢进自家交易台的事后成本归因系统,扣掉佣金、印花税、半价差(half spread)和 Almgren Chriss 市场冲击之后...
打开 →某周四 早上,上海 某 量化 私募 的 投决会。L1 L3 全部 走 完 的 5 日 动量 策略 摆 在 Confluence 上:事件驱动 引擎、十 项 真实性 清单 全 绿、deflated Sharpe 0.8、PBO 0.35。研究员 问 投资 总监:「什么时候 上 实盘?」投资 总监 不 回答 这 个 问题。她 连 问 四 个 反 问 题。 十 节...
打开 →周五上午,你在上海的一家 量化 私募 ——明汯、 幻方、 九坤、 灵均 风格 的 多 因子 私募。 L3 把 四 条 信号 正交化 完了: mom 12 1 , book to market , gross profitability , pead sue 都 残差化 通过 了 IC break even 门槛。 桌面 上 还 没有 量产 复合 信号。 投决...
打开 →偏差 方差分解与泛化 Hook:周一的因子复盘 上海某私募的因子研究员周一收到了风控的复盘邮件。他原本用 6 个 Barra 风格因子在沪深300 成份股上做截面回归预测次日超额收益,样本内 公式,模型经理觉得「不够性感」。一周后他把因子从 6 个铺到 36 个——叠加了 28 个行业哑变量、过去 30 日动量分位、几个高频微观结构特征——样本内 公式 一跃...
打开 →国内一家头部 quant 在 CFFEX 张家湾数据中心 colo 部署的低延迟工程负责人,正在 review 自家 IF 股指做市路径的 tick to trade 延迟报告。中位数 4.8 μs;MarketMakerTier1 桌内预算是 5 μs,正好达标。P99.9 是 47 μs,超过了 OperationalRiskCommittee 公开的 ...
打开 →国内私募的 50ETF 期权做市,盘中 13:47 SSE 一条 IF 主力 tick 的入库延迟从平均 80 毫秒跳到 1.8 秒。L1 的结构化日志能告诉你这一笔 tick 落在 feed handler consumer 7c4f9d8b6 x2k4l 这个 pod 的某条 offset;L2 的 dashboard 能告诉你 p99 延迟在过去 5 ...
打开 →周三上午,你在国内某头部私募的衍生品自营桌做期权 Greeks 重估。沪深300 ETF(510300.SH)期权链上挂着 480 张合约,每张合约要算一次 Delta、Gamma、Vega、Theta,每个 Greek 都是一次 100 万路径的 Monte Carlo——480 × 4 × 1M = 19.2 亿条路径。上一课你已经用 monotonic...
打开 →周二上午十一点。你的分支 feature/risk factor z 在本地终于跑通——沪深300 因子归因回测 Sharpe 三位小数都对上了审查者期望。你 git push ,在内网 GitLab 开了 MR,一小时内审查者要求改两处,并指出你的分支已落后 main 四个提交,因为同事刚合了另一个修同模块的 MR。第 1 课教你在一台机器上操作 git;...
打开 →