周三下午两点半,你在上海某私募(private fund)的统计套利(statistical arbitrage)团队碰到一桩争执。两只沪深300 成份股里的地产龙头,对数价格(log price)序列各自带强烈趋势,放在同一张图上几乎平行。新来的研究员把两条序列直接做 OLS,跑出 、系数 值 18,准备开仓。资深 PM 一句话拦下他:「先做单位根检验(unit root test, ADF 检验)。」本课要回答这句拦截的依据:平稳(stationary)假设在两类外观相似、本质相反的非平稳过程上各自如何崩溃?当它崩溃时,正确的补救是去趋势还是差分?这套补救把 ARMA 扩展成 ARIMA(p, d, q),而单位根检验就是切换分支的开关。
1. 两类非平稳过程
放下平稳性假设之前,先看清「非平稳」内部的两条分支。第一类叫趋势平稳(trend-stationary):序列围绕一条确定性时间趋势(deterministic trend)波动,扣掉这条趋势后是平稳的。第二类叫差分平稳(difference-stationary)或单位根过程(unit root process):序列里嵌着一个随机游走(random walk)成分,这部分趋势是随机的(stochastic trend),无法靠回归剥离,只能靠差分消除。
两式中的 都是平稳 ARMA 过程,图上两条曲线长得像孪生兄弟,可一旦用错方法,结论会南辕北辙。伪回归现象(spurious regression, Granger & Newbold 1974)正出在这里:把两组互不相干的 序列当作平稳变量直接做 OLS, 与 值都会被人为推高,几乎必然得到「显著」的虚假结论。开篇研究员的 之所以可疑,根源就在这一条。
2. 整阶单整与 ARIMA(p, d, q)
为把「差几次差分能回到平稳」这件事说清楚,引入差分算子 ,其中 是滞后算子(lag operator),。于是 、。称序列 为 阶单整(integrated of order ),记作 ,当且仅当 平稳且可逆,而 不平稳。约定 即平稳。随机游走 是 的原型,因为 已经是白噪声。这条结构性观察在量化金融里关键:价格水平 通常按 建模,而对数收益 按 建模——这就是量化流水线总从对数收益(log return)、而不是价格本身开始的结构性原因。
把上一课的 ARMA(p, q) 沿这条阶梯上推一层,即得 ARIMA(p, d, q):序列 服从 ARIMA(p, d, q) 当且仅当 服从平稳、可逆的 ARMA(p, q)。用滞后算子写出来:
其中 、 的所有根严格在单位圆外,而额外因子 在 处贡献 个单位根——这就是「单整」(integrated)一词的来源。特例对照:ARIMA(p, 0, q) 即 ARMA(p, q);ARIMA(0, 1, 0) 即随机游走;ARIMA(0, 1, 1) 与指数加权移动平均(EWMA)等价。上一课的 Box-Jenkins 工作流整套机械迁移过来:先用单位根检验选 ,再在 上识别和估计 。
3. 增广迪基-富勒(ADF)检验
需要一个数据驱动的开关来判定 ,这就是 ADF 检验。先看 AR(1) 自回归(autoregressive)过程 ,原假设 表示存在单位根( 为 ),备择 表示无单位根( 平稳)。两端同时减去 并令 ,得到等价检验 vs. ,这是一个左单尾(one-sided lower-tail)检验。「增广」(augmented)版本再加两件事:(a) 加入常数项 与可选的线性时间趋势 ,以覆盖趋势平稳备择;(b) 加入 个滞后差分项,用来吸收残差自相关。整条检验回归是:
滞后阶数 按 AIC / BIC 选,或按经验取 。ADF 统计量就是 的 比值 。关键事实:在原假设下,该 比值不服从标准正态或 分布,而是服从一个非标准的迪基-富勒分布(Dickey-Fuller distribution,可写成布朗运动的泛函;Dickey & Fuller 1979 此处仅列名,不展开推导)。因此必须查 Dickey-Fuller 临界值表,绝不能查标准 表。操作判则:在 5% 显著性水平下,当且仅当 ADF 统计量低于临界值时拒绝 (即判 平稳)。三种主流设定的 5%-显著性临界值如下,精度到一位小数:
| Specification | 5% critical value |
|---|---|
| no constant, no trend | -1.95 |
| with constant, no trend | -2.86 |
| with constant and trend | -3.41 |
把这些值与标准 表的 对照,你会发现它们更负,所以同等条件下 ADF 检验比朴素 检验更难拒绝原假设——这就是「单位根原假设很黏(sticky)」的工程意义。一句标准告诫:当真实 接近 1 时,ADF 对持续性强的平稳备择检验功效偏低;场上常用的替代是 Phillips-Perron 检验与 KPSS 检验,这里只列名、不展开。
4. 数值演示:一条 序列
把整条流程跑通一次。设 、、、,这是教科书级的随机游走。
- 对水平(level) 跑「含常数项、无趋势项」规格的 ADF 回归,得到 。该值显然高于 5% 临界值 ,所以不拒绝单位根原假设——结论: 含单位根,可视为 。
- 取一阶差分 ,对差分序列再跑同一规格的 ADF,得到 。该值远低于 ,所以拒绝单位根原假设——结论: 平稳,即 。
- 合并(1)、(2): 在一阶差分后即回到平稳,故 、。又因 本身已是白噪声,,合适的模型即 ARIMA(0, 1, 0),也就是随机游走本身。
这段流水线就是把 Box-Jenkins 框架从 ARMA 推广到 ARIMA 时最低限度的工作量:先用 ADF 确定 ,再在差分后的序列上识别 。下面这个 FormulaExplorer 让你拉动 与 ,直观看到 AR(1) 在 步预测下的方差 在 时如何发散——这正是单位根极限下方差关于水平的线性增长形式:
Formula Explorer
(1 - phi^(2*h)) / (1 - phi^2)5. 协整:把两条 拼回
回到开篇的伪回归隐患。若两条 序列 、 之间存在某个非零向量 ,使得线性组合 是 ,即称二者协整(cointegration); 称为协整系数。形式化:
协整是配对交易(pairs trade)与统计套利在价格水平上做策略的形式化基础:如果两只股票的对数价格协整,价差 是均值回复(mean-reverting)的,当价差远离长期均值时可建立多空头寸期待回归。Engle-Granger 两步法(Engle & Granger 1987 / 2003 年诺贝尔经济学奖)是工程化的标准检验:第一步,把 对 跑 OLS 得到 ;第二步,对残差 做 ADF 检验,但临界值要换成 MacKinnon 的协整版,不是普通的 ADF 临界值,原假设是「不协整」。多元情形下的 Johansen-VECM 完整处理留给后续高阶模块。开篇研究员若先做这一步,会发现两条价格水平不显著协整,从而正确放弃水平回归、转用一阶差分(对数收益)层面的相关或回归——这就是「先单位根检验,再下结论」的实际意义。
练习
Exercise
某只在售楼盘的月度对数房价 共 个观测,使用「含常数项、无趋势项」规格做 ADF 检验,统计量为 ;对一阶差分 同规格做 ADF,统计量为 。(a) 写出两次 ADF 检验各自的原假设与备择假设。(b) 把统计量与 5% 临界值 比较,分别给出拒绝/不拒绝原假设的判断。(c) 由此判定 的单整阶 ,在不估计 的前提下指出合适的 ARIMA 家族,并用一句话说明:若不先差分而直接把 与另一只 序列 做水平回归,为什么会陷入伪回归。
提示
提示
6. 通向下一模块
到这里整个 2.3.1 模块闭环:从「什么是平稳」起步,经 AR / MA / ARMA、Box-Jenkins 识别-估计-预测,再到本课对非平稳的补救。你手上的 ARIMA 流水线已能把序列的条件均值(conditional mean)结构榨干,留下一组看似无序的残差 。然而在金融时间序列里,这些残差几乎从来不是同方差:大波动倾向于跟着大波动,小波动跟着小波动——这就是波动率聚集(volatility clustering),它发生在残差不相关的前提下,所以 ARIMA 的均值模型抓不到。下一模块 2.3.2「波动率与状态切换模型」(Volatility & Regime Models)从这条残差线索接力,先把 ARCH 引出来,再叠上 GARCH 与 EGARCH 等家族,把条件方差也建模进去。本模块在均值侧打的地基,正是 2.3.2 在波动率侧立柱时所需的承重墙。