周五下午两点,沪深300 当日累计跌幅已经放大到 2.8%、还在加速。你在一家中型私募(private fund)做日内风险报表,上周用对称 GARCH(1, 1) 给组合估的次日条件方差,在过去三次类似的放量下跌之后,滚动校准里都低估了实际 realised vol 将近 30%——而向上的同尺度日子,模型反而略偏高。问题不在样本,也不在 zt 是否服从正态分布(Gaussian distribution),而出在模型递推本身:它先把 εt−1 平方,符号信息整条丢掉了。本课的任务有两件——先把符号信息塞回单变量(EGARCH 与 GJR-GARCH),再把单资产的方差升级为 k 资产组合的协方差矩阵(covariance matrix)版本(BEKK、CCC、DCC)。
1. 杠杆效应:对称 GARCH 漏掉了什么
Black (1976) 与 Christie (1982) 给出的机制解释是:股价下跌使公司净资产相对负债比被动收缩,杠杆(leverage)被放大,股权波动也随之放大——所谓杠杆效应(leverage effect)。这一机制是否唯一正确尚有争议,但实证规律本身极稳健:在绝大多数股指日收益上,−1σ 量级的负向冲击对次日条件方差的推升,显著高于 +1σ 的正向同尺度冲击。对称 GARCH(1, 1) 的递推 σt2=ω+αεt−12+βσt−12 只通过 εt−12 接收过去信息,εt−1 的符号在平方那一步被完全抹掉。要把符号塞回去,文献给了两条主流参数化。
2. EGARCH(1, 1):对数方差递推
Nelson (1991) 把递推搬到对数条件方差上。记标准化创新 zt=εt/σt,EGARCH(1, 1) 写作
logσt2=ω+βlogσt−12+αzt−1+γ(∣zt−1∣−E∣zt−1∣).
在 Gaussian 创新下 E∣zt∣=2/π——这个常数把冲击函数 g(z)=αz+γ(∣z∣−E∣z∣) 中的幅度项中心化到零均值。g 拆成两半:αz 是符号项,把过去冲击的方向塞进 logσt2;γ(∣z∣−E∣z∣) 是幅度偏离项,只看 ∣z∣ 相对其期望的偏离。这一参数化有两件结构性好事:
- σt2=exp(logσt2)>0 自动成立,无须对 (ω,α,γ,β) 强加正性约束,数值优化更省心;
- 权益市场上 α 通常显著为负,意味着 zt−1<0 比同尺度的 zt−1>0 把 logσt2 推得更高——这正是杠杆效应的代数体现。
弱平稳条件简单:AR(1) 块满足 ∣β∣<1,p 阶推广为 ∑j=1pβj<1。这一条件等价于把 logσt2 看作 AR(p) 时其特征多项式的根位于单位圆外——它不约束 α,γ 的取值,因为这两项在对数尺度上只贡献有界的冲击项 g(zt−1),不影响特征根。
3. GJR-GARCH(1, 1):层级模型与信息冲击曲线
Glosten-Jagannathan-Runkle (1993) 给出更接近经典 GARCH 形态的层级(level-form)写法:
σt2=ω+αεt−12+γεt−121{εt−1<0}+βσt−12,
正性约束为 ω>0、α≥0、α+γ≥0、β≥0,弱平稳条件(下一节推导)为 α+γ/2+β<1。γ>0 即杠杆参数:一次 −ξ 量级冲击的贡献是 (α+γ)ξ2,一次 +ξ 的贡献只有 αξ2,差额 γξ2 就是非对称性的代数指纹。
把 σt2 作为 εt−1 的函数、固定 σt−12 在无条件方差,就得到 Pagan-Schwert (1990) 的信息冲击曲线(news-impact curve, NIC):对称 GARCH 的 NIC 是一条以原点为顶点的对称抛物线;GJR-GARCH 的 NIC 是两段半抛物线,在 εt−1=0 处出现折点、左半边斜率 α+γ 严格大于右半边斜率 α;EGARCH 的 NIC 是 exp(⋅) 形态,严格凸且左右斜率非对称。NIC 是对比三类模型最直接的视觉工具。下面这个 FormulaExplorer 让你拉动 (ω,α,γ,β,sigma2_prev) 的滑块,直接观察 GJR 的 NIC 在折点两侧的斜率差异:
Formula Explorer
omega + (alpha + gamma * (x < 0)) * x^2 + beta * sigma2_prev
4. 无条件方差的推导
对 GJR-GARCH(1, 1) 的递推两边取无条件期望——假设过程已经弱平稳,记 V=E[σt2]=E[εt2] 与 t 无关。三步:
- 由全期望公式 E[εt−12]=E[σt−12zt−12]=V⋅E[zt−12]=V,因为 E[zt2]=1;
- 创新 zt−1 关于零对称、且与 Ft−2-可测的 σt−12 独立,故
E[εt−121{εt−1<0}]=E[σt−12]E[zt−121{zt−1<0}]=V⋅21E[zt−12]=2V;
- 代回递推得 V=ω+αV+γ⋅2V+βV,解出
Var(εt)=V=1−α−γ/2−βω.
弱平稳与正无条件方差同时要求 α+γ/2+β<1,这就是 GJR-GARCH(1, 1) 的稳定区。α+γ/2+β=1 是非对称版的 IGARCH 边界;长记忆推广(FIGARCH、HYGARCH)只在此点名,完整推导见 Tsay 第 3.13 节。
5. 估计:QML 与三明治标准误
EGARCH 与 GJR-GARCH 完全继承上一课的极大似然估计(maximum likelihood estimation, MLE)框架:在条件正态假设下写出对数似然,即便真实 zt 是 Student-t 或有偏 t,这一估计仍按 Bollerslev-Wooldridge 的拟极大似然(quasi-MLE, QML)解读,标准误用三明治形式。一元的对数似然形式与上一课同型,只把 σt2(θ) 替换为当前模型递推;参数维度也只多一个杠杆项,样本量没增加多少边际负担。数值上 EGARCH 因无须正性约束更省心,梯度近乎处处可微;GJR 优化器需要在约束面 α+γ≥0 上维护可行性,通常以参数重参数化或带屏障的内点法处理。若多元创新出现联合厚尾,常见修正是把多元正态似然换成多元 Student-t,本课不展开。
6. 多元 GARCH:从 Ht 到 DCC
把视角换到 k 资产组合。条件均值残差 εt=rt−μt,条件协方差矩阵
Ht=E[εtεt⊤∣Ft−1].
仅给每只资产单独跑一元 GARCH 不够——组合 VaR、跟踪误差、最优对冲比都需要完整的 Ht。维度诅咒来得很快:vech(Ht) 长 k(k+1)/2,朴素 VEC(1, 1) 参数量 O(k4),k>3 即不可行。三种工程化方案如下。
(a) BEKK(Engle-Kroner 1995):
Ht=CC⊤+Aεt−1εt−1⊤A⊤+BHt−1B⊤,
其中 C,A,B 均为 k×k 矩阵。二次型构造直接保证 Ht 半正定,无须额外正性约束;参数量降到 O(k2),实务中常用 A,B 对角的简化形式以进一步压缩。
(b) CCC(Bollerslev 1990)与 (c) DCC(Engle 2002):共享同一分解,但相关性矩阵的处理不同:
Ht=DtRtDt,Qt=(1−a−b)Qˉ+aut−1ut−1⊤+bQt−1,Rt=(Qt∗)−1/2Qt(Qt∗)−1/2,
其中 Dt=diag(σ1,t,…,σk,t) 来自 k 个独立的一元 GARCH(1, 1) 拟合,ut=Dt−1εt 是标准化残差,Qˉ=T−1∑tutut⊤ 是 {ut} 的样本协方差,Qt∗=diag(Qt) 用作归一化对角;CCC 直接令 Rt≡R(常相关),DCC 则按上式让 Rt 动态演化,且仅多两个标量参数 a,b≥0、a+b<1。
多元正态条件密度对应的对数似然把一元的二次项升级为二次型:
ℓ(θ)=−21t=1∑T[klog(2π)+logdetHt(θ)+εt⊤Ht(θ)−1εt].
DCC 的两阶段估计是工程化关键,严格按 Engle (2002) 原文顺序:阶段一对每只资产独立拟合一元 GARCH(1, 1) 得到对角的 Dt;阶段二固定 Dt,用 ut=Dt−1εt 仅就 (a,b) 最大化相关性对数似然。CCC 是否站得住脚由 Engle-Sheppard (2001) 的常条件相关性检验给出——拒绝即转用 DCC。非对称版本(Cappiello-Engle-Sheppard 2006 的 ADCC)把杠杆效应推进到相关性矩阵层面,本课不展开。
7. 通向下一课
回看本模块的两课:从对称 GARCH 到 GJR、EGARCH、再到 BEKK / DCC,估计骨架完全相同——在条件正态假设下写出对数似然、数值优化、汇报 Bollerslev-Wooldridge 三明治标准误;模型与模型之间的差别只在 σt2 或 Ht 的递推形式。但 GARCH 族共享一个核心假设:σt2(以及 Ht)都是过去冲击的确定性函数,即 Ft−1-可测。下一课要放弃这条假设——令 logσt2 自身服从一条由独立创新驱动的隐含 AR(1) 过程,这就是随机波动率(stochastic volatility, SV)模型族。它在选择权定价上更贴近 Heston / SABR 的直觉,但代价是估计要从滤波或 MCMC 入手,远比 GARCH 族的 QML 麻烦。
练习
Exercise
考虑 GJR-GARCH(1, 1) 模型 εt=σtzt,其中 zt∼i.i.d.(0,1) 关于零对称,且 σt2=ω+αεt−12+γεt−121{εt−1<0}+βσt−12,参数满足 ω>0、α,β≥0、α+γ≥0。(a) 证明在 zt 对称的条件下 E[εt−121{εt−1<0}]=21Var(εt−1)。(b) 推导无条件方差 Var(εt)=ω/(1−α−γ/2−β),并写出对应的弱平稳条件。(c) 画出信息冲击曲线 σt2 关于 εt−1 的图(把 σt−12 固定在无条件方差),并解释为什么 γ>0 对应杠杆效应。(d) 假设对 k 资产组合逐资产拟合一元 GARCH(1, 1) 得 Dt=diag(σ1,t,…,σk,t),定义标准化残差 ut=Dt−1εt,写出 DCC(1, 1) 的 Qt 递推与由此得到的 Rt。
提示
(a) 把
εt−121{εt−1<0} 拆成
σt−12zt−121{zt−1<0};由独立性与
zt−1 对称即得
E[z21{z<0}]=21。
提示
(b) 对递推两端取期望并代入 (a),得
V=ω+(α+γ/2+β)V,解出
V 与稳定区;(c) 左右半边斜率分别为
α+γ 与
α;(d) 用上节给出的
Qt 与
Rt=(Qt∗)−1/2Qt(Qt∗)−1/2 即可。