置信区间与自助法 — 参数估计与假设检验

周一上午,某私募的量化研究员要给 LP 周报里的「日均超额收益」配上一句免责声明。点估计给出 $\bar X = 5.2$ 、样本标准差 $S = 1.4$ 、样本量 $n = 25$ 。市场部追问:「这个 5.2 准吗?能不能告诉我一个区间?」她不能回答「真值有 95% 的概率落在某段里」——后面会看到这是个语言陷阱——但她可以给出一段置信区间(confidence interval, CI),并把这段区间所承担的统计意义讲清楚。本课就把上一节得到的点估计与它的抽样波动,正式翻译成一句关于 $\theta$ 可能取值的可辩护陈述。

一、定义与正确读法

设 $X = (X_1, \dots, X_n)$ 是来自被未知参数 $\theta \in \Theta$ 索引的分布的样本。一对统计量 $L(X), U(X)$ 称为 $\theta$ 的 $1 - \alpha$ 置信区间,若满足如下覆盖率(coverage)条件:

P_\theta(L(X) \leq \theta \leq U(X)) \geq 1 - \alpha \quad \text{for every } \theta \in \Theta

把类型签名(type signature)看清楚: $\theta$ 是未知但固定的常数,区间 $[L(X), U(X)]$ 才是随机的,随机性全部来自数据 $X$ 。正确的频率派读法是:在同一分布下假想多次重复抽样,所产生的区间中至少有 $1 - \alpha$ 的比例会覆盖真实 $\theta$ 。

这里立刻钉上本课最容易出错的一处:theta 是未知常数,不是随机变量,所以「theta 在区间内的概率是 95%」这种说法在频率派下是错误的。 数据观测下来后区间实现为 $[4.62, 5.78]$ 这样的具体数,真实 $\theta$ 要么在里面、要么不在,不存在「概率 95%」可言;那个 95% 是构造程序的覆盖率,而不是给定数据后关于参数的条件概率。贝叶斯可信区间(credible interval)允许后一种概率语言,但需要先验,本模块不展开。

二、用枢轴量构造正态模型 CI

枢轴量(pivotal quantity)是一个分布不依赖于 $\theta$ 的函数 $W(X, \theta)$ 。把它的分位区间反解为关于 $\theta$ 的区间,就得到 CI。上一模块的正态分布(Gaussian distribution)抽样定理直接给出三个标准枢轴量。

(i) $\sigma$ 已知,z 区间。 $Z = \sqrt{n}(\bar X - \mu)/\sigma \sim \mathcal{N}(0, 1)$ ,由 $P(-z_{\alpha/2} \leq Z \leq z_{\alpha/2}) = 1 - \alpha$ 反解,得 $\mu \in \bar X \pm z_{\alpha/2}\,\sigma/\sqrt{n}$ 。

(ii) $\sigma$ 未知,t 区间。 $T = \sqrt{n}(\bar X - \mu)/S \sim t_{n - 1}$ (用上一模块 $\bar X \perp S^2$ 的正态独立性),反解得

\bar{X} \pm t_{n - 1,\,\alpha/2}\,\dfrac{S}{\sqrt{n}}

(iii) 方差的 chi^2 区间。 $W = (n - 1) S^2 / \sigma^2 \sim \chi^2_{n - 1}$ ,反解得

\left(\dfrac{(n - 1) S^2}{\chi^2_{n - 1,\,1 - \alpha/2}},\ \dfrac{(n - 1) S^2}{\chi^2_{n - 1,\,\alpha/2}}\right)

注意 chi^2 分布是偏的(右偏),这段区间关于 $S^2$ 不对称——这是同济附表中查 chi^2 分位数时最容易看反的一处:下端分位用 $\chi^2_{n-1,\,1-\alpha/2}$ 而上端分位用 $\chi^2_{n-1,\,\alpha/2}$ ,左右两个分位与公式中两个分母的对应关系恰好是倒过来的,把表头看错就把区间方向写反了。 $\sigma^2$ 与 $\sigma$ 的区间一一对应,后者只需对前者开根号——这是 MLE 不变性原理在区间上的简单延伸。

三、大样本 Wald 区间

把视野放回到一般参数。上一课已经建立极大似然估计(maximum likelihood estimation, MLE)的渐近正态性 $\sqrt{n}(\hat\theta_{\mathrm{MLE}} - \theta) \xrightarrow{d} \mathcal{N}(0, I_1(\theta)^{-1})$ 。用 Slutsky 把 $I_1(\theta)$ 替换为 $I_1(\hat\theta_{\mathrm{MLE}})$ 即得渐近枢轴量,反解给出通用 Wald 区间

\hat{\theta}_{\mathrm{MLE}} \pm z_{\alpha/2}\,\dfrac{1}{\sqrt{n\,I_1(\hat{\theta}_{\mathrm{MLE}})}}

这条结构是上一课渐近正态结论的「直接消费形式」:只要你能写出 $\hat\theta_{\mathrm{MLE}}$ 与 $I_1(\hat\theta_{\mathrm{MLE}})$ ,大样本下就有一段近似 $1-\alpha$ CI。把它特化到伯努利:由 $I_1(p) = 1/[p(1 - p)]$ ,得比例的经典 Wald 区间

\hat{p} \pm z_{\alpha/2}\,\sqrt{\dfrac{\hat{p}(1 - \hat{p})}{n}}

但要诚实标注它的缺陷:当 $p$ 靠近 0 或 1 时该区间覆盖率不准,甚至越出 $[0, 1]$ 边界;实践中更稳的替代是 Wilson 区间与 Agresti-Coull 区间(详见 Brown, Cai & DasGupta, 2001)。

四、非参数自助法

样本量不大、分布形态又非标准的场合,直接套正态枢轴会失败。自助法(bootstrap,旧译「拔靴法」)给出一条几乎万能的套路。把待估量写成分布的泛函 $\theta = T(F)$ ;以经验分布 $\hat F_n$ (对每个 $X_i$ 赋质量 $1/n$ )代替未知 $F$ ;自助样本就是从 $\hat F_n$ 中有放回地重抽样 $n$ 个观测。

for b in 1..B:
    抽取 X*_{1,b}, ..., X*_{n,b}  i.i.d. from  F-hat_n   (有放回, 长度 n)
    theta-hat*_b = T(F-hat*_{n,b})                       (在自助样本上重算估计量)
返回经验分位:[ theta-hat*_{(alpha/2)},  theta-hat*_{(1 - alpha/2)} ]    (百分位 CI)

启发式正当性来自 Glivenko-Cantelli 定理: $\hat F_n$ 以一致收敛逼近 $F$ ,故对足够光滑的泛函而言 $T(\hat F_n)$ 近似 $T(F)$ ,本课不证。自助法在均值、中位数、分位数、回归系数、相关系数、夏普比率上都好用;但在边界型参数(如 $U(0, \theta)$ 的 $\theta = \max$ )与重尾分布(样本均值方差无穷)上会失效。参数自助法(从拟合后的 $f(\cdot; \hat\theta)$ 重抽样)结构与上面相同,只是把 $\hat F_n$ 换成参数化模型;更精细的 BCa(bias-corrected and accelerated)区间与双重自助法见 Efron & Tibshirani《An Introduction to the Bootstrap》(1993)。

五、一个端到端的算例

取 $n = 25$ 、 $\bar X = 5.2$ 、 $S = 1.4$ ,要为 $\mu$ 构造 95% t-CI。查 t 分位数表(同济附表)得 $t_{24,\,0.025} \approx 2.064$ 。代入公式:

\text{half-width} \approx 2.064 \cdot \dfrac{1.4}{\sqrt{25}} = 2.064 \cdot \dfrac{1.4}{5} \approx 0.578

于是 $\mu \in 5.2 \pm 0.578 \approx [4.62,\,5.78]$ 。再把这句话翻译成正确口径:如果以同样的程序从同一分布反复抽 25 个观测,所得的区间在 95% 的样本上会盖住真实 $\mu$ ——而不是「真实 $\mu$ 有 95% 的概率落在 $[4.62, 5.78]$ 」。两句话长得很像,统计含义却完全不同。

下面的滑块演示 z 区间宽度随样本量 $n$ 与未知波动率 $\sigma$ 的变化:

Formula Explorer

2 * 1.96 * sigma / sqrt(n)

把 $n$ 拨大,宽度按 $1/\sqrt{n}$ 衰减——这是「样本量翻四倍只能让区间窄一半」这条常识的几何来源;同样地,要把区间宽度缩到原来的十分之一,需要把样本量扩大到原来的一百倍,这条尺寸账常常是研究预算的硬约束。这条结论对 z、t 与 Wald 区间都成立,因为它们的半宽都正比于标准误,而正态模型的标准误以 $\sigma/\sqrt{n}$ 量级出现。

Exercise

设 $X_1, \dots, X_{16}$ i.i.d. 来自某正态分布(Gaussian distribution)总体,样本给出 $\bar X = 10.4$ 、 $S = 2.0$ 。(a) 构造均值 $\mu$ 的 95% t-置信区间。(b) 构造 $\sigma^2$ 的 90% chi-square 置信区间,并写出你所用的 chi-square 分位数。

提示

(a) 用 t 区间

\bar X \pm t_{n - 1,\,\alpha/2}\,S/\sqrt{n}

;此处

n = 16

、

\alpha = 0.05

,查表

t_{15,\,0.025} \approx 2.131

。直接代入即可。

提示

(b) 用 chi^2 区间

((n - 1) S^2/\chi^2_{15,\,1-\alpha/2},\ (n - 1) S^2/\chi^2_{15,\,\alpha/2})

;

\alpha = 0.10

,查表

\chi^2_{15,\,0.95} \approx 24.996

、

\chi^2_{15,\,0.05} \approx 7.261

,顺序别写反。

六、下一步

到这里你已能给各主流参数挂上区间报价——但这只是同一硬币的一面:每一个置信区间对应一个假设检验。下一课把这个对偶关系明面化:从 $5.2 \pm 0.578$ 出发,我们立刻能回答「 $\mu = 5$ 在 5% 显著性水平下能否被拒?」这类问题,并把 P 值、第一类错误、Neyman-Pearson 引理一并装进同一张图。