← 返回模块
2.2.1.3beta 可读 · 未来付费校验通过内容版本 2026-05-26

置信区间与自助法

2.2.1 · 参数估计与假设检验 · 数学与统计能力

周一上午,某私募的量化研究员要给 LP 周报里的「日均超额收益」配上一句免责声明。点估计给出 Xˉ=5.2\bar X = 5.2、样本标准差 S=1.4S = 1.4、样本量 n=25n = 25。市场部追问:「这个 5.2 准吗?能不能告诉我一个区间?」她不能回答「真值有 95% 的概率落在某段里」——后面会看到这是个语言陷阱——但她可以给出一段​​置信区间​​(confidence interval, CI),并把这段区间所承担的统计意义讲清楚。本课就把上一节得到的点估计与它的抽样波动,正式翻译成一句关于 θ\theta 可能取值的可辩护陈述。

一、定义与正确读法

X=(X1,,Xn)X = (X_1, \dots, X_n) 是来自被未知参数 θΘ\theta \in \Theta 索引的分布的样本。一对统计量 L(X),U(X)L(X), U(X) 称为 θ\theta1α1 - \alpha ​置信区间​​,若满足如下​​覆盖率​​(coverage)条件:

Pθ(L(X)θU(X))1αfor every θΘP_\theta(L(X) \leq \theta \leq U(X)) \geq 1 - \alpha \quad \text{for every } \theta \in \Theta

把类型签名(type signature)看清楚:θ\theta 是未知但​​固定​​的常数,区间 [L(X),U(X)][L(X), U(X)] 才是随机的,随机性全部来自数据 XX。正确的频率派读法是:​​在同一分布下假想多次重复抽样,所产生的区间中至少有 1α1 - \alpha 的比例会覆盖真实 θ\theta。​

这里立刻钉上本课最容易出错的一处:​​theta 是未知常数,不是随机变量,所以「theta 在区间内的概率是 95%」这种说法在频率派下是错误的。​ 数据观测下来后区间实现为 [4.62,5.78][4.62, 5.78] 这样的具体数,真实 θ\theta 要么在里面、要么不在,不存在「概率 95%」可言;那个 95% 是构造​​程序​​的覆盖率,而不是给定数据后关于参数的条件概率。贝叶斯可信区间(credible interval)允许后一种概率语言,但需要先验,本模块不展开。

二、用枢轴量构造正态模型 CI

​枢轴量​​(pivotal quantity)是一个分布不依赖于 θ\theta 的函数 W(X,θ)W(X, \theta)。把它的分位区间反解为关于 θ\theta 的区间,就得到 CI。上一模块的​​正态分布​​(Gaussian distribution)抽样定理直接给出三个标准枢轴量。

​(i) σ\sigma 已知,z 区间。​ Z=n(Xˉμ)/σN(0,1)Z = \sqrt{n}(\bar X - \mu)/\sigma \sim \mathcal{N}(0, 1),由 P(zα/2Zzα/2)=1αP(-z_{\alpha/2} \leq Z \leq z_{\alpha/2}) = 1 - \alpha 反解,得 μXˉ±zα/2σ/n\mu \in \bar X \pm z_{\alpha/2}\,\sigma/\sqrt{n}

​(ii) σ\sigma 未知,t 区间。​ T=n(Xˉμ)/Stn1T = \sqrt{n}(\bar X - \mu)/S \sim t_{n - 1}(用上一模块 XˉS2\bar X \perp S^2 的正态独立性),反解得

Xˉ±tn1,α/2Sn\bar{X} \pm t_{n - 1,\,\alpha/2}\,\dfrac{S}{\sqrt{n}}

​(iii) 方差的 chi^2 区间。​ W=(n1)S2/σ2χn12W = (n - 1) S^2 / \sigma^2 \sim \chi^2_{n - 1},反解得

((n1)S2χn1,1α/22, (n1)S2χn1,α/22)\left(\dfrac{(n - 1) S^2}{\chi^2_{n - 1,\,1 - \alpha/2}},\ \dfrac{(n - 1) S^2}{\chi^2_{n - 1,\,\alpha/2}}\right)

注意 chi^2 分布是偏的(右偏),这段区间​​关于 S2S^2 不对称​​——这是同济附表中查 chi^2 分位数时最容易看反的一处:下端分位用 χn1,1α/22\chi^2_{n-1,\,1-\alpha/2} 而上端分位用 χn1,α/22\chi^2_{n-1,\,\alpha/2},左右两个分位与公式中两个分母的对应关系恰好是倒过来的,把表头看错就把区间方向写反了。σ2\sigma^2σ\sigma 的区间一一对应,后者只需对前者开根号——这是 MLE 不变性原理在区间上的简单延伸。

三、大样本 Wald 区间

把视野放回到一般参数。上一课已经建立​​极大似然估计​​(maximum likelihood estimation, MLE)的渐近正态性 n(θ^MLEθ)dN(0,I1(θ)1)\sqrt{n}(\hat\theta_{\mathrm{MLE}} - \theta) \xrightarrow{d} \mathcal{N}(0, I_1(\theta)^{-1})。用 Slutsky 把 I1(θ)I_1(\theta) 替换为 I1(θ^MLE)I_1(\hat\theta_{\mathrm{MLE}}) 即得渐近枢轴量,反解给出通用 Wald 区间

θ^MLE±zα/21nI1(θ^MLE)\hat{\theta}_{\mathrm{MLE}} \pm z_{\alpha/2}\,\dfrac{1}{\sqrt{n\,I_1(\hat{\theta}_{\mathrm{MLE}})}}

这条结构是上一课渐近正态结论的「直接消费形式」:只要你能写出 θ^MLE\hat\theta_{\mathrm{MLE}}I1(θ^MLE)I_1(\hat\theta_{\mathrm{MLE}}),大样本下就有一段近似 1α1-\alpha CI。把它特化到伯努利:由 I1(p)=1/[p(1p)]I_1(p) = 1/[p(1 - p)],得比例的经典 Wald 区间

p^±zα/2p^(1p^)n\hat{p} \pm z_{\alpha/2}\,\sqrt{\dfrac{\hat{p}(1 - \hat{p})}{n}}

但要诚实标注它的缺陷:当 pp 靠近 0 或 1 时该区间覆盖率不准,甚至越出 [0,1][0, 1] 边界;实践中更稳的替代是 Wilson 区间与 Agresti-Coull 区间(详见 Brown, Cai & DasGupta, 2001)。

四、非参数自助法

样本量不大、分布形态又非标准的场合,直接套正态枢轴会失败。​​自助法​​(bootstrap,旧译「拔靴法」)给出一条几乎万能的套路。把待估量写成分布的泛函 θ=T(F)\theta = T(F);以​​经验分布​ F^n\hat F_n(对每个 XiX_i 赋质量 1/n1/n)代替未知 FF;​​自助样本​​就是从 F^n\hat F_n 中有放回地重抽样 nn 个观测。

for b in 1..B:
    抽取 X*_{1,b}, ..., X*_{n,b}  i.i.d. from  F-hat_n   (有放回, 长度 n)
    theta-hat*_b = T(F-hat*_{n,b})                       (在自助样本上重算估计量)
返回经验分位:[ theta-hat*_{(alpha/2)},  theta-hat*_{(1 - alpha/2)} ]    (百分位 CI)

启发式正当性来自 Glivenko-Cantelli 定理:F^n\hat F_n 以一致收敛逼近 FF,故对足够光滑的泛函而言 T(F^n)T(\hat F_n) 近似 T(F)T(F),本课不证。自助法在均值、中位数、分位数、回归系数、相关系数、夏普比率上都好用;但在​​边界型参数​​(如 U(0,θ)U(0, \theta)θ=max\theta = \max)与​​重尾分布​​(样本均值方差无穷)上会失效。参数自助法(从拟合后的 f(;θ^)f(\cdot; \hat\theta) 重抽样)结构与上面相同,只是把 F^n\hat F_n 换成参数化模型;更精细的 BCa(bias-corrected and accelerated)区间与双重自助法见 Efron & Tibshirani《An Introduction to the Bootstrap》(1993)。

五、一个端到端的算例

n=25n = 25Xˉ=5.2\bar X = 5.2S=1.4S = 1.4,要为 μ\mu 构造 95% t-CI。查 t 分位数表(同济附表)得 t24,0.0252.064t_{24,\,0.025} \approx 2.064。代入公式:

half-width2.0641.425=2.0641.450.578\text{half-width} \approx 2.064 \cdot \dfrac{1.4}{\sqrt{25}} = 2.064 \cdot \dfrac{1.4}{5} \approx 0.578

于是 μ5.2±0.578[4.62,5.78]\mu \in 5.2 \pm 0.578 \approx [4.62,\,5.78]。再把这句话翻译成正确口径:​​如果以同样的程序从同一分布反复抽 25 个观测,所得的区间在 95% 的样本上会盖住真实 μ\mu​​​——而不是「真实 μ\mu 有 95% 的概率落在 [4.62,5.78][4.62, 5.78]」。两句话长得很像,统计含义却完全不同。

下面的滑块演示 z 区间宽度随样本量 nn 与未知波动率 σ\sigma 的变化:

Formula Explorer

2 * 1.96 * sigma / sqrt(n)

nn 拨大,宽度按 1/n1/\sqrt{n} 衰减——这是「样本量翻四倍只能让区间窄一半」这条常识的几何来源;同样地,要把区间宽度缩到原来的十分之一,需要把样本量扩大到原来的一百倍,这条尺寸账常常是研究预算的硬约束。这条结论对 z、t 与 Wald 区间都成立,因为它们的半宽都正比于标准误,而正态模型的标准误以 σ/n\sigma/\sqrt{n} 量级出现。

Exercise

X1,,X16X_1, \dots, X_{16} i.i.d. 来自某正态分布(Gaussian distribution)总体,样本给出 Xˉ=10.4\bar X = 10.4S=2.0S = 2.0。(a) 构造均值 μ\mu 的 95% t-置信区间。(b) 构造 σ2\sigma^2 的 90% chi-square 置信区间,并写出你所用的 chi-square 分位数。

提示
(a) 用 t 区间 Xˉ±tn1,α/2S/n\bar X \pm t_{n - 1,\,\alpha/2}\,S/\sqrt{n};此处 n=16n = 16α=0.05\alpha = 0.05,查表 t15,0.0252.131t_{15,\,0.025} \approx 2.131。直接代入即可。
提示
(b) 用 chi^2 区间 ((n1)S2/χ15,1α/22, (n1)S2/χ15,α/22)((n - 1) S^2/\chi^2_{15,\,1-\alpha/2},\ (n - 1) S^2/\chi^2_{15,\,\alpha/2});α=0.10\alpha = 0.10,查表 χ15,0.95224.996\chi^2_{15,\,0.95} \approx 24.996χ15,0.0527.261\chi^2_{15,\,0.05} \approx 7.261,顺序别写反。

六、下一步

到这里你已能给各主流参数挂上区间报价——但这只是同一硬币的一面:​​每一个置信区间对应一个假设检验​​。下一课把这个对偶关系明面化:从 5.2±0.5785.2 \pm 0.578 出发,我们立刻能回答「μ=5\mu = 5 在 5% 显著性水平下能否被拒?」这类问题,并把 P 值、第一类错误、Neyman-Pearson 引理一并装进同一张图。