周一上午,某私募的量化研究员要给 LP 周报里的「日均超额收益」配上一句免责声明。点估计给出 Xˉ=5.2、样本标准差 S=1.4、样本量 n=25。市场部追问:「这个 5.2 准吗?能不能告诉我一个区间?」她不能回答「真值有 95% 的概率落在某段里」——后面会看到这是个语言陷阱——但她可以给出一段置信区间(confidence interval, CI),并把这段区间所承担的统计意义讲清楚。本课就把上一节得到的点估计与它的抽样波动,正式翻译成一句关于 θ 可能取值的可辩护陈述。
一、定义与正确读法
设 X=(X1,…,Xn) 是来自被未知参数 θ∈Θ 索引的分布的样本。一对统计量 L(X),U(X) 称为 θ 的 1−α 置信区间,若满足如下覆盖率(coverage)条件:
Pθ(L(X)≤θ≤U(X))≥1−αfor every θ∈Θ
把类型签名(type signature)看清楚:θ 是未知但固定的常数,区间 [L(X),U(X)] 才是随机的,随机性全部来自数据 X。正确的频率派读法是:在同一分布下假想多次重复抽样,所产生的区间中至少有 1−α 的比例会覆盖真实 θ。
这里立刻钉上本课最容易出错的一处:theta 是未知常数,不是随机变量,所以「theta 在区间内的概率是 95%」这种说法在频率派下是错误的。 数据观测下来后区间实现为 [4.62,5.78] 这样的具体数,真实 θ 要么在里面、要么不在,不存在「概率 95%」可言;那个 95% 是构造程序的覆盖率,而不是给定数据后关于参数的条件概率。贝叶斯可信区间(credible interval)允许后一种概率语言,但需要先验,本模块不展开。
二、用枢轴量构造正态模型 CI
枢轴量(pivotal quantity)是一个分布不依赖于 θ 的函数 W(X,θ)。把它的分位区间反解为关于 θ 的区间,就得到 CI。上一模块的正态分布(Gaussian distribution)抽样定理直接给出三个标准枢轴量。
(i) σ 已知,z 区间。 Z=n(Xˉ−μ)/σ∼N(0,1),由 P(−zα/2≤Z≤zα/2)=1−α 反解,得 μ∈Xˉ±zα/2σ/n。
(ii) σ 未知,t 区间。 T=n(Xˉ−μ)/S∼tn−1(用上一模块 Xˉ⊥S2 的正态独立性),反解得
Xˉ±tn−1,α/2nS
(iii) 方差的 chi^2 区间。 W=(n−1)S2/σ2∼χn−12,反解得
(χn−1,1−α/22(n−1)S2, χn−1,α/22(n−1)S2)
注意 chi^2 分布是偏的(右偏),这段区间关于 S2 不对称——这是同济附表中查 chi^2 分位数时最容易看反的一处:下端分位用 χn−1,1−α/22 而上端分位用 χn−1,α/22,左右两个分位与公式中两个分母的对应关系恰好是倒过来的,把表头看错就把区间方向写反了。σ2 与 σ 的区间一一对应,后者只需对前者开根号——这是 MLE 不变性原理在区间上的简单延伸。
三、大样本 Wald 区间
把视野放回到一般参数。上一课已经建立极大似然估计(maximum likelihood estimation, MLE)的渐近正态性 n(θ^MLE−θ)dN(0,I1(θ)−1)。用 Slutsky 把 I1(θ) 替换为 I1(θ^MLE) 即得渐近枢轴量,反解给出通用 Wald 区间
θ^MLE±zα/2nI1(θ^MLE)1
这条结构是上一课渐近正态结论的「直接消费形式」:只要你能写出 θ^MLE 与 I1(θ^MLE),大样本下就有一段近似 1−α CI。把它特化到伯努利:由 I1(p)=1/[p(1−p)],得比例的经典 Wald 区间
p^±zα/2np^(1−p^)
但要诚实标注它的缺陷:当 p 靠近 0 或 1 时该区间覆盖率不准,甚至越出 [0,1] 边界;实践中更稳的替代是 Wilson 区间与 Agresti-Coull 区间(详见 Brown, Cai & DasGupta, 2001)。
四、非参数自助法
样本量不大、分布形态又非标准的场合,直接套正态枢轴会失败。自助法(bootstrap,旧译「拔靴法」)给出一条几乎万能的套路。把待估量写成分布的泛函 θ=T(F);以经验分布 F^n(对每个 Xi 赋质量 1/n)代替未知 F;自助样本就是从 F^n 中有放回地重抽样 n 个观测。
for b in 1..B:
抽取 X*_{1,b}, ..., X*_{n,b} i.i.d. from F-hat_n (有放回, 长度 n)
theta-hat*_b = T(F-hat*_{n,b}) (在自助样本上重算估计量)
返回经验分位:[ theta-hat*_{(alpha/2)}, theta-hat*_{(1 - alpha/2)} ] (百分位 CI)
启发式正当性来自 Glivenko-Cantelli 定理:F^n 以一致收敛逼近 F,故对足够光滑的泛函而言 T(F^n) 近似 T(F),本课不证。自助法在均值、中位数、分位数、回归系数、相关系数、夏普比率上都好用;但在边界型参数(如 U(0,θ) 的 θ=max)与重尾分布(样本均值方差无穷)上会失效。参数自助法(从拟合后的 f(⋅;θ^) 重抽样)结构与上面相同,只是把 F^n 换成参数化模型;更精细的 BCa(bias-corrected and accelerated)区间与双重自助法见 Efron & Tibshirani《An Introduction to the Bootstrap》(1993)。
五、一个端到端的算例
取 n=25、Xˉ=5.2、S=1.4,要为 μ 构造 95% t-CI。查 t 分位数表(同济附表)得 t24,0.025≈2.064。代入公式:
half-width≈2.064⋅251.4=2.064⋅51.4≈0.578
于是 μ∈5.2±0.578≈[4.62,5.78]。再把这句话翻译成正确口径:如果以同样的程序从同一分布反复抽 25 个观测,所得的区间在 95% 的样本上会盖住真实 μ——而不是「真实 μ 有 95% 的概率落在 [4.62,5.78]」。两句话长得很像,统计含义却完全不同。
下面的滑块演示 z 区间宽度随样本量 n 与未知波动率 σ 的变化:
Formula Explorer
2 * 1.96 * sigma / sqrt(n)
把 n 拨大,宽度按 1/n 衰减——这是「样本量翻四倍只能让区间窄一半」这条常识的几何来源;同样地,要把区间宽度缩到原来的十分之一,需要把样本量扩大到原来的一百倍,这条尺寸账常常是研究预算的硬约束。这条结论对 z、t 与 Wald 区间都成立,因为它们的半宽都正比于标准误,而正态模型的标准误以 σ/n 量级出现。
Exercise
设 X1,…,X16 i.i.d. 来自某正态分布(Gaussian distribution)总体,样本给出 Xˉ=10.4、S=2.0。(a) 构造均值 μ 的 95% t-置信区间。(b) 构造 σ2 的 90% chi-square 置信区间,并写出你所用的 chi-square 分位数。
提示
(a) 用 t 区间
Xˉ±tn−1,α/2S/n;此处
n=16、
α=0.05,查表
t15,0.025≈2.131。直接代入即可。
提示
(b) 用 chi^2 区间
((n−1)S2/χ15,1−α/22, (n−1)S2/χ15,α/22);
α=0.10,查表
χ15,0.952≈24.996、
χ15,0.052≈7.261,顺序别写反。
六、下一步
到这里你已能给各主流参数挂上区间报价——但这只是同一硬币的一面:每一个置信区间对应一个假设检验。下一课把这个对偶关系明面化:从 5.2±0.578 出发,我们立刻能回答「μ=5 在 5% 显著性水平下能否被拒?」这类问题,并把 P 值、第一类错误、Neyman-Pearson 引理一并装进同一张图。