← 返回模块
2.1.1.1beta 可读 · 未来免费校验通过内容版本 2026-05-26

样本空间与概率公理

2.1.1 · 概率论基础 · 数学与统计能力

某私募基金的风控组在周五下午盘点一份报告:研究员声称他的新因子在过去 250 个交易日里"有 23 次同一日命中两只以上股票的涨跌停",并把这当作"反常聚集"的证据。问题是:在 23 个独立事件中至少撞上两次,本来就稀奇吗?这其实是"生日问题"的金融变体——回答它之前,你需要把"事件"和"概率"的定义先钉死。本节把概率从地基重新搭起来:样本空间、事件、Kolmogorov 公理化定义,以及由公理直接推出的几条万能恒等式。

一、样本空间、事件、概率

一次随机试验(experiment)的所有可能结果(outcome)的集合,称为​​样本空间​​(sample space),记作 Ω\Omega。任何一个 Ω\Omega 的子集 AΩA \subseteq \Omega 都称为一个​​事件​​(event),概率函数 PP 把每个事件映到一个 [0,1][0, 1] 之间的实数 P(A)P(A)

三个贯穿全课的例子:

  1. ​单掷一颗骰子​​:Ω={1,2,3,4,5,6}\Omega = \{1, 2, 3, 4, 5, 6\},有限且等可能,这是经典的​​古典概型​​。
  2. ​无穷次抛硬币​​:Ω={0,1}N\Omega = \{0, 1\}^{\mathbb{N}},即所有 0–1 无穷序列,是不可数集。
  3. ​在 [0,1][0, 1] 上均匀取一点​​:Ω=[0,1]\Omega = [0, 1],也是不可数集,对应​​几何概型​​——概率由长度而非个数决定。

后两个例子里,无法对 Ω\Omega 的每一个子集都赋予一个"合理"的概率;这时只在某个​​事件 σ\sigma 代数​​(sigma-algebra)上定义 PP。本节先不细究该集类的构造,仅记住"并非任何子集都可测"这一事实——严格的测度论留到 2.7.1 布朗运动课。

二、Kolmogorov 三条公理

Kolmogorov 在 1933 年给出公理化定义,把概率从直觉变成了数学。三条公理写成一组:

(A1) 非负性:P(A)0,(A2) 规范性:P(Ω)=1,(A3) 可列可加性:P(i=1Ai)=i=1P(Ai)    对两两不相交的 Ai.\begin{aligned} &\text{(A1) 非负性:} && P(A) \geq 0, \\ &\text{(A2) 规范性:} && P(\Omega) = 1, \\ &\text{(A3) 可列可加性:} && P\left(\bigcup_{i=1}^{\infty} A_i\right) = \sum_{i=1}^{\infty} P(A_i) \;\; \text{对两两不相交的 } A_i. \end{aligned}

(A3) 是关键:它把有限多个不相交事件的相加规则,推广到​​可列无穷​​多个。强行只要求有限可加性是不够的,因为概率论中大量极限论证(包括下一节的全概率公式与第五节的大数定律)都依赖可列可加性这一条。

三、由公理直接推出的恒等式

只用三条公理,几条万能事实立刻浮现:

  • P()=0P(\varnothing) = 0:取 Ai=A_i = \varnothing 全部空集代入 (A3),立即得到 P()=P()P(\varnothing) = \sum P(\varnothing),只有 00 满足。
  • P(Ac)=1P(A)P(A^c) = 1 - P(A):因为 AAAcA^c 不相交,且 AAc=ΩA \cup A^c = \Omega
  • 单调性:若 ABA \subseteq B,则 P(A)P(B)P(A) \leq P(B);证明拆 B=A(BA)B = A \cup (B \setminus A)
  • ​容斥原理​​(inclusion-exclusion)两事件版:
P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B)

三事件版本则把三两相交全部加减一次:

P(ABC)=P(A)+P(B)+P(C)P(AB)P(AC)P(BC)+P(ABC)P(A \cup B \cup C) = P(A) + P(B) + P(C) - P(A \cap B) - P(A \cap C) - P(B \cap C) + P(A \cap B \cap C)

四、古典概型实战:扑克花色与生日撞车

​例 1(同花概率)​​:从一副 52 张扑克牌中无放回随机抽 5 张,得到同花(全部 5 张同花色)的概率是

P(同花)=4(135)(525)=4128725989600.00198.P(\text{同花}) = \frac{4 \cdot \binom{13}{5}}{\binom{52}{5}} = \frac{4 \cdot 1287}{2598960} \approx 0.00198.

分子:选 1 种花色 ×\times 在该花色 13 张中选 5 张;分母:从 52 张中无序选 5 张的总数。

​例 2(生日问题)​​:nn 个独立的人,生日均匀落在 365 天(忽略闰年)。"至少两人同生日"的概率最容易通过补事件算:

P(no shared birthday among n people)=k=0n1365k365.P(\text{no shared birthday among } n \text{ people}) = \prod_{k=0}^{n-1} \frac{365 - k}{365}.

代入 n=23n = 23,数值约为 0.49270.4927;故 P(至少撞车)0.5073P(\text{至少撞车}) \approx 0.5073,过半。换言之,文章开头那位研究员声称的"23 个事件里命中两次"在概率论看来完全正常——直觉对碰撞概率的低估,是这堂课每次都要重申的教训。

五、滑块:看公理如何约束概率

下面的滑块让你看到一个简单的两事件示例 P(A)+P(B)P(AB)P(A) + P(B) - P(A \cap B) 如何随各分量变化:

Formula Explorer

a + b - c

六、练习

Exercise

一颗公平六面骰子掷两次。用古典概型(等可能定义)计算两次点数之和不小于 9 的概率。请显式写出样本空间与事件。

提示
样本空间是有序对 Ω={(i,j):1i,j6}\Omega = \{(i, j) : 1 \leq i, j \leq 6\},共 36 个等可能结果。事件 AA 是其中和 9\geq 9 的那部分。
提示
用枚举法清点 AA:和为 9 的 4 对、和为 10 的 3 对、和为 11 的 2 对、和为 12 的 1 对,共 10 对。所求概率即 10/36=5/1810/36 = 5/18

七、通往下一节

至此你已经能在一个清晰定义的样本空间上,用公理与容斥原理算出基本的事件概率。下一节把"信息"引入概率:当你已经知道事件 BB 发生时,事件 AA 的概率会如何更新?这就是​​条件概率​ P(AB)P(A \mid B),以及由它派生的乘法公式、全概率公式与贝叶斯公式——你做生日问题反思的同一组工具,马上会让你在沪深300 成分股的逐日"看似异常"事件里,把信号从噪音中识别出来。