某私募基金的风控组在周五下午盘点一份报告:研究员声称他的新因子在过去 250 个交易日里"有 23 次同一日命中两只以上股票的涨跌停",并把这当作"反常聚集"的证据。问题是:在 23 个独立事件中至少撞上两次,本来就稀奇吗?这其实是"生日问题"的金融变体——回答它之前,你需要把"事件"和"概率"的定义先钉死。本节把概率从地基重新搭起来:样本空间、事件、Kolmogorov 公理化定义,以及由公理直接推出的几条万能恒等式。
一、样本空间、事件、概率
一次随机试验(experiment)的所有可能结果(outcome)的集合,称为样本空间(sample space),记作 Ω。任何一个 Ω 的子集 A⊆Ω 都称为一个事件(event),概率函数 P 把每个事件映到一个 [0,1] 之间的实数 P(A)。
三个贯穿全课的例子:
- 单掷一颗骰子:Ω={1,2,3,4,5,6},有限且等可能,这是经典的古典概型。
- 无穷次抛硬币:Ω={0,1}N,即所有 0–1 无穷序列,是不可数集。
- 在 [0,1] 上均匀取一点:Ω=[0,1],也是不可数集,对应几何概型——概率由长度而非个数决定。
后两个例子里,无法对 Ω 的每一个子集都赋予一个"合理"的概率;这时只在某个事件 σ 代数(sigma-algebra)上定义 P。本节先不细究该集类的构造,仅记住"并非任何子集都可测"这一事实——严格的测度论留到 2.7.1 布朗运动课。
二、Kolmogorov 三条公理
Kolmogorov 在 1933 年给出公理化定义,把概率从直觉变成了数学。三条公理写成一组:
(A1) 非负性:(A2) 规范性:(A3) 可列可加性:P(A)≥0,P(Ω)=1,P(i=1⋃∞Ai)=i=1∑∞P(Ai)对两两不相交的 Ai.
(A3) 是关键:它把有限多个不相交事件的相加规则,推广到可列无穷多个。强行只要求有限可加性是不够的,因为概率论中大量极限论证(包括下一节的全概率公式与第五节的大数定律)都依赖可列可加性这一条。
三、由公理直接推出的恒等式
只用三条公理,几条万能事实立刻浮现:
- P(∅)=0:取 Ai=∅ 全部空集代入 (A3),立即得到 P(∅)=∑P(∅),只有 0 满足。
- P(Ac)=1−P(A):因为 A 与 Ac 不相交,且 A∪Ac=Ω。
- 单调性:若 A⊆B,则 P(A)≤P(B);证明拆 B=A∪(B∖A)。
- 容斥原理(inclusion-exclusion)两事件版:
P(A∪B)=P(A)+P(B)−P(A∩B)
三事件版本则把三两相交全部加减一次:
P(A∪B∪C)=P(A)+P(B)+P(C)−P(A∩B)−P(A∩C)−P(B∩C)+P(A∩B∩C)
四、古典概型实战:扑克花色与生日撞车
例 1(同花概率):从一副 52 张扑克牌中无放回随机抽 5 张,得到同花(全部 5 张同花色)的概率是
P(同花)=(552)4⋅(513)=25989604⋅1287≈0.00198.
分子:选 1 种花色 × 在该花色 13 张中选 5 张;分母:从 52 张中无序选 5 张的总数。
例 2(生日问题):n 个独立的人,生日均匀落在 365 天(忽略闰年)。"至少两人同生日"的概率最容易通过补事件算:
P(no shared birthday among n people)=∏k=0n−1365365−k.
代入 n=23,数值约为 0.4927;故 P(至少撞车)≈0.5073,过半。换言之,文章开头那位研究员声称的"23 个事件里命中两次"在概率论看来完全正常——直觉对碰撞概率的低估,是这堂课每次都要重申的教训。
五、滑块:看公理如何约束概率
下面的滑块让你看到一个简单的两事件示例 P(A)+P(B)−P(A∩B) 如何随各分量变化:
Formula Explorer
a + b - c
六、练习
Exercise
一颗公平六面骰子掷两次。用古典概型(等可能定义)计算两次点数之和不小于 9 的概率。请显式写出样本空间与事件。
提示
样本空间是有序对
Ω={(i,j):1≤i,j≤6},共 36 个等可能结果。事件
A 是其中和
≥9 的那部分。
提示
用枚举法清点
A:和为 9 的 4 对、和为 10 的 3 对、和为 11 的 2 对、和为 12 的 1 对,共 10 对。所求概率即
10/36=5/18。
七、通往下一节
至此你已经能在一个清晰定义的样本空间上,用公理与容斥原理算出基本的事件概率。下一节把"信息"引入概率:当你已经知道事件 B 发生时,事件 A 的概率会如何更新?这就是条件概率 P(A∣B),以及由它派生的乘法公式、全概率公式与贝叶斯公式——你做生日问题反思的同一组工具,马上会让你在沪深300 成分股的逐日"看似异常"事件里,把信号从噪音中识别出来。