← 返回模块
2.1.2.1beta 可读 · 未来免费校验通过内容版本 2026-05-24

联合分布与边缘分布

2.1.2 · 条件分布与联合分布 · 数学与统计能力

某私募的风险分析师每天早盘从终端上抓两个数:沪深300 ETF 的日收益与 10 年国债收益率的日变动。她真正关心的不是任何一个单变量,而是两者的​​联合​​画像:沪深300 跌超 1% ​同时​ 10 年期收益率跳升 5bp 的概率。这类问题任何单变量密度都回答不了——它本质上是一个联合分布(joint distribution)问题。这一节把你在 2.1.1 模块里建立的整套单变量随机变量工具,从标量提升到对偶 (X, Y),并且不需要任何新观念,直接推广到任意维随机向量 (X_1, ..., X_n)。这一节结束后,你能写出联合分布律(joint pmf)或联合密度函数(joint pdf),由联合分布提取两个边缘(marginal),计算任一事件 {(X,Y)A}\{(X, Y) \in A\} 的概率,以及通过雅可比公式做二维变量代换。

一、离散情形:联合分布律即一张概率表

XXYY 都是离散随机变量,​​联合分布律​​为每一对可能取值赋一个概率:

pX,Y(x,y)=P(X=x, Y=y)p_{X,Y}(x, y) = P(X = x,\ Y = y)

两条规范化要求:pX,Y(x,y)0p_{X,Y}(x, y) \geq 0,以及联合支集上概率求和为一,x,ypX,Y(x,y)=1\sum_{x, y} p_{X,Y}(x, y) = 1。可视为一张二维表,横向索引 XX 的取值,纵向索引 YY 的取值。​​边缘分布律​​对 XX 的形式即把另一个变量加和掉:

pX(x)=ypX,Y(x,y)p_X(x) = \sum_{y} p_{X,Y}(x, y)

YY 同理:pY(y)=xpX,Y(x,y)p_Y(y) = \sum_x p_{X,Y}(x, y)。边缘化的过程丢掉了所有关于 YY 的信息,但保留了所有只涉及 XX 的概率陈述。手上有联合就必有两个边缘;反之不成立——两个完全不同的联合可以共享同样的两个边缘,这一差距恰恰是接下来整章的中心议题:依赖结构(dependence structure)。

​两骰子例​​。掷两颗公平骰子,设 XX 表示第一颗骰子的点数,YY 表示两颗骰子点数之和。联合支集形式上是 {1,,6}×{2,,12}\{1, \dots, 6\} \times \{2, \dots, 12\},但绝大多数格子为零——对固定 xx,只有 y=x+1,x+2,,x+6y = x + 1, x + 2, \dots, x + 6 这六种和值可能出现,每一对的概率为 1/361/36。因此联合分布律可写为一张 6×116 \times 11 的表:在每一行 xx 上,六个位置 (x,x+1),(x,x+2),,(x,x+6)(x, x+1), (x, x+2), \dots, (x, x+6) 各取 1/361/36,其余皆为 00。对 yy 求和得 pX(x)=61/36=1/6p_X(x) = 6 \cdot 1/36 = 1/6,x=1,,6x = 1, \dots, 6——单颗骰子的均匀分布,正如所料。对 xx 求和则恢复两骰子之和的经典金字塔分布:pY(2)=1/36p_Y(2) = 1/36,pY(3)=2/36p_Y(3) = 2/36,pY(4)=3/36p_Y(4) = 3/36,pY(5)=4/36p_Y(5) = 4/36,pY(6)=5/36p_Y(6) = 5/36,pY(7)=6/36p_Y(7) = 6/36,pY(8)=5/36p_Y(8) = 5/36,pY(9)=4/36p_Y(9) = 4/36,pY(10)=3/36p_Y(10) = 3/36,pY(11)=2/36p_Y(11) = 2/36,pY(12)=1/36p_Y(12) = 1/36。两边缘均正确地满足概率求和为一。

二、连续情形:联合密度、联合分布函数与混合偏导

转到连续 (X,Y)(X, Y):​​联合密度​ fX,Y(x,y)0f_{X,Y}(x, y) \geq 0 满足二重积分规范化 fX,Y(x,y)dxdy=1\iint f_{X,Y}(x, y)\, dx\, dy = 1,任一可测区域 AR2A \subset \mathbb{R}^2 上的概率即一个二重积分:

P((X,Y)A)=AfX,Y(x,y)dxdy.P((X, Y) \in A) = \iint_A f_{X,Y}(x, y)\, dx\, dy.

与单变量版本一致,联合密度本身​​不是​​概率。fX,Y(0.3,0.7)=1.4f_{X,Y}(0.3, 0.7) = 1.4 并不意味着"出现 1.4 的概率",它意味着"在点 (0.3,0.7)(0.3, 0.7) 附近,单位面积上的概率约为 1.4"。概率只活在积分里,不在逐点取值里。

​联合分布函数​​把一切系到事件上:

FX,Y(x,y)=P(Xx, Yy)F_{X,Y}(x, y) = P(X \leq x,\ Y \leq y)

FX,YF_{X,Y} 充分光滑时,联合密度由混合偏导恢复:

fX,Y(x,y)=2FX,Y(x,y)xyf_{X,Y}(x, y) = \dfrac{\partial^2 F_{X,Y}(x, y)}{\partial x\,\partial y}

​边缘密度​​对另一变量积出:

fX(x)=fX,Y(x,y)dyf_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x, y)\,dy

YY 亦同。两个例子把机制锁住。

​例一:单位正方形上的均匀分布​​。若 (X,Y)U([0,1]2)(X, Y) \sim U([0,1]^2),联合密度 fX,Y(x,y)=1f_{X,Y}(x, y) = 1[0,1]2[0,1]^2 上,否则为 00。对 yy0011 积出得 fX(x)=1f_X(x) = 1,x[0,1]x \in [0, 1]——两边缘均为 U(0,1)U(0, 1),任一矩形事件的概率就是它的面积。

​例二:非轴对齐区域​​。设 (X,Y)(X, Y) 在三角形 D={(x,y):x,y0, x+y1}D = \{(x, y): x, y \geq 0,\ x + y \leq 1\} 上服从均匀分布。区域 DD 的面积为 1/21/2,故密度 fX,Y(x,y)=2f_{X,Y}(x, y) = 2DD 上,否则为 00。求 P(YX)P(Y \geq X)。事件 {YX}D\{Y \geq X\} \cap DDD 中位于 y=xy = x 直线之上的那一半区域。由 DD 关于 y=xy = x 直线的对称性(交换坐标后区域不变),上下两半面积相等,故

P(YX)=01/2x1x2dydx=01/22(12x)dx=[2x2x2]01/2=112=12.P(Y \geq X) = \int_0^{1/2} \int_x^{1-x} 2\, dy\, dx = \int_0^{1/2} 2(1 - 2x)\, dx = \left[2x - 2x^2\right]_0^{1/2} = 1 - \tfrac{1}{2} = \tfrac{1}{2}.

对称性论证与显式积分结果一致:P(YX)=1/2P(Y \geq X) = 1/2

三、二维变量代换公式

很多时候分析的自然变量并非原始 (X,Y)(X, Y),而是某个变换 (U,V)=T(X,Y)(U, V) = T(X, Y)——收益的和与差、二维正态在极坐标下的形式、独立因子的比值等。设 TT 是光滑双射,其逆变换 T1(u,v)=(x(u,v),y(u,v))T^{-1}(u, v) = (x(u, v), y(u, v)),​​雅可比行列式​

J=det ⁣((x,y)(u,v)).J = \det\!\left(\dfrac{\partial(x, y)}{\partial(u, v)}\right).

(U,V)(U, V) 的联合密度为

fU,V(u,v)=fX,Y ⁣(x(u,v),y(u,v))Jf_{U,V}(u, v) = f_{X,Y}\!\left(x(u, v), y(u, v)\right) \left|J\right|

绝对值 J|J| 是正确的缩放因子,因为密度是"单位面积上的概率",而 J|J| 恰好是 T1T^{-1} 局部的面积放大率。​​应用一例​​。设 X,YX, Y 独立均匀于 (0,1)(0, 1),故 fX,Y(x,y)=1f_{X,Y}(x, y) = 1[0,1]2[0,1]^2 上。令 U=X+YU = X + Y,V=XYV = X - Y。反解 X=(U+V)/2X = (U + V)/2,Y=(UV)/2Y = (U - V)/2,雅可比为

J=det ⁣(1/21/21/21/2)=12,J=12.J = \det\!\begin{pmatrix} 1/2 & 1/2 \\ 1/2 & -1/2 \end{pmatrix} = -\tfrac{1}{2},\quad |J| = \tfrac{1}{2}.

所以 fU,V(u,v)=11/2=1/2f_{U,V}(u, v) = 1 \cdot 1/2 = 1/2 在像集上——以 (0,0),(1,1),(2,0),(1,1)(0, 0), (1, 1), (2, 0), (1, -1) 为顶点的平行四边形。总质量:面积 × 密度 = 2×1/2=12 \times 1/2 = 1。密度值与支集都对得上。

四、练习

Exercise

设 X, Y 独立同分布于 Uniform(0, 1),令 U = X + Y,V = X - Y。用雅可比公式求 (U,V)(U, V) 的联合密度 fU,V(u,v)f_{U,V}(u, v),并写出 (U,V)(U, V) 的支集。

提示
先反解原变量:x=(u+v)/2x = (u + v)/2,y=(uv)/2y = (u - v)/2。计算 (x,y)(x, y) 关于 (u,v)(u, v)2×22 \times 2 雅可比矩阵,取其行列式的绝对值。
提示
可得 J=1/2|J| = 1/2,故 fU,V(u,v)=1/2f_{U,V}(u, v) = 1/2 在像集上。支集是以 (0,0),(1,1),(2,0),(1,1)(0, 0), (1, 1), (2, 0), (1, -1) 为顶点的平行四边形,因为 0x,y10 \leq x, y \leq 1 映射为 vu|v| \leq uv2u|v| \leq 2 - u

五、通往下一节

到这里你已经能算任何关于 (X,Y)(X, Y) 的事件概率,也能通过变量代换得到任意变换后随机对的联合密度。但仍然有一类问题你尚未能干净回答:"在 Y=yY = y 的条件下,XX 的分布是什么?"这就是条件分布问题。一旦能干净回答它,你也就自动得到独立性的精确定义——独立性正是条件分布与边缘分布重合的那种特殊情形。下一节会同时把两个对象建好:条件分布律、条件密度、密度版乘法公式,从而把全部联合推断收敛回那条熟悉的贝叶斯公式,只是这次写在密度而非事件上。这正是上证 50ETF 期权链上每天估出的条件收益率密度,以及一切下游经验密度估计静静依赖的同一根基。