深圳某券商衍生品做市团队周五下午收到一封 CFFEX 合规问询:47 套挂在沪深300 股指期货上的对冲策略,监管想知道是否存在两套策略相互冗余——也就是说某一套是其他几套的线性组合。问题背后是同一个矩阵 A A A :列是各策略的盯市 P&L,秩决定了一切。若 A A A 列满秩,47 个方向线性无关;若不满秩,过去几个月里有人在重复申报相同的风险敞口。本节给你回答这个问题需要的代数工具:把矩阵乘法理解为映射复合,把高斯消元用作揭示秩的引擎,把可逆性的四个等价刻画一次性厘清。
一、矩阵乘法即线性映射的复合
上一节里你已经看到,一旦取基,线性映射 T : R n → R m T: \mathbb{R}^n \to \mathbb{R}^m T : R n → R m 化作矩阵 A ∈ R m × n A \in \mathbb{R}^{m \times n} A ∈ R m × n 。同理,若 S : R p → R n S: \mathbb{R}^p \to \mathbb{R}^n S : R p → R n 化作 B ∈ R n × p B \in \mathbb{R}^{n \times p} B ∈ R n × p ,则复合 T ∘ S : R p → R m T \circ S: \mathbb{R}^p \to \mathbb{R}^m T ∘ S : R p → R m 也必然对应一个矩阵——它就是 A B AB A B 。按列推开复合的定义,立刻得到熟悉的行乘列公式:
( A B ) i j = ∑ k A i k B k j (AB)_{ij} = \sum_k A_{ik} B_{kj} ( A B ) ij = ∑ k A ik B k j
「乘法即复合」这一观点立刻给出三件事:第一,结合律 ( A B ) C = A ( B C ) (AB)C = A(BC) ( A B ) C = A ( B C ) 成立,因为函数复合本身满足结合律;第二,分配律 A ( B + C ) = A B + A C A(B + C) = AB + AC A ( B + C ) = A B + A C 成立;第三,乘法不 满足交换律,一般 A B ≠ B A AB \neq BA A B = B A ,因为反过来复合需要 S S S 接受 T T T 的输出,多数情况下根本无定义。乘之前先做尺寸检查:A A A 的列数必须等于 B B B 的行数。
矩阵转置 A T A^T A T 翻转行列,( A T ) i j = A j i (A^T)_{ij} = A_{ji} ( A T ) ij = A j i 。常用的两条恒等式:( A T ) T = A (A^T)^T = A ( A T ) T = A ,以及 ( A B ) T = B T A T (AB)^T = B^T A^T ( A B ) T = B T A T (次序反转)。
二、用高斯消元求解 A x = b Ax = b A x = b
方阵方程 A x = b Ax = b A x = b 问的是:哪个 x ∈ R n x \in \mathbb{R}^n x ∈ R n 给出右端 b b b ?高斯消元的策略是对增广矩阵 [ A ∣ b ] [A \mid b] [ A ∣ b ] 反复施加初等行变换 ——交换 r i ↔ r j r_i \leftrightarrow r_j r i ↔ r j 、伸缩 c r i cr_i c r i 、替换 r i + c r j r_i + cr_j r i + c r j ——每一步都保持解集不变,最终把 A A A 化为行阶梯形 :主元(pivot)沿对角下行右移,主元下方为零。
考虑 3 阶具体例子:
A = ( 1 2 3 2 4 7 3 6 8 ) , b = ( 6 15 17 ) A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 7 \\ 3 & 6 & 8 \end{pmatrix}, \quad b = \begin{pmatrix} 6 \\ 15 \\ 17 \end{pmatrix} A = 1 2 3 2 4 6 3 7 8 , b = 6 15 17
第一步 r 2 − 2 r 1 → r 2 r_2 - 2 r_1 \to r_2 r 2 − 2 r 1 → r 2 与 r 3 − 3 r 1 → r 3 r_3 - 3 r_1 \to r_3 r 3 − 3 r 1 → r 3 之后,增广矩阵的第 2、3 行分别变为 ( 0 , 0 , 1 , 3 ) (0, 0, 1, 3) ( 0 , 0 , 1 , 3 ) 与 ( 0 , 0 , − 1 , − 1 ) (0, 0, -1, -1) ( 0 , 0 , − 1 , − 1 ) ;再做 r 3 + r 2 → r 3 r_3 + r_2 \to r_3 r 3 + r 2 → r 3 ,得到 ( 0 , 0 , 0 , 2 ) (0, 0, 0, 2) ( 0 , 0 , 0 , 2 ) 。第三行被读作 0 = 2 0 = 2 0 = 2 ,方程无解 。若把 b b b 换成 ( 6 , 15 , 18 ) (6, 15, 18) ( 6 , 15 , 18 ) ,第三行会变成 0 = 0 0 = 0 0 = 0 ,x 2 x_2 x 2 成为自由变量 ,参数化出一族无穷解。
三、秩、自由变量与秩-零度定理
矩阵 A A A 的秩 r a n k ( A ) \mathrm{rank}(A) rank ( A ) 是其行阶梯形中主元的个数,等价于其列空间的维数;其零空间 ker A = { x : A x = 0 } \ker A = \{x : Ax = 0\} ker A = { x : A x = 0 } 衡量映射把哪些输入压成零,维数称为零度 。无论怎样消元,这两个维数都不会变。对任意 A ∈ R m × n A \in \mathbb{R}^{m \times n} A ∈ R m × n ,秩-零度定理把它们绑在一起:
r a n k ( A ) + dim ker ( A ) = n \mathrm{rank}(A) + \dim \ker(A) = n rank ( A ) + dim ker ( A ) = n
它是数解的标准工具,三种情形:(i) b b b 不在列空间,无解;(ii) b b b 在列空间且 r a n k ( A ) = n \mathrm{rank}(A) = n rank ( A ) = n (零空间平凡),有唯一解;(iii) b b b 在列空间且 r a n k ( A ) < n \mathrm{rank}(A) < n rank ( A ) < n ,有 dim ker ( A ) = n − r a n k ( A ) \dim \ker(A) = n - \mathrm{rank}(A) dim ker ( A ) = n − rank ( A ) 个自由变量参数化的无穷多解。下面的滑块演示 A x = b Ax = b A x = b 第一行残差随系数与右端变化的情况:
Formula Explorer
a11*x1 + a12*x2 - b1
几何上,一行就是一张约束超平面随系数移动,方程组的解必须同时落在每一张约束面上。这与 Strang 的「行图像」一致;「列图像」则反过来问如何用 A A A 的各列组合出 b b b 。
四、逆矩阵与四条等价的可逆判据
方阵 A ∈ R n × n A \in \mathbb{R}^{n \times n} A ∈ R n × n 称为可逆 ,若存在矩阵逆 A − 1 A^{-1} A − 1 使 A A − 1 = A − 1 A = I A A^{-1} = A^{-1} A = I A A − 1 = A − 1 A = I (I I I 为单位矩阵)。逆矩阵唯一:若 B , C B, C B , C 同为 A A A 的逆,则 B = B I = B ( A C ) = ( B A ) C = I C = C B = BI = B(AC) = (BA)C = IC = C B = B I = B ( A C ) = ( B A ) C = I C = C 。对实方阵,下列五条两两等价 :
A A A 可逆。
det ( A ) ≠ 0 \det(A) \neq 0 det ( A ) = 0 。
r a n k ( A ) = n \mathrm{rank}(A) = n rank ( A ) = n (满秩)。
ker A = { 0 } \ker A = \{0\} ker A = { 0 } (零空间平凡)。
对任何 b ∈ R n b \in \mathbb{R}^n b ∈ R n ,A x = b Ax = b A x = b 有唯一解。
只要任一条成立,其余四条自动成立。实操中最廉价的判据是高斯消元:若消元过程中出现一整行零,则 A A A 奇异。
五、行列式(一段话)
按行公理化定义行列式:(a) 对每一行多重线性,(b) 交错(交换两行变号),(c) det ( I ) = 1 \det(I) = 1 det ( I ) = 1 。这三条公理唯一决定了函数 det : R n × n → R \det: \mathbb{R}^{n \times n} \to \mathbb{R} det : R n × n → R 。两条要点:det ( A B ) = det ( A ) det ( B ) \det(AB) = \det(A) \det(B) det ( A B ) = det ( A ) det ( B ) ;以及高斯消元后行列式等于主元乘积乘以 ( − 1 ) 行交换次数 (-1)^{\text{行交换次数}} ( − 1 ) 行交换次数 。n > 3 n > 3 n > 3 时的代数余子展开存在,但手算极少用到。
六、练习
Exercise
用高斯消元求解 x + 2y + 3z = 6, 2x + 4y + 7z = 15, 3x + 6y + 8z = 17,并判断解是唯一、无穷还是无解。
提示 写出增广矩阵后做
r 2 − 2 r 1 → r 2 r_2 - 2 r_1 \to r_2 r 2 − 2 r 1 → r 2 与
r 3 − 3 r 1 → r 3 r_3 - 3 r_1 \to r_3 r 3 − 3 r 1 → r 3 清掉第一列;再观察第二列在第 2、3 行已经为零,
y y y 是潜在的自由变量。
提示 消元后第二行变
( 0 , 0 , 1 , 3 ) (0, 0, 1, 3) ( 0 , 0 , 1 , 3 ) 、第三行变
( 0 , 0 , − 1 , − 1 ) (0, 0, -1, -1) ( 0 , 0 , − 1 , − 1 ) ;做
r 3 + r 2 → r 3 r_3 + r_2 \to r_3 r 3 + r 2 → r 3 得
( 0 , 0 , 0 , 2 ) (0, 0, 0, 2) ( 0 , 0 , 0 , 2 ) ,即
0 = 2 0 = 2 0 = 2 ,矛盾。方程组
无解 。
七、通往下一节
到这一节末尾,你已经掌握矩阵的代数运算,以及通过秩去读懂方阵或长方形线性方程组的能力。下一节为 R n \mathbb{R}^n R n 装上几何:内积、L2 范数、正交性。借助这些工具,你将推出向 A A A 的列空间做正交投影的公式,并进一步给出量化常用的最小二乘闭式估计 β ^ = ( X T X ) − 1 X T y \hat\beta = (X^T X)^{-1} X^T y β ^ = ( X T X ) − 1 X T y ——它正是任何一次 OLS 回归(无论作用在沪深300 收益上还是其他数据上)在底层执行的同一段代数。