← 返回模块
2.4.1.2beta 可读 · 未来付费校验通过内容版本 2026-05-25

矩阵代数与线性方程组

2.4.1 · 线性代数核心 · 数学与统计能力

深圳某券商衍生品做市团队周五下午收到一封 CFFEX 合规问询:47 套挂在沪深300 股指期货上的对冲策略,监管想知道是否存在两套策略相互冗余——也就是说某一套是其他几套的线性组合。问题背后是同一个矩阵 AA:列是各策略的盯市 P&L,秩决定了一切。若 AA 列满秩,47 个方向线性无关;若不满秩,过去几个月里有人在重复申报相同的风险敞口。本节给你回答这个问题需要的代数工具:把矩阵乘法理解为映射复合,把高斯消元用作揭示秩的引擎,把可逆性的四个等价刻画一次性厘清。

一、矩阵乘法即线性映射的复合

上一节里你已经看到,一旦取基,线性映射 T:RnRmT: \mathbb{R}^n \to \mathbb{R}^m 化作矩阵 ARm×nA \in \mathbb{R}^{m \times n}。同理,若 S:RpRnS: \mathbb{R}^p \to \mathbb{R}^n 化作 BRn×pB \in \mathbb{R}^{n \times p},则复合 TS:RpRmT \circ S: \mathbb{R}^p \to \mathbb{R}^m 也必然对应一个矩阵——它就是 ABAB。按列推开复合的定义,立刻得到熟悉的行乘列公式:

(AB)ij=kAikBkj(AB)_{ij} = \sum_k A_{ik} B_{kj}

「乘法即复合」这一观点立刻给出三件事:第一,结合律 (AB)C=A(BC)(AB)C = A(BC) 成立,因为函数复合本身满足结合律;第二,分配律 A(B+C)=AB+ACA(B + C) = AB + AC 成立;第三,乘法​​不​​满足交换律,一般 ABBAAB \neq BA,因为反过来复合需要 SS 接受 TT 的输出,多数情况下根本无定义。乘之前先做尺寸检查:AA 的列数必须等于 BB 的行数。

矩阵转置 ATA^T 翻转行列,(AT)ij=Aji(A^T)_{ij} = A_{ji}。常用的两条恒等式:(AT)T=A(A^T)^T = A,以及 (AB)T=BTAT(AB)^T = B^T A^T(次序反转)。

二、用高斯消元求解 Ax=bAx = b

方阵方程 Ax=bAx = b 问的是:哪个 xRnx \in \mathbb{R}^n 给出右端 bb?高斯消元的策略是对增广矩阵 [Ab][A \mid b] 反复施加​​初等行变换​​——交换 rirjr_i \leftrightarrow r_j、伸缩 cricr_i、替换 ri+crjr_i + cr_j——每一步都保持解集不变,最终把 AA 化为​​行阶梯形​​:主元(pivot)沿对角下行右移,主元下方为零。

考虑 3 阶具体例子:

A=(123247368),b=(61517)A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 7 \\ 3 & 6 & 8 \end{pmatrix}, \quad b = \begin{pmatrix} 6 \\ 15 \\ 17 \end{pmatrix}

第一步 r22r1r2r_2 - 2 r_1 \to r_2r33r1r3r_3 - 3 r_1 \to r_3 之后,增广矩阵的第 2、3 行分别变为 (0,0,1,3)(0, 0, 1, 3)(0,0,1,1)(0, 0, -1, -1);再做 r3+r2r3r_3 + r_2 \to r_3,得到 (0,0,0,2)(0, 0, 0, 2)。第三行被读作 0=20 = 2,​​方程无解​​。若把 bb 换成 (6,15,18)(6, 15, 18),第三行会变成 0=00 = 0x2x_2 成为​​自由变量​​,参数化出一族无穷解。

三、秩、自由变量与秩-零度定理

矩阵 AA 的​​秩​ rank(A)\mathrm{rank}(A) 是其行阶梯形中主元的个数,等价于其列空间的维数;其​​零空间​ kerA={x:Ax=0}\ker A = \{x : Ax = 0\} 衡量映射把哪些输入压成零,维数称为​​零度​​。无论怎样消元,这两个维数都不会变。对任意 ARm×nA \in \mathbb{R}^{m \times n},秩-零度定理把它们绑在一起:

rank(A)+dimker(A)=n\mathrm{rank}(A) + \dim \ker(A) = n

它是数解的标准工具,三种情形:(i) bb 不在列空间,无解;(ii) bb 在列空间且 rank(A)=n\mathrm{rank}(A) = n(零空间平凡),有唯一解;(iii) bb 在列空间且 rank(A)<n\mathrm{rank}(A) < n,有 dimker(A)=nrank(A)\dim \ker(A) = n - \mathrm{rank}(A) 个自由变量参数化的无穷多解。下面的滑块演示 Ax=bAx = b 第一行残差随系数与右端变化的情况:

Formula Explorer

a11*x1 + a12*x2 - b1

几何上,一行就是一张约束超平面随系数移动,方程组的解必须同时落在每一张约束面上。这与 Strang 的「行图像」一致;「列图像」则反过来问如何用 AA 的各列组合出 bb

四、逆矩阵与四条等价的可逆判据

方阵 ARn×nA \in \mathbb{R}^{n \times n} 称为​​可逆​​,若存在矩阵逆 A1A^{-1} 使 AA1=A1A=IA A^{-1} = A^{-1} A = III 为单位矩阵)。逆矩阵唯一:若 B,CB, C 同为 AA 的逆,则 B=BI=B(AC)=(BA)C=IC=CB = BI = B(AC) = (BA)C = IC = C。对实方阵,下列五条​​两两等价​​:

  1. AA 可逆。
  2. det(A)0\det(A) \neq 0
  3. rank(A)=n\mathrm{rank}(A) = n(满秩)。
  4. kerA={0}\ker A = \{0\}(零空间平凡)。
  5. 对任何 bRnb \in \mathbb{R}^nAx=bAx = b 有唯一解。

只要任一条成立,其余四条自动成立。实操中最廉价的判据是高斯消元:若消元过程中出现一整行零,则 AA 奇异。

五、行列式(一段话)

按行公理化定义行列式:(a) 对每一行多重线性,(b) 交错(交换两行变号),(c) det(I)=1\det(I) = 1。这三条公理唯一决定了函数 det:Rn×nR\det: \mathbb{R}^{n \times n} \to \mathbb{R}。两条要点:det(AB)=det(A)det(B)\det(AB) = \det(A) \det(B);以及高斯消元后行列式等于主元乘积乘以 (1)行交换次数(-1)^{\text{行交换次数}}n>3n > 3 时的代数余子展开存在,但手算极少用到。

六、练习

Exercise

用高斯消元求解 x + 2y + 3z = 6, 2x + 4y + 7z = 15, 3x + 6y + 8z = 17,并判断解是唯一、无穷还是无解。

提示
写出增广矩阵后做 r22r1r2r_2 - 2 r_1 \to r_2r33r1r3r_3 - 3 r_1 \to r_3 清掉第一列;再观察第二列在第 2、3 行已经为零,yy 是潜在的自由变量。
提示
消元后第二行变 (0,0,1,3)(0, 0, 1, 3)、第三行变 (0,0,1,1)(0, 0, -1, -1);做 r3+r2r3r_3 + r_2 \to r_3(0,0,0,2)(0, 0, 0, 2),即 0=20 = 2,矛盾。方程组​​无解​​。

七、通往下一节

到这一节末尾,你已经掌握矩阵的代数运算,以及通过秩去读懂方阵或长方形线性方程组的能力。下一节为 Rn\mathbb{R}^n 装上几何:内积、L2 范数、正交性。借助这些工具,你将推出向 AA 的列空间做正交投影的公式,并进一步给出量化常用的最小二乘闭式估计 β^=(XTX)1XTy\hat\beta = (X^T X)^{-1} X^T y——它正是任何一次 OLS 回归(无论作用在沪深300 收益上还是其他数据上)在底层执行的同一段代数。