Chapter5-2 MATH1408

λ-矩阵理论与矩阵标准型

1. λ-矩阵 (λ-Matrix / Polynomial Matrix)

1.1 定义

  • 一个λ-矩阵 (或称多项式矩阵) 是指其元素是关于变量 λ 的多项式的矩阵。
    $A(\lambda) = \begin{pmatrix}
    a_{11}(\lambda) & a_{12}(\lambda) & \dots & a_{1n}(\lambda) \\
    a_{21}(\lambda) & a_{22}(\lambda) & \dots & a_{2n}(\lambda) \\
    \vdots & \vdots & \ddots & \vdots \\
    a_{m1}(\lambda) & a_{m2}(\lambda) & \dots & a_{mn}(\lambda)
    \end{pmatrix}$
    其中 $a_{ij}(\lambda)$ 是数域 $F$ (通常是复数域 $\mathbb{C}$ 或实数域 $\mathbb{R}$) 上的 λ 的多项式。
  • λ-矩阵的次数是指其所有元素多项式中的最高次数。

1.2 λ-矩阵的初等变换 (Elementary Operations for λ-Matrices)

λ-矩阵的初等变换类似于常数矩阵的初等变换,但涉及多项式:

  1. 第一类 (行/列交换): 交换 λ-矩阵的两行 (或两列)。
  2. 第二类 (行/列倍乘): 将 λ-矩阵的某一行 (或某一列) 乘以一个非零常数 $c \in F, c \ne 0$。 (注意:不是乘以一个λ的多项式,除非该多项式是可逆的,即非零常数)。
  3. 第三类 (行/列倍加): 将 λ-矩阵的某一行 (或某一列) 乘以一个任意的 λ-多项式 $f(\lambda)$ 后加到另一行 (或另一列) 上。

1.3 λ-矩阵的等价 (Equivalence of λ-Matrices)

  • 如果 λ-矩阵 $A(\lambda)$ 可以通过一系列有限次 λ-矩阵初等变换得到 λ-矩阵 $B(\lambda)$,则称 $A(\lambda)$ 与 $B(\lambda)$ 等价,记为 $A(\lambda) \sim B(\lambda)$ 或 $A(\lambda) \xrightarrow{\text{初等变换}} B(\lambda)$。
  • 等价关系具有反身性、对称性和传递性。

1.4 可逆λ-矩阵 (Unimodular λ-Matrix / Invertible λ-Matrix)

  • 一个 $n \times n$ 的 λ-方阵 $A(\lambda)$ 称为可逆λ-矩阵 (或幺模λ-矩阵),如果存在另一个 $n \times n$ 的 λ-方阵 $B(\lambda)$ 使得 $A(\lambda)B(\lambda) = B(\lambda)A(\lambda) = E_n$ (单位矩阵)。
  • 定理: $n \times n$ λ-方阵 $A(\lambda)$ 是可逆λ-矩阵的充要条件是其行列式 $|A(\lambda)|$ 是一个非零常数
    • 证明思路:
      • ($\Rightarrow$) 若 $A(\lambda)B(\lambda)=E_n$,则 $|A(\lambda)||B(\lambda)| = |E_n|=1$。因为 $|A(\lambda)|$ 和 $|B(\lambda)|$ 都是 λ 的多项式,它们相乘为1,则它们必须都是非零常数。
      • ($\Leftarrow$) 若 $|A(\lambda)|=c \ne 0$ (常数),则 $A(\lambda)^{-1} = \frac{1}{|A(\lambda)|} \text{adj}(A(\lambda)) = \frac{1}{c} \text{adj}(A(\lambda))$。由于伴随矩阵 $\text{adj}(A(\lambda))$ 的元素也是 λ 的多项式,所以 $A(\lambda)^{-1}$ 是一个 λ-矩阵。
  • 定理: 任何可逆λ-矩阵都可以表示为有限个初等λ-矩阵的乘积。初等λ-矩阵是指由单位矩阵经过一次λ-矩阵初等变换得到的矩阵。
  • 定理: λ-矩阵 $A(\lambda)$ 与 $B(\lambda)$ 等价的充要条件是存在可逆λ-矩阵 $P(\lambda)$ 和 $Q(\lambda)$ 使得 $P(\lambda)A(\lambda)Q(\lambda) = B(\lambda)$。

1.5 矩阵多项式 (Polynomials of Matrices / Matrix Polynomials in a different sense)

(这部分PPT的表述似乎混淆了“元素是多项式的矩阵”和“以矩阵为变量的多项式”,这里按前者理解,但提到了带余除法,这通常用于后者)

  • 定义: 形如 $M(\lambda) = M_m \lambda^m + M_{m-1} \lambda^{m-1} + \dots + M_1 \lambda + M_0$ 的表达式,其中 $M_i$ 是 $n \times n$ 的常数矩阵,$M_m \ne O$ (零矩阵)(如果 $m>0$)。$m$ 称为该矩阵多项式的次数。
  • 带余除法: 对于矩阵多项式 $M(\lambda)$ 和 $N(\lambda) = \lambda E - A$ (其中 $A$ 是常数矩阵),存在唯一的矩阵多项式 $Q(\lambda)$ (商式) 和常数矩阵 $R$ (余式) 使得:
    $M(\lambda) = Q(\lambda)(\lambda E - A) + R$ (右除法)
    且存在唯一的矩阵多项式 $S(\lambda)$ (商式) 和常数矩阵 $T$ (余式) 使得:
    $N(\lambda) = (\lambda E - B)S(\lambda) + T$ (这里应该是 $M(\lambda) = (\lambda E - B)S(\lambda) + T$ 左除法)
    • 证明思路 (右除法):
      设 $M(\lambda) = M_m \lambda^m + \dots + M_0$。
      如果 $m=0$, $M(\lambda)=M_0$, 则 $Q(\lambda)=O, R=M_0$。
      如果 $m \ge 1$。令 $Q_1(\lambda) = M_m \lambda^{m-1}$。
      $M(\lambda) - Q_1(\lambda)(\lambda E - A) = (M_m \lambda^m + \dots) - (M_m \lambda^m - M_m A \lambda^{m-1}) = (M_{m-1} + M_m A)\lambda^{m-1} + \dots$
      这是一个次数严格小于 $m$ 的矩阵多项式。重复此过程,直到余式的次数为0 (即常数矩阵) 或余式为零矩阵。
  • 推论 (矩阵余数定理): 矩阵多项式 $M(\lambda)$ 右除以 $\lambda E - A$ 的余矩阵是 $M(A) = M_m A^m + \dots + M_0$ (即把 $A$ “代入” $M(\lambda)$,但这里是右代入)。
    $M(\lambda) = Q(\lambda)(\lambda E - A) + M(A)_{right}$
    左除以 $\lambda E - A$ 的余矩阵是 $M(A)_{left}$ (左代入)。

2. 相似关系与λ-矩阵的等价

  • 定理: $n \times n$ 常数矩阵 $A$ 与 $B$ 相似 ($A \sim B$) 的充要条件是它们的特征矩阵 $\lambda E - A$ 与 $\lambda E - B$ 作为 λ-矩阵是等价的。
    即,$A \sim B \iff \lambda E - A \sim \lambda E - B$。
    • 证明:
      ($\Rightarrow$) 若 $A \sim B$,则存在可逆常数矩阵 $P$ 使得 $P^{-1}AP = B$。
      则 $P^{-1}(\lambda E - A)P = \lambda P^{-1}EP - P^{-1}AP = \lambda E - B$。
      由于 $P$ 和 $P^{-1}$ 都是常数矩阵,它们也是可逆λ-矩阵 (行列式为非零常数)。
      因此 $\lambda E - A \sim \lambda E - B$。
      ($\Leftarrow$) 若 $\lambda E - A \sim \lambda E - B$,则存在可逆λ-矩阵 $M(\lambda)$ 和 $N(\lambda)$ 使得
      $M(\lambda)(\lambda E - A)N(\lambda) = \lambda E - B$ ()
      PPT中有一段较复杂的证明,试图说明 $M(\lambda)$ 和 $N(\lambda)$ 实际上必须是常数矩阵且 $N(\lambda) = M(\lambda)^{-1}$。
      关键步骤是利用带余除法:
      $M(\lambda) = (\lambda E - B)Q_M(\lambda) + R_M$
      $N(\lambda) = Q_N(\lambda)(\lambda E - A) + R_N$ (这里应该是 $(\lambda E - B)Q_N(\lambda) + R_N$ 或 $Q_N(\lambda)(\lambda E - A)$ for $N(\lambda)^{-1}$)
      代入(
      )并比较系数。PPT 的推导过程比较难以辨认,但最终结论是 $M(\lambda)$ 和 $N(\lambda)$ 必须是常数可逆矩阵 $P$ 和 $P^{-1}$。
      更标准的证明通常依赖于不变因子或初等因子理论:$\lambda E - A \sim \lambda E - B$ 意味着它们有相同的Smith标准型,这进一步意味着它们有相同的不变因子,从而 $A$ 和 $B$ 相似。

3. λ-矩阵的Smith标准型 (Smith Normal Form)

  • 定理 (Smith标准型定理): 任何一个非零的 $m \times n$ λ-矩阵 $A(\lambda)$ 都等价于一个唯一的对角形λ-矩阵:
    $S(\lambda) = \text{diag}(d_1(\lambda), d_2(\lambda), \dots, d_r(\lambda), 0, \dots, 0)$
    $S(\lambda) = \begin{pmatrix}
    d_1(\lambda) & & & & & \\
    & d_2(\lambda) & & & & \\
    & & \ddots & & & \\
    & & & d_r(\lambda) & & \\
    & & & & 0 & \\
    & & & & & \ddots \\
    & & & & & & 0
    \end{pmatrix}$
    其中:

    1. $r = \text{rank}(A(\lambda))$ 是 $A(\lambda)$ 的秩 (秩是指其行列式不恒为零的最高阶子式的阶数)。
    2. 每个 $d_i(\lambda)$ 是首项系数为1的λ-多项式 (monic polynomial)。
    3. $d_i(\lambda)$ 整除 $d_{i+1}(\lambda)$ (即 $d_i(\lambda) | d_{i+1}(\lambda)$) 对 $i=1, 2, \dots, r-1$ 成立。
  • 这个唯一的对角形矩阵 $S(\lambda)$ 称为 $A(\lambda)$ 的 Smith标准型

  • $d_i(\lambda)$ 称为 $A(\lambda)$ 的不变因子 (invariant factors)

  • 对于特征矩阵 $\lambda E - A$ ($A$ 是 $n \times n$ 常数矩阵):
    其Smith标准型为:
    $S(\lambda) = \text{diag}(1, \dots, 1, d_1(\lambda), d_2(\lambda), \dots, d_m(\lambda))$
    其中 $d_i(\lambda)$ 是次数 $\ge 1$ 的首1多项式,且 $d_i(\lambda) | d_{i+1}(\lambda)$。
    这里,前 $n-m$ 个不变因子是1。
    最后一个不变因子 $d_m(\lambda)$ 实际上等于 $A$ 的最小多项式 $m_A(\lambda)$ (如果规范化为首1)。
    所有不变因子的乘积 $\prod d_i(\lambda)$ (包括那些为1的) 等于 $\lambda E - A$ 的行列式 (即 $A$ 的特征多项式 $f_A(\lambda)$),除了一个常数因子外。如果 $d_i(\lambda)$ 都是首1的,则 $\prod d_i(\lambda) = f_A(\lambda)$。

  • 例子:
    PPT中给出了一个例子:
    $A = \begin{pmatrix} 0 & 1 & -1 \\ 3 & -2 & 0 \\ -1 & 1 & -1 \end{pmatrix}$
    $\lambda E - A = \begin{pmatrix} \lambda & -1 & 1 \\ -3 & \lambda+2 & 0 \\ 1 & -1 & \lambda+1 \end{pmatrix}$
    通过初等变换化为 Smith 标准型:
    $\sim \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & (\lambda-1)(\lambda^2+4\lambda+2) \end{pmatrix}$
    (PPT中的结果是 $(\lambda-1)(\lambda^2+4\lambda+2)$, 可能计算有误或抄录有误,标准做法应是 $(\lambda-1)(\lambda^2+4\lambda+7)$ 或者其他形式,具体取决于 $A$。这里的多项式是 $f_A(\lambda)$)。
    不变因子是: $1, 1, (\lambda-1)(\lambda^2+4\lambda+2)$。

4. 行列式因子、不变因子与初等因子

4.1 k阶行列式因子 ($D_k(\lambda)$)

  • 定义: λ-矩阵 $A(\lambda)$ 的 $k$ 阶行列式因子 $D_k(\lambda)$ 是 $A(\lambda)$ 中所有 $k \times k$ 子式的最大公因式 (GCD),并规范化为首项系数为1。
    如果 $A(\lambda)$ 中所有 $k \times k$ 子式都为0,则 $D_k(\lambda)=0$。
    约定 $D_0(\lambda) = 1$。
  • 性质:
    • λ-矩阵初等变换不改变其各阶行列式因子 (这是一个非常重要的性质,用于证明Smith标准型的唯一性)。
    • $D_k(\lambda) | D_{k+1}(\lambda)$。

4.2 不变因子 ($d_k(\lambda)$) 与行列式因子的关系

  • 不变因子可以通过行列式因子计算得到:
    $d_1(\lambda) = D_1(\lambda)$
    $d_k(\lambda) = \frac{D_k(\lambda)}{D_{k-1}(\lambda)}$ for $k=2, \dots, r$ (其中 $r = \text{rank}(A(\lambda))$)
  • 这就是为什么 $d_k(\lambda)$ 也被称为“不变的”,因为 $D_k(\lambda)$ 在初等变换下不变。

4.3 初等因子 (Elementary Divisors)

  • 定义: 将 λ-矩阵 $A(\lambda)$ (通常指 $\lambda E - A$) 的每个次数 $\ge 1$ 的不变因子 $d_i(\lambda)$ 在复数域 (或适当的数域) 上分解为互不相同的一次不可约因式 (即 $x-\lambda_j$) 的幂的乘积:
    $d_i(\lambda) = ( \lambda - \lambda_1 )^{e_{i1}} ( \lambda - \lambda_2 )^{e_{i2}} \dots ( \lambda - \lambda_s )^{e_{is}}$
    所有这些形如 $(\lambda - \lambda_j)^{e_{ij}}$ 且 $e_{ij} > 0$ 的因式称为 $A(\lambda)$ (或对应矩阵 $A$) 的初等因子
  • 同一个 $(\lambda - \lambda_j)$ 的不同次幂若出现多次,则它们都是初等因子。
  • 性质:
    • 相似的常数矩阵有相同的初等因子集合 (因为它们有相同的不变因子)。
    • 反之,如果两个常数矩阵有相同的初等因子集合,则它们相似 (在复数域上)。
  • 不变因子与初等因子的关系:
    • $d_r(\lambda)$ (最后一个不变因子,对应最小多项式) 是所有不同根的初等因子的最高次幂的乘积。
      例如,如果初等因子是 $(\lambda-\lambda_1)^{k_1}, (\lambda-\lambda_1)^{j_1}, (\lambda-\lambda_2)^{k_2}$ (其中 $k_1 \ge j_1$),则 $d_r(\lambda)$ 包含 $(\lambda-\lambda_1)^{k_1}$ 和 $(\lambda-\lambda_2)^{k_2}$。
    • $d_{r-1}(\lambda)$ 是除去每个根的最高次幂后,剩余初等因子中每个根的最高次幂的乘积。
    • 以此类推,直到 $d_1(\lambda)$。
    • 简单来说,对每个素因子 $p(\lambda) = \lambda - \lambda_j$,将其在所有不变因子分解式中的指数 $e_{ij}$ 按非增序列排列,这些 $p(\lambda)^{e_{ij}}$ ($e_{ij}>0$) 就是初等因子。

5. Frobenius 标准型 (Rational Canonical Form / Frobenius Normal Form)

  • 友矩阵 (Companion Matrix): 对于首1多项式 $p(\lambda) = \lambda^r + a_{r-1}\lambda^{r-1} + \dots + a_1\lambda + a_0$,其友矩阵定义为:
    $F_p = \begin{pmatrix}
    0 & 0 & \dots & 0 & -a_0 \\
    1 & 0 & \dots & 0 & -a_1 \\
    0 & 1 & \dots & 0 & -a_2 \\
    \vdots & \vdots & \ddots & \vdots & \vdots \\
    0 & 0 & \dots & 1 & -a_{r-1}
    \end{pmatrix}_{r \times r}$
    (友矩阵有几种形式,这是常见的一种。另一种是将负系数放在第一行)。
  • 性质: 友矩阵 $F_p$ 的特征多项式和最小多项式都是 $p(\lambda)$。其不变因子是 $1, \dots, 1, p(\lambda)$。

  • Frobenius 标准型定理: 任何一个 $n \times n$ 复 (或实) 矩阵 $A$ 都相似于一个分块对角矩阵 $F = \text{diag}(F_1, F_2, \dots, F_k)$,其中每个 $F_i$ 是对应于 $A$ 的一个非常数不变因子 $d_i(\lambda)$ (即次数 $\ge 1$ 的那些) 的友矩阵。
    $F = \begin{pmatrix} F_{d_1(\lambda)} & & \\ & F_{d_2(\lambda)} & \\ & & \ddots \\ & & & F_{d_k(\lambda)} \end{pmatrix}$
    其中 $d_1(\lambda) | d_2(\lambda) | \dots | d_k(\lambda)$ 是 $\lambda E - A$ 的非常数首1不变因子。
    这个 $F$ 称为 $A$ 的 Frobenius 标准型 (或有理标准型,因为它可以在定义矩阵的域 $F$ 上实现,不需要扩域)。

  • Frobenius 标准型在不计块的排列顺序下是唯一的。
  • $A$ 的最小多项式是 $d_k(\lambda)$ (最后一个最大的不变因子)。
  • $A$ 的特征多项式是 $\prod_{i=1}^k d_i(\lambda)$。

  • 例子:
    如果 $A$ 的不变因子是 $1, 1, \lambda-1, (\lambda-1)^2, (\lambda-1)^2(\lambda+1)$。
    非常数不变因子是 $d_1(\lambda) = \lambda-1$, $d_2(\lambda) = (\lambda-1)^2 = \lambda^2-2\lambda+1$, $d_3(\lambda) = (\lambda-1)^2(\lambda+1) = (\lambda^2-2\lambda+1)(\lambda+1) = \lambda^3 - \lambda^2 - \lambda + 1$。
    Frobenius 标准型为:
    $F = \text{diag} \left(
    \begin{pmatrix} 1 \end{pmatrix},
    \begin{pmatrix} 0 & -1 \\ 1 & 2 \end{pmatrix},
    \begin{pmatrix} 0 & 0 & -1 \\ 1 & 0 & 1 \\ 0 & 1 & 1 \end{pmatrix}
    \right)$
    (这里友矩阵的系数是对应多项式中除去最高次项后各项系数的相反数)。

6. Jordan 标准型 (Jordan Canonical Form / Jordan Normal Form)

6.1 从不变因子到初等因子 (回顾)

如前所述,将每个不变因子 $d_i(\lambda)$ 分解成素多项式 (在复数域上是 $\lambda - \lambda_j$) 的幂。这些幂就是初等因子。

6.2 Jordan 块

  • 对应于初等因子 $(\lambda - \lambda_0)^r$ 的 Jordan 块是一个 $r \times r$ 矩阵:
    $J_r(\lambda_0) = \begin{pmatrix}
    \lambda_0 & 1 & & & \\
    & \lambda_0 & 1 & & \\
    & & \ddots & \ddots & \\
    & & & \lambda_0 & 1 \\
    & & & & \lambda_0
    \end{pmatrix}$
  • Jordan 块 $J_r(\lambda_0)$ 的唯一初等因子是 $(\lambda - \lambda_0)^r$。其不变因子也是 $1, \dots, 1, (\lambda-\lambda_0)^r$。

6.3 Jordan 标准型定理

  • 任何一个 $n \times n$ 复矩阵 $A$ (或定义在代数闭域上的矩阵) 都相似于一个分块对角矩阵 $J$,称为 $A$ 的 Jordan 标准型:
    $J = \text{diag}(J_1, J_2, \dots, J_s)$
    其中每个 $J_k$ 是一个 Jordan 块,对应于 $A$ 的一个初等因子。
    具体地,如果 $A$ 的初等因子集合是 $\{ (\lambda-\lambda_1)^{r_1}, (\lambda-\lambda_2)^{r_2}, \dots, (\lambda-\lambda_s)^{r_s} \}$ (这里 $\lambda_i$ 可能相同),则 Jordan 标准型由 Jordan 块 $J_{r_1}(\lambda_1), J_{r_2}(\lambda_2), \dots, J_{r_s}(\lambda_s)$ 组成。
  • Jordan 标准型在不计 Jordan 块排列顺序的情况下是唯一的。
  • $A$ 的特征多项式是所有初等因子的乘积。
  • $A$ 的最小多项式是每个不同根 $(\lambda-\lambda_j)$ 对应的最高次幂初等因子的乘积。

6.4 从 Smith 标准型/不变因子直接得到 Jordan 标准型

如果 $\lambda E - A$ 的 Smith 标准型是 $\text{diag}(1, \dots, 1, d_1(\lambda), \dots, d_m(\lambda))$。
对每个非常数不变因子 $d_i(\lambda)$,将其分解为 $d_i(\lambda) = \prod_j (\lambda - \lambda_{ij})^{e_{ij}}$。
则 $A$ 的 Jordan 标准型由对应于每个 $(\lambda - \lambda_{ij})^{e_{ij}}$ 的 Jordan 块 $J_{e_{ij}}(\lambda_{ij})$ 构成。
(这种说法不完全准确,更准确的是通过所有初等因子来构造)。
正确做法是:

  1. 求出 $\lambda E - A$ 的所有初等因子。
  2. 对每个初等因子 $(\lambda - \lambda_0)^k$,Jordan 标准型中就有一个 $k \times k$ 的 Jordan 块 $J_k(\lambda_0)$。

6.5 例子

如果 $A$ 的初等因子是 $(\lambda-1)^2, (\lambda-1)^2, \lambda+2, (\lambda-1)$。
(这里特征值 1 对应几何重数为3,代数重数为 $2+2+1=5$;特征值 -2 对应几何重数和代数重数都为1)。
Jordan 标准型是 (不计顺序):
$J = \text{diag}( J_2(1), J_2(1), J_1(-2), J_1(1) )$
$J = \text{diag} \left(
\begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix},
\begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix},
\begin{pmatrix} -2 \end{pmatrix},
\begin{pmatrix} 1 \end{pmatrix}
\right)$

6.6 寻找相似变换矩阵 P ($P^{-1}AP=J$)

PPT中提到了如何通过解方程组 $(A-\lambda_i E)x = 0$ (找特征向量) 和 $(A-\lambda_i E)x = y$ (找广义特征向量,形成Jordan链) 来构造矩阵 $P$。
对于每个 Jordan 块 $J_k(\lambda_0)$,对应 $P$ 中的 $k$ 列向量 $v_1, \dots, v_k$ (Jordan 链),满足:
$(A-\lambda_0 E)v_1 = 0$
$(A-\lambda_0 E)v_2 = v_1$

$(A-\lambda_0 E)v_k = v_{k-1}$
然后 $P = (v_1, v_2, \dots, v_k, \dots)$。

总结与关系

  • λ-矩阵的初等变换 是核心工具。
  • Smith标准型 给出了λ-矩阵在等价关系下的最简形式,其对角线元素是不变因子
  • 行列式因子 用于计算不变因子。
  • 不变因子 分解得到初等因子
  • 对于常数矩阵 $A$,其特征矩阵 $\lambda E - A$ 的
    • 不变因子 决定了 $A$ 的 Frobenius 标准型
    • 初等因子 决定了 $A$ 的 Jordan 标准型 (在代数闭域上)。
  • Frobenius 标准型在原域上总存在,Jordan 标准型需要域是代数闭的 (例如复数域)。
作者

Jiamin Liu

发布于

2025-06-25

更新于

2025-06-25

许可协议

评论