Chapter4_MATH1408

映射与线性映射

1. 映射 (Mapping / Function) 的基本概念

1.1 定义

  • 设 $A$ 和 $B$ 是两个非空集合。如果存在一个法则(或对应关系) $\phi$,使得对于集合 $A$ 中的每一个元素 $a$,在集合 $B$ 中都有唯一确定的元素 $b$ 与之对应,那么称 $\phi$ 是从集合 $A$ 到集合 $B$ 的一个映射 (mapping) 或函数 (function)。
  • 记作 $\phi: A \to B$。
  • 元素 $a \in A$ 称为原像 (preimage)。
  • 元素 $b \in B$ 称为 $a$ 在映射 $\phi$ 下的 (image),记作 $b = \phi(a)$。
  • 集合 $A$ 称为映射 $\phi$ 的定义域 (domain)。
  • 集合 $B$ 称为映射 $\phi$ 的陪域 (codomain)。
  • 所有像的集合,即 $\{\phi(a) | a \in A\}$,称为映射 $\phi$ 的值域 (range 或 image of $\phi$),记作 $\text{Im}(\phi)$ 或 $\phi(A)$。显然,$\text{Im}(\phi) \subseteq B$。
  • 对于 $b \in B$,集合 $\{a \in A | \phi(a) = b\}$ 称为 $b$ 的原像集 (preimage set of $b$),记作 $\phi^{-1}(b)$。

注意:

  • 定义域中的每个元素都必须有像。
  • 定义域中的每个元素的像是唯一的。
  • 陪域中的元素不一定都有原像,一个元素也可能有多个原像(除非是单射或双射)。

1.2 映射的相等

两个映射 $\phi: A \to B$ 和 $\psi: A \to B$ 相等,当且仅当它们的定义域相同,陪域相同,并且对于任意 $a \in A$,都有 $\phi(a) = \psi(a)$。

1.3 映射的复合 (Composition of Mappings)

  • 设有两个映射 $\phi_1: A \to B$ 和 $\phi_2: B \to C$。
  • 可以定义一个新的映射,称为 $\phi_2$ 与 $\phi_1$ 的复合映射,记作 $\phi_2 \circ \phi_1$ (有时也记作 $\phi_2\phi_1$),它是一个从 $A$ 到 $C$ 的映射:
    $\phi_2 \circ \phi_1: A \to C$
    $(\phi_2 \circ \phi_1)(a) = \phi_2(\phi_1(a))$, 对于所有 $a \in A$。
  • 注意运算顺序: 先作用 $\phi_1$,再作用 $\phi_2$。

  • 映射复合的结合律:
    定理: 设 $\phi_1: A \to B$, $\phi_2: B \to C$, $\phi_3: C \to D$ 是三个映射。则
    $\phi_3 \circ (\phi_2 \circ \phi_1) = (\phi_3 \circ \phi_2) \circ \phi_1$。

    • 证明:
      两个映射相等需要验证它们的定义域、陪域相同,且对定义域中任意元素的作用结果相同。
      左边映射 $\phi_3 \circ (\phi_2 \circ \phi_1)$ 的定义域是 $A$,陪域是 $D$。
      右边映射 $(\phi_3 \circ \phi_2) \circ \phi_1$ 的定义域是 $A$,陪域是 $D$。
      对于任意 $a \in A$:
      $(\phi_3 \circ (\phi_2 \circ \phi_1))(a) = \phi_3((\phi_2 \circ \phi_1)(a)) = \phi_3(\phi_2(\phi_1(a)))$.
      $((\phi_3 \circ \phi_2) \circ \phi_1)(a) = (\phi_3 \circ \phi_2)(\phi_1(a)) = \phi_3(\phi_2(\phi_1(a)))$.
      由于对于任意 $a \in A$,两边作用结果相同,故映射的复合满足结合律。

1.4 恒等映射 (Identity Mapping)

  • 对于任意集合 $A$,定义恒等映射 $\text{id}_A: A \to A$ (或 $1_A$) 为:
    $\text{id}_A(a) = a$, 对于所有 $a \in A$。
  • 性质: 对于任意映射 $\phi: A \to B$:
    $\phi \circ \text{id}_A = \phi$
    $\text{id}_B \circ \phi = \phi$
    恒等映射在映射复合运算中充当单位元的作用。

1.5 逆映射 (Inverse Mapping)

  • 设 $\phi: A \to B$ 是一个映射。

    • 如果存在一个映射 $\psi: B \to A$ 使得 $\psi \circ \phi = \text{id}_A$,则称 $\psi$ 是 $\phi$ 的一个左逆映射,$\phi$ 是 $\psi$ 的一个右逆映射
    • 如果存在一个映射 $\psi: B \to A$ 使得 $\psi \circ \phi = \text{id}_A$ 并且 $\phi \circ \psi = \text{id}_B$,则称 $\psi$ 是 $\phi$ 的逆映射,记作 $\psi = \phi^{-1}$。此时也称映射 $\phi$ 是可逆的 (invertible) 或双射 (bijective)。
  • 定理 (逆映射的唯一性): 如果映射 $\phi: A \to B$ 存在左逆 $\psi_1$ 和右逆 $\psi_2$,则 $\psi_1 = \psi_2$,并且这个共同的映射是 $\phi$ 的唯一的逆映射。

    • 证明:
      假设 $\psi_1 \circ \phi = \text{id}_A$ 且 $\phi \circ \psi_2 = \text{id}_B$.
      考虑 $\psi_1 = \psi_1 \circ \text{id}_B = \psi_1 \circ (\phi \circ \psi_2)$.
      根据映射复合的结合律: $\psi_1 \circ (\phi \circ \psi_2) = (\psi_1 \circ \phi) \circ \psi_2 = \text{id}_A \circ \psi_2 = \psi_2$.
      所以 $\psi_1 = \psi_2$.
      因此,如果一个映射同时有左逆和右逆,那么它们必然相等,且这个映射就是唯一的逆映射。
  • 推论: 如果映射 $\phi$ 可逆,则其逆映射 $\phi^{-1}$ 唯一。

  • 性质:
    • 如果 $\phi$ 可逆,则 $\phi^{-1}$ 也可逆,且 $(\phi^{-1})^{-1} = \phi$。
    • 如果 $\phi: A \to B$ 和 $\psi: B \to C$ 都是可逆映射,则复合映射 $\psi \circ \phi: A \to C$ 也可逆,且 $(\psi \circ \phi)^{-1} = \phi^{-1} \circ \psi^{-1}$ (注意顺序)。
      • 证明: 验证 $(\phi^{-1} \circ \psi^{-1}) \circ (\psi \circ \phi) = \text{id}_A$ 和 $(\psi \circ \phi) \circ (\phi^{-1} \circ \psi^{-1}) = \text{id}_C$。
        $(\phi^{-1} \circ \psi^{-1}) \circ (\psi \circ \phi) = \phi^{-1} \circ (\psi^{-1} \circ \psi) \circ \phi = \phi^{-1} \circ \text{id}_B \circ \phi = \phi^{-1} \circ \phi = \text{id}_A$.
        $(\psi \circ \phi) \circ (\phi^{-1} \circ \psi^{-1}) = \psi \circ (\phi \circ \phi^{-1}) \circ \psi^{-1} = \psi \circ \text{id}_B \circ \psi^{-1} = \psi \circ \psi^{-1} = \text{id}_C$.

1.6 单射、满射、双射

  • 单射 (Injective / One-to-one):
    映射 $\phi: A \to B$ 称为单射,如果对于任意 $a_1, a_2 \in A$,当 $a_1 \neq a_2$ 时,有 $\phi(a_1) \neq \phi(a_2)$。
    等价地,如果 $\phi(a_1) = \phi(a_2)$ 蕴涵 $a_1 = a_2$。
    (不同的原像有不同的像)。
  • 满射 (Surjective / Onto):
    映射 $\phi: A \to B$ 称为满射,如果对于任意 $b \in B$,都存在至少一个 $a \in A$ 使得 $\phi(a) = b$。
    等价地,值域 $\text{Im}(\phi) = B$ (陪域中的每个元素都是至少一个原像的像)。
  • 双射 (Bijective / One-to-one correspondence):
    映射 $\phi: A \to B$ 称为双射,如果它既是单射又是满射。

  • 定理 (映射类型与逆映射的关系):
    设 $\phi: A \to B$ 是一个映射。
    (i) $\phi$ 是单射 $\iff$ $\phi$ 存在左逆映射。
    (ii) $\phi$ 是满射 $\iff$ $\phi$ 存在右逆映射。
    (iii) $\phi$ 是双射 $\iff$ $\phi$ 存在逆映射 (即同时存在左逆和右逆,且它们相等)。

    • 证明 (i):
      ($\Rightarrow$) 假设 $\phi$ 是单射。定义 $\psi: B \to A$ 如下:
      对于 $b \in \text{Im}(\phi)$, 由于 $\phi$ 是单射,存在唯一的 $a \in A$ 使得 $\phi(a)=b$。令 $\psi(b) = a$。
      对于 $b \in B \setminus \text{Im}(\phi)$ (如果 $B \setminus \text{Im}(\phi)$ 非空),任选一个固定的 $a_0 \in A$ (假设 $A$ 非空),令 $\psi(b) = a_0$。
      则对于任意 $a \in A$, $\psi(\phi(a)) = a$。所以 $\psi \circ \phi = \text{id}_A$。$\psi$ 是 $\phi$ 的左逆。
      ($\Leftarrow$) 假设存在左逆 $\psi: B \to A$ 使得 $\psi \circ \phi = \text{id}_A$。
      如果 $\phi(a_1) = \phi(a_2)$,则 $\psi(\phi(a_1)) = \psi(\phi(a_2))$。
      即 $(\psi \circ \phi)(a_1) = (\psi \circ \phi)(a_2)$。
      即 $\text{id}_A(a_1) = \text{id}_A(a_2)$,所以 $a_1 = a_2$。因此 $\phi$ 是单射。
    • 证明 (ii):
      ($\Rightarrow$) 假设 $\phi$ 是满射。对于任意 $b \in B$,由于 $\phi$ 是满射,原像集 $\phi^{-1}(b) = \{a \in A | \phi(a)=b\}$ 非空。
      对于每个 $b \in B$,根据选择公理 (Axiom of Choice),我们可以从 $\phi^{-1}(b)$ 中选择一个元素,记为 $a_b$。
      定义 $\psi: B \to A$ 为 $\psi(b) = a_b$。
      则对于任意 $b \in B$, $\phi(\psi(b)) = \phi(a_b) = b$。所以 $\phi \circ \psi = \text{id}_B$。$\psi$ 是 $\phi$ 的右逆。
      ($\Leftarrow$) 假设存在右逆 $\psi: B \to A$ 使得 $\phi \circ \psi = \text{id}_B$。
      对于任意 $b \in B$,令 $a = \psi(b) \in A$。则 $\phi(a) = \phi(\psi(b)) = (\phi \circ \psi)(b) = \text{id}_B(b) = b$。
      这意味着对于任意 $b \in B$,都存在 $a \in A$ (即 $\psi(b)$) 使得 $\phi(a)=b$。因此 $\phi$ 是满射。
    • 证明 (iii):
      $\phi$ 是双射 $\iff$ $\phi$ 既是单射又是满射。
      根据 (i) 和 (ii),这等价于 $\phi$ 既存在左逆又存在右逆。
      根据逆映射唯一性定理,这意味着 $\phi$ 存在唯一的逆映射 $\phi^{-1}$。

1.7 集合的基数 (Cardinality) 与 Schröder-Bernstein 定理

  • 如果集合 $A$ 和 $B$ 之间存在一个单射 $\phi: A \to B$,则称 $A$ 的基数不大于 $B$ 的基数,记作 $|A| \le |B|$ (或 $A \preceq B$,$A$ 的势小于等于 $B$ 的势)。
  • 如果集合 $A$ 和 $B$ 之间存在一个双射 $\phi: A \to B$,则称 $A$ 和 $B$ 等势 (equipollent 或 equinumerous) 或具有相同的基数,记作 $|A| = |B|$ (或 $A \sim B$)。
  • 如果 $|A| \le |B|$ 且 $|A| \neq |B|$,则称 $|A| < |B|$。
  • Schröder-Bernstein 定理: 如果 $|A| \le |B|$ 且 $|B| \le |A|$,则 $|A| = |B|$。
    即,如果存在单射 $\phi: A \to B$ 和单射 $\psi: B \to A$,则存在双射 $\chi: A \to B$。
    • 证明概要 (一种经典构造思路):
      考虑元素在两个映射下的“祖先链”。
      对于 $a \in A$, 其祖先链形如 $a, \psi^{-1}(a), \phi^{-1}(\psi^{-1}(a)), \dots$ (如果这些逆像存在且唯一,因为 $\phi, \psi$ 是单射,所以逆像如果存在就是唯一的)。
      将 $A$ 划分成三部分 $A_A, A_B, A_\infty$:
      • $A_A$: 祖先链终止于 $A$ (即某个祖先在 $A$ 中但没有 $\psi$ 的原像)。
      • $A_B$: 祖先链终止于 $B$ (即某个祖先在 $B$ 中但没有 $\phi$ 的原像)。
      • $A_\infty$: 祖先链无限延伸或形成循环。
        类似地划分 $B$ 为 $B_A, B_B, B_\infty$。
        可以证明 $\phi$ 将 $A_A$ 双射到 $B_A$,$\phi$ 将 $A_\infty$ 双射到 $B_\infty$。
        而 $\psi$ 将 $B_B$ 双射到 $A_B$,所以 $\psi^{-1}$ (在 $A_B$ 上有定义) 将 $A_B$ 双射到 $B_B$。
        定义 $\chi: A \to B$ 为:
        $\chi(a) = \phi(a)$ 如果 $a \in A_A \cup A_\infty$
        $\chi(a) = \psi^{-1}(a)$ 如果 $a \in A_B$
        可以证明 $\chi$ 是一个双射。

1.8 集合的幂集与 Cantor 定理

  • 从集合 $A$ 到集合 $B$ 的所有映射构成的集合记作 $B^A$ 或 $\text{Map}(A,B)$。
  • 其基数关系为 $|B^A| = |B|^{|A|}$ (对于有限集成立,并推广到无限集)。
  • 一个集合 $A$ 的所有子集构成的集合称为 $A$ 的幂集 (power set),记作 $\mathcal{P}(A)$ 或 $2^A$。
  • 幂集 $\mathcal{P}(A)$ 与从 $A$ 到 $\{0,1\}$ 的所有映射的集合 $ \{0,1\}^A $ 是等势的。
    一个子集 $S \subseteq A$ 对应一个特征函数 $\chi_S: A \to \{0,1\}$,其中 $\chi_S(a)=1$ if $a \in S$, $\chi_S(a)=0$ if $a \notin S$。
    因此 $|\mathcal{P}(A)| = 2^{|A|}$。
  • Cantor 定理: 对于任何集合 $A$, $|A| < |\mathcal{P}(A)|$ (即 $|A| < 2^{|A|}$)。
    这意味着没有从集合到其幂集的满射。

    • 证明 (反证法):
      假设存在一个满射 $f: A \to \mathcal{P}(A)$。
      考虑集合 $S = \{a \in A | a \notin f(a) \}$。
      由于 $f$ 是满射,且 $S \subseteq A$ (即 $S \in \mathcal{P}(A)$),所以必定存在某个 $x \in A$ 使得 $f(x) = S$。
      现在问:$x \in S$ 吗?
      • 如果 $x \in S$,根据 $S$ 的定义,$x \notin f(x)$。但 $f(x)=S$,所以 $x \notin S$。矛盾。
      • 如果 $x \notin S$,根据 $S$ 的定义,$x \in f(x)$。但 $f(x)=S$,所以 $x \in S$。矛盾。
        无论哪种情况都导致矛盾。因此,不存在这样的满射 $f$。
        同时,存在一个单射 $g: A \to \mathcal{P}(A)$,例如 $g(a) = \{a\}$。所以 $|A| \le |\mathcal{P}(A)|$。
        结合不存在满射,得出 $|A| < |\mathcal{P}(A)|$。
  • 基数:

    • 自然数集 $\mathbb{N}$ 的基数记为 $\aleph_0$ (阿列夫零),称其为可数无限。
    • 实数集 $\mathbb{R}$ 的基数记为 $\mathfrak{c}$ (连续统的势)。可以证明 $\mathfrak{c} = 2^{\aleph_0}$。
    • $\aleph_1$ 是第一个不可数基数。连续统假设 (CH) 断言 $\aleph_1 = 2^{\aleph_0}$ (即 $\mathfrak{c} = \aleph_1$)。CH独立于ZFC公理系统。

1.9 映射的限制 (Restriction)

  • 设 $\phi: A \to B$ 是一个映射,$A_1 \subseteq A$ 是 $A$ 的一个子集。
  • $\phi$ 在 $A_1$ 上的限制是一个新的映射 $\phi|_{A_1}: A_1 \to B$,定义为:
    $(\phi|_{A_1})(a) = \phi(a)$ 对于所有 $a \in A_1$。
    (定义域缩小,对应法则不变)。

2. 线性映射 (Linear Transformation / Linear Map)

2.1 定义 (背景:向量空间)

  • 设 $V$ 和 $V_1$ 是定义在同一数域 $F$ 上的两个向量空间。
  • 一个映射 $A: V \to V_1$ (PPT中用 $A$ 表示线性映射,通常也用 $T, L$ 等) 称为从 $V$ 到 $V_1$ 的一个线性映射,如果它满足以下两个条件:
    1. 可加性: 对于任意 $\alpha, \beta \in V$,有 $A(\alpha + \beta) = A(\alpha) + A(\beta)$。
    2. 齐次性: 对于任意 $\alpha \in V$ 和任意标量 $k \in F$,有 $A(k\alpha) = k A(\alpha)$。
  • 这两个条件可以合并为一个:
    对于任意 $\alpha, \beta \in V$ 和任意标量 $k \in F$ (或任意标量 $k, l \in F$),有
    $A(k\alpha + \beta) = k A(\alpha) + A(\beta)$ (PPT中的形式)
    或更一般地 $A(k\alpha + l\beta) = k A(\alpha) + l A(\beta)$。
  • 如果 $V = V_1$,则线性映射 $A: V \to V$ 称为 $V$ 上的一个线性变换 (linear operator)。

2.2 线性映射的例子

  • 数乘变换: 设 $V$ 是数域 $F$ 上的向量空间,$c \in F$ 是一个固定的标量。定义 $A: V \to V$ 为 $A(\alpha) = c\alpha$ 对于所有 $\alpha \in V$。
    • 如果 $c=1$,则 $A(\alpha) = \alpha$,这是恒等变换 (identity operator),记作 $\text{Id}_V$ 或 $I$ 或 $1_V$。
    • 如果 $c=0$,则 $A(\alpha) = \mathbf{0}_V$ (零向量),这是零变换 (zero operator),记作 $O$。
  • 矩阵乘法: 设 $A$ 是一个 $m \times n$ 的实数 (或复数) 矩阵。它可以定义一个从 $F^n$ 到 $F^m$ (其中 $F=\mathbb{R}$ 或 $\mathbb{C}$) 的线性映射 $T_A: F^n \to F^m$ 为 $T_A(\mathbf{x}) = A\mathbf{x}$ (矩阵向量乘积)。
    • $A(\mathbf{x}+\mathbf{y}) = A(\mathbf{x}+\mathbf{y}) = A\mathbf{x} + A\mathbf{y}$
    • $A(k\mathbf{x}) = A(k\mathbf{x}) = k(A\mathbf{x})$
  • 微分算子: 设 $V = C^1[a,b]$ (区间 $[a,b]$ 上所有一阶连续可导函数的集合,构成一个向量空间)。定义 $D: V \to C[a,b]$ (连续函数空间) 为 $D(f(x)) = f’(x)$ (求导)。
    • $D(f+g) = (f+g)’ = f’ + g’ = D(f) + D(g)$
    • $D(kf) = (kf)’ = kf’ = kD(f)$
  • 积分算子: 设 $V = C[a,b]$。定义 $I: V \to \mathbb{R}$ (或到某个函数空间,如 $I(f)(x) = \int_a^x f(t)dt$) 为 $I(f) = \int_a^b f(x)dx$ (定积分,这是一个线性泛函)。
    如果 $I(f)(x) = \int_a^x f(t)dt$,则 $I: C[a,b] \to C^1[a,b]$ 是一个线性映射。
  • 投影变换: 设 $V = U \oplus W$ (向量空间 $V$ 是其子空间 $U$ 和 $W$ 的直和)。则任意 $\alpha \in V$ 可以唯一分解为 $\alpha = \alpha_U + \alpha_W$,其中 $\alpha_U \in U, \alpha_W \in W$。
    定义 $P_U: V \to V$ (或 $V \to U$) 为 $P_U(\alpha) = \alpha_U$。这称为沿 $W$ 到 $U$ 的投影。它是线性的。
  • 商映射 (自然映射): 设 $W$ 是向量空间 $V$ 的一个子空间。$V/W = \{\alpha + W | \alpha \in V\}$ 是商空间。
    定义自然映射 (或典范映射) $\pi: V \to V/W$ 为 $\pi(\alpha) = \alpha + W$。
    $\pi(k\alpha + \beta) = (k\alpha + \beta) + W = (k\alpha+W) + (\beta+W)$ (需要定义商空间的运算)
    商空间中的运算定义为:$(\alpha+W) + (\beta+W) = (\alpha+\beta)+W$ 和 $k(\alpha+W) = (k\alpha)+W$。
    则 $\pi(k\alpha + \beta) = (k\alpha+\beta)+W = k(\alpha+W) + (\beta+W) = k\pi(\alpha) + \pi(\beta)$。
    所以 $\pi$ 是一个线性映射。

2.3 线性映射的基本性质

设 $A: V \to V_1$ 是一个线性映射。

  1. $A(\mathbf{0}_V) = \mathbf{0}_{V_1}$ (零向量映到零向量)。
    • 证明: $A(\mathbf{0}_V) = A(\mathbf{0}_V + \mathbf{0}_V) = A(\mathbf{0}_V) + A(\mathbf{0}_V)$。两边减去 $A(\mathbf{0}_V)$ 得 $A(\mathbf{0}_V) = \mathbf{0}_{V_1}$。
      或者 $A(\mathbf{0}_V) = A(0 \cdot \alpha) = 0 \cdot A(\alpha) = \mathbf{0}_{V_1}$。
  2. $A(-\alpha) = -A(\alpha)$。
    • 证明: $A(-\alpha) = A((-1)\alpha) = (-1)A(\alpha) = -A(\alpha)$。
  3. 线性组合的保持性: 对于任意 $\alpha_1, \dots, \alpha_m \in V$ 和标量 $k_1, \dots, k_m \in F$:
    $A(k_1\alpha_1 + k_2\alpha_2 + \dots + k_m\alpha_m) = k_1A(\alpha_1) + k_2A(\alpha_2) + \dots + k_mA(\alpha_m)$。
    (可以通过数学归纳法证明)。
    这意味着线性映射保持向量之间的线性关系。
    线性相关的向量组的像仍然是线性相关的(或为零向量)。
    线性无关的向量组的像不一定是线性无关的(可能映为零或线性相关)。

2.4 由基的像确定线性映射

  • 定理: 设 $V$ 和 $V_1$ 是数域 $F$ 上的向量空间。设 $\{\alpha_1, \dots, \alpha_n\}$ 是 $V$ 的一组基。设 $\beta_1, \dots, \beta_n$ 是 $V_1$ 中任意 $n$ 个向量。
    存在唯一的线性映射 $A: V \to V_1$ 使得 $A(\alpha_i) = \beta_i$ 对于 $i=1, \dots, n$。
    • 证明:
      存在性: 对于任意 $\alpha \in V$,由于 $\{\alpha_i\}$ 是基,$\alpha$ 可以唯一表示为 $\alpha = x_1\alpha_1 + \dots + x_n\alpha_n$,其中 $x_i \in F$。
      定义映射 $A: V \to V_1$ 为 $A(\alpha) = x_1\beta_1 + \dots + x_n\beta_n$。
      验证 $A$ 是线性的:
      设 $\alpha = \sum x_i \alpha_i$ 和 $\gamma = \sum y_i \alpha_i$。
      $A(\alpha + \gamma) = A(\sum (x_i+y_i)\alpha_i) = \sum (x_i+y_i)\beta_i = \sum x_i\beta_i + \sum y_i\beta_i = A(\alpha) + A(\gamma)$。
      $A(k\alpha) = A(\sum (kx_i)\alpha_i) = \sum (kx_i)\beta_i = k \sum x_i\beta_i = k A(\alpha)$。
      且 $A(\alpha_i) = A(0\alpha_1 + \dots + 1\alpha_i + \dots + 0\alpha_n) = 1\beta_i = \beta_i$。
      所以这样的线性映射存在。
      唯一性: 假设存在另一个线性映射 $B: V \to V_1$ 使得 $B(\alpha_i)=\beta_i$。
      对于任意 $\alpha = \sum x_i \alpha_i \in V$:
      $B(\alpha) = B(\sum x_i \alpha_i) = \sum x_i B(\alpha_i)$ (因为 $B$ 线性)
      $= \sum x_i \beta_i = A(\alpha)$。
      由于对任意 $\alpha \in V$,$B(\alpha)=A(\alpha)$,所以 $B=A$。
    • 结论: 一个线性映射完全由它在一组基上的作用所确定。

2.5 线性映射的同构 (Isomorphism)

  • 如果线性映射 $A: V \to V_1$ 是一个双射 (即既单射又满射),则称 $A$ 是一个线性同构 (linear isomorphism),并称向量空间 $V$ 与 $V_1$ 线性同构 (linearly isomorphic),记作 $V \cong V_1$。
  • 定理: 设 $V$ 是 $n$ 维向量空间,$\{\alpha_1, \dots, \alpha_n\}$ 是 $V$ 的一组基。则线性映射 $A: V \to V_1$ 是线性同构的充要条件是像集 $\{A(\alpha_1), \dots, A(\alpha_n)\}$ 是 $V_1$ 的一组基。
    • 证明:
      ($\Rightarrow$) 假设 $A$ 是同构。
      首先证明 $\{A(\alpha_i)\}$ 线性无关:若 $\sum k_i A(\alpha_i) = \mathbf{0}_{V_1}$,则 $A(\sum k_i \alpha_i) = \mathbf{0}_{V_1}$。因为 $A$ 是单射 (同构必单射),所以 $A(\mathbf{0}_V) = \mathbf{0}_{V_1}$,故 $\sum k_i \alpha_i = \mathbf{0}_V$。由于 $\{\alpha_i\}$ 线性无关,所以所有 $k_i=0$。因此 $\{A(\alpha_i)\}$ 线性无关。
      其次证明 $\{A(\alpha_i)\}$ 生成 $V_1$:对于任意 $\beta \in V_1$,因为 $A$ 是满射 (同构必满射),存在 $\alpha \in V$ 使得 $A(\alpha)=\beta$。设 $\alpha = \sum x_i \alpha_i$。则 $\beta = A(\alpha) = A(\sum x_i \alpha_i) = \sum x_i A(\alpha_i)$。所以 $\{A(\alpha_i)\}$ 生成 $V_1$。
      因此 $\{A(\alpha_i)\}$ 是 $V_1$ 的基。这也意味着 $\dim V_1 = n = \dim V$。
      ($\Leftarrow$) 假设 $\{A(\alpha_i)\}$ 是 $V_1$ 的一组基。这意味着 $\dim V_1 = n = \dim V$。
      证明 $A$ 是满射:对于任意 $\beta \in V_1$,由于 $\{A(\alpha_i)\}$ 是 $V_1$ 的基,$\beta = \sum y_i A(\alpha_i) = A(\sum y_i \alpha_i)$。令 $\alpha = \sum y_i \alpha_i \in V$,则 $A(\alpha)=\beta$。所以 $A$ 是满射。
      证明 $A$ 是单射:设 $A(\alpha) = \mathbf{0}_{V_1}$。设 $\alpha = \sum x_i \alpha_i$。则 $A(\alpha) = \sum x_i A(\alpha_i) = \mathbf{0}_{V_1}$。由于 $\{A(\alpha_i)\}$ 线性无关,所以所有 $x_i=0$。因此 $\alpha = \mathbf{0}_V$。所以 $A$ 是单射 (核为零)。
      因此 $A$ 是线性同构。
  • 推论: 有限维向量空间 $V$ 上的线性变换 $A: V \to V$ 是同构的 $\iff A$ 是单射 $\iff A$ 是满射。 (这将在后续的秩-零度定理中体现)。
  • 重要结论: 任何 $n$ 维数域 $F$ 上的向量空间都与 $F^n$ 线性同构。
    (选择一组基 $\{\alpha_i\}$,映射 $\alpha = \sum x_i \alpha_i \mapsto (x_1, \dots, x_n)^T$ 就是一个线性同构)。

2.6 线性映射的空间 $\text{Hom}(V, V_1)$

  • 设 $V, V_1$ 是数域 $F$ 上的向量空间。所有从 $V$ 到 $V_1$ 的线性映射的集合记作 $\text{Hom}_F(V, V_1)$ 或 $L(V, V_1)$。
  • 可以对 $\text{Hom}(V, V_1)$ 中的元素 (即线性映射) 定义加法和标量乘法:
    • 加法: $(A+B)(\alpha) = A(\alpha) + B(\alpha)$,对于所有 $\alpha \in V$。 ($A, B \in \text{Hom}(V,V_1)$)
    • 标量乘法: $(kA)(\alpha) = k(A(\alpha))$,对于所有 $\alpha \in V$。 ($k \in F, A \in \text{Hom}(V,V_1)$)
  • 定理: 在上述运算下,$\text{Hom}(V, V_1)$ 构成数域 $F$ 上的一个向量空间。
    • 证明: 需要验证向量空间的八条公理。例如,零元素是零映射 $O(\alpha)=\mathbf{0}_{V_1}$。$A$ 的负元素是 $(-1)A$。
  • 如果 $\dim V = n, \dim V_1 = m$,则 $\dim \text{Hom}(V, V_1) = mn$。
    (可以通过将线性映射表示为 $m \times n$ 矩阵来理解)。
  • 特别地,$\text{Hom}(V,V)$ (也记作 $L(V)$ 或 $\text{End}(V)$,表示 $V$ 上的所有线性变换) 是一个向量空间。

2.7 线性变换的代数 $\text{Hom}(V,V)$ (或称算子代数)

  • 除了向量空间结构,$\text{Hom}(V,V)$ 还具有乘法运算,即映射的复合。
    如果 $A, B \in \text{Hom}(V,V)$,则 $B \circ A$ (简记 $BA$) 也是 $\text{Hom}(V,V)$ 中的一个线性变换。
    • $(BA)(k\alpha+\beta) = B(A(k\alpha+\beta)) = B(kA(\alpha)+A(\beta)) = kB(A(\alpha)) + B(A(\beta)) = k(BA)(\alpha) + (BA)(\beta)$。
  • 线性变换的复合满足结合律: $C(BA) = (CB)A$。
  • 线性变换的复合对加法满足分配律:
    $A(B+C) = AB+AC$
    $(B+C)A = BA+CA$
  • 标量乘法与复合的兼容性: $k(AB) = (kA)B = A(kB)$。
  • $\text{Hom}(V,V)$ 在加法、标量乘法和映射复合下构成一个带有单位元 (恒等变换 $I$) 的结合代数 (associative algebra over $F$)。
    (代数是一个向量空间,其上还定义了一个双线性的乘法运算)。
    具体来说,$\text{Hom}(V,V)$ 是一个 (ring),并且由于可以与数域 $F$ 中的标量相乘,它是一个 $F$-代数。
    • 数域 $F$ 上的 $n \times n$ 矩阵环 $M_n(F)$ 也是一个 $F$-代数,并且与 $n$ 维空间 $V$ 上的 $\text{Hom}(V,V)$ 同构。

2.8 投影算子 (Projection Operator)

  • 回顾: 若 $V = U \oplus W$ (直和分解),则任意 $\alpha \in V$ 可唯一表示为 $\alpha = u+w$,$u \in U, w \in W$。
    定义 $P_U: V \to V$ 为 $P_U(\alpha) = u$,称为沿 $W$ 到 $U$ 的投影算子
  • 性质:
    1. $P_U$ 是线性的。
    2. $P_U^2 = P_U$ (即 $P_U$ 是幂等的 idempotent)。
      • 证明: $P_U^2(\alpha) = P_U(P_U(\alpha)) = P_U(u) = u = P_U(\alpha)$。
    3. $\text{Im}(P_U) = U$ (投影算子的值域是投影到的子空间)。
    4. $\text{Ker}(P_U) = W$ (投影算子的核是沿其投影的子空间)。
  • 定理: 一个线性变换 $A: V \to V$ 是投影算子的充要条件是 $A^2=A$ (即 $A$ 是幂等的)。

    • 证明:
      ($\Rightarrow$) 已证。
      ($\Leftarrow$) 假设 $A^2=A$。
      令 $U = \text{Im}(A)$ 和 $W = \text{Ker}(A)$。
      我们需要证明 $V = U \oplus W$。
      1. $U+W=V$: 对于任意 $\alpha \in V$,可以写成 $\alpha = A(\alpha) + (\alpha - A(\alpha))$。
        $A(\alpha) \in \text{Im}(A) = U$。
        $A(\alpha - A(\alpha)) = A(\alpha) - A^2(\alpha) = A(\alpha) - A(\alpha) = \mathbf{0}_V$。所以 $\alpha - A(\alpha) \in \text{Ker}(A) = W$。
        因此 $V = U+W$。
      2. $U \cap W = \{\mathbf{0}_V\}$: 设 $\beta \in U \cap W$。
        因为 $\beta \in U = \text{Im}(A)$,所以存在 $\gamma \in V$ 使得 $\beta = A(\gamma)$。
        因为 $\beta \in W = \text{Ker}(A)$,所以 $A(\beta) = \mathbf{0}_V$。
        $A(\beta) = A(A(\gamma)) = A^2(\gamma) = A(\gamma) = \beta$。
        所以 $\beta = \mathbf{0}_V$。
        因此 $V = U \oplus W$。
        此时,$A$ 的作用是将 $\alpha = u+w$ 映为 $A(\alpha) = A(u) + A(w) = A(u) + \mathbf{0}_V$。
        由于 $u \in U = \text{Im}(A)$, $u=A(\gamma’)$ for some $\gamma’$. Then $A(u) = A^2(\gamma’) = A(\gamma’)=u$.
        所以 $A(\alpha)=u$。这正是沿 $W$ 到 $U$ 的投影。
  • 如果 $P_U$ 是沿 $W$ 到 $U$ 的投影,$P_W$ 是沿 $U$ 到 $W$ 的投影,则 $P_U + P_W = I$ 且 $P_U P_W = P_W P_U = O$ (零变换)。
    如果两个投影算子 $A, B$ 满足 $AB=BA=O$,则称它们是正交投影 (如果定义了内积且 $U \perp W$) 或互补投影。此时 $A+B$ 也是投影算子,投影到 $\text{Im}(A) \oplus \text{Im}(B)$。

2.9 幂零算子 (Nilpotent Operator)

  • 一个线性变换 $A: V \to V$ 称为幂零算子,如果存在正整数 $k$ 使得 $A^k = O$ (零变换)。
  • 满足 $A^k=O$ 的最小正整数 $k$ 称为 $A$ 的幂零指数

3. 线性映射的核与像 (Kernel and Image)

3.1 核 (Kernel / Null Space)

  • 设 $A: V \to V_1$ 是一个线性映射。
  • $A$ 的 (kernel),记作 $\text{Ker}(A)$ 或 $\text{ker}(A)$ (有时也用 $N(A)$ 表示 null space),定义为:
    $\text{Ker}(A) = \{\alpha \in V | A(\alpha) = \mathbf{0}_{V_1}\}$。
    (即被 $A$ 映为 $V_1$ 中零向量的所有 $V$ 中向量的集合)。
  • 定理: $\text{Ker}(A)$ 是 $V$ 的一个子空间。
    • 证明:
      1. $\mathbf{0}_V \in \text{Ker}(A)$ 因为 $A(\mathbf{0}_V) = \mathbf{0}_{V_1}$。所以 $\text{Ker}(A)$ 非空。
      2. 若 $\alpha, \beta \in \text{Ker}(A)$, 则 $A(\alpha)=\mathbf{0}_{V_1}, A(\beta)=\mathbf{0}_{V_1}$。
        $A(\alpha+\beta) = A(\alpha)+A(\beta) = \mathbf{0}_{V_1}+\mathbf{0}_{V_1} = \mathbf{0}_{V_1}$。所以 $\alpha+\beta \in \text{Ker}(A)$。
      3. 若 $\alpha \in \text{Ker}(A)$ 且 $k \in F$, 则 $A(\alpha)=\mathbf{0}_{V_1}$。
        $A(k\alpha) = kA(\alpha) = k\mathbf{0}_{V_1} = \mathbf{0}_{V_1}$。所以 $k\alpha \in \text{Ker}(A)$。
        因此 $\text{Ker}(A)$ 是 $V$ 的子空间。
  • 定理: 线性映射 $A: V \to V_1$ 是单射的充要条件是 $\text{Ker}(A) = \{\mathbf{0}_V\}$。
    • 证明:
      ($\Rightarrow$) 假设 $A$ 是单射。已知 $A(\mathbf{0}_V) = \mathbf{0}_{V_1}$。如果存在 $\alpha \in \text{Ker}(A)$ 且 $\alpha \neq \mathbf{0}_V$,则 $A(\alpha) = \mathbf{0}_{V_1} = A(\mathbf{0}_V)$。由于 $A$ 单射,必有 $\alpha = \mathbf{0}_V$,矛盾。所以 $\text{Ker}(A)$ 中只有零向量。
      ($\Leftarrow$) 假设 $\text{Ker}(A) = \{\mathbf{0}_V\}$。如果 $A(\alpha_1) = A(\alpha_2)$,则 $A(\alpha_1) - A(\alpha_2) = \mathbf{0}_{V_1}$。
      由于 $A$ 线性,$A(\alpha_1 - \alpha_2) = \mathbf{0}_{V_1}$。这意味着 $\alpha_1 - \alpha_2 \in \text{Ker}(A)$。
      因为 $\text{Ker}(A) = \{\mathbf{0}_V\}$,所以 $\alpha_1 - \alpha_2 = \mathbf{0}_V$,即 $\alpha_1 = \alpha_2$。
      因此 $A$ 是单射。

3.2 像 (Image / Range)

  • 设 $A: V \to V_1$ 是一个线性映射。
  • $A$ 的 (image) 或值域 (range),记作 $\text{Im}(A)$ 或 $A(V)$,定义为:
    $\text{Im}(A) = \{A(\alpha) | \alpha \in V\}$。
    (即 $V$ 中所有向量在 $A$ 下的像构成的集合)。
  • 定理: $\text{Im}(A)$ 是 $V_1$ 的一个子空间。
    • 证明:
      1. $A(\mathbf{0}_V) = \mathbf{0}_{V_1} \in \text{Im}(A)$。所以 $\text{Im}(A)$ 非空。
      2. 若 $\beta_1, \beta_2 \in \text{Im}(A)$, 则存在 $\alpha_1, \alpha_2 \in V$ 使得 $A(\alpha_1)=\beta_1, A(\alpha_2)=\beta_2$。
        $\beta_1+\beta_2 = A(\alpha_1)+A(\alpha_2) = A(\alpha_1+\alpha_2)$。由于 $\alpha_1+\alpha_2 \in V$,所以 $\beta_1+\beta_2 \in \text{Im}(A)$。
      3. 若 $\beta \in \text{Im}(A)$ 且 $k \in F$, 则存在 $\alpha \in V$ 使得 $A(\alpha)=\beta$。
        $k\beta = kA(\alpha) = A(k\alpha)$。由于 $k\alpha \in V$,所以 $k\beta \in \text{Im}(A)$。
        因此 $\text{Im}(A)$ 是 $V_1$ 的子空间。
  • 显然,$A$ 是满射的充要条件是 $\text{Im}(A) = V_1$。

3.3 秩-零度定理 (Rank-Nullity Theorem / Dimension Theorem)

  • 第一同构定理 (线性映射形式):
    设 $A: V \to V_1$ 是一个线性映射。则商空间 $V/\text{Ker}(A)$ 与像空间 $\text{Im}(A)$ 线性同构。
    $V/\text{Ker}(A) \cong \text{Im}(A)$。
    同构映射 $\sigma: V/\text{Ker}(A) \to \text{Im}(A)$ 定义为 $\sigma(\alpha + \text{Ker}(A)) = A(\alpha)$。
    需要验证 $\sigma$ 是良定义的 (well-defined):如果 $\alpha + \text{Ker}(A) = \beta + \text{Ker}(A)$,则 $\alpha-\beta \in \text{Ker}(A)$,所以 $A(\alpha-\beta)=\mathbf{0}_{V_1}$,$A(\alpha)=A(\beta)$。
    然后验证 $\sigma$ 是线性的、单射的、满射的。

  • 秩-零度定理: 设 $V$ 是有限维向量空间,$A: V \to V_1$ 是一个线性映射。则
    $\dim(\text{Ker}(A)) + \dim(\text{Im}(A)) = \dim(V)$。

    • $\dim(\text{Ker}(A))$ 称为 $A$ 的零度 (nullity of $A$)。
    • $\dim(\text{Im}(A))$ 称为 $A$ 的 (rank of $A$),记作 $\text{rank}(A)$ 或 $r(A)$。
    • 定理可写为: $\text{nullity}(A) + \text{rank}(A) = \dim(V)$。
    • 证明:
      设 $\dim(V)=n$ 和 $\dim(\text{Ker}(A))=m \le n$。
      取 $\text{Ker}(A)$ 的一组基 $\{\alpha_1, \dots, \alpha_m\}$。
      将这组基扩充为 $V$ 的一组基 $\{\alpha_1, \dots, \alpha_m, \alpha_{m+1}, \dots, \alpha_n\}$。
      我们想证明 $\{A(\alpha_{m+1}), \dots, A(\alpha_n)\}$ 是 $\text{Im}(A)$ 的一组基。
      1. 生成性: 任意 $\beta \in \text{Im}(A)$,存在 $\alpha \in V$ 使得 $A(\alpha)=\beta$。
        $\alpha = c_1\alpha_1 + \dots + c_m\alpha_m + c_{m+1}\alpha_{m+1} + \dots + c_n\alpha_n$。
        $\beta = A(\alpha) = c_1A(\alpha_1) + \dots + c_mA(\alpha_m) + c_{m+1}A(\alpha_{m+1}) + \dots + c_nA(\alpha_n)$。
        由于 $\alpha_1, \dots, \alpha_m \in \text{Ker}(A)$, $A(\alpha_1)=\dots=A(\alpha_m)=\mathbf{0}_{V_1}$。
        所以 $\beta = c_{m+1}A(\alpha_{m+1}) + \dots + c_nA(\alpha_n)$。
        这表明 $\{A(\alpha_{m+1}), \dots, A(\alpha_n)\}$ 生成 $\text{Im}(A)$。
      2. 线性无关性: 设 $k_{m+1}A(\alpha_{m+1}) + \dots + k_nA(\alpha_n) = \mathbf{0}_{V_1}$。
        则 $A(k_{m+1}\alpha_{m+1} + \dots + k_n\alpha_n) = \mathbf{0}_{V_1}$。
        这意味着向量 $\gamma = k_{m+1}\alpha_{m+1} + \dots + k_n\alpha_n$ 属于 $\text{Ker}(A)$。
        所以 $\gamma$ 可以表示为 $\text{Ker}(A)$ 的基的线性组合: $\gamma = d_1\alpha_1 + \dots + d_m\alpha_m$。
        因此 $k_{m+1}\alpha_{m+1} + \dots + k_n\alpha_n - d_1\alpha_1 - \dots - d_m\alpha_m = \mathbf{0}_V$。
        由于 $\{\alpha_1, \dots, \alpha_n\}$ 是 $V$ 的基,它们线性无关,所以所有系数 $k_j=0$ 和 $d_i=0$。
        特别是 $k_{m+1} = \dots = k_n = 0$。
        所以 $\{A(\alpha_{m+1}), \dots, A(\alpha_n)\}$ 线性无关。
        因此,$\{A(\alpha_{m+1}), \dots, A(\alpha_n)\}$ 是 $\text{Im}(A)$ 的基,其元素个数为 $n-m$。
        所以 $\dim(\text{Im}(A)) = n-m = \dim(V) - \dim(\text{Ker}(A))$。
        即 $\dim(\text{Ker}(A)) + \dim(\text{Im}(A)) = \dim(V)$。
  • 推论 (有限维空间中单射、满射、同构的等价性):
    设 $V, V_1$ 是有限维向量空间且 $\dim V = \dim V_1 = n$。对于线性映射 $A: V \to V_1$,下列条件等价:
    (a) $A$ 是单射 ($\text{Ker}(A) = \{\mathbf{0}_V\}$,即 $\dim(\text{Ker}(A))=0$)。
    (b) $A$ 是满射 ($\text{Im}(A) = V_1$,即 $\dim(\text{Im}(A))=n$)。
    (c) $A$ 是线性同构。

    • 证明:
      (a) $\Rightarrow$ (b): 若 $A$ 单射,则 $\dim(\text{Ker}(A))=0$。由秩-零度定理,$\dim(\text{Im}(A)) = \dim(V) - 0 = n$。因为 $\text{Im}(A)$ 是 $V_1$ 的 $n$ 维子空间且 $\dim V_1 = n$,所以 $\text{Im}(A) = V_1$,$A$ 是满射。
      (b) $\Rightarrow$ (a): 若 $A$ 满射,则 $\dim(\text{Im}(A))=n$。由秩-零度定理,$\dim(\text{Ker}(A)) = \dim(V) - n = n-n=0$。所以 $\text{Ker}(A) = \{\mathbf{0}_V\}$,$A$ 是单射。
      (a) and (b) $\Rightarrow$ (c): $A$ 是单射且满射,所以是同构。
      (c) $\Rightarrow$ (a) and (b): 同构定义包含单射和满射。
    • 特别地,对于有限维空间 $V$ 上的线性变换 $A: V \to V$,$A$ 是同构 (可逆) $\iff A$ 是单射 $\iff A$ 是满射。

3.4 线性变换的不变子空间与矩阵表示

  • 不变子空间 (Invariant Subspace):
    设 $A: V \to V$ 是一个线性变换,$U$ 是 $V$ 的一个子空间。如果对于任意 $\alpha \in U$,都有 $A(\alpha) \in U$ (即 $A(U) \subseteq U$),则称 $U$ 是 $A$ 的不变子空间 (或 $A$-不变子空间)。
    • 此时,$A$ 在 $U$ 上的限制 $A|_U: U \to U$ 是一个定义在 $U$ 上的线性变换。
    • 平凡的不变子空间: $\{\mathbf{0}_V\}$ 和 $V$ 本身。
    • $\text{Ker}(A)$ 和 $\text{Im}(A)$ 都是 $A$ 的不变子空间 (对于 $\text{Im}(A)$,需要 $A(\text{Im}(A)) \subseteq \text{Im}(A)$,这是显然的)。
    • 特征子空间 (eigenspace) $V_\lambda = \{\alpha \in V | A\alpha = \lambda\alpha\}$ 是 $A$ 的不变子空间。
  • 不变子空间与矩阵的块上三角化:
    如果 $U$ 是 $A$ 的 $r$ 维不变子空间,选择 $U$ 的一组基 $\{\alpha_1, \dots, \alpha_r\}$,并将其扩充为 $V$ 的一组基 $\{\alpha_1, \dots, \alpha_r, \alpha_{r+1}, \dots, \alpha_n\}$。
    则 $A$ 在这组基下的矩阵表示具有块上三角形式:
    $M = \begin{pmatrix} A_{11} & A_{12} \\ O & A_{22} \end{pmatrix}$
    其中 $A_{11}$ 是 $A|_U$ 在基 $\{\alpha_1, \dots, \alpha_r\}$ 下的 $r \times r$ 矩阵。
    $A_{12}$ 是 $m \times (n-m)$ 矩阵,$A_{22}$ 是 $(n-m) \times (n-m)$ 矩阵。
    左下角的 $O$ 是 $(n-r) \times r$ 的零矩阵,表示 $A(\alpha_i)$ ($i=1..r$) 的分量中,对应于 $\alpha_{r+1}, \dots, \alpha_n$ 的系数全为零。
  • 不变子空间的直和分解与矩阵的块对角化:
    如果 $V = U_1 \oplus U_2 \oplus \dots \oplus U_k$,其中每个 $U_i$ 都是 $A$ 的不变子空间。
    选择 $V$ 的一组基,该基是由每个 $U_i$ 的基拼接而成。
    则 $A$ 在这组基下的矩阵表示为块对角形式:
    $M = \text{diag}(A_1, A_2, \dots, A_k) = \begin{pmatrix} A_1 & & & O \\ & A_2 & & \\ & & \ddots & \\ O & & & A_k \end{pmatrix}$
    其中 $A_i$ 是 $A|_{U_i}$ 在 $U_i$ 的基下的矩阵。
    寻找不变子空间并将向量空间分解为不变子空间的直和,是简化线性变换 (及其矩阵表示) 的核心策略 (例如,对角化、Jordan标准型)。
  • 可交换线性变换族与公共不变子空间/特征向量:
    如果一组线性变换 $A, B$ 可交换,即 $AB=BA$。
    那么 $B$ 的核 $\text{Ker}(B)$、像 $\text{Im}(B)$ 以及任何特征子空间 $V_\lambda(B)$ 都是 $A$ 的不变子空间。
    • 证明 (以 $V_\lambda(B)$ 为例): 设 $\alpha \in V_\lambda(B)$, 即 $B\alpha = \lambda\alpha$。
      我们需要证明 $A\alpha \in V_\lambda(B)$, 即 $B(A\alpha) = \lambda(A\alpha)$。
      $B(A\alpha) = (BA)\alpha = (AB)\alpha = A(B\alpha) = A(\lambda\alpha) = \lambda(A\alpha)$。
      所以 $A\alpha \in V_\lambda(B)$。
      这个性质对于同时对角化一组可交换的矩阵非常重要。

4. 线性变换/线性映射的矩阵表示

4.1 线性变换的矩阵 (Matrix of a Linear Operator)

  • 设 $V$ 是 $n$ 维向量空间,$\mathcal{B} = \{\alpha_1, \dots, \alpha_n\}$ 是 $V$ 的一组有序基。
  • 设 $A: V \to V$ 是一个线性变换。
  • 对于每个基向量 $\alpha_j$, $A(\alpha_j)$ 是 $V$ 中的向量,可以唯一表示为基 $\mathcal{B}$ 的线性组合:
    $A(\alpha_1) = a_{11}\alpha_1 + a_{21}\alpha_2 + \dots + a_{n1}\alpha_n$
    $A(\alpha_2) = a_{12}\alpha_1 + a_{22}\alpha_2 + \dots + a_{n2}\alpha_n$
    $\vdots$
    $A(\alpha_n) = a_{1n}\alpha_1 + a_{2n}\alpha_2 + \dots + a_{nn}\alpha_n$
  • 将 $A(\alpha_j)$ 在基 $\mathcal{B}$ 下的坐标向量 $(a_{1j}, a_{2j}, \dots, a_{nj})^T$ 作为矩阵的第 $j$ 列,得到一个 $n \times n$ 矩阵:
    $[A]_{\mathcal{B}} = \begin{pmatrix}
    a_{11} & a_{12} & \cdots & a_{1n} \\
    a_{21} & a_{22} & \cdots & a_{2n} \\
    \vdots & \vdots & \ddots & \vdots \\
    a_{n1} & a_{n2} & \cdots & a_{nn}
    \end{pmatrix}$
    这个矩阵称为线性变换 $A$ 在基 $\mathcal{B}$ 下的矩阵表示 (或简称矩阵)。
  • 坐标表示: 如果向量 $\alpha \in V$ 在基 $\mathcal{B}$ 下的坐标向量为 $[\alpha]_{\mathcal{B}} = \mathbf{x} = (x_1, \dots, x_n)^T$ (即 $\alpha = \sum x_j \alpha_j$),
    向量 $A(\alpha) \in V$ 在基 $\mathcal{B}$ 下的坐标向量为 $[A(\alpha)]_{\mathcal{B}} = \mathbf{y} = (y_1, \dots, y_n)^T$。
    则 $\mathbf{y} = [A]_{\mathcal{B}} \mathbf{x}$。
    • 证明:
      $A(\alpha) = A(\sum_j x_j \alpha_j) = \sum_j x_j A(\alpha_j)$
      $= \sum_j x_j (\sum_i a_{ij} \alpha_i) = \sum_i (\sum_j a_{ij} x_j) \alpha_i$.
      所以 $y_i = \sum_j a_{ij} x_j$,这正是矩阵乘法 $\mathbf{y} = M \mathbf{x}$ 的第 $i$ 个分量。
      (PPT中可能写成行向量形式 $A(\alpha_1, \dots, \alpha_n) = (\alpha_1, \dots, \alpha_n) [A]_{\mathcal{B}}$,如果将基向量看作行向量的组合)。
  • 例子: $V = P_3(\mathbb{R})$ (次数不超过3的多项式空间),基 $\mathcal{B} = \{1, x, x^2, x^3\}$。
    线性变换 $D: V \to V$,$D(p(x)) = p’(x)$ (微分算子)。
    $D(1) = 0 = 0 \cdot 1 + 0 \cdot x + 0 \cdot x^2 + 0 \cdot x^3 \implies \text{col}_1 = (0,0,0,0)^T$
    $D(x) = 1 = 1 \cdot 1 + 0 \cdot x + 0 \cdot x^2 + 0 \cdot x^3 \implies \text{col}_2 = (1,0,0,0)^T$
    $D(x^2) = 2x = 0 \cdot 1 + 2 \cdot x + 0 \cdot x^2 + 0 \cdot x^3 \implies \text{col}_3 = (0,2,0,0)^T$
    $D(x^3) = 3x^2 = 0 \cdot 1 + 0 \cdot x + 3 \cdot x^2 + 0 \cdot x^3 \implies \text{col}_4 = (0,0,3,0)^T$
    $[D]_{\mathcal{B}} = \begin{pmatrix}
    0 & 1 & 0 & 0 \\
    0 & 0 & 2 & 0 \\
    0 & 0 & 0 & 3 \\
    0 & 0 & 0 & 0
    \end{pmatrix}$。

4.2 线性映射的矩阵 (Matrix of a Linear Map)

  • 设 $V$ 是 $n$ 维向量空间,$\mathcal{B}_V = \{\alpha_1, \dots, \alpha_n\}$ 是 $V$ 的一组有序基。
  • 设 $V_1$ 是 $m$ 维向量空间,$\mathcal{B}_{V_1} = \{\beta_1, \dots, \beta_m\}$ 是 $V_1$ 的一组有序基。
  • 设 $A: V \to V_1$ 是一个线性映射。
  • 对于每个 $V$ 的基向量 $\alpha_j$, $A(\alpha_j)$ 是 $V_1$ 中的向量,可以唯一表示为 $V_1$ 的基 $\mathcal{B}_{V_1}$ 的线性组合:
    $A(\alpha_j) = a_{1j}\beta_1 + a_{2j}\beta_2 + \dots + a_{mj}\beta_m$
  • 将 $A(\alpha_j)$ 在基 $\mathcal{B}_{V_1}$ 下的坐标向量 $(a_{1j}, a_{2j}, \dots, a_{mj})^T$ 作为矩阵的第 $j$ 列,得到一个 $m \times n$ 矩阵:
    $[A]_{\mathcal{B}_V, \mathcal{B}_{V_1}} = \begin{pmatrix}
    a_{11} & a_{12} & \cdots & a_{1n} \\
    a_{21} & a_{22} & \cdots & a_{2n} \\
    \vdots & \vdots & \ddots & \vdots \\
    a_{m1} & a_{m2} & \cdots & a_{mn}
    \end{pmatrix}$
    这个矩阵称为线性映射 $A$ 关于基 $\mathcal{B}_V$ 和 $\mathcal{B}_{V_1}$ 的矩阵表示
  • 坐标表示: 如果 $[\alpha]_{\mathcal{B}_V} = \mathbf{x}$,则 $[A(\alpha)]_{\mathcal{B}_{V_1}} = [A]_{\mathcal{B}_V, \mathcal{B}_{V_1}} \mathbf{x}$。
  • 同构关系: $\text{Hom}(V, V_1)$ 与 $m \times n$ 矩阵的空间 $M_{m \times n}(F)$ 线性同构。
    选择固定的基后,每个线性映射对应一个唯一的矩阵,反之亦然。
    这个同构保持加法和标量乘法。
    如果 $A, B: V \to V_1$ 对应矩阵 $M_A, M_B$,则 $A+B$ 对应 $M_A+M_B$,$kA$ 对应 $kM_A$。
  • 复合映射与矩阵乘积:
    设 $A: V \to U$,$B: U \to W$ 是线性映射。
    $\mathcal{B}_V, \mathcal{B}_U, \mathcal{B}_W$ 分别是 $V, U, W$ 的基。
    $[A]_{\mathcal{B}_V, \mathcal{B}_U}$ 是 $A$ 的矩阵,$M_A$。
    $[B]_{\mathcal{B}_U, \mathcal{B}_W}$ 是 $B$ 的矩阵,$M_B$。
    则复合映射 $B \circ A: V \to W$ 的矩阵是 $[B \circ A]_{\mathcal{B}_V, \mathcal{B}_W} = M_B M_A$ (矩阵乘积)。
  • 秩与核的维数:
    $\text{rank}(A)$ (线性映射 $A$ 的秩) 等于其任一矩阵表示 $M_A$ 的秩 $\text{rank}(M_A)$。
    $\dim(\text{Ker}(A))$ (线性映射 $A$ 的零度) 等于矩阵方程 $M_A \mathbf{x} = \mathbf{0}$ 的解空间的维数 (即 $n - \text{rank}(M_A)$)。

4.3 基变换与坐标变换 (Change of Basis)

  • 设 $V$ 是 $n$ 维向量空间,$\mathcal{B} = \{\alpha_1, \dots, \alpha_n\}$ 和 $\mathcal{B}’ = \{\alpha’_1, \dots, \alpha’_n\}$ 是 $V$ 的两组有序基。
  • 过渡矩阵 (Transition Matrix):
    将新基 $\mathcal{B}’$ 中的每个向量 $\alpha’_j$ 用旧基 $\mathcal{B}$ 表示:
    $\alpha’_j = p_{1j}\alpha_1 + p_{2j}\alpha_2 + \dots + p_{nj}\alpha_n$。
    矩阵 $P = (p_{ij})$ (其中第 $j$ 列是 $\alpha’_j$ 在基 $\mathcal{B}$ 下的坐标向量 $[\alpha’_j]_{\mathcal{B}}$) 称为从旧基 $\mathcal{B}$ 到新基 $\mathcal{B}’$ 的过渡矩阵 (Change-of-basis matrix from $\mathcal{B}$ to $\mathcal{B}’$)。
    (注意:有些教材定义 $P$ 为从 $\mathcal{B}’$ 到 $\mathcal{B}$ 的过渡矩阵,此时列是旧基在新基下的坐标,与这里的定义相反,导致后续公式中 $P$ 和 $P^{-1}$ 的位置不同。这里的定义更符合 $[\mathbf{x}]_{\mathcal{B}} = P [\mathbf{x}]_{\mathcal{B}’}$ 的形式。)
    PPT的写法 $A(\alpha_1, \dots, \alpha_n) = (\alpha_1, \dots, \alpha_n) A$ 暗示 $(\alpha’_1, \dots, \alpha’_n) = (\alpha_1, \dots, \alpha_n) P$。
    即 $\alpha’_j = \sum_i \alpha_i P_{ij}$。
  • 坐标变换公式:
    设向量 $v \in V$。它在旧基 $\mathcal{B}$ 下的坐标向量为 $[\mathbf{v}]_{\mathcal{B}} = \mathbf{x}$。
    它在新基 $\mathcal{B}’$ 下的坐标向量为 $[\mathbf{v}]_{\mathcal{B}’} = \mathbf{x}’$。
    则 $\mathbf{x} = P \mathbf{x}’$ 或 $\mathbf{x}’ = P^{-1} \mathbf{x}$。
    (如果 $P$ 的列是新基在旧基下的坐标)。
    • 证明:
      $v = \sum_j x’_j \alpha’_j = \sum_j x’_j (\sum_i p_{ij} \alpha_i) = \sum_i (\sum_j p_{ij} x’_j) \alpha_i$.
      同时 $v = \sum_i x_i \alpha_i$.
      所以 $x_i = \sum_j p_{ij} x’_j$,即 $\mathbf{x} = P\mathbf{x}’$.
  • 线性变换矩阵在不同基下的关系 (相似变换):
    设 $A: V \to V$ 是一个线性变换。
    $M = [A]_{\mathcal{B}}$ 是 $A$ 在旧基 $\mathcal{B}$ 下的矩阵。
    $M’ = [A]_{\mathcal{B}’}$ 是 $A$ 在新基 $\mathcal{B}’$ 下的矩阵。
    $P$ 是从基 $\mathcal{B}$ 到基 $\mathcal{B}’$ 的过渡矩阵 (其列为新基向量在旧基下的坐标)。
    则 $M’ = P^{-1} M P$。
    • 证明:
      对于任意 $v \in V$,设其在新基 $\mathcal{B}’$ 下的坐标为 $\mathbf{x}’$。
      则其在旧基 $\mathcal{B}$ 下的坐标为 $\mathbf{x} = P\mathbf{x}’$。
      $A(v)$ 在旧基 $\mathcal{B}$ 下的坐标为 $M\mathbf{x} = MP\mathbf{x}’$。
      $A(v)$ 在新基 $\mathcal{B}’$ 下的坐标为 $M’\mathbf{x}’$。
      由于 $P$ 将新基坐标转换为旧基坐标,所以 $P^{-1}$ 将旧基坐标转换为新基坐标。
      因此 $M’\mathbf{x}’ = [A(v)]_{\mathcal{B}’} = P^{-1} [A(v)]_{\mathcal{B}} = P^{-1} (M\mathbf{x}) = P^{-1} (MP\mathbf{x}’)$。
      由于这对任意 $\mathbf{x}’$ 成立,所以 $M’ = P^{-1}MP$。
    • 称矩阵 $M$ 和 $M’$ 相似 (similar)。相似的矩阵代表同一个线性变换在不同基下的表示。它们有相同的行列式、迹、特征值、秩等不变量。

5. Kronecker 积 (Tensor Product of Matrices) 与线性矩阵方程

(这部分内容在典型的初等线性代数中不常见,属于更高级的主题)

5.1 vec 算子 (Vectorization)

  • 对于 $m \times n$ 矩阵 $A=(a_{ij})$,$\text{vec}(A)$ (或 $\text{cs}(A)$ 表示 column stacking) 是一个 $mn \times 1$ 的列向量,通过将 $A$ 的列按顺序堆叠而成:
    $\text{vec}(A) = (a_{11}, a_{21}, \dots, a_{m1}, a_{12}, a_{22}, \dots, a_{m2}, \dots, a_{1n}, a_{2n}, \dots, a_{mn})^T$。
    (PPT中也用了行堆叠 $rs(A)$,但列堆叠更常见)。

5.2 Kronecker 积 (Kronecker Product)

  • 设 $A$ 是 $m \times n$ 矩阵,$B$ 是 $p \times q$ 矩阵。
  • $A$ 与 $B$ 的 Kronecker 积 (或张量积),记作 $A \otimes B$,是一个 $mp \times nq$ 的分块矩阵:
    $A \otimes B = \begin{pmatrix}
    a_{11}B & a_{12}B & \cdots & a_{1n}B \\
    a_{21}B & a_{22}B & \cdots & a_{2n}B \\
    \vdots & \vdots & \ddots & \vdots \\
    a_{m1}B & a_{m2}B & \cdots & a_{mn}B
    \end{pmatrix}$。

5.3 Kronecker 积的性质

  1. 结合律: $(A \otimes B) \otimes C = A \otimes (B \otimes C)$。
  2. 双线性 (分配律):
    $(A_1+A_2) \otimes B = A_1 \otimes B + A_2 \otimes B$
    $A \otimes (B_1+B_2) = A \otimes B_1 + A \otimes B_2$
    $(kA) \otimes B = A \otimes (kB) = k(A \otimes B)$
  3. 混合乘积性质: $(A \otimes B)(C \otimes D) = (AC) \otimes (BD)$ (要求矩阵乘积 $AC$ 和 $BD$ 有意义)。
    • 证明思路: 将 $A \otimes B$ 和 $C \otimes D$ 写成分块矩阵形式,然后进行分块矩阵乘法。
      $(A \otimes B)_{ik,jl} = A_{ij}B_{kl}$ (这里用索引表示块中的元素)。
      $(AC \otimes BD)_{ik,jl} = (AC)_{ij}(BD)_{kl} = (\sum_p A_{ip}C_{pj}) (\sum_q B_{kq}D_{ql})$
      $((A \otimes B)(C \otimes D))_{ik,jl} = \sum_{pq} (A \otimes B)_{ik,pq} (C \otimes D)_{pq,jl} = \sum_{pq} A_{ip}B_{kq} C_{pj}D_{ql}$
      两者通过重新排列求和顺序可以证明相等。
  4. : 如果 $A, B$ 均可逆,则 $A \otimes B$ 也可逆,且 $(A \otimes B)^{-1} = A^{-1} \otimes B^{-1}$。
    • 证明: 利用混合乘积性质:
      $(A^{-1} \otimes B^{-1})(A \otimes B) = (A^{-1}A) \otimes (B^{-1}B) = I_m \otimes I_p = I_{mp}$ (假设 $A$ 是 $m \times m$, $B$ 是 $p \times p$)。
  5. 转置: $(A \otimes B)^T = A^T \otimes B^T$。
  6. 行列式: 若 $A$ 是 $m \times m$ 矩阵, $B$ 是 $n \times n$ 矩阵,则 $|A \otimes B| = |A|^n |B|^m$。
    • 证明思路:
      可以将 $A$ 通过相似变换化为上三角阵 (Jordan标准型也可)。$A = PJP^{-1}$。
      $A \otimes B = (PJP^{-1}) \otimes (Q L Q^{-1})$ (如果 $B$ 也能三角化)。
      $A \otimes B = (P \otimes I)(J \otimes B)(P^{-1} \otimes I)$ (如果 $B$ 是三角阵,或者用更一般的性质)。
      若 $A$ 是上三角,则 $A \otimes B$ 是分块上三角,其对角块是 $a_{ii}B$。
      $|A \otimes B| = \prod_i |a_{ii}B| = \prod_i a_{ii}^n |B| = (\prod_i a_{ii})^n |B|^m$ (这里有个小错误,应该是 $(\prod_i a_{ii})^n |B|^m$ if B is $m \times m$ and $A$ is $n \times n$ from the formula)
      If A is $m \times m$ and B is $n \times n$: $\prod_i |a_{ii}B| = \prod_i (a_{ii}^n |B|) = (\prod_i a_{ii})^n |B|^m = |A|^n |B|^m$.
  7. : $\text{rank}(A \otimes B) = \text{rank}(A) \text{rank}(B)$。
    • 证明思路: 将 $A, B$ 化为等价标准形 $A = P_A D_A Q_A$, $B = P_B D_B Q_B$,其中 $D_A, D_B$ 是对角线上为1或0的矩阵。
      $A \otimes B = (P_A D_A Q_A) \otimes (P_B D_B Q_B) = (P_A \otimes P_B)(D_A \otimes D_B)(Q_A \otimes Q_B)$。
      $P_A \otimes P_B$ 和 $Q_A \otimes Q_B$ 是可逆的 (因为 $P_A, P_B, Q_A, Q_B$ 可逆)。
      $D_A \otimes D_B$ 是一个对角矩阵,其对角线上的1的个数等于 $\text{rank}(A) \text{rank}(B)$。
      所以 $\text{rank}(A \otimes B) = \text{rank}(D_A \otimes D_B) = \text{rank}(A)\text{rank}(B)$。
  8. : $\text{tr}(A \otimes B) = \text{tr}(A) \text{tr}(B)$。
    • 证明:
      $\text{tr}(A \otimes B) = \sum_i (A \otimes B)_{ii,ii}$ (对角块的迹之和)。
      对角块为 $a_{ii}B$。所以 $\text{tr}(A \otimes B) = \sum_i \text{tr}(a_{ii}B) = \sum_i a_{ii}\text{tr}(B) = (\sum_i a_{ii})\text{tr}(B) = \text{tr}(A)\text{tr}(B)$。

5.4 线性矩阵方程 $AXB=C$ 的解

  • vec 算子与 Kronecker 积的关系:
    $\text{vec}(AXB) = (B^T \otimes A) \text{vec}(X)$。
    其中 $A$ 是 $m \times n$, $X$ 是 $n \times p$, $B$ 是 $p \times q$。
    则 $AXB$ 是 $m \times q$。$\text{vec}(AXB)$ 是 $mq \times 1$。
    $B^T$ 是 $q \times p$, $A$ 是 $m \times n$。$B^T \otimes A$ 是 $mq \times np$。
    $\text{vec}(X)$ 是 $np \times 1$。
  • 求解线性矩阵方程:
    考虑矩阵方程 $\sum_{i=1}^s A_i X B_i = C$。
    对其两边作用 $\text{vec}$ 算子:
    $\text{vec}(\sum_{i=1}^s A_i X B_i) = \text{vec}(C)$
    $\sum_{i=1}^s \text{vec}(A_i X B_i) = \text{vec}(C)$
    $\sum_{i=1}^s (B_i^T \otimes A_i) \text{vec}(X) = \text{vec}(C)$
    令 $G = \sum_{i=1}^s (B_i^T \otimes A_i)$,$\mathbf{x} = \text{vec}(X)$,$\mathbf{c} = \text{vec}(C)$。
    则原矩阵方程等价于线性方程组 $G\mathbf{x} = \mathbf{c}$。
  • 解的存在性: 矩阵方程 $\sum A_i X B_i = C$ 有解的充要条件是线性方程组 $G\mathbf{x} = \mathbf{c}$ 有解,即 $\text{rank}(G) = \text{rank}((G|\mathbf{c}))$。
  • 唯一解: 如果 $G$ 可逆 (当 $X$ 是方阵且 $G$ 是方阵时),则有唯一解 $\mathbf{x} = G^{-1}\mathbf{c}$,从而得到唯一的 $X$。

5.5 线性映射的张量积 (Tensor Product of Linear Maps)

  • 设 $A: V \to V’$ 和 $B: W \to W’$ 是线性映射。
  • 它们的张量积 $A \otimes B: V \otimes W \to V’ \otimes W’$ 是一个线性映射,定义在简单张量上为:
    $(A \otimes B)(v \otimes w) = A(v) \otimes B(w)$
    并线性扩展到整个张量积空间 $V \otimes W$。
  • 如果 $V, W, V’, W’$ 都是有限维的,并选择了各自的基。
    设 $A$ 在相应基下的矩阵为 $M_A$,$B$ 的矩阵为 $M_B$。
    则线性映射 $A \otimes B$ 在由 $V,W$ 的基构成的张量积基下的矩阵表示就是 $M_A \otimes M_B$ (Kronecker 积)。
    (张量积基例如: 如果 $\{\mathbf{e}_i\}$ 是 $V$ 的基, $\{\mathbf{f}_j\}$ 是 $W$ 的基, 则 $\{\mathbf{e}_i \otimes \mathbf{f}_j\}$ 是 $V \otimes W$ 的基)。

这部分内容涵盖了抽象代数中映射的基本概念,然后深入到线性代数的核心——线性映射,包括其性质、与矩阵的关系、秩-零度定理、不变子空间等,最后还介绍了Kronecker积及其在线性矩阵方程中的应用。

作者

Jiamin Liu

发布于

2025-06-25

更新于

2025-06-25

许可协议

评论