秩-零度定理

学习泛函的过程中,深感自己的线性代数拖后腿,回过头补线性代数的知识。偶然看到一位台湾教授的网站,https://ccjou.wordpress.com/, 获益匪浅,非常感谢。

我在这篇博客主要介绍 秩-零度定理, 请和我的另一篇博客 线性变换 结合在一起看

1. 秩-零度定理

\(\mathcal {V}\)\(\mathcal {W}\) 是两个有限维向量空间,线性变换 \(T: \mathcal {V} \to \mathcal {W}\) 有两个重要的子空间(subspace): 值域 (range) 和核 (kernel)。

值域 \(R(T)\),也记为 \(\text{ran}(T)\)\(\text{im}(T)\) ,是 \(T\) 中所有像(image)所形成的集合: \[
R(T) = \{ T(\mathbf {x}) \vert \mathbf {x} \in \mathcal {V} \}
\]
线性变换 \(T\) 的值域 \(R(T)\) 维数由 \(T\)决定,即 \(\hbox {rank} T = \dim \hbox {R}(T)\)

这里只是引入一个新的概念 – 秩 (rank),方便表示

显然,值域 \(R(T)\) 是向量空间 \(\mathcal {W}\) 的子空间 !!!

证明: 对于任意元素 \(\mathbf {y}_1, \mathbf {y}_2 \in R(T)\), 必然存在 \(\mathbf {x}_1, \mathbf {x}_2 \in \mathcal {V}\) ,使得

\(\mathbf {y}_1 = T(\mathbf {x}_1)\)\(\mathbf {y}_2 = T(\mathbf {x}_2)\) ,对于 \(\forall \alpha, \beta \in \mathbb {R}\) ,有: \[
\begin {aligned}
\alpha \mathbf {y}_1 + \beta \mathbf {y}_2 &= \alpha T(\mathbf {x}_1) + \beta T(\mathbf {x}_2) \\
&= T(\alpha \mathbf {x}_1) + T(\beta \mathbf {x}_2) \\
&= T(\alpha \mathbf {x}_1 +\beta \mathbf {x}_2)
\end {aligned}
\]
上面的公式利用了线性变换的加法和数乘的性质

因为 \(\mathcal {V}\) 是向量空间且 \(\mathbf {x}_1, \mathbf {x}_2 \in \mathcal {V}\) ,则 \(\alpha \mathbf {x}_1 +\beta \mathbf {x}_2 \in \mathcal {V}\) ,根据定义: \[
T(\alpha \mathbf {x}_1 +\beta \mathbf {x}_2) \in R(T)
\]
于是 \(\alpha \mathbf {y}_1 + \beta \mathbf {y}_2 \in R(T)\) ,得证

而核 \(\ker(T)\) 是经过线性变换 \(T\) 后的像为 0 对应所有 \(\mathbf {x}\) 的集合 \[
\ker(T) = \{ \mathbf {x} \in \mathcal {V} \vert T(\mathbf {x}) = \mathbf {0} \}
\]
核的维数称为零度(nullity),记为 \(\dim \ker(T)\) ,用来度量核的大小。

同样可以证明, \(\ker(T)\) 是向量空间 \(\mathcal {V}\) 的子空间 !!!

如下图所示,展示了两个空间

所谓秩-零度定理,就是向量空间 \(\mathcal {V}\) 的维度等于 秩和零度之和,即: \[
\dim \mathcal {V} = \dim \ker(T) + \hbox {rank} T
\]
证明:

\(\dim \mathcal {V} = n\) ,且 \(\dim \ker(T) = p, p \le n\) 。假设 \(\ker(T)\) 的一组基底为 \(\{\mathbf {u}_1, \ldots, \mathbf {u}_p \}\) ,扩充此基底成为向量空间 \(\mathcal {V}\) 的基底 \(\{\mathbf {u}_1, \ldots, \mathbf {u}_p, \mathbf {w}_1, \ldots, \mathbf {w}_r \}\) (这里可以用补空间证明可以在 \(\ker (T)\) 的基底基础上扩张到向量空间 \(\mathcal {V}\) 的基底 ),且 \(n= p+r\) ,我们的目标是证明 \(r = \hbox {rank}T\) ,见下图

向量空间 \(\mathcal {V}\) 中任一向量 \(\mathbf {v}\) 都可以表示为基底向量的唯一线性组合: \[
\mathbf {v} = a_1 \mathbf {u}_1 + \cdots + a_p \mathbf {u}_p + b_1 \mathbf {w}_1 + \cdots + b_r \mathbf {w}_r
\]
向量 \(\mathbf {v}\) 经线性变换 \(T\) 的映射,\(T(\mathbf {v})\) 称为像 (image) ,

由于 \(\mathbf {u}_1, \ldots, \mathbf {u}_p \in \ker(T)\) ,因此 \(T(\mathbf {u}_1) = \cdots = T (\mathbf {u}_p) =0\), 于是 \[
\begin {aligned}
T(\mathbf {v}) &= T(a_1 \mathbf {u}_1 + \cdots + a_p \mathbf {u}_p + b_1 \mathbf {w}_1 + \cdots + b_r \mathbf {w}_r) \\
&= a_1 T(\mathbf {u}_1) + \cdots + a_p T(\mathbf {u}_p) + b_1 T(\mathbf {w}_1) + \cdots + b_r T(\mathbf {w}_r) \\
&= b_1 T(\mathbf {w}_1) + \cdots + b_r T(\mathbf {w}_r)
\end {aligned}
\]
也就是说: \(R(T) = lin\{ T(\mathbf {w}_1), \ldots, T(\mathbf {w}_r) \}\) ,即\(\{T(\mathbf {w}_1), \ldots, T(\mathbf {w}_r) \}\) 扩张(span)值域 \(R(T)\)

还记得基底的性质吧,在 向量空间和子空间 讲过:

  1. 子空间的基底的个数等于该子空间的维度
  2. 基底向量之间互相线性独立
  3. 基底生成整个子空间

我们要证明 \(r = \hbox {rank}T = \dim R(T)\) ,只要证明 \(\{T(\mathbf {w}_1), \ldots, T(\mathbf {w}_r) \}\) 是值域空间 \(R(T)\) 的一组基底即可,我们只要证明线性独立即可,考虑 \[
c_1 T(\mathbf {w}_1) + \cdots + c_r T(\mathbf {w}_r) = \mathbf {0}
\]
或表示为: \[
T(c_1 \mathbf {w}_1 + \cdots + c_r \mathbf {w}_r) = \mathbf {0}
\]
说明 \(c_1 \mathbf {w}_1 + \cdots + c_r \mathbf {w}_r\) 属于核 \(\ker(T)\) 。而 \(\{\mathbf {u}_1, \ldots, \mathbf {u}_p \}\)\(\ker(T)\) 的一组基底,

可以写出下列表达式: \[
c_1 \mathbf {w}_1 + \cdots + c_r \mathbf {w}_r = d_1 \mathbf {u}_1 + \cdots + d_p\mathbf {u}_p
\]
即: \[
c_1 \mathbf {w}_1 + \cdots + c_r \mathbf {w}_r – d_1 \mathbf {u}_1 – \cdots – d_p\mathbf {u}_p = \mathbf {0}
\]
因为 \(\{\mathbf {u}_1, \ldots, \mathbf {u}_p, \mathbf {w}_1, \ldots, \mathbf {w}_r \}\)\(\mathcal {V}\) 的基底,所有系数必须为0

\(\{T(\mathbf {w}_1), \ldots, T(\mathbf {w}_r) \}\) 是线性独立的,得证。

2. 推论

先介绍一下满射和一对一映射的概念:

所谓满射,就是值域 \(R(T)\) 充满整个到达域 \(\mathcal {W}\) ,即 \(\hbox {rank} T= \dim R(T) = \dim \mathcal {W}\)

所谓一对一映射,就是如果 \(T(\mathbf {x}) = T(\mathbf {y} )\) ,则 \(\mathbf {x} = \mathbf {y}\) 。可以证明,当且仅当 \(\ker (T) = \{ \mathbf 0\}\) 时, \(T\) 是一对一映射。由秩-零度定理,此时 \(\hbox {rank} T= \dim \mathcal {V}\)

如果 \(T\) 同时是满射和一对一,则 \(\hbox {rank} T= \dim \mathcal {V} = \dim \mathcal {W}\) ,称为同构 (isomorphism),此时 \(T^{-1}\) 唯一存在,因为对于 \(\mathcal {W}\) 空间的任一个(因为满射)元素 \(\mathbf y\) ,我们都可以找到与之唯一对应的 \(\mathcal {V}\) 空间的一个元素 \(\mathbf x\), 这就是逆映射 \(T^{-1}\)

还是线性变换 \(T: \mathcal {V} \to \mathcal {W}\)\(\mathcal {V}\)\(\mathcal {W}\) 是两个有限维向量空间

  1. \(\dim \mathcal {V} \gt \dim \mathcal {W}\) ,则 \[
    \dim \ker(T) = \dim \mathcal {V} – \dim R(T) \ge \dim \mathcal {V} – \dim \mathcal {W} \gt 0
    \]
    即存在非零向量 \(\mathbf {x} \in \mathcal {V}\) 使得 \(T(\mathbf {x}) = \mathbf {0}\) 。换句话说,\(T\) 不是一对一映射的

  2. \(\dim \mathcal {V} \lt \dim \mathcal {W}\) ,则 \[
    \dim R(T) = \dim \mathcal {V} – \dim \ker(T) \le \dim \mathcal {V} \lt \dim \mathcal {W}
    \]
    即存在非零向量 \(\mathbf {y} \in \mathcal {W}\) 使得 \(\mathbf {y} \notin R(T)\)。 换句话说,\(T\) 不是满射的

3. 定理推广到矩阵

如果 \(A: \mathbb C^n \to \mathbb C^m\) ,即 \(A\) 是一个 \(m \times n\) 阶矩阵,子空间定义如下:

  1. 列空间 (column space): $C(A) = {A ^n } ^m $

  2. 行空间 (row space): \(C(A^T) = \{A^T \mathbf {y} \vert \mathbf {y} \in \mathbb {C}^m \} \subseteq \mathbb {C}^n\)

  3. 零空间 (nullspace): \(N(A) = \{ \mathbf {x} \in \mathbb {C}^n\vert A \mathbf {x} = \mathbf {0}\} \subseteq \mathbb {C}^n\)
    零度: \(\mathrm {nullity} A = \dim N(A)\)

  4. 左零空间 (left nullspace): \(N(A^T) = \{ \mathbf {y} \in \mathbb {C}^m\vert A^T \mathbf {y} = \mathbf {0}\} \subseteq \mathbb {C}^m\)

根据博客 线性变换和矩阵的关系 ,我们知道每个线性变换对应一个矩阵

线性变换 \(T: \mathcal {V} \to \mathcal {W}\) ,其中 \(\dim \mathcal {V} = n, \dim \mathcal {W}=m\), 则 \(T\) 对应矩阵 \(A: \mathbb C^n \to \mathbb C^m\) ,其中 \(A\) 是一个 \(m \times n\) 阶矩阵,\(\mathbb C^n\) 是定义域,\(\mathbb C^m\) 是到达域。因为在线性变换中我们说过:

\(\mathbf {y} = A \mathbf {x}\) 可以将 \(\mathbf {y}\) 视为 \(A\) 的列向量的线性组合,也就是说, \(\mathbf {y}\) 属于 \(A\) 的列空间 \(C(A)\)

因此,值域 \(R(T)\) 其实就是 \(A\) 的列空间 \(C(A)\) ,也就是说 \[
\hbox {rank}A = \dim C(A) \le \dim \mathbb C^m = m
\]

矩阵的秩其实是矩阵的列空间维度

另一方面,可以看到矩阵零空间的定义和线性变换的核空间的定义是相同,即 \[
\dim N(A) = \dim \ker(T) \le \dim \mathbb C^n = n
\]
当然根据秩-零度定理: \[
\hbox {rank}A = \dim \mathbb C^n – \dim \ker(T) \le \dim \mathbb C^n = n
\]

矩阵的秩也可以看作定义域的维数减去零空间的维数

结论:

  1. 行满秩: \(C(A) = \mathbb C^m\) , 即 \(\hbox {rank}A = m\) ,对应线性变换满射
  2. 列满秩: \(N(A) = \{\mathbf 0 \}\), 即 \(\hbox {rank}A = n\) ,对应线性变换一对一映射
  3. 满秩: \(\hbox {rank}A = m = n\) ,对应线性变换同构

类似前面对 \(\dim \mathcal {V}, \dim \mathcal {W}\) 大小的比较,我们可以比较\(m \times n\) 阶矩阵 \(A\)\(m, n\) 大小

  1. \(n \gt m\) ,则 \[
    \dim N(A) = n – \dim C(A) \ge n – m \gt 0
    \]
    即零空间 \(N(A)\) 包含非零向量,换句话说, \(A \mathbf {x} = \mathbf {0}\) 有无穷多解

  2. \(n \lt m\) ,则 \[
    \dim C(A) = n – \dim N(A) \le n \lt m
    \]
    即行空间 \(C(A)\) 未能充满整个 \(\mathbb C^m\) (或 \(\mathbb R^m\) ),换句话说,\(A \mathbf {x} = \mathbf {b}\) 不总是存在解

One thought on “秩-零度定理

发表评论

电子邮件地址不会被公开。 必填项已用*标注