二阶方阵的凯莱─汉米尔顿定理(The Cayley-Hami


二次方程式 \(ax^2+bx+c=0\) 求解对我们来说一点都不困难,公式解 \(x=\frac{-b\pm \sqrt{b^2-4ac}}{2a}\)
想必不少人都能够琅琅上口。现在让我们将方程式的想法,推广应用到矩阵,会不会有什幺美妙的事情发生呢?直观来看,若将未知数 \(x\) 看成 \(1\times 1\) 阶方阵,结论并没什幺不同。
但若将未知数 \(x\) 换作其他阶的方阵,那结果可就很有趣啰!让我们先看看二阶方阵的例子。

设 \(I\) 与 \(O\) 分别代表单位方阵与零方阵。
若给定係数 \(a,b,c\),能否找到二阶方阵 \(A\) 满足 \(aA^2+bA+cI=O\) 呢?

举个实例来说好了,当 \(A^2-3A-10I=O\) 时,二阶方阵 \(A\) 为何呢?还是不存在这样子的二阶方阵 \(A\) 呢?思考这问题的时候,就会发现这时候公式解派不上用场了,因为它只能带领我们找到数,而不是矩阵。因此,我们需要别的工具。

读者不妨自行验证,下列的二阶方阵统统会符合   \(A^2-3A-10I=O\):

\(\begin{bmatrix}1&4\\3&2\end{bmatrix},\begin{bmatrix}2&4\\3&1\end{bmatrix},\begin{bmatrix}2&3\\4&1\end{bmatrix},\begin{bmatrix}1&3\\4&2\end{bmatrix};\\\begin{bmatrix}3&5\\2&0\end{bmatrix},\begin{bmatrix}0&5\\2&3\end{bmatrix},\begin{bmatrix}0&2\\5&3\end{bmatrix},\begin{bmatrix}3&2\\5&0\end{bmatrix};\\\begin{bmatrix}-1&2\\-7&4\end{bmatrix},\begin{bmatrix}4&2\\-7&-1\end{bmatrix},\begin{bmatrix}4&-7\\2&-1\end{bmatrix},\begin{bmatrix}-1&-7\\2&4\end{bmatrix};\\\begin{bmatrix}-3&4\\-7&6\end{bmatrix},\begin{bmatrix}6&4\\-7&-3\end{bmatrix},\begin{bmatrix}6&-7\\4&-3\end{bmatrix},\begin{bmatrix}-3&-7\\4&6\end{bmatrix}\)

事实上,还有无限多个二阶方阵 \(A\) 会满足 \(A^2-3A-10I=O\)。换句话说,在方程式理论中很重要的「代数基本定理」( \(n\) 次方程式恰有 \(n\) 个複数根 ),在这里也不合用了,那该怎幺办呢?读者不妨先观察上面所给出的 \(A\),是否能看出什幺端倪。

首先,我们可以观察到,当找到一个符合的 \(A\) 后,调换其主对角线(左上到右下)或副对角线(左下到右上)的元,所得到的方阵依然符合 \(A^2-3A-10I=O\)。

所以,想必对角线的元一定是关键所在!有了这个想法,那离目标就不远了。将目光聚焦在对角线的元,然后再看看 \(A^2-3A-10I=O\) 的係数 \(3\) 和 \(10\),我们就可以得出下列的定理:

对任意二阶方阵 \(\begin{bmatrix}a&b\\c&d\end{bmatrix}\) ,恆有 \(A^2-(a+d)A+(ad-bc)I=O\)。

这定理就是「凯莱─汉米尔顿定理」(Cayley-Hamilton Theorem)在二阶方阵的情形。证明很简单,勇敢地计算 \(A^2-(a+d)A+(ad-bc)I\) 就对了,在此就略去,留给读者自行证明。

「凯莱─汉米尔顿定理」的应用很广,最简单的应用,就是可以用来求 \(A^n\) 。
比如说,当 \(\begin{bmatrix}1&4\\3&2\end{bmatrix}\) 时,\(A^2-3A-10I=O\) ,移项得到 \(A^2=3A+10I\) ,
反覆利用此关係式,就可以求出:

\(\begin{array}{ll}A^3 &=A^2\cdot A=(3A+10I)\cdot A\\ &=3A^2+10A=3(3A+10I)+10A=19A+30I\end{array}\)

\(\begin{array}{ll}{A^4} &= {A^3} \cdot A =(19A +30I) \cdot A\\ &=19{A^2} +30A = 19(3A + 10I) +30A =87A +190I\end{array}\)

\(\begin{array}{ll}{A^5} &= {A^4} \cdot A=(87A +190I) \cdot A\\ &=87{A^2} +190A =87(3A + 10I) +190A =451A +870I\end{array}\)

\(\vdots\)

上述的算法看起来虽然不怎幺样,但背后的观念就是递迴数列,而这正是很多电脑程式语言的核心语法之一。换句话说,这个算法由人来算不见得比较快,但可以将它转换成电脑程式语言,那幺,电脑就可以帮我们代劳了。

「凯莱─汉米尔顿定理」和多项式理论结合在一起,更可以看出它的威力。

例如当 \(\begin{bmatrix}1&4\\3&2\end{bmatrix}\) 时,如何比较快速地求出 \({A^4} -4{A^3} – 6{A^2} +8A – 11I\) 之值?

我们可以先找一个多项式 \(f(x) = {x^4} -4{x^3} – 6{x^2} +8x – 11\),

然后用 \({x^2} -3x – 10\) 去除,就可以得到

\(f(x) = {x^4} -4{x^3} – 6{x^2} +8x – 11 = ({x^2} -3x – 10)({x^2} -x + 1) + x – 1\)

上述的多项式可以看成

\({A^4} -4{A^3} – 6{A^2} +8A – 11I = ({A^2} -3A – 10I)({A^2} -A + I) + A – I\) ,

因为 \({A^2} -3A – 10I = O\) ,

所以:\({A^4} -4{A^3} – 6{A^2} +8A – I = A – I{\rm{ = }}\left[ {\begin{array}{*{20}{c}} 1&4\\ 3&2 \end{array}} \right] – \left[ {\begin{array}{*{20}{c}} 1&0\\ 0&1 \end{array}} \right]{\rm{ = }}\left[ {\begin{array}{*{20}{c}} 0&4\\ 3&1 \end{array}} \right]\)

这样子是不是快多了!或许有读者会认为上述的过程并不会比较简便,原因是要做多项式的除法。但若仔细想想上述的解法,就会发现关键其实是在求余式,商式是谁并不重要,因此,在多项式所学到求余数的方法、工具,例如插值多项式等等,就可引进来大幅减少我们的计算量。

看起来两个不相关的领域:矩阵与多项式,竟然可以如此巧妙地结合在一起,真的是件既奇妙又美丽的事。这种巧妙的结合,并不侷限于二阶方阵,更高阶的方阵依照适用,只不过,我们需要更高阶一点的工具:「特徵值」与「特徵方程式」才能来说明它的美丽。有兴趣的读者,请参阅〈从特徵值、特徵向量到凯莱─汉米尔顿定理、谱定理〉一文。