矩陣運算入門

代數 · 閱讀時間 12 分鐘

矩陣是線性代數的起點，也是現代數學和工程不可或缺的工具。從電腦繪圖的座標變換到手機GPS的定位計算，從經濟學的投入產出分析到量子力學的狀態演化，到處都有矩陣的身影。矩陣本質上就是把一堆數字排列成矩形陣列，但這個簡單的結構卻能表達非常複雜的線性關係。這篇文章會介紹矩陣的基本概念和運算規則。

一、矩陣的基本概念

矩陣就是把數字排列成 m 列 n 行的矩形陣列。每一個數字叫做矩陣的元素。我們通常用大寫字母 A、B、C 來表示矩陣，並用 aᵢⱼ 來表示第 i 列、第 j 行的元素。

如果矩陣有 m 列 n 行，我們就說它是 m × n 矩陣。例如，一個 2 × 3 矩陣有 2 列 3 行，總共 6 個元素。特殊形狀的矩陣有自己的名字：n × n 的矩陣叫做方陣；只有一列的矩陣叫做行向量；只有一行的矩陣叫做列向量。

兩個矩陣相等，首先形狀要相同（都是 m × n），其次所有對應位置的元素都要相等。這是矩陣相等的基本條件。

矩陣加法只有當兩個矩陣形狀完全相同時才能進行。做法很直觀：對應位置的元素相加。(A + B)ᵢⱼ = aᵢⱼ + bᵢⱼ。減法也是同樣的道理，對應位置元素相減。

純量乘法則是矩陣的每個元素都乘上同一個純量：如果 k 是純量，那麼 (kA)ᵢⱼ = k·aᵢⱼ。這些運算都很像普通的數字運算，但矩陣乘法可不是這麼簡單。

矩陣乘法的規則是整個矩陣代數中最需要小心的地方。兩個矩陣 A 和 B 相乘，A 的列數必須等於 B 的行數，否則無法相乘。如果 A 是 m × p 矩陣，B 是 p × n 矩陣，則乘積 AB 會是 m × n 矩陣。

乘積矩陣 C = AB 的第 i 列、第 j 行元素 cᵢⱼ，是用 A 的第 i 列和 B 的第 j 行對應元素相乘後加起來得到的：cᵢⱼ = aᵢ₁b₁ⱼ + aᵢ₂b₂ⱼ + ... + aᵢₚbₚⱼ。這個定義是row-by-column（列乘行）的規則。

矩陣乘法最違反直覺的一點是：它不滿足交換律。大多數情況下，AB ≠ BA。所以做矩陣乘法時，順序非常重要！不過矩陣乘法仍然滿足結合律：(AB)C = A(BC)，以及分配律：A(B + C) = AB + AC。

在矩陣運算中，單位矩陣 I 扮演的角色類似數字運算中的 1。n 階單位矩陣是一個 n × n 矩陣，對角線上的元素都是 1，其他位置都是 0。任何矩陣乘上單位矩陣都不會改變：AI = IA = A。

類比數字運算中「倒數」的概念，矩陣也有「反矩陣」。如果 A 是一個方陣，存在另一個矩陣 A⁻¹ 使得 A·A⁻¹ = A⁻¹·A = I，那麼 A⁻¹ 就是 A 的反矩陣。一個矩陣要有反矩陣，必須滿足兩個條件：首先，它必須是方陣；其次，它的行列式不能為零。

對於 2 × 2 矩陣，反矩陣有一個可以直接使用的公式。如果

A = [a  b]

　　[c  d]

那麼 A 的行列式 det(A) = ad − bc。當 ad − bc ≠ 0 時，反矩陣存在，且

A⁻¹ = (1/(ad−bc)) × [d  −b]

　　　　　　　　　　[−c  a]

行列式 ad − bc 不為零這個條件非常重要。如果行列式等於零，這個矩陣就沒有反矩陣，我們稱這個矩陣為奇異矩陣。為什麼行列式這麼關鍵？因為它代表的是矩陣所代表的線性變換的面積縮放因子。當行列式為零時，這個變換會把二維面積「壓扁」成一維甚至零維，自然無法逆轉。

矩陣在電腦繪圖中有著根本性的重要性。一張圖片在螢幕上旋轉、縮放、傾斜，都可以表示為矩陣乘法。一個點 (x, y) 經過 2×2 矩陣變換後會得到新的座標 (x', y')。例如，繞原點旋轉 θ 角的變換矩陣是：

[cosθ −sinθ]
[sinθ cosθ]

這個矩陣乘上原始座標，就能得到旋轉後的座標。這就是為什麼 3D 遊戲和電影特效能夠即時渲染大量幾何變換——背後就是高效矩陣運算的功勞。