矩陣是線性代數的起點,也是現代數學和工程不可或缺的工具。從電腦繪圖的座標變換到手機GPS的定位計算,從經濟學的投入產出分析到量子力學的狀態演化,到處都有矩陣的身影。矩陣本質上就是把一堆數字排列成矩形陣列,但這個簡單的結構卻能表達非常複雜的線性關係。這篇文章會介紹矩陣的基本概念和運算規則。
矩陣就是把數字排列成 m 列 n 行的矩形陣列。每一個數字叫做矩陣的元素。我們通常用大寫字母 A、B、C 來表示矩陣,並用 aᵢⱼ 來表示第 i 列、第 j 行的元素。
如果矩陣有 m 列 n 行,我們就說它是 m × n 矩陣。例如,一個 2 × 3 矩陣有 2 列 3 行,總共 6 個元素。特殊形狀的矩陣有自己的名字:n × n 的矩陣叫做方陣;只有一列的矩陣叫做行向量;只有一行的矩陣叫做列向量。
兩個矩陣相等,首先形狀要相同(都是 m × n),其次所有對應位置的元素都要相等。這是矩陣相等的基本條件。
矩陣加法只有當兩個矩陣形狀完全相同時才能進行。做法很直觀:對應位置的元素相加。(A + B)ᵢⱼ = aᵢⱼ + bᵢⱼ。減法也是同樣的道理,對應位置元素相減。
純量乘法則是矩陣的每個元素都乘上同一個純量:如果 k 是純量,那麼 (kA)ᵢⱼ = k·aᵢⱼ。這些運算都很像普通的數字運算,但矩陣乘法可不是這麼簡單。
矩陣乘法的規則是整個矩陣代數中最需要小心的地方。兩個矩陣 A 和 B 相乘,A 的列數必須等於 B 的行數,否則無法相乘。如果 A 是 m × p 矩陣,B 是 p × n 矩陣,則乘積 AB 會是 m × n 矩陣。
乘積矩陣 C = AB 的第 i 列、第 j 行元素 cᵢⱼ,是用 A 的第 i 列和 B 的第 j 行對應元素相乘後加起來得到的:cᵢⱼ = aᵢ₁b₁ⱼ + aᵢ₂b₂ⱼ + ... + aᵢₚbₚⱼ。這個定義是row-by-column(列乘行)的規則。
矩陣乘法最違反直覺的一點是:它不滿足交換律。大多數情況下,AB ≠ BA。所以做矩陣乘法時,順序非常重要!不過矩陣乘法仍然滿足結合律:(AB)C = A(BC),以及分配律:A(B + C) = AB + AC。
在矩陣運算中,單位矩陣 I 扮演的角色類似數字運算中的 1。n 階單位矩陣是一個 n × n 矩陣,對角線上的元素都是 1,其他位置都是 0。任何矩陣乘上單位矩陣都不會改變:AI = IA = A。
類比數字運算中「倒數」的概念,矩陣也有「反矩陣」。如果 A 是一個方陣,存在另一個矩陣 A⁻¹ 使得 A·A⁻¹ = A⁻¹·A = I,那麼 A⁻¹ 就是 A 的反矩陣。一個矩陣要有反矩陣,必須滿足兩個條件:首先,它必須是方陣;其次,它的行列式不能為零。
對於 2 × 2 矩陣,反矩陣有一個可以直接使用的公式。如果
那麼 A 的行列式 det(A) = ad − bc。當 ad − bc ≠ 0 時,反矩陣存在,且
行列式 ad − bc 不為零這個條件非常重要。如果行列式等於零,這個矩陣就沒有反矩陣,我們稱這個矩陣為奇異矩陣。為什麼行列式這麼關鍵?因為它代表的是矩陣所代表的線性變換的面積縮放因子。當行列式為零時,這個變換會把二維面積「壓扁」成一維甚至零維,自然無法逆轉。
矩陣在電腦繪圖中有著根本性的重要性。一張圖片在螢幕上旋轉、縮放、傾斜,都可以表示為矩陣乘法。一個點 (x, y) 經過 2×2 矩陣變換後會得到新的座標 (x', y')。例如,繞原點旋轉 θ 角的變換矩陣是:
[cosθ −sinθ]
[sinθ cosθ]
這個矩陣乘上原始座標,就能得到旋轉後的座標。這就是為什麼 3D 遊戲和電影特效能夠即時渲染大量幾何變換——背後就是高效矩陣運算的功勞。
📖 延伸閱讀:向量運算與應用 · 複數的運算與幾何意義