隨機變數與期望值:從機率走向統計的橋樑

統計 · 閱讀時間約 10 分鐘
隨機變數與機率分布圖

到目前為止,我們討論的機率都是「某件事發生」的機率。但現實生活中,我們經常需要處理的問題是:一個隨機過程會產生什麼樣的「數值」結果?這個數值結果的平均表現會是多少?這就是隨機變數與期望值要處理的問題。

一、隨機變數的引入

想像擲兩枚硬幣,我們關心的不再是「都是正面」這個事件,而是「有幾個正面」。正面數可以是 0、1、2,分別對應「HH」、「HT/TH」、「TT」。

這個「正面數」就是一個隨機變數——它是一個函數,將每一個樣本空間中的結果映射到一個實數值。根據可以取到的值,隨機變數分為離散型(有限或可數多個值)和連續型(區間內任意實數)。

二、機率質量函數(PMF)

對於離散隨機變數 X,PMF 告訴我們 X 取每個可能值的機率:P(X = x)。例如上例中,P(X=0) = 1/4、P(X=1) = 1/2、P(X=2) = 1/4。注意所有可能值的機率之和必為 1。

三、期望值的定義與意義

期望值 E(X) 是隨機變數所有可能值的加權平均:

E(X) = Σ x_i × P(X = x_i)

期望值不是「最可能發生的值」,而是長期重複實驗的平均結果。例如輪盤遊戲,每次結果是不可預測的,但玩很多次之後,平均每次的結果會趨近期望值。

四、期望值的基本性質

期望值有幾個非常重要的代數性質:

這些性質在計算複雜隨機變數的期望值時極為有用。

五、變異數與標準差

期望值描述的是「平均結果」,但同樣的期望值可以來自截然不同的分布。例如一個收入期望值為 50 萬的職業,可能是每個人都恰好賺 50 萬,也可能是一半人賺 100 萬一半人破產。變異數就是用來衡量這種「分散程度」的指標:

Var(X) = E[(X − E(X))²] = E(X²) − [E(X)]²

第二個等號有時更容易計算,因為它只需要計算 X² 的期望值和 X 期望值的平方。

六、二項分配的期望值與變異數

二項隨機變數 B(n,p) 代表 n 次獨立試驗中成功的次數,其期望值和變異數有簡潔的公式:

E(B) = np  Var(B) = np(1 − p)

這兩個公式的推導需要用到期望值的線性性質和獨立性,假設有興趣可以自行推導看看。

結語

隨機變數、期望值和變異數是統計學的三大基石。掌握這三個概念之後,你就有了從「描述單一事件機率」升級到「分析隨機系統整體表現」的能力。

📖 延伸閱讀:二項分配與常態分配 · 機率論基礎與應用