下一次會更好?拉普拉斯接續法則來說明
日常生活中,我們經常面臨「統計」和「小數據」等的問題。例如這一班到高雄的自強號會晚點的機率有多少?個人所支持的兄弟象棒球隊,在這次季末賽中可能會贏嗎?其實,提出「貝氏定理」的貝葉斯牧師,對於類似問題的思考,都給了一些解答。
當時,貝葉斯以購買新推出的彩券為例,來推敲類似上述的問題。假設我們不知道新彩券的獲獎率,所以先到彩券行隨機買了10張,結果有5張中獎,那麼推估這一批彩券中獎機率,大概就是0.5。
不過,假設我們只買了一張彩券而且中了獎,那中獎的機率就是1?
聽起來這似乎不太合理,發行彩券的券商會那麼笨嗎?會讓你買的每一張彩券都中獎?不過,如果機率不是1,那麼合理的機率又應該是多少呢?
後來,法國著名的天文學家與數學家拉普拉斯(Pierre Simon, Marquis de Laplace, 1749–1827)又提供了一種簡單的方法,來協助我們估算出背後的機率。
拉普拉斯1774年發表了一篇名為〈論事件成因的機率(Treatise on the Probability of the Causes of Events)〉的論文,解決上述的問題。
假設我們重複一個將導致成功或失敗的實驗,獨立進行 n 次,獲得 s 次成功和 n-s 次失敗,那麼下一次成功的機率是多少?
拉普拉斯提出一個公式,來預測下一次成功的機率。這個公式為:
P(next outcome is success)=(s+1)/(n+2)
這項公式稱為「拉普拉斯接續法則(Laplace’s Rule of Succession)」。其中,n為過去發生試驗的次數(例如,進行了10次試驗),s為成功的次數(例如,5次成功),下次成功的機率就是(s+1)/(n+2)。
舉例來說,假設買了10張彩券(n=10),其中有5張中獎(s=5),下一次中獎的機率就是6/12,為0.5,至少中獎機率沒有往下掉。假如過去火車有10班(n=10)準點,有2班晚點(s=2),下一班火車晚點的機率則是3/12=0.25,也就是下一班準點率還稍微提高了。
拉普拉斯接續法則雖然簡單,並也算是合理,但還是招來了一些批評。在維基百科裡的例子中,根據拉普拉斯所提供的公式,明天太陽升起的機率為:
P(sun will rise tomorrow)=(d+1)/(d+2)
其中 d 是過去太陽升起的次數。有些人認為這樣的計算相當荒謬,但拉普拉斯認為,由於太陽升起的數字太過龐大(以45億年來計算,太陽升起的次數是1.64兆次),因此,可以推斷明天太陽依舊還是會升起,只要不下雨,你明天一早還是可以在東方看到大太陽出現。
拉普拉斯接續法則提供一種簡單的方法,讓我們在面對小數據時,估算下次成功的機率。
作者:蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)
繪圖者:謝瑜倩