白努利黃金定理(Theorema Aureum)
想像一下,房間的桌上有一個很大的罐子,裡面有2,000顆黑色石頭與3,000顆白色石頭。現在,如果要從裡面取出白色石頭,算一下機率是3,000/5,000=0.6,大概是取出十顆會有六顆是白色石頭。但是,假設我們不知道罐子裡的石頭比例,這時候,我們應該要抽多少顆石頭,才能有「信心」地推論出「接近」背後真正的機率。
先說明,我們這裡指的「信心」可能是90%;95%;99%;至於「接近」,又稱「精確度」,可能與真實機率之間,相差±10%、±5%、±1%。
其實,在直覺上,信心度越強,接近程度越近,所需的抽出石頭的數量,就要越多。根據瑞士籍的數學家雅各‧白努利在十七世紀的計算,要在99.9%的信心水準下,以及落在±2%的誤差水準下,必須要抽出25,550顆石頭,遠大於罐子裡的5,000顆。(不過,依據現在的計算,只要抽出6,767顆,各位可用網路上的樣本計數器來檢驗一下)
http://www.raosoft.com/samplesize.html
實務上,面對以上的問題,一般會採取降低信心水準或是精確度的做法。以民調為例,如果抽樣人數達到1068人,將有95%的機會,達到±3%誤差的結果。
事實上,以上抽取石頭的過程,可以把它想成是一次次的試驗,每次試驗都只有兩種結果,而且結果是隨機出現、彼此獨立的。這樣的試驗,在統計學裡稱為「白努利試驗」,而一次次試驗的過程,稱為「白努利過程」。由於每次試驗都只有兩種結果,因此又稱做「二項分佈」。這在生活上就有很多的應用。像是生男生女、買或不買、是或否,投籃進或不進……等,都可以用白努利試驗來模擬。
值得注意的是,要計算一個事件的發生機率,必要先知道隱藏在其背後的機率分佈是什麼。例如投籃比賽,連續投兩次都進球的機率就是1/2*1/2。至於等公車的時間,則用「卜瓦松(Poisson Distribution)」分佈,因為它主要是在單位時間內隨機事件發生次數的機率分布。而像電話交換機之類的服務設施,在一定時間內接受服務請求的次數、汽車站台的候客人數、機器出現的故障數,甚至是自然災害發生的次數,一樣適用卜瓦松分佈,它的機率分佈就和二項分佈不同。
雅各•白努利(Jakob Bernoulli)將他的證明稱為黃金定理,又稱「大數法則」(或弱大數法則)。而這個法則,也在他死後第八年,即1713年出現在他的鉅著《猜度術》(Ars Conjectandi)裡,如圖1所示。

作者:蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)