Chapter 03 推論統計

一、醉漢走路

 

日常生活中,我們看到醉漢走路,都會用「步履蹣跚、東倒西歪」來形容,但是在物理與統計學界,醉漢走路(Drunkard’s Walk)則是一個專有名詞,指的是一種不規則的變動軌跡。在行動時,每一步的變化會以隨機的形式出現,就好像酒後亂步一樣。

與醉漢走路(Drunkard’s Walk)類似的名詞,還有隨機漫步(Random Walk)。加州理工學院曼羅·迪諾(Leonard Mlodinow)教授在《醉漢走路(The Drunkard’s Walk: How Randomness Rules Our Lives)》一書中提到「直覺並不可靠」。他也提及,我們常常以為的偶然,其實都是必然。

迪諾教授在書中舉了許多故事,來說明我們很難對「隨機事件」進行判斷。在該書第九章中,迪諾教授提到「隨機」比「天機」更難以分辨。他以數學家斯賓塞·布朗(Spencer-Brown)的書為例,布朗在書中提到,一個由10的1,000,007次方個0與1所組成的隨機序列裡,出現連續1百萬個0所組成,而且又互不重疊的子序列,至少會有10次(而且10次還是低估)。

迪諾教授提到,想像一下,有一個可憐的科學家,在他的研究過程中,需要用到隨機亂數,結果剛好就碰到上述的隨機序列。他的軟體連續跑出10個0;然後是100個0;接著是1,000個0;之後是10,000個0…。如果他要求退貨,難道錯了嗎?(難道軟體公司也錯了嗎?)

 

迪諾教授進一步指出,Apple最初用在iPod的隨機自動選歌方法就碰到類似的問題,因為總是有顧客認為iPod的隨機自動選歌,感覺上並不隨機。於是蘋果公司的負責人史提夫‧賈伯斯(Steven Jobs)便下令旗下的工程師,讓自動選歌方式,不要那麼隨機,以便讓顧客感覺更隨機。如圖1所示。 

 

圖1 不那麼隨機,以便讓顧客感覺更隨機

繪圖者:謝瑜倩

其實,由於「隨機」經常違反我們的「直覺」,所以在用直覺進行決策時,往往會產生很大的問題。

此外,迪諾教授還提到一個違反我們直覺的觀點。無論是事業是否成功?投資是否賺錢?電影是否賣座?書籍是否暢銷?都跟「命」有關(受到背後的「隨機」所掌控)。

 

在這樣的觀點下,作者期待人們在面對不確定時,能夠改變思維模式,認清使我們有所成就的隨機事件。進而在做決策時,避免產生粗劣的判斷與選擇的偏見。

二、黑天鵝與灰犀牛

最近這幾年,企業在談論「風險管理」議題時,大家都擔心兩種「動物」的突然來臨,一種是相當罕見的黑天鵝(Black swan),一種則是奔馳在大草原上,往往來勢洶洶的灰犀牛(Gray rhino)。

這兩種動物之可怕,一種在於世所罕見,一種則在於人們漠視,但這兩種動物威力都很驚人。紐約大學教授納西姆.尼可拉斯.塔雷伯(Nassim Nicholas Taleb)於2007年出版《黑天鵝效應》(The Black Swan: The Impact of the Highly Improbable)一書後,「黑天鵝」一詞開始流行起來。

首先,「黑天鵝」事件是指那些發生機率極低、不可預測且衝擊力大的事件。但當它真的發生之後,人們往往會對它產生「後見之明」,並且企圖對它的出現做出某種合理的解釋。2001年的「911事件」就是一個典型的範例,例如就有學者指稱911事件並非恐怖攻擊的開始,也不是恐怖攻擊的結束,但卻是恐怖攻擊的重要分水嶺。因為沒想到恐怖份子竟然會利用民航客機發動攻勢,更重要是,美國情報界與國安人員早就預測到,只是大家都不相信它真的會發生。

塔雷伯教授之所會使用「黑天鵝」一詞,主要是因為在16世紀的歐洲,當時的人們根深蒂固地認為所有的天鵝,天生都是白色的。可是後來在1697年,有人在澳洲發現了黑天鵝後,就一舉推翻了人們一直以來存在的信念(只要一隻黑天鵝,就能推翻數以萬計白天鵝所建構起的信念)。

至於「灰犀牛」一詞,則是由曾任紐約世界政策研究所(World Policy Institute)主席的米歇爾.渥克(Michele Wucker)所提出。她於2016年出版《灰犀牛:危機就在眼前,為何我們選擇視而不見?》(The Gray Rhino: How to Recognize and Act on the Obvious Dangers We Ignore)一書,從此「灰犀牛」一詞廣為流傳。

「灰犀牛」是指那些發生機率極高、有明顯地癥兆、突發性強、且衝擊力大,同時容易被忽視的威脅。舉例來說,2008年的美國次貸危機就是「灰犀牛」。因為早在2004年美國聯邦調查局FBI就提醒大家要慎防抵押詐欺;爾後2008年初,世界經濟論壇就指出,當時房地產市場就已潛藏著巨大的衰退風險。

會用「灰犀牛」來做比喻,是因為生長在非洲大草原裡的灰犀牛,身軀碩大、看似行動緩慢,但當灰犀牛狂奔起來,攻擊力爆棚,容易產生極具破壞性的影響。

無論是黑天鵝(Black swan)或是灰犀牛(Gray rhino),都是影響巨大,但黑天鵝發生的機率極低,灰犀牛發生的機率很高。重要的是,它們都不容易看見,或是容易讓人視而不見,如圖1所示。

圖1 黑天鵝與灰犀牛

繪圖者:彭煖蘋

面對黑天鵝與灰犀牛,企業要做好「風險識別」,一個發生機率極低,易受忽略;灰犀牛發生機率很高,易遭忽視。企業當定期檢視、且發揮一定的想像力,在識別完風險之後,即可開始對風險進行評估與回應(如風險規避、風險降低、風險移轉、風險承擔等),並做好「風險控制」。

三、考績最差的5%註定定該淘汰?

在高度競爭的商業世界裡,每年都有許許多多的企業,會遭受外部環境威脅而自然淘汰。企業則為了保持自己的競爭力,也會刻意淘汰不具競爭力的員工。

在人力資源管理的績效考核中,就有一項奉行汰弱留強的「強迫淘汰制」,大意是每年都要評比出績效最差的5%左右的員工,設法讓他們離職或資遣,再引進新血輪替。

這個制度乍看起來沒有問題,畢竟「汰弱留強」是管理上的重要做法。而在這個淘汰制裡,一般都會假設員工績效屬於常態分配(Normal Distribution),左右兩端代表最優秀與最差的人才,但為數不多,能力介於中間的人數則比例最高。

但問題是,如果員工績效並不符合常態分配,連一開始的「假設」都錯了,那後續的做法是否就有問題。

美國印第安那大學人力資源教授恩斯特.奧伯利(Ernest O’Boyle JR.)與華盛頓大學商學院赫爾曼.阿吉尼斯(Herman Aguinis),就在《人事心理學(Personnel Psychology)》期刊上,共同發表了一篇文章,〈最優與最劣:重新審視個人績效的正常水平(The best and the rest: Revisiting the norm of normality of individual performance)〉。

在該篇文章裡,奧伯利與阿吉尼斯教授重新審視了人力資源管理中,眾多企業一個長期存在的假設-「個別員工的績效表現遵循常態分配」。

他們為此進行了五項研究,涉及的範疇包括:研究人員、演藝人員、政治人物以及業餘和職業運動員共633,263名。結果在各個行業、職位類型、績效指標類型、和時間範圍內,結果都非常一致,呈現出「個人績效不是常態分配(Normal Distribution),而是柏拉圖分配(Paretian Distribution)分配」,如圖1所示。

圖1 常態分配與柏拉圖分配

繪圖者:彭煖蘋

柏拉圖分配可以簡單地歸納成一種表達方式,企業中前20%員工,創造出企業80%的績效,至於其它80%的員工帶來20%的結果。只是如果要用這樣的研究來淘汰員工,恐怕會嚇死一堆人。

值得注意的是,這個研究結果顛覆了我們的刻板印象,它也提醒我們,很多時候,錯誤的假設將導致錯誤的管理決策。而「最優與最劣」的研究讓我們重新思考,人力資源管理中選、訓、用、留的影響,畢竟這些議題與個人績效之間有很大的關係。

資料來源:O’Boyle, E. H., & Aguinis, H. (2012). The best and the rest: Revisiting the norm of normality of individual performance. Personnel Psychology, 65(1), 79–119.

四、生日悖論

某一天,在一班約莫有30名學生的課堂上,老師突然提到:「我們來玩個小賭局。只要課堂的現場上,有任何兩位同學的生日是同一天的,就算老師贏;如果沒有任何人的生日是相同的,就算老師輸。如果老師輸了,就請全班喝飲料,如果老師贏,下次上課時,全班不准有人遲到。」假如您剛好是這一個班上的同學,您賭不賭?

直覺上,這個賭局似乎對全班同學很有利,看來飲料是喝定了。畢竟課堂上只有30位同學,但對應到生日,一年卻有365天,兩個人同一天生日應該很低。因為遇到同一天生日的機率為1/365,或0.002739。這機率也太小了吧,這也是在生活中,一旦您遇上到一個和您同一天生日的人,往往會讓您感慨,這也太巧了。

然而,事實上,這場違反直覺的賭局,老師贏的機率可是高達七成,這就是俗稱的「生日悖論(Birthday Paradox)」。

生日悖論是奧地利數學家理察·馮·麥澤斯(Richard von Mises),於1939年針對「資料儲存技術」所發表的論文。大致的內容以數學方式來說:若有一個均勻的映射函數將23個不同、屬於整數集的數,映射到〔1,365〕時,兩個數映射到同一位置的機率為0.5073(>0.5)。因此,可知利用散列儲存技術查尋儲存器時,難免會發生碰撞。

翻譯成白話文的意思為「如果一間屋子裡,有23個人以上,其中2人同一天生日的機率,會大於1/2」。

要算出背後的機率觀念上不難。以30位同學為例,先計算30位同學生日都不相同的機率,第一位同學的生日有365種可能;第二位同學的生日有364種可能(因為生日要不同),第三位同學的生日有363種可能,以此類推,第30位同學生日有336種可能。

所以,30位同學生日都不同的機率為,365 乘 364乘363乘…乘336 除上 365 的 30 次方,大約是30%。所以班上至少有兩位同學生日相同的機率為1–30%等於70%。

從公式來看,所有人的生日都不相同的機率為:

P= 365*364*…*(365-N+1)365N

根據這項公式,n等於23人時,兩人同一天生日的機率1-P(補集),已經為50.7%,意思是,教室內只要有超過23名同學,老師贏的機率已經超過一半;當n一旦來到30人時,1-P為70.6%;而n等於50人時,1-P為97.0%;當n等於60人時,1-P為99.4%。

圖1 兩人生日相同的機率曲線

繪圖者:彭煖蘋

其實,生日悖論往往在提醒我們,「直覺」通常是不可靠的,而且統計學很重要。因此在做決策時,要儘可能地蒐集資料,並對資料進行分析,以利理性決策的進行。還有,就是千萬不要跟老師對賭,因為輸的機率很高。下次上課您就得乖乖地提早來!

五、小時了了,大未必要佳-迴歸均值的有趣現象

先問一個問題,您會不會好奇,在您離開校園一、二十年之後,當年那些功課很好的同學,他們現在在哪裡?他們的社會成就有比您優秀嗎?而經過多方探索,往往您可能會發現,當年那些功課不得了的同學,長大後有些也實在不怎麼樣,出社會就是表現平平,就是所謂的「小時了了,大未必佳」。其實,看完今天的內容,您就會了解這種情況就是統計學上所稱的「迴歸均值」的特殊現象。

1886年,英國遺傳學家弗朗西斯·高爾頓爵士(Sir Francis Galton)在《人類學學院學報(Journal of the Anthropological Institute)》期刊上,發表了一項有趣的研究成果,名為〈遺傳身材回歸平凡(Regression towards mediocrity in hereditary stature)〉。

高爾頓的研究結論是這樣子來的,父母親與他們的子女之間的身高,往往具有相關性,個子高大的父母,通常會生下高個子的小孩,因為身高通常會遺傳。以中國的球星姚明為例,他在官方的紀錄上,身高是226公分,從普通人眼中來看,的確就是個不折不扣的「巨人」。而他的太太葉莉,同樣是個籃球運動員,身高190公分,跟一般中國女性相比,也高人一等,而姚明的女兒姚沁蕾,據說九歲時,就已接近170公分。(原文網址:https://kknews.cc/sports/34emer8.html)。

當然,父母的高大基因,往往容易生出高個子的子女,但是,往往物極必反。一旦身材高大的父母,生出的小孩沒那麼高大;身材矮小的父母,生出的孩子又沒那麼矮小。高爾頓稱這種現象就叫做「迴歸到平均值(regression toward the mean),簡稱迴歸均值」。

當年,高爾頓搜集了205對父母與928名成年子女的身高資料,並將分析結果,整理如表1所示(單位為吋,一吋為2.54公分)。

表1迴歸均值表
資料來源:Francis Galton, Regression towards mediocrity in hereditary stature, Journal of the Anthropological Institute, 15, pp 246–263 ,1886.

最左邊的欄位是父母平均身高的級距(64.5–72.5);最右邊的欄位是兒女身高的中位數(65.8–72.2)。最上面中間的欄位是成年兒女的身高級距(62.2–73.2);最下面的列是父母身高的中位數(66.3–70.0)。

接著我們來看一下表格中間的部分。以父母身高為69.5吋的級距為例,共有41對父母(右邊算起第二欄),兒女中位數為68.9吋(右邊算起第一欄),其中兒女183位(右邊算起第三欄),69.2吋的有33位(右邊算起第九欄)。

從表1中還可以發現,無論是父母或是兒女,身高皆呈常態分配。同時,資料從左下角到右上角呈對角線的分布狀況,代表父母與成年兒女的身高呈現正相關。

而且,對最左欄的父母平均身高的級距,與最右欄的兒女中位數進行比較,可以發現「迴歸均值(regression toward the mean)」的現象。當父母平均身高級距大於68.5吋時,兒女身高的中位數都小於父母的平均身高;當父母平均身高級距小於68.5吋時,兒女身高的中位數都大於父母的平均身高。

最後,高爾頓在文章中,用圖1來呈現迴歸均值的概念。我們可以發現,父母親身高級距的斜率較大,兒女身高級距的斜率較平緩,呼應上一段文字的內容。

圖1迴歸均值圖
資料來源:Francis Galton, Regression towards mediocrity in hereditary stature, Journal of the Anthropological Institute, 15, pp 246–263 ,1886.

而這樣的趨勢,後來被廣泛應用來解釋投資股票和像是「小時了了,大未必佳」等許多社會現象。

作者:鍾皓軒,羅凱陽,蘇宇暉
出版社:旗標科技
出版日期:2023/02/10
語言:繁體中文
定價:500元

回到頂端