如何分辨長相近似的孿生兄弟-
直方圖(Histogram)與長條圖(Bar chart)之差異

直方圖是統計學中,最初步也是最簡單的圖形表示方法之一,透過數根長方型的圖示,就可以表達一組資料集的大致樣態。因此,這種簡單瞭的表達方式也讓它在各類統計應用中,歷久不衰。

直方圖(Histogram)是每一位初學統計的人的入門課程。如果大家還記得,每位統計老師在第一次上課,介紹到資料集的表示方法時,第一個登場的通常就是「直方圖」。

直方圖的英文為Histogram,第一次看到這個英文單字,會以為直方圖跟歷史History有密切關連,但兩者的關係其實是八竿子打不著。而直方圖還有一個長相近似的孿生兄弟,叫做長條圖(Bar chart),但兩者在表達資料的用法上,還是有一些差異,如圖1所示,初學者應該特別注意。

圖1 . 直方圖(Histogram)與長條圖(Bar chart)之差異

基本上,直方圖主要在呈現資料分布的結果,長條圖呈現的是各組資料的大小。直方圖的橫軸變數為「數值型連續變數」,長條圖則為「類別型離散變數」。至於組距的「間隔」,直方圖各組距之間是連接在一起的,彼此之間沒有間隔;長條圖則是組距之間存在著間隔(有人認為,有間隔才能呈現分布的狀態,並讓直方圖和長條圖能有區隔;但也有人認為,有無間隔,差異不大)。

另外,直方圖的組距是有順序的,所以不可相互置換,而長條圖則無順序,可以置換。但長條圖也因為可以置換,通常在畫出圖形後,可以對橫軸的組別,依次數大小進行排序,以利使用者用在後續的決策制定。

此外,直方圖裡各組距次數的加總,即為條形圖的總面積,每個條形圖背後所佔的面積,就代表每個組距中包含的次數。當組距變大時,會使得條形圖的高度跟著改變,如圖2所示。

圖2. 直方圖各組距次數加總

最後,直方圖與長條圖在使用上,有時並不明確。舉例來說,業績報表中常會以「顧客年齡」作為呈現的依據,而年齡是數值型態的連續變數,所以是透過直方圖來呈現(如圖3所示,在此以有間隔方式呈現)。然而,一旦以顧客業績做為排序的依據時(亦即將顧客業績依高至低進行排列),這時候,各個年齡組距的順序就會被打破,此時就會呈現出企業顧客最重要的年齡組距(如圖4所示)。

圖3 .各年齡層組距之營業額
圖4. 各年齡層組距之營業額(排序後)

直方圖表面上看似簡單,卻隱藏了一些內涵,值得初學者特別注意一下。

作者:蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)

繪圖:傅嬿珊、彭煖蘋

更多商普好文推薦

主觀機率與貝氏定理

主觀機率與貝氏定理 先前我們曾經提過,機率可以分成「客觀機率」與「主觀機率」。客觀機率主要與頻率有關,像是當丟一枚公平銅板的次數越多,出現正

閱讀更多 »
回到頂端