「模型」是「真實現象的精簡呈現」

行銷資料科學家在進行數據分析時,需要擁有不同的思維模式,包括:統計思維、運算思維、模型思維……等。其中,統計思維強調運用統計學的工具,來對資料進行分析與判讀;運算思維讓我們能像電腦一樣思考,透過邏輯推演解決問題;模型思維則是透過模型,來協助對問題進行思考,進而提出有價值的方案。

而為了要學習「模型思維」,我們必須先解釋何謂「模型」(Model)?

資料科學家要學的模型很多,常見的有:TF-IDF模型(Term Frequency-Inverse Document Frequency Model)、線性迴歸模型(Linear Regression Model)、隱馬可夫模型(Hidden Markov Model)、邏輯迴歸模型(Logistic Regression Model)、類神經網路模型(Neural Network Model)……等。

這些模型聽起來很複雜,而且給感覺數學很多。事實上,「模型」本身並不複雜。簡單來說,「模型」是指「真實現象的精簡呈現」。這裡的真實現象,可以是浩瀚的宇宙,也可以是渺小的粒子;可以是有形的物質,也可以是無形的想法。將這些真實現象,用某種形式,精簡地呈現出來,就是所謂的模型。

舉例來說,地球儀就是一種實體模型,透過圓圓的一顆球,來呈現地球的縮小比。而馬斯洛(Maslow)需求層級則是一種概念圖模型,透過簡單的三角形(如圖1所式),來呈現人們內心不同的需求階層。

333
圖1 馬斯洛需求層級模型

既然「模型」是「真實現象的精簡呈現」,那判斷一個模型的好壞,也可以從這個定義切入。根據這個定義,一個好的模型,其反映出真實現象的程度要高;同時,呈現時的精簡程度也要高(亦即不能太過複雜),如圖2所示。

444
圖2 模型的好壞

如果一個「模型」無法呈現出「真實現象」,就好比一顆地球儀看不出是地球,這時,無論該模型是簡單還是複雜,都不是好的模型。

此外,模型的複雜度牽涉到使用者的認知程度,或是在製作時的成本效益。以認知程度來說,簡單的模型比複雜的模型更容易讓使用者所接受。而當一個簡單的模型,能夠和複雜模型一樣,甚至比複雜模型更能呈現出真實現象。這時,簡單的模型就比複雜的模型來的好。

至於成本效益的部分,類似飛行模擬器這種模型,因為涉及身死攸關的飛安大事,所以模型本身要非常複雜,甚至是要做到幾乎擬真的程度。否則簡單的模型,因為相對成本較低,如果能夠帶來相同的效益,當然便是屬於更好的模型。

作者:羅凱揚(台科大企管系博士)、鍾皓軒(臺灣行銷研究有限公司創辦人)
繪圖者:彭煖蘋

更多商普好文推薦

回到頂端