Chapter 04 研究的類型與資料科學分析的類型
一、研究與資料科學分析的類型
(一) 搞懂您的研究類型—探索性、描述性、相關性與解釋性研究
很多初踏入研究這個領域的研究生,只知道自己做的是量化或是質化研究,卻不清楚自己著手的研究是什麼類型,事實上,知道自己的研究類型有助於對研究問題的掌握,以及能達成什麼樣的研究目的,弄懂這個問題就像知道自己究竟開的是什麼轎車、跑車、推土機或者是坦克。
學者對研究的類型區分有很多種,但大致上的內容包括:探索性(Exploration Research)、描述性(Description Research)、相關性(Relation Research)與解釋性研究(Explanation Research)。簡述如下:
1. 探索性研究(Exploration Research)
顧名思義,探索性研究常使用於探索新的議題,甚至是新的領域。過去幾十年來,在行銷學領域裡,新的概念不斷地出現,例如:從「顧客滿意」、「服務品質」、到「顧客體驗」、「顧客旅程」,這些概念的出現,都是經由探索性研究而生成。
一開始,探索性研究通常傾向使用「歸納法」的方式,因為一開始並沒有一個完整的理論可以協助你演繹,研究者必須先透過一些特殊的個案收集資料,進而歸納出一般性的通則。
探索性研究在研究設計上,通常使用定性法,透過觀察、深度訪談個案的方式來對研究議題進行探索。
2. 描述性研究(Description Research)
顧名思義,描述性研究通常是對所想要觀察的事件進行描述。
在行銷實務中,許多政府或商業調查報告都是屬於描述性研究。舉例來說,無論是文化部每年對出版產業的調查,或是《CIO IT經理人》雜誌每年對各產業的資訊經理所進行的調查報告,都是描述性研究,它們大都在敘述行業裡的現況,例如台灣地區目前有多少家出版社,去年共出版了多少本書之類的內容。
這一類的研究通常比較像是報告式的整理,大多僅是進行資料的蒐集,並加以彙總與解釋,並未對變數之間的關係進行探討。
3. 相關性研究(Relation Research)
顧名思義,相關性研究在確定兩變數間或兩個以上的變數之間,是否有某種關係存在。例如:我們想瞭解「顧客滿意度」與「顧客忠誠度」之間,有何種關係存在?此種關係可能是線性關係,可能是曲線關係。
相關性研究看似簡單,但要做好並不容易。以上述要瞭解「顧客滿意度」與「顧客忠誠度」之間的關係,要先確定「顧客滿意度」與「顧客忠誠度」的操作型定義為何?是否限定產業?是否限制體驗的產品或服務類型?再者,對於發展兩者之間關係的假設,是正相關、負相關、或是無相關,甚至是背後還有其他干擾因素(例如:轉換成本)存在。這些在進行研究時,都需要一一加以釐清,如圖1所示。
圖1. 「顧客滿意度」與「顧客忠誠度」之間的關係
繪圖者:彭煖蘋
資料來源:Thomas O. JonesW. Earl Sasser, Jr., “Why Satisfied Customers Defect.” Harvard Business Review (November 1995).
4. 解釋性研究(Explanation Research)
解釋性研究,顧名思義在於解釋為什麼一種特定的關係會形成。有別於相關性的研究,相關性研究只是在瞭解兩個變數之間的關係,然而解釋性研究,必須去瞭解這兩個變數的關係是如何發生的。例如:研究者想了解,「服務品質」是如何影響「顧客滿意度」的。然而,解釋性研究通常涉及到因果關係的驗證,連帶地也增加了研究的複雜度。
最後,以上的研究類型,彼此之間並非各自獨立,相反的,某些研究甚至同時包含了四種研究。舉例來說:當網路精準行銷的新議題出現後,我們即可就這個議題進行「網路精準行銷」的探索性研究。同時,在此研究中,我們需要針對什麼是「網路精準行銷」進行描述性研究;我們要針對企業在推動「網路精準行銷」的過程裡,它的「關鍵成功因素」和「成功的網路精準行銷」之間的關係,進行相關性研究;更進一步,我們要去瞭解為什麼這些「網路精準行銷的關鍵成功因素」,會影響到企業在推行「網路精準行銷」時專案的成功,而這就屬於解釋性研究了。
(二) 橫斷研究與縱貫研究
從時間觀點來看,研究可以區分成橫斷研究(Cross-sectional research)與縱貫研究(longitudinal research)兩大類,時間的因素攸關研究的「類推性(generalization)」,究竟研究所產生的研究結果,只能代表研究的當下,還是可以向前、後類推呢?
在處理研究的時間議題上,「橫斷面研究」意指可以在同一個時間裡,蒐集並分析不同受試者資料的一種研究(Cooper, 2003)。例如:年齡變數,我們在某一個時間區間內,針對不同年齡的受試者,進行問卷發放,以瞭解這些不同年齡層的人對於一些事情的看法,這樣的研究方式稱為橫斷面的研究。
一般來說,在最理想的情況下,一個碩士班研究生所做的調查,從開始到完成通常得耗費三個月到六個月的時間,儘管調查時間的跨距,已長達九十到一百八十天,但是從研究時間的角度來看,它僅屬於某一個時間點對母體或現象樣本描述的「橫斷研究」。
再舉一個例子,像是新聞媒體會做總統候選人的民意調查,他們發佈結果的當天,都只是在某一個時間點由選舉人口對總統候選人的勝負看法,無法完全類推到投票日的最後結果。同樣的,探索性和描述性的研究都屬於「橫斷研究」、解釋性的研究也屬之。
至於「縱貫研究」是一種跨越長時間的觀察研究(Cooper, 2003),短則數個月,長的話可達5–10年甚至更長的研究期間。更重的是,這類研究方式會針對同一研究樣本,進行2~3次以上不同的詢問。由於涉及時間與成本的考量,加上不容易設計與執行,所以縱貫面研究相對較少,並且都是由大型研究或學術機構來處理。
舉例來說,哈佛大學有項研究進行至今已經超過75年,從1938年開始,該研究持續追蹤724位研究對象,每一年哈佛的研究團隊都會對研究對象進行訪談,了解他們的生活、健康、工作等狀況。該研究發現,良好的人際關係,讓人們快樂與健康。
從圖形的角度來看(如圖2所示),Time軸代表的是不同的時間點,橫斷面研究就是針對某一個時間點的研究;而縱貫面的研究則是屬於不同時間點的研究。透過這個圖形,我們可以更加瞭解橫貫面與縱貫面的差異。
圖2. 橫斷面與縱貫面研究
繪圖者:陳靖宜
不知道大家有沒有發現,「橫斷面研究」很像是高速公路的測速照相,紀錄著當車輛超速時的瞬間。而縱斷面研究,就好比「ETC」記錄車輛上高速公路後,首次與最後一次被ETC偵測到時間點。
值得一提的是,由於碩士階段的時間因素,導致絕大多數碩士同學的論文,皆是屬於橫斷面的研究,通常會只針對同一個研究對象,進行一次的問卷發放;而大部分的期刊論文中發現,橫斷面研究所佔的比例居多。
最後,根據周文賢(2002)在《多變量分析》一書中所提,在碩士生階段,大多數同學的論文多以橫斷面為主,所使用的統計工具,包括:多元尺度分析、集群分析、因素分析、共變數分析、ANOVA分析與迴歸分析等。在博士生階段,除了上述的工具外,還要學習共變數模式、LISREL、路徑分析等工具。若要從事到縱貫面的研究,還必須學習諸如時間序列等的工具。以上的說明,同時點出橫斷面研究與縱貫面研究,在使用工具上的差別。
二、相關與因果
(一) 相關性-風吹草低見牛羊
南北朝「樂府詩集」中的《敕勒歌》中有一句「風吹草低見牛羊」的句子,剛好可以用來說明在做研究時,告訴我們很容易設定出「隨意而不當的假設(Hypothesis)」,並且掉進統計「相關性」的迷思裡。
話說,有一對夫妻,先生是氣象學家、太太是動物學者,兩二人到墾丁進行研究,先生對落山風的風速進行詳細的量測,妻子對墾丁草原上的牛羊數量進行詳細的計算。兩人的數據經過分析,得到高度的相關,因此推論,「風速」與「牛羊」數量之間有正向的關係,換句話說,風速愈大時,草原上的牛羊數會愈多。
許多人在聽完這個故事時,大多只會莞爾一笑,說是哪個學者這麼白目,但是真正在做研究,或是做決策收集資訊時,大家卻很容易掉到這樣的陷阱裡。
「風速」與「牛羊數」,兩個變數之間看似「有關」,但事實確是,草原上的牛羊數是固定的,與風速「無關」,如圖3所示。
圖3. 「風速」與「牛羊數」看似「有關」但「無關」
另一種相關性的問題則剛好相反,兩個變數之間看似「無關」,但事實上確是「有關」。例如︰在之前的文章中提到過「雀巢即溶咖啡」的案例,當雀巢經過嚴謹的研究,推出「雀巢即溶咖啡」後卻賣不出去,這時我們會直覺地認為,「業績」好壞,一定跟「產品」、「價格」、「促銷」、或是「通路」有關,於是就想辦法改變包裝、降價、多打廣告或是透過其他通路去賣。結果是,「業績」的好壞,與雀巢即溶咖啡的「使用者形象」有關(被認為是懶惰、不會規劃家計而且是浪費的家庭主婦)。看似「無關」的兩個變數之間,但事實上確是「有關」。只是在未做研究之前,我們並不知道。
為了要打破「相關性」的迷思,我們必須透過嚴謹的分析,來避免將「無關」的事誤認成「有關」。同時,我們也必須透過宏觀性的思考,來避免將「有關」誤認為「無關」。
在管理學理論與實務中,「相關分析」(Correlation Analysis),是經常應用到的工具與概念,但在實際應用時,則要避免犯了以上的錯誤。
(二) 世界夜間光點與GDP的關係─相關性研究
學過經濟學的同學應該都知道,由各國政府官方所公佈的GDP,通常只能呈現國家經濟的部分面貌,因為這些數據無法完全揭露像是攤販、賭博、毒品,甚至是賣淫等地下經濟活動。過去為了能夠更真實呈現一個國家的經濟狀況,許多研究者企圖利用不同的方式來衡量,像是一顆大麥克漢堡在各國的售價,女生迷你裙長短與經濟指標的連動性等。後來,也有人想到利用衛星照片上,各國陸地上在夜間光點的變化,來推測國家GDP,畢竟夜間活動也和國民經濟能力有很大的關連性。
有趣的是,此舉也讓原本兩件看似風馬牛不相及的事,將不同資訊結合在一起後,產生出「哇!」令人為之一歎的交集。
研究人員之所以會這樣認定,是因為無論消費或投資活動都需要燈光。弗農·亨德森(J. Vernon Henderson)等三位學者蒐集了美國空軍氣象衛星,於1992–2003年所拍攝的各國夜間光點照片,再將光點的數量及密度變化,與各國的GDP做比較,發現兩者之間確實有關。透過這種方式,三位學者估計,有不少國家所提出的官方數據,與該國實際經濟數據差距很大。
最後,三人在論文中提到,這種利用光點推算GDP的方式,雖然未必適用於那些資料可靠度較高的國家,但對於那種連官方統計資料都沒有的地方,這種方法著實提供很大的助益,如圖4所示。
圖4. 世界夜間光點與GDP的關係
繪圖者:鄭雅馨
其實,這個故事說到這裡,有兩件事情必須注意,一是如何培養自己,具備看出兩件看似無關,但其實卻有關連的能力。反之,如何避免將看似有關,但其實卻是無關的兩件事情,硬是牽扯在一起。
對於這兩個問題,背後有一個共通的答案,那就是隱藏在其背後的「邏輯」。只要我們能夠將兩件事情背後可能發生的原因,做合理的交代,這樣就有機會證明彼此的相關性。
至於尋找邏輯的方式,可以來自於「直覺」或是「科學」。其中,有關直覺的部份,如果覺得課堂上所教過的決策方法太難,我們可以透過閱讀各類小說來練習。閱讀小說讓我們有機會瀏覽到,許多看似不可思議,但背後卻有著充分邏輯支持的劇情描述。藉由這樣的練習,我們就有機會在閱讀其他小說時,開始預測劇情。甚至在未來,自己還可以設計劇情,讓結果再怎麼峰迴路轉的劇情,背後都有了清楚的邏輯。
至於科學的部份,學習「研究方法」則是一個很好的切入方式。例如在行銷研究裡經常提到的「嬰兒尿布與啤酒」案例,這兩種看似無關的產品,透過統計學的應用,竟然發現兩者背後有著高度的關連性。主要的原因來自於,許多有嬰幼兒的家庭主婦,會請先生在下班後,順便去買尿布,然而先生到了超市,通常會順手帶著啤酒回家。因此賣場在擺設產品時,會刻意將尿布與啤酒擺在相鄰的地方,同步拉高啤酒的銷售量。背後的簡單邏輯因此出現(雖然後來這個故事證明只是個傳說,但背後的技術卻是真實的)。
事實上,無論透過直覺或是科學,原本看似風馬牛不相及的兩件事情,經過仔細思考或是研究之後,也許真的就產生「風吹草低見牛羊」,發現「風速」與「牛羊數量」之間有了相關性。
最強行銷武器 — 整合行銷研究與資料科學
作者:鍾皓軒,羅凱陽,蘇宇暉
出版社:碁峰
出版日期:2021/08/09
語言:繁體中文
定價:580元
作者:鍾皓軒,羅凱陽,蘇宇暉
出版社:碁峰
出版日期:2021/08/09
語言:繁體中文
定價:580元