Chapter 10 輸出—數據分析與人工智慧
一、 敘述性統計的呈現方式 — 直方圖
先前我們曾經提過,統計學的前半部是以「敘述性統計」為主軸,主要目的在呈現(Presenting)、組織(Organizing)和彙總簡化(Summarizing)資料。除了先前提到以文字資料加數字的表達之外,還有一種就是讓大家一目了然的方式,使用視覺化的「圖表」來表達。
行銷資料科學,很大程度依賴「統計」為基礎,在與大家分享行銷資料科學的過程中,我們必須常常回過頭來介紹統計基礎知識。舉例來說,「敘述性統計」中的圖表,也是在呈現我們所收集的資料集。而這些內容大致不外乎過去發生了什麼事,儘量客觀呈現事實而已。美國著名的資料科學家湯瑪士‧戴文波特(Thomas H.Davenport)就指出,「敘述性統計」中就圖表可以拿來表達企業用了多少人、過去賣出些什麼、達成多少生產目標,並沒有很高深的數學。
不過,戴文波特也請大家記住一個原則,意即「表格比文字好,圖像又比表格好」。另外,受限於圖表的特性,一旦你在工作上需要呈現某些資料特性,就最好使用特定類型的圖表,例如:要呈現比例的,最好使用「長條圖」、「圓餅圖」或者「兩者的綜合圖」。
本文以長條圖為例,來說明看似簡單的長條圖,常常一點也不簡單。我們以CIO IT經理人的《2017–18 CIO大調查》為例,裡面有一張直方圖《搶攻市場商機MarTech不可少》(如圖1所示)來進行說明。
圖1. 2017–18 CIO大調查 繪圖者:王舒憶 資料來源:旗訊科技CIOIT經理人2017–18 CIO大調查
這張直方圖揭示各產業採用MarTech(行銷科技)的比例,從0%到接近90%不等,整體平均32.7%。
現在,請大家思考一下,「這張圖的背後,有何管理意涵?」對於採用MarTech程度高的產業來說(例如電信業、數位企業、保險業、民生消費服務業…等),一旦自己的企業尚未採用,可能就是「落後者」,此時,就可以思考所應採取的作法。反之,對於採用MarTech程度低的產業來說(像是營建工程業、健康醫療業、教育業、傳統製造業…等),如果自己企業已經採用,可能就是「領先者」,此時,一樣可以思考應該採取什麼作法。
接著,再依平均值來看。在平均值以上的產業屬於「領先群產業」;在平均值以下的產業屬於「落後群產業」。而落後群產業當中的領先者(例如教育產業中有採用MarTech的企業),如果要進行標竿學習,就可以針對這些領先群產業中的企業,進行「跨產業標竿學習」。
看似簡單的長條圖,常常一點也不簡單。
二、直方圖(Histogram)與長條圖(Bar chart)之差異
直方圖是統計學中,最初步也是最簡單的圖形表示方法之一,透過數根長方型的圖示,就可以表達一組資料集的大致樣態。因此,這種簡單瞭的表達方式也讓它在各類統計應用中,歷久不衰。
直方圖(Histogram)是每一位初學統計的人的入門課程。如果大家還記得,每位統計老師在第一次上課,介紹到資料集的表示方法時,第一個登場的通常就是「直方圖」。
直方圖的英文為Histogram,第一次看到這個英文單字,會以為直方圖跟歷史History有密切關連,但兩者的關係其實是八竿子打不著。而直方圖還有一個長相近似的孿生兄弟,叫做長條圖(Bar chart),但兩者在表達資料的用法上,還是有一些差異,如圖2所示,初學者應該特別注意。
圖2. 直方圖(Histogram)與長條圖(Bar chart)之差異
基本上,直方圖主要在呈現資料分布的結果,長條圖呈現的是各組資料的大小。直方圖的橫軸變數為「數值型連續變數」,長條圖則為「類別型離散變數」。至於組距的「間隔」,直方圖各組距之間是連接在一起的,彼此之間沒有間隔;長條圖則是組距之間存在著間隔(有人認為,有間隔才能呈現分布的狀態,並讓直方圖和長條圖能有區隔;但也有人認為,有無間隔,差異不大)。
另外,直方圖的組距是有順序的,所以不可相互置換,而長條圖則無順序,可以置換。但長條圖也因為可以置換,通常在畫出圖形後,可以對橫軸的組別,依次數大小進行排序,以利使用者用在後續的決策制定。
此外,直方圖裡各組距次數的加總,即為條形圖的總面積,每個條形圖背後所佔的面積,就代表每個組距中包含的次數。當組距變大時,會使得條形圖的高度跟著改變,如圖3所示。
圖3. 直方圖各組距次數加總
最後,直方圖與長條圖在使用上,有時並不明確。舉例來說,業績報表中常會以「顧客年齡」作為呈現的依據,而年齡是數值型態的連續變數,所以是透過直方圖來呈現(如圖4所示,在此以有間隔方式呈現)。然而,一旦以顧客業績做為排序的依據時(亦即將顧客業績依高至低進行排列),這時候,各個年齡組距的順序就會被打破,此時就會呈現出企業顧客最重要的年齡組距(如圖5所示)。
圖4. 各年齡層組距之營業額
圖5. 各年齡層組距之營業額(排序後)
直方圖表面上看似簡單,卻隱藏了一些內涵,值得初學者特別注意一下。
三、十大AI行銷學相關研究議題
拜科技進步之賜,全球各個產業近年都迎來「人工智慧(AI)」新發展潮流,行銷領域亦是如此。然而,許多行銷人對AI雖抱以厚望,但看待AI仍有如「霧裡看花」,不知道AI往後會如何發展?
芬蘭圖爾庫經濟學院博士後研究員梅哈伊爾•穆斯塔克(Mekhail Mustak)等人,在2021年的《商業研究期刊(Journal of Business Research)》上,發表了一篇文章〈AI行銷學:主題建模、科學計量分析和研究議程(Artificial intelligence in marketing: Topic modeling, scientometric analysis, and research agenda)〉。
該研究的特色在於透過AI研究AI文獻,亦即藉由人工智慧的自然語言處理、機器學習和統計演算法等技術,分析與AI及行銷學相關的文獻,最後找出深具潛力的十大AI行銷學研究主題。希望讓有意朝這方面發展的行銷人,能有更明確的方向。
梅哈伊爾•穆斯塔克等人發現,AI行銷學的研究在2014年之後,開始大量出現,這部分同時呼應了行銷資料科學的發展。圖6 為AI行銷學文獻年度發的表數量。
圖6. AI行銷學文獻年度發表數量
資料來源:Mustak, Mekhail, Joni Salminen, Loïc Pléc, Jochen Wirtz, (2021), “Artificial intelligence in marketing: Topic modeling, scientometric analysis, and research agenda,” Journal of Business Research, Volume 124, January 2021, Pages 389–404.
穆斯塔克等人將主題分成與消費者有關,以及和組織策略有關的兩大類議題。
以下簡述此十大主題:
- 理解消費者情緒(understanding consumer sentiments)
- 人工智慧的工業機會(industrial opportunities of AI)
- 分析顧客滿意度(analyzing customer satisfaction)
- 對電子口碑的洞見(electronic word-of-mouth based insights)
- 改善市場績效(improving market performance)
- 使用人工智慧品牌管理(using AI for brand management)
- 衡量和增強顧客忠誠度和信任度(measuring and enhancing customer loyalty and trust)
- AI和新穎服務(AI and novel services)
- 使用AI改善顧客關係(using AI to improve customer relationships)
- AI和策略行銷(AI and strategic marketing)
有意結合AI的行銷人,從以上這十大主題,應該能夠獲得一定的啟發。
四、從調查、分析、建模預測到系統整合:行銷研究到行銷資料科學
行銷人以調查消費者行為為職志,行銷公司更是隨時在追蹤消費者行為、態度的變化,而如果您曾經搜尋過從事行銷研究公司的官方網站,一定可以發現他們的業務範疇包括競爭者調查、消費者調查、價格調查、商圈調查和民意調查的市場調查;收視率調查、媒體效果研究的媒體研究;品牌管理、產品概念測試、廣告效益評估的專案執行,以及行銷策略和各類行銷業務諮詢的顧問諮詢。而整體看來,這些業務範疇的本質,無非是以「調查」為主,而這一部分更呼應我們之前提到的,行銷研究多以調查、分析為主要目的。
圖7. 行銷研究公司常見的業務範疇
至於行銷資料科學,主要是透過「機器學習(Machine learning)」對內部和外部資料加以分析與建模,為企業帶來「數據分析(Data Analysis)」與「人工智慧(Artificial Intelligence, AI)」的成果。這也是提供行銷資料科學服務的公司,主要的業務範疇。
基本上,這樣的業務範疇本質,其實不只是「調查」,還包括「預測」與「系統」。這部分也呼應我們之前提到的,行銷資料科學不只包括研究分析,還包括資料產品。
圖8. 行銷資料科學的業務範疇
從行銷研究到行銷資料科學,就業務的本質來看,可以分成:調查(Survey)、預測(prediction)與系統(system)。這裡的系統,主要又以人工智慧系統為主。
一般來說,行銷資料科學的「調查」與行銷研究的調查頗為類似。多半是在資料蒐集、資料分析與資料呈現上工具的應用。例如:企業透過網路爬文技術,調查網路口碑,至於「預測」則是能針對企業所欲了解的行銷變數(如消費者的態度與行為)加以預估。例如:全美第二大連鎖量販店塔吉特(Target)公司透過數據分析,進一步預測女性消費者可能已經懷孕,以及未來妊娠期間的消費需要。
至於人工智慧(AI)系統,在實務上,則包括:「+人工智慧(AI)」與「人工智慧(AI)+」。
圖9. +人工智慧(AI)與人工智慧(AI)+
所謂「+人工智慧(AI)」,意指將企業現有的產品或服務,透過人工智慧(AI)產生價值。例如:教育+人工智慧,就是現有教育產業的業者,思考如何透過人工智慧(如AI自動批改英文作文),來為自己的服務進行加值。
更進一步的「人工智慧(AI)+」則是指透過人工智慧(AI)的視角,用顛覆傳統的方式,重新檢視現有產業,甚至創造新的產業。以人工智慧+教育為例,中國的松鼠AI公司,透過AI技術,打造出「智適應學習」系統,讓每一位學生,透過檢測系統,診斷出學生在學科上知識點的不足之處。接著根據不同學生的弱點,推播他應該先行了解的知識點課程,以確保之後的學習能夠更有效。最終來看,這種「人工智慧(AI)+教育」的模式,已經相當貼近孔子一生所追求的「因材施教」。
最強行銷武器 — 整合行銷研究與資料科學
作者:鍾皓軒,羅凱陽,蘇宇暉
出版社:碁峰
出版日期:2021/08/09
語言:繁體中文
定價:580元
作者:鍾皓軒,羅凱陽,蘇宇暉
出版社:碁峰
出版日期:2021/08/09
語言:繁體中文
定價:580元