Chapter 10 輸出—數據分析與人工智慧

一、 敘述性統計的呈現方式 — 直方圖

先前我們曾經提過,統計學的前半部是以「敘述性統計」為主軸,主要目的在呈現(Presenting)、組織(Organizing)和彙總簡化(Summarizing)資料。除了先前提到以文字資料加數字的表達之外,還有一種就是讓大家一目了然的方式,使用視覺化的「圖表」來表達。

行銷資料科學,很大程度依賴「統計」為基礎,在與大家分享行銷資料科學的過程中,我們必須常常回過頭來介紹統計基礎知識。舉例來說,「敘述性統計」中的圖表,也是在呈現我們所收集的資料集。而這些內容大致不外乎過去發生了什麼事,儘量客觀呈現事實而已。美國著名的資料科學家湯瑪士‧戴文波特(Thomas H.Davenport)就指出,「敘述性統計」中就圖表可以拿來表達企業用了多少人、過去賣出些什麼、達成多少生產目標,並沒有很高深的數學。

不過,戴文波特也請大家記住一個原則,意即「表格比文字好,圖像又比表格好」。另外,受限於圖表的特性,一旦你在工作上需要呈現某些資料特性,就最好使用特定類型的圖表,例如:要呈現比例的,最好使用「長條圖」、「圓餅圖」或者「兩者的綜合圖」。

本文以長條圖為例,來說明看似簡單的長條圖,常常一點也不簡單。我們以CIO IT經理人的《2017–18 CIO大調查》為例,裡面有一張直方圖《搶攻市場商機MarTech不可少》(如圖1所示)來進行說明。

圖1. 2017–18 CIO大調查    繪圖者:王舒憶    資料來源:旗訊科技CIOIT經理人2017–18 CIO大調查

這張直方圖揭示各產業採用MarTech(行銷科技)的比例,從0%到接近90%不等,整體平均32.7%。

現在,請大家思考一下,「這張圖的背後,有何管理意涵?」對於採用MarTech程度高的產業來說(例如電信業、數位企業、保險業、民生消費服務業…等),一旦自己的企業尚未採用,可能就是「落後者」,此時,就可以思考所應採取的作法。反之,對於採用MarTech程度低的產業來說(像是營建工程業、健康醫療業、教育業、傳統製造業…等),如果自己企業已經採用,可能就是「領先者」,此時,一樣可以思考應該採取什麼作法。

接著,再依平均值來看。在平均值以上的產業屬於「領先群產業」;在平均值以下的產業屬於「落後群產業」。而落後群產業當中的領先者(例如教育產業中有採用MarTech的企業),如果要進行標竿學習,就可以針對這些領先群產業中的企業,進行「跨產業標竿學習」。

看似簡單的長條圖,常常一點也不簡單。

二、直方圖(Histogram)與長條圖(Bar chart)之差異

直方圖是統計學中,最初步也是最簡單的圖形表示方法之一,透過數根長方型的圖示,就可以表達一組資料集的大致樣態。因此,這種簡單瞭的表達方式也讓它在各類統計應用中,歷久不衰。

直方圖(Histogram)是每一位初學統計的人的入門課程。如果大家還記得,每位統計老師在第一次上課,介紹到資料集的表示方法時,第一個登場的通常就是「直方圖」。

直方圖的英文為Histogram,第一次看到這個英文單字,會以為直方圖跟歷史History有密切關連,但兩者的關係其實是八竿子打不著。而直方圖還有一個長相近似的孿生兄弟,叫做長條圖(Bar chart),但兩者在表達資料的用法上,還是有一些差異,如圖2所示,初學者應該特別注意。

0_OSp7hkXwZAOMAZZ3

圖2. 直方圖(Histogram)與長條圖(Bar chart)之差異

基本上,直方圖主要在呈現資料分布的結果,長條圖呈現的是各組資料的大小。直方圖的橫軸變數為「數值型連續變數」,長條圖則為「類別型離散變數」。至於組距的「間隔」,直方圖各組距之間是連接在一起的,彼此之間沒有間隔;長條圖則是組距之間存在著間隔(有人認為,有間隔才能呈現分布的狀態,並讓直方圖和長條圖能有區隔;但也有人認為,有無間隔,差異不大)。

另外,直方圖的組距是有順序的,所以不可相互置換,而長條圖則無順序,可以置換。但長條圖也因為可以置換,通常在畫出圖形後,可以對橫軸的組別,依次數大小進行排序,以利使用者用在後續的決策制定。

此外,直方圖裡各組距次數的加總,即為條形圖的總面積,每個條形圖背後所佔的面積,就代表每個組距中包含的次數。當組距變大時,會使得條形圖的高度跟著改變,如圖3所示。

直方圖各組距次數加總

圖3. 直方圖各組距次數加總

最後,直方圖與長條圖在使用上,有時並不明確。舉例來說,業績報表中常會以「顧客年齡」作為呈現的依據,而年齡是數值型態的連續變數,所以是透過直方圖來呈現(如圖4所示,在此以有間隔方式呈現)。然而,一旦以顧客業績做為排序的依據時(亦即將顧客業績依高至低進行排列),這時候,各個年齡組距的順序就會被打破,此時就會呈現出企業顧客最重要的年齡組距(如圖5所示)。

各年齡層組距之營業額

圖4. 各年齡層組距之營業額

各年齡層組距之營業額(排序後)

圖5. 各年齡層組距之營業額(排序後)

直方圖表面上看似簡單,卻隱藏了一些內涵,值得初學者特別注意一下。

三、十大AI行銷學相關研究議題

拜科技進步之賜,全球各個產業近年都迎來「人工智慧(AI)」新發展潮流,行銷領域亦是如此。然而,許多行銷人對AI雖抱以厚望,但看待AI仍有如「霧裡看花」,不知道AI往後會如何發展?

芬蘭圖爾庫經濟學院博士後研究員梅哈伊爾•穆斯塔克(Mekhail Mustak)等人,在2021年的《商業研究期刊(Journal of Business Research)》上,發表了一篇文章〈AI行銷學:主題建模、科學計量分析和研究議程(Artificial intelligence in marketing: Topic modeling, scientometric analysis, and research agenda)〉。

該研究的特色在於透過AI研究AI文獻,亦即藉由人工智慧的自然語言處理、機器學習和統計演算法等技術,分析與AI及行銷學相關的文獻,最後找出深具潛力的十大AI行銷學研究主題。希望讓有意朝這方面發展的行銷人,能有更明確的方向。

梅哈伊爾•穆斯塔克等人發現,AI行銷學的研究在2014年之後,開始大量出現,這部分同時呼應了行銷資料科學的發展。圖6 為AI行銷學文獻年度發的表數量。

圖6. AI行銷學文獻年度發表數量

資料來源:Mustak, Mekhail, Joni Salminen, Loïc Pléc, Jochen Wirtz, (2021), “Artificial intelligence in marketing: Topic modeling, scientometric analysis, and research agenda,” Journal of Business Research, Volume 124, January 2021, Pages 389–404.

穆斯塔克等人將主題分成與消費者有關,以及和組織策略有關的兩大類議題。

以下簡述此十大主題:

  1. 理解消費者情緒(understanding consumer sentiments)
  2. 人工智慧的工業機會(industrial opportunities of AI)
  3. 分析顧客滿意度(analyzing customer satisfaction)
  4. 對電子口碑的洞見(electronic word-of-mouth based insights)
  5. 改善市場績效(improving market performance)
  6. 使用人工智慧品牌管理(using AI for brand management)
  7. 衡量和增強顧客忠誠度和信任度(measuring and enhancing customer loyalty and trust)
  8. AI和新穎服務(AI and novel services)
  9. 使用AI改善顧客關係(using AI to improve customer relationships)
  10. AI和策略行銷(AI and strategic marketing)

有意結合AI的行銷人,從以上這十大主題,應該能夠獲得一定的啟發。

四、從調查、分析、建模預測到系統整合:行銷研究到行銷資料科學

行銷人以調查消費者行為為職志,行銷公司更是隨時在追蹤消費者行為、態度的變化,而如果您曾經搜尋過從事行銷研究公司的官方網站,一定可以發現他們的業務範疇包括競爭者調查、消費者調查、價格調查、商圈調查和民意調查的市場調查;收視率調查、媒體效果研究的媒體研究;品牌管理、產品概念測試、廣告效益評估的專案執行,以及行銷策略和各類行銷業務諮詢的顧問諮詢。而整體看來,這些業務範疇的本質,無非是以「調查」為主,而這一部分更呼應我們之前提到的,行銷研究多以調查、分析為主要目的。

圖7. 行銷研究公司常見的業務範疇

至於行銷資料科學,主要是透過「機器學習(Machine learning)」對內部和外部資料加以分析與建模,為企業帶來「數據分析(Data Analysis)」與「人工智慧(Artificial Intelligence, AI)」的成果。這也是提供行銷資料科學服務的公司,主要的業務範疇。

基本上,這樣的業務範疇本質,其實不只是「調查」,還包括「預測」與「系統」。這部分也呼應我們之前提到的,行銷資料科學不只包括研究分析,還包括資料產品。

1_5jbeIWGrE801KDN7s-goUg

圖8. 行銷資料科學的業務範疇

從行銷研究到行銷資料科學,就業務的本質來看,可以分成:調查(Survey)、預測(prediction)與系統(system)。這裡的系統,主要又以人工智慧系統為主。

一般來說,行銷資料科學的「調查」與行銷研究的調查頗為類似。多半是在資料蒐集、資料分析與資料呈現上工具的應用。例如:企業透過網路爬文技術,調查網路口碑,至於「預測」則是能針對企業所欲了解的行銷變數(如消費者的態度與行為)加以預估。例如:全美第二大連鎖量販店塔吉特(Target)公司透過數據分析,進一步預測女性消費者可能已經懷孕,以及未來妊娠期間的消費需要。

至於人工智慧(AI)系統,在實務上,則包括:「+人工智慧(AI)」與「人工智慧(AI)+」。

1_HJZwxS6aRXfRSW4pHuh6VA

圖9.  +人工智慧(AI)與人工智慧(AI)+

所謂「+人工智慧(AI)」,意指將企業現有的產品或服務,透過人工智慧(AI)產生價值。例如:教育+人工智慧,就是現有教育產業的業者,思考如何透過人工智慧(如AI自動批改英文作文),來為自己的服務進行加值。

更進一步的「人工智慧(AI)+」則是指透過人工智慧(AI)的視角,用顛覆傳統的方式,重新檢視現有產業,甚至創造新的產業。以人工智慧+教育為例,中國的松鼠AI公司,透過AI技術,打造出「智適應學習」系統,讓每一位學生,透過檢測系統,診斷出學生在學科上知識點的不足之處。接著根據不同學生的弱點,推播他應該先行了解的知識點課程,以確保之後的學習能夠更有效。最終來看,這種「人工智慧(AI)+教育」的模式,已經相當貼近孔子一生所追求的「因材施教」。

最強行銷武器 — 整合行銷研究與資料科學

作者:鍾皓軒,羅凱陽,蘇宇暉
出版社:碁峰
出版日期:2021/08/09
語言:繁體中文
定價:580元

作者:鍾皓軒,羅凱陽,蘇宇暉
出版社:碁峰
出版日期:2021/08/09
語言:繁體中文
定價:580元

回到頂端