Chapter 07 市場分析與行銷資料科學

一、環境分析與行銷資料科學

「環境論」是廿世紀管理學界在探討企業所處經營環境時的一門顯學。進入大數據時代之後,讓我們再回頭檢視一下企業所處的環境是否有所改變,因為環境的改變,代表生活在其中的消費者行為,也一定會跟著調整,唯有有效掌握環境變化趨勢,企業才能正確追蹤消費者動態。

企業所處的環境一般分為超環境(Hyper-Environment)、總體環境(General Environment)、產業環境(Industrial Environment)與市場環境(Market environment),如圖1所示。而環境分析的方式,則包含超環境分析、總體環境分析、產業分析與市場分析。以下先針對總體環境加以說明。

book_picture_0037

圖1 環境架構圖

繪圖者:張庭瑄

在總體環境方面,一般都會以PEST架構來說明。PEST分別指P:Political意指「政治」;E:Economic意指「經濟」;S:Social意指「社會」;T:Technological意指「科技」,其構面和構成要素如圖2所示。

book_picture_0038

圖2 PEST架構

繪圖者:張庭瑄

過去,企業在進行總體環境分析時,一般都透過購買政府或是產業公協會、媒體、市調公司所出版的總體環境趨勢調查報告來進行分析。現在,企業在透過行銷資料科學進行總體環境分析時,可下載全世界的線上開放資料,或是利用網路爬文技術來蒐集相關的初級資料。這樣的好處在於可「即時」取得,同時所分析的內容也較符合自己企業所需,缺點則是在費用上可能會比較高。

實務上,無論是購買或下載趨勢調查報告,或是透過自行分析總體環境的趨勢,各有其優缺點,但兩種做法並沒有太大的衝突,從某些角度來看甚至可以相輔相成。

在產業環境(Industrial Environment)方面,主要分析的對象為顧客(Customer)、供應商(Supplier)、競爭者(Competitor)、潛在競爭者(Potential Competitors)、替代品(Substitutes)和互補品(Complements)等,如圖3所示。

圖3 產業環境架構

繪圖者:廖庭儀

以往企業在進行產業環境分析時,一般都透過問卷或焦點群體訪談顧客、購買產業工協會出版的產業環境趨勢調查報告、聘請行銷研究公司進行競爭者分析等。現在,企業在透過行銷資料科學進行產業環境分析時,除了可透過開放資料或是網路爬文來蒐集相關資料外,還可進一步透過物聯網對消費者行為進行資料蒐集與分析。

最後,產業環境與市場環境的差異,在於市場環境著重於顧客與競爭者,而產業環境還包括供應商等。有關市場分析,日本的著名管理顧問大前研一(Kenichi Ohmae)曾提出3C模型的概念。3C分別為顧客(Customer)與競爭者(Competitor),以及企業本身(Corporation),如圖4所示。

圖4 3C分析

繪圖者:廖庭儀

這樣的3C概念,已言簡意賅地指出市場分析的重點,落在企業本身、競爭者和顧客三者,讓企業在透過行銷資料科學進行市場分析時,能有一個參考的基準點。

二、設置「預警機器人」做企業網路監測前哨

俗話說「民意如流水,東漂西流無常軌」,其實,消費者的想法也像流水一般,難以捉摸和預測。以往要了解消費者的意見,企業得耗時費工派遣專人上網全天監看,然而目前拜網路爬蟲技術和即時通訊APP快速進步之賜,已發展出可以偵測口碑風向的「預警機器人」,快速蒐集並篩選出可能衝擊企業的網路負面口碑與意見,並自動傳輸到手機即時通訊軟體(如:line)上,並且定時提供摘要性指示,告訴企業廠商應特別針對哪些重點做出回應,讓行銷人或公關單位不需耗費時間在網路大海中以人工方式搜尋負面評論,同時可以迅速有效地在第一時間快速回應消費者的抱怨或批評。

當然,要建置針對網路負評的「哨兵」,在做法上,必須從網路爬文與資料彙整出發。綜合上述程序,我們首先建置如圖5,首先透過收集各大網站言論之資料庫,再以演算法進行,最後透過預警機器人由line推播至企業內部使用者手機上,完成整個預警作業。

圖5 預警機器人架構圖

以下讓我們一步步從技術角度來解釋。由於消費者的網路意見、抱怨和批評文經常是他們使用的文字化敘述(如圖1的監控各社群貼文所示),PO文在網路平台上,但這些PO文都屬於非結構化資料,必須先轉換為可分析之結構化資料。

一般的作法是,透過爬文技術,悉數擷取事先鎖定的網路口碑貼文(如圖2所示),其中應包含最重要的文章本身,並將附屬資料一併擷取下來,像是按讚數、分享數、自帶情緒狀態(表情符號等)、時間和日期等有助於判斷的資訊。從圖6中,我們先行鎖定FB粉絲頁等這類非結構化資料,並由相關程式轉換成結構化資料表,以便後續分析。

book_picture_0042

圖6 網路口碑文章資料

繪圖者:張珮盈

接著,透過結巴 (Jieba)開源中文切詞類別庫,將爬得的文字加以「切詞」,再加上自我或產業通用的定義詞庫,完成最終切詞程序(如圖7)。

圖7  將非結構化文字資料,切分成結構化資料

完成切詞後,由電腦計算出每一個語詞在個別文章中出現的次數(見圖8),也就是俗稱的「文章字詞矩陣(Document Term Matrix;DTM)」,然後即可再儲存至資料庫(如圖5的資料庫所示),做為後續預測性分析之用。如此一來,圖8所顯示的欄位即是我們所稱的自變數,也就是可用來預測依變數的「情緒」。此時,「機器學習分類器」便設法從不同文章找出模式(pattern)。而電腦即可對抓取的文章,進行同樣的轉換和比對,接著加以預測。

值得注意的是,圖8的文章字詞矩陣即俗稱的「詞帶模型」,如果要提升預測效能,建議改採tf-idf法或詞向量法,依據我們的經驗,它可以有效提昇5-10%的準確度。

圖8 將已完成的切詞轉換成文章字詞矩陣

接著,展開「輿情分析」步驟(如圖5的預測演算法所示),利用機器學習找出關鍵性的預警貼文,此處,建議以單純貝氏(Naïve Bayes)分類器做為機器學習分類之用,並以監督式學習演算法做情感分析。單純貝氏分類器的優點在於儲存空間及計算時間效能頗佳,毋需耗費太多時間,且其後驗機率上有嚴格的獨立假設。一旦所蒐集的文本數量達到百萬或千萬筆,可依其特性做最大的評估機率來選擇類別,連帶會使正負詞的機率往極端成長,讓分類更準確;後續如果需再做深度類神經網路的讀者,建議使用捲積式網路(Convolutional Neural Network)如CNN、RCNN、Resnet等,以捲積法降維後再進行預測,效果上會比傳統機器學習法要好。

情緒分析方面,透過常見的標註法,事先標記好情緒字詞,讓單純貝氏分類器學習正負面等多種的情緒分類(見圖9),爾後,依照企業偏好的依變數(分享數、留言數等)加以客製化建模。最後將按讚數(Likes counts)、留言數(Comment counts)、留言字詞與分享數(Shares counts)等,當作單純貝氏的自變數,以做為情緒判別,最後產出標示數值的內容警示、網友附議及負評擴散三項指標,並自動傳送到Line上,通知企業使用者(如圖5的Line推播所示)。

同樣,依Mihalcea and Tarau(2004)提出的「文本排序法(Text-Rank)」進行分析,還可製做出「重點摘要」和「建議回答事項」的指示性分析。

book_picture_0045

圖9 人工標記情感詞庫與比較之競爭品牌

繪圖者:李宛樺

完成上述的流程後,我們就可將所選的訊息推播到使用者的手機上,讓成員知迅速知道目前公司或個人所關注的最新消息及動態(如圖10所示)。

book_picture_0046

圖10 最終Line推播畫面呈現

在細部應用上,更可以發現預警機器人的強大之處是,面對每一主題監控的細節程度,實在是一般人力所不能及。以我們自己的校務客戶為例,從圖11、12、13中分別可以知道該校與學費、霸凌和抽菸等相關之預警推播消息,讓該校完整掌握學校內部動態,以加快危機處理的速度。

圖11 學費相關之預警推播

book_picture_0048

圖12 霸凌相關之預警推播

book_picture_0049

圖13 抽菸相關之預警推播

在其他應用上,預警機器人可以搜尋正負面言論,並使用LINE類化近期與企業有關的正、負字詞,讓業者能依照字詞制定後續的決策;同時,依企業偏好之依變數(如分享數和留言數)客製化建立模型,以預測「往後發展趨勢」以及「應注意的貼文事項」;製做「貼文的情緒關鍵字詞」,以便製訂後續產品策略。至於在訊息發佈上還可利用Line定期推播「焦點新聞」,以及定期推出如圖14的「日/週/月報型的情緒分析圖」。

圖14 口碑週/月報

<<本頁僅供試讀,若須閱讀完整章節歡迎參考行銷資料科學>>

行銷資料科學|大數據x市場分析x人工智慧

作者:鍾皓軒,羅凱陽,蘇宇暉
出版社:碁峰
出版日期:2019/07/30
語言:繁體中文
定價:520元
回到頂端