設置「預警機器人」做企業網路監測前哨

俗話說「民意如流水,東漂西流無常軌」,其實,消費者的想法也像流水一般,難以捉摸和預測。以往要了解消費者的意見,企業得耗時費工派遣專人上網全天監看,然而目前拜網路爬蟲技術和即時通訊APP快速進步之賜,已發展出可以偵測口碑風向的「預警機器人」,快速蒐集並篩選出可能衝擊企業的網路負面口碑與意見,並自動傳輸到手機即時通訊軟體(如:line)上,並且定時提供摘要性指示,告訴企業廠商應特別針對哪些重點做出回應,讓行銷人或公關單位不需耗費時間在網路大海中以人工方式搜尋負面評論,同時可以迅速有效地在第一時間快速回應消費者的抱怨或批評。
當然,要建置針對網路負評的「哨兵」,在做法上,必須從網路爬文與資料彙整出發。綜合上述程序,我們首先建置如圖1,首先透過收集各大網站言論之資料庫,再以演算法進行,最後透過預警機器人由line推播至企業內部使用者手機上,完成整個預警作業。
IR小幫手_圖7-5預警機器人架構圖
圖1. 預警機器人架構圖

繪圖者:陳靖宜

以下讓我們一步步從技術角度來解釋。由於消費者的網路意見、抱怨和批評文經常是他們使用的文字化敘述(如圖1的監控各社群貼文所示),PO文在網路平台上,但這些PO文都屬於非結構化資料,必須先轉換為可分析之結構化資料。
一般的作法是,透過爬文技術,悉數擷取事先鎖定的網路口碑貼文(如圖2所示),其中應包含最重要的文章本身,並將附屬資料一併擷取下來,像是按讚數、分享數、自帶情緒狀態(表情符號等)、時間和日期等有助於判斷的資訊。從圖2中,我們先行鎖定FB粉絲頁等這類非結構化資料,並由相關程式轉換成結構化資料表,以便後續分析。
IR小幫手_圖7-6網路口碑文章資料
圖2. 網路口碑文章資料

繪圖者:張珮盈

接著,透過結巴 (Jieba)開源中文切詞類別庫,將爬得的文字加以「切詞」,再加上自我或產業通用的定義詞庫,完成最終切詞程序(如圖3)。

圖3. 將非結構化文字資料,切分成結構化資料
繪圖者:彭煖蘋

完成切詞後,由電腦計算出每一個語詞在個別文章中出現的次數(見圖4),也就是俗稱的「文章字詞矩陣(Document Term Matrix;DTM)」,然後即可再儲存至資料庫(如圖1的資料庫所示),做為後續預測性分析之用。如此一來,圖4所顯示的欄位即是我們所稱的自變數,也就是可用來預測依變數的「情緒」。此時,「機器學習分類器」便設法從不同文章找出模式(pattern)。而電腦即可對抓取的文章,進行同樣的轉換和比對,接著加以預測。

圖4. 將已完成的切詞轉換成文章字詞矩陣

繪圖者:彭煖蘋
值得注意的是,圖4的文章字詞矩陣即俗稱的「詞帶模型」,如果要提升預測效能,建議改採tf-idf法或詞向量法,依據我們的經驗,它可以有效提昇5-10%的準確度。
接著,展開「輿情分析」步驟(如圖1的預測演算法所示),利用機器學習找出關鍵性的預警貼文,此處,建議以單純貝氏(Naïve Bayes)分類器做為機器學習分類之用,並以監督式學習演算法做情感分析。單純貝氏分類器的優點在於儲存空間及計算時間效能頗佳,毋需耗費太多時間,且其後驗機率上有嚴格的獨立假設。一旦所蒐集的文本數量達到百萬或千萬筆,可依其特性做最大的評估機率來選擇類別,連帶會使正負詞的機率往極端成長,讓分類更準確;後續如果需再做深度類神經網路的讀者,建議使用捲積式網路(Convolutional Neural Network)如CNN、RCNN、Resnet等,以捲積法降維後再進行預測,效果上會比傳統機器學習法要好。

情緒分析方面,透過常見的標註法,事先標記好情緒字詞,讓單純貝氏分類器學習正負面等多種的情緒分類(見圖5),爾後,依照企業偏好的依變數(分享數、留言數等)加以客製化建模。最後將按讚數(Likes counts)、留言數(Comment counts)、留言字詞與分享數(Shares counts)等,當作單純貝氏的自變數,以做為情緒判別,最後產出標示數值的內容警示、網友附議及負評擴散三項指標,並自動傳送到Line上,通知企業使用者(如圖1的Line推播所示)。

圖5. 人工標記情感詞庫與比較之競爭品牌
繪圖者:李宛樺
同樣,依Mihalcea and Tarau(2004)提出的「文本排序法(Text-Rank)」進行分析,還可製做出「重點摘要」和「建議回答事項」的指示性分析。

完成上述的流程後,我們就可將所選的訊息推播到使用者的手機上,讓成員知迅速知道目前公司或個人所關注的最新消息及動態(如圖6所示)。

圖6. 最終Line推播畫面呈現

在細部應用上,更可以發現預警機器人的強大之處是,面對每一主題監控的細節程度,實在是一般人力所不能及。以我們自己的校務客戶為例,從圖7、8、9中分別可以知道該校與學費、霸凌和抽菸等相關之預警推播消息,讓該校完整掌握學校內部動態,以加快危機處理的速度。

圖7. 學費相關之預警推播

圖8. 霸凌相關之預警推播

圖9. 抽菸相關之預警推播

在其他應用上,預警機器人可以搜尋正負面言論,並使用LINE類化近期與企業有關的正、負字詞,讓業者能依照字詞制定後續的決策;同時,依企業偏好之依變數(如分享數和留言數)客製化建立模型,以預測「往後發展趨勢」以及「應注意的貼文事項」;製做「貼文的情緒關鍵字詞」,以便製訂後續產品策略。至於在訊息發佈上還可利用Line定期推播「焦點新聞」,以及定期推出如圖10的「日/週/月報型的情緒分析圖」。

圖10. 口碑週/月報

Scroll to Top