機器學習 X 精準行銷 KDD 2.0程序:
【內部資料】實案應用 (附Python程式碼)

在開始之前,可參考先前撰寫的2篇文章,我們可以得到的概念:

  1. 【學習機器學習必知的程序 — 資料庫知識探索】讀者可基礎了解到利用資料庫知識探索(Knowledge Discovery in Database, KDD),可以將大量已存在的「資料」 ,透過層層的處理,最終分析出有意義、甚至可以幫助企業決策的「知識」。
  2. 機器學習 X 精準行銷 KDD 2.0程序:【外部資料】概念 (附實案應用)】 :則藉由團隊業界經驗與KDD程序的結合,產生了KDD 2.0,更落地且易懂的架構,再以KDD 2.0套用到外部資料分析,快速找出重點關鍵標籤或關鍵字,了解消費者care的重點。

而本文即將介紹的是內部資料(例如:CRM的資料)可以如何透過KDD 2.0的方式進行有系統性的分析。就讓我們直接來看Python的實戰個案吧!

Image from : RonaldCandonga pixbay

KDD 2.0程序 — 內部資料「案例2. 線上電商」

 

我們以線上電商情境個案搭配Python實戰,步步講解我們的KDD 2.0如何具體實際在Python機器學習中吧!

備註:情境個案因保密問題,將以真實個案經轉換之虛擬個案分析呈現。

首先,在KDD 2.0中,一樣讓我們從「決定目標」來介紹一下本線上電商及其目標(圖1):

步驟1 — 決定目標

  1. 產品:A線上電商主打的線上服務P產品
  2. 通路:100%的網路媒介
  3. 價格:$ 3,500元新台幣
  4. 成本:$ 1,650元新台幣
  5. 行銷成本:$ 300元新台幣 / 每位顧客
  6. 銷售:A公司提供30天的免費線上服務 — P產品,期望期限內顧客能正式簽約購買P產品之服務
  7. 資料蒐集:購買 = 1;無購買 = 0,提供的為5,000位顧客使用第7天時購買狀況之資料集;同時這也是我們要預測的主目標
  8. 面對難題:不曉得到底應該使用廣告全投放還是機器學習模型來做投放?
  9. 決定目標:以機器學習節省成本且有獲益的做P產品CRM的廣告投放
圖1 決定目標:以機器學習節省成本且有獲益的做P產品CRM的廣告投放(繪圖者:廖庭儀)

步驟2 — 建立目標資料集(搜集資料)

由於A公司之前沒有進行「建立目標資料集」的考量,所以我們必須透過A公司提供的現有資料(圖2)來決定我們是否可以以其機器學習的方式來做CRM的廣告投放。

如果讀者對「客戶資料蒐集的考量要素」欲有進一步的了解,歡迎參考:

概念與實作文章:用Python機器學習步步打造「自己的客戶精準名單」(附Python程式碼)

圖2 建立目標資料集

步驟3 — 資料清理與前置處理

由本案來說,因為演算法無法將本資料集的「location與gender」直接進行演算,而我們必須使用獨熱編碼(One-Hot Encoding)的編碼模式 ,將中文轉換成機器學習可以辨識的「數字」(圖3 ),才能算是將資料分析的前置作業完成(圖 4)!

若想了解不同的編碼模式,歡迎參考這篇對類別變數的回覆訊息哦!

圖3. 編碼轉換
圖4. 完成資料處理的前置作業

將步驟3完成後,就相當於完成圖5資料處理的部分,接著我們就要進入分析建模的部分啦~

圖5 搜集資料與資料處理

步驟4 — 分析建模

在分析建模的部分,我們一樣切分80%的訓練資料集,作爲模型訓練使用;與20%的測試資料,驗證模型的效果從測試集。模型方面,我們則使用了XGBoost的方法中找出每一個客戶預期會購買A商品的可能性/機率(圖6與7)。

圖6 建模程序
圖7 分析建模

步驟5 — 策略行動

建模完成後,即可開始上線,開始檢視分析狀況的好壞。

圖8 進行策略行動,以實際資料進行檢視

步驟6 — 評量成效

經過策略行動後,我們開始要來評量成效,看看模型預測成果的好壞程度(圖9)。

圖9 評量成效,如果模型可以被接受,模型即可成為企業知識/資產的一部分

最後,我們來看看本案例所造成的效益(圖10),只對CRM資料中目標客群發送的利潤(13萬)是大過於對所有會員發送的利潤(11萬)!當然這利潤還要在扣除資料蒐集、機器設備、資料科學專案合作等費用,不過以長期的成效來說,使用機器學習的效果要比以往的方式要佳。

圖10 使用機器學習後的P產品成效評估

管理意涵

  1. 自從2015年開始,FB對廣告觸及率逐漸調降,造成許多廣告觸及成效不彰,所以企業可以如本案例的A公司一般,將線上資訊(如:GA裡面可以觀察的註冊時間、停留時間等)結合會員CRM資料,以機器學習方法分析可能購買公司產品的舊客,對其進行廣告投放,更能有效的產生轉換效果。除了從本實務案例中得以見證,哈佛商業評論也在《The Value of Keeping the Right Customers》這篇文章中提過:「開發一個新客的費用是留舊客費用的5–25倍」,這表示留住一個舊客遠比帶進一個新客更划算
  2. 業績好,不代表利潤高,所以主管或老闆應該要求員工以「營業利益/利潤」為做事原則,從本案例證實,如果不從利潤的角度著想,雖然可以賣很多產品,但是卻會讓公司賺得少,甚至賠錢,同樣的,我們能不能以利潤的角度來做獎金分配(這就像是機器學習中常見的損失函數一般),讓員工可以確實的以利潤為目標,試圖讓公司獲利更多。
  3. 評估機器學習或者新方法的好壞,其中有一點是非常事關重要的,那就是「時間週期」在成效上的評估,以本案例來說,讀者或許認為獲利不如預期,怎麼才這麼一點點(約2萬元),這時候,時間週期便顯得尤其重要,因為這2萬元的利潤只是我們前面情境假設時所說過的「第7天」的狀況,所以我們如果推算一下,每天使用該類的機器學習模型能夠多2萬元的「利潤」(不計算維護等資料科學外包費用的話),我一個月就比之前還要多了60萬元的利潤,一年下來就多720萬元的利潤,而且還是持續累積性的。 但是如果這2萬元是一年下來才有的利潤,老闆與主管就要好好評估使用機器學習的可行性了。

作者:鍾皓軒(臺灣行銷研究有限公司創辦人)

繪圖者:廖庭儀(臺灣行銷研究特約設計師)

更多商普好文推薦

AI 人力資源管理

AI 人力資源管理 與一位人資主管聊天,她知道我對AI行銷學(人工智慧行銷學)有所研究,於是便聊到了AI在人力資源管理上的應用。 簡單來說,

閱讀更多 »
回到頂端