為什麼要用購物籃分析與協同過濾來看商務資料?


一般我們在進行商務資料分析時,總是會期望能透過過往所獲得的資料來發掘更多的商業洞察。一般店家在進行銷售的同時,也會留下顧客的銷售清單,而若該廠商有採用會員制度,更可以將銷售資料與顧客的個人資料做串連。在此,我們將介紹兩個資料分析的觀念:「關聯規則」與「協同過濾」,透過這兩種技術,我們皆能從過往的銷售資料中,抓取出重要的關鍵資訊,並能以此作為商品品項推薦的基礎,協助我們做出管理決策。

關聯規則

在銷售的時候,我們不見得在所有情境皆能鎖定商品的消費者是誰,比如在大賣場或是便利商店購物時的情形。在這種情形之下,店家應如何對顧客進行產品推薦,或是規劃消費者的購買動線周邊的產品呢?在這個時候,我們就可以透過「關聯規則」的演算法對消費者的購買明細進行分析,也就是大家常常聽到的「購物籃分析」。透過購物籃分析,我們即可找出各個產品組合間的關聯性,比如當我們看到一個消費者買了A產品和B產品,我們即可透過這個架構來判斷何種產品是我們應該向消費者推薦的,如圖1。最經典的案例即為啤酒和尿布,透過分析美國大賣場的資料,資料分析人員發現這兩者的關聯性相當高,故將兩者的陳列位置放在一起,也因此提升了賣場營收,這樣的演算法,也被稱為Apriori演算法,如圖2。

圖1 消費者採購資料

在計算某產品A與其他產品的關聯性時,有三個重要的統計量來讓我們能夠以此作為判斷基準,以產品A為例,分別為:

i. 支援(Support):含有產品A的的購買明細佔全部購買明細的比例

ii. 信心(Confidence):在購買A產品的購買明細中,含有某產品B的比例

iii. 提升(Lift):公式為Confidence(A →B) / Support(B) ,此值表示產品A和產品B的相關性,若此值接近1時,則表兩者獨立,若大於一則為負相關,反之則為正相關,如圖2。

圖2 Apriori演算法

從上列的介紹可以看出Apriori演算法是一個相當注重產品關聯性的一個演算法,而在此稍作介紹後,未來還會有一系列相關應用會介紹給大家。

協同過濾

在討論協同過濾之前,我們先來說一個容易搞混的概念 — 【內容過濾】。

內容過濾主要基於商品的相似性,以及客戶過去對產品與服務的偏好,進而提出推薦。譬如:顧客購買了洗髮精後,系統若認為沐浴乳與洗髮精相當類似,則會自動推薦沐浴乳給該消費者。

而當我們能夠有效地搜集客戶資料時,「協同過濾」就是我們用以推薦商品給客戶們的一大利器,而協同過濾可分為三種,前二種也是我們最常使用的方法,以下將一一與各位介紹。

1. 基於使用者的協同過濾(User-based Collaborative Filtering Recommendation)

顧名思義,此種演算法即為衡量用戶之間的「關聯性」,一般來說會使用皮爾森相關係數(Pearson’s correlation coefficient)或是餘弦相似度(Cosine Similarity)來做計算。以下圖的情形來舉例,透過資料,我們發現用戶A對於產品A和產品C皆很有興趣,而用戶C對於產品A、C、D也很有興趣,倘若演算法認為用戶A和用戶C相當雷同,則系統就會自動推薦產品D給用戶A,如圖3。

圖3 基於使用者的協同過濾

2. 基於商品的協同過濾(Item-based Collaborative Filtering Recommendation)

若從另外一個角度來切入,當我們發現某些產品會一起被銷售時,我們就可以猜測某用戶購買產品A後,是否有可能會購買另外某一種產品。而我們在處理這類資料時,會遇到稀疏矩陣的問題,這是因為一個人購買的產品種類,相對於整間店所擁有的產品數量,真的是微乎其微。故在此,我們會使用奇異值分解(SVD)的方法來拆解矩陣,這也會使得運算速度能更快速。從圖4的例子來看,我們發現產品A和產品C都會一起出現在消費者的偏好矩陣之中,則此時會推薦產品C給已經購買產品A的用戶C。

圖4 基於商品的協同過濾

3. 基於模型的協同過濾

最後一種協同過濾的發展,即以模型作為基礎,比如說使用類神經網絡等演算法的建立,再以此判斷產品被推薦與否,而這些方法在未來的文章,我們會繼續和大家分享。

推薦系統的強大性,從它在商業上的廣泛應用即可略知一二,不論從賣場或線上購物的應用,到Netflix透過用戶回饋所建立起的推薦資料庫,都是這些觀念的延伸。若能更好地應用這些觀念於實際的商業資料之中,想必一定能找出更多有趣的商業洞察。

作者:黃海潮(臺灣行銷研究特邀作者)、鍾皓軒(臺灣行銷研究有限公司創辦人)


 

更多實戰案例及情境好文推薦

回到頂端