如何在大數據中找出「關鍵少數」,贏得最大獲利?(附Python程式碼與業界實際案例)
試想一下,當我們面對數以萬計的產品時,我們該如何有效率且準確地分析產品?在預算有限與時間有限的情況下,管理者如何投放最低成本而獲得最高的獲利?
在實務上,往往大多數營收來自少部分的產品,微軟大部分營收來自Office辦公軟體、亞馬遜多數營收來自AWS的雲端服務。如果我們能找出並且把握關鍵賺錢的少數產品,也能獲得龐大的獲利!
那我們要怎麼準確地找出那關鍵少數?在商業營運上,80%的獲利多來自於20%的產品,也就是常聽見的「八二法則」!我們可以利用「八二法則」在眾多產品中去蕪存菁,找出貢獻利潤最高的產品,並重新分配資源,創造更大獲利!
問題是,我們要怎麼找出那20%的產品呢?本次文章將會手把手教你利用Python找出那「關鍵少數」!本文我們將實際使用操作Python分析電商服飾資料,和大家分享應用過程及結果,完整的程式碼可以到GitHub查看!
此次過程會分成四個部份:
- 案例情境簡要說明與資料簡介
- 計算系列利潤
- 找出貢獻前80%利潤的系列與商品清單
- 管理意涵
案例情境簡要說明
本次的服飾案例商品種類繁雜,本文先和大家分享一下何謂資料之間的「階層關係」?
在大賣場購物時,賣場為了方便客戶尋找商品,會進行區隔分類,並進行排序,如:大賣場有「日用百貨區」、「生活休閒區」、「生鮮區」等區域,而在「日常用品區」區域中又分成「衛浴用品」、「餐廚配備」等類別,其中「衛浴用品」細類別中又可分成「浴巾」、「浴帽」等商品項目。在大賣場的例子中,「階層關係」是「區域(日常用品)」>「類別(衛浴用品)」>「商品項目(浴巾)」。(如圖1.)
了解完這層層的資料結構與型態後,我們可以正式進入資料分析!
讀取資料
我們先讀取資料,接下來看資料維度以及查看變數有哪些。
資料簡介
共有353,224筆資料,這353,224筆資料分別紀錄產品的個別資料,資料包涵以下11種資料:
- 顏色:產品顏色,若產品非服飾類則無顏色
- 單價:產品售出單價
- 成本:產品成本
- 系列:產品所屬系列
- 產品:產品所屬系列下的產品類別,例如:產品4–1指的是系列4產品中的第一個產品
- 訂單時間:客人購買下訂單的時間
- 會員:會員代號流水號,相同顧客會有相同的流水號
- 性別:FEMALE為女,MALE為男
- 年紀:會員年紀
- 廣告代號all:顧客如何知道此產品管道
- 尺寸:產品尺寸,若產品非服飾類則無顏色
此次資料最重要的元素是「系列」與「產品」,我們可以使用unique函式找出總分別有幾種系列與產品種類!
此資料總共有1051種系列,8076個產品種類,那我們要如何從高達千筆的系列中找出利潤最高的產品?
計算系列利潤
在此資料中,影響利潤最主要的因素是「系列」,利潤貢獻通常是企業在評估產品經營優劣的重要指標,也是提供決策者在是否投注資源的重要參考。若能找出利潤貢獻最高的系列,企業便能投注更多的資源於此系列上。
最簡易利潤計算方式為「單價」-「成本」。因此,我們將單價減掉成本,並創造出一欄「利潤」(如圖3.)。
接著,我們可以利用groupby函式將各「系列」的利潤「分別」總和,Python中的groupby函式與Excel的樞紐分析功能相似!結果可以看到每個系列的利潤都被分別計算出來,接著我們將利潤除以利潤總和,算出「利潤佔比」,再利用sort_values函式從大到小排序。
排序之後,我們能很容易地找出系列利潤最多的前10名(如圖4.),其中前5名分別是系列1、系列2、系列3、系列6、系列7!
我們再利用視覺化的方式查看利潤前30名的系列,可以更清楚地看到系列1、系列2、系列3的利潤總和遠超出其他系列,也就是說這三個系列為企業貢獻最多的獲利!(如圖5.)
如何找出貢獻總利潤80%的產品清單?
知道了利潤貢獻前10名的系列之後,我們要怎麼更精確地找出貢獻大部分利潤的「關鍵少數」呢?根據八二法則,大多數的利潤由少數關鍵的產品貢獻,那我們要怎麼找出那20%的產品呢?
我們先算出各系列的利潤佔比,利用cumsum函式將各系列的利潤佔比加總,產生累積利潤佔比(如圖6.)。累積利潤佔比會不斷累加,直到1為止。
接著,我們從一千多筆系列中挑出累積利潤佔比小於0.8的系列,累積利潤佔比小於0.8只有僅僅67筆資料(如圖7.),也就是說,1051個系列中,僅僅67個系列卻貢獻了80%的利潤!
這67個系列僅僅只佔總系列個數的6%,然而,這6%的產品是幫助企業獲利的「關鍵少數」,是不是很驚人,如此微量的系列卻貢獻那麼大的獲利!管理者可以增加這6%的產品資源投放,增加更多獲利!八二法則雖然說前80%的利潤來自20%的產品,但隨著產業的不同,比例也會有所不同,像此次資料就是6%的產品貢獻了80%的獲利!
八二法則只能用在「系列」產品上嗎?
除了用在「系列」產品的分析之外,八二法則當然也可以用在系列下的商品上!我們使用上述的方法對8076個「產品」進行分析,一樣可以找出貢獻利潤前10名的產品名單,也透過視覺化更知道各產品利潤分配狀況!例如:產品1–12貢獻利潤很明顯的是其餘產品的2倍之多,後續可能可以增加產品1–12的推廣!(如圖8.)
而在8076個產品中,貢獻前80%利潤的產品僅有603個,佔比僅為7%!若結合前面系列產生的清單,就能產生出獲利最高的系列與產品供管理者參考了!
管理意涵
從這次的資料集,我們可以知道:
- 當我們遇到數以萬計筆資料集的時候,我們可以利用八二法則抓出重要的系列!
- 然而,在每一個產業別不一定是八二法則,像是此資料集就不是20%產品貢獻80%的利潤,但我們仍然可以用此來判斷哪些產品貢獻了80%的利潤!在有限資源下,管理者可重新分配資源、加強推廣這少數卻重要的產品,或是加強相關產品的後續開發,創造更大的市場需求!
- 同樣八二法則當然也可以應用在產品、顏色、尺寸等SKU上!
以上就是今日「八二法則」的行銷操作分享~希望對大家會有幫助!!!
作者:葉庭妤(臺灣行銷研究特邀作者)、鍾皓軒(臺灣行銷研究創辦人)
更多實戰案例及情境好文推薦
如何使用機器學習提高房仲業潛在成交率?資料處理面基本心法(附Python程式碼)
如何使用機器學習提高房仲業潛在成交率?資料處理面基本心法(附Python程式碼) 情境 目前美國知名房屋出租網「RentHop」於租客端已做
透過資料視覺化,找出成為Youtube發燒影片的關鍵
透過資料視覺化,找出成為Youtube發燒影片的關鍵 情境 社群行銷一直是企業吸引市場目光或是培養客戶關係的熱門管道,而較受歡迎的社群平台從
透過機器學習預測「電信業」顧客流失率 - 基礎概況分析(附Python程式碼)
透過機器學習預測「電信業」顧客流失率 - 基礎概況分析(附Python程式碼) 情境 相信各位讀者還記得2018年5月,某電信推出行動網路吃