透過使用者習慣分析,預測未來需求量 - 以共享單車產業為例 情境
情境
假設你代表公司,到了一個陌生的城鎮和客戶開會,下了捷運才發現目的地還有十分鐘的路程,正午日光曝曬,走路實在很累,但搭計程車過去好像又有些浪費,你陷入了兩難……。
這時,若能有一台隨借隨還的腳踏車,是不是能帶來莫大的幫助?
為了研究人群在城市之中的流動性,華盛頓哥倫比亞特區(Washington, D.C.)的研究人員藉由大量的單車租借紀錄,進一步預測未來每個時段的需求量。
解決方法
資料簡介
資料由華盛頓特區的一家自行車共享系統 Capital Bikeshare 所提供,總共包含兩年、共 17379 筆資料,其中資料的切分方法則是以日期切分,每個月 19 號以前為訓練資料,總共 10886 筆,20 號以後為測試資料,總共 6493 筆,而最終目的就是根據所提供的欄位,包括氣溫、雨量、季節、節日與否等等,預測出每小時腳踏車的總租借數。
接著,為了做變數的挑選,我們把較為無關的季節、天氣等變數去除,並將內含多於一項資訊的欄位(如 datetime)拆分,成為一欄只包含一個資訊的欄位。
模型訓練
共嘗試以下五種模型,成果如表一,RMSLE 為衡量預測值與實際值之間的誤差,其值越低模型表現越佳。因此,下圖中的模型,以 RandomForestRegressor 表現最佳:
成果與應用
至此,我們完整的示範了從原始資料到最後生成一個需求預測模型的過程。對於廠商,此模型可以用以規劃共享單車的配送,避免在熱門和冷門地點,車輛數量分布不均的情形;對於消費者,此模型可在規劃行程與交通方式時使用,若預先得知某地在某時段的車輛需求較大,不一定能在該站租借到車輛,則可轉換其他的交通方式,對於供需雙方而言,都能達到莫大的幫助!
作者:趙熙寧(臺灣行銷研究特邀作者)、鍾皓軒(臺灣行銷研究有限公司創辦人)
更多實戰案例及情境好文推薦
資料科學實戰行銷活動評估!(附Python 程式碼)
資料科學實戰行銷活動評估!(附Python 程式碼) 若您是行銷部門的人員,每天可能為了增加產品的曝光,運用不同的行銷手法,例如:透過媒體廣
視覺化財經數據,挖掘資料金礦 — 以美國投資基金公司為例
視覺化財經數據,挖掘資料金礦 - 以美國投資基金公司為例 情境 電影《華爾街之狼》中有一句話「在太陽升起之前,就投資了太陽的股票!」完美詮釋
用Python機器學習步步打造「自己的客戶精準名單」(附Python程式碼)
用 Python 機器學習步步打造「自己的客戶精準名單」(附 Python 程式碼) 談到精準名單,您會想到什麼? 當我們談到精準名單時,我