透過使用者習慣分析,預測未來需求量 - 以共享單車產業為例
情境
假設你代表公司,到了一個陌生的城鎮和客戶開會,下了捷運才發現目的地還有十分鐘的路程,正午日光曝曬,走路實在很累,但搭計程車過去好像又有些浪費,你陷入了兩難……。
這時,若能有一台隨借隨還的腳踏車,是不是能帶來莫大的幫助?
為了研究人群在城市之中的流動性,華盛頓哥倫比亞特區(Washington, D.C.)的研究人員藉由大量的單車租借紀錄,進一步預測未來每個時段的需求量。
解決方法
資料簡介
資料由華盛頓特區的一家自行車共享系統 Capital Bikeshare 所提供,總共包含兩年、共 17379 筆資料,其中資料的切分方法則是以日期切分,每個月 19 號以前為訓練資料,總共 10886 筆,20 號以後為測試資料,總共 6493 筆,而最終目的就是根據所提供的欄位,包括氣溫、雨量、季節、節日與否等等,預測出每小時腳踏車的總租借數。
接著,為了做變數的挑選,我們把較為無關的季節、天氣等變數去除,並將內含多於一項資訊的欄位(如 datetime)拆分,成為一欄只包含一個資訊的欄位。
模型訓練
共嘗試以下五種模型,成果如表一,RMSLE 為衡量預測值與實際值之間的誤差,其值越低模型表現越佳。因此,下圖中的模型,以 RandomForestRegressor 表現最佳:
成果與應用
至此,我們完整的示範了從原始資料到最後生成一個需求預測模型的過程。對於廠商,此模型可以用以規劃共享單車的配送,避免在熱門和冷門地點,車輛數量分布不均的情形;對於消費者,此模型可在規劃行程與交通方式時使用,若預先得知某地在某時段的車輛需求較大,不一定能在該站租借到車輛,則可轉換其他的交通方式,對於供需雙方而言,都能達到莫大的幫助!
作者:趙熙寧(臺灣行銷研究特邀作者)、鍾皓軒(臺灣行銷研究有限公司創辦人)
更多實戰案例及情境好文推薦
如何評估不同產品適合的廣告方式?! 資料前處理_雙樣本t檢定技法(附Python程式碼)
如何評估不同產品適合的廣告方式?! 資料前處理_雙樣本t檢定技法(附Python程式碼) 此篇將講述何謂雙樣本t檢定,並使用該方法判斷不同產
詞向量在商業的應用-系列1-人類邏輯能量化?(附Pytorch模型與程式碼)
詞向量在商業的應用 – 系列1-人類邏輯能量化?(附Pytorch模型與程式碼) 到底啥是詞向量? 那跟人類邏輯啥關係? 詞向量
易懂的視覺化呈現 — 由折線圖看行銷活動成長趨勢分析
易懂的視覺化呈現 - 由折線圖看行銷活動成長趨勢分析 本文章以廣告為主要進行行銷活動的分析案例,利用易懂的折線圖,檢視各項廣告於不同月份的成