訂房網之熱門飯店的演算邏輯-點擊率與訂房紀錄

圖片來源: unsplash.com, by Marten Bjork

網美小美3個月前從澳洲布里斯本度假回來。當地宜人的氣候,獨特的文化令小美留戀忘返,但小美最戀戀不忘的莫屬他在當地下塌的飯店–那是當地的熱門飯店,小美隨便發幾張在飯店的照片就讓他的粉絲增長了15%….

問題來了,小美預計在今年暑假與同樣是網美的姊妹淘們前往首爾來一場歡樂姐妹之旅,他們準備仿造小美的經驗,上網找一間當地熱門的飯店後讓每個人的粉絲大漲特漲。假設你現在是首爾某間主攻網美客群的飯店行銷人員,你該如何利用訂房網的熱門飯店推薦機制達成下列目標?

目標一:增加小美及其朋友們打開訂房網時系統看到該飯店的機率

目標二:基於資料科學擬定行銷策略幫助該飯店在訂房網上提升曝光度

資料是由訂房網站Expedia提供,總共包含2013–2015共三年資料,資料切分法則是以日期切分。前二年(2013–2014)的資料將會被運用於訓練機器學習模型,後一年(2015)的資料則會被用來測試訓練出的機器學習模型之準確度。這兩個資料集的欄位大致上相同,包含使用者的國籍、所在地區、點擊來源、欲前往的目的地,以及訂房網站Expedia針對這些飯店做出的類型ID等等資訊。

雖然原始資料提供的變數眾多,但我們只選用較為關鍵的訂房次數、點擊次數、飯店類型ID、目的地ID資料,具體說明請參閱圖一。同時為避免龐大的資料量拖累效能,將總體資料以一百萬筆為單位切分為多份小批次資料。接下來,讓我們來進行初步的資料整理吧!

(圖一)變數解釋表

1.篩選:

針對訓練資料,篩選出較重要的欄位 — 訂房次數、目的地的ID、飯店類型ID,並將資料以一百萬為單位切分為多份小批次資料。

2.飯店點擊率及訂房次數:

整理出不同飯店類別的點擊次數與訂房次數,並儲存整理出的資料

3.計算各飯店類別的熱門程度:

該訂房網的熱門程度計算是利用訂房次數與點擊次數進行加權計算後得出。而此處我們認為訂房次數對於熱程度的影響較大,因此將其權重設為1,點擊次數的權重則設為0.05。

(圖二)bookings(訂房次數) X 1 + clicks(點擊次數) X0.05 = relevance

4.找出各地區前5熱門的飯店類別:

接著,將不同飯店依照熱門程度排序,整理出各地區前5熱門的飯店類別,並將整理好的資料套用於測試集。

5.處理沒有熱門飯店類別的地區:

統計出資料中缺少熱門飯店類別的地區,並再將總排名前5熱門的飯店類別填入原本無資料的欄位。如此一來就算目的地是新地區,訂房網也能推薦適宜的熱門飯店給顧客。

(圖三)飯店分群結果

最終可以得出如圖三所示,左欄代表不同目的地,右欄代表該目的地熱門之飯店類別。這也代表著我們成功利用資料科學歸類出不同目的地的熱門飯店類別。

完成上述的步驟後,便可得出各地區最熱門的飯店類別。回歸文章開頭的所提及之

目標一:增加小美及其朋友們打開訂房網時系統看到該飯店的機率

該飯店行銷人員能了解訂房網站背後的計算機制,對於該如何操作才能在訂房網站上獲得更高的曝光度有深一步認識。

目標二:基於資料科學擬定行銷策略幫助該飯店在訂房網上提升曝光度

透過計算不同飯店類型的熱門度,訂房網站Expedia能迅速整理出適宜的飯店,推薦給小花跟她的朋友們,盡可能節省顧客的時間成本並提高服務滿意度。

總而言之,使用此方法對於飯店方或者小花一夥人皆帶來正面影響。身為讀者的你,是否也能看出以資料科學為基礎所擬定的行銷策略所能帶來的巨大潛力與價值?

參考資料來源:Predict hotel type with pandas

 

作者:劉睿哲(臺灣行銷研究特邀作者)、鄭晴文(臺灣行銷研究特邀作者)、劉加德(臺灣行銷研究特邀編審)

更多實戰案例及情境好文推薦

回到頂端