透過資料視覺化,找出成為Youtube發燒影片的關鍵
情境
社群行銷一直是企業吸引市場目光或是培養客戶關係的熱門管道,而較受歡迎的社群平台從早期的無名小站、部落格等,一直到近幾年的 Facebook、Instagram、YouTube 都是相當熱門的選擇。
本篇以 YouTube 作為分析的主軸,因 YouTube 作為當今最大的影片平台,若是善加利用,不僅可以提高曝光率,更可以帶來一線商機。
在 YouTube 眾多的分類中,皆有一個不斷更新的發燒影片列表,本篇將分析發燒影片列表的數據來深入了解這些發燒影片是否存在著共通點,並以三個面向作為分析的依據:
一、觀看次數、按讚數、評論數
1. 發燒影片擁有多少觀看次數、按讚數、評論數?
二、標題
1. 發燒影片的標題字數是否相似?
2. 在標題中最常使用的詞?
三、發片時間
1. 發燒影片的發片時間,多在一週何天?一天何時?
解決方法
資料簡介
資料由 YouTube 所提供,其分析區域位於美國,時間為 2017 年到 2018 年,共有 40,949 筆的資料。整個資料集包含影片編碼 (video_id)、上發燒的日期 (trending_date)、標題 (title)、頻道標題 (channel_title)…… 等欄位,圖一為資料集示意圖。
資料處理
根據以下方法進行資料處理,最終產出將在「成果與應用」展示:
- 敘述統計:
將資料進行平均數、中位數等運算,例如:計算觀看次數的平均等。 - 資料視覺化:
將經由敘述統計處理過後的資訊進行視覺化的呈現,可以更快速的查看出所需資訊,例如:計算出各個標題字數後,利用長條圖的方式呈現,可以看出標題字數的範圍是落在何種區間等運用。
成果與應用
成果
原始資料在經由敘述統計以及資料視覺化的處理後,就能做更進一步的分析,最後從中找出關鍵,以下將分別針對三個面向進行成果的解說:
一、觀看次數、按讚數、評論數:
發燒影片擁有多少觀看次數、按讚數、評論數?
以觀看次數為例,雖然其平均數高達 2,360,784 次,但是中位數卻只有 681,861 次,代表絕大多數的影片觀看次數都小於平均數的 236 萬次,因此並不一定需要相當高的觀看次數、按讚數、評論數才能夠成為發燒影片。
二、標題:
發燒影片的標題字數是否相似?
可以看到標題長度圖是一張近似常態分配的圖,其中標題長度多分布在 30 字至 60 字之間。
在標題中最常使用的詞?
忽略常見連接詞,如:”the”、”of”…… 等詞彙後,可以得到以下結果:
“Official”、”Video”、”Trailer”、”How”、”2018″ 等是較為常見的詞,在影片標題中出現 1613–1901 次,若再進一步查看影片類型,可以發現 Official 多是音樂、遊戲、影集的官方所發出的影片;Trailer 多是串流影音平台、電影所發出的預告片;How 多是解說技巧、教學、知識等類型的影片。
三、發片時間:
發燒影片的發片時間,多在一週何天?
從圖四可得知,在週四、五發片後成為發燒影片的數目最高,甚至高於周六、日的數量。
發燒影片的發片時間,多在一天何時?
從圖五可得知,發布時間於下午 2 點到 6 點成為發燒影片的數目,較其他時間點成為發燒影片的數目還要高。
應用
藉由上述結果,可以得知觀看次數、按讚數、評論數不一定是成為發燒影片的關鍵,而標題長度、出現字詞以及發片時間則是可以多花心思規劃,若能善加利用本篇所分析出的結果,使企業發布的影片,有更高的機率成為發燒影片,不僅可以吸引市場的目光,更可以達到宣傳企業的效果,從中增加知名度。
參考資料
YouTube Trending Videos Analysis:https://www.kaggle.com/ammar111/youtube-trending-videos-analysis
作者:蔡尚宏(臺灣行銷研究特邀作者)、鍾皓軒(臺灣行銷研究有限公司創辦人)
更多實戰案例及情境好文推薦
Google Map Review 動態爬蟲:如何解決評論動態加載的問題以及在不同視窗間跳轉、滑動(附Python程式碼)
Google Map Review 動態爬蟲:如何解決評論動態加載的問題以及在不同視窗間跳轉、滑動(附Python程式碼) 歡迎回到 Goo
購物籃分析 - Python實戰:如何找出商品搭配的總體策略?(附Python程式碼)
購物籃分析 - Python實戰: 如何找出商品搭配的總體策略?(附Python程式碼) 本次的文章我們將實際應用購物籃分析,帶您瞭解各項產