資料集多大稱作大數據?行銷資料科學與大數據行銷

最近幾年,隨著資料科學和大數據分析的興起,並不斷引起話題,由於其間牽涉大量的資料的蒐集、處理和分析,讓許多人都認為兩者似乎是同一件事。這樣的想法同樣被延伸到行銷資料科學與大數據行銷。然而事實上,行銷資料科學與大數據行銷,在本質上還是有所差異。

自從半導體科技快速發展和電腦日益普及之後,人們活動的資料能夠被更詳實和密集的記錄下來,人們也很積極地利用這些資料,以追求更美好、更方便的生活。而這種因為資料的產生和累積,造成生活的改變,在大數據時代來臨後,更是突飛猛進。

在商業世界更是如此,您可以想像全世界目前有多少人,每天會將餐廳上的菜一一拍照,上傳到臉書;每到一處景點,就要「打卡」簽到;每天又有多少人將他們購物開箱的影片,上傳到Youtube;每天又有多少人把他們對店家的滿意和不滿意,以電子口碑形式,丟上網路論壇去討論,這些消費者點點滴滴的真實經驗,都被記錄和保存了下來。

問題來了,如果一個行銷人或企業要問,我的行銷資料科學或我做的研究,到底算不算得上是「大數據研究」?或者更直接的「到底行銷資料的量要多大,才算是大?」

我們來看一下在維基百科中,「巨量資料」有一個條目是這樣解釋的,「對某些組織來說,第一次面對數百GB的資料集可能讓他們需要重新思考資料管理的選項。對於其他組織來說,資料集可能需要達到數十或數百TB才會對他們造成困擾。」而截至2021年,單一資料集的大小從數個TB,至數個PB不等。換言之,大數據的狹義定義是,資料量起碼必須落在100TB~1PB間。不過,除非是電信公司或者大型零售業者,相信台灣絕大多數中小型企業不會符合這個標準。

資料量的大小,只不過是大數據的眾多面向之一,即便數據不夠大,有時候並不是重點,畢竟以傳統的統計分析,只要使用少量資料就做出不錯的效果,而如果數據夠多、夠大,那麼結果就更精準、更有價值。

簡單來說,行銷資料科學與大數據行銷不同之處在於,行銷資料科學裡的「資料」,可以是大數據,也可以是小數據。而大數據行銷,顧名思義,背後的「資料」通常就是資料量很大的大數據,如圖1所示。

圖1 行銷資料科學與大數據行銷

舉例來說,一家零售商透過分析公司內部資料庫裡的顧客銷售資料,發展出預測模型,這背後的資料量,便不需要達到大數據的規模。又或是一家公司透過網路爬蟲分析網路論壇上自家品牌與競爭者品牌之間定位上的差異,背後的資料量也可能也遠遠達不到大數據的定義。但這些做法,都是行銷資料科學的應用。

至於到底多大的資料量才能被稱為大數據,並沒有絕對的定義,一般來說,資料量超過1TB (10的12次方)以上,就可被稱為大數據。但也許在不久的將來,這樣的規模也不能被稱為大數據了(例如,到時至少要1EB,10的18次方以上才能被稱為大數據)。大數據多大是會變動的。

作者:蘇宇暉(台科大管研所博士候選人)、羅凱揚(台科大企管系博士)

繪圖者:傅嬿珊

更多商普好文推薦

回到頂端