自動化搜集數據所存在的挑戰
網路使用者每分鐘在Google上會進行超過570萬次的搜尋行為;每分鐘在Instagram上分享65,000張的照片;每分鐘在網路上進行600萬次以上的交易。在高度數位化的今天,每分每秒都有規模龐大、形式多樣的數據產生。
許多公司透過API(application programing interfaces,應用程序串接)技術,快速、大規模地取得網際網路或是物聯網上的數據。此舉對於想要透過量化技術來分析消費者的行為、或是追蹤某些社會活動(如網路口碑傳播)的經營者來說,這是一個金礦,可以協助經營者了解消費者心理、驗證模型、調整經營策略等。
就像是在全美擁有9,500間店面的麥當勞,便在得來速電子菜單上設定數據分析系統。當顧客開車進入麥當勞車道時,系統會依照當時的時間、天氣、餐廳熱賣菜單、食材庫存、歷史銷售數據、全球門市銷售數據、周邊活動等7項因素,來分析客戶所需要的商品。當客戶訂餐後,系統會自動呈現加購商品的推薦。
但這種透過自動化搜集網路數據,存在著重要的挑戰。荷蘭伊拉斯姆斯大學(Erasmus University)鹿特丹管理學院行銷助理教授博格斯豪森(Boegershausen)等學者,在2022年發表了一篇《抓取網絡數據來洞察經營樣貌》的研究中 [1] 指出,雖然利用API來快速取得資訊,並應用在經營上固然方便,但以過於自動化的方式來搜集數據,仍可能存在使用上的挑戰,像是(如圖1所示):
- 可能只取得片面的數據,而未能取得完整的上下文訊息。像是上述麥當勞的案例中,假設只取得購買者開車入得來速車道的資訊。同時,原始資料也會因為不斷更新,通常難以保留。
- 對所蒐集的數據進行分析,但卻未能充分呈現出消費者的心理歷程。例如,麥當勞在得來速車道上,無法搜集消費者進入前、駛出後的行為,所以無法完整呈現出完整的顧客旅程。
- 忽略了在數據取得過程中,技術使用時的法律與道德問題。
通常設定API能很方便地取得大量的數據,但也因為設定的關係,資料可能存在不完整、未能充分呈現、或是忽略技術、法律、道德等問題。這也是企業經營者在利用網路數據來檢驗經營模式時,不可忽視的項目。
作者:陳苡任(台科大企管系博士)、羅凱揚(台科大企管系博士)
繪圖者:鍾淳育
[1] Boegershausen, Johannes, Hannes Datta, Abhishek Borah, and Andrew T. Stephen (2022), ” Fields of Gold: Scraping Web Data for Marketing Insights,” Journal of Marketing, 86 (5), 1–20.
更多商普好文推薦
白努利黃金定理(Theorema Aureum)
白努利黃金定理(Theorema Aureum) 想像一下,房間的桌上有一個很大的罐子,裡面有2,000顆黑色石頭與3,000顆白色石頭