蒐集數據時所需思考的問題
越來越多的企業透過 API 來抓取網路訊息,但在抓取的過程中,會產生只抓片面的數據、未能呈現消費者整體的歷程、忽略技術對法律、道德的影響。企業該如何確保透過 API 取得的數據集是有效的?
荷蘭伊拉斯姆斯大學(Erasmus University)鹿特丹管理學院行銷助理教授博格斯豪森(Boegershausen)等學者 [1],提出了一種方法,來協助企業進行蒐集數據時的思考(如圖1所示)。其中,當企業技術可行性越高,所面臨的法律/道德風險較低時,會有較廣的數據來源。而越要求數據的有效性,數據的範疇則會越來越小,形成一個倒三角形的狀態。
資料來源:Boegershausen, Johannes, Hannes Datta, Abhishek Borah, and Andrew T. Stephen (2022), ” Fields of Gold: Scraping Web Data for Marketing Insights,” Journal of Marketing, 86 (5), 1–20.
此外,企業在進行數據蒐集時,通常可分成三個步驟:選擇數據來源、設計數據搜集方式、與取得數據等。各階段所需思考的問題,如表1所示。
資料來源:Boegershausen, Johannes, Hannes Datta, Abhishek Borah, and Andrew T. Stephen (2022), ” Fields of Gold: Scraping Web Data for Marketing Insights,” Journal of Marketing, 86 (5), 1–20.
透過圖 1 中的三個步驟,以及對表 1 中的十項問題進行思考,能協助企業確保透過 API 所取得的數據是更加有效的。
作者:陳苡任(台科大企管系博士)、羅凱揚(台科大企管系博士)
繪圖者:鍾淳育
[1] Boegershausen, Johannes, Hannes Datta, Abhishek Borah, and Andrew T. Stephen (2022), ” Fields of Gold: Scraping Web Data for Marketing Insights,” Journal of Marketing, 86 (5), 1–20.