換個「資料科學」(Data Science)腦袋

中國企業家馬雲在他所著的《未來已來》一本書中曾經提到,「人類正在從資訊科技(IT, Information Technology)時代,走向資料科技(DT, Data Technology)時代。」而其中的「資料科技」則是以「資料科學」(DS, Data Science)為軸心,搭配隱身其後的人工智慧AI,發展出來的新科技。

有人不免要問,那「資料科學(DS)」能夠做些什麼?如果以中學生準備微積分考試為例,在時間有限下,如何只做100題的題目,會讓學習效果比做500題題目還來的好?答案就在「資料科學」(背後的AI人工智慧)。

想像一下,如果有一個線上測驗的考試平台。它能夠在同學一邊在做題目時,平台能對一邊對同學作答的時間、計算過程、答題結果…等,進行即時性的分析來了解同學的程度,並「判斷」出同學不會的地方。之後,繼續給予同學「量身訂製」的「下一題」,協助他徹底了解不懂之處,或是讓同學能依照系統的個人化推薦,循序漸進且有效地學習完所有範圍的理論。更特別的是,在這套系統下,對應著不同背景、不同程度的同學,雖然有人只要做100題,有人則可能要做200題、300題…,但無論做幾題,都能達到練習500題應有的成效。如圖1所示。

圖1 AI線上測驗的考試平台

其實,以目前的科技發展,要完成以上的平台,概念上並不難。以前的問題在於技術,但自2010年後,深度學習(Deep Learning)相關技術有了重大突破,現在只要擁有一套完整的「學科學習地圖」,並擁有大量有效的題庫,再配合大量的樣本對平台進行測試,就有機會建置出以上的幾近理想的「微積分學習測驗平台」。

只是,有了「資料科學(DS)」的概念還不夠。真正在「企業經營管理」的實務上,一旦要落實這樣的概念,目前還有許多瓶頸需要克服。我們以「資料科學」這四個字為例。將「資料科學」拆開,企業會面臨「資料」的瓶頸與「科學」的瓶頸。

在「資料」的瓶頸方面,對於多數的企業來說,其實並沒有多少「資料」可以進行分析。對於擁有「少數資料」的企業來說,所需要用到的「科學」,可能不用很複雜(有些用Excel就足夠處理),所以無需做到「資料科學」;而對於一些擁有「大量資料」的企業,也可能會因為主管們沒有概念,不清楚自己的「資料」多有價值。

至於在「科學」方面的瓶頸,對於大多數企業來說,沒有足夠、適合的資料科學家來協助分析問題何在,則是最大的問題。

也因為以上的瓶頸,「資料科學」要真正普及到商業界,還有一段長路要走。但無論如何,至少我們可以先讓自己,從換個「資料科學」(DS)腦袋開始著手。

作者:羅凱揚(台科大企管系博士)、蘇宇暉(台科大管研所博士候選人)

繪圖者:謝瑜倩

更多商普好文推薦

回到頂端