距離「強大」依然尚遠的資料科學

  您的智慧型手機裡有線上串流音樂服務的APP嗎?先別急著打開,想一想它是如何推薦歌曲給您的?依照歌手、年份還是曲風?不知道您有沒有想過,現在歌曲的曲風分類方式的夠詳細嗎?抒情、搖滾、爵士、民謠、古典……等,這樣的分類能夠有效區辨出不同風格的音樂,讓您更方便選擇嗎?

  《演算法的一百道陰影》(Outnumbered)一書的作者,瑞典烏普薩拉大學應用數學系教授大衛‧桑普特(David Sumpter)曾經訪談線上音樂串流服務平台Spotify的資料科學家格倫‧麥克唐納(Glenn McDonald)。

  為了方便線上會員的選擇,麥克唐納與同事們開發出Spotify的曲風分類系統,主要是將每首歌轉換成13個維度中的一個點。這13個維度包括客觀的響度、節拍數…等,以及主觀的強度、情緒度…等。其中,主觀指標是由用戶的經驗所建立,採用兩兩互比方式,一旦用戶聽完兩首歌後,決定哪一首歌比較歡樂與悲傷。最後,分類系統會將接近的點(亦即歌曲),歸類成同一種曲風。

  麥克唐納同時架設了一個名為「同一時間的所有聲響(Every Noise At Once)」的網站(https://everynoise.com/),將Spotify裡5749種 [1] 音樂風格以二維空間圖的方式呈現,如圖1所示。簡單地說來,這個空間圖呈現出不同類型的音樂風格,最下方為有機(Organic),最上方為機械與電子(Mechanical and Electric);左邊為密集(Denser)和有氣氛(Atmospheric),右邊則較尖銳(Spikier)與跳躍(Bouncier)。

圖1 Every Noise At Once網站(資料來源:https://everynoise.com/)

  儘管網站的分類方式已比以往更廣泛和多元,但桑普特教授很坦白地告訴麥克唐納,自己對Spotify的推薦新曲功能相當失望。沒想到麥克唐納竟然很大方承認演算法背後的限制。他提到,現有的演算法並無法知道一個人對某首歌的迷戀,或著鍾愛,究竟由何而來(例如某首屬於兩人的情歌)。麥克唐納認為Spotify推薦的曲目對人數眾多的派對最有效,而且切歌率低,但如果是推薦給個人,效果就大打折扣。

  桑普特教授總結與麥克唐納互動的發現。雖然資料科學家都在高維度裡尋覓解答,但音樂本身,牽涉到心靈的相繫或羈絆,背後有著不可知的私密維度。無論是那一首讓我們怦然心動的歌曲;或是那首讓我們感受孤獨的樂音;抑或是那些牽引著我們情緒的旋律。平心而論,這些都是資料科學家無法解釋的維度。

  如此看來,資料科學看似強大,但其實距離強大仍遠遠不夠。Spotify的故事,給我們不少啟發。

作者:羅凱揚(台科大企管系博士)、蘇宇暉(台科大管研所博士候選人)

[1] 截至2022.1.30,持續增加中。

更多商普好文推薦

回到頂端