猜猜這瓶紅酒多少錢─使用機器學習來做價格預測


有一本書《什麼都能算,什麼都不奇怪:超級數據分析的祕密》[1],書中提到一般葡萄酒的品酒專家都會採取「含酒吐出」的品酒方法,來判斷葡萄酒品質(就像漫畫《神之雫》裡所描繪的,有點像漱口)。不過,能受知名葡萄酒專家讚賞的葡萄酒,身價也會跟著大漲。只是,品酒專家要喝到葡萄酒,通常得等到葡萄採收四個月後。而且他們必須在酒還在發酵時,就能準確預知葡萄酒未來的品質(當然,預測率未必能百分之百)。

為了解決這個問題,普林斯頓大學的經濟學家艾森菲特(Orley Ashenfelter)透過數據分析,來評估法國波爾多葡萄酒的品質。他研究波爾多地區數十年來的氣候資料,並根據1952至1980年的統計資料,發現收成時雨量少,再加上夏季平均溫度高,就能生產出品質較好的酒。

艾森菲特發展出以下的公式,如圖1所示:

圖1 葡萄酒品質公式

任何人只要輸入任何年份的氣候統計數字,就能預測當年度的葡萄酒品質,並且根據這項預估值,來評估(或預測)葡萄酒的價格。艾森菲甚至發展出更複雜的公式,來預測超過100家酒莊的葡萄酒品質。

事實上,2015年,另一名叫做崔斯坦‧佛萊徹(Tristan Fletcher)英國研究員想要了解機器學習技術的侷限所在,決定將複雜的人工智慧技術應用於價格混亂的高級葡萄酒定價領域,來比較這些新技術和傳統資產交易技術之間的優劣。

有趣的是,葡萄酒的交易成本很高,主因是它的交易量不大,因此買賣的人通常需要承受較高的單位價格。而葡萄酒也不像股票那樣,交易頻率很高,愛好者常常一次會買兩箱,然後把其中一箱喝掉,等待一段時間後,再將另一箱以更高價格賣掉,而這樣的方式除了可以喝到酒之外,還可賺回之前的酒價差額。這就好像,如果你手上剛好有兩張絕版郵票,如果撕掉其中一張,另一張馬上價格飛騰。

佛萊徹的團隊開始從Liv-ex 100紅酒指數,收集約100種最受歡迎的高級葡萄酒的數據。他們對這個資料集以「高斯過程迴歸」和更複雜的「多重任務特性學習」來測試。結果發現,有一半葡萄酒的單日價格會呈現明顯的負相關性,也就是如果它們在某一日的價格上升,次日的價格就會下降。換言之,高級葡萄酒的價格走勢的確可以預測。

佛萊徹認為,類似的機器學習技術未來很有可能應用於其他小眾資產交易,像是古董車、絕版書籍甚至是藝術品。但是,其他資產的交易都與高級葡萄酒非常不一樣,它們之間不會一致。

不過,傳統的葡萄酒評論家,對這類預測法很不以為然,並且批評說,這樣的做法,對品酒師的權威是一項重大的挑戰。而如果預測方法非常準確,恐怕會有許多人就要失業。透過數據分析,人們在葡萄剛剛採收時,就能預測未來的葡萄酒品質,這對想要買喝酒的人來說,確實會有不小的助益。

最後,數據分析的應用非常多元,不但葡萄酒的品質都能「計算」出來,甚至棒球教練,即便未曾與球員見過面,也能透過數據,評斷出他的潛力。

提醒您,喝酒不開車,開車不喝酒

[1] Ian Ayres,《什麼都能算,什麼都不奇怪:超級數據分析的祕密》(Super Crunchers:Why Thinking-by Numbers Is the New Way to Be Smart),張美惠譯,時報出版,2008年10月30日。


作者:蘇宇暉(台科大管研所博士生)、羅凱揚(台科大企管系博士)

繪圖者:張庭瑄

更多實戰案例及情境好文推薦

回到頂端