數位時代 陳建鈞
史上最強AI!微軟 Suphx 突破日本麻將高端水準,功力大勝頂級人類玩家
2019-09-05
微軟亞洲研究院正式揭曉麻將 AI Suphx,並成功於日本麻將平台天鳳上晉升 10 段,成為首個獲得此殊榮的 AI。
「那個超強 AI 到底是何方神聖?」今年 3 月起,某個謎一般的強悍 AI 席捲了國際日本麻將平台天鳳,時隔 5 個月,這位 AI 的真面目終於揭曉。
上周,微軟亞洲研究院正式發表麻將 AI「Microsoft Suphx」(Super Phoenix),並宣佈其在日本麻將平台天鳳上,取得晉升 10 段的優異成果。
天鳳是日本著名的麻將網路平台,採用日本麻將規則,分為 4 人麻與 3 人麻,並擁有段位、Rating 等評價制度。依照級數、段位高低,玩家可使用的桌也有所差異。
至於 10 段是什麼概念?目前天鳳平台上約有 33 萬名玩家,其中到達 10 段者僅 180 人 。也就是說,10 段代表著全體玩家最頂端的 0.0054%,毫無疑問擁有人類頂尖選手層級的麻將技術。
天鳳營運商經常與企業、研究機構合作,共同開發強悍的麻將 AI,甚至推出 AI 專用帳號。玩家可以透過 AI 帳號專屬的標記,清楚得知對手究竟是人還是機器。
在 Suphx 現身以前,由東大碩士生水上直紀開發的「爆打」、資訊科技公司多玩國(株式会社ドワンゴ)的「NAGA25」等 AI 都曾在這個平台上,和玩家們同桌遊戲,但 過去未曾有 AI 獲得過晉升 10 段的殊榮 。
Suphx 於 3 月加入天鳳,並在 3 個月內與人類玩家、其他 AI 對戰 5,000 餘局後,6 月以特上桌第一名的成績成功晉升 10 段,這是目前 AI 專屬帳號所能達到的最高等級,同時 Suphx 的勝率也比其餘 AI,甚至人類玩家更勝一籌 。
微軟公佈的資料顯示,目前 Suphx 取得的安定段位分數約為 8.7 分,而爆打與 NAGA25 則都只有 6.5 分上下;10 段以上的人類高手則為 7.5 分。
決勝因素充滿未知,麻將比圍棋、德州撲克難度更高
3 年前,AlphaGo 大敗韓國棋王李世乭,是 AI 在遊戲上超越人類的一個重要里程碑,象徵了 AI 在訊息完全公開遊戲的制霸地位。
自此時開始,各個企業、研究人員開始著眼於訊息不完全公開的遊戲內容,好比說,DeepMind 就放眼《星海爭霸》、OpenAI 也聚焦《Dota 2》等電競遊戲。
然而,微軟卻將目光對準另一款同樣源自中國,有著上千年歷史的古老遊戲:麻將。
對於訊息不完全公開的遊戲,人類往往依靠經驗、直覺判讀,甚至有時得觀察對手的表情、語氣,好判斷究竟是否是虛張聲勢,而這些人類常用的判斷方法,都相當難以化為 AI 可使用的數據。
2017 年時,由卡內基梅隆大學開發的 AI Libratus,曾在 20 天擊敗 4 位德州撲克高手,從人類手中贏得價值 177 萬美元的籌碼,標誌了 AI 攻佔不完全訊息(資訊不完整)賽局領域的第一步。
但相對於德州撲克,麻將的不確定因素遠要來得更高。根據微軟公佈的資料,德州撲克的隱藏情報量約為 10 的 3 次方,也就是 1,000 種,而麻將的隱藏情報量卻達到 10 的 48 次方,完全無法比擬。
也由於麻將的難度,目前一般人能觸及的麻將 AI 性能大多非常弱,為了確保遊戲樂趣,會選擇讓 AI 得知玩家的牌。當然,Suphx 絕對沒有利用這種不公平的手段,而是與一般玩家自相同起跑點競爭。
藉對戰與自學累積強悍實力,麻將 AI 將用於金融界
除了與眾多玩家、AI 對局外,在登上天鳳以前,Suphx 是透過「餵食大量麻將牌譜」的資料庫進行訓練。事實上,微軟之所以選擇與天鳳合作,後者擁有的大量公開牌譜也是重要原因之一。
且 Suphx 不僅麻將實力堅強, 也懂得依照情況運用策略,以保持自己的分數 。舉例來說,當它認為這局無法勝過第一名的玩家時,對局策略就可能轉向擊敗第 3、4 名的玩家,以免被系統扣除太多分數。
不過,一個麻將技術高強的 AI,在現實中究竟能如何發揮作用,目前還很難確定。日本微軟技術長榊原彰認為,麻將 AI 的能力將能在金融領域發揚光大,一位優秀的操盤手,必須能夠讀懂市場脈動,而這與麻將 AI 所擁有的能力十分相似。
順帶一提,達到 10 段並未讓微軟就此滿足,目前他們正與天鳳商討,能否開放 AI 專屬帳號晉升天鳳位,這是達到 10 段最高點數才能獲得的殊榮,目前全遊戲總共只有 13 人達到此位階。
資料來源 / Business Insider、Microsoft;本文出自 數位時代