【人類又輸了】只需 20 步!這個 AI 靠「自學」破解魔術方塊 | TechOrange 科技報橘

【人類又輸了】只需 20 步!這個 AI 靠「自學」破解魔術方塊

【為什麼我們要挑選這篇文章】你玩過魔術方塊嗎?還記得當初被魔術方塊折騰的苦樣嗎?現今 AI 日趨成熟,電腦科學家和數學家編寫一種深度強化學習演算法,連電腦都可以幫你玩魔術方塊。(責任編輯:蕭信隆)

自從 1974 年被一位匈牙利建築師發明以來,魔術方塊一直令很多玩家頭痛,目前最快的金氏世界紀錄是由 MIT 製作的機器人保持,僅用了 0.38 秒。

但是這個 3D 邏輯難題沒有難倒人工智慧系統  DeepCubeA。DeepCubeA 演算法是由加州大學(University of California, Irvine)電腦科學家和數學家編寫的一種深度強化學習算法,它可以在幾分之一秒內解決問題且不需要任何專業知識或人類經驗指導。

論文已發表於《 Nature 》【傳送門】

下面是文摘菌的演示,通過點擊「 Scramble 」打亂魔術方塊,再點擊「 Solve 」,DeepCube 就會開始算出最快的解決方案。

DeepCubeA 網址【傳送門】

網站上還有項目的原始碼,感興趣的讀者可以去看看。

能玩魔術方塊的 AI 更像是可以思考、推理、計劃和決策的高階系統

鑑於魔術方塊的還原路徑有數十億種,但玩魔術方塊只有一個目標——通過轉動使六個面成單一顏色,這顯然不適用於隨機移動演算法,因此這項任務可不簡單。

最近一項發表在 Nature Machine Intelligence 上的研究說明, DeepCubeA 100 %的通過了所有測試,其中 60 %找到了還原魔術方塊的最短路徑。該演算法還適用於其他組合遊戲,如滑動拼圖、關燈遊戲和推箱子等。

「人工智慧可以擊敗世界上最好的國際象棋和圍棋選手,但也有一些比較棘手的項目,比如魔術方塊,還沒有被電腦解決,因此我們認為人工智慧或許能在這個方向進行探索。」

資深作者、加州大學爾灣分校電腦科學傑出教授 Pierre Baldi 表示:「魔術方塊還原需要更多的象徵性思維、數學思維和抽象思維,因此可以解決這類難題的深度學習系統更像是一個可以思考、推理、計劃和決策的高階系統。」

只需 20 步, AI 的思維方式與人類完全不同

研究人員希望能夠知道  AI 是如何規劃?如何得出這樣的還原步驟?以及需要多長時間用於優化方法?

他們從一個完整的魔術方塊電腦模擬開始,然後打亂魔術方塊。一旦程式碼完成並開始運行, DeepCubeA 將被隔離兩天,訓練解決一系列更複雜的組合情況。

「它在自我學習。」 Baldi 指出。

一些玩家,特別是青少年,可以快速地還原魔術方塊,但是整個過程他們大約需要 50 步。

「我們的人工智慧系統只需要大約 20 步,並且大部分時候都是以最少的步數還原魔方。」 Baldi 說。「從它完成的步驟就可以看出它採用的策略與人類不同,所以最好的解釋是 AI 的思維方式與人類完全不同。」這位資深的電腦科學家表示,做這類項目的最終目標是建立下一代  AI 系統。

人們每天都會與 Siri 、 Alexa 、推薦引擎等隱藏在應用背後的人工智慧產生聯繫。「但這些系統並不是真的智慧,它們很傻,你可以很容易地調戲或欺騙它們。」Baldi說。「如何創建一個更智能、更強大,能夠推理、理解和做計劃的高階人工智慧系統。人工智慧成功解出魔術方塊意味著我們朝著這個偉大目標邁出了一步。」

原文:傳送門

(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈 AI 會玩魔方了!全是自學,比任何人都快,包括機器人〉。首圖來源:Pexel CC Licensed)

更多關於 AI 的文章

我們的「看診費用」有望調降?埃森哲:AI 將為醫院省下 4.7 兆台幣的成本
【破解 AI 黑箱】Google 提出 TCAV 技術,有望成為深度學習的全新框架!
以色列獨角獸 OrCam 來台:推智慧語音眼鏡,讓 AI 成為視障者的眼睛