【Google 用 AI 拯救我的腦霧】Google 推 Project Astra 智慧助手,只要它「看過」就不會忘! | TechOrange 科技報橘

【Google 用 AI 拯救我的腦霧】Google 推 Project Astra 智慧助手,只要它「看過」就不會忘!

今天 Google 於 I/O 活動中發表了許多關於人工智慧的相關應用,其中最讓人感到驚艷的莫過於 Project Astra。概念上,Project Astra 算是 Google AI 助理 Gemini 的擴增功能之一,它可以讓 Gemini 擁有「看見」和「理解」現實世界的能力,並且具備「記憶」和「回憶」功能,方便使用者隨時隨地對 AI 發出提問。

Google DeepMind 執行長 Demis Hassabis 表示,團隊一直都希望開發出對日常生活有幫助的通用型人工智慧助理,而 Project Astra 則是這方面的最新進展。

在手機上與 Google Gemini 偕同運作的 Project Astra,只擁有一個類似於相機拍攝畫面的操作介面;示範影片中有一個人拿起手機,將鏡頭對準辦公室的各個角落,並且用語音問道:「請告訴我辦公室裡的哪些東西會發出聲音」,接著 Gemini 回答:「我看見了一個喇叭,而它會發出聲音」;接著示範者用手在螢幕上畫了一個箭頭指向喇叭頂端,並且問道:「這個部分叫做什麼?」Gemini 也立刻指出那是喇叭上的高音揚聲器。

掌握 AI 趨勢 & 活動資訊一點都不難!訂閱電子報,每週四一起《AI TOgether》

感謝訂閱!隨時注意信箱的最新資訊

前面這一連串操作確實令人震驚,因為這代表 AI 開始理解現實生活中的一切,Project Astra 不只能夠明白某個物體是什麼東西、擁有什麼功能,甚至於對「發出聲音」的概念都能準確掌握。

更令人吃驚的是 Project Astra 還擁有一定的記憶能力。舉例來說,Google 在示範 Project Astra 的過程中,刻意讓手機鏡頭掃過並拍下整個辦公室,而當操作者突然詢問「請問你還記得我的眼鏡放在哪裡嗎?」的時候,Project Astra 和 Gemini 立刻給出了回應,準確指出眼鏡就放在桌子上、一顆紅色蘋果的旁邊,即便手機鏡頭當下根本沒有對準放著眼鏡的那個角落。

讓 AI 能夠回憶看見的東西

強大的 Project Astra 還可以透過手機鏡頭,讓 Gemini 清楚解釋它所「看見」的圖表,並且給出準確的解讀和建議;即便是需要創意性的回答,例如幫小貓、小狗取名字之類也難不倒 AI。

Demis Hassabis 指出,Project Astra 背後的原理是將鏡頭所拍下的畫面進行連續編碼,混合語音及其他必備要素後,創造出一條「事件時間軸」,接著系統將快取時間軸上的資訊,提供給 Gemini 隨時進行「回憶」,因此 AI 回答使用者提問的速度才可以如此之快。

Demis Hassabis 表示,Project Astra 目前仍是一個早期開發項目,官方還沒有正式推出的時間表,未來 Project Astra 將會應用於手機及智慧眼鏡上,而後者似乎正是指 Google 尚未公開的 Google Glass 後繼產品,然而 Project Astra 的部分功能,將於今年稍晚整合到 Gemini 應用程式中,讓外界能夠搶先體驗。

【延伸閱讀】

◆【讓 AI 每天幫你省 85 分鐘】Google 推出全新生成式 AI 線上課,零基礎也能提升 4 大工作效率

◆「Google AI 太強大讓我很不安」微軟大力投資 OpenAI,理由竟是 AlphaGo 帶來了危機感

◆Google Gemini AI 開放台灣使用者下載試用!但是缺乏這些功能你可能會不開心

*本文開放合作夥伴轉載,資料來源:《digitaltrends》《engadget》。首圖來源:YouTube