【iPhone 用戶看過來】加強版 Siri 要來啦!以後不用再「Hey, Siri」,蘋果 AI 即將上菜 | TechOrange 科技報橘
Search
Close this search box.

【iPhone 用戶看過來】加強版 Siri 要來啦!以後不用再「Hey, Siri」,蘋果 AI 即將上菜

自 2022 年底 ChatGPT 席捲全球以來,蘋果(Apple)在人工智慧領域起步較晚,似乎已經成為了外界的共識。面對大批競爭對手帶來的壓力,過去幾個月間出現不少謠言與報導,皆表明蘋果實際上只是在等待時機,準備於 AI 領域大放異彩。

全世界的蘋果裝置使用者,幾乎都希望這家公司可以善用 AI,打造出更進化、更完美的產品體驗,然而蘋果也確實有著這方面的規劃,準備透過新技術讓虛擬助理變得更加好用、更加聰明。

首先在一篇名為「 LLM in a flash: Efficient Large Language Model Inference with Limited Memory 」的論文中,蘋果設計了一套將 AI 模型資料儲存於 SSD 內的系統,這套系統可以視需求將資料傳送至記憶體,打破原本在 DRAM 儲存 AI 資料的容量限制,藉此大幅度提高模型的執行效率。

掌握 AI 趨勢 & 活動資訊一點都不難!訂閱電子報,每週四一起《AI TOgether》

感謝訂閱!隨時注意信箱的最新資訊

研究人員指出,這套新系統不僅可以幫助記憶體較少的裝置,運行資料量更為龐大的 AI 模型,相較於傳統載入方法,其 AI 推理速度甚至可以提高 4 到 5 倍。

壓縮 AI 模型,讓多數裝置都能運作

此外,蘋果研究人員還創造了一個名為「EELBERT」的技術,目的是將大型語言模型壓縮成更小的容量,並且不會破壞其效能表現。舉例來說,蘋果研究人員嘗試將 Google Bert 的模型進行壓縮,最終成功將其縮小 15 倍,但執行品質僅僅下降了 4%。

總歸來說,蘋果正在努力解決 AI 模型的核心矛盾,那就是模型越大雖然表現可以越好、泛用性越高,但 AI 也會因此會變得更加笨重、耗電與執行緩慢。那麼蘋果這一切的研究又是為了什麼呢?答案其實也很明顯:一個在蘋果裝置上更為好用、不需網路且反應更快、更精準的 Siri。

舉例而言,蘋果正在研究一種全新方式,讓使用者不需要喊出喚醒詞,例如「Siri」或「Hey, Siri」即可得到 AI 語音助手的幫助。

蘋果研究人員指出,想要達成這個目的十分具有挑戰性,因此蘋果目前朝兩個方向努力:第一,維持傳統方式但更準確地檢測到喚醒詞;第二,讓大型語言模型(LLM)聽懂使用者正在說的話,以確保當使用者需要 Siri 時,語音助手可以主動給出回應。

對此蘋果開發了一個名為 STEER 的技術,它的主要功能是讓語音助手可以搞清楚,使用者何時想跟 AI 進行溝通,比方說讓 Siri 明白使用者究竟是要針對當下的問題,繼續追問下一個問題,亦或者是詢問一個全新的問題。

STEER 也利用 LLM 提升了 Siri 在「模糊查詢」上的效率,讓使用者無論怎麼提出問題,Siri 都能搞清楚說話者的意思,並且給予更加正確的答案。此外蘋果還發表了另外一篇論文,指出如何讓擁有 LLM 的語音助手,可以在回答問題時不要給出過度冗長的答案,想辦法令使用者更加容易理解 Siri 的回應內容。

蘋果還有更多 AI 等著上菜

除了語音助手的進化外,蘋果的論文還提到了 MGIE 影像編輯技術,使用者僅需透過文字描述想要進行的編輯即可,比方說「讓天空更藍」、「讓我的臉不那麼奇怪」、「在照片中添加一些石頭」等等,MGIE 可以自動判斷應該於圖片的哪些地方做出更動,達成合理的圖像後製編輯。

在蘋果所發表,關於 AI 的各種論文中,最為野心勃勃的項目稱作 Ferret,它是一種多模態大型語言模型,使用者只需在畫面上主動選取任何事物,Ferret 就能夠理解螢幕上的內容,並且給予解釋或描述。

即便我們可能無法在 WWDC 看見蘋果一次給出大量 AI 應用,但從 Ferret 所擘劃出來的理想,也許有一天蘋果 AI 將會改變我們與手機、Vision Pro 甚至於其他蘋果裝置進行互動的方式。

【延伸閱讀】

◆Google Gemini AI 開放台灣使用者下載試用!但是缺乏這些功能你可能會不開心

◆Anthropic 在蘋果推出 AI 聊天機器人,力拚 OpenAI 的 ChatGPT

◆蘋果 AI 終於來了!誠意滿滿,4 種版本開源生成式 AI 模型 OpenELM

*本文開放合作夥伴轉載,資料來源:《The Verge》《arxiv》。首圖來源:《Unsplash》