OpenAI發佈會回顧:最新旗艦模型免費用 ChatGPT進入實時互動紀元 - 新浪香港

OpenAI發佈會回顧:最新旗艦模型免費用 ChatGPT進入實時互動紀元

來源:財聯社

財聯社5月14日訊(編輯 史正丞)香港時間週二淩晨1點,自年初「文生影片模型」 Sora後許久未給市場帶來驚喜的OpenAI舉行春季發佈會。公司首席技術官Mira Murati向外界展現了多項與ChatGPT有關的更新。

簡要來說,OpenAI的發佈會主要乾了兩件事情:首先是發佈最新GPT-4o多模態大模型,相較於GPT-4 Trubo速度更快、價格也更便宜。

通過響應速度的大幅提升,該模型在語音模式下已經可以達到「實時」響應的狀態。用戶可以與ChatGPT像真人一樣聊天——在機器人回應的過程中打斷它,提出更多的要求(例如轉變話題、要求機器人改變語音語調),再也不需要等待機器人完成上一個問題的回覆後,再提出新的問題。

山姆·奧爾特曼在博客中表示,AI達到人類級別的響應時間和表現力證明是一個很大的改變,這個新東西在感受上是完全不同的。它快速、聰明、有趣、自然且有幫助。

第二件事情就是宣佈,ChatGPT的免費用戶也能用上最新發佈的GPT-4o模型(更新前只能使用GPT-3.5),來進行數據分析、圖像分析、互聯網搜索、訪問應用商店等操作。這也意味著GPT應用商店的開發者,將面對海量的新增用戶。

當然,付費用戶將會獲得更高的消息限額(OpenAI說至少是5倍)。當免費用戶用完消息數量後,ChatGPT將自動切換到 GPT-3.5。另外,OpenAI將在未來1個月左右向Plus用戶推出基於GPT-4o改進的語音體驗,目前GPT-4o的API並不包含語音功能。

最後,蘋果電腦用戶將迎來一款為macOS設計的ChatGPT桌面應用,用戶可以通過快捷鍵「拍攝」桌面並向ChatGP提問,OpenAI表示,Windows版本將在今年晚些時候推出。

—-發佈會全程回顧—-

01點00分:倒計時結束,直播正式開始。首席技術官Mira Murati登場。

01點01分:Mira Murati表示,今天她將談論3件事情:1)為什麼一個可以免費、廣泛使用的工具對於OpenAI非常重要?2)如何減少摩擦,讓每個人都能使用ChatGPT,公司將發佈桌面版的ChatGPT;3)公司將在今日發佈最新的旗艦大模型,叫做GPT-4o。

這裏的「o」指的是「全方位」(omni)的意思——指的是GPT-4o的多模態特性。

01點05分:對於桌面版的ChatGPT,OpenAI表示重新對UI進行了設計。(註:OpenAI在公告中表示,桌面應用程序適用於macOS,Windows版本將在今年晚些時候推出)

01點08分:GPT-4o具備GPT-4同等的智能,但運行速度更快,兼具文字、音頻和影片能力。這是OpenAI歷史上第一次在「便於使用」這個目標上實現了飛躍的進步。

01點13分:直到今天之前,在語音模式下,OpenAI仍需要調用三個模型——轉寫、智能和文生語音功能,這也造成了體驗上的巨大延遲。而GPT-4o可以自然地在圖片、文字和聲音上進行推理。

01點17分:通過效率的提升,也使得OpenAI可以向免費用戶提供GPT-4級別的智能。

01點19分:Murati重申,由於GPT-4o帶來的效率提升,現在OpenAI可以讓所有人都能使用上(GPT-4)工具。

01點20分:目前GPT Store里已經有超過100萬個GPTs。伴隨著免費開放,GPTs的開發者將獲得更大的用戶基數。

01點22分:免費用戶也將能夠上傳圖片、進行分析、使用「瀏覽器」功能搜索實時信息。同時GPT-4o也將支持記憶功能。GPT-4o也將支持API,供開發者調用。相較於GPT-4 Turbo,GPT-4o快兩倍、便宜50%,速率限制高出5倍。

01點25分:兩名研究主管Mark Chen和Barret Zoph登台,他們將演示一系列新功能。

01點26分:Mark Chen正在與ChatGPT寒暄,機器人能夠從急促的喘氣聲中理解「緊張」的含義,並且指導他進行深呼吸。

01點28分:Chen表示,他的演示是為了說明,在目前的語音模式下,不需要再與機器進行機械的一問一答,可以進行實時的溝通交流。實時交流中不需要再每次「尷尬地等待2-3秒」。

01點30分:實時演示中,主持們不斷要求ChatGPT變換語調,包括誇張的語氣、機器人的預期和使用「唱腔」講故事。

01點35分:Barret Zoph啟動攝像頭,要求ChatGPT實時幫助他解決一個一元方程題。

01點37分:除了圖像識別和解題能力外,ChatGPT展現了實時根據影像變化,與Barret實時互動的能力。

01點40分:Barret進一步展示了ChatGPT桌面版對代碼和電腦桌面(一張氣溫圖表)進行實時解讀的能力。

01點42分:Murati和Mark Chen展示ChatGPT進行意大利語、英語的實時交傳翻譯。

發佈會結束,OpenAI表示今天的發佈會主要聚焦於免費用戶,這些功能將在未來幾週內逐步向所有用戶推送。

根據OpenAI的官網公告顯示,GPT-4o將同時向付費的Plus、Team用戶,以及免費用戶推出。Plus用戶的消息限制數量將是免費用戶的5倍,Team和Enterprise用戶的可用消息數量還會更高一些。當免費用戶的使用量達到限制後,ChatGPT將自動切換到GPT-3.5,以便繼續進行對話。