免費開放給所有人使用!OpenAI推出新模型「GPT-4o」 - 科技新聞 - PChome Online 新聞



  
  
  

  
  

    


 
  
            
              

免費開放給所有人使用!OpenAI推出新模型「GPT-4o」

免費開放給所有人使用!OpenAI推出新模型「GPT-4o」

OpenAI舉行春季新品發表會,推出新的人工智慧模型「GPT-4o」,其中的「o」代表「omni」,也就是全能、全方位的意思,代表其在各種應用場景中都有著廣泛的功能及適用性。


使用者過去以語音模式與ChatGPT對話時,GPT-3.5的平均延遲時間為2.8秒、GPT-4則為5.4秒,但也有著無法直接觀察音調及多個說話者或背景噪音,也無法輸出笑聲、歌唱或表達情感等問題。



免費開放給所有人使用!OpenAI推出新模型「GPT-4o」


而OpenAI針對GPT-4o,進行跨文字、音訊、圖像的端到端訓練新模型,使所有輸入和輸出都由同一神經網路處理,也成就現在的GPT-4o能夠接受使用者輸入文字、音訊、圖像,也能產出文字、音訊和圖像的的回應,並且可以在232毫秒的時間內回應音訊輸入,平均為320毫秒,這與人類在自然對話中的回應時間相似。


不僅如此,新模型還能透過分析使用者的臉部變化感知其情緒狀況,並透過回應、變換聲調、播放音樂,甚至講睡前故事等方式來舒緩使用者情緒,就像是真人在跟你互動一般。



免費開放給所有人使用!OpenAI推出新模型「GPT-4o」


GPT-4o的即時語言翻譯能力也較前一代更上一層樓。在發表會中,OpenAI研究員 Mark Chen與技術長Mira Murati分別以義大利文和英文對話,而新模型隨即將雙方交談的內容翻譯成各自的語言。


所以GPT-4o在英語文字和程式碼上的表現與GPT-4 Turbo的效能相匹配,在非英語文字上的效能也顯著提高,且與GPT-4 Turbo相比,其API速度快上一倍,成本卻只有GPT-4 Turbo的50%。


OpenAI指出,GPT-4o 是他們突破深度學習界線的最新舉措,並朝著實用性的方向發展,而這個新模型將免費開放給所有用戶使用,不過付費用戶將享有更大的容量上限。


(以上圖片取自OpenAI官網)



最新科技新聞
人氣科技新聞
行動版 電腦版