Google I/O 2024 | Gemini 1.5 Flash 是個「輕量化」的模型

可望降低開發者的時間和金錢成本。

Google Gemini 1.5 Flash

Google 在一年一度的 I/O 開發者大會上,宣布了多項對其 Gemini AI 模型家族的更新。這當中最主要的一個,是該公司正準備推出一個名為「Gemini 1.5 Flash」的新模型,據稱該模型是以更快的速度和更高的效率為目標進行最佳化。

Google DeepMind 的 CEO Demis Hassabis 表示,Gemini 1.5 Flash 在摘要生成、聊天、圖像和影片字幕生成、以及由長文件和表格中提取資料等方面更勝一籌。Hassabis 並補充說,Google 之所以創建 Gemini 1.5 Flash,是因為開發人員需要一個比 Pro 版本更輕、更便宜的模型。Google 是在今年 2 月份發表了 Gemini 1.5 Pro,該版本相比去年年底發布的原始 Gemini 1.0 模型,在效率和性能方面均有所提升。

Gemini 1.5 Flash 位於功能更強大、但也更耗費資源的 Gemini 1.5 Pro,以及運行在設備本機內的超小型 Gemini 1.5 Nano 之間。然而,盡管它比 Gemini Pro 更輕巧,功能卻沒有打折多少。Google 表示,這是通過「知識蒸餾(Distillation)」的方式來實現的。Google 將來自 Gemini 1.5 Pro 的最核心知識和技能轉移到了Flash 這個較小的模型中,這意味著 Gemini 1.5 Flash 除了擁有與 Pro 相同的多模態能力外,還有同樣長 (100 萬個 token)的窗口。據 Google 的說法,這讓 Gemini 1.5 Flash 可以同時分析長達 1500 頁的文件或超過 30,000 行的程式碼。

不過所有這些型號的 Gemini 實際上都不是以消費者為使用對象,而是為開發者提供了一種更快、更便宜的方式,來使用 Google 設計的技術構建自己的 AI 產品與服務。

除了推出 Gemini 1.5 Flash 之外,Google 還升級了 Gemini 1.5 Pro,增強了該模型編寫程式碼、推理以及解析音訊和圖像的能力。但還有更大的更新即將到來 —— Google 宣布了今年晚些時候將把該模型現有的窗口翻一番,增加到 200 萬個 token。這將使其能夠同時處理兩小時的影片、22 小時的音訊、超過 60,000 行的程式碼或超過 140 萬字的文字。

Gemini 1.5 Flash 和 Pro 目前都可以在 Google 的 AI Studio 和 Vertex AI 中作為公開預覽版本使用。同時,Google 還宣布了其開源模型 Gemma 的新版本,名為 Gemma 2。但是,除非你是開發者,或喜歡試用這麼東西,否則這些更新實際上都不影響普通消費者的。

緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!

🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk

🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/

🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8

🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D