與ChatGPT競爭的Google Gemini,本月(5)推出更新,原來它已有繁體中文版也有 App!最強大的功能是它可以串連Gmail、Google Map和Google Drive等,讓你生活更方便!怎麼下載使用與安裝?好用方式與完整優缺點分析在哪?《遠見》一文完整教學。
Google Gemini有哪些更新?
盤點過往Google Gemini(舊名Google Bard)更新,去年5月(2023),將底層模型從LaMDA調整為PaLM系列模型,7月進一步推出中文版以觸及更多大眾,同時增加文字轉語音功能,也讓人分享與Gemini的對話。
去年9月時,Google發揮成熟生態系優勢,讓Gemini連接各個「通路」。
對使用者個人來說,可以取得Google Workspace既有資訊,例如使用者可以直接導入Gmail、Google文件以及雲端硬碟的不同檔案,Gemin因此更能有效地扮演智慧助手,同時讓苦於無法取得個資的ChatGPT相形失色。當然,ChatGPT沒有就此退出競爭,也在去年8月推出需付費的企業版ChatGPT,開放使用者導入其他應用程式,藉此豐厚原先ChatGPT這座資料孤島。
對外,Gemini則透過Google眾多應用服務,取得形態各異的資訊,例如自地圖取得交通路程、從YouTube取得娛樂影音內容,並接起航班與飯店,降低使用者獲取資訊耗費的認知資源,可以將重點放在規劃上。
12月時,Gemini模型再升級至Gemini Pro,今年2月以降,則沿著ChatGPT的相似路線前進,先是嵌入Imagen模型,就像ChatGPT之於DALLE一般,加進以文生圖功能,同時深度整合Google搜尋功能,讓使用者可以對照生成與搜尋結果內容的異同,超越ChatGPT曾經引發關注的網頁瀏覽功能。
同樣在2月,Google Bard正式改名為Google Gemini,並同步推出應用程式版本。除了簡化名稱,讓一般用戶更不容易混淆以外,也能看出Google推進其AI服務的決心。
從詩人變成雙子,這款服務就不再是激發創意的內容創作者,重點也不再是單一產品表現良窳、能否超越競品,而在於和Gemini模型對標,表現更容易讓人聯想到Gemini模型的實際功力,有了應用程式後,也能接觸更多行動端的使用者。Google更表示,推出應用程式版本,可說是「提供世界上最有用人工智慧助理願景所邁出的重要一步。」
今年5月這波更新中,主要是將過往率先讓英文使用者先行體驗的功能,延伸到更多語言當中,中文版也在其中,包含繁體中文版的Gemini app(應用程式)和Google服務的串連,都是跟上英文版的重要環節。
Google Gemini 連接Gmail、雲端硬碟,怎麼當好文書智慧助手?
使用Google Gemini時,可以取用存放於電子信箱、文件和雲端硬碟中的檔案。
要啟動此功能,用戶必須同意「連結至Workspace」的設定,然後才能存取檔案。Google強調,為了保護隱私,他們不會使用Workspace的資料提升Gemini的性能。
整合Google Workspace後,讓Google Gemini更為實用,不再僅是像ChatGPT那樣只能在網絡上搜尋資料和回答問題,它能同時整合外部和內部資料,更接近智慧助理。
雖然內嵌在Microsoft 365中的付費Copilot也有使用者電腦和雲端資料的權限,但Gemini透過Google的內部API,同樣串起Workspace中的文件,對於非企業用戶,以及非微軟使用者來說,Gemini的更新可以減少微軟工具的吸引力。
先前這項功能只開放給英文版使用者,現在中文版也能使用。實際測試中,Gemini快速總結一週內收到的電子信件重點,得到的表現不差。
Google Gemini 串連地圖、YouTube,優點與缺點分析?
除了擔任文件管理助手,幫助使用者查找信件和檔案細節,Gemini還增添了一個關鍵功能,成為外部資訊的整理員,新增擴充功能,因此串起地圖、也能查到音樂,Google應用程式盡在掌握。不過,遺憾的是幻覺也很多。
Google Gemini開發團隊的傑出科學家紀懷新(Ed H. Chi)去年八月返台時曾表示,相較於OpenAI的ChatGPT,Google的強項在於,能夠將大型語言模型與旗下多元產品結合使用。
這次開放使用繁體版擴充功能,印證了紀懷新所說,透過調取這些應用程式的應用程式介面(Application Programming Interface,API),進而由Gemini整理資訊與用戶對話。Google的期許是使用者不用開啟新的分頁,而能直接在Google旗下的服務中完成各項任務。
不過,檢視運作成果,仍有許多待改進之處。以安排小巨蛋到大巨蛋的交通路程來說,Gemini誤解「小巨蛋」,將小巨蛋和大巨蛋誤認為相同地點,因此安排出的路線頗有問題。同時,提供的大巨蛋運送賽事晚於提問時間(5/10),對使用者的幫助不大。
將問題從小巨蛋通往大巨蛋,調整成自南京林森路口到大巨蛋,回答中仍可看出Gemini不時將大巨蛋錯誤理解為小巨蛋的狀況。不過,只要Gemini在解析使用者輸入(input)多下功夫,運用不同的落地(grounding)技巧,就能有效緩解目前誤解,預期很快就能修正。
再以YouTube的連結為例,Gemini在回答YouTube上周杰倫點閱最高的作品時,仍舊回答錯誤。實際查找YouTube後可以知道,點閱次數最多的是2.5億次的《告白氣球》,並非Gemini回答的擱淺。
為何會犯下如此簡單的錯誤?造訪YouTube後可以看到,目前Gemini很有可能單純串起YouTube API,但還沒有調整過回答邏輯,因此回答順序和YouTube預設結果相同。若根據觀看次數排序,就能夠得到《告白氣球》在前的結果。因此,這個失誤預計也能很快改進。
Google Gemini App 繁體中文版開放下載,要怎麼使用?
至Google Play下載Gemini應用程式後,接著打開。它會提醒使用者,要先「登入Google應用程式」後才能使用。
何謂Google應用程式?其實就是同名同姓、內建在手機內的Google App。一般情況下都已經登入過,若還沒完成登入步驟,要記得用Gmail登入,接下來就能開始使用Gemini。
因為Gemini和Google助理相同,都能用語音對話,功能也有部分重疊,因此現在若要使用Gemini,需要先確認切換改用Gemini。
切換後就能開始使用了。Gemini本身就是多模態模型,可以接受文字、語音和圖像輸入,因此可以請它辨識照片與圖片,也能像是和Google助理對話一樣,直接用嘴巴下指令。
以辨識上傳圖片的結果來看,雖然仍有錯誤部分,但已經能夠大致理解照片中的元素。
詢問Google擅長的行程和交通方式等問題時,目前仍有幻覺產生,例如提問當天(05/12)其實有籃球比賽,小巨蛋至大巨蛋的公車路線,也出現頗多問題。
不過,若只是一般性的創意思考、寫作建議等,Gemini App都能產出不錯成果。
展望未來,Google是否有可能將Gemini發展成一個超級應用程式(Super app),或者是全新的服務入口?若它可以滿足人類對於資訊的全方位需求,不限於目前Gemini在每次問答中解決一個問題、連接單一應用程式的API,而是進一步在消化資訊後,向不同應用程式發出指令,最終整合完整的資訊。
例如,讓Gemini整理雲端硬碟中的日本旅行計畫PDF文件,同時在Gmail確認機票訂購進度和旅館安排,使用Google地圖補充旅行計畫中遺漏的資訊,並在Google文件中重新整理計畫,製作一份完整且排版精美的計畫書。
能夠實現這一功能,意味著Google Gemini正逐步邁向成為一個真正的生活助理,同時這也象徵著其與微軟的競爭將變得更加激烈,因為許多上述功能都是微軟Copilot試圖實現的任務。