Google Gemini 如何下載?竟秒整理Gmail! | 遠見雜誌
訂閱
快速註冊 已是會員,立即登入

為您推薦

加入會員獨享優惠

Google Gemini 如何下載?竟秒整理Gmail!

曾子軒
user

曾子軒

2024-05-13

瀏覽數 5,850+

Google Gemini開放給中文使用者,有機會和先前的Google助理整合。取自Google Blog
Google Gemini開放給中文使用者,有機會和先前的Google助理整合。取自Google Blog
00:00
00:00

ChatGPT競爭的Google Gemini,本月(5)推出更新,原來它已有繁體中文版也有 App!最強大的功能是它可以串連Gmail、Google Map和Google Drive等,讓你生活更方便!怎麼下載使用與安裝?好用方式與完整優缺點分析在哪?《遠見》一文完整教學。

Google Gemini有哪些更新?

盤點過往Google Gemini(舊名Google Bard)更新,去年5月(2023),將底層模型從LaMDA調整為PaLM系列模型,7月進一步推出中文版以觸及更多大眾,同時增加文字轉語音功能,也讓人分享與Gemini的對話。

去年9月時,Google發揮成熟生態系優勢,讓Gemini連接各個「通路」。

對使用者個人來說,可以取得Google Workspace既有資訊,例如使用者可以直接導入Gmail、Google文件以及雲端硬碟的不同檔案,Gemin因此更能有效地扮演智慧助手,同時讓苦於無法取得個資的ChatGPT相形失色。當然,ChatGPT沒有就此退出競爭,也在去年8月推出需付費的企業版ChatGPT,開放使用者導入其他應用程式,藉此豐厚原先ChatGPT這座資料孤島。

對外,Gemini則透過Google眾多應用服務,取得形態各異的資訊,例如自地圖取得交通路程、從YouTube取得娛樂影音內容,並接起航班與飯店,降低使用者獲取資訊耗費的認知資源,可以將重點放在規劃上。

Gemini則透過Google眾多應用服務,取得形態各異的資訊。取自Google Gemini對話

Gemini則透過Google眾多應用服務,取得形態各異的資訊。取自Google Gemini對話

Gemini則透過Google眾多應用服務,取得形態各異的資訊。取自Google Gemini對話

Gemini則透過Google眾多應用服務,取得形態各異的資訊。取自Google Gemini對話

12月時,Gemini模型再升級至Gemini Pro,今年2月以降,則沿著ChatGPT的相似路線前進,先是嵌入Imagen模型,就像ChatGPT之於DALLE一般,加進以文生圖功能,同時深度整合Google搜尋功能,讓使用者可以對照生成與搜尋結果內容的異同,超越ChatGPT曾經引發關注的網頁瀏覽功能。

同樣在2月,Google Bard正式改名為Google Gemini,並同步推出應用程式版本。除了簡化名稱,讓一般用戶更不容易混淆以外,也能看出Google推進其AI服務的決心。

從詩人變成雙子,這款服務就不再是激發創意的內容創作者,重點也不再是單一產品表現良窳、能否超越競品,而在於和Gemini模型對標,表現更容易讓人聯想到Gemini模型的實際功力,有了應用程式後,也能接觸更多行動端的使用者。Google更表示,推出應用程式版本,可說是「提供世界上最有用人工智慧助理願景所邁出的重要一步。」

今年5月這波更新中,主要是將過往率先讓英文使用者先行體驗的功能,延伸到更多語言當中,中文版也在其中,包含繁體中文版的Gemini app(應用程式)和Google服務的串連,都是跟上英文版的重要環節。

Google Gemini 連接Gmail、雲端硬碟,怎麼當好文書智慧助手?

使用Google Gemini時,可以取用存放於電子信箱、文件和雲端硬碟中的檔案。

要啟動此功能,用戶必須同意「連結至Workspace」的設定,然後才能存取檔案。Google強調,為了保護隱私,他們不會使用Workspace的資料提升Gemini的性能。

要存取Gmail,用戶必須同意「連結至Workspace」的設定。取自Google Gemini對話

要存取Gmail,用戶必須同意「連結至Workspace」的設定。取自Google Gemini對話

整合Google Workspace後,讓Google Gemini更為實用,不再僅是像ChatGPT那樣只能在網絡上搜尋資料和回答問題,它能同時整合外部和內部資料,更接近智慧助理。

雖然內嵌在Microsoft 365中的付費Copilot也有使用者電腦和雲端資料的權限,但Gemini透過Google的內部API,同樣串起Workspace中的文件,對於非企業用戶,以及非微軟使用者來說,Gemini的更新可以減少微軟工具的吸引力。

先前這項功能只開放給英文版使用者,現在中文版也能使用。實際測試中,Gemini快速總結一週內收到的電子信件重點,得到的表現不差。

Gemini快速總結一週內收到的電子信件重點,得到的表現不差。取自Google Gemini對話

Gemini快速總結一週內收到的電子信件重點,得到的表現不差。取自Google Gemini對話

Google Gemini 串連地圖、YouTube,優點與缺點分析?

除了擔任文件管理助手,幫助使用者查找信件和檔案細節,Gemini還增添了一個關鍵功能,成為外部資訊的整理員,新增擴充功能,因此串起地圖、也能查到音樂,Google應用程式盡在掌握。不過,遺憾的是幻覺也很多。

從此不再晚上加班|AI成為你的簡報策略師,快速生成完美簡報

Google Gemini開發團隊的傑出科學家紀懷新(Ed H. Chi)去年八月返台時曾表示,相較於OpenAI的ChatGPT,Google的強項在於,能夠將大型語言模型與旗下多元產品結合使用。

這次開放使用繁體版擴充功能,印證了紀懷新所說,透過調取這些應用程式的應用程式介面(Application Programming Interface,API),進而由Gemini整理資訊與用戶對話。Google的期許是使用者不用開啟新的分頁,而能直接在Google旗下的服務中完成各項任務。

不過,檢視運作成果,仍有許多待改進之處。以安排小巨蛋到大巨蛋的交通路程來說,Gemini誤解「小巨蛋」,將小巨蛋和大巨蛋誤認為相同地點,因此安排出的路線頗有問題。同時,提供的大巨蛋運送賽事晚於提問時間(5/10),對使用者的幫助不大。

Gemini誤解「小巨蛋」,將小巨蛋和大巨蛋誤認為相同地點。取自Google Gemini對話

Gemini誤解「小巨蛋」,將小巨蛋和大巨蛋誤認為相同地點。取自Google Gemini對話

將問題從小巨蛋通往大巨蛋,調整成自南京林森路口到大巨蛋,回答中仍可看出Gemini不時將大巨蛋錯誤理解為小巨蛋的狀況。不過,只要Gemini在解析使用者輸入(input)多下功夫,運用不同的落地(grounding)技巧,就能有效緩解目前誤解,預期很快就能修正。

將問題從小巨蛋通往大巨蛋,調整成自南京林森路口到大巨蛋,回答中仍可看出Gemini不時將大巨蛋錯誤理解為小巨蛋的狀況。取自Google Gemini對話

將問題從小巨蛋通往大巨蛋,調整成自南京林森路口到大巨蛋,回答中仍可看出Gemini不時將大巨蛋錯誤理解為小巨蛋的狀況。取自Google Gemini對話

再以YouTube的連結為例,Gemini在回答YouTube上周杰倫點閱最高的作品時,仍舊回答錯誤。實際查找YouTube後可以知道,點閱次數最多的是2.5億次的《告白氣球》,並非Gemini回答的擱淺。

Gemini在回答YouTube上周杰倫點閱最高的作品時,仍舊回答錯誤。取自Google Gemini對話

Gemini在回答YouTube上周杰倫點閱最高的作品時,仍舊回答錯誤。取自Google Gemini對話

為何會犯下如此簡單的錯誤?造訪YouTube後可以看到,目前Gemini很有可能單純串起YouTube API,但還沒有調整過回答邏輯,因此回答順序和YouTube預設結果相同。若根據觀看次數排序,就能夠得到《告白氣球》在前的結果。因此,這個失誤預計也能很快改進。

目前Gemini很有可能單純串起YouTube API,但還沒有調整過回答邏輯。取自YouTube操作畫面

目前Gemini很有可能單純串起YouTube API,但還沒有調整過回答邏輯。取自YouTube操作畫面

Google Gemini App 繁體中文版開放下載,要怎麼使用?

至Google Play下載Gemini應用程式後,接著打開。它會提醒使用者,要先「登入Google應用程式」後才能使用。

要先「登入Google應用程式」後才能使用。取自Google Gemini App對話

要先「登入Google應用程式」後才能使用。取自Google Gemini App對話

何謂Google應用程式?其實就是同名同姓、內建在手機內的Google App。一般情況下都已經登入過,若還沒完成登入步驟,要記得用Gmail登入,接下來就能開始使用Gemini。

Google App。取自Google Gemini App對話

Google App。取自Google Gemini App對話

因為Gemini和Google助理相同,都能用語音對話,功能也有部分重疊,因此現在若要使用Gemini,需要先確認切換改用Gemini。

現在若要使用Gemini,需要先確認切換改用Gemini。取自Google Gemini App對話

現在若要使用Gemini,需要先確認切換改用Gemini。取自Google Gemini App對話

切換後就能開始使用了。Gemini本身就是多模態模型,可以接受文字、語音和圖像輸入,因此可以請它辨識照片與圖片,也能像是和Google助理對話一樣,直接用嘴巴下指令。

以辨識上傳圖片的結果來看,雖然仍有錯誤部分,但已經能夠大致理解照片中的元素。

Gemini已經能夠大致理解照片中的元素。取自Google Gemini App對話

Gemini已經能夠大致理解照片中的元素。取自Google Gemini App對話

詢問Google擅長的行程和交通方式等問題時,目前仍有幻覺產生,例如提問當天(05/12)其實有籃球比賽,小巨蛋至大巨蛋的公車路線,也出現頗多問題。

詢問Google擅長的行程和交通方式等問題時,目前仍有幻覺產生。取自Google Gemini App對話

詢問Google擅長的行程和交通方式等問題時,目前仍有幻覺產生。取自Google Gemini App對話

詢問Google擅長的行程和交通方式等問題時,目前仍有幻覺產生。取自Google Gemini App對話

詢問Google擅長的行程和交通方式等問題時,目前仍有幻覺產生。取自Google Gemini App對話

不過,若只是一般性的創意思考、寫作建議等,Gemini App都能產出不錯成果。

展望未來,Google是否有可能將Gemini發展成一個超級應用程式(Super app),或者是全新的服務入口?若它可以滿足人類對於資訊的全方位需求,不限於目前Gemini在每次問答中解決一個問題、連接單一應用程式的API,而是進一步在消化資訊後,向不同應用程式發出指令,最終整合完整的資訊。

例如,讓Gemini整理雲端硬碟中的日本旅行計畫PDF文件,同時在Gmail確認機票訂購進度和旅館安排,使用Google地圖補充旅行計畫中遺漏的資訊,並在Google文件中重新整理計畫,製作一份完整且排版精美的計畫書。

能夠實現這一功能,意味著Google Gemini正逐步邁向成為一個真正的生活助理,同時這也象徵著其與微軟的競爭將變得更加激烈,因為許多上述功能都是微軟Copilot試圖實現的任務。

延伸閱讀

勇往職前 躍競搶手人才起手式
數位專題

勇往職前 躍競搶手人才起手式

當AI以超乎想像的速度趕上人類的腳步,掀起一波職涯新革命,我們必須思考:大學學什麼對未來工作才加分?作為多數學子邁向職場前的最後一哩路,高等教育有責任培養學子的競爭力,一起剖析未來人才關鍵實力。

請往下繼續閱讀

登入網站會員

享受更多個人化的會員服務