Guide et Comparatif

Gemini : présentation de l'IA de Google qui va faciliter la vie des utilisateurs de smartphone

Le 19/05/2024 à 14:00

Voici tout ce qu'il faut comprendre de Gemini, la nouvelle IA développée par Google. © Google

Alors que le vaste sujet de l’intelligence artificielle n’a jamais fait couler autant d’encre, le géant de la tech' Google s’est également lancé à son tour dans la course à l’IA. Si vous n’avez pas tout compris à Gemini, la nouvelle IA développée par la firme de Mountain View, pas de panique : SFR Actus vous explique tout ce qu’il faut savoir.

Mardi 14 mai, Google dévoilait son lot d’innovations lors de sa fameuse conférence Google I/O. Si la firme de Mountain View a livré quelques précisions au sujet d’Android 15, la prochaine version de son OS destiné aux smartphones Android, c’est surtout Gemini, l’intelligence artificielle de Google, qui était la véritable tête d’affiche de la conférence annuelle.

Qu’est-ce que Gemini ?

Concrètement, qu’est-ce que Gemini ? Lorsqu’on se rend sur le chatbot Gemini (à l’image de ChatGPT via Open AI) et qu’on lui pose directement la question, voici ce que l’intelligence artificielle maison de Google nous répond :

''Google Gemini, également connu sous le nom de Gemini AI ou simplement Gemini, est un modèle d'intelligence artificielle (IA) de type réseau neuronal multimodal génératif développé par Google AI et DeepMind. Cet outil d'intelligence artificielle conversationnelle est un modèle de langage avancé capable de générer du texte, de traduire des langues, d'écrire différents types de contenu créatif et de répondre à vos questions de manière informative.''

Similaire et même concurrent direct de ChatGPT, notamment GPT-4o, sa dernière version la plus avancée, Gemini remplace définitivement et totalement Bard, le premier chatbot de Google lancé en février 2023. Lancé avant le début de l’année 2024, Gemini est toutefois bien plus qu’un simple chatbot. L’outil rassemble en effet plusieurs modèles de langage (LLM) capables de comprendre le langage naturel, les images, l’audio, la vidéo et même le code.

En intégrant de nouvelles informations et en affinant ses capacités au fil du temps, Gemini va apprendre et s’améliorer de façon continue. Se basant et puisant dans les avancées technologiques issues des recherches menées par Google Brain et DeepMind, Gemini se dote d'un triple champ d’action :

Traitement du langage naturel (NLP), afin de suivre vos instructions et répondre à vos demandes de manière réfléchie, générer du texte de manière fluide et cohérente, traduire des langues ou encore écrire du contenu créatif et s’adapter à divers styles d'écriture.
Génération d'images et de vidéos : à partir de descriptions textuelles, qu’elles soient complexes ou simples, l’outil de Google va pouvoir créer des images et des vidéos réalistes.
Raisonnement et résolution de problèmes : afin d’aider à une prise de décision dans un domaine complexe (tel qu’un domaine scientifique par exemple), Gemini est capable de raisonner sur des informations complexes afin de résoudre ou d’analyser des problèmes logiques.

Une intégration en profondeur dans l’écosystème Android

Lors de l’ouverture de la Google I/O le 14 mai, le directeur général de Google Sundar Pichai a immédiatement donné le ton : remplaçant Google Assistant, Gemini va progressivement s’intégrer dans la prochaine version d’Android, soit Android 15, attendue théoriquement pour l’automne 2024, accompagnant l’hypothétique sortie des futurs Google Pixel 9.

L’intégration en profondeur s’effectuera dans les applications phares de Google : Gmail, Calendar, Tasks, Docs, Drive ou encore Keep. L’objectif est simple : faciliter la vie de l’utilisateur au quotidien. Par exemple, vous pourrez prendre en photo une liste d’évènements et solliciter Gemini afin qu’elle les intègre directement à votre agenda. Utilisant tout le potentiel de l’écosystème du géant de la tech', Gemini naviguera entre toutes les applications natives de Google, de quoi garantir praticité et fluidité.

Gemini : trois modèles bientôt disponibles

En fonction de la complexité des demandes et des besoins, Google a décidé de décliner son IA Gemini en trois modèles qui diffèrent par leur capacité et leurs fonctionnalités :

Gemini Nano, soit la version ''allégée'' de Gemini. Concrètement, Gemini Nano est optimisé pour fonctionner directement sur les appareils mobiles comme les smartphones, sans forcément nécessiter de connexion internet. À l’heure actuelle, certaines fonctionnalités de Gemini Nano sont disponibles sur le Google Pixel 8 Pro.
Gemini Pro, le modèle LLM alimentant le chatbot Gemini de Google. Cette version plus lourde et complète peut traiter des données en grande quantité (approximativement 700 000 mots, 30 000 lignes de code, ou 11 heures d'audio).
Gemini Ultra, soit la version la plus premium et aboutie de Gemini. Ce modèle se destine à des tâches très complexes, comme l’analyse d’articles scientifiques ou la résolution de problèmes avancés.

À l’heure où nous écrivons ces lignes, Google n'a pas encore annoncé de date précise pour la disponibilité grand public de Gemini, qui sera proposée sous forme d'abonnements individuels. Il faudra donc patienter encore un peu avant de mettre à l’épreuve la nouvelle IA révolutionnaire de Google...