KultureGeek Internet Google lance Gemini, son nouveau modèle d’IA pour concurrencer GPT-4 (ChatGPT)

Google lance Gemini, son nouveau modèle d’IA pour concurrencer GPT-4 (ChatGPT)

6 Déc. 2023 • 17:26
0

Après une première annonce à l’occasion de la conférence I/O, Google annonce aujourd’hui le lancement de Gemini, qui se veut son nouveau modèle d’IA. Cela vient concurrencer GPT-4, le modèle d’OpenAI (ChatGPT) et ça débarque dans Bard.

Google Gemini Logo

Avec Gemini, Google veut dominer l’IA

Google explique que Gemini est le fruit d’une coopération de grande envergure entre différentes équipes de l’écosystème Google. Ce modèle a été conçu dès l’origine pour être multimodal, c’est-à-dire capable de généraliser, comprendre avec fluidité, traiter et combiner différents supports d’informations, dont le texte, le code, l’audio, l’image et la vidéo.

Google assure également que Gemini est son modèle le plus polyvalent à ce jour. Il est annoncé pour être adapté et efficace pour tous les usages depuis les data centers jusqu’aux smartphones. Ses capacités avancées apporteront aux développeurs et aux entreprises pour la conception et la mise à disposition d’applications fondées sur l’IA auprès du plus grand nombre.

Aujourd’hui marque le lancement de Gemini 1.0 avec trois éléments :

  • Gemini Ultra — le modèle le grand et le plus capable, doté des plus larges capacités, destiné aux tâches de haute complexité ;
  • Gemini Pro — le modèle le plus polyvalent, adapté à une grande variété de tâches ;
  • Gemini Nano — le modèle le plus efficace pour les tâches embarquées (sur l’appareil)

Plus performant que GPT-4 d’OpenAI

Qu’en est-il des performances ? De la compréhension naturelle de supports image, audio ou vidéo au raisonnement mathématique, les performances de Gemini Ultra surpassent GPT-4 d’OpenAI dans ce domaine dans 30 des 32 référentiels académiques largement utilisées dans la recherche et le développement de grands modèles de langage (Large Language Models ou LLMs), selon les affirmations de Google.

Google Gemini vs GPT-4

Avec un score de 90%, Gemini Ultra est le premier modèle capable de surpasser les experts humains en matière de compréhension massive du langage multitâche (Massive Multitask Language Understanding ou MMLU), qui teste à la fois les connaissances sur le monde et les capacités de résolution de problèmes dans un corpus de 57 sujets tels que les mathématiques, la physique, l’histoire, le droit, la médecine ou l’éthique.

Gemini Ultra atteint également une performance inédite de 59,4% dans le nouveau référentiel de compréhension massive multidisciplinaire multitâche (MMMU, Massive Multi-discipline Multimodal Understanding), qui propose des tâches multimodales exigeant un raisonnement délibéré dans une grande variété de domaines.

Dans les référentiels d’image sur lesquels il a été testé, Gemini Ultra a surclassé les meilleurs modèles existants sans avoir recours à des systèmes de reconnaissance de texte (OCR), qui permettent d’extraire le texte contenu dans les images pour les traiter. Ces benchmarks ont souligné la multimodalité native de Gemini et ont donné une première indication de ses capacités de raisonnement approfondies. Les résultats détaillés sont disponibles sur cette page.

Une démonstration avec des vidéos

Google propose également des vidéos de démonstration. Une personne montre des objets, des dessins et des vidéos à Gemini. Le système d’IA commente à l’oral ce qu’il « voit », identifie les objets, joue de la musique et répond à des questions requérant un certain degré d’analyse, en justifiant son raisonnement. Par exemple, face à l’image d’un canard en plastique qui doit choisir entre deux chemins — celui de gauche menant vers un autre canard dessiné sur le papier et celui de droite vers un ours à l’air menaçant — Gemini suggère le chemin de gauche car « il vaut mieux se faire des amis plutôt que des ennemis ».

La vidéo démontre aussi que Gemini peut reconnaître des références avec très peu de contexte, comme une scène du film Matrix jouée par une personne qui fait semblant d’éviter des balles au ralenti.

Une disponibilité dès aujourd’hui

Google propose dès aujourd’hui Gemini Pro au lieu de LaMDA au niveau de son IA Bard. Il faut cependant parler anglais (pour l’instant) pour avoir le droit à la nouvelle version.

Pour Gemini Nano, la disponibilité se fait au niveau du smartphone Pixel 8 Pro. Ce sera disponible avec une mise à jour afin d’améliorer les capacités de reconnaissance du texte ou de prédiction des réponses. On peut imaginer que cela arrivera plus tard sur tous les smartphones Android.

2024 sera par ailleurs une grosse année avec Google qui compte proposer Gemini sur son moteur de recherche, Chrome et d’autres éléments, toujours dans l’objectif d’améliorer les prédictions. Pour la recherche par exemple, Google parle d’un affichage des résultats 40% plus rapide.

Toujours en 2024, Google proposera Bard Advanced, qui sera une version avancée du chatbot avec Gemini Ultra. Il est toutefois possible que ce soit payant (à l’instar de ChatGPT Plus).

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Claude Cowork

Anthropic lance Claude Cowork pour l’automatisation de tâches avec l’IA

13 Jan. 2026 • 22:26
0 Logiciels

Anthropic lance Cowork, une déclinaison simplifiée de Claude Code intégrée à l’application Claude sur ordinateur,...

Firefox Logo

Firefox 147 améliore la lecture vidéo et apporte d’autres nouveautés

13 Jan. 2026 • 19:31
0 Logiciels

Mozilla propose aujourd’hui au téléchargement Firefox 147 dans sa version stable. Il y a quelques nouveautés disponibles avec...

Free Logo

Free Mobile confirme ne pas augmenter ses prix et mise sur la 5G+

13 Jan. 2026 • 18:03
1 Mobiles / Tablettes

Free Mobile fête aujourd’hui ses 14 ans et l’opérateur en profite pour parler des prix, ainsi que de son...

illustration batteries solides

Batterie solide : une percée sur l’électrolyte solide pourrait accélérer l’arrivée de cellules plus sûres et plus performantes

13 Jan. 2026 • 17:01
1 Science

Au CES 2026, la batterie solide (ou tout-solide) a cessé d’être un simple mot magique réservé aux laboratoires. Comme...

Star Wars Outlaws

Ubisoft annonce une nouvelle vague de licenciements dans ses deux studios suédois

13 Jan. 2026 • 16:45
0 Jeux vidéo

Décidément, l’année 2026 débute sur un climat social pour le moins tendu chez Ubisoft. Moins de deux semaines...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site