KultureGeek Internet Gemini 3.1 Flash-Lite : Google lance son modèle IA rapide et économique

Gemini 3.1 Flash-Lite : Google lance son modèle IA rapide et économique

4 min.
3 Mar. 2026 • 20:41
0

Google annonce Gemini 3.1 Flash-Lite, son modèle d’intelligence artificielle le plus rapide et le plus économique de la gamme Gemini 3, disponible dès aujourd’hui en accès anticipé pour les développeurs via l’API Gemini dans Google AI Studio et sur Vertex AI pour les entreprises.

Gemini 3 Logo

Le positionnement tarifaire est agressif : 0,25 $ par million de tokens en entrée et 1,50 $ par million de tokens en sortie. À titre de comparaison, GPT-5 mini facture 0,25 $ en entrée mais 2,00 $ en sortie, Claude 4.5 Haiku avec Extended Thinking atteint 1,00 $ en entrée et 5,00 $ en sortie, et Grok 4,1 Fast se positionne à 0,20 $ en entrée et 0,50 $ en sortie. Gemini 2.5 Flash-Lite, le prédécesseur direct, affichait 0,10 $ en entrée mais seulement 0,40 $ en sortie.

Gemini 3.1 Flash-Lite Prix Benchmarks

Le rapport vitesse/qualité comme principal argument

Gemini 3.1 Flash-Lite atteint 363 tokens par seconde en vitesse de sortie selon le benchmark Artificial Analysis. C’est 2,5 fois plus rapide en Time to First Answer Token et 45 % plus rapide en débit de sortie que Gemini 2.5 Flash. Cela confirme l’avantage face aux concurrents directs : GPT-5 mini plafonne à 71 tokens/s, Claude 4.5 Haiku (Extended Thinking) à 108 tokens/s, et Grok 4,1 Fast (Reasoning) à 145 tokens/s. Seul Gemini 2.5 Flash-Lite (Dynamic) fait mieux à 366 tokens/s, mais à un tarif en sortie quatre fois inférieur.

Gemini 3.1 Flash-Lite Tokens

Sur les benchmarks de qualité, Gemini 3,1 Flash-Lite s’impose dans la grande majorité des tests face à ses concurrents de même catégorie. Il décroche 86,9 % sur GPQA Diamond (connaissances scientifiques), 76,8 % sur MMMU Pro (compréhension multimodale), 84,8 % sur Video-MMMU, 88,9 % sur MMLU multilingue et 43,3 % sur SimpleQA. Sur LiveCodeBench (génération de code), GPT-5 mini prend la tête à 80,4 % contre 72,0 % pour Gemini 3.1 Flash-Lite. Sur Humanity’s Last Exam, Grok 4,1 Fast mène à 17,6 % contre 16,0 %. Le modèle affiche un score Elo de 1 432 sur le classement Arena.ai.

Des niveaux de réflexion configurables

Gemini 3,1 Flash-Lite intègre des niveaux de réflexion configurables directement dans Google AI Studio et Vertex AI, une fonctionnalité qui permet aux développeurs de doser le niveau de raisonnement selon la nature de la tâche. Pour les usages à haut volume où le coût prime (traduction, modération de contenu ou tri d’images à grande échelle), le modèle peut fonctionner en mode minimal. Pour des tâches plus complexes nécessitant un raisonnement approfondi (génération d’interfaces, création de simulations ou agents multi-étapes), le niveau de réflexion peut être augmenté.

Google indique que des développeurs en accès anticipé sur AI Studio, Vertex AI, ainsi que des entreprises comme Latitude, Cartwheel et Whering utilisent déjà le modèle en production, soulignant sa capacité à traiter des entrées complexes avec « la précision d’un modèle de niveau supérieur » tout en respectant les instructions.

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Windows 11 Bureau PC Portable

Microsoft tease « une nouvelle ère pour le PC » dans quelques jours

29 Mai. 2026 • 20:57
6 Actu OS

Microsoft donne rendez-vous la semaine prochaine pour présenter « une nouvelle ère pour le PC ». Faut-il...

Fable

Fable est reporté à 2027 pour éviter GTA 6

29 Mai. 2026 • 20:35
1 Jeux vidéo

Le compte officiel du jeu Fable affirmait le mois dernier qu’aucun report n’était prévu. Xbox vient pourtant de reporter le jeu...

YouTube Flux Video Personnalise

YouTube peut vous créer un flux vidéo personnalisé avec l’IA

29 Mai. 2026 • 19:56
0 Internet

YouTube déploie une fonction d’intelligence artificielle qui crée un fil vidéo personnalisé à partir d’un...

Lithium 1

Batteries : le MIT imagine une technologie d’extraction du lithium beaucoup plus propre

29 Mai. 2026 • 18:20
0 Energie

Le lithium est au cœur des batteries de voitures électriques, de smartphones et de systèmes de stockage d’énergie, mais...

House of the Dragon Saison 3 Daemon Targaryen Matt Smith

House of the Dragon saison 3 : l’ultime bande-annonce promet la guerre

29 Mai. 2026 • 18:11
0 Geekeries

HBO a dévoilé la bande-annonce finale de la saison 3 de House of the Dragon, dont les premiers épisodes seront diffusés chaque...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site