KultureGeek Internet Gemini 3.1 Flash-Lite : Google lance son modèle IA rapide et économique

Gemini 3.1 Flash-Lite : Google lance son modèle IA rapide et économique

4 min.
3 Mar. 2026 • 20:41
0

Google annonce Gemini 3.1 Flash-Lite, son modèle d’intelligence artificielle le plus rapide et le plus économique de la gamme Gemini 3, disponible dès aujourd’hui en accès anticipé pour les développeurs via l’API Gemini dans Google AI Studio et sur Vertex AI pour les entreprises.

Gemini 3 Logo

Le positionnement tarifaire est agressif : 0,25 $ par million de tokens en entrée et 1,50 $ par million de tokens en sortie. À titre de comparaison, GPT-5 mini facture 0,25 $ en entrée mais 2,00 $ en sortie, Claude 4.5 Haiku avec Extended Thinking atteint 1,00 $ en entrée et 5,00 $ en sortie, et Grok 4,1 Fast se positionne à 0,20 $ en entrée et 0,50 $ en sortie. Gemini 2.5 Flash-Lite, le prédécesseur direct, affichait 0,10 $ en entrée mais seulement 0,40 $ en sortie.

Gemini 3.1 Flash-Lite Prix Benchmarks

Le rapport vitesse/qualité comme principal argument

Gemini 3.1 Flash-Lite atteint 363 tokens par seconde en vitesse de sortie selon le benchmark Artificial Analysis. C’est 2,5 fois plus rapide en Time to First Answer Token et 45 % plus rapide en débit de sortie que Gemini 2.5 Flash. Cela confirme l’avantage face aux concurrents directs : GPT-5 mini plafonne à 71 tokens/s, Claude 4.5 Haiku (Extended Thinking) à 108 tokens/s, et Grok 4,1 Fast (Reasoning) à 145 tokens/s. Seul Gemini 2.5 Flash-Lite (Dynamic) fait mieux à 366 tokens/s, mais à un tarif en sortie quatre fois inférieur.

Gemini 3.1 Flash-Lite Tokens

Sur les benchmarks de qualité, Gemini 3,1 Flash-Lite s’impose dans la grande majorité des tests face à ses concurrents de même catégorie. Il décroche 86,9 % sur GPQA Diamond (connaissances scientifiques), 76,8 % sur MMMU Pro (compréhension multimodale), 84,8 % sur Video-MMMU, 88,9 % sur MMLU multilingue et 43,3 % sur SimpleQA. Sur LiveCodeBench (génération de code), GPT-5 mini prend la tête à 80,4 % contre 72,0 % pour Gemini 3.1 Flash-Lite. Sur Humanity’s Last Exam, Grok 4,1 Fast mène à 17,6 % contre 16,0 %. Le modèle affiche un score Elo de 1 432 sur le classement Arena.ai.

Des niveaux de réflexion configurables

Gemini 3,1 Flash-Lite intègre des niveaux de réflexion configurables directement dans Google AI Studio et Vertex AI, une fonctionnalité qui permet aux développeurs de doser le niveau de raisonnement selon la nature de la tâche. Pour les usages à haut volume où le coût prime (traduction, modération de contenu ou tri d’images à grande échelle), le modèle peut fonctionner en mode minimal. Pour des tâches plus complexes nécessitant un raisonnement approfondi (génération d’interfaces, création de simulations ou agents multi-étapes), le niveau de réflexion peut être augmenté.

Google indique que des développeurs en accès anticipé sur AI Studio, Vertex AI, ainsi que des entreprises comme Latitude, Cartwheel et Whering utilisent déjà le modèle en production, soulignant sa capacité à traiter des entrées complexes avec « la précision d’un modèle de niveau supérieur » tout en respectant les instructions.

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Google Messages RCS

RCS 4.0 annoncé avec les appels vidéo et la mise en forme de texte

26 Mar. 2026 • 22:48
0 Logiciels

La GSMA, l’organisation qui gère le standard RCS, vient d’annoncer l’Universal Profile 4.0, une mise à jour qui introduit...

TikTok Logo

TikTok : le ministre de l’Éducation saisit la justice pour l’algorithme

26 Mar. 2026 • 20:28
0 Internet

Édouard Geffray, le ministre de l’Éducation nationale, n’a pas seulement transmis un signalement à la justice contre...

Lunettes Ray-Ban Meta

Ray-Ban Meta : deux nouvelles lunettes connectées-IA en préparation

26 Mar. 2026 • 19:30
0 Matériel

Meta semble préparer une nouvelle offensive sur le marché des lunettes connectées. Deux modèles inédits,...

the End of Oak Street

The End of Oak Street : premier trailer pour un mystérieux film de S.F avec Ewan McGregor et Anne Hathaway

26 Mar. 2026 • 19:10
0 Geekeries

Warner Bros. lève enfin le voile sur l’un de ses projets les plus intrigants de l’année : The End of Oak Street. Longtemps...

CapCut

ByteDance déploie Dreamina Seedance 2.0 dans CapCut, avec des garde-fous renforcés

26 Mar. 2026 • 18:33
0 Logiciels

ByteDance accélère sur la création vidéo assistée par IA. Le groupe confirme l’intégration de son nouveau...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site