KultureGeek Internet Gemini 3.1 Flash-Lite : Google lance son modèle IA rapide et économique

Gemini 3.1 Flash-Lite : Google lance son modèle IA rapide et économique

4 min.
3 Mar. 2026 • 20:41
0

Google annonce Gemini 3.1 Flash-Lite, son modèle d’intelligence artificielle le plus rapide et le plus économique de la gamme Gemini 3, disponible dès aujourd’hui en accès anticipé pour les développeurs via l’API Gemini dans Google AI Studio et sur Vertex AI pour les entreprises.

Gemini 3 Logo

Le positionnement tarifaire est agressif : 0,25 $ par million de tokens en entrée et 1,50 $ par million de tokens en sortie. À titre de comparaison, GPT-5 mini facture 0,25 $ en entrée mais 2,00 $ en sortie, Claude 4.5 Haiku avec Extended Thinking atteint 1,00 $ en entrée et 5,00 $ en sortie, et Grok 4,1 Fast se positionne à 0,20 $ en entrée et 0,50 $ en sortie. Gemini 2.5 Flash-Lite, le prédécesseur direct, affichait 0,10 $ en entrée mais seulement 0,40 $ en sortie.

Gemini 3.1 Flash-Lite Prix Benchmarks

Le rapport vitesse/qualité comme principal argument

Gemini 3.1 Flash-Lite atteint 363 tokens par seconde en vitesse de sortie selon le benchmark Artificial Analysis. C’est 2,5 fois plus rapide en Time to First Answer Token et 45 % plus rapide en débit de sortie que Gemini 2.5 Flash. Cela confirme l’avantage face aux concurrents directs : GPT-5 mini plafonne à 71 tokens/s, Claude 4.5 Haiku (Extended Thinking) à 108 tokens/s, et Grok 4,1 Fast (Reasoning) à 145 tokens/s. Seul Gemini 2.5 Flash-Lite (Dynamic) fait mieux à 366 tokens/s, mais à un tarif en sortie quatre fois inférieur.

Gemini 3.1 Flash-Lite Tokens

Sur les benchmarks de qualité, Gemini 3,1 Flash-Lite s’impose dans la grande majorité des tests face à ses concurrents de même catégorie. Il décroche 86,9 % sur GPQA Diamond (connaissances scientifiques), 76,8 % sur MMMU Pro (compréhension multimodale), 84,8 % sur Video-MMMU, 88,9 % sur MMLU multilingue et 43,3 % sur SimpleQA. Sur LiveCodeBench (génération de code), GPT-5 mini prend la tête à 80,4 % contre 72,0 % pour Gemini 3.1 Flash-Lite. Sur Humanity’s Last Exam, Grok 4,1 Fast mène à 17,6 % contre 16,0 %. Le modèle affiche un score Elo de 1 432 sur le classement Arena.ai.

Des niveaux de réflexion configurables

Gemini 3,1 Flash-Lite intègre des niveaux de réflexion configurables directement dans Google AI Studio et Vertex AI, une fonctionnalité qui permet aux développeurs de doser le niveau de raisonnement selon la nature de la tâche. Pour les usages à haut volume où le coût prime (traduction, modération de contenu ou tri d’images à grande échelle), le modèle peut fonctionner en mode minimal. Pour des tâches plus complexes nécessitant un raisonnement approfondi (génération d’interfaces, création de simulations ou agents multi-étapes), le niveau de réflexion peut être augmenté.

Google indique que des développeurs en accès anticipé sur AI Studio, Vertex AI, ainsi que des entreprises comme Latitude, Cartwheel et Whering utilisent déjà le modèle en production, soulignant sa capacité à traiter des entrées complexes avec « la précision d’un modèle de niveau supérieur » tout en respectant les instructions.

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Chrome Skills

Google Chrome ajoute les Skills pour faciliter les prompts IA

15 Avr. 2026 • 22:35
0 Logiciels

Google met à jour Chrome avec une fonctionnalité baptisée Skills qui permet de sauvegarder des prompts de Gemini et de les relancer...

Google Application Windows

Google propose son app Windows similaire à Spotlight sur Mac

15 Avr. 2026 • 21:59
0 Logiciels

Après une phase de test depuis septembre, Google rend aujourd’hui disponible son application sur les PC Windows. Elle propose...

Loki série Marvel

Disney licencie massivement et démantèle l’équipe de développement visuel de Marvel Studios

15 Avr. 2026 • 20:14
1 Business

La nouvelle vague de suppressions de postes engagée par Disney ne fait pas de quartiers, et Marvel figure visiblement parmi les entités les...

Amazon Fire TV Stick HD 2026

Amazon dévoile son nouveau Fire TV Stick HD plus fin

15 Avr. 2026 • 20:00
0 Matériel

Amazon lance son Fire TV Stick HD (2026) le plus fin à ce jour, conçu pour s’alimenter directement via le port USB du...

Le Seigneur des Anneaux Frodon

The Hunt for Gollum : le casting dévoilé pour le nouveau film Le Seigneur des Anneaux

15 Avr. 2026 • 19:05
1 Geekeries

Le film Le Seigneur des Anneaux : The Hunt for Gollum a maintenant le droit à son casting officiel, dont le nouvel acteur qui incarnera...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site