KultureGeek PC et systèmes Gemini 3 Flash introduit l’« Agentic Vision » pour améliorer l’analyse d’images par l’IA

Gemini 3 Flash introduit l’« Agentic Vision » pour améliorer l’analyse d’images par l’IA

3 min.
28 Jan. 2026 • 10:20
0

Google renforce les capacités visuelles de son modèle Gemini 3 Flash avec une nouvelle fonctionnalité baptisée Agentic Vision. Cette nouvelle fonctionnalité d’IA vise à rendre les réponses liées aux images plus fiables, en ancrant systématiquement l’analyse dans des preuves visuelles concrètes plutôt que dans de simples estimations probabilistes.

Une vision active au lieu d’une simple interprétation

Traditionnellement, les modèles d’intelligence artificielle traitent une image comme un instant figé. Lorsqu’un détail subtil échappe à leur compréhension — un numéro de série, un panneau éloigné ou une petite inscription — les modèles doivent souvent « deviner ». Avec Agentic Vision, Gemini 3 Flash adopte au contraire une démarche d’enquête visuelle active.

Agentic Vision

Le modèle fonctionne selon une boucle « Penser, Agir, Observer » : il commence par analyser la demande et l’image, élabore ensuite un plan d’action, puis exécute du code pour manipuler ou inspecter visuellement le contenu, avant d’intégrer ces nouvelles données dans son raisonnement final.

Zoom intelligent, annotations et calculs visuels

Concrètement, Gemini 3 Flash peut désormais recadrer une image, la faire pivoter, tracer des cadres ou ajouter des repères numériques pour fiabiliser ses réponses. Par exemple, pour compter les doigts d’une main, le modèle dessine automatiquement des cadres autour de chaque doigt afin d’éviter toute erreur de décompte.

Agentic Vision 1

Agentic Vision est également capable d’exploiter des tableaux complexes ou d’effectuer des calculs visuels en s’appuyant sur un environnement Python déterministe. Cette méthode réduit fortement les risques d’hallucinations dans les tâches impliquant plusieurs étapes de raisonnement.

Un gain mesurable en précision et déjà disponible

Selon Google, cette nouvelle approche apporte une amélioration de 5 à 10 % sur la majorité des benchmarks liés à la vision artificielle. La fonctionnalité est en cours de déploiement dans l’application Gemini avec le modèle Thinking, et elle est d’ores et déjà accessible aux développeurs via l’API Gemini, Google AI Studio et Vertex AI.

À terme, Agentic Vision devrait intégrer davantage d’outils, comme la recherche web ou la reconnaissance inversée d’images, afin d’ancrer encore plus solidement les réponses dans le monde réel. Une évolution qui pourrait transformer la manière dont les modèles d’IA interprètent et exploitent les contenus visuels.

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Nvidia CEO huang

IA : le CEO de Nvidia affirme que l’intelligence artificielle crée déjà une vague de nouveaux métiers

5 Mai. 2026 • 16:17
0 Business

Alors que l’intelligence artificielle nourrit les inquiétudes sur l’avenir du travail, Jensen Huang veut défendre une vision...

Forza Horizon 6 Voitures

Xbox Game Pass : les jeux ajoutés en mai 2026

5 Mai. 2026 • 15:43
0 Jeux vidéo

Microsoft lève le voile sur les jeux qui vont rejoindre le Xbox Game Pass en mai 2026. Il y a 14 titres, soit trois de moins qu’en...

Elon Musk Twitter

Rachat de Twitter : Elon Musk accepte de payer 1,5 million de dollars au régulateur américain

5 Mai. 2026 • 14:10
0 Business

Elon Musk a accepté de régler son litige avec la SEC, le gendarme boursier américain, en versant 1,5 million de dollars dans le...

Odyssée

L’Odyssée : première bande-annonce spectaculaire pour le film de Nolan

5 Mai. 2026 • 13:15
0 Geekeries

Universal a enfin publié la première bande-annonce de L’Odyssée, le prochain film de Christopher Nolan. Attendu en France le 15...

x-59-nasa

X-59 : l’avion supersonique silencieux de la NASA multiplie les manœuvres au-dessus du désert de Mojave (vidéo)

5 Mai. 2026 • 12:05
0 Science

Le X-59 de la NASA poursuit sa montée en puissance. L’avion expérimental conçu avec Lockheed Martin a réalisé une...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site