KultureGeek PC et systèmes CaptionBot : Microsoft dévoile une IA capable de décrire (presque) n’importe quelle image en langage naturel

CaptionBot : Microsoft dévoile une IA capable de décrire (presque) n’importe quelle image en langage naturel

2 min.
14 Avr. 2016 • 11:43
0

Les Bots sont partout ! Microsoft a lancé la première salve d’annonces lors de sa conférence Build 2016, mais il semble que tous les géants de la high-tech américaine (Facebook, Google, Snapchat) se soient passés le mot. Le Microsoft Cognitive Services, en charge de la création d’apps intelligentes qui pourront servir de briques (APIs) au développeurs sous Windows 10, vient de dévoiler CaptionBot, un module d’IA (Intelligence Artificielle) capable d’analyser n’importe quelle image et d’en faire la description succincte mais précise en langage naturel.

CaptionBot Bill Gates

Bill Gates, ancien CEO de Microsoft, est bien reconnu par CaptionBot; ouf !

Le site qui sert de démo de ce nouveau Bot permet déjà de se rendre compte de la perspicacité du système, qui peut même analyser les photos/images que vous lui soumettrez ! Mieux encore, CaptionBot sait même utiliser quelques emoticons pour appuyer sa description, à la façon du ChatBot Tay. Le module de langage de CaptionBot serait d’ailleurs le même que celui de Tay (mais ici le logiciel ne discute pas avec l’utilisateur et se « contente » d’analyser des images. CaptionBot est aussi capable de reconnaître l’humeur des visages (joyeux, tristes, etc…).

CaptionBot Trump

CaptionBot reconnait parfaitement les hommes politiques (mais pas François Hollande…)

On remarque tout de même quelques contraintes étranges, concernant notamment les contenus NSFW (les « femmes nues » en d’autres termes); CaptionBot refuse d’analyser ce type de demandes, ou plutôt refuse de les décrire, ce qui signifie bien que ces images olé-olé sont bien analysées mais que Microsoft a cette fois pensé à placer des limites à ce qui peut-être décrit.

th_Caption Bot arme

CaptionBot sait parfaitement décrire une arme…

Il est tout de même malheureux que l’interdiction d’analyser ne vise en somme que les corps nus, alors même que la photo d’une Kalashnikov est parfaitement décrite par CaptionBot. Le logiciel pouvant aussi servir à décrire des images à un aveugle par exemple (ainsi que l’a montré Microsoft lors de sa conférence Build), on voit mal pourquoi ces derniers ne pourraient pas avoir le droit de se rincer l’oeil (si l’on peut dire…)

Mais a préfèré me mettre ce message…

th_CaptionBot message refus analyse

Lorsque je lui ai soumis cette image, pourtant très « soft » :

Femme nue

Malgré ces quelques points de détail, CaptionBot est déjà impressionnant et se trompe fort peu souvent, même si pour le moment le logiciel ne fonctionne qu’en anglais. Ce Bot devrait bientôt intégrer la boite à outil de développement (SDK) de Windows 10, y compris pour les éditeurs tiers, l’objectif du Microsoft Cognitive Services étant de fournir de nouveaux Bots-API pour accroitre la valeur ajoutée des logiciels développés pour Windows…

Les sujets liés à ces tags pourraient vous interesser

Désolé, les commentaires sont fermés.

Les derniers articles

Serveurs Data Center

Scaleway (Iliad) remplace Microsoft pour l’hébergement des données de santé des Français

23 Avr. 2026 • 14:10
0 Internet

Le Health Data Hub (Plateforme de données de santé) sera hébergé par Scaleway à la place de Microsoft, un basculement...

Roman télescope spatial

Roman : la NASA prévoit de lancer dès septembre son télescope spatial cartographe d’univers

23 Avr. 2026 • 13:20
0 Science

La NASA prépare l’entrée en scène de son prochain grand observatoire spatial. Le Nancy Grace Roman Space Telescope, dont le...

tesla model 3 standard

Tesla dépasse les attentes au premier trimestre et accélère sur le Cybercab, le Semi et le robot Optimus

23 Avr. 2026 • 12:05
0 Business

Tesla a livré des résultats trimestriels légèrement supérieurs aux attentes pour le T1 2026, tout en confirmant de...

Google-TPU8

Google Cloud dégaine deux nouvelles puces IA pour défier Nvidia

23 Avr. 2026 • 10:40
0 Matériel

Google Cloud muscle son arsenal dans la bataille de l’intelligence artificielle avec le lancement de deux nouvelles puces maison, conçues...

Seedance 2.0 Bratt Pitt Tom Cruise Generateur Video IA

YouTube étend son outil de détection de deepfakes IA aux célébrités

23 Avr. 2026 • 9:24
0 Internet

YouTube élargit à Hollywood sa fonction de détection des deepfakes générés par intelligence artificielle, ce qui...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site