KultureGeek PC et systèmes CaptionBot : Microsoft dévoile une IA capable de décrire (presque) n’importe quelle image en langage naturel

CaptionBot : Microsoft dévoile une IA capable de décrire (presque) n’importe quelle image en langage naturel

2 min.
14 Avr. 2016 • 11:43
0

Les Bots sont partout ! Microsoft a lancé la première salve d’annonces lors de sa conférence Build 2016, mais il semble que tous les géants de la high-tech américaine (Facebook, Google, Snapchat) se soient passés le mot. Le Microsoft Cognitive Services, en charge de la création d’apps intelligentes qui pourront servir de briques (APIs) au développeurs sous Windows 10, vient de dévoiler CaptionBot, un module d’IA (Intelligence Artificielle) capable d’analyser n’importe quelle image et d’en faire la description succincte mais précise en langage naturel.

CaptionBot Bill Gates

Bill Gates, ancien CEO de Microsoft, est bien reconnu par CaptionBot; ouf !

Le site qui sert de démo de ce nouveau Bot permet déjà de se rendre compte de la perspicacité du système, qui peut même analyser les photos/images que vous lui soumettrez ! Mieux encore, CaptionBot sait même utiliser quelques emoticons pour appuyer sa description, à la façon du ChatBot Tay. Le module de langage de CaptionBot serait d’ailleurs le même que celui de Tay (mais ici le logiciel ne discute pas avec l’utilisateur et se « contente » d’analyser des images. CaptionBot est aussi capable de reconnaître l’humeur des visages (joyeux, tristes, etc…).

CaptionBot Trump

CaptionBot reconnait parfaitement les hommes politiques (mais pas François Hollande…)

On remarque tout de même quelques contraintes étranges, concernant notamment les contenus NSFW (les « femmes nues » en d’autres termes); CaptionBot refuse d’analyser ce type de demandes, ou plutôt refuse de les décrire, ce qui signifie bien que ces images olé-olé sont bien analysées mais que Microsoft a cette fois pensé à placer des limites à ce qui peut-être décrit.

th_Caption Bot arme

CaptionBot sait parfaitement décrire une arme…

Il est tout de même malheureux que l’interdiction d’analyser ne vise en somme que les corps nus, alors même que la photo d’une Kalashnikov est parfaitement décrite par CaptionBot. Le logiciel pouvant aussi servir à décrire des images à un aveugle par exemple (ainsi que l’a montré Microsoft lors de sa conférence Build), on voit mal pourquoi ces derniers ne pourraient pas avoir le droit de se rincer l’oeil (si l’on peut dire…)

Mais a préfèré me mettre ce message…

th_CaptionBot message refus analyse

Lorsque je lui ai soumis cette image, pourtant très « soft » :

Femme nue

Malgré ces quelques points de détail, CaptionBot est déjà impressionnant et se trompe fort peu souvent, même si pour le moment le logiciel ne fonctionne qu’en anglais. Ce Bot devrait bientôt intégrer la boite à outil de développement (SDK) de Windows 10, y compris pour les éditeurs tiers, l’objectif du Microsoft Cognitive Services étant de fournir de nouveaux Bots-API pour accroitre la valeur ajoutée des logiciels développés pour Windows…

Signaler une erreur dans le texte

Les sujets liés à ces tags pourraient vous interesser

Désolé, les commentaires sont fermés.

Les derniers articles

Google Mode IA Moteur de Recherche

Google va bientôt lancer son Mode IA et les AI Overviews en France

30 Juin. 2026 • 10:07
0 Internet

Google déploiera cet été en France les AI Overviews (Aperçus IA) et son Mode IA, deux fonctions qui intègrent de...

Cyberpunk Edgerunners 2

Cyberpunk: Edgerunners 2 : le premier (vrai) trailer nous replonge dans la violence de Night City

30 Juin. 2026 • 9:45
0 Geekeries

Netflix et Studio Trigger dévoilent le premier trailer de Cyberpunk: Edgerunners 2. Près de quatre ans après la série...

Barrettes RAM

Les fabricants de RAM sont poursuivis en justice, accusés d’une entente sur les prix

29 Juin. 2026 • 20:12
2 Business

Une class action accuse Samsung, SK Hynix et Micron, les trois plus gros fabricants de RAM qui pèsent plus de 90 % du revenu mondial de ce...

Werwulf

Werwulf : Robert Eggers redéfinit le film de loup-garou (bande-annonce)

29 Juin. 2026 • 19:45
0 Geekeries

Robert Eggers repart dans les ténèbres. Après The Witch, The Lighthouse et le très stylisé Nosferatu, le...

Tidal Logo

TIDAL coupe la monétisation de la musique générée par IA pour protéger les artistes

29 Juin. 2026 • 19:19
0 Logiciels

TIDAL durcit sa politique face à la montée des morceaux produits intégralement par intelligence artificielle. À partir du 15...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site