KultureGeek PC et systèmes CaptionBot : Microsoft dévoile une IA capable de décrire (presque) n’importe quelle image en langage naturel

CaptionBot : Microsoft dévoile une IA capable de décrire (presque) n’importe quelle image en langage naturel

2 min.
14 Avr. 2016 • 11:43
0

Les Bots sont partout ! Microsoft a lancé la première salve d’annonces lors de sa conférence Build 2016, mais il semble que tous les géants de la high-tech américaine (Facebook, Google, Snapchat) se soient passés le mot. Le Microsoft Cognitive Services, en charge de la création d’apps intelligentes qui pourront servir de briques (APIs) au développeurs sous Windows 10, vient de dévoiler CaptionBot, un module d’IA (Intelligence Artificielle) capable d’analyser n’importe quelle image et d’en faire la description succincte mais précise en langage naturel.

CaptionBot Bill Gates

Bill Gates, ancien CEO de Microsoft, est bien reconnu par CaptionBot; ouf !

Le site qui sert de démo de ce nouveau Bot permet déjà de se rendre compte de la perspicacité du système, qui peut même analyser les photos/images que vous lui soumettrez ! Mieux encore, CaptionBot sait même utiliser quelques emoticons pour appuyer sa description, à la façon du ChatBot Tay. Le module de langage de CaptionBot serait d’ailleurs le même que celui de Tay (mais ici le logiciel ne discute pas avec l’utilisateur et se « contente » d’analyser des images. CaptionBot est aussi capable de reconnaître l’humeur des visages (joyeux, tristes, etc…).

CaptionBot Trump

CaptionBot reconnait parfaitement les hommes politiques (mais pas François Hollande…)

On remarque tout de même quelques contraintes étranges, concernant notamment les contenus NSFW (les « femmes nues » en d’autres termes); CaptionBot refuse d’analyser ce type de demandes, ou plutôt refuse de les décrire, ce qui signifie bien que ces images olé-olé sont bien analysées mais que Microsoft a cette fois pensé à placer des limites à ce qui peut-être décrit.

th_Caption Bot arme

CaptionBot sait parfaitement décrire une arme…

Il est tout de même malheureux que l’interdiction d’analyser ne vise en somme que les corps nus, alors même que la photo d’une Kalashnikov est parfaitement décrite par CaptionBot. Le logiciel pouvant aussi servir à décrire des images à un aveugle par exemple (ainsi que l’a montré Microsoft lors de sa conférence Build), on voit mal pourquoi ces derniers ne pourraient pas avoir le droit de se rincer l’oeil (si l’on peut dire…)

Mais a préfèré me mettre ce message…

th_CaptionBot message refus analyse

Lorsque je lui ai soumis cette image, pourtant très « soft » :

Femme nue

Malgré ces quelques points de détail, CaptionBot est déjà impressionnant et se trompe fort peu souvent, même si pour le moment le logiciel ne fonctionne qu’en anglais. Ce Bot devrait bientôt intégrer la boite à outil de développement (SDK) de Windows 10, y compris pour les éditeurs tiers, l’objectif du Microsoft Cognitive Services étant de fournir de nouveaux Bots-API pour accroitre la valeur ajoutée des logiciels développés pour Windows…

Les sujets liés à ces tags pourraient vous interesser

Désolé, les commentaires sont fermés.

Les derniers articles

iOS 27 officialisé : Apple accélère sur Siri AI, Liquid Glass et les performances de l’iPhone

8 Juin. 2026 • 23:19
iPhoneAddict.fr

Apple a profité de sa WWDC 2026 pour lever le voile sur iOS 27, la prochaine grande mise à jour de l’iPhone. Cette version ne se...

iOS 27 Logo Officiel

macOS Golden Gate 27 : Apple mise sur les performances, Apple Intelligence et la fin des Mac Intel

8 Juin. 2026 • 23:13
iPhoneAddict.fr

Apple a profité de la WWDC 2026 pour lever le voile sur macOS Golden Gate 27, la prochaine grande version de son système...

macOS Golden State Chercher ou Demander
007 First Light James Bond

007 First Light : déjà 3 millions de ventes pour le jeu James Bond

8 Juin. 2026 • 19:11
0 Jeux vidéo

IO Interactive ne commente plus seulement un bon lancement pour 007 First Light. Le studio danois parle déjà d’un jeu rentable,...

WWDC-2026-Invitation-Keynote-8-Juin-2026

[WWDC 2026] Keynote Apple en live dès 18h45 sur KultureGeek

8 Juin. 2026 • 18:20
0 Infos KultureGeek

Venez suivre avec nous la Keynote de ce 8 juin qui aura lieu sur le campus d’Apple , dès 18h30 (heure Française) sur notre page...

Nvidia Logo

Nvidia annonce un data center IA et des accords en Corée du Sud

8 Juin. 2026 • 18:06
0 Internet

Nvidia a profité de la visite à Séoul de son directeur général, Jensen Huang, pour poser les bases d’un chantier...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site