KultureGeek Actualité Windows, macOS et Linux CaptionBot : Microsoft dévoile une IA capable de décrire (presque) n’importe quelle image en langage naturel

CaptionBot : Microsoft dévoile une IA capable de décrire (presque) n’importe quelle image en langage naturel

14 Avr. 2016 • 11:43
0

Les Bots sont partout ! Microsoft a lancé la première salve d’annonces lors de sa conférence Build 2016, mais il semble que tous les géants de la high-tech américaine (Facebook, Google, Snapchat) se soient passés le mot. Le Microsoft Cognitive Services, en charge de la création d’apps intelligentes qui pourront servir de briques (APIs) au développeurs sous Windows 10, vient de dévoiler CaptionBot, un module d’IA (Intelligence Artificielle) capable d’analyser n’importe quelle image et d’en faire la description succincte mais précise en langage naturel.

CaptionBot Bill Gates

Bill Gates, ancien CEO de Microsoft, est bien reconnu par CaptionBot; ouf !

Le site qui sert de démo de ce nouveau Bot permet déjà de se rendre compte de la perspicacité du système, qui peut même analyser les photos/images que vous lui soumettrez ! Mieux encore, CaptionBot sait même utiliser quelques emoticons pour appuyer sa description, à la façon du ChatBot Tay. Le module de langage de CaptionBot serait d’ailleurs le même que celui de Tay (mais ici le logiciel ne discute pas avec l’utilisateur et se « contente » d’analyser des images. CaptionBot est aussi capable de reconnaître l’humeur des visages (joyeux, tristes, etc…).

CaptionBot Trump

CaptionBot reconnait parfaitement les hommes politiques (mais pas François Hollande…)

On remarque tout de même quelques contraintes étranges, concernant notamment les contenus NSFW (les « femmes nues » en d’autres termes); CaptionBot refuse d’analyser ce type de demandes, ou plutôt refuse de les décrire, ce qui signifie bien que ces images olé-olé sont bien analysées mais que Microsoft a cette fois pensé à placer des limites à ce qui peut-être décrit.

th_Caption Bot arme

CaptionBot sait parfaitement décrire une arme…

Il est tout de même malheureux que l’interdiction d’analyser ne vise en somme que les corps nus, alors même que la photo d’une Kalashnikov est parfaitement décrite par CaptionBot. Le logiciel pouvant aussi servir à décrire des images à un aveugle par exemple (ainsi que l’a montré Microsoft lors de sa conférence Build), on voit mal pourquoi ces derniers ne pourraient pas avoir le droit de se rincer l’oeil (si l’on peut dire…)

Mais a préfèré me mettre ce message…

th_CaptionBot message refus analyse

Lorsque je lui ai soumis cette image, pourtant très « soft » :

Femme nue

Malgré ces quelques points de détail, CaptionBot est déjà impressionnant et se trompe fort peu souvent, même si pour le moment le logiciel ne fonctionne qu’en anglais. Ce Bot devrait bientôt intégrer la boite à outil de développement (SDK) de Windows 10, y compris pour les éditeurs tiers, l’objectif du Microsoft Cognitive Services étant de fournir de nouveaux Bots-API pour accroitre la valeur ajoutée des logiciels développés pour Windows…

Les sujets liés à ces tags pourraient vous interesser

Désolé, les commentaires sont fermés.

Les derniers articles

Docteurs Sante

Données personnelles : un éditeur de logiciels médicaux est condamné à une amende de 800 000€ en France

13 Sep. 2024 • 20:40
2 Internet

Cegedim, éditeur de logiciels de santé, a été condamné au versement d’une amende de 800 000 euros par la CNIL...

Tales of the Shire

Tales of the Shire, le sim-life « cosy » au pays des Hobbits, vient d’être reporté à 2025

13 Sep. 2024 • 20:04
0 Jeux vidéo

C’est peu dire que dans cette ambiance perpétuelle de « dramas » inutiles et de polarisation des débats, on...

samsung-logo-batiment

Samsung : les rendements seraient trop faibles pour la production de puces en 2 nm

13 Sep. 2024 • 19:19
0 Matériel

La position de leader de TSMC aurait tendance à le faire oublier : Samsung a été le premier fondeur à débuter la...

3G 4G 5G Logo

Opérateurs : le Royaume-Uni craint une hausse des prix avec la fusion de Vodafone et Three

13 Sep. 2024 • 18:36
0 Mobiles / Tablettes

Une fusion au Royaume-Uni entre les opérateurs Vodafone et Three pourrait renchérir le prix des forfaits pour de nombreux clients,...

Temu

Après l’Europe, Shein et Temu dans le viseur des Etats-Unis

13 Sep. 2024 • 17:28
0 Internet

L’administration Biden vient d’intensifier d’un cran la guerre commerciale entre les Etats-Unis et la Chine en proposant de nouvelles...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site