KultureGeek Actualité Windows, macOS et Linux CaptionBot : Microsoft dévoile une IA capable de décrire (presque) n’importe quelle image en langage naturel

CaptionBot : Microsoft dévoile une IA capable de décrire (presque) n’importe quelle image en langage naturel

14 Avr. 2016 • 11:43
0

Les Bots sont partout ! Microsoft a lancé la première salve d’annonces lors de sa conférence Build 2016, mais il semble que tous les géants de la high-tech américaine (Facebook, Google, Snapchat) se soient passés le mot. Le Microsoft Cognitive Services, en charge de la création d’apps intelligentes qui pourront servir de briques (APIs) au développeurs sous Windows 10, vient de dévoiler CaptionBot, un module d’IA (Intelligence Artificielle) capable d’analyser n’importe quelle image et d’en faire la description succincte mais précise en langage naturel.

CaptionBot Bill Gates

Bill Gates, ancien CEO de Microsoft, est bien reconnu par CaptionBot; ouf !

Le site qui sert de démo de ce nouveau Bot permet déjà de se rendre compte de la perspicacité du système, qui peut même analyser les photos/images que vous lui soumettrez ! Mieux encore, CaptionBot sait même utiliser quelques emoticons pour appuyer sa description, à la façon du ChatBot Tay. Le module de langage de CaptionBot serait d’ailleurs le même que celui de Tay (mais ici le logiciel ne discute pas avec l’utilisateur et se « contente » d’analyser des images. CaptionBot est aussi capable de reconnaître l’humeur des visages (joyeux, tristes, etc…).

CaptionBot Trump

CaptionBot reconnait parfaitement les hommes politiques (mais pas François Hollande…)

On remarque tout de même quelques contraintes étranges, concernant notamment les contenus NSFW (les « femmes nues » en d’autres termes); CaptionBot refuse d’analyser ce type de demandes, ou plutôt refuse de les décrire, ce qui signifie bien que ces images olé-olé sont bien analysées mais que Microsoft a cette fois pensé à placer des limites à ce qui peut-être décrit.

th_Caption Bot arme

CaptionBot sait parfaitement décrire une arme…

Il est tout de même malheureux que l’interdiction d’analyser ne vise en somme que les corps nus, alors même que la photo d’une Kalashnikov est parfaitement décrite par CaptionBot. Le logiciel pouvant aussi servir à décrire des images à un aveugle par exemple (ainsi que l’a montré Microsoft lors de sa conférence Build), on voit mal pourquoi ces derniers ne pourraient pas avoir le droit de se rincer l’oeil (si l’on peut dire…)

Mais a préfèré me mettre ce message…

th_CaptionBot message refus analyse

Lorsque je lui ai soumis cette image, pourtant très « soft » :

Femme nue

Malgré ces quelques points de détail, CaptionBot est déjà impressionnant et se trompe fort peu souvent, même si pour le moment le logiciel ne fonctionne qu’en anglais. Ce Bot devrait bientôt intégrer la boite à outil de développement (SDK) de Windows 10, y compris pour les éditeurs tiers, l’objectif du Microsoft Cognitive Services étant de fournir de nouveaux Bots-API pour accroitre la valeur ajoutée des logiciels développés pour Windows…

Les sujets liés à ces tags pourraient vous interesser

Désolé, les commentaires sont fermés.

Les derniers articles

Nintendo Switch 2 Joy-Con Officiel

Nintendo Switch 2 : la date de précommande dévoilée en avance par un revendeur

27 Mar. 2025 • 22:40
1 Jeux vidéo

Nintendo a officialisé un Nintendo Direct prévu le 2 avril à 15 heures (heure française), durant lequel la firme japonaise va...

Tencent Ubisoft

Ubisoft crée une filiale avec Tencent pour Assassin’s Creed et d’autres franchises

27 Mar. 2025 • 22:31
0 Jeux vidéo

Ubisoft vient d’annoncer une restructuration majeure de son modèle opérationnel avec la création d’une nouvelle filiale...

Android Nouveau Logo 2019

Google décide de passer le développement d’Android en privé

27 Mar. 2025 • 22:22
1 Mobiles / Tablettes

Google annonce une évolution majeure dans la manière dont Android est développé. Dès la semaine prochaine, la...

Hogwarts Legacy

Hogwarts Legacy : le DLC pour le jeu Harry Potter est annulé

27 Mar. 2025 • 20:51
0 Jeux vidéo

Warner Bros a discrètement abandonné le développement d’une extension (DLC) pour Hogwarts Legacy, son jeu à...

Image Generee ChatGPT GPT-4o Oppenheimer Studio Ghibli

ChatGPT limite la génération d’images qui a tant de succès : « nos GPU fondent »

27 Mar. 2025 • 19:53
1 Internet

Le nouveau générateur d’images disponible sur ChatGPT avec GPT-4o connaît un important succès, à tel point...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site