KultureGeek Internet Imagen : l’IA qui produit des photos de n’importe quoi… à partir d’une description textuelle

Imagen : l’IA qui produit des photos de n’importe quoi… à partir d’une description textuelle

2 min.
24 Mai. 2022 • 10:50
1

Les chercheurs de Google Research restent à la pointe des technologies d’intelligence artificielle. Leur dernière création, Imagen, est capable de produire n’importe quelle photo à partir d’un simple texte écrit. Il suffit donc de renseigner la zone d’entrée avec « la photo d’un chien Corgi pilotant une moto » pour qu’Imagen produise en quelques secondes la photo correspondante à cette description (photo bien sûr créée de toute pièce).

Imagen

Quelques fausses photos produites par Imagen, avec sous chacune d’entre elles, le texte descriptif sur lequel l’IA s’est appuyée pour produire l’image finale

Les résultats sont souvent stupéfiants – l’IA peut vraiment produire n’importe quel type d’image – mais les ingénieurs de Google précisent que le logiciel connait encore de sévères limitations. Ainsi, l’IA peine à créer de fausses photos dont le contenu s’éloigne trop de l’immense banque d’images dont elle dispose (et à partir de laquelle elle compose ses propres images). Un chien pilotant une moto, ok, mais un cheval chevauchant un homme, ça ne fonctionne pas.

Imagen 2

A gauche, les images produites par Imagen, à droite les images produites par DALL-E2, la précédente génération d’IA générative 

Parfois, ce sont les « associations » qui ne correspondent pas aux résultats attendus. Ceci étant, Imagen fait souvent mieux que DALL-E2, la précédente génération d’IA générative de Google. Si l’on demande à Imagen de produire l’image d’un panda réalisant de l’art dans la crème de café, l’IA produit généralement la « photo » d’un panda préparant un capuccino tandis que DALL-E2 se plante dans les grandes largeurs. Enfin, les chercheurs de Google craignent encore et toujours la mauvaise exploitation qui pourrait être faite de ces technologies (contenus racistes, pornographiques, etc.), si bien qu’Imagen n’est pas prêt d’être disponible pour le grand public.  Ces considérations sont certes louable, mais à force de prudence, on ne risque pas d’assister un jour à la la révolution attendue de l’automatisation et de la prise en charge par l’IA des tâches les plus répétitives, avec le risque que seuls les grands groupes en profitent…

Les sujets liés à ces tags pourraient vous interesser

Un commentaire pour cet article :

  • M.D
    Erreur dans la fin de l’article, on demande bien « un panda réalisant des latte art » et non pas l’inverse.

Les derniers articles

TerraMaster D1 SSD Pro

Test TerraMaster D1 SSD Pro : notre avis sur ce boîtier SSD NVMe Thunderbolt 5/USB4 80 Gbit/s

7 Fév. 2026 • 22:38
0 Tests

Le stockage externe est entré dans une nouvelle phase : celle où la connectique n’est plus seulement un plus, mais un goulot...

Microsoft Logo

Données de santé : la France abandonne Microsoft, préférant un cloud souverain

7 Fév. 2026 • 8:00
2 Internet

Le Health Data Hub, à savoir le grand entrepôt français de données de santé pour la recherche, va quitter les data...

Femme Passant Un Appel Avec Un Téléphone Portable

Les Français changent moins d’opérateur, malgré les forfaits sans engagement

6 Fév. 2026 • 19:50
5 Mobiles / Tablettes

La mobilité des abonnés mobiles français marque le pas malgré les forfaits sans engagement. Selon le dernier observatoire de...

Bitcoin Pieces

Le Bitcoin s’effondre et perd 50% de sa valeur d’il y a quelques mois à peine

6 Fév. 2026 • 19:30
0 Business

Le marché des cryptomonnaies traverse une zone de (très) fortes turbulences. Le bitcoin est ainsi brièvement passé sous les 63...

Flickr Logo

Flickr confirme un piratage avec le vol de données d’utilisateurs

6 Fév. 2026 • 18:47
0 Internet

Flickr a notifié ses utilisateurs d’une brèche de sécurité ayant exposé leurs noms réels, adresses e-mail...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site