OpenAI lance ChatGPT Images 2.0 avec une promesse très ciblée : mieux générer les images IA qui contiennent du texte, des interfaces et beaucoup de détails. Cette nouvelle version s’inscrit aussi dans une riposte plus directe à Google et à son modèle Gemini Nano Banana 2.
Le vrai progrès concerne les images complexes
OpenAI met d’abord en avant un bond sur la fidélité visuelle dans les cas les plus difficiles. ChatGPT Images 2.0 est présenté comme nettement meilleur pour rendre du texte dans une image, mais aussi pour respecter les consignes, préserver les détails demandés et reproduire des éléments fins comme les icônes, les composants d’interface, les compositions denses ou des contraintes stylistiques subtiles.
L’exemple donné illustre bien le terrain visé. Le modèle doit désormais mieux produire des scènes comme une fenêtre de bureau macOS ou une interface de messagerie avec du texte plus juste à travers toute l’image.
OpenAI ajoute aussi des améliorations techniques plus larges. Le modèle peut générer des images en 2K avec des formats allant de 3:1 à 1:3 et il progresse sur le rendu des écritures non latines comme le japonais, le coréen, le chinois, l’hindi et le bengali.
Une offre divisée entre vitesse et raisonnement
OpenAI décline désormais son modèle en deux versions : ChatGPT Images 2.0 Instant et ChatGPT Images 2.0 Thinking (réflexion). Cette séparation montre que l’entreprise d’intelligence artificielle ne vend plus seulement une qualité d’image, mais aussi un niveau de traitement différent selon le type d’usage.
Le mode Thinking (réflexion) concentre les fonctions les plus avancées. Lorsqu’un modèle Thinking ou Pro est sélectionné dans ChatGPT, Images 2.0 peut s’appuyer sur le Web pour récupérer des informations en temps réel, produire plusieurs images distinctes à partir d’un même prompt et vérifier ses propres sorties.
ChatGPT Images 2.0 Instant est disponible pour tous les utilisateurs de ChatGPT et Codex, tandis que le mode Thinking est réservé aux offres ChatGPT Plus, Pro et Business.
Le lancement s’inscrit dans une continuité produit amorcée en 2025. Après le grand virage de l’image dans ChatGPT au début de l’année, OpenAI avait ouvert la technologie aux développeurs avec gpt-image-1 en avril 2025, puis avec gpt-image-1.5 en décembre 2025.
Avec ChatGPT Images 2.0, l’équivalent au niveau de l’API prend le nom de gpt-image-2. Son prix est fixé à 8 dollars pour l’entrée, 2 dollars pour l’entrée mise en cache et 30 dollars pour la sortie, tandis que l’ensemble du lancement se veut d’une certaine façon comme une réponse à la concurrence de Google sur la génération d’images IA.
Philips 43PUS7800 4K QLED Smart TV - Écran 43 Pouces avec Plateforme Pixel Precise Ultra HD, Titan OS et Son Dolby Atmos - Compatible Alexa et Assistant Vocal Google
Russell Hobbs Set Moulins à Sel et Poivre électrique [2 Moulins automatiques] Noir Acier Inox (Finesse de broyage réglable, Meules en Céramique, pour épices séchées, Eclairage LED) 28010-56
GIGABYTE Carte mère Z890 Aero G - Prend en Charge Les processeurs Intel Core Ultra (série 2), 16+1+2 Phases VRM, jusqu'à 8800MHz DDR5 (OC), 1xPCIe 5.0 + 4xPCIe 4.0, Wi-FI 7, LAN 2.5GbE