OpenAI déploie aujourd’hui une évolution de son outil de générations d’images par intelligence artificielle avec GPT Image 1.5. S’appuyant sur le moteur de GPT 5.2, cette nouvelle version disponible pour tous les utilisateurs et via l’API promet de corriger les défauts de fiabilité des générations précédentes. Elle est également quatre fois plus rapide.
GPT Image 1.5 pour de meilleures images IA avec ChatGPT
La promesse centrale de GPT Image 1.5 réside dans sa capacité à effectuer des retouches. Là où les modèles concurrents comme Nano Banana de Google ou Stable Diffusion offrent parfois des résultats aléatoires lors des modifications par prompt, OpenAI assure une bien meilleure adhésion aux instructions de l’utilisateur.
Le système permet désormais d’ajouter, de supprimer, de combiner ou de transposer des éléments avec une grande fidélité. L’avancée concerne la préservation de l’intégrité visuelle : l’éclairage, la composition et l’apparence des personnages restent constants entre l’image originale et ses versions modifiées. Cette continuité stylistique répond à un besoin pour les utilisateurs qui doivent itérer sur un visuel sans en altérer l’essence.
De plus, l’interface intègre de nouveaux styles et concepts prédéfinis, permettant d’appliquer des transformations complexes sans nécessairement rédiger de requête écrite.
Rendu de texte et visages : des corrections techniques attendues
Sur le plan purement technique, le modèle franchit un cap dans deux domaines historiquement problématiques pour l’IA générative :
Le texte : le moteur est désormais capable de générer des lettres lisibles et cohérentes, même lorsque la typographie est dense ou de petite taille.
Les groupes : le rendu des visages a été optimisé pour les foules, offrant une définition plus nette des visages de petite taille qui apparaissaient souvent déformés auparavant.
Ce lancement intervient dans un contexte de concurrence importante pour séduire les utilisateurs et les entreprises. OpenAI réagit directement au succès du modèle Nano Banana Pro de Google, très apprécié par de nombreuses personnes, mais aussi aux avancées d’autres acteurs mondiaux. En août, Alibaba avait démontré avec Qwen-Image sa capacité à générer du texte en chinois et en anglais, tandis que Black Forest Labs séduisait la communauté open source avec Flux.2.
Pour les nostalgiques ou ceux dont les flux de travail dépendent des anciennes versions, OpenAI précise qu’il reste possible d’utiliser l’outil basé sur GPT-4o via un GPT personnalisé.
Logitech Signature K650, Clavier sans fil Ergonomique Entier avec Repose-Poignets, BLE Bluetooth, USB Logi Bolt, Touches Silencieuses Pavé Numérique, Compatible PC/Windows/Mac, AZERTY Français - Gris
ASUS Zenscreen OLED MQ16AH - Ecran PC Portable 15,6" FHD - Télétravail ou Gaming - Alimentation et Affichage Via USB-C/Micro HDMI - Dalle OLED - 1920x1080-1ms - Delta E< 2-1ms - pour Notebook