OpenAI déploie aujourd’hui une évolution de son outil de générations d’images par intelligence artificielle avec GPT Image 1.5. S’appuyant sur le moteur de GPT 5.2, cette nouvelle version disponible pour tous les utilisateurs et via l’API promet de corriger les défauts de fiabilité des générations précédentes. Elle est également quatre fois plus rapide.
GPT Image 1.5 pour de meilleures images IA avec ChatGPT
La promesse centrale de GPT Image 1.5 réside dans sa capacité à effectuer des retouches. Là où les modèles concurrents comme Nano Banana de Google ou Stable Diffusion offrent parfois des résultats aléatoires lors des modifications par prompt, OpenAI assure une bien meilleure adhésion aux instructions de l’utilisateur.
Le système permet désormais d’ajouter, de supprimer, de combiner ou de transposer des éléments avec une grande fidélité. L’avancée concerne la préservation de l’intégrité visuelle : l’éclairage, la composition et l’apparence des personnages restent constants entre l’image originale et ses versions modifiées. Cette continuité stylistique répond à un besoin pour les utilisateurs qui doivent itérer sur un visuel sans en altérer l’essence.
De plus, l’interface intègre de nouveaux styles et concepts prédéfinis, permettant d’appliquer des transformations complexes sans nécessairement rédiger de requête écrite.
Rendu de texte et visages : des corrections techniques attendues
Sur le plan purement technique, le modèle franchit un cap dans deux domaines historiquement problématiques pour l’IA générative :
Le texte : le moteur est désormais capable de générer des lettres lisibles et cohérentes, même lorsque la typographie est dense ou de petite taille.
Les groupes : le rendu des visages a été optimisé pour les foules, offrant une définition plus nette des visages de petite taille qui apparaissaient souvent déformés auparavant.
Ce lancement intervient dans un contexte de concurrence importante pour séduire les utilisateurs et les entreprises. OpenAI réagit directement au succès du modèle Nano Banana Pro de Google, très apprécié par de nombreuses personnes, mais aussi aux avancées d’autres acteurs mondiaux. En août, Alibaba avait démontré avec Qwen-Image sa capacité à générer du texte en chinois et en anglais, tandis que Black Forest Labs séduisait la communauté open source avec Flux.2.
Pour les nostalgiques ou ceux dont les flux de travail dépendent des anciennes versions, OpenAI précise qu’il reste possible d’utiliser l’outil basé sur GPT-4o via un GPT personnalisé.
Apple Watch Series 10 (42 mm GPS) Montre connectée avec Boîtier en Aluminium Argent et Bracelet Sport Denim (S/M). Suivi de l’activité Physique, app ECG, écran Retina Toujours activé
Apple Watch SE (2ᵉ génération) 40 mm GPS Montre connectée avec Boîtier en Aluminium Argent et Boucle Sport nuée Bleue. Suivi activité et Sommeil, détection Accidents, Neutre en Carbone
Apple Watch Series 10 (46 mm GPS + Cellular) Montre connectée avec Boîtier en Titane Ardoise et Bracelet Sport Noir (S/M). Suivi de l’activité Physique, app ECG, écran Retina Toujours activé
Apple Watch Ultra 2 (49 mm GPS + Cellular) Montre de Sport connectée avec Boîtier en Titane Naturel et Boucle Alpine Sahara (Large). Suivi de l’activité, GPS Haute précision, Neutre en Carbone
Apple Watch Series 10 (46 mm GPS) Montre connectée avec Boîtier en Aluminium Argent et Bracelet Sport Denim (S/M). Suivi de l’activité Physique, app ECG, écran Retina Toujours activé
Apple Watch Series 10 (46 mm GPS + Cellular) Montre connectée avec Boîtier en Titane Ardoise et Bracelet Milanais Ardoise (S/M). Suivi de l’activité Physique, app ECG, écran Retina Toujours activé
ASUS ROG Delta II - Casque Gaming sans Fil (Équipement Officiel de Team Vitality, connectivité tri-Mode, ROG Speednova, membranes de 50mm, jusqu'à 110 Heures d'autonomie de Batterie, légère de 315g)
De'Longhi La Specialista Touch EC9455.M Machine à expresso avec moulin à café, fonction Cold Brew, mousseur à lait automatique ou manuel, contrôle tactile intuitif, set de bienvenue, métal