TENDANCES
Comparateur
- AUTO
OpenAI poursuit l’amélioration de son intelligence artificielle en dotant ChatGPT d’un nouveau modèle de génération et d’édition d’images. Cette mise à jour, directement intégrée à GPT-4o, marque une étape importante pour combler l’écart avec des concurrents comme Google (Imagen 3), xAI (Aurora) ou Midjourney.
Image générée par GPT-4o
Jusqu’ici, OpenAI reposait sur Dall-E 3 pour générer des images, un modèle qui peinait à rivaliser face aux solutions plus avancées de ses concurrents. Le nouvel outil, simplement appelé 4o Image Generation, n’est pas une évolution de Dall-E, mais une extension des capacités multimodales de GPT-4o. L’avantage ? Une meilleure compréhension des requêtes en langage naturel et une génération d’images plus précise.
Contrairement à Dall-E 3, qui limitait les utilisateurs à 3 ou 4 instructions simultanées, GPT-4o peut traiter entre 10 et 20 demandes en une seule requête. Cette amélioration permet des résultats plus détaillés, comme la création de bandes dessinées, de tableaux ou d’affiches sur mesure.
L’un des points faibles de Dall-E 3 était son incapacité à générer du texte lisible dans les images. OpenAI affirme avoir résolu ce problème, permettant désormais à ChatGPT de créer des logos, des panneaux ou des légendes sans erreurs.
Image générée par GPT-4o
Autre nouveauté majeure : l’édition d’images. Les utilisateurs peuvent désormais mettre en ligne une photo et demander des modifications via des instructions simples. Grâce à la mémoire de GPT-4o, l’IA peut retravailler une image en plusieurs étapes, par exemple en transformant un animal de compagnie en personnage de jeu vidéo. OpenAI précise que jusqu’à 15 images peuvent être fournies pour guider le processus.
Si OpenAI permet la création d’images réalistes, la politique concernant les personnalités publiques reste floue. L’entreprise indique que certaines restrictions s’appliqueront, contrairement à des outils comme Grok, bien plus permissifs.
Le nouveau générateur est d’ores et déjà accessible gratuitement dans ChatGPT (via GPT-4o), tandis que Dall-E 3 reste utilisable via un chatbot dédié. À terme, l’API sera ouverte aux développeurs, et Sora, le modèle d’OpenAI qui génère des vidéos, bénéficiera également de ces avancées.
Reste à voir si ces améliorations permettront à ChatGPT de concurrencer sérieusement Midjourney ou Imagen. Une chose est sûre : avec l’arrivée future de GPT-5, OpenAI compte bien consolider sa position dans le domaine de l’IA générative.
Rockstar Games vient de confirmer que le trailer 2 de Grand Theft Auto VI (GTA 6), sorti hier, comprend bel et bien du gameplay. Il ne s’agit pas...
L’Arcep, à savoir le gendarme des télécoms, a mis en demeure les quatre opérateurs français – Orange, SFR,...
Après plus de cinq ans de bataille juridique, NSO Group, le créateur du logiciel espion Pegasus, a été condamné...
Le tribunal judiciaire de Paris a pris une décision inédite en exigeant le blocage du site News.DayFr.com. Une quarantaine de journaux...
Après s’être montré en démo gratuite plus tôt dans l’année, Deck of Haunts proposait d’inverser...