TENDANCES
Comparateur
- AUTO
OpenAI poursuit l’amélioration de son intelligence artificielle en dotant ChatGPT d’un nouveau modèle de génération et d’édition d’images. Cette mise à jour, directement intégrée à GPT-4o, marque une étape importante pour combler l’écart avec des concurrents comme Google (Imagen 3), xAI (Aurora) ou Midjourney.
Image générée par GPT-4o
Jusqu’ici, OpenAI reposait sur Dall-E 3 pour générer des images, un modèle qui peinait à rivaliser face aux solutions plus avancées de ses concurrents. Le nouvel outil, simplement appelé 4o Image Generation, n’est pas une évolution de Dall-E, mais une extension des capacités multimodales de GPT-4o. L’avantage ? Une meilleure compréhension des requêtes en langage naturel et une génération d’images plus précise.
Contrairement à Dall-E 3, qui limitait les utilisateurs à 3 ou 4 instructions simultanées, GPT-4o peut traiter entre 10 et 20 demandes en une seule requête. Cette amélioration permet des résultats plus détaillés, comme la création de bandes dessinées, de tableaux ou d’affiches sur mesure.
L’un des points faibles de Dall-E 3 était son incapacité à générer du texte lisible dans les images. OpenAI affirme avoir résolu ce problème, permettant désormais à ChatGPT de créer des logos, des panneaux ou des légendes sans erreurs.
Image générée par GPT-4o
Autre nouveauté majeure : l’édition d’images. Les utilisateurs peuvent désormais mettre en ligne une photo et demander des modifications via des instructions simples. Grâce à la mémoire de GPT-4o, l’IA peut retravailler une image en plusieurs étapes, par exemple en transformant un animal de compagnie en personnage de jeu vidéo. OpenAI précise que jusqu’à 15 images peuvent être fournies pour guider le processus.
Si OpenAI permet la création d’images réalistes, la politique concernant les personnalités publiques reste floue. L’entreprise indique que certaines restrictions s’appliqueront, contrairement à des outils comme Grok, bien plus permissifs.
Le nouveau générateur est d’ores et déjà accessible gratuitement dans ChatGPT (via GPT-4o), tandis que Dall-E 3 reste utilisable via un chatbot dédié. À terme, l’API sera ouverte aux développeurs, et Sora, le modèle d’OpenAI qui génère des vidéos, bénéficiera également de ces avancées.
Reste à voir si ces améliorations permettront à ChatGPT de concurrencer sérieusement Midjourney ou Imagen. Une chose est sûre : avec l’arrivée future de GPT-5, OpenAI compte bien consolider sa position dans le domaine de l’IA générative.
Hertz, l’un des leaders de la location de voitures, alerte ses clients sur un important piratage qui comprend le vol de données assez...
La série The Last of Us est de retour cette semaine avec le premier épisode de la saison 2 et il se trouve que l’audience est en...
Chaque jour nous dénichons pour vous des promos sur les produits High-Tech pour vous faire économiser le plus d’argent possible. Voici...
Le CMS incontournable WordPress vient de dévoiler sa première mise à jour d’envergure pour 2025 : la version 6.8,...
OpenAI travaillerait actuellement sur un projet de réseau social, selon The Verge. Ce projet, qui s’inspirerait de X (ex-Twitter) et qui est...