OpenAI lance GPT-5.4, son modèle d’intelligence artificielle le plus avancé à ce jour, avec une nouveauté structurante : c’est le premier modèle du groupe capable de contrôler nativement un ordinateur à l’aide de commandes clavier et souris en réponse à des captures d’écran, et en écrivant du code pour piloter des applications. Une capacité qui concrétise l’ambition de l’IA agentique que poursuivent l’ensemble des grands acteurs (Google, Anthropic, etc), où des agents autonomes opèrent en arrière-plan pour accomplir des tâches complexes à la place de l’utilisateur.

GPT-5.4 représente aussi un bond sur la fiabilité factuelle : OpenAI affirme que les affirmations individuelles du modèle sont 33 % moins susceptibles d’être fausses par rapport à GPT-5.2, ce qu’il qualifie de « modèle le plus factuel à ce jour ». De plus, la fenêtre de contexte atteint 1 million de tokens, ce qui permet d’analyser des bases de code entières, de longues collections de documents ou des séquences d’agents étendues en une seule requête. Ce point en particulier risque de satisfaire beaucoup de monde, tout particulièrement les développeurs.
Et comme d’habitude, nous avons le droit aux benchmarks pour comparer les performances avec les précédents modèles GPT, ainsi que Claude Opus 4.6 d’Anthropic et Gemini 3.1 Pro de Google.

Des capacités agentiques élargies et un moteur de recherche plus tenace
GPT-5.4 améliore sensiblement la navigation Web et la précision dans l’appel aux outils et aux API externes. Sur les questions nécessitant de croiser plusieurs sources, le modèle effectue des recherches sur plusieurs itérations successives pour identifier les sources les plus pertinentes, y compris sur des requêtes de type « aiguille dans une botte de foin », avant de synthétiser une réponse structurée.
La variante GPT-5.4 Thinking (réflexion), déployée dans ChatGPT, ajoute deux fonctionnalités orientées utilisateur : un plan de travail visible pour les requêtes complexes et la possibilité d’ajuster ou de modifier sa demande pendant que le modèle génère sa réponse. OpenAI précise que cela « permet de guider le modèle vers le résultat exact souhaité sans recommencer ou enchaîner plusieurs échanges supplémentaires ». Cette fonctionnalité est disponible dès maintenant sur l’application web et Android, avec un déploiement iOS annoncé prochainement.
Disponibilité de GPT-5.4 dès maintenant
GPT-5.4 disponible maintenant sur ChatGPT, Codex et l’API, tandis que le modèle GPT-5.4 Thinking est disponible pour les utilisateurs avec les abonnements Plus, Team et Pro. Il existe également un modèle GPT-5.4 Pro pour des performances maximales sur des tâches complexes, déployé au niveau de l’API, ainsi que pour les utilisateurs Enterprise et Edu de ChatGPT.
Pour ce qui est des coûts pour l’usage via l’API, GPT-5.4 est à 2,5 dollars par million de tokens en entrée et 15 dollars par million de tokens en sortie. Avec GPT-5.4 Pro, cela grimpe à 30 dollars en million de tokens en entrée et 180 dollars par million de tokens en sortie.