Juste après Claude Opus 4.6 d’Anthropic, OpenAI annonce la disponibilité de GPT-5.3-Codex, un nouveau modèle d’intelligence artificielle capable de développer des applications complexes et de piloter un ordinateur de bout en bout. Cette version fusionne les compétences de codage de la génération précédente avec une vitesse d’exécution accrue de 25 %.

Ce lancement marque une étape importante dans l’évolution des outils de développement : pour la première fois, un modèle d’intelligence artificielle a joué un rôle instrumental dans sa propre création. Les équipes d’ingénierie d’OpenAI ont utilisé les versions alpha de GPT-5.3-Codex pour déboguer l’entraînement, diagnostiquer les résultats des tests et gérer le déploiement de la version finale.

Cette capacité d’auto-amélioration a permis d’accélérer le cycle de recherche, l’IA ayant même identifié des bugs de rendu contextuel et optimisé dynamiquement les ensembles de cartes graphiques (GPU) lors du lancement pour stabiliser la latence.

GPT-5.3-Codex est encore plus rapide

L’ambition de ce modèle dépasse la simple génération de code pour viser une autonomie complète sur le poste de travail. Les benchmarks témoignent de cette rupture : GPT-5.3-Codex atteint 64,7 % sur OSWorld, un test mesurant la capacité à accomplir des tâches de productivité dans un environnement visuel de bureau, écrasant les 38,2 % de son prédécesseur GPT-5.2-Codex. Il ne se contente plus d’écrire des scripts, il agit comme un collaborateur généraliste capable de naviguer, de créer des présentations PowerPoint, d’analyser des données Excel ou de rédiger des documents stratégiques, égalant les performances humaines sur 44 professions testées via l’évaluation GDPval.

Cette polyvalence s’illustre par sa capacité à créer des jeux complets en quelques jours, comme en témoignent les démonstrations d’un jeu de course et d’un jeu de plongée développés de zéro. L’utilisateur garde toutefois le contrôle grâce à un nouveau système de pilotage en temps réel. Contrairement aux modèles précédents qui imposaient d’attendre le résultat final, il est désormais possible d’interagir avec l’agent pendant qu’il travaille, de rectifier une direction ou de discuter d’une approche technique sans perdre le contexte.

Voici les benchmarks de GPT-5.3-Codex face à GPT-5.2-Codex et GPT-5.2.

Première classification « Haute capacité » en cybersécurité

La puissance de GPT-5.3-Codex a poussé OpenAI à classer ce modèle comme le premier à atteindre le niveau « Haute capacité » pour les tâches de cybersécurité selon son framework de préparation (Preparedness Framework⁠). Bien qu’aucune preuve définitive ne montre qu’il puisse automatiser des cyberattaques de bout en bout, l’entreprise adopte une posture de précaution maximale. Le modèle a été spécifiquement entraîné pour identifier les failles logicielles, une compétence à double tranchant qui sert autant les défenseurs que les hackers potentiels.

Pour encadrer ce risque, OpenAI lance un programme pilote « Trusted Access for Cyber » et engage 10 millions de dollars en crédits API pour soutenir la recherche défensive, ciblant particulièrement la protection des logiciels open source et des infrastructures critiques. Des outils de surveillance automatisée et de renseignement sur les menaces ont été intégrés pour détecter toute tentative d’abus.

Le modèle GPT-5.3-Codex est disponible dès maintenant pour les utilisateurs avec les abonnements payants de ChatGPT via l’application, le terminal (CLI), l’extension IDE et le Web, l’accès API étant prévu prochainement.