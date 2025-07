OpenAI annonce ChatGPT Agent, un agent d’intelligence artificielle polyvalent qui accomplit automatiquement une large variété de tâches. Cette innovation, présentée comme un équivalent d’ordinateur virtuel, marque la tentative la plus ambitieuse de la société pour transformer ChatGPT en un véritable assistant numérique.

Un agent IA aux capacités étendues

ChatGPT Agent combine plusieurs fonctionnalités issues des outils précédents d’OpenAI. Il intègre notamment la capacité d’Operator à naviguer sur les sites et celle de Deep Research à synthétiser des informations provenant de dizaines de sites en des rapports de recherche concis. L’agent peut automatiquement gérer le calendrier d’un utilisateur, générer des présentations et diaporamas modifiables, et exécuter du code.

Les utilisateurs peuvent communiquer avec ChatGPT Agent en utilisant le langage naturel, comme ils le feraient avec la version standard du chatbot.

OpenAI déploie ChatGPT Agent pour les utilisateurs avec l’abonnement Pro, et ce dès aujourd’hui, et dans quelques jours pour les abonnements Plus et Team. Cependant, le lancement dans les pays de l’Union européenne se fera plus tard. Pour activer l’outil, les utilisateurs doivent sélectionner « mode agent » dans le menu déroulant des outils de ChatGPT.

Le lancement de la nouveauté représente l’approche la plus audacieuse d’OpenAI pour transformer ChatGPT en un produit agentique capable d’effectuer des actions et de déléguer des tâches aux utilisateurs, plutôt que de simplement répondre à des questions.

Des capacités techniques avancées

OpenAI affirme que ChatGPT Agent surpasse largement ses offres précédentes en matière de capacités. L’agent peut accéder aux connecteurs de ChatGPT, permettant aux utilisateurs de relier des services comme Gmail et GitHub pour que l’agent puisse trouver des informations pertinentes selon leurs demandes.

L’agent dispose également d’un accès à un terminal et peut utiliser des API pour accéder à certaines applications. Ces fonctionnalités techniques élargissent considérablement le champ d’action de l’assistant, lui permettant d’interagir avec l’écosystème logiciel existant des utilisateurs.

OpenAI suggère que les utilisateurs peuvent faire appel à ChatGPT Agent pour « planifier et acheter des ingrédients pour préparer un petit-déjeuner japonais pour quatre personnes » ou « analyser trois concurrents et créer un diaporama ». Ces exemples illustrent la complexité des tâches que l’agent peut accomplir.

Ces capacités exigent que ChatGPT Agent analyse des sites Web, planifie une série d’actions et utilise divers outils. Cette approche représente des tâches bien plus complexes que celles qu’OpenAI avait précédemment tentées avec ses agents. L’agent doit coordonner plusieurs étapes et prendre des décisions autonomes pour mener à bien ces missions.

De bonnes performances sur les benchmarks

Le modèle sous-jacent de ChatGPT Agent offre des performances de pointe sur plusieurs benchmarks, selon les dires d’OpenAI. Il obtient un score de 41,6 % sur Humanity’s Last Exam (pass@1), un test difficile composé de milliers de questions couvrant plus de 100 matières. Ce résultat représente environ le double de ce qu’ont obtenu o3 et o4-mini d’OpenAI sur ce même test.

Sur FrontierMath, l’un des benchmarks mathématiques les plus difficiles connus, ChatGPT Agent atteint 27,4 % lorsqu’il a accès à des outils comme un terminal pour l’exécution de code. Le précédent score de référence provenait d’o4-mini, qui n’avait obtenu que 6,3 %.

Des mesures de sécurité au programme

OpenAI souligne avoir développé ChatGPT Agent en gardant la sécurité à l’esprit, principalement parce que le produit présente des capacités inédites qui pourraient le rendre plus dangereux entre de mauvaises mains. L’entreprise a précédemment averti que les modèles agentiques pourraient présenter des capacités plus dangereuses.

Dans un rapport de sécurité pour ChatGPT Agent, OpenAI classe le modèle comme « haute capacité » dans les domaines des armes biologiques et chimiques. Cette classification, définie dans le cadre de préparation d’OpenAI, désigne un modèle capable d’« amplifier les voies existantes vers des dommages graves ». Bien qu’OpenAI ne dispose pas de preuves directes de cela, l’entreprise a décidé d’adopter une approche préventive et d’activer de nouvelles protections pour atténuer ces risques.

Parmi les nouvelles mesures de protection pour ChatGPT Agent figure un moniteur qui fonctionne en temps réel pendant que les utilisateurs interagissent avec le produit. OpenAI exécute un système de classifications sur chaque prompt entré dans ChatGPT Agent, déterminant si la demande est liée à la biologie.

Si tel est le cas, OpenAI fait passer la réponse de ChatGPT Agent par un second moniteur qui détermine si le contenu pourrait être utilisé pour évoquer une menace biologique. Cette approche multicouche vise à prévenir les utilisations malveillantes tout en préservant les fonctionnalités légitimes.

Des défis persistants à surmonter

Malgré ses capacités intéressantes, il reste à voir à quel point le nouvel agent d’OpenAI est véritablement capable dans le monde réel. Jusqu’à présent, la technologie des agents s’est révélée relativement fragile lors de l’interaction avec le monde réel.

Ces dernières années, les entreprises de la tech, notamment OpenAI, Google et Perplexity, ont dévoilé des dizaines d’agents IA qui promettaient d’accomplir exactement ce type de tâches. Cependant, ces premières versions d’agents IA ont eu du mal avec des tâches complexes et semblent moins convaincantes comme produits que la vision ultime que les dirigeants présentent autour des agents IA.

OpenAI croit néanmoins avoir développé un modèle plus capable qui peut tenir la promesse des agents IA. Cette confiance repose sur les améliorations techniques significatives apportées à ChatGPT Agent par rapport aux versions précédentes.