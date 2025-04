OpenAI a officiellement lancé GPT-4.1, une évolution directe du modèle multimodal GPT-4o lancé l’année dernière. Annoncé lors d’une présentation en direct, ce nouveau modèle promet des performances supérieures dans pratiquement toutes les dimensions, selon les dires de l’entreprise d’intelligence artificielle. Les avancées concernent notamment la génération de code, la compréhension des instructions et la gestion du contexte.

Un bond technologique en matière de contexte pour GPT-4.1

GPT-4.1 se distingue par sa capacité à traiter jusqu’à un million de tokens dans une seule requête. Cela dépasse largement les 128 000 tokens gérés par GPT-4o. OpenAI affirme avoir entraîné GPT-4.1 à remarquer de manière fiable les textes pertinents et à mieux ignorer les informations secondaires, même sur de longues données.

Trois versions du modèle sont désormais disponibles pour les développeurs : GPT-4.1, mais aussi deux déclinaisons allégées. GPT-4.1 mini, déjà connue pour sa flexibilité, et GPT-4.1 nano, décrite comme la version « la plus petite, la plus rapide et la moins chère » proposée à ce jour. Ces options s’adressent à différents besoins, du prototypage rapide à l’intégration dans des applications légères.

GPT-4.1 arrive alors que les rivaux de l’OpenAI, tels que Google et Anthropic, redoublent d’efforts pour construire des modèles de programmation sophistiqués. Gemini 2.5 Pro, récemment publié par Google, qui dispose également d’une fenêtre contextuelle d’un million de tokens, occupe une place de choix dans les tests de codage les plus répandus. Il en va de même pour Claude 3.7 Sonnet d’Anthropic et la version améliorée V3 de la startup chinoise DeepSeek.

Une stratégie de remplacement des anciens modèles

OpenAI prévoit de retirer progressivement ses anciens modèles. Le modèle GPT-4, utilisé dans ChatGPT depuis deux ans, sera désactivé le 30 avril. De son côté, la préversion de GPT-4.5 disparaîtra de l’API à partir du 14 juillet. L’entreprise justifie ces retraits par les performances supérieures de GPT-4.1, tout en soulignant sa latence réduite et son coût inférieur. Ce dernier est d’ailleurs 26 % moins élevé que celui de GPT-4o, un détail stratégique alors que la concurrence, comme DeepSeek, mise sur l’efficacité énergétique.

Par ailleurs, OpenAI prépare le lancement de ses modèles de raisonnement o3 et o4 mini. Ces références ont déjà été repérées dans le code source de ChatGPT, suggérant une mise en ligne imminente.