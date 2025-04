OpenAI vient de lancer une nouvelle option tarifaire pour son API baptisée Flex processing, option destinée aux développeurs souhaitant réduire les coûts pour des tâches ne nécessitant pas de réponses instantanées. Disponible en version bêta pour les modèles de raisonnement o3 et o4-mini, Flex propose une réduction de 50 % sur les tarifs habituels d’utilisation, en échange de temps de réponse plus lents et d’une disponibilité occasionnelle limitée. La formule cible principalement les tâches non critiques comme l’évaluation de modèles, les traitements asynchrones ou l’enrichissement de données. Le tarif Flex du modèle o3 est de 5 dollars par million de tokens en entrée et 20 dollars par million de tokens en sortie, contre 10 dollars et 40 dollars en tarif standard. Le modèle o4-mini bénéficie de réductions similaires.

Ce lancement intervient dans un contexte de concurrence accrue et de hausse des coûts dans le secteur de l’IA, alors même qu’un concurrent comme Google propose des modèles performants et abordables, à l’instar de Gemini 2.5 Flash. En parallèle de ce lancement, et comme cela avait été annoncé, OpenAI renforce ses contrôles d’accès : les développeurs appartenant aux niveaux d’utilisation 1 à 3 doivent désormais effectuer une vérification d’identité pour accéder au modèle o3 et à certaines fonctionnalités avancées, comme les résumés de raisonnement et l’API en streaming. Selon OpenAI, cette mesure vise à empêcher les abus et à faire respecter ses politiques d’utilisation dans un contexte de montée en puissance de ses services.