OpenAI a annoncé le lancement de son nouveau modèle d’intelligence artificielle, o3, conçu pour offrir des capacités de raisonnement humain plus avancées que celles de ses précédentes créations. Ce modèle, qui arrivera dans ChatGPT, vise à répondre de manière plus précise aux questions complexes, en prenant davantage de temps pour calculer une réponse, particulièrement pour des problèmes à plusieurs étapes. En parallèle, OpenAI a présenté une version réduite du modèle, o3-mini.

OpenAI lève le voile sur o3
Le modèle o3 a été comparé à l’ancien modèle o1 lancé en septembre. Ce dernier, bien que performant, ne pouvait pas traiter aussi efficacement des questions très techniques, telles que celles liées à la programmation. OpenAI a affirmé que o3 surpassait son prédécesseur en matière de raisonnement, en étant capable d’aborder des problèmes plus complexes de manière plus nuancée.
Voici quelques benchmarks mis en avant par OpenAI pour son modèle o3 :
- o3 a obtenu un score de 75,7% lors de l’évaluation semi-privée ARC-AGI. Avec une configuration o3 à forte puissance de calcul, il a obtenu 87,5% à l’évaluation semi-privée.
- Sur le benchmark EpochAI Frontier Math, o3 a résolu 25,2% des problèmes, alors que les modèles existants n’en ont résolu que 2%.
- Sur SWE-Bench Verified, o3 a obtenu un score de 71,7, soit 22,8 points de plus qu’o1.
- Sur Codeforces, o3 a obtenu un score Elo de 2 727.
- À l’AIME 2024, o3 a obtenu un score de 96,7%. À titre de comparaison, o1 a obtenu un score de 83,3%.
- Sur GPQA Diamond, o3 a obtenu un score de 87,7%. En comparaison, o1 a obtenu 78%.

Les développements d’OpenAI s’accompagnent également d’une nouvelle approche de sécurité, baptisée « alignement délibératif », qui vise à garantir que ses IA respectent des normes éthiques strictes, évitant ainsi des usages illégaux. Ce défi d’alignement reste l’une des préoccupations majeures pour les entreprises développant des modèles d’IA, d’autant que les valeurs éthiques des utilisateurs varient considérablement.
Une disponibilité à partir de janvier 2025
Prévu pour fin janvier, le modèle o3-mini sera mis à la disposition des chercheurs en sécurité avant sa sortie officielle. De son côté, le modèle o3 arrivera peu de temps après selon OpenAI.
Au fait, pourquoi o3 au lieu d’o2 ? OpenAI a fait ce choix parce que O2 existe déjà au Royaume-Uni, il s’agit d’un opérateur.