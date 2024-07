AlphaGeometry 2 et AlphaProof, deux intelligences artificielles de Google DeepMind, le laboratoire de recherche du groupe, ont réussi à résoudre des problèmes des Olympiades internationales de mathématiques 2024, alors que les IA péchent jusque-là en matière de raisonnement logique. Elles ont même obtenu la médaille d’argent et ont battu des humains.

AlphaProof et AlphaGeometry 2 ont résolu quatre des six problèmes présentés cette année à ce concours international destiné aux élèves du secondaire, atteignant le niveau d’un médaillé d’argent. Cela représente une première selon Google.

Dans le détail, AlphaProof a résolu deux problèmes d’algèbre et un problème d’arithmétique, tandis qu’AlphaGeometry 2 a résolu un problème de géométrie. Les résultats détaillés sont à retrouver sur cette page.

La 65e édition des Olympiades internationales de mathématiques (OIM) s’est tenue au Royaume-Uni du 11 au 22 juillet. Cette compétition, qui existe depuis 1959, réunit des lycéens (et parfois quelques collégiens d’exception) sélectionnés dans une centaine de pays.

La première version d’AlphaGeometry était déjà parvenue à résoudre 25 problèmes de géométrie des Olympiades sur un total de 30 exercices proposés, avait rapporté en janvier la revue scientifique Nature.

« Ces résultats ouvrent de nouvelles perspectives dans le domaine du raisonnement mathématique et laissent entrevoir un avenir où mathématiciens et IA collaboreront pour résoudre des problèmes complexes », a avancé Google dans un communiqué.

Les grands modèles de langage, produits phares de l’IA, ont beaucoup de mal à raisonner face à des tests de logique, selon une étude parue en juin dans la revue Open Science de la Royal Society britannique. Celle-ci a constaté que ChatGPT 3.5 et 4 d’OpenAI, Bard de Google, Claude 2 d’Anthropic et trois versions du Llama de Meta répondaient de façon inconstante et en s’appuyant sur des raisonnements souvent absurdes.