TENDANCES
Comparateur
- AUTO
AlphaGeometry 2 et AlphaProof, deux intelligences artificielles de Google DeepMind, le laboratoire de recherche du groupe, ont réussi à résoudre des problèmes des Olympiades internationales de mathématiques 2024, alors que les IA péchent jusque-là en matière de raisonnement logique. Elles ont même obtenu la médaille d’argent et ont battu des humains.

AlphaProof et AlphaGeometry 2 ont résolu quatre des six problèmes présentés cette année à ce concours international destiné aux élèves du secondaire, atteignant le niveau d’un médaillé d’argent. Cela représente une première selon Google.
Dans le détail, AlphaProof a résolu deux problèmes d’algèbre et un problème d’arithmétique, tandis qu’AlphaGeometry 2 a résolu un problème de géométrie. Les résultats détaillés sont à retrouver sur cette page.
La 65e édition des Olympiades internationales de mathématiques (OIM) s’est tenue au Royaume-Uni du 11 au 22 juillet. Cette compétition, qui existe depuis 1959, réunit des lycéens (et parfois quelques collégiens d’exception) sélectionnés dans une centaine de pays.
La première version d’AlphaGeometry était déjà parvenue à résoudre 25 problèmes de géométrie des Olympiades sur un total de 30 exercices proposés, avait rapporté en janvier la revue scientifique Nature.
« Ces résultats ouvrent de nouvelles perspectives dans le domaine du raisonnement mathématique et laissent entrevoir un avenir où mathématiciens et IA collaboreront pour résoudre des problèmes complexes », a avancé Google dans un communiqué.
Les grands modèles de langage, produits phares de l’IA, ont beaucoup de mal à raisonner face à des tests de logique, selon une étude parue en juin dans la revue Open Science de la Royal Society britannique. Celle-ci a constaté que ChatGPT 3.5 et 4 d’OpenAI, Bard de Google, Claude 2 d’Anthropic et trois versions du Llama de Meta répondaient de façon inconstante et en s’appuyant sur des raisonnements souvent absurdes.
La startup française Wandercraft déploie depuis peu son tout dernier robot humanoïde, le Calvin‑40, sur une ligne industrielle du...
OpenAI et Amazon ont annoncé un partenariat pluriannuel de 38 milliards de dollars en rapport avec l’intelligence artificielle et le cloud....
Microsoft déploie une nouvelle fonctionnalité en test sur Windows 11 permettant de diffuser de l’audio simultanément sur deux...
Nouvelle lubie ou véritable projet tech ? Elon Musk, le patron visionnaire de Tesla, a promis de faire littéralement décoller son...
À partir du 12 novembre, toute personne souhaitant accéder à un site pornographique depuis l’Italie devra passer par un...