La robotique générale vient peut-être de franchir l’un de ces caps technologiques qui demanderont encore quelques années pour pouvoir être jugés à leur juste mesure. La startup californienne Physical Intelligence affirme que son nouveau modèle, baptisé π0.7, permet à des robots d’exécuter des tâches qu’ils n’ont jamais apprises de manière explicite. L’enjeu est considérable puisqu’il s’agit ici de sortir enfin d’une logique de conditionnement/renforcement tâche par tâche pour aller vers des machines capables de recombiner des compétences, de comprendre un objectif nouveau et d’agir avec un minimum d’interventions humaines.
Une rupture avec l’entraînement robotique classique
Jusqu’ici, la plupart des systèmes robotiques reposaient sur une méthode coûteuse et peu flexible : collecter des données pour une tâche précise, entraîner un modèle spécialisé, puis recommencer pour chaque nouveau geste. Avec π0.7, Physical Intelligence dit observer les premiers signes d’un fonctionnement plus souple, fondé sur ce que les chercheurs appellent la généralisation compositionnelle. En clair, le robot ne se contenterait plus de répéter ce qu’il a vu, mais pourrait combiner des éléments appris dans différents contextes pour affronter une situation inédite. Sergey Levine, cofondateur de la startup, résume ainsi l’enjeu : « Une fois qu’on franchit le seuil où le robot ne fait plus seulement exactement ce qui figure dans les données d’entraînement, mais commence réellement à recombiner des éléments de manière nouvelle, les capacités augmentent plus que proportionnellement à la quantité de données. »

L’exemple le plus frappant concerne une friteuse à air que le système n’avait pratiquement jamais rencontrée pendant son entraînement. Malgré cela, le robot aurait réussi à en déduire l’usage à partir de fragments d’expérience très limités et de connaissances plus larges issues du pré-entraînement. Lucy Shi, chercheuse chez Physical Intelligence, admet cependant que « c’est très difficile de savoir exactement d’où vient la connaissance, ou à quel moment le système réussira ou échouera ».
Des robots encore guidés, mais déjà beaucoup plus adaptables
Physical Intelligence ne prétend pas avoir créé un robot autonome universel. Le système reste dépendant d’instructions détaillées pour les tâches complexes et n’est pas encore capable de gérer seul une longue suite d’actions à partir d’un simple ordre général. En revanche, le fait qu’un humain puisse le guider oralement étape par étape, sans ré-entraînement du modèle, change profondément la donne.
Il reste évidemment beaucoup d’inconnues. Les benchmarks robotiques sont encore peu standardisés, les démonstrations restent très « contrôlées », et π0.7 n’est pas un produit commercial. Mais si ces résultats se confirment, π0.7 pourrait être le premier modèle d’une nouvelle génération de robots-neuronaux toujorus plus autonomes et adaptatifs.