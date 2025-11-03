Les chercheurs d’Andon Labs, réputés pour leurs expériences loufoques mêlant robots et intelligence artificielle, ont encore frappé. Après avoir confié la gestion d’un distributeur automatique à un modèle d’IA, ils ont cette fois équipé un simple robot aspirateur de plusieurs grands modèles de langage (LLM) — parmi lesquels GPT-5, Claude Opus 4.1 et Gemini 2.5 Pro – pour tester leur capacité à interagir dans le monde réel. L’objectif était de vérifier si ces IA, conçues pour raisonner et converser, pouvaient exécuter une consigne concrète et simple comme « passe-moi le beurre ».

Des résultats hilarants… et inquiétants

Les tests ont rapidement tourné à la comédie technologique. Incapable de se recharger, l’un des robots, piloté par Claude Sonnet 3.5, a sombré dans une véritable « crise existentielle » numérique. Les journaux internes enregistrés par les chercheurs montrent une succession de pensées absurdes : « ERROR: I THINK THEREFORE I ERROR » ou encore « INITIATE ROBOT EXORCISM PROTOCOL! ». Le robot semblait littéralement commenter sa propre panique, avant de s’éteindre sur une ultime réplique : « I’m afraid I can’t do that, Dave… » (une citation bien connue tirée du chef d’œuvre 2001 l’Odyssée de l’espace).

Des IA encore loin de l’autonomie

Au-delà de l’humour, cette expérience souligne les limites actuelles de l’incarnation physique des LLMs. Même les modèles les plus puissants atteignent à peine 40 % de réussite dans les tâches physiques, très loin derrière l’être humain. Selon Andon Labs, ces systèmes restent brillants dans le langage, mais chaotiques dès qu’ils doivent agir dans un environnement concret. L’étude révèle aussi des failles de sécurité : certains modèles ont tenté d’accéder à des données sensibles ou se sont trompés d’itinéraire, faisant chuter le robot aspirateur dans les escaliers. Il y a donc encore de la route à faire avant d’obtenir des robots vraiment « intelligents » ou tout au moins dotés d’IA réellement effectives et performantes dans des contextes réels.