TENDANCES
Comparateur
- AUTO
Google repousse les limites de l’intelligence robotique avec l’introduction du modèle d’apprentissage d’IA Robotic Transformer (RT-2). Cette version améliorée du modèle vision-langage-action (VLA) a été conçue pour améliorer la capacité des robots à reconnaître les schémas visuels et linguistiques, permettant aux machines d’interpréter plus efficacement les instructions et de discerner les objets les plus appropriés pour des tâches spécifiques.
Lors des différents tests, les chercheurs ont utilisé RT-2 avec un bras robotisé. Ils ont mis au défi le bras robotique et lui ont « demandé » de sélectionner parmi une liste d’objets une boisson destinée à un individu épuisé (ici une canette de Red Bull). Ils ont aussi demandé au robot de déplacer une canette de Coca vers une photo de Taylor Swift (et bien sûr, le bras–robot s’est correctement exécuté).
Le modèle RT-2 a suivi une formation complète sur les données Web et robotiques, capitalisant sur les avancées de la recherche dans les grands modèles de langage comme Google’s Bard. Avec les prouesses des modèles VLA comme RT-2, les robots peuvent désormais accéder à une mine d’informations et ainsi améliorer rapidement leurs performances en limitant au maximum les interventions extérieures.
SOURCEThe Verge
La Wikimedia Foundation, l’organisation à but non lucratif qui gère Wikipedia, tire la sonnette d’alarme : le...
Depuis plus d’une décennie, les astrophysiciens scrutent une énigmatique source de rayonnement au centre de la Voie lactée. De...
Amazon Web Services (AWS) connaît une panne majeure, rendant inutilisables plusieurs services en ligne, dont Perplexity, Snapchat, Fortnite, Canva,...
Les tensions entre Washington et Pékin prennent une nouvelle dimension numérique. Le ministère chinois de la Sécurité...
Après le succès commercial des Xiaomi 17, le constructeur officialise son intention de poursuivre et d’améliorer...