Google a franchi une étape dans l’évolution de son intelligence artificielle Gemini avec de nouvelles capacités agentiques, ce qui permet d’accomplir des tâches complexes en toute autonomie sur les smartphones Android.

Un assistant IA qui clique à votre place
L’annonce marque un tournant stratégique pour Android. Google ne se contente plus de proposer un chatbot conversationnel, mais propose une véritable capacité d’actions multiples. Cette fonctionnalité, encore en phase bêta, permet à Gemini d’interagir directement avec des applications tierces pour effectuer des actions en plusieurs étapes, comme commander un repas ou réserver un VTC, sans que l’utilisateur n’ait à naviguer dans les menus.
Le cœur de cette fonction réside dans la capacité de Gemini à comprendre et manipuler les interfaces graphiques des applications. Concrètement, un utilisateur peut demander « Commande-moi un Uber pour rentrer à la maison ». L’IA va alors ouvrir l’application, saisir la destination, choisir le type de véhicule et préparer la course.
Google décrit ce processus comme une automatisation agentique. Contrairement à une simple API invisible, l’action se déroule sous les yeux de l’utilisateur. Gemini opère dans une fenêtre virtuelle sécurisée, isolée du reste des données du téléphone, où l’on peut voir l’IA faire défiler les pages, taper du texte et sélectionner des options en temps réel.
Cependant, Google insiste sur la sécurité et le contrôle : l’assistant ne peut pas valider un paiement seul. Une fois la commande prête (le panier rempli ou la course configurée), Gemini notifie l’utilisateur qui doit vérifier les détails et appuyer lui-même sur le bouton final de validation. L’utilisateur conserve également la possibilité d’interrompre la tâche à tout moment s’il constate une erreur.
Une disponibilité limitée au départ
Pour l’instant, cette fonctionnalité est réservée à quelques smartphones Android. Elle sera disponible initialement sur les Samsung Galaxy S26 ainsi que sur les Google Pixel 10, Pixel 10 Pro et Pixel 10 Pro XL.
Le déploiement géographique est lui aussi restreint : seuls les utilisateurs aux États-Unis et en Corée du Sud pourront tester cette bêta dans un premier temps. Les applications compatibles au lancement se concentrent sur les services de livraison et de transport, incluant Uber, DoorDash et Grubhub.