Alors que Google dote son navigateur Chrome de capacités agentiques via Gemini, la société détaille sa stratégie pour contrer les nouvelles menaces de sécurité. Le principal danger identifié est l’injection indirecte de prompt, une technique où un site malveillant ou un avis utilisateur manipulé détourne l’intelligence artificielle pour lui faire exécuter des actions indésirables (comme des virements bancaires ou le vol de données).

Une double vérification par un modèle « critique »
Pour parer ces attaques, Google mise sur une défense en profondeur. La pièce maîtresse est un modèle distinct baptisé « User Alignment Critic ». Créé avec Gemini, ce superviseur intervient une fois la planification de l’agent terminée pour valider chaque étape.
Sa mission est stricte : vérifier que l’action proposée sert réellement l’objectif de l’utilisateur. S’il détecte un désalignement, il oppose son veto, forçant l’agent à reformuler son plan. Pour éviter d’être lui-même corrompu, ce modèle critique n’analyse que les métadonnées de l’action, sans jamais être exposé au contenu web brut potentiellement piégé.

En complément, Google étend les capacités d’isolation de Chrome avec les « Agent Origin Sets ». Ce mécanisme confine l’agent aux seules sources de données pertinentes pour la tâche en cours, l’empêchant d’agir arbitrairement sur des sites non concernés.
Enfin, l’utilisateur reste le décideur ultime grâce à plusieurs garde-fous :
- Journal d’activité détaillé : chaque étape est visible en temps réel avec une possibilité d’interruption immédiate.
- Confirmation sensible : l’accès aux sites bancaires ou médicaux, ainsi que l’utilisation du gestionnaire de mots de passe, nécessitent une validation explicite.
- Actions à impact : tout achat, paiement ou envoi de message déclenche une demande de permission, l’IA ne pouvant finaliser seule ces opérations critiques.