Google franchit une nouvelle étape dans la transformation de son moteur de recherche en intégrant la recherche en temps réel (Search Live) à son AI Mode, une fonctionnalité expérimentale qui permet aux utilisateurs de dialoguer vocalement avec son chatbot IA directement depuis la recherche.
Une interaction vocale avec Gemini
Testée actuellement via Google Labs aux États-Unis, cette nouveauté repose sur une version personnalisée de Gemini, le modèle d’intelligence artificielle de Google. L’objectif est de rendre les échanges plus naturels et dynamiques grâce à des conversations vocales bidirectionnelles. Une fois activée dans l’application Google sur Android ou iOS, la fonction apparaît sous la forme d’une icône « Live ». L’utilisateur peut poser une question à voix haute, comme « Que faire pour éviter que ma robe en lin se froisse dans une valise ? », et recevoir une réponse audio immédiate. Il peut ensuite enchaîner avec une nouvelle question, comme : « Et si elle se froisse quand même ? ».
En plus de la réponse vocale, l’interface affiche des liens pertinents, offrant ainsi une expérience enrichie.
Vers une recherche plus visuelle et mobile
Pour l’instant, le partage d’image via la caméra du smartphone n’est pas encore disponible, mais Google prévoit d’ajouter cette fonctionnalité dans les mois à venir. Elle permettra, par exemple, de pointer son appareil vers un objet et de poser des questions à son sujet. C’est une fonction déjà accessible, dans une forme plus limitée, dans l’application mobile.
Google souligne que Search Live fonctionne en arrière-plan, ce qui permet à la conversation de se poursuivre même lorsque l’utilisateur passe à une autre application. Une transcription textuelle est également disponible, avec la possibilité de répondre par écrit. Toutes les discussions sont archivées dans l’historique de l’AI Mode.
Cette initiative s’inscrit dans un mouvement plus large du secteur : OpenAI a lancé l’année dernière un mode vocal avancé pour ChatGPT, tandis qu’Anthropic a intégré une fonction similaire dans Claude en mai. Apple, de son côté, travaille sur un assistant vocal basé sur un LLM, surnommé « LLM Siri » en interne, mais son lancement a été repoussé en raison de problèmes de fiabilité.
Manfrotto MK190X3-2W Kit Trépied en Aluminium à 3 Sections avec Tête Fluide 2D – Trépied Photo/Vidéo pour Appareils Reflex et Hybrides, Noir/Anthracite
WD 5To My Passport Ultra pour Mac Disque Dur Externe Portable, Parfait pour sauvegarde et stockage, Sauvegarde et protection par mot de passe, Prêt pour Mac, Boîtier métallique épuré, Gris
Polar Vantage V2 - GPS Montre Connectée Running et Triathlon Premium - Mesure de la Fréquence Cardiaque au Poignet pour Course à Pied, Natation, Cyclisme - Contrôle de la Musique, Météo
ASUS Zenscreen MB165B - Ecran PC Portable 15,6" HD - Télétravail ou Gaming - Alimentation et Affichage Via USB Type-A - Dalle TN - 1366x768 - PS3 PS4 Raspberry Pi Xbox - 220cd/m² -, Noir