Google fait franchir un cap à la traduction en temps réel avec Gemini 3.5 Live Translate, un modèle pensé pour parler pendant que l’échange continue au lieu d’attendre la fin de chaque phrase. L’ambition est simple : réduire la sensation d’interruption qui accompagne encore la plupart des outils de traduction vocale.
Gemini 3.5 Live Translate fait ses débuts
Le changement le plus important tient à la cadence. Là où les systèmes tour par tour laissent un vide entre la parole d’origine et la réponse traduite, Gemini 3.5 Live Translate produit une voix continue qui reste seulement quelques secondes derrière l’orateur. Google cherche ainsi à maintenir le fil d’une conversation plutôt qu’à juxtaposer des blocs de traduction successifs.
Cette continuité ne repose pas seulement sur la vitesse. Le modèle promet aussi de préserver l’intonation, le rythme et la hauteur de voix, ce qui vise à rendre la traduction moins mécanique et plus proche d’une vraie prise de parole. Toute la difficulté consiste à arbitrer entre deux exigences contraires : attendre assez longtemps pour comprendre le contexte, mais pas au point de casser la synchronisation avec la personne qui parle.
Gemini 3.5 Live Translate arrive dans Google Traduction sur Android et iOS, avec un accès direct via le bouton « Traduction en direct ». Google cible donc d’abord les situations très simples, celles où deux personnes veulent se comprendre sans passer par une séquence lourde et fragmentée.
Sur Android, le nouveau « Mode écoute » va dans le même sens. Il permet d’écouter la traduction dans l’écouteur du téléphone, comme pendant un appel classique, quand on n’a pas d’écouteurs sous la main. Ce détail compte car il réduit la friction matérielle qui limite souvent ce type d’outil dans les usages quotidiens.
Google étend aussi ce modèle à Google Meet. La traduction vocale de l’application d’appel vidéo était auparavant limitée à cinq langues. Avec Gemini 3.5 Live Translate, Google met en avant plus de 70 langues et plus de 2 000 combinaisons linguistiques possibles dans une même réunion, alors que le fonctionnement précédent passait uniquement par l’anglais.
L’arrivée dans Google Meet donne à cette annonce une portée plus large que la seule traduction mobile. Google ne vise plus seulement le voyage, l’échange ponctuel ou la conversation improvisée. Le groupe place désormais la traduction vocale à la visioconférence avec un bouton dédié sur le Web pour lancer immédiatement la fonction.
Une traduction moins saccadée a beaucoup plus de valeur dans une réunion que dans une phrase isolée parce qu’elle peut modifier la manière dont des équipes multilingues échangent en direct. Le support de milliers de combinaisons pousse aussi l’outil hors d’un modèle centré sur l’anglais, ce qui élargit nettement les cas d’usage internationaux.
Un déploiement progressif et de l’audio traçable
Google garde toutefois un calendrier à plusieurs niveaux. Gemini 3.5 Live Translate commence son arrivée dans Google Traduction sur mobile, puis débarque ce mois-ci en préversion privée chez certains clients professionnels de Google Workspace avant un déploiement plus large plus tard dans l’année. Les développeurs peuvent aussi y accéder en préversion publique via l’API Gemini Live et Google AI Studio.
Google ajoute enfin un garde-fou sur la traçabilité du son produit. Tout l’audio généré par le modèle reçoit un marquage SynthID intégré de manière imperceptible dans la sortie vocale. Google cherche ainsi à accompagner la montée en puissance des voix synthétiques en conservant un moyen de les identifier, avec en ligne de mire les risques de manipulation et de désinformation.
Netatmo Détecteur de Fumée Intelligent, 10 ans de batterie, Tests automatisés, Alarme Incendie connectée sans box domotique, Certifié NF et EN14604, NSA-FR
Sony RX10 IV | Appareil Photo Numérique Expert Premium Bridge (Capteur de type 1.0, Optique Zeiss 24-600mm f/2.8-4.0 , Autofocus Ultra- Rapide à 0,03s, Vidéo 4K)