KultureGeek Logiciels Mistral lance Voxtral TTS, un modèle de synthèse vocale open source conçue pour les assistants et l’entreprise

Mistral lance Voxtral TTS, un modèle de synthèse vocale open source conçue pour les assistants et l’entreprise

3 min.
26 Mar. 2026 • 16:30
0

La jeune pousse française Mistral donne de la voix (hum…). L’entreprise vient de dévoiler Voxtral TTS, un nouveau modèle de synthèse vocale open source destiné aussi bien aux assistants vocaux qu’aux usages professionnels, comme le support client ou les agents de vente. Avec cette annonce, Mistral se positionne frontalement face à des acteurs déjà bien installés sur le text-to-speech, dont ElevenLabs, Deepgram ou bien encore le géant américain OpenAI.

Neuf langues et une exécution prévue pour l’edge

Voxtral TTS prend en charge neuf langues, soit l’anglais, le français, l’allemand, l’espagnol, le néerlandais, le portugais, l’italien, l’hindi et l’arabe. L’objectif affiché est de permettre aux entreprises de déployer des voix naturelles, y compris sur des appareils peu puissants. Pierre Stock, vice-président des opérations science chez Mistral, résume cette approche : « Nos clients nous demandaient un modèle de parole. Nous avons donc conçu un modèle compact qui peut tenir sur une montre connectée, un smartphone, un ordinateur portable ou d’autres appareils en périphérie. Son coût est une fraction de ce qui existe sur le marché, tout en offrant des performances de pointe. »

Clonage vocal rapide et voix moins “robotique”

Mistral met aussi en avant des capacités d’adaptation de voix à partir d’un échantillon de moins de cinq secondes, avec la possibilité de conserver des nuances comme de légers accents, l’intonation ou certaines irrégularités naturelles du flux de parole. La  startup promet aussi le passage d’une langue à l’autre sans perte d’identité sonore, ce qui sera évidemment utile pour le doublage ou la traduction en temps réel.

Latence et vitesse : des chiffres orientés temps réel

En terme de performances, Voxtral TTS afficherait une latence de démarrage (TTFA) de 90 ms sur un exemple de 500 caractères (environ 10 secondes d’audio), ainsi qu’un “real-time factor” de 6x, ce qui correspond au rendu d’un extrait de 10 secondes en environ 1,6 seconde. Le modèle s’appuie sur une base de type Ministral 3B, ce qui explique son positionnement « petit format ».

Voice Emulation Mistral

Après ses modèles de transcription lancés plus tôt cette année, Mistral avance donc vers une offre voix de bout en bout : entrée audio, texte et image, sortie multimodale, et personnalisation. Dans un marché où les entreprises cherchent à garder la main sur les données et le réglage fin des modèles, l’open source pourrait devenir un critère aussi décisif que la qualité de la voix elle-même.

 

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Amazon Data Center Serveurs

L’Iran menace directement Apple, Google, Nvidia et d’autres géants de la tech au Moyen-Orient

31 Mar. 2026 • 21:39
0 Hors-Sujet

Le conflit entre l’Iran et les États-Unis franchit un nouveau seuil de tension, avec une menace cette fois explicite visant les grandes...

Lunettes Connectees Meta Blayzer Optics Gen 2

Meta Ray-Ban : Meta dévoile ses lunettes connectées avec verres correcteurs

31 Mar. 2026 • 20:05
1 Matériel

Meta commercialise deux nouvelles paires de lunettes connectées (Optics Styles) en collaboration avec Ray-Ban conçues pour les porteurs de...

Supergirl Milly Alcock

Supergirl : nouvelle bande-annonce pour le film DC après Superman

31 Mar. 2026 • 18:28
0 Geekeries

DC Studios propose la nouvelle bande-annonce pour Supergirl, le nouveau film qui arrive après Superman de James Gunn. Le premier trailer avait...

Perseverance

Mars : Perseverance détecte pour la première fois des éléments rappelant des rubis

31 Mar. 2026 • 16:50
0 Science

La planète rouge n’a pas fini de surprendre les scientifiques. Le rover Perseverance de la NASA vient de révéler la...

Nvidia DLSS 4.5

Nvidia rend disponible le DLSS 4.5 pour les meilleurs graphismes et le Multi Frame Generation 6x

31 Mar. 2026 • 15:45
0 Jeux vidéo

Annoncé au CES 2026 en janvier, le DLSS 4.5 est désormais disponible pour les joueurs. Nvidia déploie ce 31 mars, via la bêta...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site