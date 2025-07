La start-up française Mistral AI dévoile Voxtral, sa première gamme de modèles d’intelligence artificielle dédiés au traitement audio. Cette solution open source promet d’améliorer l’intelligence vocale en combinant performance et accessibilité. Au départ, cela concerne surtout les entreprises.

Une alternative open source aux solutions propriétaires

Mistral présente Voxtral comme le premier modèle ouvert capable de déployer « une intelligence vocale vraiment utilisable en production ». Cette nouveauté répond à un dilemme majeur pour les développeurs : choisir entre un système ouvert et abordable mais peu fiable, ou une solution performante mais fermée, plus coûteuse et moins flexible.

L’entreprise française affirme que Voxtral offre une alternative économique « moins de la moitié du prix » des solutions comparables. Cette approche démocratise l’accès aux technologies d’IA audio pour les entreprises de toutes tailles.

Voxtral peut transcrire jusqu’à 30 minutes d’audio et comprendre jusqu’à 40 minutes de contenu grâce à son architecture basée sur Mistral Small 3.1. Les utilisateurs peuvent poser des questions sur le contenu audio, générer des résumés ou transformer des commandes vocales en actions temps réel comme l’appel d’API ou l’exécution de fonctions. Le modèle prend en charge huit langues : anglais, espagnol, français, portugais, hindi, allemand, néerlandais et italien.

Deux variantes adaptées aux besoins spécifiques

Mistral propose deux versions de ses modèles de compréhension vocale. Voxtral Small, avec ses 24 milliards de paramètres, cible les déploiements à grande échelle. Cette version rivalise directement avec ElevenLabs Scribe, GPT-4o-mini et Gemini 2.5 Flash.

Voxtral Mini, doté de 3 milliards de paramètres, s’adresse aux déploiements locaux. Mistral propose également une version API ultra-économique appelée Voxtral Mini Transcribe, optimisée exclusivement pour la transcription. Cette déclinaison promet de surpasser Whisper d’OpenAI pour moins de la moitié du coût.

Les utilisateurs peuvent tester Voxtral gratuitement en téléchargeant l’API sur Hugging Face ou en expérimentant les modèles dans le chatbot Le Chat de Mistral. L’intégration de l’API dans les applications démarre à 0,001 dollar par minute selon l’entreprise.

Mistral consolide sa position sur le marché européen

Cette annonce intervient un mois après le lancement de Magistral, la première famille de modèles de raisonnement de Mistral qui analysent les problèmes étape par étape pour améliorer la fiabilité. Ces innovations successives renforcent la position de Mistral comme l’une des principales entreprises d’IA européennes.

La société française, reconnue pour son plaidoyer en faveur des modèles d’IA open source, négocie actuellement une levée de fonds pouvant atteindre 1 milliard de dollars. Le fonds MGX d’Abu Dhabi figurerait parmi les investisseurs potentiels.