TENDANCES
Comparateur
- AUTO
La start-up française Mistral AI dévoile Voxtral, sa première gamme de modèles d’intelligence artificielle dédiés au traitement audio. Cette solution open source promet d’améliorer l’intelligence vocale en combinant performance et accessibilité. Au départ, cela concerne surtout les entreprises.
Mistral présente Voxtral comme le premier modèle ouvert capable de déployer « une intelligence vocale vraiment utilisable en production ». Cette nouveauté répond à un dilemme majeur pour les développeurs : choisir entre un système ouvert et abordable mais peu fiable, ou une solution performante mais fermée, plus coûteuse et moins flexible.
L’entreprise française affirme que Voxtral offre une alternative économique « moins de la moitié du prix » des solutions comparables. Cette approche démocratise l’accès aux technologies d’IA audio pour les entreprises de toutes tailles.
Voxtral peut transcrire jusqu’à 30 minutes d’audio et comprendre jusqu’à 40 minutes de contenu grâce à son architecture basée sur Mistral Small 3.1. Les utilisateurs peuvent poser des questions sur le contenu audio, générer des résumés ou transformer des commandes vocales en actions temps réel comme l’appel d’API ou l’exécution de fonctions. Le modèle prend en charge huit langues : anglais, espagnol, français, portugais, hindi, allemand, néerlandais et italien.
Mistral propose deux versions de ses modèles de compréhension vocale. Voxtral Small, avec ses 24 milliards de paramètres, cible les déploiements à grande échelle. Cette version rivalise directement avec ElevenLabs Scribe, GPT-4o-mini et Gemini 2.5 Flash.
Voxtral Mini, doté de 3 milliards de paramètres, s’adresse aux déploiements locaux. Mistral propose également une version API ultra-économique appelée Voxtral Mini Transcribe, optimisée exclusivement pour la transcription. Cette déclinaison promet de surpasser Whisper d’OpenAI pour moins de la moitié du coût.
Les utilisateurs peuvent tester Voxtral gratuitement en téléchargeant l’API sur Hugging Face ou en expérimentant les modèles dans le chatbot Le Chat de Mistral. L’intégration de l’API dans les applications démarre à 0,001 dollar par minute selon l’entreprise.
Cette annonce intervient un mois après le lancement de Magistral, la première famille de modèles de raisonnement de Mistral qui analysent les problèmes étape par étape pour améliorer la fiabilité. Ces innovations successives renforcent la position de Mistral comme l’une des principales entreprises d’IA européennes.
La société française, reconnue pour son plaidoyer en faveur des modèles d’IA open source, négocie actuellement une levée de fonds pouvant atteindre 1 milliard de dollars. Le fonds MGX d’Abu Dhabi figurerait parmi les investisseurs potentiels.
OpenAI, responsable de ChatGPT, marque un tournant stratégique en dévoilant gpt-oss-120b et gpt-oss-20b, deux grands modèles de...
Elon Musk continue de faire parler de son intelligence artificielle Grok, cette fois avec le lancement de Grok Imagine, un générateur...
Nintendo a révélé qu’un showcase Indie World aura lieu le jeudi 7 août à 15 heures. Selon l’entreprise,...
WhatsApp teste une nouvelle fonctionnalité permettant de discuter avec des personnes n’ayant pas de compte sur sur la messagerie. Cela permet...
Microsoft vient de présenter les jeux qui vont rejoindre le Xbox Game Pass en août 2025. On retrouve huit titres cette fois-ci, soit un de...