KultureGeek Internet Amazon dévoile Nova Sonic, un nouveau modèle d’IA vocal

Amazon dévoile Nova Sonic, un nouveau modèle d’IA vocal

4 min.
8 Avr. 2025 • 21:02
0

Amazon a présenté son nouveau modèle d’IA générative, Nova Sonic, qui se distingue par sa capacité à traiter nativement la voix et à générer un discours naturel. Selon la société, les performances de Nova Sonic rivalisent avec les modèles vocaux de pointe d’OpenAI et de Google, notamment en matière de rapidité, de reconnaissance vocale et de qualité des conversations.

Amazon Logo Batiment

Nova Sonic, l’IA vocale d’Amazon

Nova Sonic marque un tournant dans le domaine des assistants vocaux. Ce modèle représente la réponse d’Amazon aux nouveaux modèles d’IA vocale, comme celui qui anime le mode vocal de ChatGPT. Ces derniers offrent une expérience plus fluide et naturelle. En effet, les avancées technologiques récentes ont permis de dépasser les limites des assistants vocaux traditionnels, comme Alexa et Siri d’Apple, qui semblent désormais désuets face à ces nouvelles technologies.

Nova Sonic est d’ores et déjà accessible via Bedrock, la plateforme de développement d’Amazon pour la création d’applications IA pour les entreprises. L’IA utilise une API de streaming bidirectionnelle, permettant des échanges dynamiques entre l’utilisateur et le système. Amazon a d’ailleurs qualifié Nova Sonic de « modèle vocal IA le plus rentable du marché », soulignant que son coût est environ 80 % inférieur à celui du modèle GPT-4o d’OpenAI.

Des performances notables

L’un des atouts majeurs de Nova Sonic réside dans sa capacité à comprendre et à réagir à des dialogues complexes. Contrairement aux autres modèles vocaux, Nova Sonic sait quand intervenir pendant une conversation, en tenant compte des pauses et des interruptions de l’utilisateur. En outre, il est capable de générer une transcription texte de la parole de l’utilisateur, ce qui est particulièrement utile pour les développeurs souhaitant intégrer cette fonctionnalité dans diverses applications.

Lors de tests de reconnaissance vocale multilingues, Nova Sonic a affiché des résultats intéressants. Sur le benchmark Multilingual LibriSpeech, qui mesure la reconnaissance vocale à travers plusieurs langues (anglais, français, italien, allemand et espagnol), le modèle a obtenu un taux d’erreur de seulement 4,2 %, un résultat bien supérieur à la moyenne des modèles concurrents. Par ailleurs, dans un test mesurant la capacité du modèle à interagir lors d’échanges bruyants impliquant plusieurs participants, Nova Sonic a surpassé le modèle GPT-4o-transcribe d’OpenAI de 46,7 % en matière de précision.

Une vitesse de traitement inégalée

Un autre domaine dans lequel Nova Sonic excelle est la vitesse de traitement. Selon Amazon, le modèle présente une latence perçue moyenne de seulement 1,09 seconde, soit plus rapide que le modèle GPT-4o d’OpenAI, qui répond en 1,18 seconde. Cette rapidité est cruciale pour garantir une interaction fluide et naturelle dans des contextes d’utilisation réels, où la réactivité est essentielle.

Nova Sonic représente ainsi un élément clé de la stratégie d’Amazon pour développer l’intelligence artificielle générale (AGI). Cette ambition vise à créer des systèmes d’IA capables d’effectuer toutes les tâches qu’un humain peut accomplir sur un ordinateur. Dans les mois à venir, Amazon prévoit de dévoiler de nouveaux modèles d’IA, capables de comprendre diverses modalités, telles que les images, la vidéo, la voix, et d’autres types de données sensorielles qui pourraient être utiles dans des applications physiques.

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

iOS 27 officialisé : Apple accélère sur Siri AI, Liquid Glass et les performances de l’iPhone

8 Juin. 2026 • 23:19
iPhoneAddict.fr

Apple a profité de sa WWDC 2026 pour lever le voile sur iOS 27, la prochaine grande mise à jour de l’iPhone. Cette version ne se...

iOS 27 Logo Officiel

macOS Golden Gate 27 : Apple mise sur les performances, Apple Intelligence et la fin des Mac Intel

8 Juin. 2026 • 23:13
iPhoneAddict.fr

Apple a profité de la WWDC 2026 pour lever le voile sur macOS Golden Gate 27, la prochaine grande version de son système...

macOS Golden State Chercher ou Demander
007 First Light James Bond

007 First Light : déjà 3 millions de ventes pour le jeu James Bond

8 Juin. 2026 • 19:11
0 Jeux vidéo

IO Interactive ne commente plus seulement un bon lancement pour 007 First Light. Le studio danois parle déjà d’un jeu rentable,...

WWDC-2026-Invitation-Keynote-8-Juin-2026

[WWDC 2026] Keynote Apple en live dès 18h45 sur KultureGeek

8 Juin. 2026 • 18:20
0 Infos KultureGeek

Venez suivre avec nous la Keynote de ce 8 juin qui aura lieu sur le campus d’Apple , dès 18h30 (heure Française) sur notre page...

Nvidia Logo

Nvidia annonce un data center IA et des accords en Corée du Sud

8 Juin. 2026 • 18:06
0 Internet

Nvidia a profité de la visite à Séoul de son directeur général, Jensen Huang, pour poser les bases d’un chantier...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site