KultureGeek Logiciels VALL-E : Microsoft dévoile une IA capable de reproduire le timbre et les nuances de la voix humaine

VALL-E : Microsoft dévoile une IA capable de reproduire le timbre et les nuances de la voix humaine

11 Jan. 2023 • 10:51
0

C’est peu dire que Microsoft croit fortement au potentiel des IA conversationnelles. La firme de Redmond s’apprête à placer du GPT (ChatGPT) dans tous ses logiciels y compris dans son moteur de recherche Bing, et investirait près de 10 milliards de dollars dans OpenAI, la société (créée par Elon Musk) à l’origine de ChatGPT. Microsoft travaille aussi en interne sur ses propres IA, à l’instar de VALL-E, un programme d’apprentissage automatique (machine learning) capable d’imiter à la perfection le timbre et les nuances d’une voix humaine. L’IA peut même reproduire l’environnement sonore de la voix (par exemple une voix dans un espace avec écho).

VALL-E est « un modèle de langage de codec neuronal » basé sur la technologie de compression audio EnCodec créée par… Meta ! Cette IA s’est formée à partir de l’énorme banque de données sonores LibriLight, soit 60 000 heures d’enregistrements (en anglais) de voix en provenance de 7000 personnes. VALL-E est tellement performant que Microsoft craint déjà les dérives (par exemple la copie de voix de célébrités) et n’a pas jugé bon de rendre le projet Open Source.

Il n’y a pas un gros chemin intellectuel à faire pour imaginer un mariage de raison entre ChatGPT et VALL-E, ce qui nous rapprocherait vraiment du film Her (que l’on vous recommande chaudement). En revanche, il ne faudra pas compter pouvoir disposer un jour d’une IA compagnon qui serait même capable d’exprimer des émotions voire des sentiments vis à vis de l’utilisateur (comme dans le film Her justement) : le puritanisme de l’époque et la prudence quasi paranoïaque des grosses firmes face au risque du moindre dérapage (qui peut se finir en procès) font que ces supers IA seront probablement uniquement destinées à être des Jarvis 2.0, et rien d’autre.

Les sujets liés à ces tags pourraient vous interesser

Désolé, les commentaires sont fermés.

Les derniers articles

Loi ecrans et reseaux sociaux

Loi écrans et réseaux sociaux : le Sénat durcit le ton pour protéger les mineurs, de l’école aux plateformes

19 Déc. 2025 • 9:56
0 Internet

Le 18 décembre 2025, le Sénat a adopté en première lecture une proposition de loi qui vise à mieux protéger les...

Icône de l'application YouTube

YouTube supprime des chaînes qui génèrent de fausses bandes-annonces de films par IA

18 Déc. 2025 • 20:36
0 Internet

YouTube vient de fermer définitivement les chaînes de Screen Culture et KH Studio, deux poids lourds de la plateforme qui cumulaient plus de...

Free Logo

Free Mobile va proposer l’eSIM sur d’autres montres connectées, après l’Apple Watch

18 Déc. 2025 • 20:13
0 Mobiles / Tablettes

Free Mobile propose depuis peu l’option eSIM sur Apple Watch, mais pas encore sur les autres montres connectées sous Wear OS. Il ne faut...

Telecommande Wii

Après 15 ans, Nintendo remporte son procès pour la manette Wii

18 Déc. 2025 • 19:44
0 Matériel

La justice allemande a tranché en faveur de Nintendo dans son litige historique contre Nacon (ex-BigBen) concernant la contrefaçon de la...

Ray3 Modify

Luma dévoile Ray3 Modify, un générateur de vidéos qui permet de modifier à la volée les séquences créées

18 Déc. 2025 • 18:31
0 Logiciels

La startup Luma, spécialisée dans la génération vidéo et 3D par intelligence artificielle (et soutenue par a16z),...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site