KultureGeek Hors-Sujet OpenAI (ChatGPT) annonce Voice Engine pour cloner les voix humaines

OpenAI (ChatGPT) annonce Voice Engine pour cloner les voix humaines

3 min.
29 Mar. 2024 • 19:51
0

OpenAI continue les annonces et dévoile aujourd’hui Voice Engine, un outil capable de recréer une voix humaine. Cela fait suite à la présentation récente de Sora, une intelligence artificielle pouvant créer des vidéos à l’aide d’un simple texte.

OpenAI Logo ChatGPT

Voice Engine pour recréer les voix humaines

En développement depuis environ deux ans, Voice Engine permet de mettre en ligne n’importe quel échantillon de voix de 15 secondes pour générer une copie synthétique de cette voix. Cela permet de « générer des voix naturelles qui ressemblent beaucoup à celles du locuteur d’origine. Il est remarquable qu’un petit modèle avec un seul échantillon de 15 secondes puisse créer des voix émotives et réalistes », dit OpenAI.

Voice Engine s’appuie sur le même modèle qui sous-tend les capacités vocales et de lecture à voix haute de ChatGPT, ainsi que les voix prédéfinies disponibles dans l’API de synthèse vocale d’OpenAI. Spotify l’utilise depuis le début du mois de septembre pour doubler en différentes langues les podcasts d’animateurs de premier plan.

OpenAI dit tester son nouvel outil de voix avec un petit groupe de partenaires qui ont identifié des utilisations potentielles telles que l’aide à la lecture, la traduction de contenu, le soutien aux personnes non verbales et l’aide aux personnes souffrant de troubles de la parole pour retrouver leur voix.

Plusieurs extraits audios sont disponibles sur le blog d’OpenAI. On découvre notamment qu’une voix peut être utilisée dans différentes langues. Par exemple, la langue maternelle du locateur est le français. Le clone vocal peut ensuite parler en anglais, en espagnol, en italien et d’autres langues, qu’importe le texte.

En ce qui concerne la traduction justement, OpenAI dit que Voice Engine préserve l’accent du locuteur original. Par exemple, si l’on génère de l’anglais à partir d’un échantillon audio provenant d’un locuteur français, on obtiendra un discours avec un accent français.

Des risques importants

Naturellement, un clone de la voix peut être très dangereux selon les usages, notamment avec les politiques et d’autres personnes publiques. Il est techniquement possible de faire tout et n’importe quoi, comme dire des mensonges. OpenAI le sait et réagit :

Nous sommes conscients que générer des discours qui ressemblent aux voix des gens comporte de sérieux risques, qui sont particulièrement présents à l’esprit en cette année électorale. Nous nous engageons avec des partenaires américains et internationaux issus du gouvernement, des médias, du divertissement, de l’éducation, de la société civile et d’ailleurs, afin de nous assurer que nous tenons compte de leurs commentaires au fur et à mesure que nous construisons.

OpenAI indique ne pas avoir encore prévu une disponibilité publique de Voice Engine. Comme Sora, la société veut seulement démontrer ce qu’elle peut faire.

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

PlayStation 4 Slim vs PlayStation 4 Pro et Manette

Sony pousse les joueurs PS4 à passer sur la PlayStation 5

1 Fév. 2026 • 9:00
5 Jeux vidéo

Sony envoie une notification directement sur les PlayStation 4 pour encourager les joueurs ayant encore cette console sortie en 2013 à acheter une...

Google Maps Logo Icone

Google Maps ajoute l’IA Gemini pour discuter à pied ou à vélo

31 Jan. 2026 • 9:00
1 Mobiles / Tablettes

Google déploie son assistant Gemini dans Maps pour accompagner les trajets à pied et à vélo. Cette mise à jour permet...

3G 4G 5G Logo

La 5G millimétrique n’intéresse pas les opérateurs français

30 Jan. 2026 • 20:53
5 Mobiles / Tablettes

La 5G millimétrique (mmWave), qui propose des débits vraiment très rapides, est au point mort en France. Jugée trop...

xreal-1s-1

XREAL déploie une fonction de conversion 3D en temps réel sur ses lunettes AR

30 Jan. 2026 • 18:40
1 Logiciels

La société chinoise XREAL enrichit les possibilités de ses appareils connectés en annonçant une fonctionnalité...

Femme Passant Un Appel Avec Un Téléphone Portable

Usurpation de numéros (spoofing) : l’Arcep ouvre une enquête contre les opérateurs

30 Jan. 2026 • 18:29
3 Mobiles / Tablettes

L’Arcep ouvre une enquête administrative ciblant l’ensemble des opérateurs français (Orange, SFR, Bouygues Telecom et Free...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site