TENDANCES
Comparateur
- AUTO
Microsoft a achevé le développement de VALL-E 2, un générateur de voix par IA si sophistiqué que ce dernier est jugé dangereux pour le libre accès en raison de sa capacité à imiter de manière convaincante les voix humaines. En conséquence, le modèle sera limité à des fins de recherche uniquement. VALL-E 2, un modèle de langage neural, peut effectuer une synthèse vocale « zero-shot », c’est à dire en utilisant des bibliothèques d’entraînement extensives afin de générer des discours pour des voix qu’il n’a pas été explicitement formé à reproduire, en incorporant des variations de prononciation et d’intonation.

Les chercheurs de Microsoft Research Asia affirment que VALL-E 2 a atteint la « parité humaine » en génération vocale, ce qui est évidemment une avancé technologique considérable dans le secteur des IA vocales. Cette capacité à reproduire sans faille les voix humaines génère évidemment de fortes préoccupations concernant une potentielle utilisation abusive de ce type d’IA, comme la falsification d’identification vocale ou l’usurpation d’identité, ce qui incite Microsoft à ne pas l’incorporer dans des produits ni à en étendre l’accès public. Les applications de ce modèle dans le secteurs de l’éducation ou du divertissement sont déjà reconnues, mais les implications éthiques et les risques d’abus l’emporteraient largement sur les avantages.

VALL-E 2 restera donc sous un contrôle strict, permettant à Microsoft d’explorer ses capacités tout en assurant des garde-fous éthiques. L’équipe en charge de ce projet souligne l’importance du consentement de la voix synthétisée et la nécessité d’un protocole de détection pour prévenir les usages non autorisés. Cette approche prudente, encore plutôt rare, reflète des préoccupations beaucoup plus larges au sein de l’industrie de la tech concernant l’utilisation éthique de l’IA, en particulier pour la création de contenus trompeurs ou dans les secteurs où l’IA pourrait remplacer à terme des emplois humains.
Le bras de fer juridique entre Meta et la Commission européenne pour les données de Facebook prend une tournure personnelle devant la plus...
PICO, la marque XR du groupe ByteDance (l’éditeur de TikTok), s’apprête à lancer en 2026 un casque de...
L’Agence nationale de sécurité sanitaire de l’alimentation, de l’environnement et du travail (Anses) vient de rendre un...
Le fabricant singapourien FoloToy a remis en rayon son ourson connecté Kumma, un jouet présenté comme un compagnon ludique pour les...
Nouvelle étape majeure pour l’aéronautique : la NASA a publié les images du tout premier vol du X-59, son démonstrateur...