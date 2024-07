Microsoft a achevé le développement de VALL-E 2, un générateur de voix par IA si sophistiqué que ce dernier est jugé dangereux pour le libre accès en raison de sa capacité à imiter de manière convaincante les voix humaines. En conséquence, le modèle sera limité à des fins de recherche uniquement. VALL-E 2, un modèle de langage neural, peut effectuer une synthèse vocale « zero-shot », c’est à dire en utilisant des bibliothèques d’entraînement extensives afin de générer des discours pour des voix qu’il n’a pas été explicitement formé à reproduire, en incorporant des variations de prononciation et d’intonation.

Les chercheurs de Microsoft Research Asia affirment que VALL-E 2 a atteint la « parité humaine » en génération vocale, ce qui est évidemment une avancé technologique considérable dans le secteur des IA vocales. Cette capacité à reproduire sans faille les voix humaines génère évidemment de fortes préoccupations concernant une potentielle utilisation abusive de ce type d’IA, comme la falsification d’identification vocale ou l’usurpation d’identité, ce qui incite Microsoft à ne pas l’incorporer dans des produits ni à en étendre l’accès public. Les applications de ce modèle dans le secteurs de l’éducation ou du divertissement sont déjà reconnues, mais les implications éthiques et les risques d’abus l’emporteraient largement sur les avantages.

VALL-E 2 restera donc sous un contrôle strict, permettant à Microsoft d’explorer ses capacités tout en assurant des garde-fous éthiques. L’équipe en charge de ce projet souligne l’importance du consentement de la voix synthétisée et la nécessité d’un protocole de détection pour prévenir les usages non autorisés. Cette approche prudente, encore plutôt rare, reflète des préoccupations beaucoup plus larges au sein de l’industrie de la tech concernant l’utilisation éthique de l’IA, en particulier pour la création de contenus trompeurs ou dans les secteurs où l’IA pourrait remplacer à terme des emplois humains.