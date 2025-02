ByteDance, la société derrière TikTok, vient de dévoiler OmniHuman-1, une intelligence artificielle impressionnante capable de générer des vidéos longues et ultra-réalistes à partir d’une simple image. Contrairement aux applications existantes qui se limitent à quelques secondes d’animation, OmniHuman peut faire parler, bouger et chanter une personne à partir d’une unique photo, même si le cliché est mal cadré ou de faible qualité. L’IA a été entraînée sur 18 700 heures de vidéos de personnes en rain de parler et de bouger, et peut in fine reproduire avec précision des expressions faciales, des mouvements et des gestes naturels. L’un des exemples les plus impressionnants des capacités de l’IA montre Albert Einstein parlant avec un naturel effarant devant un tableau noir.



OmniHuman s’appuie sur une énorme base de données, incluant des vidéos issues de TikTok et de conférences comme TEDx, pour parvenir à ces résultats stupéfiants et à priori au dessus de tout ce que peut proposer la concurrence aujourd’hui. Cet outil pourrait bien sûr être utilisé pour des applications éducatives, mais son usage le plus probable reste la création de contenus sur TikTok (qui seront de facto extrêmement peu fiables, sachant qu’elles ne le sont déjà pas beaucoup). Sans surprise, cette avancée technologique soulève de nombreuses inquiétudes tant il deviendra possible de créer des vidéos aussi trompeuses qu’ultraréalistes.