Telles des génies sorties de leur lampe, les IA vont-elles bientôt pouvoir exaucer tous nos souhaits ? Après les IA textuelles et désormais multimodales à la façon d’un ChatGPT, après les IA génératrices d’images à partir de texte comme Midjourney, Stable Diffusion, Dall-E ou Leonardo AI, voilà que les IA génératrices de vidéo à partir de texte sortent à leur tour du bois.

Runway Gen-1 nécessite encore un support visuel

Si l’on veut être pointilleux et précis, ces IA existent déjà, mais à un stade quasi expérimental et pour des résultats toujours très erratiques ou étranges. Le text-to-video est donc déjà possible mais pas vraiment au point…jusqu’à Runway Gen-2 la nouvelle version de l’IA générative de la société Runway Research, à qui l’on doit déjà le formidable Stable Diffusion (text-to-image). La Gen-1 diffusée en février permet déjà de générer des vidéos à partir d’une vidéo de référence (comme un mode post-prod assisté par IA en quelque sorte), mais la Gen-2 promet d’aller beaucoup plus loin, avec notamment des vidéos créées uniquement à partir de prompts textuels (comme avec Midjourney donc, mais le résultat est une animation) !

Generate videos with nothing but words. If you can say it, now you can see it.

Introducing, Text to Video. With Gen-2.

Learn more at https://t.co/PsJh664G0Q pic.twitter.com/6qEgcZ9QV4

— Runway (@runwayml) March 20, 2023