Les IA génératives ont le vent en poupe, et il ne semble pas y avoir de limites à ce que ces algorithmes peuvent créer : textes, images, vidéos, musiques, et maintenant… de scènes 3D. Intel Labs et Blocklade Labs viennent en effet de dévoiler LDM3D (Latent Diffusion Model for 3D), une IA capable de générer des images 3D à partir de prompts textuels ! Les scènes 3D ainsi crées peuvent même être visualisées à 360 degrés tandis que les modèles 3D peuvent ensuite être récupérés dans des logiciels spécialisés (Maya, etc.), ce qui pourrait potentiellement intéresser de nombreux secteurs (jeux vidéo, architecture, logiciels VR ou XR, design industriel, etc.).

LDM3D s’est entrainé à partir de l’immense base de données LAION-400M, qui comme son nom l’indique contient plus de 400 millions d’images 3D. Le logiciel DepthFusion (développé conjointement par Intel Labs et Blocklade Labs) travaille de concert avec LDM3D afin de fusionner les photos 2D RGB avec des cartes de profondeur. Bien évidemment, la qualité des résultats obtenus dépendra principalement de la sophistication des prompts, comme cela est déjà le cas avec les IA génératrices d’images (Midjourney, DALL-E, etc.).