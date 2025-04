Le CEO de Google DeepMind, Demis Hassabis, a révélé dans le Podcast Possible que Google prévoyait de fusionner ses modèles d’IA Gemini avec Veo, sa technologie de génération vidéo, ce afin d’améliorer la « compréhension du monde physique » par Gemini. Conçu dès le départ comme un modèle multimodal, Gemini pourrait bien devenir cet “assistant numérique universel” capable d’aider les utilisateurs dans des tâches concrètes. Cette approche s’inscrit dans une tendance plus large de l’industrie de l’IA vers des modèles “omni” capables de traiter et de générer du texte, de l’audio, des images et des vidéos, une stratégie également suivie par OpenAI, Meta, Microsoft et Amazon.

Pour développer ces modèles polyvalents, une grande quantité de données de tous types est nécessaire. Hassabis a ainsi suggéré que YouTube, propriété de Google, puisse constituer une source d’entraînement pour Veo, notamment pour « apprendre » les lois de la physique à travers l’analyse des très nombreuses vidéos de la plateforme. Bien que Google ait déjà affirmé que seuls “certains” contenus YouTube sont utilisés pour entraîner ses modèles d’IA conformément aux accords en vigueur, l’entreprise aurait récemment élargi ses conditions d’utilisation pour faciliter un accès élargi à ces données.