TENDANCES
Comparateur
- AUTO
Le CEO de Google DeepMind, Demis Hassabis, a révélé dans le Podcast Possible que Google prévoyait de fusionner ses modèles d’IA Gemini avec Veo, sa technologie de génération vidéo, ce afin d’améliorer la « compréhension du monde physique » par Gemini. Conçu dès le départ comme un modèle multimodal, Gemini pourrait bien devenir cet “assistant numérique universel” capable d’aider les utilisateurs dans des tâches concrètes. Cette approche s’inscrit dans une tendance plus large de l’industrie de l’IA vers des modèles “omni” capables de traiter et de générer du texte, de l’audio, des images et des vidéos, une stratégie également suivie par OpenAI, Meta, Microsoft et Amazon.
Pour développer ces modèles polyvalents, une grande quantité de données de tous types est nécessaire. Hassabis a ainsi suggéré que YouTube, propriété de Google, puisse constituer une source d’entraînement pour Veo, notamment pour « apprendre » les lois de la physique à travers l’analyse des très nombreuses vidéos de la plateforme. Bien que Google ait déjà affirmé que seuls “certains” contenus YouTube sont utilisés pour entraîner ses modèles d’IA conformément aux accords en vigueur, l’entreprise aurait récemment élargi ses conditions d’utilisation pour faciliter un accès élargi à ces données.
SOURCETechcrunch
OpenAI, l’entreprise à l’origine de ChatGPT, repousse la sortie de son modèle d’intelligence artificielle open source,...
La Chine a réagi au sujet de l’enquête européenne qui vise TikTok, propriété du groupe chinois ByteDance,...
Orange a mené avec succès une série d’essais techniques sur son campus d’innovation Orange Gardens à...
Le premier trailer de Red Sonja, adaptation cinématographique du personnage culte de Dynamite Comics, vient d’être...
Et une preuve de plus que nous vivons en pleine dystopie : Grok 4, le nouveau modèle d’intelligence artificielle de xAI, a rapidement...