TENDANCES
Comparateur
- AUTO
Le CEO de Google DeepMind, Demis Hassabis, a révélé dans le Podcast Possible que Google prévoyait de fusionner ses modèles d’IA Gemini avec Veo, sa technologie de génération vidéo, ce afin d’améliorer la « compréhension du monde physique » par Gemini. Conçu dès le départ comme un modèle multimodal, Gemini pourrait bien devenir cet “assistant numérique universel” capable d’aider les utilisateurs dans des tâches concrètes. Cette approche s’inscrit dans une tendance plus large de l’industrie de l’IA vers des modèles “omni” capables de traiter et de générer du texte, de l’audio, des images et des vidéos, une stratégie également suivie par OpenAI, Meta, Microsoft et Amazon.
Pour développer ces modèles polyvalents, une grande quantité de données de tous types est nécessaire. Hassabis a ainsi suggéré que YouTube, propriété de Google, puisse constituer une source d’entraînement pour Veo, notamment pour « apprendre » les lois de la physique à travers l’analyse des très nombreuses vidéos de la plateforme. Bien que Google ait déjà affirmé que seuls “certains” contenus YouTube sont utilisés pour entraîner ses modèles d’IA conformément aux accords en vigueur, l’entreprise aurait récemment élargi ses conditions d’utilisation pour faciliter un accès élargi à ces données.
SOURCETechcrunch
Jon Bernthal enfilera à nouveau le costume du Punisher, alias Frank Castle, dans le prochain film Marvel et Sony, Spider-Man : Brand New Day,...
Deezer a annoncé le lancement du premier système d’étiquetage pour signaler les albums contenant des musiques...
Lors de son audition devant la commission d’enquête de l’Assemblée nationale sur les effets psychologiques de TikTok sur les...
Depuis le début du mois, la fonctionnalité Microsoft Family Safety, utilisée par les parents et les écoles pour...
WhatsApp a récemment annoncé l’arrivée de publicités pour la fonction Statut au niveau de l’onglet «...