KultureGeek Internet Gemini 1.5 : l’IA de Google est capable d’écouter des fichiers audio

Gemini 1.5 : l’IA de Google est capable d’écouter des fichiers audio

9 Avr. 2024 • 20:59
0

Google a dévoilé Gemini 1.5, la nouvelle version de son IA, en février et détaille aujourd’hui la possibilité d’écouter des fichiers audio, comme des appels ou l’audio d’une vidéo. Cela permet de comprendre une information sans avoir obligatoirement un format écrit.

Google Gemini

Gemini 1.5 Pro est déjà aussi puissant que le modèle Ultra et a récemment bénéficié d’une amélioration significative : une fenêtre contextuelle pouvant contenir jusqu’à 1 million d’éléments. Cela signifie que vous pouvez lui fournir des prompts d’environ 700 000 mots, plus de 30 000 millions de lignes de code, 11 heures de contenu audio ou 1 heure de contenu vidéo.

Aujourd’hui, l’IA est disponible en test pour les utilisateurs professionnels via la plateforme de développement Vertex AI. Ils peuvent envoyer des fichiers audio de n’importe quel type et demander à l’IA des informations basées sur ces fichiers.

La prise en charge des fichiers audio ouvre de nombreuses portes. Pour les entretiens et les appels vidéo par exemple, cela peut améliorer la capacité à se souvenir des détails. Cette fonction facilite aussi la transcription.

Google a par ailleurs mis à jour Imagen 2, son modèle de génération d’images à partir d’un texte. Il prend désormais en charge l’inpainting et l’outpainting, qui permettent d’ajouter ou de retirer des objets d’une photo. Les images générées prendront également en charge le filigrane numérique SynthID. Il s’agit d’un autre produit Google qui ajoute un filigrane invisible aux images générées par l’IA afin d’en identifier l’origine.

Enfin, Google testera un moyen d’améliorer les réponses de l’IA avec son moteur de recherche afin que les réponses contiennent des informations actualisées.

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Mango Boutique Logo

Mango piraté : les données de clients français ont été volées

15 Oct. 2025 • 20:46
0 Internet

Mango, l’enseigne de prêt-à-porter pour femme, homme et enfant, annonce avoir fait l’objet d’un piratage par le biais...

Claude Logo

Claude Haiku 4.5 : Anthropic lance un modèle d’IA plus compact

15 Oct. 2025 • 20:12
0 Internet

Anthropic enrichit sa gamme avec Claude Haiku 4.5, la nouvelle version de son modèle d’intelligence artificielle le plus compact. Il promet...

CT Cha b exolune

James-Webb aurait capturé la naissance de lunes autour d’une exoplanète géante

15 Oct. 2025 • 19:23
0 Science

James Webb et ses merveilles. Le fantastique télescope spatial a de nouveau déniché la perle rare dans l’immensité du...

Google Veo 3.1

Veo 3.1 : Google améliore son outil de génération vidéo par IA et Flow

15 Oct. 2025 • 19:14
0 Internet

Google présente Veo 3.1, nouvelle version de son modèle de génération vidéo par intelligence artificielle. Cette mise...

Bouygues Telecom Orange Free SFR Logos

Rachat de SFR : Orange, Bouygues Telecom et Free maintiennent leur offre, malgré le rejet

15 Oct. 2025 • 18:35
0 Mobiles / Tablettes

Orange, Bouygues Telecom et Free ont réagi à la suite du rejet d’Altice pour le rachat de son opérateur SFR après...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site