TENDANCES
Comparateur
- AUTO
Google a dévoilé Gemini 1.5, la nouvelle version de son IA, en février et détaille aujourd’hui la possibilité d’écouter des fichiers audio, comme des appels ou l’audio d’une vidéo. Cela permet de comprendre une information sans avoir obligatoirement un format écrit.

Gemini 1.5 Pro est déjà aussi puissant que le modèle Ultra et a récemment bénéficié d’une amélioration significative : une fenêtre contextuelle pouvant contenir jusqu’à 1 million d’éléments. Cela signifie que vous pouvez lui fournir des prompts d’environ 700 000 mots, plus de 30 000 millions de lignes de code, 11 heures de contenu audio ou 1 heure de contenu vidéo.
Aujourd’hui, l’IA est disponible en test pour les utilisateurs professionnels via la plateforme de développement Vertex AI. Ils peuvent envoyer des fichiers audio de n’importe quel type et demander à l’IA des informations basées sur ces fichiers.
La prise en charge des fichiers audio ouvre de nombreuses portes. Pour les entretiens et les appels vidéo par exemple, cela peut améliorer la capacité à se souvenir des détails. Cette fonction facilite aussi la transcription.
Google a par ailleurs mis à jour Imagen 2, son modèle de génération d’images à partir d’un texte. Il prend désormais en charge l’inpainting et l’outpainting, qui permettent d’ajouter ou de retirer des objets d’une photo. Les images générées prendront également en charge le filigrane numérique SynthID. Il s’agit d’un autre produit Google qui ajoute un filigrane invisible aux images générées par l’IA afin d’en identifier l’origine.
Enfin, Google testera un moyen d’améliorer les réponses de l’IA avec son moteur de recherche afin que les réponses contiennent des informations actualisées.
Le géant chinois de la fast-fashion Shein a évité de justesse une suspension de ses activités en France en purgeant son site...
De nombreux utilisateurs ont cru à une panne majeure de YouTube en découvrant une page blanche à la place de leurs contenus...
Free Mobile a passé un cap : il devient l’opérateur avec le plus d’antennes 3G. Il dépasse ainsi Orange, SFR et Bouygues...
Amazon a annoncé le lancement de Kindle Translate, un nouveau service de traduction par intelligence artificielle destiné aux auteurs...
Décidément, c’est l’heure des reports. Presque simultanément à l’annonce du report de GTA VI par Rockstar...