OpenAI a annoncé aujourd’hui GPT-4o, une nouvelle version de son modèle de langage qui se veut plus rapide que la version existante et qui a l’avantage d’être gratuite. En effet, GPT-4 nécessitait l’abonnement payant ChatGPT Plus, mais ce n’est pas nécessaire ici.
Présentation de GPT-4o
GPT-4o « est beaucoup plus rapide » et améliore « les capacités à travers le texte, la vision et l’audio », a déclaré Mira Murati, directrice de la technologie chez OpenAI. Ce sera gratuit pour tous les utilisateurs et les utilisateurs payants continueront à « avoir jusqu’à cinq fois les limites de capacité » des utilisateurs gratuits, a ajouté Mira Murati.
GPT-4o (« o » pour « omni ») est une étape vers une interaction humain-machine beaucoup plus naturelle. Il accepte en entrée toute combinaison de texte, de son et d’image et génère toute combinaison de texte, de son et d’image en sortie. Il peut répondre aux entrées audio en 232 millisecondes seulement, avec une moyenne de 320 millisecondes, ce qui est similaire au temps de réponse humain dans une conversation. Il égale les performances du GPT-4 Turbo pour les textes en anglais et en code, avec une amélioration significative pour les textes dans des langues autres que l’anglais, tout en étant beaucoup plus rapide et 50% moins cher dans l’API. GPT-4o est particulièrement performant en matière de vision et de compréhension audio par rapport aux modèles existants.
Le patron d’OpenAI, Sam Altman, ajoute que le modèle est « nativement multimodal », ce qui signifie qu’il peut générer du contenu ou comprendre des commandes vocales, textuelles ou visuelles.
Lors d’une démonstration en direct, les membres de l’équipe d’OpenAI ont discuté avec ChatGPT-4o en utilisant des commandes vocales naturelles. La voix de l’IA pouvait changer d’inflexion avec seulement quelques suggestions vocales de la part des personnes sur scène, y compris changer de ton pour que la voix soit plus dramatique ou même se transformer en une voix semblable à celle d’un robot.
Démonstrations de la nouvelle IA d’OpenAI
Voici plusieurs démonstrations :
Disponibilité
GPT-4o fait ses débuts aujourd’hui pour certains membres payants de ChatGPT. Le déploiement se fera progressivement pour tout le monde au fil des semaines, aussi bien pour les utilisateurs payants que pour les utilisateurs gratuits.
Panasonic Lumix S Pro 16-35mm F4.0 | Objectif grand angle Plein Format S-R1635E (Ultra grand angle 16mm, Bague de débrayage clutch, Tropicalisé, Compact et léger, Noir – Compatible monture L
Apple iPhone 17 512 Go : Écran 6,3 pouces avec ProMotion, Puce A19, Caméra avant Center Stage, Meilleure résistance aux rayures, Autonomie d’une journée ; Lavande
Apple iPhone 17 Pro 512 Go : Écran 6,3 pouces avec ProMotion jusqu’à 120 Hz, Puce A19 Pro, Autonomie prodigieuse, Système caméra Pro Fusion avec caméra avant Center Stage ; Argent
Apple iPhone 17 Pro Max 512 Go : Écran 6,9 Pouces, Puce A19 Pro, Autonomie Record sur iPhone, Système caméra Pro Fusion, Caméra Avant Center Stage ; Bleu Intense
4 commentaires pour cet article :