OpenAI a annoncé aujourd’hui GPT-4o, une nouvelle version de son modèle de langage qui se veut plus rapide que la version existante et qui a l’avantage d’être gratuite. En effet, GPT-4 nécessitait l’abonnement payant ChatGPT Plus, mais ce n’est pas nécessaire ici.
Présentation de GPT-4o
GPT-4o « est beaucoup plus rapide » et améliore « les capacités à travers le texte, la vision et l’audio », a déclaré Mira Murati, directrice de la technologie chez OpenAI. Ce sera gratuit pour tous les utilisateurs et les utilisateurs payants continueront à « avoir jusqu’à cinq fois les limites de capacité » des utilisateurs gratuits, a ajouté Mira Murati.
GPT-4o (« o » pour « omni ») est une étape vers une interaction humain-machine beaucoup plus naturelle. Il accepte en entrée toute combinaison de texte, de son et d’image et génère toute combinaison de texte, de son et d’image en sortie. Il peut répondre aux entrées audio en 232 millisecondes seulement, avec une moyenne de 320 millisecondes, ce qui est similaire au temps de réponse humain dans une conversation. Il égale les performances du GPT-4 Turbo pour les textes en anglais et en code, avec une amélioration significative pour les textes dans des langues autres que l’anglais, tout en étant beaucoup plus rapide et 50% moins cher dans l’API. GPT-4o est particulièrement performant en matière de vision et de compréhension audio par rapport aux modèles existants.
Le patron d’OpenAI, Sam Altman, ajoute que le modèle est « nativement multimodal », ce qui signifie qu’il peut générer du contenu ou comprendre des commandes vocales, textuelles ou visuelles.
Lors d’une démonstration en direct, les membres de l’équipe d’OpenAI ont discuté avec ChatGPT-4o en utilisant des commandes vocales naturelles. La voix de l’IA pouvait changer d’inflexion avec seulement quelques suggestions vocales de la part des personnes sur scène, y compris changer de ton pour que la voix soit plus dramatique ou même se transformer en une voix semblable à celle d’un robot.
Démonstrations de la nouvelle IA d’OpenAI
Voici plusieurs démonstrations :
Disponibilité
GPT-4o fait ses débuts aujourd’hui pour certains membres payants de ChatGPT. Le déploiement se fera progressivement pour tout le monde au fil des semaines, aussi bien pour les utilisateurs payants que pour les utilisateurs gratuits.
Corsair Vengeance RGB PRO SL 32GB (2x16GB) DDR4 3200MHz C16, Kit de mémoire de bureau éclairé (10 LEDs RGB adressables individuellement, optimisé pour la bande passante et les temps de réponse) Noir
Jabra Speak 510 Haut Parleur – Enceinte Portable Conférence Certifiée Unified Communications avec USB – Connectivité avec Ordinateurs Portables, Smartphones et Tablettes
Belkin Chargeur USB C GaN 70W avec 2 Ports USB-C et 1 Port USB-A, Fiches Électriques pour UE/R.-U. / É.-U., Recharge Rapide pour MacBook, iPhone, iPad Pro, Samsung Galaxy, Google Pixel, etc - Blanc
Bundle Fly More DJI Mini 5 Pro avec DJI RC-N3, Certifié C0, Drone avec caméra, CMOS 1 Pouce, Drone 4K pour débutants avec détection d'obstacles omnidirectionnelle, ActiveTrack 360°, 3 Batteries
ASUS ProArt Display PA32QCV, Moniteur Professionnel de 31,5 Pouces 6 K IPS (6016 x 3384), 60 Hz, 5 ms (GTG) Temps de réponse, 98% DCI-P3, Color Accuracy ΔE < 2, Ports Thunderbolt 4, HDMI, DisplayPort
4 commentaires pour cet article :