OpenAI a annoncé aujourd’hui GPT-4o, une nouvelle version de son modèle de langage qui se veut plus rapide que la version existante et qui a l’avantage d’être gratuite. En effet, GPT-4 nécessitait l’abonnement payant ChatGPT Plus, mais ce n’est pas nécessaire ici.
Présentation de GPT-4o
GPT-4o « est beaucoup plus rapide » et améliore « les capacités à travers le texte, la vision et l’audio », a déclaré Mira Murati, directrice de la technologie chez OpenAI. Ce sera gratuit pour tous les utilisateurs et les utilisateurs payants continueront à « avoir jusqu’à cinq fois les limites de capacité » des utilisateurs gratuits, a ajouté Mira Murati.
GPT-4o (« o » pour « omni ») est une étape vers une interaction humain-machine beaucoup plus naturelle. Il accepte en entrée toute combinaison de texte, de son et d’image et génère toute combinaison de texte, de son et d’image en sortie. Il peut répondre aux entrées audio en 232 millisecondes seulement, avec une moyenne de 320 millisecondes, ce qui est similaire au temps de réponse humain dans une conversation. Il égale les performances du GPT-4 Turbo pour les textes en anglais et en code, avec une amélioration significative pour les textes dans des langues autres que l’anglais, tout en étant beaucoup plus rapide et 50% moins cher dans l’API. GPT-4o est particulièrement performant en matière de vision et de compréhension audio par rapport aux modèles existants.
Le patron d’OpenAI, Sam Altman, ajoute que le modèle est « nativement multimodal », ce qui signifie qu’il peut générer du contenu ou comprendre des commandes vocales, textuelles ou visuelles.
Lors d’une démonstration en direct, les membres de l’équipe d’OpenAI ont discuté avec ChatGPT-4o en utilisant des commandes vocales naturelles. La voix de l’IA pouvait changer d’inflexion avec seulement quelques suggestions vocales de la part des personnes sur scène, y compris changer de ton pour que la voix soit plus dramatique ou même se transformer en une voix semblable à celle d’un robot.
Démonstrations de la nouvelle IA d’OpenAI
Voici plusieurs démonstrations :
Disponibilité
GPT-4o fait ses débuts aujourd’hui pour certains membres payants de ChatGPT. Le déploiement se fera progressivement pour tout le monde au fil des semaines, aussi bien pour les utilisateurs payants que pour les utilisateurs gratuits.
Epson CO-W01 Video projecteur WXGA, HD Ready 16:10, Technologie 3LCD, 3000 Lumens, Connexion USB/HDMI, Correction Horizontale Verticale du trapèze, Haut-Parleur intégré, Projection jusqu'à 378”
Sennheiser Écouteurs Sport True Wireless - Écouteurs Intra-Auriculaires Bluetooth pour Mode de Vie Actif, Musique et Appel avec Acoustique Adaptable, réduction de Bruit et Batterie de 27 h
4 commentaires pour cet article :