OpenAI a annoncé aujourd’hui GPT-4o, une nouvelle version de son modèle de langage qui se veut plus rapide que la version existante et qui a l’avantage d’être gratuite. En effet, GPT-4 nécessitait l’abonnement payant ChatGPT Plus, mais ce n’est pas nécessaire ici.
Présentation de GPT-4o
GPT-4o « est beaucoup plus rapide » et améliore « les capacités à travers le texte, la vision et l’audio », a déclaré Mira Murati, directrice de la technologie chez OpenAI. Ce sera gratuit pour tous les utilisateurs et les utilisateurs payants continueront à « avoir jusqu’à cinq fois les limites de capacité » des utilisateurs gratuits, a ajouté Mira Murati.
GPT-4o (« o » pour « omni ») est une étape vers une interaction humain-machine beaucoup plus naturelle. Il accepte en entrée toute combinaison de texte, de son et d’image et génère toute combinaison de texte, de son et d’image en sortie. Il peut répondre aux entrées audio en 232 millisecondes seulement, avec une moyenne de 320 millisecondes, ce qui est similaire au temps de réponse humain dans une conversation. Il égale les performances du GPT-4 Turbo pour les textes en anglais et en code, avec une amélioration significative pour les textes dans des langues autres que l’anglais, tout en étant beaucoup plus rapide et 50% moins cher dans l’API. GPT-4o est particulièrement performant en matière de vision et de compréhension audio par rapport aux modèles existants.
Le patron d’OpenAI, Sam Altman, ajoute que le modèle est « nativement multimodal », ce qui signifie qu’il peut générer du contenu ou comprendre des commandes vocales, textuelles ou visuelles.
Lors d’une démonstration en direct, les membres de l’équipe d’OpenAI ont discuté avec ChatGPT-4o en utilisant des commandes vocales naturelles. La voix de l’IA pouvait changer d’inflexion avec seulement quelques suggestions vocales de la part des personnes sur scène, y compris changer de ton pour que la voix soit plus dramatique ou même se transformer en une voix semblable à celle d’un robot.
Démonstrations de la nouvelle IA d’OpenAI
Voici plusieurs démonstrations :
Disponibilité
GPT-4o fait ses débuts aujourd’hui pour certains membres payants de ChatGPT. Le déploiement se fera progressivement pour tout le monde au fil des semaines, aussi bien pour les utilisateurs payants que pour les utilisateurs gratuits.
Sony Carte mémoire flash CFexpress 160 Go Rigide Type A - VPG400 High Speed Série G avec garantie de performance vidéo (lecture 800 Mo/s et écriture 700 Mo/s) - CEA-G160T
Brother VC-500W - Imprimante d'étiquettes Couleur - Wi-Fi - Modèle Compact - Rubans jusqu’à 50 mm de Large + Ruban d'étiquettes Original - 50 mm de Large
Philips R5505/10 Radio portable, Radio de cuisine (Bluetooth, Étui bois, Radio DAB+, Diaphragme 3 pouces à large bande, Minuteur de cuisine, Fonctionne sur réseau ou à piles - Modèle 2020/2021
Belkin Câble Lightning à Gaine Tressée (Câble Boost Charge Lightning vers USB pour iPhone, iPad, AirPods, Câble de Recharge Certifié MFi pour iPhone, Lightning (15 cm, Noir)
4 commentaires pour cet article :