KultureGeek Science Anthropic affirme que Claude 3.5 est meilleur que GPT-4o (oui mais…)

Anthropic affirme que Claude 3.5 est meilleur que GPT-4o (oui mais…)

20 Juin. 2024 • 19:03
0

Anthropic, une société d’IA fondée par d’anciens d’OpenAI – à l’instar de la nouvelle startup SSI d’Ilian Sutskever – le claironne haut et fort : son dernier LLM Sonnet (ou Claude 3.5) « surpasse désormais les modèles concurrents sur les évaluations clés, à deux fois la vitesse de Claude 3 Opus (son ancien modèle phare) et un cinquième du coût ». De fait, si l’on s’en tien au tableau publié par Anthropic, Claude 3.5 Sonnet fait mieux que GPT-4o, et ce dans 4 catégories sur les 6 où le LLM d’OpenAI est représenté.

Claude 3,5 vs GPT-4°

Mais il y a tout de même un petit soucis, car il serait très facilement possible de manipuler à son avantage les résultats de benchs d’IA,  sans compter que dans le cas présent, le LLM d’OpenAI n’est pas évalué sur 3 des 9 benchmarks. Les scores entre les deux LLMs étant particulièrement serrés, rien ne dit que que GPT-40 ne repasserait pas devant. Par exemple, GPT-40 fait nettement mieux que Claude 3.5 pour la résolution de problèmes de maths (76,6% de bonnes réponses contre 71,1% pour Claude 3.5) mais il n’y a pas de benchs GPT-40 pour  la catégorie de tests « mathématique niveau études supérieures ».

Une chose semble tout de même globalement acquise, : Claude est revenu au niveau de GPT-40 dans sa version 3.5 Sonnet. De là à dire qu’il explose le LLM d’OpenAI, il y a tout de même une sacré marge….

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Fallout Saison 2 Lucy MacLean Ella Purnell

Fallout saison 2 : voici la bande-annonce et la date de sortie

19 Août. 2025 • 22:47
0 Geekeries

La série Fallout d’Amazon Prime Video revient avec une saison 2 attendue par les fans et la bande-annonce a été diffusée...

Call of Duty Black Ops 7 Soldats Armes

Call of Duty Black Ops 7 dévoile son trailer, sa date de sortie et sa bêta

19 Août. 2025 • 21:03
1 Jeux vidéo

Call of Duty: Black Ops 7 a eu le droit à une présentation lors de la Gamescom 2025. Ce fut l’occasion d’avoir la bande-annonce,...

Firefox Logo

Firefox 142 ajoute un aperçu des liens avec de l’IA et d’autres nouveautés

19 Août. 2025 • 20:04
0 Logiciels

Mozilla propose au téléchargement la version stable de Firefox 142. Cette mise à jour propose plusieurs nouveautés,...

Kirby Air Riders

Kirby Air Riders dévoile sa date de sortie et son prix sur Switch 2

19 Août. 2025 • 19:39
0 Jeux vidéo

Nintendo a dévoilé de nouvelles informations sur Kirby Air Riders, son prochain jeu exclusif pour la Switch 2, lors d’un Nintendo...

Hollow Knight Silksong

Hollow Knight: Silksong : un livestream daté pour le plus attendu des jeux indés

19 Août. 2025 • 18:23
0 Jeux vidéo

Enfin ! L’attente touche à sa fin pour les adeptes de Hollow Knight: Silksong. Team Cherry a annoncé une « annonce...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site