KultureGeek Science Anthropic affirme que Claude 3.5 est meilleur que GPT-4o (oui mais…)

Science

Anthropic affirme que Claude 3.5 est meilleur que GPT-4o (oui mais…)

20 Juin. 2024 • 19:03

0

Anthropic, une société d’IA fondée par d’anciens d’OpenAI – à l’instar de la nouvelle startup SSI d’Ilian Sutskever – le claironne haut et fort : son dernier LLM Sonnet (ou Claude 3.5) « surpasse désormais les modèles concurrents sur les évaluations clés, à deux fois la vitesse de Claude 3 Opus (son ancien modèle phare) et un cinquième du coût ». De fait, si l’on s’en tien au tableau publié par Anthropic, Claude 3.5 Sonnet fait mieux que GPT-4o, et ce dans 4 catégories sur les 6 où le LLM d’OpenAI est représenté.

Claude 3,5 vs GPT-4°

Mais il y a tout de même un petit soucis, car il serait très facilement possible de manipuler à son avantage les résultats de benchs d’IA, sans compter que dans le cas présent, le LLM d’OpenAI n’est pas évalué sur 3 des 9 benchmarks. Les scores entre les deux LLMs étant particulièrement serrés, rien ne dit que que GPT-40 ne repasserait pas devant. Par exemple, GPT-40 fait nettement mieux que Claude 3.5 pour la résolution de problèmes de maths (76,6% de bonnes réponses contre 71,1% pour Claude 3.5) mais il n’y a pas de benchs GPT-40 pour la catégorie de tests « mathématique niveau études supérieures ».

Une chose semble tout de même globalement acquise, : Claude est revenu au niveau de GPT-40 dans sa version 3.5 Sonnet. De là à dire qu’il explose le LLM d’OpenAI, il y a tout de même une sacré marge….

Signaler une erreur dans le texte

Vous utilisez Google Actualités ? Suivez KultureGeek pour ne rien rater de l'actu High-Tech !

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Fils des commentaires

Quelques règles à respecter :

1. Restez dans le sujet de l'article
2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles

Les derniers articles

Fallout Saison 2 Lucy MacLean Ella Purnell

Fallout saison 2 : voici la bande-annonce et la date de sortie

19 Août. 2025 • 22:47

0 Geekeries

La série Fallout d’Amazon Prime Video revient avec une saison 2 attendue par les fans et la bande-annonce a été diffusée...

Call of Duty Black Ops 7 Soldats Armes

Call of Duty Black Ops 7 dévoile son trailer, sa date de sortie et sa bêta

19 Août. 2025 • 21:03

1 Jeux vidéo

Call of Duty: Black Ops 7 a eu le droit à une présentation lors de la Gamescom 2025. Ce fut l’occasion d’avoir la bande-annonce,...

Firefox 142 ajoute un aperçu des liens avec de l’IA et d’autres nouveautés

19 Août. 2025 • 20:04

0 Logiciels

Mozilla propose au téléchargement la version stable de Firefox 142. Cette mise à jour propose plusieurs nouveautés,...

Kirby Air Riders

Kirby Air Riders dévoile sa date de sortie et son prix sur Switch 2

19 Août. 2025 • 19:39

0 Jeux vidéo

Nintendo a dévoilé de nouvelles informations sur Kirby Air Riders, son prochain jeu exclusif pour la Switch 2, lors d’un Nintendo...

Hollow Knight Silksong

Hollow Knight: Silksong : un livestream daté pour le plus attendu des jeux indés

19 Août. 2025 • 18:23

0 Jeux vidéo

Enfin ! L’attente touche à sa fin pour les adeptes de Hollow Knight: Silksong. Team Cherry a annoncé une « annonce...

Produits Hi-Tech
Applications
Films iTunes

image produit Philips ampoule LED Standard E27 100W Blanc Chaud Dépolie, Verre, Lot de 2

Philips ampoule LED Standard E27 100W Blanc Chaud Dépolie, Verre, Lot de 2

12€

7€

@Amazon voir l'offre

image produit Samondra wall lantern anthracite 1x12W - livrable en France

Samondra wall lantern anthracite 1x12W - livrable en France

53€

43€

@Amazon 🇩🇪 voir l'offre

image produit Fractal Design Pop XL Silent Black Solid - livrable en France

Fractal Design Pop XL Silent Black Solid - livrable en France

116€

97€

@Amazon 🇩🇪 voir l'offre

image produit PÅ‚yta gÅ‚ówna ASRock Z790 PG Lightning - livrable en France

PÅ‚yta gÅ‚ówna ASRock Z790 PG Lightning - livrable en France

174€

152€

@Amazon 🇩🇪 voir l'offre

image produit JBL Quantum 100 – Casque gaming filaire avec micro détachable – Accessoire gamer léger et confortable – Compatible avec plusieurs plateformes – Couleur : Bleu

JBL Quantum 100 – Casque gaming filaire avec micro détachable – Accessoire gamer léger et confortable – Compatible avec plusieurs plateformes – Couleur : Bleu

29€

25€

@Amazon voir l'offre

image produit Smartphone Pas Cher Blackview A55 16GO 6.5 Pouces HD+ IPS 4780mAh 5MP+8MP Android 11 Quad-core Double SIM GPS - Noir - livrable en France

Smartphone Pas Cher Blackview A55 16GO 6.5 Pouces HD+ IPS 4780mAh 5MP+8MP Android 11 Quad-core Double SIM GPS - Noir - livrable en France

85€

71€

@Amazon 🇮🇹 voir l'offre

image produit Wacom Cintiq 16 & ExpressKey Remote Accessory (télécommande)

Wacom Cintiq 16 & ExpressKey Remote Accessory (télécommande)

600€

559€

@Amazon voir l'offre

image produit Flash Canon FLASH MACRO TWIN LITE MT-26EX-RT

Flash Canon FLASH MACRO TWIN LITE MT-26EX-RT

1179€

986€

@Amazon voir l'offre

image produit Logitech G203 LIGHTSYNC Souris Gaming avec Éclairage RVB Personnalisable, 6 Boutons Programmables, Capteur Niveau Gaming, 8000 PPP, Ultra-Léger, - Lila

Logitech G203 LIGHTSYNC Souris Gaming avec Éclairage RVB Personnalisable, 6 Boutons Programmables, Capteur Niveau Gaming, 8000 PPP, Ultra-Léger, - Lila

34€

20€

@Amazon voir l'offre

image produit JBL TUNE 225TWS – Écouteurs intra-auriculaires véritablement sans fil – Bluetooth – Autonomie jusqu'à 25 heures – Étui de recharge pratique et élégant – Couleur : bleu

JBL TUNE 225TWS – Écouteurs intra-auriculaires véritablement sans fil – Bluetooth – Autonomie jusqu'à 25 heures – Étui de recharge pratique et élégant – Couleur : bleu

100€

83€

@Amazon voir l'offre

Voir tous les bons plans Hi-Tech en live

[#BonPlan] Les promos High-Tech du 18 aout

$icone L\'App Météo alerte pour France$

L'App Météo alerte pour France

Météo

17,99 €

Gratuit

voir l'offre

icone The Marble Age

The Marble Age

Jeux

3,99 €

2,99 €

voir l'offre

icone VS – Visual Synthesizer

VS – Visual Synthesizer

Musique

14,99 €

7,49 €

voir l'offre

icone The Witness

The Witness

Jeux

9,99 €

5,99 €

voir l'offre

icone SAGA Synth | 16-Bit Sonic Fun!

SAGA Synth | 16-Bit Sonic Fun!

Musique

5,99 €

3,99 €

voir l'offre

icone Air Share - Transfert Wi-Fi

Air Share - Transfert Wi-Fi

Economie et entreprise

2,99 €

0,99 €

voir l'offre

icone ROD Multiplayer Conduite

ROD Multiplayer Conduite

Jeux

5,99 €

0,99 €

voir l'offre

icone Canvas SketchBook Pro

Canvas SketchBook Pro

Divertissement

2,99 €

Gratuit

voir l'offre

icone Dreamworld - Music Album

Dreamworld - Music Album

Musique

3,99 €

Gratuit

voir l'offre

icone Swiss3D Pro

Swiss3D Pro

Voyages

5,99 €

3,99 €

voir l'offre

Voir toutes les promos sur les apps

Affiche du film Benny & Joon

Benny & Joon

Comédie

9,99€

4,99€

voir l'offre

Affiche du film La cage aux folles

La cage aux folles

Films étrangers

9,99€

4,99€

voir l'offre

Affiche du film Manhattan

Manhattan

Classiques

9,99€

4,99€

voir l'offre

Affiche du film Petites princesses (a.k.a Filles de bonne famille)

Petites princesses (a.k.a Filles de bonne famille)

Comédie

9,99€

4,99€

voir l'offre

Affiche du film La blonde contre-attaque

La blonde contre-attaque

Comédie

9,99€

4,99€

voir l'offre

Affiche du film De Lovely

De Lovely

Drame

9,99€

4,99€

voir l'offre

Affiche du film Bananas

Bananas

Classiques

9,99€

4,99€

voir l'offre

Affiche du film Bill et Ted sauvent l’univers

Bill et Ted sauvent l’univers

Enfants / famille

9,99€

4,99€

voir l'offre

Voir tous les films iTunes en promo

Les dernières actus Apple sur iPhoneAddict :

Tous les articles

image de l'article iPhone 17 : Apple accélère sa production avec plusieurs usines en Inde

iPhone 17 : Apple accélère sa production avec plusieurs usines en Inde

19 Aug. 2025 • 20:48

image de l'article AirPods Pro 2 et AirPods 4 : nouvelle bêta du firmware disponible

AirPods Pro 2 et AirPods 4 : nouvelle bêta du firmware disponible

19 Aug. 2025 • 20:32

image de l'article Un iPhone en verre sans bordures suggéré par iOS 26 et l’interface Liquid Glass ?

Un iPhone en verre sans bordures suggéré par iOS 26 et l’interface Liquid Glass ?

19 Aug. 2025 • 19:15

image de l'article Coques iPhone 17 : Apple proposerait son remplaçant au FineWoven

Coques iPhone 17 : Apple proposerait son remplaçant au FineWoven

19 Aug. 2025 • 18:22