KultureGeek Science Anthropic affirme que Claude 3.5 est meilleur que GPT-4o (oui mais…)

Science

Anthropic affirme que Claude 3.5 est meilleur que GPT-4o (oui mais…)

2 min.

20 Juin. 2024 • 19:03

0

Anthropic, une société d’IA fondée par d’anciens d’OpenAI – à l’instar de la nouvelle startup SSI d’Ilian Sutskever – le claironne haut et fort : son dernier LLM Sonnet (ou Claude 3.5) « surpasse désormais les modèles concurrents sur les évaluations clés, à deux fois la vitesse de Claude 3 Opus (son ancien modèle phare) et un cinquième du coût ». De fait, si l’on s’en tien au tableau publié par Anthropic, Claude 3.5 Sonnet fait mieux que GPT-4o, et ce dans 4 catégories sur les 6 où le LLM d’OpenAI est représenté.

Claude 3,5 vs GPT-4°

Mais il y a tout de même un petit soucis, car il serait très facilement possible de manipuler à son avantage les résultats de benchs d’IA, sans compter que dans le cas présent, le LLM d’OpenAI n’est pas évalué sur 3 des 9 benchmarks. Les scores entre les deux LLMs étant particulièrement serrés, rien ne dit que que GPT-40 ne repasserait pas devant. Par exemple, GPT-40 fait nettement mieux que Claude 3.5 pour la résolution de problèmes de maths (76,6% de bonnes réponses contre 71,1% pour Claude 3.5) mais il n’y a pas de benchs GPT-40 pour la catégorie de tests « mathématique niveau études supérieures ».

Une chose semble tout de même globalement acquise, : Claude est revenu au niveau de GPT-40 dans sa version 3.5 Sonnet. De là à dire qu’il explose le LLM d’OpenAI, il y a tout de même une sacré marge….

Signaler une erreur dans le texte

Vous utilisez Google Actualités ? Suivez KultureGeek pour ne rien rater de l'actu High-Tech ! Icône Google Actualités

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Fils des commentaires

Quelques règles à respecter :

1. Restez dans le sujet de l'article
2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles

Les derniers articles

Starlink Satellite déploiement

Spectaculaire : un déploiement de satellites Starlink filmé depuis l’un des satellites !

8 Mai. 2026 • 15:30

0 Internet

SpaceX a publié une séquence spectaculaire filmée non pas depuis une fusée, mais depuis l’un de ses satellites Starlink...

DeepL, le concurrent de Google Traduction, licencie 25 % de ses employés pour miser sur l’IA

8 Mai. 2026 • 14:10

0 Business

DeepL, le concurrent de Google Traduction, va supprimer environ 250 postes, soit un quart de ses effectifs. Le groupe ne présente pas cette...

Robot moine bouddhiste

En Corée du Sud, un robot humanoïde est ordonné moine bouddhiste juste avant l’anniversaire de Bouddha

8 Mai. 2026 • 13:05

0 Science

Qui a dit que la spiritualité était incompatible avec la technologie la plus avancée ? Pas les moines de Séoul en tout cas...

Paranormal Activity Threshold

Paranormal Activity Threshold annulé : le jeu d’horreur de Brian Clarke ne verra finalement pas le jour

8 Mai. 2026 • 11:45

0 Jeux vidéo

Mauvaise nouvelle pour les amateurs d’horreur interactive : Paranormal Activity: Threshold est officiellement annulé. Annoncé en 2024,...

PS5 Pro PlayStation 5 Couchee et Manette DualSense

Résultats : les ventes de PS5 chutent de 46 % suite aux augmentations de tarifs

8 Mai. 2026 • 10:30

0 Jeux vidéo

Les arbres ne montent pas au ciel : malgré l’attachement d’une large partie des joueurs à la marque et malgré aussi une...

Produits Hi-Tech
Applications
Films iTunes

image produit Philips Sonicare DiamondClean Prestige 9900 - brosse à dents électrique avec 1 tête de brosse A3 Premium tout-en-un et un boîtier de charge couleur perle (modèle HX9992/11)

Philips Sonicare DiamondClean Prestige 9900 - brosse à dents électrique avec 1 tête de brosse A3 Premium tout-en-un et un boîtier de charge couleur perle (modèle HX9992/11)

230€

208€

@Amazon voir l'offre

image produit PHILIPS Air Fryer Série 3000 6.2L, air fryer 14 en 1, Technologie Rapid Air, jusqu'à 90% de matières grasses en moins, Digital, App HomeID (HD9270/90)

PHILIPS Air Fryer Série 3000 6.2L, air fryer 14 en 1, Technologie Rapid Air, jusqu'à 90% de matières grasses en moins, Digital, App HomeID (HD9270/90)

58€

50€

@Amazon voir l'offre

image produit Arlo Batterie Rechargeable, Blanc, Compatible avec ranges Pro 3, 4, 5, 6 et Ultra 2, 3 Camera Surveillance WiFi - Accessoire Certifie Arlo, VMA5400 (Lot de 2)

Arlo Batterie Rechargeable, Blanc, Compatible avec ranges Pro 3, 4, 5, 6 et Ultra 2, 3 Camera Surveillance WiFi - Accessoire Certifie Arlo, VMA5400 (Lot de 2)

210€

66€

@Amazon voir l'offre

image produit Sigma Bouchon Avant d'objectif Diamètre 82mm Noir Compatible Canon EF Protège Le Verre de l'objectif (Lot de 2)

Sigma Bouchon Avant d'objectif Diamètre 82mm Noir Compatible Canon EF Protège Le Verre de l'objectif (Lot de 2)

260€

22€

@Amazon voir l'offre

image produit Corsair iCUE SP120 RGB ELITE Performance 120 mm Kit de Trois Ventilateurs avec iCUE Lighting Node CORE (Technologie CORSAIR AirGuide, Huit LED RGB Paramétrables, Silencieux niveau sonore 18 dBA) Blanc

Corsair iCUE SP120 RGB ELITE Performance 120 mm Kit de Trois Ventilateurs avec iCUE Lighting Node CORE (Technologie CORSAIR AirGuide, Huit LED RGB Paramétrables, Silencieux niveau sonore 18 dBA) Blanc

56€

48€

@Amazon voir l'offre

image produit Support sécurisé avec porte-clés Belkin pour AirTag Noir

Support sécurisé avec porte-clés Belkin pour AirTag Noir

13€

8€

@Amazon voir l'offre

image produit D-Link DES-1016D Switch 16 Ports Ethernet 10/100mbps - Idéal Partage de Connexion et Mise en Réseau Small/Home Office

D-Link DES-1016D Switch 16 Ports Ethernet 10/100mbps - Idéal Partage de Connexion et Mise en Réseau Small/Home Office

46€

18€

@Amazon voir l'offre

image produit D-Link DGS-1026MP Switch Web Manageable 26 Ports Gigabit POE+ 10/100/1000mbps - Idéal pour Entreprise Administration et Réseaux Gérés

D-Link DGS-1026MP Switch Web Manageable 26 Ports Gigabit POE+ 10/100/1000mbps - Idéal pour Entreprise Administration et Réseaux Gérés

349€

307€

@Amazon voir l'offre

image produit Razer Kraken X - Casque de jeu filaire multiplateforme (Confort Ultra-Légère, On Positionnel Clair Et Précis, Ultra-Légère, Commande Audio Pratique, Compatibilité Entre Platesformes) Mercure

Razer Kraken X - Casque de jeu filaire multiplateforme (Confort Ultra-Légère, On Positionnel Clair Et Précis, Ultra-Légère, Commande Audio Pratique, Compatibilité Entre Platesformes) Mercure

56€

46€

@Amazon voir l'offre

image produit Datacolor Spyder X Elite – Un étalonnage moniteur conçu pour les photographes et vidéastes experts et professionnels

Datacolor Spyder X Elite – Un étalonnage moniteur conçu pour les photographes et vidéastes experts et professionnels

253€

210€

@Amazon voir l'offre

Voir tous les bons plans Hi-Tech en live

[#BonPlan] Les promos High-Tech du 6 mai

icone Coran Pro Audio, Sans Internet

Coran Pro Audio, Sans Internet

Références

5,99 €

Gratuit

voir l'offre

Vandals

Jeux

3,99 €

1,99 €

voir l'offre

icone Homo Machina

Homo Machina

Jeux

2,99 €

1,49 €

voir l'offre

icone Anémomètre: Vitesse du vent

Anémomètre: Vitesse du vent

Météo

5,99 €

2,99 €

voir l'offre

icone Altimètre GPS altitude réelle

Altimètre GPS altitude réelle

Navigation

5,99 €

2,99 €

voir l'offre

icone Indice UV - Rayons du soleil

Indice UV - Rayons du soleil

Météo

3,99 €

2,99 €

voir l'offre

icone Thermomètre: Température

Thermomètre: Température

Météo

2,99 €

1,99 €

voir l'offre

icone Baromètre - Pression Air

Baromètre - Pression Air

Météo

7,99 €

2,99 €

voir l'offre

icone Hygromètre - Humidité de l'air

Hygromètre - Humidité de l'air

Météo

3,99 €

2,99 €

voir l'offre

icone DayCalc Pro - Calculatrice HD

DayCalc Pro - Calculatrice HD

Utilitaires

0,99 €

Gratuit

voir l'offre

Voir toutes les promos sur les apps

Affiche du film Ella McCay

Ella McCay

Comédie

9,99€

4,99€

voir l'offre

Affiche du film Hot Milk

Hot Milk

Romance

11,99€

4,99€

voir l'offre

Affiche du film Les indomptés

Les indomptés

Romance

11,99€

4,99€

voir l'offre

Affiche du film Moi, Christiane F., 13 ans, droguée, prostituée

Moi, Christiane F., 13 ans, droguée, prostituée

Drame

11,99€

4,99€

voir l'offre

Affiche du film Black Flies

Black Flies

Drame

9,99€

4,99€

voir l'offre

Affiche du film Le dernier empereur

Le dernier empereur

Action et aventure

9,99€

4,99€

voir l'offre

Affiche du film La Proie d'une ombre

La Proie d'une ombre

Horreur

13,99€

4,99€

voir l'offre

Affiche du film Billie Holiday, une affaire d'état

Billie Holiday, une affaire d'état

Drame

9,99€

4,99€

voir l'offre

Voir tous les films iTunes en promo

Les dernières actus Apple sur iPhoneAddict :

Tous les articles

image de l'article Brevet : Apple prépare les futures Vision Pro et lunettes connectées avec une optique plus légère et plus précise

Brevet : Apple prépare les futures Vision Pro et lunettes connectées avec une optique plus légère et plus précise

8 May. 2026 • 15:30

image de l'article Grok est disponible sur Apple CarPlay avec son mode vocal IA

Grok est disponible sur Apple CarPlay avec son mode vocal IA

8 May. 2026 • 15:20

image de l'article App Store : Rave attaque Apple en justice après le retrait de son app de « watch party »

App Store : Rave attaque Apple en justice après le retrait de son app de « watch party »

8 May. 2026 • 14:10

image de l'article Apple TV commande Disavowed, un thriller d’espionnage avec James Marsden en vedette

Apple TV commande Disavowed, un thriller d’espionnage avec James Marsden en vedette

8 May. 2026 • 12:40