KultureGeek Logiciels ChatGPT : en programmation, l’IA aurait tout faux une fois sur deux

ChatGPT : en programmation, l’IA aurait tout faux une fois sur deux

2 min.
24 Mai. 2024 • 20:08
4

Il est sans doute bon de rappeler que les IA ne sont toujours pas infaillibles. Loin s’en faut même si l’on en croit une étude de l’Université Purdue dans l’Indiana, qui conclut que ChatGPT répond incorrectement à des questions de programmation informatique 52 % du temps. Aie.

Intelligence Artificielle Cerveau Puce

Présentée à la conférence sur l’interaction homme-ordinateur à Hawaï, l’étude a analysé 517 questions de programmation issues de Stack Overflow, qui ont ensuite été traitées par ChatGPT. Les résultats, rapportés pour la première fois par Futurism, dévoilent des problèmes significatifs de précision avec le chatbot. « Notre analyse montre que 52 % des réponses de ChatGPT contiennent des informations incorrectes et 77 % sont verbeuses », explique l’étude. Mais il y a un soucis peut-être plus inquiétant encore : malgré les nombreuses erreurs de ChatGPT, 35% des participants (tous développeurs) à l’étude ont indiqué préférer les réponses de ChatGPT à cause de son exhaustivité et… de son phrasé bien articulé. Dans 39% des cas, les programmeurs ont même ignoré les réponses fausses.

Ces résultats indiquent que les IA ne sont pas prêtes à réellement remplacer les êtres humains pour nombres de tâches relativement complexes, mais ce n’est pas forcément une mauvaise nouvelle si cela doit pousser les géants de l’IA à mieux encadrer leur LLM et à favoriser la mise en place d’outils d’autoévaluation. On notera aussi que cette étude tombe au moment où l’IA Gemini de Google est accusée de produire de trop nombreuses réponses absurdes.

Les sujets liés à ces tags pourraient vous interesser

4 commentaires pour cet article :

  • Maverick
    Apres ChatGPT n’a pas ete entrainer dans ce but! Il faudtait se tourner vers un outils comme github copilot pour tester les capacites de l’IA a produire du code
    • John
      Si je ne me trompe pas, c’est tout le contraire. À la base cette IA avait été développée pour assister les développeurs dans le code et faciliter le développement. Le fait d’afficher des résultats aussi faible pose question. Pour ma part, chaque fois que j’en ai eu besoin pour du code, il m’a fait gagner un temps fou, à partir du moment où je lui ai posé mon prompt au complet et correctement.
  • Maxime
    Je suis et étonné de ce résultat. Jutilise chatgpt quasi quotidiennement pour lui demander des bout de codes HTML, CSS, TYPESCRIPT, JAVA, KOTLIN… et franchement il me fait gagner un temps fou ! En effet il se trompe souvent “un peu” mais apres 2, 3 ou 10 interraction avec lui il finnit par vous crasher un code convenable ! Peut etre que votre statistique est faussée car elle compte les résultats « juste du premier coup » ?

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Sora OpenAI Logos

OpenAI perd encore des dirigeants, dont le patron de Sora

18 Avr. 2026 • 9:00
0 Business

OpenAI voit partir deux dirigeants de plus au moment où l’entreprise démonte déjà une partie de son organisation...

deals promos

🔥 [#BonPlan] Les promos High-Tech du 17 avril

17 Avr. 2026 • 22:40
0 Promos

Chaque jour nous dénichons pour vous des promos sur les produits High-Tech pour vous faire économiser le plus d’argent possible. Voici...

Claude Anthropic Logo

L’IA Claude vérifie l’identité de certains avec une carte d’identité et un selfie

17 Avr. 2026 • 20:57
0 Internet

Anthropic a discrètement ajouté une page dédiée à la vérification d’identité pour son intelligence...

YouTube Logo

YouTube va afficher moins de pubs pendant les directs (live)

17 Avr. 2026 • 20:43
1 Internet

YouTube modifie sa gestion des publicités pour les vidéos en direct (live) afin d’éviter de casser les séquences...

Amazon Fire TV Stick HD 2026

Les futurs Fire TV Stick d’Amazon vont abandonner Android pour Vega OS

17 Avr. 2026 • 20:21
0 Matériel

Amazon ne se contente plus de tester Vega OS sur quelques produits : le groupe prépare désormais la transition de toute la gamme des Fire TV...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site