KultureGeek Logiciels ChatGPT : en programmation, l’IA aurait tout faux une fois sur deux

ChatGPT : en programmation, l’IA aurait tout faux une fois sur deux

24 Mai. 2024 • 20:08
4

Il est sans doute bon de rappeler que les IA ne sont toujours pas infaillibles. Loin s’en faut même si l’on en croit une étude de l’Université Purdue dans l’Indiana, qui conclut que ChatGPT répond incorrectement à des questions de programmation informatique 52 % du temps. Aie.

Intelligence Artificielle Cerveau Puce

Présentée à la conférence sur l’interaction homme-ordinateur à Hawaï, l’étude a analysé 517 questions de programmation issues de Stack Overflow, qui ont ensuite été traitées par ChatGPT. Les résultats, rapportés pour la première fois par Futurism, dévoilent des problèmes significatifs de précision avec le chatbot. « Notre analyse montre que 52 % des réponses de ChatGPT contiennent des informations incorrectes et 77 % sont verbeuses », explique l’étude. Mais il y a un soucis peut-être plus inquiétant encore : malgré les nombreuses erreurs de ChatGPT, 35% des participants (tous développeurs) à l’étude ont indiqué préférer les réponses de ChatGPT à cause de son exhaustivité et… de son phrasé bien articulé. Dans 39% des cas, les programmeurs ont même ignoré les réponses fausses.

Ces résultats indiquent que les IA ne sont pas prêtes à réellement remplacer les êtres humains pour nombres de tâches relativement complexes, mais ce n’est pas forcément une mauvaise nouvelle si cela doit pousser les géants de l’IA à mieux encadrer leur LLM et à favoriser la mise en place d’outils d’autoévaluation. On notera aussi que cette étude tombe au moment où l’IA Gemini de Google est accusée de produire de trop nombreuses réponses absurdes.

Les sujets liés à ces tags pourraient vous interesser

4 commentaires pour cet article :

  • Maverick(via l'app )
    Apres ChatGPT n’a pas ete entrainer dans ce but! Il faudtait se tourner vers un outils comme github copilot pour tester les capacites de l’IA a produire du code
    • John(via l'app )
      Si je ne me trompe pas, c’est tout le contraire. À la base cette IA avait été développée pour assister les développeurs dans le code et faciliter le développement. Le fait d’afficher des résultats aussi faible pose question. Pour ma part, chaque fois que j’en ai eu besoin pour du code, il m’a fait gagner un temps fou, à partir du moment où je lui ai posé mon prompt au complet et correctement.
  • Maxime(via l'app )
    Je suis et étonné de ce résultat. Jutilise chatgpt quasi quotidiennement pour lui demander des bout de codes HTML, CSS, TYPESCRIPT, JAVA, KOTLIN… et franchement il me fait gagner un temps fou ! En effet il se trompe souvent “un peu” mais apres 2, 3 ou 10 interraction avec lui il finnit par vous crasher un code convenable ! Peut etre que votre statistique est faussée car elle compte les résultats « juste du premier coup » ?

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Data Center Serveurs

Amazon (AWS) va investir 10 milliards d’euros pour le cloud en Allemagne

21 Juin. 2024 • 22:25
0 Internet

Amazon a annoncé investir, via sa filiale Amazon Web Services (AWS), 10 milliards d’euros supplémentaires en Allemagne d’ici...

Instagram Live Direct Amis Proches

Instagram Live : il devient possible de faire un direct réservé aux amis proches

21 Juin. 2024 • 20:55
0 Internet

La fonction Live d’Instagram évolue, avec désormais la possibilité de limiter la vidéo en direct à vos amis...

Freebox Disney Plus

Freebox : Free commence à délaisser Disney+ pour Max

21 Juin. 2024 • 20:36
1 Matériel

À l’instar de Canal+ et SFR, Free mise un peu moins sur Disney+ et préfère mettre en avant le service de streaming Max pour ses...

Kaspersky

Kaspersky interdit aux États-Unis : 12 responsables sont sanctionnés

21 Juin. 2024 • 20:12
3 Logiciels

Les États-Unis annoncent des sanctions économiques à l’encontre de 12 responsables de l’entreprise russe Kaspersky,...

OpenAI Logo

OpenAI (ChatGPT) rachète Rockset, une start-up d’analyse de données

21 Juin. 2024 • 19:59
0 Hors-Sujet

OpenAI annonce avoir réalisé sa première acquisition en mettant la main sur Rockset. C’est une start-up d’analyse de...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site