KultureGeek Logiciels ChatGPT : en programmation, l’IA aurait tout faux une fois sur deux

ChatGPT : en programmation, l’IA aurait tout faux une fois sur deux

24 Mai. 2024 • 20:08
4

Il est sans doute bon de rappeler que les IA ne sont toujours pas infaillibles. Loin s’en faut même si l’on en croit une étude de l’Université Purdue dans l’Indiana, qui conclut que ChatGPT répond incorrectement à des questions de programmation informatique 52 % du temps. Aie.

Intelligence Artificielle Cerveau Puce

Présentée à la conférence sur l’interaction homme-ordinateur à Hawaï, l’étude a analysé 517 questions de programmation issues de Stack Overflow, qui ont ensuite été traitées par ChatGPT. Les résultats, rapportés pour la première fois par Futurism, dévoilent des problèmes significatifs de précision avec le chatbot. « Notre analyse montre que 52 % des réponses de ChatGPT contiennent des informations incorrectes et 77 % sont verbeuses », explique l’étude. Mais il y a un soucis peut-être plus inquiétant encore : malgré les nombreuses erreurs de ChatGPT, 35% des participants (tous développeurs) à l’étude ont indiqué préférer les réponses de ChatGPT à cause de son exhaustivité et… de son phrasé bien articulé. Dans 39% des cas, les programmeurs ont même ignoré les réponses fausses.

Ces résultats indiquent que les IA ne sont pas prêtes à réellement remplacer les êtres humains pour nombres de tâches relativement complexes, mais ce n’est pas forcément une mauvaise nouvelle si cela doit pousser les géants de l’IA à mieux encadrer leur LLM et à favoriser la mise en place d’outils d’autoévaluation. On notera aussi que cette étude tombe au moment où l’IA Gemini de Google est accusée de produire de trop nombreuses réponses absurdes.

Les sujets liés à ces tags pourraient vous interesser

4 commentaires pour cet article :

  • Maverick(via l'app )
    Apres ChatGPT n’a pas ete entrainer dans ce but! Il faudtait se tourner vers un outils comme github copilot pour tester les capacites de l’IA a produire du code
    • John(via l'app )
      Si je ne me trompe pas, c’est tout le contraire. À la base cette IA avait été développée pour assister les développeurs dans le code et faciliter le développement. Le fait d’afficher des résultats aussi faible pose question. Pour ma part, chaque fois que j’en ai eu besoin pour du code, il m’a fait gagner un temps fou, à partir du moment où je lui ai posé mon prompt au complet et correctement.
  • Maxime(via l'app )
    Je suis et étonné de ce résultat. Jutilise chatgpt quasi quotidiennement pour lui demander des bout de codes HTML, CSS, TYPESCRIPT, JAVA, KOTLIN… et franchement il me fait gagner un temps fou ! En effet il se trompe souvent “un peu” mais apres 2, 3 ou 10 interraction avec lui il finnit par vous crasher un code convenable ! Peut etre que votre statistique est faussée car elle compte les résultats « juste du premier coup » ?

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Raccordement Fibre Optique

Fibre optique : SFR et Bouygues Telecom réclament 330 millions d’euros à Orange

18 Avr. 2025 • 22:26
1 Internet

La fibre optique devient aujourd’hui un sujet de discorde entre les opérateurs français. SFR et Bouygues Telecom réclament...

Orange Logo

Orange va améliorer son réseau 5G (performances et énergie) avec Ericsson

18 Avr. 2025 • 20:54
4 Mobiles / Tablettes

Orange France s’associe une nouvelle fois à Ericsson pour moderniser 60 % de son réseau mobile d’ici quatre ans....

Samsung Galaxy S24 Ultra Resumer Notes

One UI 7 : Samsung reprend le déploiement de sa mise à jour après un bug

18 Avr. 2025 • 20:19
0 Mobiles / Tablettes

Après un retrait surprise à cause d’un bug, Samsung reprend le déploiement de One UI 7, sa mise à jour basée sur...

devolo-routeur-5G-wifi6-1360×907

[Prise en main] Routeur devolo Wi-Fi 6 3600 5G LTE : l’internet haut débit à emporter (+ promo)

18 Avr. 2025 • 20:09
1 Tests

Le besoin d’une connexion Internet fiable, rapide et sécurisée ne cesse de grandir, que ce soit pour le télétravail, le...

Spotify Logo Icone

Spotify augmente ses prix dans quelques pays en Europe (bientôt la France ?)

18 Avr. 2025 • 19:48
2 Internet

Après Netflix qui augmente ses prix en France, voilà que Spotify fait la même chose dans trois pays en Europe : Belgique,...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site