C’est un énorme pavé dans la mare, un de plus pourrait-on ajouter. Acculé par plusieurs utilisateurs, le LLM Grok de xAI avait fini par reconnaitre que son prompt général avait été modifié par un tiers afin qu’il ne puisse jamais incriminer Elon Musk ou Donald Trump sur le sujet de la désinformation, une censure évidemment bien peu compatible avec l’idée que l’on se fait d’un outil de confiance. Face à l’accumulation de preuves d’une manipulation, Igor Babuschkin, le responsable de l’ingénierie chez xAI, a fini par sortir du bois pour confirmer le changement du prompt… tout en faisant porter la responsabilité de cette modification sur un employé d’xAI, qui se serait donc rendu coupable d’avoir mis à jour Grok sans autorisation adéquate.

Babuschkin déclare que l’employé en question a cru « que cela aiderait, mais cela ne correspond évidemment pas à nos valeurs ». Le responsable de l’ingénierie ajoute que le « prompt système » de Grok (celui qui encadre l’ensemble des réponses de l’IA) est visible par tous « car nous pensons que les utilisateurs devraient pouvoir voir ce que nous demandons à Grok ». Dit autrement : It’s not a bug, it’s a feature ! On notera avec une certaine ironie que ces derniers jours, Grok ne se montrait pas particulièrement tendre avec l’administration MAGA, le chatbot déclarant (entre autres) à qui veut l’entendre que le président Trump, Musk et le vice-président JD Vance étaient les hommes qui « causent le plus de tort à l’Amérique ». Le « libertarien » Elon Musk va t-il respecter jusqu’au bout la liberté de parole de son IA ?