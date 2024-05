L’explication est claire : l’actrice Scarlett Johansson et son équipe d’avocats ont bien fait pression sur OpenAI pour le retrait de la voix Sky de GPT-4o, une voix pourtant présente depuis plus d’un an mais qui bénéficie désormais d’un mode conversationnel supplémentaire. L’actrice et son staff légal ont envoyé une missive à OpenAI pour exprimer leur mécontentement au sujet de la voix Sky, pourtant enregistrée à partir des audios d’une autre comédienne qui a été payée pour ce travail (et dont le timbre diffère tout de même sensiblement de celle de la voix de Johansson malgré une similarité évidente).

Les mensonges de Sam Altman

Le courrier envoyé à OpenAI dévoile aussi les petits mensonges de Sam Altman, qui prétendait jusqu’ici que la voix Sky n’avait pas été utilisée lors des démos de GPT-4o pour son effet de ressemblance avec celle de Scarlett Johansson. « En septembre dernier, j’ai reçu une offre de Sam Altman, qui souhaitait m’embaucher pour exprimer le système ChatGPT 4.0 actuel » déclare Johansson. « Il m’a dit qu’il pensait qu’en étant la voix du système, je pourrais combler le fossé entre les entreprises technologiques et les créatifs et aider les consommateurs à se sentir à l’aise avec le changement sismique concernant les humains et l’IA. Il a dit qu’il pensait que ma voix réconforterait les gens. »

Statement from Scarlett Johansson on the OpenAI situation. Wow: pic.twitter.com/8ibMeLfqP8 — Bobby Allyn (@BobbyAllyn) May 20, 2024

Une voix ressemblante, mais pas identique

L’actrice américaine a finalement décliné cette offre « pour des raisons personnelles », et avoue avoir été « choquée, en colère et incrédule que M. Altman poursuive avec une voix qui ressemblait si étrangement à la mienne que mes amis les plus proches et les médias ne pouvaient pas faire la différence » Cette dernière affirmation semble objectivement exagérée. Un simple revisionnage des séquences du film Her permet de se rendre compte que les timbres des deux voix ne sont pas du tout identiques, même s’il y a des similarités dans le rythme du phrasé ou un léger grain au fond de la voix (faudra t-il interdire aussi toute voix féminine avec un grain un peu rauque ?). Toujours selon Johansson, Sam Altman aurait de nouveau tenté de la recontacter deux jours à peine avant la démo de GPT-4o, sans succès encore.

Vivement la jurisprudence

L' »affaire Johansson » va sans doute servir de cas d’école, et il semble désormais acquis qu’un jour ou l’autre un procès devra trancher sur le fond de ce type de litige et faire jurisprudence. Une voix ressemblante a une autre voix tout en n’étant pas identique à cette dernière tombera t-elle tout de même sous le coup d’une forme de violation de copyright ? Quel degré de ressemblance faudra t-il obtenir pour que les voix d’IA ne puissent pas être attaquées en justice pour ce qui pourrait devenir une nouvelle manne judiciaire pour les artistes ? A la fin de son long courrier adressé à OpenAI, Scarlett Johansson rappelle le danger des deepfakes… tout en omettant ici un point essentiel : la voix utilisée pour Sky est bien celle d’une autre personne, pas la sienne. Entre les mensonges du CEO d’une des startups les plus influentes du moment et des avocats toujours prompts à faire du zèle lorsqu’ils sentent une possibilité d’arrangements financiers, l’ère de l’IA conversationnelle et « émotionnelle » commence sous de bien mauvais auspices.