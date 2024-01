C’est le prochain gros coup d’accélérateur des IA génératives : Sam Altman, CEO d’OpenAI, a annoncé sur le podcast « Unconfuse Me » de Bill Gates (co-fondateur de Microsoft) que la prochaine mouture GPT-5 de ChatGPT sera un outil entièrement multimodal prenant en charge la parole, l’image, le code… et la vidéo ! GPT-5 sera en effet capable de générer des vidéos en fonction des requêtes (prompts) formulées par l’utilisateur.

Sam Altman

Cette mise à jour étendra donc considérablement les fonctionnalités de l’IA générative et rapprochera un peu plus les capacités des IA de la cognition humaine (tout au moins en apparence, on se doute que le fonctionnement interne n’est pas le même entre un cerveau biologique et un groupe de processeurs). Les IA multimodales soulèvent cependant un certain nombre d’inquiétudes concernant d’éventuels soucis de confidentialité et bien sûr de copyright, OpenAI étant déjà confronté à ce sujet à de multiples plaintes en justice. Pour rappel, plusieurs fuites semblaient indiquer le limogeage d’Altman d’OpenAI (avant sa réintégration au poste de CEO) avait pour cause la défiance d’une partie du conseil d’administration concernant l’IA multimodale.

Sam Altman semble sourd à ces critiques – il est vrai souvent portées par des craintes dystopiques plus fantasmées qu’appuyées sur des éléments réels – et promet même que les futures versions de GPT pourront comprendre profondément les utilisateurs à partir d’une myriade de données. Incidemment, le CEO d’OpenAI confirme aussi que GPT-5 devrait être publié dès cette année. Logiquement, cette version sera uniquement proposée aux abonnés payants à ChatGPT, comme cela est déjà le cas pour GPT-4.