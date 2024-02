A peine arrivé au sommet que Nvidia va devoir faire face à un concurrent… dont on ne connaissait même pas le nom en début d’année. Le mardi 20 février, la startup américaine Groq (à ne pas confondre avec le chatbot-troll d’Elon Musk) a en effet dévoilé une puce dédiée à l’IA proprement révolutionnaire : il s’agit en effet du premier LPU (Langage Processing Unit), un processeur qui accélère spécifiquement les calculs des LLM (de type ChatGPT, Llama, Gemini, etc.), et les premiers résultats sont au delà du spectaculaire puisque les requêtes envoyées à un LLM basé sur la technologie Groq sont traitées quasi instantanément, parfois en moins d’une seconde ! Il est d’ailleurs possible de se rendre compte par soi-même de ces performances puisque Groq a ouvert une page qui permet d’utiliser librement un chatbot basé sur ses LPUs. Le chatbot indique le nombre de mots renvoyés chaque seconde à l’utilisateur, et atteint souvent un score dépassant les 500 mots/seconde. Stupéfiant.

Cette petite puce est-elle le futur « tueur » de Nvidia ? Les performances sont en tout cas stupéfiantes

Groq affirme que lors d’un test, sa solution a enfoncé le chatbot Lama 2 (Meta) fonctionnant sur l’infrastructure de cloud Azure, Groq s’avérant alors 20 fois plus rapide que son concurrent direct. Lors de ce même test, Groq a produit 100 tokens (mots) en a peine 0,8 secondes (contre 10,1 seconde pour Lama 2), mais les résultats peuvent être encore plus spectaculaires en fonction des requêtes formulées.

A noter que le fondateur et actuel CEO de Groq n’est autre que Jonathan Ross, qui travaillait auparavant chez Google pour le développement de puces spécialisées dans l’apprentissage automatique (ML). Nvidia a peut-être quelques soucis à se faire, même si Groq n’est pas encore passé à l’étape commerciale.