TENDANCES
Comparateur
- AUTO
A peine arrivé au sommet que Nvidia va devoir faire face à un concurrent… dont on ne connaissait même pas le nom en début d’année. Le mardi 20 février, la startup américaine Groq (à ne pas confondre avec le chatbot-troll d’Elon Musk) a en effet dévoilé une puce dédiée à l’IA proprement révolutionnaire : il s’agit en effet du premier LPU (Langage Processing Unit), un processeur qui accélère spécifiquement les calculs des LLM (de type ChatGPT, Llama, Gemini, etc.), et les premiers résultats sont au delà du spectaculaire puisque les requêtes envoyées à un LLM basé sur la technologie Groq sont traitées quasi instantanément, parfois en moins d’une seconde ! Il est d’ailleurs possible de se rendre compte par soi-même de ces performances puisque Groq a ouvert une page qui permet d’utiliser librement un chatbot basé sur ses LPUs. Le chatbot, qui n’est autre que Mistral AI de la startup française éponyme, indique le nombre de mots renvoyés chaque seconde à l’utilisateur, et atteint souvent un score dépassant les 500 mots/seconde. Stupéfiant.
Cette petite puce est-elle le futur « tueur » de Nvidia ? Les performances sont en tout cas stupéfiantes
Groq affirme que lors d’un test, sa solution a enfoncé le chatbot Lama 2 (Meta) fonctionnant sur l’infrastructure de cloud Azure, Groq s’avérant alors 20 fois plus rapide que son concurrent direct. Lors de ce même test, Groq a produit 100 tokens (mots) en a peine 0,8 secondes (contre 10,1 seconde pour Lama 2), mais les résultats peuvent être encore plus spectaculaires en fonction des requêtes formulées.
A noter que le fondateur et actuel CEO de Groq n’est autre que Jonathan Ross, qui travaillait auparavant chez Google pour le développement de puces spécialisées dans l’apprentissage automatique (ML). Nvidia a peut-être quelques soucis à se faire, même si Groq n’est pas encore passé à l’étape commerciale.
L’Union européenne se prépare à une riposte suite aux nouveaux droits de douane imposés par Donald Trump sur les...
Meta développerait une version haut de gamme de ses lunettes intelligentes Ray-Ban Meta, un modèle portant le nom de code Hypernova en...
X viendrait-il de subir la fuite de données la plus massive de son histoire ? Le site Hackread révèle en effet que 400 Go de...
L’enthousiasme autour de l’adaptation live-action de Dragons (How to Train Your Dragon en VO) a visiblement donné à Universal...
Microsoft lève le voile sur la liste des jeux qui vont être disponibles avec le Xbox Game Pass en avril 2025. Il y a neuf titres cette...