KultureGeek Internet Nvidia félicite DeepSeek pour R1, son nouveau modèle d’IA qui fait parler

Internet

Nvidia félicite DeepSeek pour R1, son nouveau modèle d’IA qui fait parler

27 Jan. 2025 • 22:22

Le modèle R1 de DeepSeek, lancé la semaine dernière, continue de secouer l’industrie de l’intelligence artificielle, au point que l’action de Nvidia a chuté de 17% aujourd’hui. Ce succès provient d’une start-up chinoise et Nvidia a réagi en saluant la performance de DeepSeek, tout en admettant que cette évolution a un impact significatif sur ses affaires.

DeepSeek, un modèle d’IA performant à faible coût

DeepSeek, une entreprise chinoise d’intelligence artificielle, a attiré l’attention en publiant R1, un modèle de raisonnement open source qui est capable de surpasser les meilleures IA développées par des entreprises américaines comme OpenAI (ChatGPT). Ce modèle aurait coûté moins de 6 millions de dollars pour son entraînement, une somme bien inférieure aux milliards investis par les géants de la Silicon Valley.

Nvidia, le leader des cartes graphiques (GPU) utilisées pour les IA, a reconnu cette avancée. Un porte-parole du groupe a indiqué à CNBC :

DeepSeek est une excellente avancée en matière d’IA et un exemple parfait du Test Time Scaling. Les travaux de DeepSeek illustrent la manière dont de nouveaux modèles peuvent être créés à l’aide de cette technique, en tirant parti de modèles largement disponibles et d’un calcul qui respecte pleinement le contrôle des exportations.

L’inférence nécessite un nombre important de GPU Nvidia et un réseau de haute performance. Nous disposons désormais de trois lois de mise à l’échelle : pré-entraînement et post-entraînement, qui se poursuivent, et un nouveau Test-Time Scaling.

Le concept du Test Time Scaling évoqué par Nvidia et déjà adopté par DeepSeek représente un tournant dans l’optimisation des modèles d’IA. Selon Nvidia, cette méthode permet à un modèle d’IA entièrement entraîné d’utiliser des ressources supplémentaires pendant la phase de prédiction ou de génération de texte et d’images, ce qui améliore la qualité des résultats. Si un modèle passe plus de temps à raisonner avec plus de puissance de calcul, il fournira de meilleures réponses.

Les répercussions sur les investissements en infrastructure

La mise en avant de DeepSeek et de son modèle R1 a soulevé des interrogations parmi les analystes. Si des entreprises comme Microsoft, Meta et Google investissent des dizaines de milliards de dollars dans l’infrastructure nécessaire pour soutenir leurs IA via des GPU Nvidia, la question se pose de savoir si ces dépenses colossales ne sont pas en train de devenir obsolètes. Microsoft, par exemple, a annoncé qu’elle allouerait 80 milliards de dollars à l’infrastructure de l’IA en 2025, tandis que Meta prévoit un investissement similaire entre 60 et 65 milliards de dollars. DeepSeek, en réalisant de telles performances à un coût bien inférieur, pourrait bien redéfinir les règles du marché de l’IA.

Ainsi, si Nvidia reste optimiste quant à l’augmentation de la demande pour ses GPU, l’émergence de modèles comme DeepSeek pourrait forcer l’industrie à réévaluer ses priorités et ses investissements.

Signaler une erreur dans le texte

Vous utilisez Google Actualités ? Suivez KultureGeek pour ne rien rater de l'actu High-Tech !

Les sujets liés à ces tags pourraient vous interesser

Un commentaire pour cet article :

Xero(via l'app )
28 Jan. 2025 • 08:53

Belle performance de la part de DeepSeek, qui intensifie encore la compétition entre les différents acteurs de l’IA. Personnellement, j’attends avec impatience la montée en puissance de l’informatique quantique. Même si M. Huang a déclaré qu’il faudrait encore une décennie avant de pouvoir utiliser cette technologie (ce qui reste à prouver 😉), cela promet d’être une révolution encore plus marquante, surtout lorsqu’elle sera combinée à l’IA.
- Répondre

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Fils des commentaires

Quelques règles à respecter :

1. Restez dans le sujet de l'article
2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles