KultureGeek Internet Nvidia félicite DeepSeek pour R1, son nouveau modèle d’IA qui fait parler

Nvidia félicite DeepSeek pour R1, son nouveau modèle d’IA qui fait parler

3 min.
27 Jan. 2025 • 22:22
1

Le modèle R1 de DeepSeek, lancé la semaine dernière, continue de secouer l’industrie de l’intelligence artificielle, au point que l’action de Nvidia a chuté de 17% aujourd’hui. Ce succès provient d’une start-up chinoise et Nvidia a réagi en saluant la performance de DeepSeek, tout en admettant que cette évolution a un impact significatif sur ses affaires.

Nvidia Logo

DeepSeek, un modèle d’IA performant à faible coût

DeepSeek, une entreprise chinoise d’intelligence artificielle, a attiré l’attention en publiant R1, un modèle de raisonnement open source qui est capable de surpasser les meilleures IA développées par des entreprises américaines comme OpenAI (ChatGPT). Ce modèle aurait coûté moins de 6 millions de dollars pour son entraînement, une somme bien inférieure aux milliards investis par les géants de la Silicon Valley.

Nvidia, le leader des cartes graphiques (GPU) utilisées pour les IA, a reconnu cette avancée. Un porte-parole du groupe a indiqué à CNBC :

DeepSeek est une excellente avancée en matière d’IA et un exemple parfait du Test Time Scaling. Les travaux de DeepSeek illustrent la manière dont de nouveaux modèles peuvent être créés à l’aide de cette technique, en tirant parti de modèles largement disponibles et d’un calcul qui respecte pleinement le contrôle des exportations.

L’inférence nécessite un nombre important de GPU Nvidia et un réseau de haute performance. Nous disposons désormais de trois lois de mise à l’échelle : pré-entraînement et post-entraînement, qui se poursuivent, et un nouveau Test-Time Scaling.

DeepSeek Logo

Le concept du Test Time Scaling évoqué par Nvidia et déjà adopté par DeepSeek représente un tournant dans l’optimisation des modèles d’IA. Selon Nvidia, cette méthode permet à un modèle d’IA entièrement entraîné d’utiliser des ressources supplémentaires pendant la phase de prédiction ou de génération de texte et d’images, ce qui améliore la qualité des résultats. Si un modèle passe plus de temps à raisonner avec plus de puissance de calcul, il fournira de meilleures réponses.

Les répercussions sur les investissements en infrastructure

La mise en avant de DeepSeek et de son modèle R1 a soulevé des interrogations parmi les analystes. Si des entreprises comme Microsoft, Meta et Google investissent des dizaines de milliards de dollars dans l’infrastructure nécessaire pour soutenir leurs IA via des GPU Nvidia, la question se pose de savoir si ces dépenses colossales ne sont pas en train de devenir obsolètes. Microsoft, par exemple, a annoncé qu’elle allouerait 80 milliards de dollars à l’infrastructure de l’IA en 2025, tandis que Meta prévoit un investissement similaire entre 60 et 65 milliards de dollars. DeepSeek, en réalisant de telles performances à un coût bien inférieur, pourrait bien redéfinir les règles du marché de l’IA.

Ainsi, si Nvidia reste optimiste quant à l’augmentation de la demande pour ses GPU, l’émergence de modèles comme DeepSeek pourrait forcer l’industrie à réévaluer ses priorités et ses investissements.

Les sujets liés à ces tags pourraient vous interesser

Un commentaire pour cet article :

  • Xero
    Belle performance de la part de DeepSeek, qui intensifie encore la compétition entre les différents acteurs de l’IA. Personnellement, j’attends avec impatience la montée en puissance de l’informatique quantique. Même si M. Huang a déclaré qu’il faudrait encore une décennie avant de pouvoir utiliser cette technologie (ce qui reste à prouver 😉), cela promet d’être une révolution encore plus marquante, surtout lorsqu’elle sera combinée à l’IA.

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Android 17 Logo

La Google I/O 2026 aura lieu les 19 et 20 mai pour Android 17 et l’IA

17 Fév. 2026 • 22:25
0 Internet

La Google I/O 2026 se tiendra les 19 et 20 mai au Shoreline Amphitheatre de Mountain View en Californie et en direct sur io.google, avec Android 17 et les...

Claude Logo

Claude Sonnet 4.6 est disponible : Anthropic dévoile son IA performante

17 Fév. 2026 • 20:28
0 Internet

Anthropic lance Claude Sonnet 4.6, son modèle d’intelligence artificielle le plus performant pour la gamme Sonnet, qui égale les...

mistral-ai

Mistral AI rachète Koyeb et accélère sa stratégie de cloud IA souverain en Europe

17 Fév. 2026 • 20:00
0 Business

Mistral AI, valorisée 13,8 milliards de dollars et considérée comme l’un des principaux rivaux européens d’OpenAI,...

ticket to Ride

Netflix va adapter en film le jeu de société culte Ticket to Ride (Les Aventuriers du Rail)

17 Fév. 2026 • 19:45
0 Geekeries

Après avoir multiplié les adaptations de licences issues du jeu vidéo, Netflix élargit son terrain de chasse. La plateforme...

Unitree robot gala

Nouvel An chinois : les robots humanoïdes de Unitree enflamment le gala de la CCTV

17 Fév. 2026 • 19:17
1 Science

Le gala du Nouvel An lunaire diffusé par la CCTV, l’un des programmes les plus regardés au monde, a une nouvelle fois servi de vitrine...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site