Le modèle R1 de DeepSeek, lancé la semaine dernière, continue de secouer l’industrie de l’intelligence artificielle, au point que l’action de Nvidia a chuté de 17% aujourd’hui. Ce succès provient d’une start-up chinoise et Nvidia a réagi en saluant la performance de DeepSeek, tout en admettant que cette évolution a un impact significatif sur ses affaires.

DeepSeek, un modèle d’IA performant à faible coût

DeepSeek, une entreprise chinoise d’intelligence artificielle, a attiré l’attention en publiant R1, un modèle de raisonnement open source qui est capable de surpasser les meilleures IA développées par des entreprises américaines comme OpenAI (ChatGPT). Ce modèle aurait coûté moins de 6 millions de dollars pour son entraînement, une somme bien inférieure aux milliards investis par les géants de la Silicon Valley.

Nvidia, le leader des cartes graphiques (GPU) utilisées pour les IA, a reconnu cette avancée. Un porte-parole du groupe a indiqué à CNBC :

DeepSeek est une excellente avancée en matière d’IA et un exemple parfait du Test Time Scaling. Les travaux de DeepSeek illustrent la manière dont de nouveaux modèles peuvent être créés à l’aide de cette technique, en tirant parti de modèles largement disponibles et d’un calcul qui respecte pleinement le contrôle des exportations. L’inférence nécessite un nombre important de GPU Nvidia et un réseau de haute performance. Nous disposons désormais de trois lois de mise à l’échelle : pré-entraînement et post-entraînement, qui se poursuivent, et un nouveau Test-Time Scaling.

Le concept du Test Time Scaling évoqué par Nvidia et déjà adopté par DeepSeek représente un tournant dans l’optimisation des modèles d’IA. Selon Nvidia, cette méthode permet à un modèle d’IA entièrement entraîné d’utiliser des ressources supplémentaires pendant la phase de prédiction ou de génération de texte et d’images, ce qui améliore la qualité des résultats. Si un modèle passe plus de temps à raisonner avec plus de puissance de calcul, il fournira de meilleures réponses.

Les répercussions sur les investissements en infrastructure

La mise en avant de DeepSeek et de son modèle R1 a soulevé des interrogations parmi les analystes. Si des entreprises comme Microsoft, Meta et Google investissent des dizaines de milliards de dollars dans l’infrastructure nécessaire pour soutenir leurs IA via des GPU Nvidia, la question se pose de savoir si ces dépenses colossales ne sont pas en train de devenir obsolètes. Microsoft, par exemple, a annoncé qu’elle allouerait 80 milliards de dollars à l’infrastructure de l’IA en 2025, tandis que Meta prévoit un investissement similaire entre 60 et 65 milliards de dollars. DeepSeek, en réalisant de telles performances à un coût bien inférieur, pourrait bien redéfinir les règles du marché de l’IA.

Ainsi, si Nvidia reste optimiste quant à l’augmentation de la demande pour ses GPU, l’émergence de modèles comme DeepSeek pourrait forcer l’industrie à réévaluer ses priorités et ses investissements.