KultureGeek Internet DeepSeek-V4 est disponible : le nouveau modèle d’IA frappe fort

DeepSeek-V4 est disponible : le nouveau modèle d’IA frappe fort

4 min.
24 Avr. 2026 • 9:38
0

DeepSeek-V4 Preview arrive avec une promesse très lisible : offrir une très grande fenêtre de contexte, des capacités avancées en code et en raisonnement, tout en gardant une logique de coût plus agressive que celle des modèles d’intelligence artificielle les plus lourds. La start-up chinoise structure pour cela son offre autour de deux variantes, Pro et Flash, désormais disponibles sur le Web et via l’API.

DeepSeek Logo

Le point le plus différenciant est sans doute la fenêtre de contexte de 1 million de tokens, prise en charge à la fois par les versions Flash et par Pro. DeepSeek la présente comme un saut suffisamment large pour envoyer dans un seul prompt une base de code entière ou de longs documents, avec l’ambition de rendre le modèle plus utile sur les conversations étendues et les tâches complexes.

Pour soutenir cette promesse, l’entreprise met en avant une Hybrid Attention Architecture censée améliorer la mémoire des requêtes sur la durée. DeepSeek associe aussi cette évolution à des gains plus larges en raisonnement, en tâches agentiques et en benchmarks de code.

Des versions Pro et Flash pour DeepSeek-V4

Les deux modèles partagent donc le même plafond de contexte, mais pas la même échelle. DeepSeek-V4 Pro affiche 1 600 milliards de paramètres au total et 49 milliards de paramètres actifs, contre 284 milliards de paramètres totaux et 13 milliards de paramètres actifs pour Flash.

L’ensemble repose sur une architecture Mixture-of-Experts (MoE) qui n’active qu’une petite partie des experts à chaque tâche. DeepSeek explique ainsi limiter l’inférence à un maximum de 37 milliards de paramètres activés par requête afin de contenir les coûts face à des modèles de pointe comparables.

Dans son positionnement, le modèle Pro représente la version la plus ambitieuse. DeepSeek lui attribue des capacités agentiques renforcées, une connaissance du monde supérieure à celle des modèles ouverts actuels tout en restant derrière Gemini 3.1 Pro sur ce terrain, ainsi qu’un niveau de raisonnement qui dépasserait les modèles ouverts en maths, en STEM (science, technologie, ingénierie et mathématiques) et en code.

Flash, lui, joue une carte plus pragmatique. DeepSeek affirme qu’il s’approche de Pro en raisonnement, qu’il se montre au niveau sur les tâches agentiques simples et qu’il devient surtout beaucoup plus attractif sur le plan tarifaire.

Une offensive aussi pensée pour les prix

Cette différence se voit immédiatement dans l’API. Pour DeepSeek-V4 Flash, le prix d’entrée descend à 0,028 dollar ou 0,14 dollar en cas de cache manquant, avec un coût de sortie de 0,28 dollar. Pour DeepSeek-V4 Pro, les prix montent à 0,145 dollar ou 1,74 dollar en entrée selon le cache, puis 3,48 dollars en sortie.

DeepSeek cherche ainsi à opposer à ChatGPT, Gemini et Claude non seulement à un modèle avec un long contexte, mais aussi à une gamme plus segmentée entre performance maximale et efficacité économique. La start-up chinoise revendique même de meilleurs scores que GPT-5.2 sur des benchmarks, tout en reconnaissant rester encore à environ trois à six mois des meilleurs modèles du marché.

DeepSeek-V4 est disponible dès maintenant en open source sur Hugging Face, sur le site de DeepSeek et via son API mise à jour.

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Intelligence artificielle

Le Royaume-Uni va utiliser l’IA pour détecter la fraude fiscale

15 Mai. 2026 • 16:03
0 Internet

Le fisc britannique va s’appuyer pendant dix ans sur Quantexa pour renforcer la détection de fraude et le traitement des erreurs dans les...

Honor caméra robot

Robot Phone : le smartphone à caméra robotisée de Honor arrivera lors du T3 avec la technologie ARRI

15 Mai. 2026 • 15:30
0 Mobiles / Tablettes

On a failli avoir des doutes. Le Honor Robot Phone n’est plus seulement un concept spectaculaire :  la marque chinoise confirme que son...

Windows 11 Bureau PC Portable

Windows Update va corriger tout seul certains mauvais pilotes sur Windows 11

15 Mai. 2026 • 14:10
0 Actu OS

Microsoft prépare une nouvelle fonction dans Windows 11 pour revenir automatiquement à un pilote stable quand une version défectueuse...

Xbox Manette cloud

Xbox Cloud Gaming : Microsoft prépare des manettes Wi-Fi pour jouer sans console

15 Mai. 2026 • 12:40
0 Matériel

Malgré l’arrêt brutal de sa campagne « All is an Xbox », Microsoft semble toujours plancher sur les moyens de...

Nvidia CEO huang

Nvidia se rapproche des 6000 milliards de dollars de capitalisation

15 Mai. 2026 • 11:15
0 Business

Plus rien n’arrête Nvidia. Le fabricant américain vient de franchir un nouveau seuil symbolique à Wall Street. Le...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site