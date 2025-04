Le géant chinois Alibaba a dévoilé il y a quelques heures Qwen3, une nouvelle famille de modèles d’IA annoncée comme pouvant rivaliser, voire surpasser, les meilleurs modèles d’OpenAI et de Google (pour certains types de tâches et de calculs). Disposant de 0,6 à 235 milliards de paramètres, les modèles Qwen3 sont — ou seront bientôt — disponibles sur les plateformes Hugging Face et GitHub en licences ouvertes. Ces modèles prennent en charge 119 langues et ont été entraînés sur un gigantesque ensemble de données de 36 000 milliards de jetons, comprenant des manuels, des paires de questions-réponses, du code et du contenu généré par IA. Alibaba met en avant les capacités de ces nouveaux modèles à alterner entre des modes « réflexifs » et « non-réflexifs » pour équilibrer précision et rapidité, certains modèles utilisant une architecture dite « mixture of experts » (MoE) pour un traitement plus efficace.

Le modèle le plus puissant, Qwen-3-235B-A22B (ouf !), surpasse OpenAI o3-mini et Google Gemini 2.5 Pro sur plusieurs benchmarks, mais il faut noter que ce dernier n’est pas encore accessible au public. Le plus grand modèle public, Qwen3-32B, reste cependant très compétitif et surpasse même le modèle o1 d’OpenAI sur des tâches de codage comme LiveCodeBench. Qwen3 serait aussi particulièrement doué pour suivre des instructions précises. Et c’est là que l’on constate que l’embargo des États-Unis sur les processeurs à destination de Chine ne semble pas vraiment avoir les effets escomptés