Lors du CES 2026, Nvidia a présenté Alpamayo, une nouvelle famille de modèles d’intelligence artificielle open source destinée à aider la robotique physique et les véhicules autonomes. Selon Jensen Huang, PDG de l’entreprise, cette technologie marque l’arrivée du « moment ChatGPT pour l’IA physique », permettant aux machines de comprendre, raisonner et agir dans le monde réel.

Alpamayo 1, un modèle qui explique ses décisions

Au cœur de cette annonce se trouve Alpamayo 1, un modèle de vision-langage-action (VLA) de 10 milliards de paramètres. Sa particularité réside dans sa capacité à utiliser une chaîne de pensée pour analyser des situations inédites. Contrairement aux systèmes classiques, ce modèle ne se contente pas de réagir : il décompose les problèmes complexes étape par étape, évalue toutes les possibilités et sélectionne la trajectoire la plus sûre.

Cette approche permet au véhicule de gérer des cas limites difficiles, comme une panne de feux tricolores à un carrefour fréquenté, sans avoir besoin d’une expérience préalable spécifique. Plus impressionnant encore, le système est capable d’expliquer sa logique : il verbalise l’action qu’il s’apprête à entreprendre, justifie son choix et détaille la trajectoire prévue, tout en contrôlant le volant et les pédales.

Une suite d’outils complète pour les développeurs

Nvidia met le code source d’Alpamayo 1 à disposition sur Hugging Face, offrant une grande flexibilité aux ingénieurs. Ils peuvent affiner le modèle pour créer des versions plus légères et rapides, l’utiliser pour entraîner des systèmes de conduite plus simples ou bâtir des outils d’étiquetage automatique de données vidéo.

Pour compléter cet écosystème, Nvidia lance également :