OpenAI présente GPT-Rosalind, un modèle de raisonnement spécialisé pour la biologie, la découverte de médicaments et la médecine translationnelle. Il constitue le premier volet d’une série de modèles sciences de la vie qu’OpenAI entend développer.

Un modèle taillé pour les travaux scientifiques complexes
Les modèles généralistes traitent mal les raisonnements multi-étapes propres à la recherche biomédicale. GPT-Rosalind a été optimisé pour combler ce manque sur des tâches précises : identification et validation de cibles thérapeutiques, interprétation génomique, analyse de voies biologiques, synthèse de littérature scientifique, génération d’hypothèses et planification expérimentale. Il intègre également une compréhension approfondie de la chimie et de l’ingénierie des protéines, et peut mobiliser des outils et bases de données scientifiques dans un même flux de travail.
Le contexte justifie l’ambition : aux États-Unis, le développement d’un nouveau médicament prend en moyenne 10 à 15 ans, avec une part considérable du temps absorbée par les seules étapes initiales de sélection de cibles et de planification. OpenAI positionne GPT-Rosalind comme un accélérateur de ces phases préliminaires pour que les équipes de recherche parviennent plus vite à des décisions fondées sur les données.
Sur BixBench, qui simule des tâches réelles de bioinformatique et d’analyse de données, GPT-Rosalind atteint un score Pass@1 de 0,751, le plus élevé parmi les modèles disponibles publiquement. Sur LABBench2, qui évalue la recherche documentaire, l’utilisation de bases de données, la manipulation de séquences et la conception de protocoles, il surpasse GPT-5.4 sur 6 des 11 tâches avec le gain le plus marqué sur la conception de clonage moléculaire.

En collaboration avec Dyno Therapeutics, le modèle a dépassé le 95e percentile des experts humains sur des séquences ARN inédites, un résultat qu’OpenAI cite comme un signal de capacité de raisonnement au-delà des données d’entraînement classiques. Le modèle est nommé en hommage à Rosalind Franklin, scientifique britannique dont les travaux ont été déterminants pour la découverte de la structure en double hélice de l’ADN.
Un plugin Codex et des conditions d’accès strictes
Le déploiement s’effectue via le programme Trusted Access d’OpenAI, réservé aux clients entreprises qualifiés aux États-Unis sur ChatGPT, Codex et l’API. Les organisations accédant au modèle doivent conduire une recherche scientifique légitime d’intérêt public, disposer de systèmes de gouvernance et de conformité appropriés, et garantir que seuls des utilisateurs autorisés accèdent au modèle dans un environnement sécurisé. Les crédits et tokens des clients ne sont pas consommés pendant la période de test. Les premiers partenaires incluent Amgen, Moderna, Novo Nordisk, Nvidia, Allen Institute, Thermo Fisher Scientific, Benchling et l’UCSF.
OpenAI lance simultanément un plugin gratuit pour Codex, connectant les chercheurs à plus de 50 outils et sources de données scientifiques publiques. Les utilisateurs sans accès à GPT-Rosalind peuvent utiliser le plugin seul avec le modèle principal. Sur le plan de la conformité, la plateforme répond aux standards SOC 2 Type 2 et aux exigences HIPAA, avec des contrôles d’accès par rôle et des espaces de travail régulés. OpenAI affirme ne pas s’entraîner sur les données des clients.