Google Traduction enrichit sa base de données avec le support de 110 nouvelles langues. L’outil de traduction en comptait 133 jusqu’à présent. Autant dire que le gain du jour est plus que notable.

110 nouvelles langues débarquent sur Google Traduction
Google attribue cet ajout à son grand modèle de langage PaLM 2. Il s’est avéré particulièrement efficace pour apprendre les langues apparentées, telles que celles proches de l’hindi, comme l’awadhi et le marwadi, et les créoles français comme le créole seychellois et le créole mauricien.
Voici quelques-unes des langues désormais disponibles sur Google Traduction :
- L’afar est une langue tonale parlée à Djibouti, en Érythrée et en Éthiopie. De toutes les langues de ce lancement, l’afar est celle qui a bénéficié du plus grand nombre de contributions volontaires de la part de la communauté.
- Le cantonais est depuis longtemps l’une des langues les plus demandées sur Google Traduction. Mais c’est une langue difficile à ajouter car, à l’écrit, elle se confond souvent avec le mandarin, ce qui complique la recherche de données et la formation de modèles.
- Le manx est la langue celtique de l’île de Man. Elle a failli disparaître avec la mort de son dernier locuteur natif en 1974. Mais grâce à un mouvement de renaissance à l’échelle de l’île, elle compte aujourd’hui des milliers de locuteurs.
- Le NKo est une forme standardisée des langues mandingues d’Afrique de l’Ouest qui unifie de nombreux dialectes en une langue commune. Son alphabet unique a été inventé en 1949 et une communauté de recherche active développe aujourd’hui des ressources et des technologies pour cette langue.
- Le panjabi (shahmukhi) est la variété de panjabi écrite à l’aide d’un alphabet perso-arabe (le shahmukhi). C’est la langue la plus parlée au Pakistan.
- Le tamazight est une langue berbère parlée dans toute l’Afrique du Nord. Bien qu’il existe de nombreux dialectes, la forme écrite est généralement compréhensible par tous. Elle s’écrit en caractères latins et en caractères tifinagh, tous deux disponibles sur Google Traduction.
- Le tok pisin est un créole basé sur l’anglais et la lingua franca (un langage permettant la communication entre locuteurs de langues différentes) de Papouasie-Nouvelle-Guinée. Si vous parlez anglais, essayez de traduire une phrase en tok pisin, vous pourrez peut-être en comprendre le sens.
À l’avenir, Google souhaite prendre en charge encore plus de variétés de langues et de conventions orthographiques. L’objectif plus large est de construire des modèles d’IA qui prendront en charge les 1 000 langues les plus parlées dans le monde.