KultureGeek Internet Google Traduction ajoute le support de 110 nouvelles langues

Google Traduction ajoute le support de 110 nouvelles langues

27 Juin. 2024 • 10:15
0

Google Traduction enrichit sa base de données avec le support de 110 nouvelles langues. L’outil de traduction en comptait 133 jusqu’à présent. Autant dire que le gain du jour est plus que notable.

Google Traduction

110 nouvelles langues débarquent sur Google Traduction

Google attribue cet ajout à son grand modèle de langage PaLM 2. Il s’est avéré particulièrement efficace pour apprendre les langues apparentées, telles que celles proches de l’hindi, comme l’awadhi et le marwadi, et les créoles français comme le créole seychellois et le créole mauricien.

Voici quelques-unes des langues désormais disponibles sur Google Traduction :

  • L’afar est une langue tonale parlée à Djibouti, en Érythrée et en Éthiopie. De toutes les langues de ce lancement, l’afar est celle qui a bénéficié du plus grand nombre de contributions volontaires de la part de la communauté.
  • Le cantonais est depuis longtemps l’une des langues les plus demandées sur Google Traduction. Mais c’est une langue difficile à ajouter car, à l’écrit, elle se confond souvent avec le mandarin, ce qui complique la recherche de données et la formation de modèles.
  • Le manx est la langue celtique de l’île de Man. Elle a failli disparaître avec la mort de son dernier locuteur natif en 1974. Mais grâce à un mouvement de renaissance à l’échelle de l’île, elle compte aujourd’hui des milliers de locuteurs.
  • Le NKo est une forme standardisée des langues mandingues d’Afrique de l’Ouest qui unifie de nombreux dialectes en une langue commune. Son alphabet unique a été inventé en 1949 et une communauté de recherche active développe aujourd’hui des ressources et des technologies pour cette langue.
  • Le panjabi (shahmukhi) est la variété de panjabi écrite à l’aide d’un alphabet perso-arabe (le shahmukhi). C’est la langue la plus parlée au Pakistan.
  • Le tamazight est une langue berbère parlée dans toute l’Afrique du Nord. Bien qu’il existe de nombreux dialectes, la forme écrite est généralement compréhensible par tous. Elle s’écrit en caractères latins et en caractères tifinagh, tous deux disponibles sur Google Traduction.
  • Le tok pisin est un créole basé sur l’anglais et la lingua franca (un langage permettant la communication entre locuteurs de langues différentes) de Papouasie-Nouvelle-Guinée. Si vous parlez anglais, essayez de traduire une phrase en tok pisin, vous pourrez peut-être en comprendre le sens.

À l’avenir, Google souhaite prendre en charge encore plus de variétés de langues et de conventions orthographiques. L’objectif plus large est de construire des modèles d’IA qui prendront en charge les 1 000 langues les plus parlées dans le monde.

Les sujets liés à ces tags pourraient vous interesser

Laisser un commentaire

Sauvegarder mon pseudo et mon adresse e-mail pour la prochaine fois.

Quelques règles à respecter :
  • 1. Restez dans le sujet de l'article
  • 2. Respectez les autres lecteurs : pas de messages agressifs, vulgaires, haineux,…
  • 3. Relisez-vous avant de soumettre un commentaire : pas de langage SMS, et vérifiez l'orthographe avant de valider (les navigateurs soulignent les fautes).
  • 4. En cas d'erreur, faute d'orthographe, et/ou omission dans l'article , merci de nous contacter via la page Contact.

Nous nous réservons le droit de supprimer les commentaires qui ne respectent pas ces règles


Les derniers articles

Amazon Logo Batiment

IA : Amazon investit encore 4 milliards de dollars dans Anthropic

22 Nov. 2024 • 18:50
0 Hors-Sujet

Amazon va investir 4 milliards de dollars supplémentaires dans la start-up d’intelligence artificielle générative Anthropic,...

Coca Cola publicité

La dernière publicité de Coca-Cola est (en partie) générée par l’IA… et ça ne plait pas !

22 Nov. 2024 • 17:19
0 Hors-Sujet

Ça ne passe pas. Coca-Cola vient de diffuser sa traditionnelle publicité de Noël, et à priori rien n’est vraiment choquant...

Real-Debrid

Streaming : Real-Debrid durcit ses règles pour éviter des poursuites en France

22 Nov. 2024 • 16:32
0 Internet

Real-Debrid, un débrideur français qui est réputé pour le téléchargement et le streaming de films et de...

Hack Lignes de Code

Microsoft annonce avoir saisi 240 sites liés à du phishing

22 Nov. 2024 • 14:10
0 Internet

Microsoft a annoncé avoir obtenu le blocage de 240 sites liés à un réseau de cybercriminels, après avoir lancé...

Facepalm

OpenAI efface des éléments de preuve dans sa bataille juridique contre le New York Times

22 Nov. 2024 • 12:45
2 Hors-Sujet

C’est la grosse boulette de la semaine : si l’on en croit un dépôt de la cour de justice, les ingénieurs d’OpenAI...

Les dernières actus Apple sur iPhoneAddict :

Comparateur

Recherchez le meilleur prix des produits Hi-tech

Recherche

Recherchez des articles sur le site