L'IA au service des langues menacées : Google et Meta développent des outils de traduction pour les langues à faibles ressources

Google et Meta investissent dans la traduction automatique de langues peu documentées. Le projet No Language Left Behind de Meta couvre plus de 200 langues, tandis que Google Translate en prend en charge 243. Un effort qui pourrait aider à préserver la diversité linguistique.

Par Rédaction OrChair ·

La traduction automatique a fait des progrès considérables grâce à l'intelligence artificielle. Google Translate prend désormais en charge 243 langues, et Meta a lancé le projet « No Language Left Behind » (NLLB) qui couvre plus de 200 langues, dont beaucoup n'avaient jamais été traitées par un système de traduction automatique.

L'UNESCO estime qu'environ 40% des 7 000 langues parlées dans le monde sont en danger de disparition. L'IA peut jouer un rôle dans la documentation et la préservation de ces langues, en créant des outils de transcription, de traduction et d'apprentissage à partir de données limitées — un défi majeur pour les modèles de traitement du langage naturel qui nécessitent habituellement de vastes corpus de textes.

Google DeepMind a utilisé l'IA pour aider à déchiffrer des textes anciens, notamment des inscriptions cunéiformes et des tablettes linéaire B. Ces travaux, publiés dans des revues scientifiques, montrent que les modèles d'apprentissage profond peuvent identifier des patterns dans des écritures anciennes et proposer des déchiffrements plausibles.

Les outils de traduction en temps réel progressent. Google Pixel Buds et d'autres oreillettes connectées proposent la traduction simultanée dans plusieurs dizaines de langues, avec des résultats encore imparfaits mais en amélioration constante. La traduction vocale en temps réel reste un défi, notamment pour les langues tonales et les dialectes régionaux.

Les communautés autochtones et les linguistes collaborent avec les entreprises tech pour développer des modèles de traduction adaptés. Le projet Masakhane, porté par des chercheurs africains, développe des outils de NLP (traitement du langage naturel) pour les langues africaines, un domaine historiquement sous-représenté dans l'IA linguistique.