GOOGLE LANCE UNE IA VOCALE POUR LES LANGUES AFRICAINES
Le 12/02/2026 — Par Francky SABITI
GOOGLE LANCE UNE IA VOCALE POUR LES LANGUES AFRICAINES
Google vient de lancer un projet très important pour l’Afrique, et on n’en parle pas encore assez.
Le projet s’appelle WAXAL, un mot qui vient du wolof et qui signifie « parler ». L’objectif est simple mais puissant : permettre aux technologies vocales de comprendre et parler les langues africaines.
Aujourd’hui, parler à son téléphone ou à un assistant vocal est normal… sauf quand la technologie ne comprend pas ta langue. C’est la réalité de centaines de millions de personnes en Afrique subsaharienne, où plus de 2 000 langues sont parlées.
Pendant 3 ans, Google, avec des universités et organisations africaines, a collecté un énorme jeu de données :
- 21 langues africaines (dont le haoussa, le yoruba, le luganda, l’acholi…)
- plus de 11 000 heures de voix
- près de 2 millions d’enregistrements audio
- des données pour la reconnaissance vocale et la synthèse de voix
Ce projet a été construit par et pour les communautés locales. Les universités africaines partenaires gardent la propriété des données, et tout est publié en open source pour les chercheurs et développeurs du monde entier.
Ce que ça change concrètement :
- des assistants vocaux qui comprennent enfin les langues africaines
- des outils numériques plus inclusifs
- la préservation numérique de nos langues
- plus d’opportunités pour les développeurs et chercheurs africains
C’est exactement le type d’initiative qui montre que l’Afrique n’est pas juste consommatrice de technologie, mais actrice de son avenir numérique.
Le dataset est déjà disponible publiquement ici :
👉 https://lnkd.in/dupzZGec
Le projet s’appelle WAXAL, un mot qui vient du wolof et qui signifie « parler ». L’objectif est simple mais puissant : permettre aux technologies vocales de comprendre et parler les langues africaines.
Aujourd’hui, parler à son téléphone ou à un assistant vocal est normal… sauf quand la technologie ne comprend pas ta langue. C’est la réalité de centaines de millions de personnes en Afrique subsaharienne, où plus de 2 000 langues sont parlées.
Pendant 3 ans, Google, avec des universités et organisations africaines, a collecté un énorme jeu de données :
- 21 langues africaines (dont le haoussa, le yoruba, le luganda, l’acholi…)
- plus de 11 000 heures de voix
- près de 2 millions d’enregistrements audio
- des données pour la reconnaissance vocale et la synthèse de voix
Ce projet a été construit par et pour les communautés locales. Les universités africaines partenaires gardent la propriété des données, et tout est publié en open source pour les chercheurs et développeurs du monde entier.
Ce que ça change concrètement :
- des assistants vocaux qui comprennent enfin les langues africaines
- des outils numériques plus inclusifs
- la préservation numérique de nos langues
- plus d’opportunités pour les développeurs et chercheurs africains
C’est exactement le type d’initiative qui montre que l’Afrique n’est pas juste consommatrice de technologie, mais actrice de son avenir numérique.
Le dataset est déjà disponible publiquement ici :
👉 https://lnkd.in/dupzZGec
Commentaires
Aucun commentaire pour le moment.