OSIRIS

Observatoire sur les systèmes d’information, les réseaux et les inforoutes au Sénégal

Show navigation Hide navigation
  • OSIRIS
    • Objectifs
    • Partenaires
  • Ressources
    • Société de l’Information
    • Politique nationale
    • Législation et réglementation
    • Etudes et recherches
    • Points de vue
  • Articles de presse
  • Chiffres clés
    • Le Sénégal numérique
    • Principaux tarifs
    • Principaux indicateurs
  • Opportunités
    • Projets

Accueil > Articles de presse > Année 2026 > Février 2026 > Google lance WAXAL, une base de données vocale pour les langues africaines

Google lance WAXAL, une base de données vocale pour les langues africaines

mercredi 4 février 2026

L’Afrique subsaharienne compte plus de 2000 langues, mais moins de 5% disposent aujourd’hui de ressources suffisantes pour le traitement automatique du langage naturel. Une sous-représentation limite fortement l’efficacité des technologies vocales existantes pour les utilisateurs africains.

Google a officiellement lancé WAXAL, une base de données vocale « open source » destinée à favoriser le développement de technologies d’intelligence artificielle (IA) capables de comprendre et de restituer les langues africaines. Le projet, développé sur trois ans en partenariat avec des institutions du continent, vise à répondre à un manque structurel de données linguistiques, longtemps identifié comme un frein majeur à l’essor de l’IA vocale en Afrique subsaharienne.

Désormais accessible librement sur la plateforme Hugging Face, WAXAL rassemble plus de 11 000 heures d’enregistrements vocaux, issues de près de deux millions de fichiers audio. La base couvre 21 langues africaines, parmi lesquelles le haoussa, le yoruba, le luganda, l’acholi, le swahili, l’igbo ou encore le peul.

La collecte des données a été assurée par plusieurs partenaires africains, dont l’université de Makerere en Ouganda et l’université du Ghana, qui ont piloté les travaux pour 13 langues, ainsi que l’initiative rwandaise Digital Umuganda, en charge de cinq langues supplémentaires. Des studios régionaux ont également contribué à la production d’enregistrements de haute qualité, tandis que l’Institut africain des sciences mathématiques (AIMS) a participé à la constitution de corpus multilingues pour de futures versions.

Pensée comme une infrastructure de base, WAXAL fournit environ 1250 heures de parole transcrite pour la reconnaissance automatique de la parole, ainsi que plus de 20 heures d’enregistrements en studio destinés à la synthèse vocale. L’objectif est de permettre le développement d’applications reposant sur la voix, comme des assistants vocaux, des outils de dictée, ou encore des services publics accessibles aux populations peu ou non lettrées, notamment dans les domaines de la santé, de l’éducation ou de l’agriculture.

« Cette base de données fournit un socle essentiel pour permettre aux chercheurs et aux entrepreneurs de concevoir des technologies adaptées à leurs langues et à leurs contextes », explique Aisha Walcott-Bryant, responsable de Google Research Africa.

Le lancement de WAXAL intervient dans un contexte de mobilisation croissante autour des technologies linguistiques africaines. En 2025, le Nigeria a par exemple présenté N-ATLAS, un modèle linguistique open source capable de transcrire la parole en yoruba, haoussa, igbo et en anglais nigérian. Dans le secteur privé, des start-up africaines développent également des solutions de reconnaissance vocale et de traduction ciblant les usages locaux.

L’enjeu est considérable. L’Afrique subsaharienne compte plus de 2000 langues, mais une poignée disposent aujourd’hui des ressources nécessaires au traitement automatique du langage naturel. Cette situation limite l’accès de millions de personnes aux technologies vocales, pourtant devenues courantes dans d’autres régions du monde.

Selon le modèle de partenariat retenu, les institutions africaines ayant contribué à la collecte des données conservent la propriété des corpus, tout en les rendant accessibles sous licence ouverte. Pour Joyce Nakatumba-Nabende, enseignante-chercheuse à l’université de Makerere, « pour que l’intelligence artificielle ait un impact réel en Afrique, elle doit être capable de parler nos langues et de refléter nos réalités ».

Fiacre E. Kakpo

(Source : Agence Ecofin, 4 février 2026)

Fil d'actu

  • Charte de membre Africollector Burkina NTIC (25 février 2026)
  • TIC ET AGRICULTURE AU BURKINA FASO Étude sur les pratiques et les usages Burkina NTIC (9 avril 2025)
  • Sortie de promotion DPP 2025 en Afrique de l’Ouest Burkina NTIC (12 mars 2025)
  • Nos étudiant-es DPP cuvée 2024 tous-tes diplomés-es de la Graduate Intitute de Genève Burkina NTIC (12 mars 2025)
  • Retour sur images Yam Pukri en 2023 Burkina NTIC (7 mai 2024)

Liens intéressants

  • NIC Sénégal
  • ISOC Sénégal
  • Autorité de régulation des télécommunications et des postes (ARTP)
  • Fonds de Développement du Service Universel des Télécommunications (FDSUT)
  • Commission de protection des données personnelles (CDP)
  • Conseil national de régulation de l’audiovisuel (CNRA)
  • Sénégal numérique (SENUM SA)

Navigation par mots clés

  • 5856/6426 Régulation des télécoms
  • 427/6426 Télécentres/Cybercentres
  • 4729/6426 Economie numérique
  • 2366/6426 Politique nationale
  • 6426/6426 Fintech
  • 675/6426 Noms de domaine
  • 2520/6426 Produits et services
  • 1923/6426 Faits divers/Contentieux
  • 901/6426 Nouveau site web
  • 6332/6426 Infrastructures
  • 2458/6426 TIC pour l’éducation
  • 238/6426 Recherche
  • 288/6426 Projet
  • 4701/6426 Cybersécurité/Cybercriminalité
  • 2410/6426 Sonatel/Orange
  • 2150/6426 Licences de télécommunications
  • 373/6426 Sudatel/Expresso
  • 1273/6426 Régulation des médias
  • 1580/6426 Applications
  • 1366/6426 Mouvements sociaux
  • 2175/6426 Données personnelles
  • 372/6426 Big Data/Données ouvertes
  • 800/6426 Mouvement consumériste
  • 462/6426 Médias
  • 815/6426 Appels internationaux entrants
  • 2329/6426 Formation
  • 125/6426 Logiciel libre
  • 2779/6426 Politiques africaines
  • 1238/6426 Fiscalité
  • 268/6426 Art et culture
  • 725/6426 Genre
  • 2205/6426 Point de vue
  • 1339/6426 Commerce électronique
  • 1869/6426 Manifestation
  • 403/6426 Presse en ligne
  • 152/6426 Piratage
  • 249/6426 Téléservices
  • 1291/6426 Biométrie/Identité numérique
  • 411/6426 Environnement/Santé
  • 419/6426 Législation/Réglementation
  • 558/6426 Gouvernance
  • 2255/6426 Portrait/Entretien
  • 187/6426 Radio
  • 944/6426 TIC pour la santé
  • 338/6426 Propriété intellectuelle
  • 76/6426 Langues/Localisation
  • 1361/6426 Médias/Réseaux sociaux
  • 2675/6426 Téléphonie
  • 230/6426 Désengagement de l’Etat
  • 1474/6426 Internet
  • 152/6426 Collectivités locales
  • 532/6426 Dédouanement électronique
  • 1608/6426 Usages et comportements
  • 1354/6426 Télévision/Radio numérique terrestre
  • 657/6426 Audiovisuel
  • 4486/6426 Transformation digitale
  • 487/6426 Affaire Global Voice
  • 234/6426 Géomatique/Géolocalisation
  • 495/6426 Service universel
  • 811/6426 Sentel/Tigo
  • 224/6426 Vie politique
  • 1974/6426 Distinction/Nomination
  • 39/6426 Handicapés
  • 909/6426 Enseignement à distance
  • 878/6426 Contenus numériques
  • 746/6426 Gestion de l’ARTP
  • 225/6426 Radios communautaires
  • 2673/6426 Qualité de service
  • 548/6426 Privatisation/Libéralisation
  • 163/6426 SMSI
  • 639/6426 Fracture numérique/Solidarité numérique
  • 3760/6426 Innovation/Entreprenariat
  • 1692/6426 Liberté d’expression/Censure de l’Internet
  • 56/6426 Internet des objets
  • 206/6426 Free Sénégal
  • 1028/6426 Intelligence artificielle
  • 246/6426 Editorial
  • 38/6426 Gaming/Jeux vidéos
  • 33/6426 Yas

2026 OSIRIS
Plan du site - Archives (Batik)

Suivez-vous