IA : un modèle adapté à 11 langues officielles voit le jour en Afrique du Sud
mercredi 6 mai 2026
Face aux biais des modèles occidentaux, des initiatives émergent pour entraîner de grands modèles de langage (LLM) sur des données africaines. En Afrique du Sud, des chercheurs d’une prestigieuse université proposent une nouvelle solution.
Des chercheurs de l’université du Cap (UCT) ont mis au point un modèle d’intelligence artificielle (IA) capable de traiter les 11 langues officielles parlées en Afrique du Sud. Baptisé MzansiLM, ce modèle s’inscrit dans une dynamique visant à adapter l’IA aux réalités locales, encore largement sous-représentées dans les systèmes globaux.
Contrairement aux grands modèles internationaux, principalement entraînés sur des données en anglais ou en langues européennes, MzansiLM repose sur un corpus spécifique baptisé MzansiText, conçu pour intégrer les particularités linguistiques sud-africaines. Cette approche permet d’améliorer les performances de l’IA sur des langues dites « à faibles ressources », pour lesquelles les données disponibles sont limitées. Les langues prises en compte par le modèle sont le zoulou, le xhosa, l’afrikaans, l’anglais, le sepedi, le tswana, le sotho, le tsonga, le swati, le venda et le ndébélé.
« Notre ensemble de données, MzansiText, reste modeste par rapport aux données disponibles pour les langues à ressources abondantes telles que l’anglais et les principales langues européennes et asiatiques, mais il est plus volumineux que les ensembles de données précédents consacrés aux langues sud-africaines », a déclaré Jan Buys, maître de conférences au département d’informatique de l’UCT.
Dans de nombreux pays africains, les solutions d’IA peinent à répondre aux besoins des populations locales, faute d’une compréhension fine des langues et des contextes culturels. En développant un modèle adapté à son environnement, l’équipe de l’université du Cap apporte une réponse concrète à cette problématique.
Au-delà de la recherche, les applications potentielles sont nombreuses : assistants vocaux, traduction automatique, services publics numériques ou encore outils éducatifs. Une meilleure prise en compte des langues locales pourrait ainsi faciliter l’accès aux services digitaux pour une part plus large de la population.
Cette initiative illustre une tendance émergente en Afrique : le développement de solutions d’IA locales, conçues pour pallier les limites des modèles globaux. Plus tôt dans la semaine, le gouvernement tanzanien a communiqué sur le développement d’un modèle de langage basé sur le kiswahili, dans le cadre de sa stratégie nationale de transformation numérique. Par ailleurs, des initiatives privées ont vu le jour, comme N-ATLAS au Nigeria ou encore UlizaLlama au Kenya.
Adoni Conrad Quenum
(Source : Agence Ecofin, 6 mai 2026)
OSIRIS