OSIRIS

Observatoire sur les systèmes d’information, les réseaux et les inforoutes au Sénégal

Show navigation Hide navigation
  • OSIRIS
    • Objectifs
    • Partenaires
  • Ressources
    • Société de l’Information
    • Politique nationale
    • Législation et réglementation
    • Etudes et recherches
    • Points de vue
  • Articles de presse
  • Chiffres clés
    • Le Sénégal numérique
    • Principaux tarifs
    • Principaux indicateurs
  • Opportunités
    • Projets

Accueil > Articles de presse > Archives 1999-2025 > Année 2023 > Janvier 2023 > Kenya : premiers remous pour ChatGPT

Kenya : premiers remous pour ChatGPT

vendredi 27 janvier 2023

Contenus numériques

Depuis quelques temps ChatGPT secoue l’écosystème numérique. Dans ce vent de succès, ChatGPT vient de vivre sa première zone de turbulences au Kenya.

Dans le monde de l’intelligence artificielle, ChatGPT occupe l’actualité depuis novembre 2022. Mais la trouvaille qui fait tant parler vit ses premiers soubresauts. Selon une enquête du magazine Time décrit par le biais d’un prestataire établi en Afrique, OpenAI aurait entraîné son modèle en demandant à des salariés sous-payés d’étiqueter des milliers de textes atroces. Réagissant à cette information, l’accusé indique que « sa mission est de s’assurer que l’intelligence artificielle générale profite à toute l’Humanité ».

Mais l’enquête donne une toute autre version. Le journal révèle que « l’entreprise a eu recours aux services d’une entreprise, Sama, afin d’ « apprendre » à ChatGPT ne pas répondre à ses utilisateurs de façon toxique ou violente. Le siège de Sama, qui a aussi pour clients Google, Microsoft ou la Nasa, est à San Francisco… Mais les dizaines d’employés qui ont travaillé sur ChatGPT habitent loin, très loin de la Silicon Valley », indique-t-il.

Ce sont en effet des travailleurs kenyans de Sama, payés selon Time entre 1,20 et 2 euros de l’heure, qui ont réalisé le « sale boulot » qui nous permet aujourd’hui d’utiliser ChatGPT sans que le bot se perde dans des délires toxiques, racistes, violents.

Analyse de mots piochés sur le web

Dans le détail, l’article revient avec insistance sur le calvaire des travailleurs. « Pour bien comprendre ce que ces travailleurs payés une misère ont dû endurer, il faut d’abord expliquer rapidement comment ChatGPT est entraîné, et la technique d’OpenAI pour l’empêcher de générer un discours toxique. L’intelligence du bot vient de la collecte et de l’analyse de milliards d’ensembles de mots piochés sur le Web. Une somme qui, bien entendu, comporte aussi une quantité considérable de ce que les échanges humains produisent de pire… et qui se retrouvent dans le modèle, une fois ce dernier entraîné », lit-on dans l’article.

Étant presque dans l’impossibilité de vérifier ces éléments « à la main », l’OpenAi a alors décidé d’intégrer à ChatGPT un mécanisme de protection, une sorte d’IA « gendarme » entraînée par des humains, capable de limiter les discours toxiques générés par le modèle. Pour cela, il faut la « nourrir » d’autres types de textes bien spécifiques : des discours haineux, sexuellement explicites, violents, toxiques… Pire, les « étiqueteurs » de Sama que Time a pu interviewer ont dit avoir eu à décrire pour la machine entre 150 et 250 passages de ce genre par jour, comportant de 100 à 1000 mots à raison de 9 heures de travail quotidien.

Sama évoque de son côté un chiffre plus bas, d’environ 70 contenus par jour. Qu’importe : la violence psychologique d’un tel travail peut être traumatisante. Un employé interrogé par le magazine parle même de « torture » en se remémorant avoir eu à étiqueter par exemple un contenu décrivant « un homme ayant des relations sexuelles avec un chien en présence d’un enfant ». Le calvaire ne s’arrête pas là.

Une collecte d’images inquiétante

Au-delà de l’étiquetage de textes violents, OpenAI a passé un autre contrat avec Sama, qui a conduit à la fin précipitée de leur collaboration. En février 2022, le créateur de ChatGPT demande à son prestataire de collecter « des images sexuelles et violentes » pour un autre de ses projets, une « étape nécessaire pour rendre ses outils plus sûrs ». La firme s’est exécutée et a collecté 1 400 images, dont des clichés clairement illégaux, parmi lesquels des images de violences sexuelles sur enfants, de viols, de meurtres… Une collecte qui a rapidement inquiété la branche africaine, et mené à la fin précoce d’un contrat qui devait encore durer huit mois.

Aujourd’hui, l’affaire continue de secouer l’écosystème et les accusés se renvoient la balle. Même si elle n’a pas encore révélé tous ses secrets, cette affaire garde un aspect sombre. C’est d’autant plus problématique que la main d’œuvre employée à cette tâche est à la fois mal rémunérée et très peu suivie psychologiquement. Un comble, quand les entreprises qui les emploient -toujours très discrètement – pèsent plusieurs dizaines de milliards de dollars. Pour rappel, OpenAI serait déjà valorisée 29 milliards de dollars.

Mamadou Diop

(Source : CIO Mag, 27 janvier 2022)

Fil d'actu

  • Charte de membre Africollector Burkina NTIC (25 février 2026)
  • TIC ET AGRICULTURE AU BURKINA FASO Étude sur les pratiques et les usages Burkina NTIC (9 avril 2025)
  • Sortie de promotion DPP 2025 en Afrique de l’Ouest Burkina NTIC (12 mars 2025)
  • Nos étudiant-es DPP cuvée 2024 tous-tes diplomés-es de la Graduate Intitute de Genève Burkina NTIC (12 mars 2025)
  • Retour sur images Yam Pukri en 2023 Burkina NTIC (7 mai 2024)

Liens intéressants

  • NIC Sénégal
  • ISOC Sénégal
  • Autorité de régulation des télécommunications et des postes (ARTP)
  • Fonds de Développement du Service Universel des Télécommunications (FDSUT)
  • Commission de protection des données personnelles (CDP)
  • Conseil national de régulation de l’audiovisuel (CNRA)
  • Sénégal numérique (SENUM SA)

Navigation par mots clés

  • 4547/5230 Régulation des télécoms
  • 364/5230 Télécentres/Cybercentres
  • 3446/5230 Economie numérique
  • 1799/5230 Politique nationale
  • 5230/5230 Fintech
  • 536/5230 Noms de domaine
  • 2132/5230 Produits et services
  • 1537/5230 Faits divers/Contentieux
  • 786/5230 Nouveau site web
  • 5187/5230 Infrastructures
  • 1877/5230 TIC pour l’éducation
  • 203/5230 Recherche
  • 254/5230 Projet
  • 3642/5230 Cybersécurité/Cybercriminalité
  • 2067/5230 Sonatel/Orange
  • 1637/5230 Licences de télécommunications
  • 280/5230 Sudatel/Expresso
  • 1030/5230 Régulation des médias
  • 1335/5230 Applications
  • 1451/5230 Mouvements sociaux
  • 1921/5230 Données personnelles
  • 133/5230 Big Data/Données ouvertes
  • 622/5230 Mouvement consumériste
  • 384/5230 Médias
  • 682/5230 Appels internationaux entrants
  • 1716/5230 Formation
  • 94/5230 Logiciel libre
  • 2040/5230 Politiques africaines
  • 1036/5230 Fiscalité
  • 182/5230 Art et culture
  • 604/5230 Genre
  • 1804/5230 Point de vue
  • 1086/5230 Commerce électronique
  • 1535/5230 Manifestation
  • 332/5230 Presse en ligne
  • 135/5230 Piratage
  • 230/5230 Téléservices
  • 967/5230 Biométrie/Identité numérique
  • 316/5230 Environnement/Santé
  • 386/5230 Législation/Réglementation
  • 376/5230 Gouvernance
  • 1880/5230 Portrait/Entretien
  • 153/5230 Radio
  • 771/5230 TIC pour la santé
  • 297/5230 Propriété intellectuelle
  • 66/5230 Langues/Localisation
  • 1282/5230 Médias/Réseaux sociaux
  • 2106/5230 Téléphonie
  • 205/5230 Désengagement de l’Etat
  • 1150/5230 Internet
  • 124/5230 Collectivités locales
  • 481/5230 Dédouanement électronique
  • 1155/5230 Usages et comportements
  • 1089/5230 Télévision/Radio numérique terrestre
  • 571/5230 Audiovisuel
  • 3464/5230 Transformation digitale
  • 410/5230 Affaire Global Voice
  • 170/5230 Géomatique/Géolocalisation
  • 376/5230 Service universel
  • 700/5230 Sentel/Tigo
  • 186/5230 Vie politique
  • 1566/5230 Distinction/Nomination
  • 36/5230 Handicapés
  • 717/5230 Enseignement à distance
  • 851/5230 Contenus numériques
  • 597/5230 Gestion de l’ARTP
  • 191/5230 Radios communautaires
  • 1800/5230 Qualité de service
  • 439/5230 Privatisation/Libéralisation
  • 146/5230 SMSI
  • 477/5230 Fracture numérique/Solidarité numérique
  • 2812/5230 Innovation/Entreprenariat
  • 1556/5230 Liberté d’expression/Censure de l’Internet
  • 52/5230 Internet des objets
  • 173/5230 Free Sénégal
  • 774/5230 Intelligence artificielle
  • 216/5230 Editorial
  • 43/5230 Gaming/Jeux vidéos
  • 24/5230 Yas

2026 OSIRIS
Plan du site - Archives (Batik)

Suivez-vous