twitter facebook rss

Ressources

Imprimer Texte plus petit Texte plus grand

Internet et les langues nationales : réalité virtuelle ou chimère ?

samedi 29 octobre 2011

La problématique dont il est question ici relève de la traduction automatique, une application de la linguistique informatique ou suivant l’appellation anglo-saxonne la linguistique computationnelle, une discipline issue du développement de l’informatique dans le domaine des sciences du langage. L’objet premier de cette discipline est l’élaboration de modèles computationnels d’analyse et de génération à partir des quels on peut comprendre ou produire des énoncés en langues naturelles.

En ce qui concerne l’introduction de nos langues nationales (wolof, diola, sérère, etc.) dans internet, il s’agira de développer des programmes capables de les traduire vers les langues majoritairement utilisées sur internet (anglais, français, etc.). Il faut noter que de tels programmes font intervenir toutes les composantes majeures de la linguistique informatique comme l’analyse, les lexiques et la génération.

Dans leur grande majorité, les tentatives de développent de systèmes de traduction automatique se sont soldés par des échecs. Les exigences d’un système de traduction sont loin d’être satisfaites pour nos langues nationales. Nous devons d’abord tenter de les satisfaire si nous voulons éviter de tomber, malgré la puissance de calcul des ordinateurs d’aujourd’hui ainsi que leur haut niveau de langages de programmation, dans le piège qu’à connu les pionniers dans les années 1950.

En effet, il est intéressant de noter que la traduction automatique a constitué l’une des premières applications mon numérique des ordinateurs. En effet, les premières tentatives visant à utiliser l’ordinateur pour traduire un texte remontent au début des années 1950. Une quarantaine d’années plus tard, on ne peut que s’étonner de l’optimisme et, il faut bien le dire, de la naïveté des chercheurs, qui pensaient être en mesure de résoudre avec les moyens informatiques dérisoires de l’époque un problème que la technologie actuelle ne maitrise que bien partiellement. Il est difficile, en effet de se représenter aujourd’hui dans quelles conditions et avec quels moyens techniques ces premières recherches ont été entreprises. Du point de vue de la puissance de calcul et du stockage de données, le plus petit des ordinateurs personnels d’aujourd’hui est déjà incomparablement plus puissant et plus performant que les gigantesques machines du début des années 1950. Quant au logiciel, il faut se rappeler que le langage machine était le seul langage disponible.

Pour comprendre ce qui apparait aujourd’hui comme une aberration, il faut se rappeler la conjecture politique de l’époque - la guerre froide - et les besoins des services de renseignement. Ce n’est pas un hasard si tous les efforts de ces pionniers de la traduction automatique ont porté sur la traduction du russe vers l’anglais ou le français en Europe occidentale et aux Etats-Unis, et de l’anglais ou du français vers le russe du coté de l’ex-Union soviétique.

Du point de vue de la méthode utilisée, ces premiers systèmes de traduction automatique effectuent essentiellement une traduction mot-à-mot, l’analyse linguistique ne s’étendant guère au-delà de la morphologie et de certaines collocations. Il faut dire qu’en raison du manque de mémoire des machines de l’époque, pendant de nombreuses années la préoccupation dominante a été celle du stockage des données.

Il n’est guère surprenant, dans ces conditions, que malgré les moyens financiers considérables engagés par les agences gouvernementales dans ces recherches, les premières tentatives de traduction se sont toutes soldées par des échecs. Aux Etats-Unis, les recherches furent pratiquement toutes interrompues après 1965, à la suite d’un rapport établi à la demande de l’Académie nationale des sciences (le fameux rapport ALPAC , qui conclut à l’impossibilité de la traduction automatique sur la base des moyens technologiques et scientifiques de l’époque). La phrase anglaise qui était soumise à machine lors de la phase test fut : l’esprit est fort et la chaire est faible. Elle fut traduite en russe par : La vodka est forte et la viande est pourrie

Une des conséquences de ce rapport fut, du moins dans le monde occidental, la disparition de la traduction automatique de la scène scientifique et académique pour plus d’une dizaine d’années. Suivant les recommandations du rapport, la recherche s’oriente alors vers les questions fondamentales de la linguistique informatique (ou computationnelle) (méthode d’analyse de la langue naturelle) et de l’intelligence artificielle (problème de la représentation de la connaissance, etc.).

Petit à petit, les développements technologiques, aussi bien au niveau des machines que du logiciel, ceux de la linguistique théorique, ainsi que des besoins toujours plus pressants des administrations, de l’industrie et du commerce international, submergés par l’augmentation constante du volume des documents à traduire ont remis la traduction à l’ordre du jour, et on assiste depuis la fin des années 1970 au lancement de nombreux projets de traduction automatique ou de traduction assistée par ordinateur. Ainsi au Japon, on comptait pratiquement une vingtaine de groupes de recherche sur la traduction automatique en 1982, contre une dizaine seulement en Europe et aux Etats-Unis. Parmi ces derniers, les plus connus sont METAL et Eurotra. METAL est un système de traduction allemand-anglais développé à l’université du Texas avec l’aide de la compagnie Siemens, qui l’a commercialisé à la fin des années quatre-vingt. Il s’agit d’un système de 2e génération, ce qui signifie que le système effectue une analyse syntaxique des phrases sources. Quant au projet Eurotra, financé par l’Union européenne, il visait à développer un système expérimental plurilingue portant sur les langues officielles de la communauté européenne, utilisant une technologie relativement proche de celle du système METAL. Le projet, qui à son apogée a regroupé plus d’une centaine de collaborateur répartis dans les différents groupes nationaux, s’est achevé en 1992, sans parvenir toutefois à réaliser le prototype attendu.

A ce jour, les deux systèmes les plus utilisés sont sans doute SYSTRAN et Globalink tous deux issus des technologies de traduction des années 1960-1970. Le premier utilisé par l’union européenne et quelques grandes entreprises comme Xerox et GM doit son succès à ses énormes dictionnaires, le second à son prix modeste, sa disponibilité sur ordinateurs personnels et sa facilité d’utilisation.

Mar Ndiaye, Bargny
Spécialiste des technologies cognitives : technologies web & technologies du langage.
776207099

(Source : Dakaractu, 29 octobre 2011)

Mots clés

Inscrivez-vous a BATIK

Inscrivez-vous à notre newsletter et recevez toutes nos actualités par email.

Navigation par mots clés

153 153 153 144 144 144 238 238 238 168 168 168 145 145 145 170 170 170 171 171 171 160 160 160 172 172 172 173 173 173 154 154 154 174 174 174 226 226 226 155 155 155 176 176 176 177 177 177 237 237 237 250 250 250 241 241 241 157 157 157 178 178 178 180 180 180 259 259 259 181 181 181 159 159 159 248 248 248 183 183 183 239 239 239 256 256 256 185 185 185 162 162 162 186 186 186 187 187 187 191 191 191 192 192 192 234 234 234 194 194 194 195 195 195 196 196 196 197 197 197 198 198 198 199 199 199 229 229 229 233 233 233 202 202 202 228 228 228 204 204 204 232 232 232 206 206 206 253 253 253 208 208 208 209 209 209 210 210 210 211 211 211 212 212 212 213 213 213 214 214 214 254 254 254 217 217 217 218 218 218 249 249 249 219 219 219 220 220 220 230 230 230 222 222 222 252 252 252 255 255 255 242 242 242 243 243 243 244 244 244 245 245 245 246 246 246 258 258 258 260 260 260 261 261 261 48 48 48 61 61 61 59 59 59 12 12 12 11 11 11 70 70 70 53 53 53 127 127 127 132 132 132 75 75 75 123 123 123 15 15 15 52 52 52 110 110 110 49 49 49 14 14 14 28 28 28 13 13 13 73 73 73 164 164 164 77 77 77 112 112 112 113 113 113 18 18 18 102 102 102 105 105 105 78 78 78 119 119 119 65 65 65 47 47 47 16 16 16 120 120 120 90 90 90 133 133 133 81 81 81 116 116 116 20 20 20 135 135 135 136 136 136 137 137 137 21 21 21 129 129 129 35 35 35 22 22 22 67 67 67 7 7 7 79 79 79 69 69 69 108 108 108 84 84 84 87 87 87 96 96 96 23 23 23 25 25 25 106 106 106 82 82 82 32 32 32 76 76 76 72 72 72 115 115 115 26 26 26 104 104 104 29 29 29 58 58 58 30 30 30 46 46 46 31 31 31 62 62 62 88 88 88 55 55 55 101 101 101 86 86 86 10 10 10 80 80 80 114 114 114 92 92 92 100 100 100 85 85 85 36 36 36 125 125 125 37 37 37 38 38 38 109 109 109 74 74 74 51 51 51 50 50 50 39 39 39 83 83 83 40 40 40 66 66 66 68 68 68 93 93 93 99 99 99 60 60 60 57 57 57 24 24 24 41 41 41 42 42 42 134 134 134 19 19 19 43 43 43 111 111 111 17 17 17 117 117 117 97 97 97 94 94 94 54 54 54 71 71 71 122 122 122 33 33 33 56 56 56 131 131 131 98 98 98 34 34 34 89 89 89 91 91 91 45 45 45 107 107 107

INTERNET EN CHIFFRES

- Bande passante internationale : 172 Gbps
- 4 FAI (Orange, Arc Télécom, Waw Télécom et Africa Access)
- 10 770 683 abonnés Internet

  • 10 512 647 abonnés 2G+3G+4G (97,60%)
  • 99 177 clés et box Internet (1,11%)
  • 138 743 abonnés ADSL (1,31%)
  • 17 952 abonnés bas débit (0,17%)
  • 2164 abonnés aux 4 FAI

- Liaisons louées : 22 633

- Taux de pénétration des services Internet : 68,49%

(ARTP, 31 mars 2019)

- 7 260 000 utilisateurs
- Taux de pénétration : 58,20%

(Internet World Stats 31 décembre 2018)

- 4710 noms de domaine actifs en .sn

(NIC Sénégal, 25 septembre 2018)

TÉLÉPHONIE EN CHIFFRES


Téléphonie fixe

- 2 opérateurs : Orange et Expresso
- 307 736 abonnés
- 237 282 lignes résidentielles (77,11%)
- 70 363 lignes professionnelles (22,86%)
- 84 lignes publiques (0,03%)
- Taux de pénétration : 1,95%

(ARTP, 31 mars 2019)


Téléphonie mobile

- 3 opérateurs (Orange, Tigo et Expresso)
- 16 977 104 abonnés
- Taux de pénétration : 107,95%

(ARTP, 30 septembre 2018)

FACEBOOK

- 3 171 000 utilisateurs

- Taux de pénétration de Facebook : 18,6%

(Facebook, Juin 2019)