Les langue africaines sur Wikipédia :
place, intérêt et limites
Olivier Sagna
Université Cheikh Anta Diop de Dakar (Sénégal)
5ème colloque international de la langue française
Place, usages et variantes du français dans l'internet collaboratif
30 mars 2012, Paris (France)
- Janvier 2001, lancement de l’encyclopédie libre Wikipédia qui se veut :
- collective en ce qui concerne son mode d’élaboration,
- universelle quant à sa couverture thématique
- multilingue pour ce qui est de son véhicule de diffusion
- Janvier 2012, Wikipédia compte plus de 21 millions d’articles rédigés par plus d’un million de volontaires dans près de 300 langues
- Derrières ces chiffres se cachent cependant de grandes disparités :
- 4 langues (anglais, allemand, français et néerlandais) comptent plus d’un million d’articles
- 36 langues ont plus de 100 000 articles
- 68 langues ont plus de 10 000 articles
- 108 langues ont plus de 1000 articles
- 56 langues ont plus de 100 articles
- Et les langues africaines dans tout cela ?
- Les 2000 langues africaines représentent environ un tiers des langues du monde alors que la quarantaine de langue africaines présentes sur Wikipédia ne comptent que pour 13% du total des langues
- Seules une quarantaine de langues africaines sont présentes sur Wikipédia soit 0,5% du total des langues africaines
- Aucune des versions de Wikipédia rédigées dans une langue africaine ne compte plus de 40 000 articles
- Quelles sont les langues qui se distinguent ?
Seules cinq langues se distinguent nettement des autres avec des versions de Wikipédia comportant entre 10 000 et 40 000 articles à savoir :
1. Le Malgache : 36 282 articles
2. Le Yoruba : 29 850 articles
3. Le Swahili : 23 358 articles
4. L’Afrikaans : 21 560 articles
5. L’Amharique : 11 546 articles
- Quelles sont les raisons qui expliquent la forte présence de ces langues sur Wikipédia ?
- Grand nombre de locuteurs (Swahili : 40 à 50 millions de locuteurs, Amharique : 27 millions, Yoruba : 20 millions de locuteurs, Malgache : 20 millions de locuteurs)
- Statut de langue officielle, langue d’enseignement, langue utilisée dans la vie publique, disposant d’une presse, etc.
- Ancienneté de l’écriture : l’amharique utilise l’alphabet guèze qui remonte au Vème siècle dans sa version la plus récente, le swahili s’est d’abord écrit en arabe puis en caractères romanisés à partir du début du XXème siècle, idem pour le malgache écrit depuis le début du XVIème siècle puis romanisé dans le premier quart du XIXème siècle ou le Yoruba transcrit en caractère latin depuis la fin du XIXème siècle
- Les grandes langues absentes
Le Peul : 60 millions de locuteurs
Le Berbère : 45 millions de locuteurs
L’Igbo : 20 millions de locuteurs
Le Lingala : 10 à 35 millions de locuteurs
Le Mandingue : 12 millions de locuteurs
- Présence symbolique des autres langues
- Une présence marginale des langues africaines sur Wikipédia
Toutes langues africaines confondues : 135 581 articles
Esperanto : 161 337 articles
Arabe : 171 543 articles
Catalan : 368 538 articles (10 millions de locuteurs)
- Pourquoi une présence si faible sur Wikipédia?
Impact des différentes dimensions de la fracture numérique
Impact des politiques linguistiques qui relèguent souvent au second plan les langues africaines au profit des langues héritées de la colonisation
Absence de transcription officielle pour nombre de langues africaines
Utilisation d’alphabets particuliers dont l'encodage informatique n'est pas disponible (Ex. Le wolofal au Sénégal)
Obligation d'utiliser des claviers virtuels pour la saisie des graphies particulières gérées par le système d’encodage universel Unicode en l'absence de claviers élargis alternatifs aux claviers AZERTY et QWERTY
- Cependant la technique n’explique pas tout
Absence de mobilisation autour du projet Wikipédia plutôt vu comme un site comme un autre que comme une dynamique bénévole et collaborative
Nouveauté du concept de production collaborative de biens communs
Faiblesse du mouvement culturel et social en faveur de la promotion des langues africaines
Importance de l'analphabétisme intégral et de l’analphabétisme dans les langues africaines
Oralité demeure le mode d'expression dominant des langues africaines même lorsque celles-ci ont fait l'objet d'un travail de transcription
Langues africaines sur Internet plus des objets d’étude (mention, documentation, description, échantillons, textes, cours ) que des véhicules de communication (Marcel Diki-Kidiri et Edema Atibakwa Baboya, 2003)
Malgré tout les langues africaines ne sont pas absentes du Net et les langues africaines sont très utilisées dans les forums de discussions (Gilles Maurice de Schryver et Anneleen Van der Veken, 2003)
- Que conclure de tout cela ?
Wikipédia se veut un projet participatif ouvert aux experts comme au grand public or à l'examen la problématique de la présence des langues africaines sur Internet, sous leur forme écrite, montre qu'il s'agit essentiellement d'une affaire d'experts compte tenu des compétences exigées et des obstacles à surmonter pour écrire dans ces langues
La où les langues africaines sont largement utilisées sur Internet, à savoir dans les forums de discussion, dans les chats et dans les courriers électroniques, elles le sont de manière empirique, non codifiée, non harmonisée, sous une forme qui se rapproche plus de l'oralité que de l'écrit
Dans une tel contexte, les articles de Wikipédia rédigés dans les langues africaines s'apparentent plus à des ressources sur ces langues qu'à des ressources pour les locuteurs de ces langues
Jërëjëf ! (Wolof)
I ni cé ! (Bamanan)
Jaaraama ! (Pulaar)
Asante Sana ! (Swahili)