Le Kirghizistan a passé un siècle sous la domination impériale russe et soviétique, mais la langue kirghize a survécu. Aujourd’hui, il reste largement parlé par les adultes et constitue une pierre angulaire de l’identité nationale. Cependant, une nouvelle étude révèle une autre menace pour son avenir : non pas l’oppression politique, mais les algorithmes de recommandation de YouTube.
Des chercheurs de l’Université du Michigan, de Berkeley et d’autres institutions ont découvert que l’algorithme de la plateforme donne systématiquement la priorité au contenu en russe par rapport aux vidéos en langue kirghize, en particulier pour les intérêts des enfants. Ce virage numérique inverse par inadvertance des décennies de résilience linguistique, éloignant une nouvelle génération de sa langue maternelle vers la langue de ses anciens colonisateurs.
Le biais algorithmique
L’inquiétude est apparue pour la première fois lors d’un travail de terrain réalisé par Ashley McDermott, doctorante à l’Université du Michigan. Lors de ses recherches au Kirghizistan, elle a été confrontée à une plainte récurrente de la part des parents et des éducateurs : les enfants des villages ruraux, où le kirghize était la langue dominante à la maison, captaient spontanément des phrases et des accents russes.
Les adultes de ces communautés ont identifié un seul coupable : YouTube.
Pour tester cette hypothèse, McDermott et une équipe de cinq chercheurs ont réalisé une simulation du comportement des utilisateurs sur la plateforme. Ils ont collecté près de 11 000 résultats de recherche uniques et recommandations de vidéos, en se concentrant sur des sujets populaires auprès des enfants, tels que les dessins animés, les contes de fées et les sirènes.
Les résultats ont été frappants. Lors de la recherche de ces sujets en kirghize, l’algorithme renvoyait rarement du contenu dans cette langue. Plus inquiétant encore, l’équipe a simulé des utilisateurs ayant déjà regardé 10 vidéos pour enfants présentant la langue kirghize – un signal clair de préférence pour cette langue. Malgré ces solides données comportementales, l’algorithme a recommandé à ces utilisateurs moins de vidéos en langue kirghize qu’à des « robots » simulés qui ne montraient aucune préférence linguistique.
« Les enfants kirghizes sont construits algorithmiquement comme des publics pour le contenu russe », a déclaré Nel Escher, co-auteur et chercheur postdoctoral à l’UC Berkeley. “Il n’y a pas de bonne façon d’être un enfant parlant le kirghize sur YouTube.”
Un héritage colonial numérique
Les résultats mettent en évidence la façon dont les plateformes numériques peuvent renforcer les dynamiques de pouvoir historiques. Sous le régime soviétique, la maîtrise du russe était essentielle à la réussite économique et sociale du Kirghizistan. Aujourd’hui, alors que de nombreux adultes sont bilingues et que le kirghize est obligatoire dans les écoles, le russe reste la lingua franca du commerce et, de plus en plus, du divertissement numérique.
Les chercheurs ont découvert que lors de la recherche de termes orthographiés de manière identique dans les deux langues, tels que Harry Potter ou Minecraft, les résultats étaient principalement en russe. Dans l’ensemble, seulement 2,7 % des vidéos analysées présentaient des personnes d’origine kirghize.
Ce déséquilibre crée un puissant effet socialisant. Les chercheurs soutiennent que YouTube apprend aux jeunes utilisateurs à considérer le russe comme la langue par défaut de la technologie et du divertissement, tout en présentant le kirghize comme périphérique ou sans intérêt. Cela se reflète dans leur comportement hors ligne : les enfants kirghizes citent de plus en plus l’argot russe sur Internet, imitent les accents russes et adoptent la syntaxe russe dans leur discours quotidien.
Le coût humain
Pour les parents qui tentent de préserver le lien de leurs enfants avec leur héritage, le biais algorithmique constitue un obstacle frustrant. McDermott se souvient avoir parlé avec une mère en 2023 qui lui a expliqué qu’elle payait délibérément sa facture Internet avec un jour de retard chaque mois. Cela lui a permis de passer une journée sans accès à Internet à la maison, donnant ainsi à sa famille un bref répit face à l’influence de YouTube.
Le problème n’est pas un manque de contenu. Les chercheurs ont noté qu’il existe de nombreux documents de haute qualité en langue kirghize. En 2024, D Billions, un studio de contenu pour enfants basé au Kirghizistan, s’est classé au 35e rang des chaînes YouTube les plus regardées au monde. Sa chaîne dédiée en langue kirghize compte près d’un million d’abonnés, ce qui prouve qu’il existe une audience importante pour les contenus en langue maternelle.
Malgré cela, l’algorithme ne parvient pas à présenter ce matériel aux utilisateurs qui le recherchent. YouTube, qui s’est publiquement engagé à amplifier les voix autochtones, n’a pas répondu aux demandes de commentaires concernant ces conclusions. Cependant, l’équipe de recherche tente de dialoguer avec l’équipe de contrôle parental de YouTube pour discuter de la mise en œuvre de filtres linguistiques qui pourraient contribuer à atténuer ce biais.
Conclusion
Cette étude constitue un avertissement critique sur les conséquences involontaires de la curation algorithmique. Si la technologie connecte le monde, elle peut également effacer les cultures locales si rien n’est fait pour y remédier. La survie de la langue kirghize dépend désormais non seulement des écoles et des familles, mais aussi de la capacité des plateformes numériques à reconnaître et à promouvoir la diversité linguistique plutôt que de renforcer les hiérarchies historiques.






























