Une équipe d'universitaires constituée de chercheurs issus de quatre universités américaines et canadiennes a indiqué avoir mesuré la taille et les effets de cet outil de censure déployé par le gouvernement chinois pour contrôler la navigation de ses citoyens. Dans un projet de recherche qui a duré neuf mois, d'avril à décembre 2020, des universitaires ont développé un système appelé GFWatch qui accédait à des domaines à l'intérieur et à l'extérieur de l'espace Internet chinois, puis mesurait comment le Great Firewall (GFW) altérerait la connexion au niveau DNS afin d'empêcher les utilisateurs chinois d'accéder à un domaine, ou une entité externe d'accéder à des sites internes chinois.
« L'appareil de filtrage DNS du Great Firewall (GFW) a considérablement évolué au cours des deux dernières décennies. Cependant, la plupart des études antérieures sur le filtrage DNS de la Chine ont été réalisées sur de courtes périodes, entraînant des changements inaperçus dans le comportement du GFW. Dans cette étude, nous présentons GFWatch, une plateforme de mesure longitudinale à grande échelle capable de tester quotidiennement des centaines de millions de domaines, permettant une surveillance continue du comportement de filtrage DNS de GFW ».
À l'aide de GFWatch, les chercheurs ont déclaré avoir testé 534 millions de domaines distincts, accédant quotidiennement à environ 411 millions de domaines afin d'enregistrer puis de vérifier que les blocages étaient persistants.
Après neuf mois de compilation de données, ils ont découvert que le grand pare-feu chinois bloque actuellement environ 311 000 domaines, avec 270 000 domaines bloqués intentionnellement tandis que 41 000 domaines semblent avoir été bloqués par accident.
L'équipe de recherche a déclaré que ces derniers domaines semblaient avoir été bloqués accidentellement lorsque les autorités chinoises ont essayé de bloquer un domaine plus court et ont utilisé une expression régulière de filtrage DNS large (regex) qui ne tenait pas compte des situations où ce domaine plus court faisait également partie d'un nom de domaine plus long, bloquant indirectement d'autres sites.
À titre d’exemple, les scientifiques détaillent que le blocage de la plateforme de forums reddit.com a engendré des blocages collatéraux sur plus d’un millier de sites sans lien, comme booksreddit.com ou geareddit.com et 1 087 autres sites. La raison ? Le filtre mis en place au niveau du DNS vise l’expression « reddit » mais n’exclut pas les cas où « reddit » serait inclus dans un mot plus long.
L’étude ne s’arrête pas à la quantité, elle évalue aussi la qualité des contenus bloqués. En utilisant des services de catégorisation de domaines comme FortiGuard, les chercheurs ont déclaré qu'environ 40 % des sites bloqués étaient des domaines nouvellement enregistrés et que les autorités chinoises ont décidé de bloquer par défaut, le temps de catégoriser leur contenu et d’éventuellement les intégrer à la liste blanche.
Les 60 % de domaines bloqués restants contiennent, quant à eux, toutes sortes de contenus. L'équipe de recherche a déclaré que les domaines les plus bloqués hébergeaient généralement du contenu lié aux entreprises, suivis des domaines hébergeant de la pornographie, puis des domaines dédiés aux technologies de l'information. D'autres types de domaines bloqués comprenaient des sites hébergeant des outils pour éviter les blocages du Great Firewall, des sites de jeux d'argent, des blogs personnels, des sites de divertissement, des sites d'actualités et de médias et des domaines hébergeant du contenu malveillant/malware.
Top 10 des catégories de domaines bloquées par le GFW
De plus, alors que le projet se déroulait et que la pandémie de coronavirus augmentait en intensité l'année dernière, les chercheurs ont également repéré des domaines liés au COVID-19 ajoutés aux règles de filtrage GFW en temps réel. Cela comprenait des blocages pour des domaines comme covid19classaction.it, covid19song.info, covidcon.org, ccpcoronavirus.com, covidhaber.net et covid-19truth.info. Ils ont noté que l'État chinois était accusé d'être responsable de la pandémie de coronavirus sur certains de ces sites.
Finalement, l’ampleur du Grand Firewall paraît plus réduite que ce que l’on pourrait imaginer : « Nous avons découvert que la plupart des domaines bloqués par le GFW n’apparaissent pas sur les listes des sites les plus populaires ». Sur un échantillon de 138 700 domaines, les universitaires ont déclaré que seulement 1,3% (~1 800) sites figuraient parmi les 100 000 sites les plus populaires sur Internet (selon le classement Tranco).
En outre, en utilisant GFWatch, les chercheurs ont déclaré avoir également repéré des cas où les blocages basés sur le DNS chinois (qui impliquent généralement la modification des enregistrements DNS renvoyés aux utilisateurs chinois) ont également accidentellement pollué des enregistrements DNS en dehors de l'espace Internet chinois, à l'intérieur des réseaux de plusieurs fournisseurs DNS pour au moins 77 000 sites.
Toutefois, il convient de garder à l’esprit que le « Projet bouclier doré », partie intégrante du Grand Firewall, ne se limite pas aux filtres DNS.
Source : résultats de la recherche
Et vous ?
Quelle lecture en faites-vous ?
Voir aussi :
Une application qui permettait aux utilisateurs chinois de contourner le Grand Pare-feu et d'accéder à Google, Facebook a disparu, après cinq millions de téléchargements
Le géant chinois des médias sociaux WeChat supprimerait les comptes des personnes non hétérosexuelles (LGBT) dans le cadre d'une nouvelle mesure de répression
Les applications chinoises pourraient faire l'objet d'assignations ou d'interdictions en vertu d'un décret de Joe Biden
La Chine a construit 819 000 stations de base 5G, soit 70 % du total mondial, selon le ministère chinois de l'Industrie et des Technologies de l'information