Quelle que soit la bonne volonté dont Google pourrait avoir montré ces dernières années, par exemple en combattant les abus de publicité et le pistage systémique des utilisateurs, ses efforts ont été remis en cause avec la solution que l’entreprise a proposée. L'apprentissage fédéré des cohortes ou FLoC est présenté comme une meilleure stratégie qui protège la vie privée des gens tout en offrant aux annonceurs quelque chose dont ils peuvent profiter. Les défenseurs de la vie privée, cependant, sonnent l'alarme sur ce qu'ils considèrent comme une technologie encore pire et les éditeurs de navigateurs basés sur Chromium comme Brave et Vivaldi s'engagent à lutter contre FLoC sous toutes ses formes.
En quelques mots, FLoC échange le suivi des utilisateurs individuels et le fingerprinting contre une identification de groupe (cohorte) basée sur des historiques de navigation similaires des membres de ce groupe. FLoC place essentiellement les personnes dans des groupes basés sur des comportements de navigation similaires, ce qui signifie que seuls des « identifiants de cohorte » et non des identifiants d'utilisateurs individuels sont utilisés pour les cibler. L'historique Web et les entrées pour l'algorithme sont conservés sur le navigateur, le navigateur exposant uniquement une « cohorte » contenant des milliers de personnes.
Cependant, de nombreux défenseurs de la protection de la vie privée n'en sont pas convaincus et considèrent FLoC comme une solution encore pire que le problème qu'il tente de résoudre. En plus de violer potentiellement des lois comme le RGPD, les critiques soulignent également que FLoC collecte davantage de données privées sous la forme d'historique de navigation, ce que même les cookies de suivi ne font pas. Bien que des identités individuelles uniques puissent être cachées derrière des cohortes, les données détenues par l'historique de navigation peuvent toujours être considérées comme quelque chose de privé, en particulier lorsqu'il sera facile de développer des profils pour les membres de ce groupe.
Suite au tollé provoqué par sa proposition, Google a annoncé que FLoC (Federated Learning of Cohorts), son projet controversé de Google visant à remplacer les cookies pour la publicité ciblée par centres d'intérêt en regroupant les utilisateurs en groupes d'utilisateurs ayant des intérêts comparables, est mort. À sa place, Google a fait une nouvelle proposition : Topics. L'idée ici est que votre navigateur apprendra vos intérêts au fur et à mesure que vous vous déplacerez sur le Web. Il conservera les données pendant les trois dernières semaines de votre historique de navigation et à partir de maintenant, Google limite le nombre de sujets à 300, avec des plans pour étendre cela au fil du temps. Google note que ces sujets n'incluront aucune catégorie sensible comme le sexe ou la race. Pour déterminer vos intérêts, Google classe les sites que vous visitez en fonction de l'un de ces 300 sujets. Pour les sites qu'il n'a pas classés auparavant, un algorithme d'apprentissage automatique léger dans le navigateur prendra le relais et fournira un sujet estimé basé sur le nom du domaine.
Fonctionnement de l'API Topics
« L'autopsie » de FLoC
Malgré le fait que Google ait annoncé l'abandon du projet FLoC, des informaticiens du MIT Media Lab se sont intéressés à ce système de ciblage publicitaire et ont découvert qu'il lui manquait son ingrédient clé annoncé*: la confidentialité.
« FLoC fournit un mécanisme de préservation de la vie privée pour la sélection d'annonces basée sur les centres d'intérêt », explique Sam Dutton, Google Chrome developer advocate, sur le site web.dev de Google.
Ce devait être l'une des nombreuses technologies proposées dans ce que Google appelle avec optimisme The Privacy Sandbox , une initiative « pour créer des technologies qui protègent la vie privée des personnes en ligne tout en donnant aux entreprises et aux développeurs des outils pour créer des entreprises numériques florissantes ».
FLoC visait à regrouper les visiteurs du site Web en groupes appelés cohortes. Ces cohortes correspondaient à diverses catégories d'intérêts issues des historiques de navigation des personnes, mais sans rendre ces personnes identifiables ni exposer leurs historiques de navigation.
En théorie, les sites Web mettant en œuvre FLoC pourraient envoyer le numéro d'identification de la cohorte d'un visiteur à un serveur publicitaire et récupérer une publicité susceptible de s'aligner sur le comportement de navigation passé du visiteur sans pouvoir deviner l'identité du visiteur.
Mais FLoC a à peine réussi à décoller. Suite à son commit initial de code en août 2019 et à son essai sur le navigateur Chrome au début de 2021, Google a terminé son essai en juillet 2021, afin d'apporter des modifications non spécifiées. Puis, en janvier 2022, Google a annoncé la mort de FLoC et l'a remplacé par un autre système publicitaire basé sur les intérêts, également ostensiblement respectueux de la vie privée, appelé Topics.
Sans se laisser décourager par les éditeurs de navigateurs rivaux comme Apple, Brave et Mozilla, ou par des groupes de défense comme l'Electronic Frontier Foundation, qui ont remis en question à la fois les motivations de Google et sa technologie, Google ne cesse de répéter le mot « confidentialité » en relation avec sa pile adtech qui en est encore au stade expérimental.
Pourtant, dans un article de recherche récent intitulé Privacy Limitations Of Interest-based Advertising On The Web: A Post-mortem Empirical Analysis Of Google's FLoC, les doctorants du MIT Media Lab Alex Berke et Dan Calacci soutiennent que le FLoC n'a pas réussi à assurer la confidentialité et a mis des renseignements personnels à risque.
Les défenseurs de la vie privée ont exprimé ces inquiétudes au sujet de FLoC lors de son test. Mais Google n'a jamais révélé le déroulement de ses tests, laissant les observateurs s'interroger sur les résultats. Alors Berke et Calacci ont décidé d'enquêter.
Les deux universitaires se sont mis à implémenter FLoC en utilisant le code open source disponible. Ils ont calculé des cohortes pour les utilisateurs sur la base d'un ensemble de données de plus de 90 000 appareils d'environ 50 000 ménages à travers les États-Unis, complétés par des données démographiques de ces ménages.
Leur analyse a indiqué que les critiques de FLoC étaient justes, et ils ont émis l'hypothèse selon laquelle les problèmes de confidentialité de FLoC sont le déclencheur de la décision de Google lorsque la grande entreprise a décidé d'y mettre un terme pour opter pour Topics.
« Tout d'abord, contrairement à ses objectifs fondamentaux, FLoC permet le suivi des utilisateurs individuels sur les sites », indique le document. « Nous constatons que plus de 95% des appareils des utilisateurs sont identifiables de manière unique après seulement quatre semaines. Nous montrons ensuite à quel point ces estimations sont extrêmement conservatrices et que ce risque augmente avec l'utilisation de méthodes courantes de fingerprinting des appareils ».
Cependant, FLoC n'était pas entièrement sans mérite. Les chercheurs notent que bien qu'il existe une relation entre les données démographiques sensibles des utilisateurs comme la race et le revenu et le comportement de navigation, l'algorithme FLoC qu'ils ont testé n'a pas regroupé les utilisateurs en cohortes en fonction de la race ou du revenu. Cela compte pour quelque chose.
Berke et Calacci soutiennent que ceux qui développent ce type de technologie devraient publier des outils, des exemples d'ensembles de données et du code - comme ils l'ont fait - pour permettre à d'autres chercheurs de tester toutes les affirmations faites.
« Google a annulé FLoC en faveur d'une nouvelle approche (Topics), qui est une étape plus respectueuse de la vie privée vers la publicité basée sur le contenu contextuel », expliquent les chercheurs. « Cependant, comme FLoC, il repose toujours sur le suivi des comportements de navigation des utilisateurs et les travaux futurs devront démontrer que cette nouvelle approche va suffisamment loin pour préserver la confidentialité des utilisateurs ».
Exemples d'illustrations de ce que vous pouvez voir sur les cookies tiers (à gauche) par rapport aux Topics (à droite). Dans Chrome, Google prévoie de faciliter la reconnaissance et la gestion des Topics pour les utilisateurs.
Comment l'API Topics marche
La publicité basée sur les intérêts (IBA - Interest-based advertising) est une forme de publicité personnalisée dans laquelle une publicité est sélectionnée pour l'utilisateur en fonction des intérêts dérivés des sites qu'il a visités dans le passé. Ceci est différent de la publicité contextuelle, qui est basée uniquement sur les intérêts dérivés du site actuel consulté (et sur lequel la publicité est faite). L'un des avantages d'IBA est qu'il permet aux sites qui sont utiles à l'utilisateur, mais qui ne pourraient peut-être pas être facilement monétisés via la publicité contextuelle, d'afficher des publicités plus pertinentes pour l'utilisateur qu'ils ne le pourraient autrement, aidant ainsi à financer les sites que l'utilisateur visite.
L'API Topics a pour but de fournir aux appelants (y compris les fournisseurs tiers de technologies publicitaires ou de publicité sur la page qui exécutent le script) des sujets publicitaires généraux qui pourraient actuellement intéresser le visiteur de la page. Ces sujets compléteront le contexte signaux de la page actuelle et peuvent être combinés pour aider à trouver une publicité appropriée pour le visiteur.
Exemple d'utilisation pour récupérer une annonce ciblée par centres d'intérêt :
Code JavaScript : | Sélectionner tout |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | // document.browsingTopics() returns an array of up to three topic objects in random order. const topics = await document.browsingTopics(); // The returned array looks like: [{'value': Number, 'taxonomyVersion': String, 'modelVersion': String}] // Get data for an ad creative. const response = await fetch('https://ads.example/get-creative', { method: 'POST', headers: { 'Content-Type': 'application/json', }, body: JSON.stringify(topics) }); // Get the JSON from the response. const creative = await response.json(); // Display ad. |
Sources : analyse de FloC, article des chercheurs
Et vous ?
Que pensez-vous de l'analyse des chercheurs ?