Le Monde (site web) mercredi 12 février 2025 2110 mots
Données personnelles en vente libre : les « data brokers », une industrie hors de contrÎle
Les donnĂ©es personnelles gĂ©olocalisĂ©es de millions dâutilisateurs sont agrĂ©gĂ©es par des courtiers en donnĂ©es, dans des conditions douteuses. Une menace pour la vie privĂ©e des personnes, rĂ©vĂšle une enquĂȘte du « Monde », menĂ©e en partenariat avec plusieurs mĂ©dias internationaux.
Quand elle veut sâoccuper, Marie-Claire sort son tĂ©lĂ©phone et sâinstalle dans le fauteuil du salon de sa petite maison de Pleubian (CĂŽtes-dâArmor). La retraitĂ©e de 66 ans peut passer des heures sur Candy Crush, Farm Heroes et bien dâautres jeux. Elle ne se doutait pas, en revanche, que ses distractions prĂ©fĂ©rĂ©es pouvaient collecter et revendre des informations sur elle : ses heures de connexion, son modĂšle de smartphone ou sa position gĂ©ographique.
Ces éléments figurent dans un gigantesque fichier vendu par un courtier en données américain, Datastream Group. Le Monde et huit médias partenaires ont eu accÚs à un échantillon commercial de cette base de données, dans laquelle figurent déjà plus de 47 millions de personnes.
A premiĂšre vue, ces mobinautes semblent anonymes, car ils apparaissent sous lâidentifiant publicitaire (unique) associĂ© Ă leur tĂ©lĂ©phone. Cependant, il ne nous a fallu que quelques minutes pour remonter Ă Marie-Claire en suivant la trace dâun joueur de Words of Wonders en Bretagne, ses coordonnĂ©es GPS permettant dâidentifier son domicile.
EtonnĂ©e de notre appel, elle nous a confirmĂ© sâadonner rĂ©guliĂšrement Ă ce jeu, sans savoir que son crĂ©ateur tirait profit de ses donnĂ©es. « Pour moi, ce nâest pas clair du tout. Maintenant que vous me lâapprenez, je vais le dĂ©sinstaller ! », peste-t-elle.
De gigantesques fichiers constitués de maniÚre opaque
La colĂšre et la surprise de Marie-Claire ne surprennent guĂšre ceux qui, depuis des annĂ©es, travaillent sur ces questions, comme Mathieu Cunche, professeur dâinformatique Ă lâInstitut national des sciences appliquĂ©es de Lyon et Ă lâInstitut national de recherche en sciences et technologies du numĂ©rique. Le diagnostic de lâuniversitaire est sans appel : « Il sâagit dâune collecte massive que la plupart des utilisateurs ne soupçonnent pas, pas plus que la quantitĂ© et la circulation de ces donnĂ©es, qui sont hors de contrĂŽle. »
Les data brokers eux-mĂȘmes restent discrets sur lâorigine de leurs donnĂ©es. Plusieurs circuits existent. Elles peuvent dâabord ĂȘtre collectĂ©es et partagĂ©es directement par les applications. La transmission peut aussi se faire par le biais dâune de leurs briques logicielles â les « SDK » (pour « Software Development Kit »). Ces outils, gratuits, sont utilisĂ©s par de nombreux Ă©diteurs pour faciliter le dĂ©veloppement et la monĂ©tisation de leurs applications. Les entreprises tierces qui les proposent se rĂ©munĂšrent, quant Ă elles, grĂące aux donnĂ©es personnelles des mobinautes.
Des donnĂ©es sâĂ©changent Ă©galement par le biais du marchĂ© publicitaire Ă enchĂšres en temps rĂ©el (dit RTB, pour « real-time bidding »), trĂšs rĂ©pandu dans la rĂ©clame en ligne. ConcrĂštement, Ă chaque fois quâun encart publicitaire va ĂȘtre disponible sur lâĂ©cran dâun internaute, lâapplication diffuse son profil auprĂšs dâune myriade dâannonceurs potentiels (ou de leurs reprĂ©sentants) : « Qui veut envoyer une publicitĂ© Ă un utilisateur du Boncoin Ă Lille ? » Lâencart est ensuite attribuĂ© au plus offrant dans le cadre de transactions ultrarapides (la durĂ©e des Ă©changes se chiffre en millisecondes). Mais ce processus a un effet de bord : les enchĂ©risseurs potentiels ont accĂšs aux (nombreuses) donnĂ©es dâinternautes en circulation. DĂšs lors, certains acteurs peuvent dĂ©tourner ce systĂšme afin dâalimenter leurs fichiers.
Pour ne rien simplifier, il peut aussi y avoir des incohĂ©rences dans les fichiers des data brokers : mauvais horaires, mauvais nom dâapplication⊠Ces irrĂ©gularitĂ©s peuvent ĂȘtre le fruit dâerreurs techniques apparues au fil de la constitution du fichier ou de tromperies sur lâorigine de certaines donnĂ©es.
Plusieurs Ă©lĂ©ments laissent penser que tout ou partie des donnĂ©es de Datastream pourrait provenir dâEskimi, une plateforme publicitaire lituanienne. Le data broker amĂ©ricain lâidentifie comme la source dâun de ses autres fichiers, trĂšs proche de celui sur lequel nous avons enquĂȘtĂ©, dans une lettre Ă un sĂ©nateur amĂ©ricain enquĂȘtant sur les donnĂ©es publicitaires.
Eskimi est par ailleurs rĂ©fĂ©rencĂ© comme partenaire dâune grande part des applications de notre base de donnĂ©es. Lâentreprise a Ă©galement des liens Ă©troits avec Redmob, un courtier sis Ă DubaĂŻ, qui propose justement des fichiers issus dâenchĂšres publicitaires : son fondateur, Vytautas Paukstys, est aussi le patron dâEskimi. InterrogĂ©, celui-ci affirme quâEskimi nâa aucune relation commerciale avec Datastream, quâil nâa pas dâactivitĂ© de courtage en donnĂ©es et que Redmob, de son cĂŽtĂ©, respecte toutes les lois en vigueur.
Dans un communiquĂ©, Datastream nous assure, pour sa part, se procurer des donnĂ©es de maniĂšre lĂ©gitime, « par le truchement dâune entreprise tierce qui a bonne rĂ©putation ». Elle ajoute estimer que « ces donnĂ©es anonymisĂ©es ne peuvent, Ă elles seules, rĂ©vĂ©ler des informations sensibles ». Nos interrogations sur les risques de ce pistage ne seraient, par consĂ©quent, quâune « prĂ©sentation trompeuse des faits ».
Des risques pour les individus, voire les Etats
Explorer ce fichier, câest aussi mesurer la quantitĂ© dâinformations quâil agrĂšge sur un individu prĂ©cis. Les identifiants publicitaires associĂ©s aux smartphones permettent de croiser les donnĂ©es glanĂ©es sur un mobinaute, application par application, facilitant un profilage assez sophistiquĂ©.
Plusieurs entreprises vendent dâailleurs des Ă©tudes qui sâappuient sur ces fichiers. En France, câest par exemple le cas du groupe CBRE, qui propose des Ă©tudes de frĂ©quentation de zones urbaines, vendues notamment aux collectivitĂ©s territoriales, Ă partir des donnĂ©es gĂ©olocalisĂ©es de millions dâhabitants achetĂ©es Ă un data broker. Lâentreprise utilise notamment un algorithme qui dĂ©duit automatiquement lâadresse des utilisateurs Ă partir de leurs dĂ©placements.
Un autre problĂšme est apparu au fil de nos recherches : parmi les milliers de services qui font commerce des donnĂ©es personnelles de leurs utilisateurs, bon nombre portent sur des sujets dĂ©licats. Dans lâĂ©chantillon de Datastream, on trouve ainsi des applications confessionnelles, permettant de lire des pages de la Bible ou du Coran, dâautres dans le domaine de la santĂ©, utilisĂ©es par exemple pour surveiller sa pression artĂ©rielle, ou encore des sites de rencontres, notamment rĂ©servĂ©s Ă la communautĂ© LGBTQ+.
De telles informations peuvent causer un préjudice si elles tombent entre de mauvaises mains et leur partage est strictement encadré par le droit. En janvier, des millions de données géolocalisées provenant du courtier en données Gravy Analytics ont ainsi été mises en ligne par des hackeurs, rappelant le caractÚre sensible de telles bases de données.
GrĂące Ă ces fichiers, certaines sociĂ©tĂ©s vendent directement Ă des Etats â notamment Ă des services dâenquĂȘte amĂ©ricains, â des outils de gĂ©olocalisation et de surveillance permettant, par exemple, de savoir qui a frĂ©quentĂ© tel lieu ou dâidentifier les participants Ă une manifestation. Des questions de sĂ©curitĂ© nationale se posent Ă©galement, le mĂȘme procĂ©dĂ© pouvant servir Ă surveiller les entrĂ©es et sorties dans des sites sĂ©curisĂ©s â agences de renseignement, institutions, centrales nuclĂ©aires⊠Au cours dâune prĂ©cĂ©dente enquĂȘte, nos partenaires de Bayerischer Rundfunk et Netzpolitik.org avaient dĂ©montrĂ© que des agents du Bundesnachrichtendienst, le service de renseignement extĂ©rieur allemand, pouvaient ĂȘtre pistĂ©s de la sorte.
Un cadre juridique en principe strict
Les data brokers seraient-ils sans foi ni loi ? Un cadre juridique rigoureux et bien dĂ©fini sâimpose pourtant Ă eux : le RĂšglement gĂ©nĂ©ral sur la protection des donnĂ©es personnelles (RGPD), le texte de rĂ©fĂ©rence au niveau europĂ©en sur cette question, ainsi que la directive ePrivacy. La Commission nationale de lâinformatique et des libertĂ©s (CNIL), le « gendarme » français chargĂ© du respect de ces rĂšgles, peut aussi bien sanctionner des acteurs Ă lâĂ©tranger manipulant indĂ»ment des donnĂ©es dâutilisateurs en France que des sociĂ©tĂ©s ayant leur siĂšge dans lâHexagone.
Les donnĂ©es gĂ©olocalisĂ©es manipulĂ©es par les data brokers ne peuvent ĂȘtre considĂ©rĂ©es comme strictement « anonymes », au sens juridique du terme. MĂȘme en lâabsence du nom ou du prĂ©nom de lâutilisateur, elles « restent des donnĂ©es Ă caractĂšre personnel, dans la mesure oĂč elles sont indirectement identifiantes », rappelle Nacera Bekhat, cheffe du service de lâĂ©conomie numĂ©rique et du secteur financier Ă la CNIL. Il en va de lâIP comme de toute information permettant, par croisement, de retrouver lâidentitĂ© dâune personne.
Le RGPD sâapplique donc, confĂ©rant des droits aux citoyens concernĂ©s (notamment la possibilitĂ© de demander la suppression de leurs donnĂ©es) et imposant des obligations aux entreprises, comme stocker les informations de maniĂšre sĂ©curisĂ©e ou ne pas les conserver trop longtemps. Surtout, lâutilisation des donnĂ©es Ă des fins publicitaires ne peut se faire quâavec le consentement de lâutilisateur, qui doit ĂȘtre recueilli dans des conditions prĂ©cises : ĂȘtre libre, informĂ©, explicite et spĂ©cifique.
Or, lâinformation fournie aux internautes au moment de lâinstallation dâune application est souvent vague. Lâapplication Words of Wonders utilisĂ©e par Marie-Claire, par exemple, demande Ă ses utilisateurs de pouvoir « suivre [leurs] activitĂ©s dans les apps et sur les sites Web dâautres sociĂ©tĂ©s », un accĂšs prĂ©sentĂ© comme « nĂ©cessaire pour Ă©viter les publicitĂ©s indĂ©sirables ». Cela peut-il suffire Ă lĂ©gitimer la revente de ces donnĂ©es Ă des tiers dans des fichiers commerciaux comme ceux de Datastream ? ContactĂ©, son Ă©diteur, Fugo Games, nâa pas donnĂ© suite Ă nos sollicitations.
Plus gĂ©nĂ©ralement, les Ă©lĂ©ments soumis aux utilisateurs nâĂ©clairent guĂšre leur choix. Peu lisent vraiment les conditions dâutilisation dâune application ou consultent la liste des prestataires, notamment publicitaires, Ă qui les donnĂ©es peuvent ĂȘtre envoyĂ©es. Et pour cause : elle compte souvent plusieurs centaines de noms.
Des dérives difficiles à juguler
Cette situation est lâune des principales explications de la dissĂ©mination sauvage des donnĂ©es. Avec un tel nombre dâintermĂ©diaires, « on sâimagine bien quâil est difficile de maĂźtriser ce qui sera fait de vos donnĂ©es et qui, le cas Ă©chĂ©ant, les a utilisĂ©es de maniĂšre indue, analyse FrĂ©dĂ©ric Duflot, juriste spĂ©cialisĂ© en conformitĂ© numĂ©rique. Une seule acceptation et elles vont se retrouver partout. »
Au cours de nos recherches, plusieurs Ă©diteurs nous ont dit ignorer que leur application transmettait des donnĂ©es Ă la sociĂ©tĂ© Datastream. Ce transfert viendrait « probablement dâun SDK profitant de son installation pour collecter des donnĂ©es sans lâautorisation du dĂ©veloppeur de lâapplication ou le consentement des utilisateurs », avance Yves Benchimol, dirigeant de WeWard, une application populaire qui vise Ă encourager la marche. Il assure « [prendre] en ce moment les mesures nĂ©cessaires pour que cela ne puisse plus se produire ». Dâautres acteurs concĂšdent avoir peu de visibilitĂ© sur ces questions. « Je ne sais pas prĂ©cisĂ©ment quel type de donnĂ©es nos partenaires rĂ©cupĂšrent, mais en thĂ©orie, câest uniquement Ă des fins publicitaires », dĂ©clare ainsi le crĂ©ateur de NiamorDev, une sorte de tĂ©lĂ©commande sur mobile.
Les Ă©diteurs dâapplications mobiles gratuites sont en effet « fortement incitĂ©s Ă collecter les donnĂ©es de leurs utilisateurs, car la publicitĂ© est leur principale source de revenus », analyse Narseo Vallina Rodriguez, chercheur Ă lâIMDEA Networks Institute, Ă Madrid, et spĂ©cialiste des enjeux de protection des donnĂ©es mobiles. Or, une petite application gratuite peut difficilement le faire sans passer par des SDK, pour des raisons techniques et financiĂšres.
Ce constat nâenlĂšve rien au fait que lâĂ©diteur est le premier responsable de la protection des donnĂ©es personnelles de ses utilisateurs dans le droit europĂ©en. « Il a une responsabilitĂ© assez importante, car il est celui qui va permettre ou non lâentrĂ©e dâun certain nombre de donnĂ©es dans la chaĂźne, Ă la maniĂšre dâun vigile dâune boĂźte de nuit qui choisit qui entre ou non dans lâĂ©tablissement », rĂ©sume Nacera Bekhat, de la CNIL.
Des dĂ©cisions et sanctions ont dĂ©jĂ visĂ© des acteurs de cet Ă©cosystĂšme, mais les autoritĂ©s peinent Ă en juguler vraiment les dĂ©rives. « Le circuit peut ĂȘtre trĂšs long entre la source et lâutilisateur final de ces donnĂ©es Ă caractĂšre personnel. Sâil y a un acteur qui prĂ©sente des dĂ©fauts de conformitĂ© nâimporte oĂč dans la chaĂźne, alors le ver est dans le fruit et il nâest pas toujours Ă©vident de retrouver le âpĂ©chĂ© originelâ », analyse Tony Martin, chef du service des contrĂŽles de la CNIL. Si bien que les enquĂȘtes sont longues et complexes.
Le cas de lâapplication AndroĂŻd du Monde nous en a apportĂ© une preuve saisissante. Dans lâĂ©chantillon de Datastream, des donnĂ©es de gĂ©olocalisation approximatives concernant 4 581 identifiants publicitaires sont prĂ©sentĂ©es comme issues de notre Ă©dition mobile. Renseignements pris, Le Monde nâa aucun contact, juridique ou technique, avec le data broker amĂ©ricain. Dans le cas oĂč de telles donnĂ©es auraient bien Ă©tĂ© partagĂ©es avec lui, ce serait sans notre accord. A ce jour, lâentreprise nâa pas rĂ©pondu Ă la mise en demeure qui lui a Ă©tĂ© adressĂ©e.
Cet article est paru dans Le Monde (site web)
Ah ah câest vrai. Jâaime bien ses points de vue aĂ©ronautique mais bordel de merde il a une sponso Ă chaque vidĂ©o. Vive Sponsorblock !
(et câest incogni le site, jâai rĂ©pondu au dessus)