Le Monde (site web) mercredi 12 février 2025 2110 mots

Données personnelles en vente libre : les « data brokers », une industrie hors de contrÎle

Les donnĂ©es personnelles gĂ©olocalisĂ©es de millions d’utilisateurs sont agrĂ©gĂ©es par des courtiers en donnĂ©es, dans des conditions douteuses. Une menace pour la vie privĂ©e des personnes, rĂ©vĂšle une enquĂȘte du « Monde », menĂ©e en partenariat avec plusieurs mĂ©dias internationaux.

Quand elle veut s’occuper, Marie-Claire sort son tĂ©lĂ©phone et s’installe dans le fauteuil du salon de sa petite maison de Pleubian (CĂŽtes-d’Armor). La retraitĂ©e de 66 ans peut passer des heures sur Candy Crush, Farm Heroes et bien d’autres jeux. Elle ne se doutait pas, en revanche, que ses distractions prĂ©fĂ©rĂ©es pouvaient collecter et revendre des informations sur elle : ses heures de connexion, son modĂšle de smartphone ou sa position gĂ©ographique.

Ces éléments figurent dans un gigantesque fichier vendu par un courtier en données américain, Datastream Group. Le Monde et huit médias partenaires ont eu accÚs à un échantillon commercial de cette base de données, dans laquelle figurent déjà plus de 47 millions de personnes.

A premiĂšre vue, ces mobinautes semblent anonymes, car ils apparaissent sous l’identifiant publicitaire (unique) associĂ© Ă  leur tĂ©lĂ©phone. Cependant, il ne nous a fallu que quelques minutes pour remonter Ă  Marie-Claire en suivant la trace d’un joueur de Words of Wonders en Bretagne, ses coordonnĂ©es GPS permettant d’identifier son domicile.

EtonnĂ©e de notre appel, elle nous a confirmĂ© s’adonner rĂ©guliĂšrement Ă  ce jeu, sans savoir que son crĂ©ateur tirait profit de ses donnĂ©es. « Pour moi, ce n’est pas clair du tout. Maintenant que vous me l’apprenez, je vais le dĂ©sinstaller ! », peste-t-elle.

De gigantesques fichiers constitués de maniÚre opaque

La colĂšre et la surprise de Marie-Claire ne surprennent guĂšre ceux qui, depuis des annĂ©es, travaillent sur ces questions, comme Mathieu Cunche, professeur d’informatique Ă  l’Institut national des sciences appliquĂ©es de Lyon et Ă  l’Institut national de recherche en sciences et technologies du numĂ©rique. Le diagnostic de l’universitaire est sans appel : « Il s’agit d’une collecte massive que la plupart des utilisateurs ne soupçonnent pas, pas plus que la quantitĂ© et la circulation de ces donnĂ©es, qui sont hors de contrĂŽle. »

Les data brokers eux-mĂȘmes restent discrets sur l’origine de leurs donnĂ©es. Plusieurs circuits existent. Elles peuvent d’abord ĂȘtre collectĂ©es et partagĂ©es directement par les applications. La transmission peut aussi se faire par le biais d’une de leurs briques logicielles – les « SDK » (pour « Software Development Kit »). Ces outils, gratuits, sont utilisĂ©s par de nombreux Ă©diteurs pour faciliter le dĂ©veloppement et la monĂ©tisation de leurs applications. Les entreprises tierces qui les proposent se rĂ©munĂšrent, quant Ă  elles, grĂące aux donnĂ©es personnelles des mobinautes.

Des donnĂ©es s’échangent Ă©galement par le biais du marchĂ© publicitaire Ă  enchĂšres en temps rĂ©el (dit RTB, pour « real-time bidding »), trĂšs rĂ©pandu dans la rĂ©clame en ligne. ConcrĂštement, Ă  chaque fois qu’un encart publicitaire va ĂȘtre disponible sur l’écran d’un internaute, l’application diffuse son profil auprĂšs d’une myriade d’annonceurs potentiels (ou de leurs reprĂ©sentants) : « Qui veut envoyer une publicitĂ© Ă  un utilisateur du Boncoin Ă  Lille ? » L’encart est ensuite attribuĂ© au plus offrant dans le cadre de transactions ultrarapides (la durĂ©e des Ă©changes se chiffre en millisecondes). Mais ce processus a un effet de bord : les enchĂ©risseurs potentiels ont accĂšs aux (nombreuses) donnĂ©es d’internautes en circulation. DĂšs lors, certains acteurs peuvent dĂ©tourner ce systĂšme afin d’alimenter leurs fichiers.

Pour ne rien simplifier, il peut aussi y avoir des incohĂ©rences dans les fichiers des data brokers : mauvais horaires, mauvais nom d’application
 Ces irrĂ©gularitĂ©s peuvent ĂȘtre le fruit d’erreurs techniques apparues au fil de la constitution du fichier ou de tromperies sur l’origine de certaines donnĂ©es.

Plusieurs Ă©lĂ©ments laissent penser que tout ou partie des donnĂ©es de Datastream pourrait provenir d’Eskimi, une plateforme publicitaire lituanienne. Le data broker amĂ©ricain l’identifie comme la source d’un de ses autres fichiers, trĂšs proche de celui sur lequel nous avons enquĂȘtĂ©, dans une lettre Ă  un sĂ©nateur amĂ©ricain enquĂȘtant sur les donnĂ©es publicitaires.

Eskimi est par ailleurs rĂ©fĂ©rencĂ© comme partenaire d’une grande part des applications de notre base de donnĂ©es. L’entreprise a Ă©galement des liens Ă©troits avec Redmob, un courtier sis Ă  DubaĂŻ, qui propose justement des fichiers issus d’enchĂšres publicitaires : son fondateur, Vytautas Paukstys, est aussi le patron d’Eskimi. InterrogĂ©, celui-ci affirme qu’Eskimi n’a aucune relation commerciale avec Datastream, qu’il n’a pas d’activitĂ© de courtage en donnĂ©es et que Redmob, de son cĂŽtĂ©, respecte toutes les lois en vigueur.

Dans un communiquĂ©, Datastream nous assure, pour sa part, se procurer des donnĂ©es de maniĂšre lĂ©gitime, « par le truchement d’une entreprise tierce qui a bonne rĂ©putation ». Elle ajoute estimer que « ces donnĂ©es anonymisĂ©es ne peuvent, Ă  elles seules, rĂ©vĂ©ler des informations sensibles ». Nos interrogations sur les risques de ce pistage ne seraient, par consĂ©quent, qu’une « prĂ©sentation trompeuse des faits ».

Des risques pour les individus, voire les Etats

Explorer ce fichier, c’est aussi mesurer la quantitĂ© d’informations qu’il agrĂšge sur un individu prĂ©cis. Les identifiants publicitaires associĂ©s aux smartphones permettent de croiser les donnĂ©es glanĂ©es sur un mobinaute, application par application, facilitant un profilage assez sophistiquĂ©.

Plusieurs entreprises vendent d’ailleurs des Ă©tudes qui s’appuient sur ces fichiers. En France, c’est par exemple le cas du groupe CBRE, qui propose des Ă©tudes de frĂ©quentation de zones urbaines, vendues notamment aux collectivitĂ©s territoriales, Ă  partir des donnĂ©es gĂ©olocalisĂ©es de millions d’habitants achetĂ©es Ă  un data broker. L’entreprise utilise notamment un algorithme qui dĂ©duit automatiquement l’adresse des utilisateurs Ă  partir de leurs dĂ©placements.

Un autre problĂšme est apparu au fil de nos recherches : parmi les milliers de services qui font commerce des donnĂ©es personnelles de leurs utilisateurs, bon nombre portent sur des sujets dĂ©licats. Dans l’échantillon de Datastream, on trouve ainsi des applications confessionnelles, permettant de lire des pages de la Bible ou du Coran, d’autres dans le domaine de la santĂ©, utilisĂ©es par exemple pour surveiller sa pression artĂ©rielle, ou encore des sites de rencontres, notamment rĂ©servĂ©s Ă  la communautĂ© LGBTQ+.

De telles informations peuvent causer un préjudice si elles tombent entre de mauvaises mains et leur partage est strictement encadré par le droit. En janvier, des millions de données géolocalisées provenant du courtier en données Gravy Analytics ont ainsi été mises en ligne par des hackeurs, rappelant le caractÚre sensible de telles bases de données.

GrĂące Ă  ces fichiers, certaines sociĂ©tĂ©s vendent directement Ă  des Etats – notamment Ă  des services d’enquĂȘte amĂ©ricains, – des outils de gĂ©olocalisation et de surveillance permettant, par exemple, de savoir qui a frĂ©quentĂ© tel lieu ou d’identifier les participants Ă  une manifestation. Des questions de sĂ©curitĂ© nationale se posent Ă©galement, le mĂȘme procĂ©dĂ© pouvant servir Ă  surveiller les entrĂ©es et sorties dans des sites sĂ©curisĂ©s – agences de renseignement, institutions, centrales nuclĂ©aires
 Au cours d’une prĂ©cĂ©dente enquĂȘte, nos partenaires de Bayerischer Rundfunk et Netzpolitik.org avaient dĂ©montrĂ© que des agents du Bundesnachrichtendienst, le service de renseignement extĂ©rieur allemand, pouvaient ĂȘtre pistĂ©s de la sorte.

Un cadre juridique en principe strict

Les data brokers seraient-ils sans foi ni loi ? Un cadre juridique rigoureux et bien dĂ©fini s’impose pourtant Ă  eux : le RĂšglement gĂ©nĂ©ral sur la protection des donnĂ©es personnelles (RGPD), le texte de rĂ©fĂ©rence au niveau europĂ©en sur cette question, ainsi que la directive ePrivacy. La Commission nationale de l’informatique et des libertĂ©s (CNIL), le « gendarme » français chargĂ© du respect de ces rĂšgles, peut aussi bien sanctionner des acteurs Ă  l’étranger manipulant indĂ»ment des donnĂ©es d’utilisateurs en France que des sociĂ©tĂ©s ayant leur siĂšge dans l’Hexagone.

Les donnĂ©es gĂ©olocalisĂ©es manipulĂ©es par les data brokers ne peuvent ĂȘtre considĂ©rĂ©es comme strictement « anonymes », au sens juridique du terme. MĂȘme en l’absence du nom ou du prĂ©nom de l’utilisateur, elles « restent des donnĂ©es Ă  caractĂšre personnel, dans la mesure oĂč elles sont indirectement identifiantes », rappelle Nacera Bekhat, cheffe du service de l’économie numĂ©rique et du secteur financier Ă  la CNIL. Il en va de l’IP comme de toute information permettant, par croisement, de retrouver l’identitĂ© d’une personne.

Le RGPD s’applique donc, confĂ©rant des droits aux citoyens concernĂ©s (notamment la possibilitĂ© de demander la suppression de leurs donnĂ©es) et imposant des obligations aux entreprises, comme stocker les informations de maniĂšre sĂ©curisĂ©e ou ne pas les conserver trop longtemps. Surtout, l’utilisation des donnĂ©es Ă  des fins publicitaires ne peut se faire qu’avec le consentement de l’utilisateur, qui doit ĂȘtre recueilli dans des conditions prĂ©cises : ĂȘtre libre, informĂ©, explicite et spĂ©cifique.

Or, l’information fournie aux internautes au moment de l’installation d’une application est souvent vague. L’application Words of Wonders utilisĂ©e par Marie-Claire, par exemple, demande Ă  ses utilisateurs de pouvoir « suivre [leurs] activitĂ©s dans les apps et sur les sites Web d’autres sociĂ©tĂ©s », un accĂšs prĂ©sentĂ© comme « nĂ©cessaire pour Ă©viter les publicitĂ©s indĂ©sirables ». Cela peut-il suffire Ă  lĂ©gitimer la revente de ces donnĂ©es Ă  des tiers dans des fichiers commerciaux comme ceux de Datastream ? ContactĂ©, son Ă©diteur, Fugo Games, n’a pas donnĂ© suite Ă  nos sollicitations.

Plus gĂ©nĂ©ralement, les Ă©lĂ©ments soumis aux utilisateurs n’éclairent guĂšre leur choix. Peu lisent vraiment les conditions d’utilisation d’une application ou consultent la liste des prestataires, notamment publicitaires, Ă  qui les donnĂ©es peuvent ĂȘtre envoyĂ©es. Et pour cause : elle compte souvent plusieurs centaines de noms.

Des dérives difficiles à juguler

Cette situation est l’une des principales explications de la dissĂ©mination sauvage des donnĂ©es. Avec un tel nombre d’intermĂ©diaires, « on s’imagine bien qu’il est difficile de maĂźtriser ce qui sera fait de vos donnĂ©es et qui, le cas Ă©chĂ©ant, les a utilisĂ©es de maniĂšre indue, analyse FrĂ©dĂ©ric Duflot, juriste spĂ©cialisĂ© en conformitĂ© numĂ©rique. Une seule acceptation et elles vont se retrouver partout. »

Au cours de nos recherches, plusieurs Ă©diteurs nous ont dit ignorer que leur application transmettait des donnĂ©es Ă  la sociĂ©tĂ© Datastream. Ce transfert viendrait « probablement d’un SDK profitant de son installation pour collecter des donnĂ©es sans l’autorisation du dĂ©veloppeur de l’application ou le consentement des utilisateurs », avance Yves Benchimol, dirigeant de WeWard, une application populaire qui vise Ă  encourager la marche. Il assure « [prendre] en ce moment les mesures nĂ©cessaires pour que cela ne puisse plus se produire ». D’autres acteurs concĂšdent avoir peu de visibilitĂ© sur ces questions. « Je ne sais pas prĂ©cisĂ©ment quel type de donnĂ©es nos partenaires rĂ©cupĂšrent, mais en thĂ©orie, c’est uniquement Ă  des fins publicitaires », dĂ©clare ainsi le crĂ©ateur de NiamorDev, une sorte de tĂ©lĂ©commande sur mobile.

Les Ă©diteurs d’applications mobiles gratuites sont en effet « fortement incitĂ©s Ă  collecter les donnĂ©es de leurs utilisateurs, car la publicitĂ© est leur principale source de revenus », analyse Narseo Vallina Rodriguez, chercheur Ă  l’IMDEA Networks Institute, Ă  Madrid, et spĂ©cialiste des enjeux de protection des donnĂ©es mobiles. Or, une petite application gratuite peut difficilement le faire sans passer par des SDK, pour des raisons techniques et financiĂšres.

Ce constat n’enlĂšve rien au fait que l’éditeur est le premier responsable de la protection des donnĂ©es personnelles de ses utilisateurs dans le droit europĂ©en. « Il a une responsabilitĂ© assez importante, car il est celui qui va permettre ou non l’entrĂ©e d’un certain nombre de donnĂ©es dans la chaĂźne, Ă  la maniĂšre d’un vigile d’une boĂźte de nuit qui choisit qui entre ou non dans l’établissement », rĂ©sume Nacera Bekhat, de la CNIL.

Des dĂ©cisions et sanctions ont dĂ©jĂ  visĂ© des acteurs de cet Ă©cosystĂšme, mais les autoritĂ©s peinent Ă  en juguler vraiment les dĂ©rives. « Le circuit peut ĂȘtre trĂšs long entre la source et l’utilisateur final de ces donnĂ©es Ă  caractĂšre personnel. S’il y a un acteur qui prĂ©sente des dĂ©fauts de conformitĂ© n’importe oĂč dans la chaĂźne, alors le ver est dans le fruit et il n’est pas toujours Ă©vident de retrouver le “pĂ©chĂ© originel” », analyse Tony Martin, chef du service des contrĂŽles de la CNIL. Si bien que les enquĂȘtes sont longues et complexes.

Le cas de l’application AndroĂŻd du Monde nous en a apportĂ© une preuve saisissante. Dans l’échantillon de Datastream, des donnĂ©es de gĂ©olocalisation approximatives concernant 4 581 identifiants publicitaires sont prĂ©sentĂ©es comme issues de notre Ă©dition mobile. Renseignements pris, Le Monde n’a aucun contact, juridique ou technique, avec le data broker amĂ©ricain. Dans le cas oĂč de telles donnĂ©es auraient bien Ă©tĂ© partagĂ©es avec lui, ce serait sans notre accord. A ce jour, l’entreprise n’a pas rĂ©pondu Ă  la mise en demeure qui lui a Ă©tĂ© adressĂ©e.

Cet article est paru dans Le Monde (site web)

  • Skunk@jlai.lu
    link
    fedilink
    Français
    arrow-up
    4
    ·
    3 months ago

    Mentour Pilot

    Ah ah c’est vrai. J’aime bien ses points de vue aĂ©ronautique mais bordel de merde il a une sponso Ă  chaque vidĂ©o. Vive Sponsorblock !

    (et c’est incogni le site, j’ai rĂ©pondu au dessus)