anonymat – Digital Media Knowledge

25/03/202525/03/2025

Fin de l’anonymat sur les réseaux sociaux : comment l’IA enfonce le dernier clou ?

Autrefois, sur les premiers forums et réseaux sociaux, un simple pseudonyme pouvait donner l’illusion d’être anonyme. Derrière un écran, chacun se créait un alias et pouvait s’exprimer librement sans afficher son nom civil. Mais au fil des années, cet anonymat en ligne s’est érodé. La multiplication des données collectées, des avancées technologiques et maintenant de l’intelligence artificielle ont peu à peu levé le voile. Aujourd’hui, il devient presque impossible de passer inaperçu sur les réseaux sociaux, une quasi-impossibilité de garantir l’anonymat à l’ère de l’IA. Comment en est-on arrivé là, et en quoi l’IA représente-t-elle le dernier clou dans le cercueil de l’anonymat en ligne ?

Pseudonymisation et anonymat : l’illusion d’une protection déjà mise à mal

Pendant des années, le pseudonyme représentait un moyen simple et intuitif de conserver un anonymat relatif sur les plateformes sociales comme Twitter, Reddit ou Instagram. Pourtant, dès le début, cette protection était en partie illusoire, car les pseudonymes ne protégeaient que des regards superficiels.

Chaque activité sur internet laisse en effet une multitude de traces numériques, ou métadonnées : adresses IP, localisation géographique approximative, données de navigation, historique des sites visités, informations stockées par les cookies publicitaires, ou encore données sur l’appareil utilisé (type d’ordinateur, résolution d’écran). Si ces informations sont individuellement banales, leur combinaison permet très rapidement d’identifier une personne, même sans connaître son nom réel.

Un exemple célèbre remonte à 2006, lorsque AOL publia involontairement des millions de recherches anonymisées. Parmi ces recherches figuraient des requêtes anodines sur des lieux précis, qui ont suffi à des journalistes pour identifier une femme précisément. Plus récemment encore, une étude publiée en 2019 dans la revue scientifique Nature Communications a démontré que seulement trois données basiques (âge, genre, code postal) suffisaient pour ré-identifier précisément 99,8 % des utilisateurs dans une base pourtant anonymisée.

Parallèlement à ces recherches, une autre technique a pris de l’ampleur : le fingerprinting numérique. Chaque appareil connecté à Internet génère une signature unique en fonction de ses caractéristiques techniques (version de navigateur, plugins installés, fuseau horaire, polices d’écriture). L’Electronic Frontier Foundation souligne que ce fingerprinting identifie un internaute avec une précision supérieure à 90 %, sans jamais avoir recours à son nom ou son email.

Enfin, la pseudonymisation atteint également ses limites sous les pressions économiques et techniques. Les réseaux sociaux utilisent des algorithmes sophistiqués qui croisent constamment des données sur les utilisateurs pseudonymes, afin de les relier à leur identité réelle et ainsi améliorer le ciblage publicitaire. Par exemple, Facebook utilise régulièrement ces procédés pour suggérer des « amis » sur la base de connexions indirectes (même lieu, même adresse IP, mêmes intérêts).

L’IA : un coup fatal à l’anonymat numérique

Si l’anonymat était déjà fragile, l’intelligence artificielle vient aujourd’hui lui porter le coup de grâce, à travers trois avancées majeures particulièrement puissantes :

Reconnaissance faciale : Clearview AI, symbole de la fin d’un anonymat visuel

Clearview AI constitue l’exemple le plus frappant de cette nouvelle réalité. Cette entreprise américaine a accumulé des milliards d’images provenant de plateformes publiques comme Facebook, Instagram ou Twitter, sans consentement explicite. Grâce à un puissant algorithme de reconnaissance faciale, elle est capable de retrouver instantanément l’identité précise d’une personne à partir d’une simple image. L’utilisation de Clearview AI par les autorités policières aux États-Unis et ailleurs dans le monde a suscité des critiques massives pour son intrusion sans précédent dans la vie privée.

Cette technologie ne se limite pas aux services de police : aujourd’hui, d’autres outils similaires sont utilisés plus largement, ce qui implique que toute photo en ligne peut désormais servir à identifier précisément un internaute, même caché derrière un pseudonyme ou sur un autre profil.

Reconnaissance comportementale : quand vos habitudes suffisent à vous identifier

Un autre aspect majeur concerne la reconnaissance comportementale. L’IA permet désormais d’identifier précisément une personne uniquement à partir de ses comportements et interactions en ligne. Une étude récente (2023) a montré qu’une intelligence artificielle entraînée sur des données anonymisées de communications téléphoniques pouvait ré-identifier précisément plus de la moitié des utilisateurs simplement en observant leurs habitudes de communication : horaires précis, contacts réguliers, et fréquence des interactions.

Facebook et Instagram utilisent quotidiennement des procédés similaires pour détecter automatiquement les liens entre différents comptes pseudonymes et profils réels, simplement à partir des comportements numériques. Ainsi, même sans fournir explicitement des informations personnelles, les habitudes d’utilisation révèlent l’identité réelle d’un internaute avec une efficacité redoutable.

Stylométrie par IA : quand écrire suffit à vous dénoncer

Enfin, l’analyse stylométrique automatisée par IA permet d’identifier précisément l’auteur réel de textes anonymes grâce à l’analyse du style d’écriture : vocabulaire spécifique, habitudes grammaticales, fréquence d’utilisation de certains mots, ou encore erreurs récurrentes. Des recherches récentes ont montré que cette technique est suffisamment puissante pour identifier anonymement des auteurs sur des plateformes comme Reddit, Twitter, ou même dans des emails et SMS anonymisés.

Avec ces trois avancées majeures combinées, l’intelligence artificielle détruit rapidement les derniers remparts de l’anonymat numérique. Le pseudonyme devient inefficace dès que l’on poste une image, un message ou que l’on interagit simplement sur les réseaux sociaux.

L’IA, un espoir paradoxal pour réinventer l’anonymat ?

Il apparaît désormais clairement que l’anonymat en ligne est largement dépassé. Nos pseudonymes et nos tentatives pour cacher notre identité sont minés de toutes parts par la collecte massive de données et par la puissance des algorithmes d’intelligence artificielle capables de relier ces données. Ce que nous faisons, ce que nous aimons, où nous allons, tout peut être analysé pour deviner qui nous sommes réellement. L’IA a accéléré ce processus jusqu’à rendre l’anonymat quasi illusoire sur les réseaux sociaux.

Faut-il pour autant sombrer dans la fatalité ? Pas nécessairement. Les mêmes technologies qui portent atteinte à l’anonymat peuvent aussi être mobilisées pour mieux protéger notre identité numérique. Paradoxalement, l’IA peut devenir une alliée de la vie privée, si on l’oriente dans ce but. Des chercheurs travaillent sur des techniques d’anonymisation assistée par IA : par exemple, des algorithmes capables de parcourir un document et d’en supprimer automatiquement toutes les informations personnelles (noms, adresses…) avant publication. Des initiatives voient le jour pour doter les régulateurs d’outils qui mesurent le risque de ré-identification et alertent en cas de données trop parlantes.

D’autres pistes, plus expérimentales, explorent la cryptographie comportementale : l’idée de chiffrer ou de brouiller nos patterns de navigation afin de les rendre inexploitables par les IA malveillantes. Par exemple, on pourrait imaginer un outil qui introduit du bruit dans nos données (fausses requêtes, likes aléatoires) pour déjouer les profilages automatisés. De même, des techniques de privacy by design (telles que la differential privacy) intègrent un flou statistique dans les données collectées, de sorte qu’on puisse en tirer des tendances globales sans pouvoir identifier individuellement les personnes.

Ces approches sont encore naissantes, mais elles offrent une lueur d’espoir. À l’heure où l’IA semble avoir levé toutes nos masques, nous ne sommes pas condamnés à une transparence totale sur les réseaux sociaux. Une prise de conscience s’opère et stimule la recherche de contre-mesures technologiques et juridiques. Demain, l’IA pourra peut-être nous aider à naviguer de façon plus anonyme, en étant le gardien de nos données plutôt que le fossoyeur de notre anonymat. En attendant, rappelons-nous que sur Internet, nous ne sommes jamais aussi cachés que nous le croyons, et agissons en conséquence, avec prudence et discernement quant aux informations que nous laissons derrière nous sur les réseaux sociaux.

Martin LORME

Sources

ISCOM – Réseaux sociaux : protection de données, anonymat et liberté d’expression
https://www.iscom.fr/actualite-labs/reseaux-sociaux-protection-de-donnes-anonymat-et-liberte-dexpression
The New York Times – A Face Is Exposed for AOL Searcher No. 4417749, par Michael Barbaro et Tom Zeller Jr. (2006)
https://www.nytimes.com/2006/08/09/technology/09aol.html
Nature Communications – Estimating the success of re-identifications in incomplete datasets using generative models, par Luc Rocher, Julien M. Hendrickx et Yves-Alexandre de Montjoye (2019)
https://www.nature.com/articles/s41467-019-10933-3
Avast – What is browser fingerprinting and how can you avoid it?
https://www.avast.com/fr-fr/c-what-is-browser-fingerprinting
Ars Technica – Now sites can fingerprint you online even when you use multiple browsers, par Dan Goodin (2017)
https://arstechnica.com/information-technology/2017/02/now-sites-can-fingerprint-you-online-even-when-you-use-multiple-browsers/
Le Monde – Clearview AI, le Big Brother qui a aspiré toutes vos photos (2022)
https://www.lemonde.fr/pixels/article/2022/01/11/clearview-ai-le-big-brother-qui-a-aspire-toutes-vos-photos_6108951_4408996.html
DataDrivenInvestor – AI can now identify people in anonymized datasets (2023)
https://www.datadriveninvestor.com/2023/09/01/ai-can-now-identify-people-in-anonymized-datasets/

31/01/202231/01/2022

Modération : à quand la fin de l’impunité sur les réseaux sociaux ?

Le phénomène d’émiettement identitaire, en corrélation avec l’utilisation grandissante des réseaux sociaux, s’aggrave ces dernières années entre l’espace physique et l’espace numérique. L’idée commune selon laquelle l’identité définie dans l’espace public disparaît au profit d’une autre identité sur Internet favorise le sentiment d’impunité et l’augmentation des contenus toxiques sur les espaces d’expression en ligne. Les tentatives de régulation ont été nombreuses, tant par les autorités publiques que par les plateformes elles-mêmes.

L’heure est au bilan sur l’état actuel de la modération des contenus en ligne.

© Source : https://news-assurances.com/artdossiers/autres-assurances/usurpation-didentite-et-internet-quelles-solutions-dassurance/016750680

Responsabilisation progressive des plateformes

Le 20 janvier 2022, le Parlement européen procédait à un vote sur la législation des services numériques, plus connue sous le nom de Digital Services Act (DSA). Ce texte vise notamment à obliger les géants du numérique à s’attaquer aux contenus illicites en ligne, tels que ceux favorisant l’incitation à la haine ou la désinformation. En effet, l’expression sur l’espace public numérique est structurée autour d’un marché oligopolistique (Facebook, Twitter, Google). C’est donc naturellement que l’attention politique et juridique s’est concentrée sur cette poignée d’acteurs en mettant en lumière leurs dérives et en alertant sur la présence grandissante des contenus haineux. Ces plateformes ont été contraintes d’accepter que leur rôle dépassait celui de simple hébergeur de contenus et ont pris leurs responsabilités en termes de modération et de régulation sur leurs interfaces.

Pour respecter ces nouveaux engagements, de nombreux outils ont été développés par les plateformes afin d’identifier les contenus toxiques. Une modération algorithmique automatisée et des équipes très conséquentes de modérateurs sont devenus deux piliers quasi-indispensables pour traiter une quantité aussi importante de contenus. Ces outils technologiques permettent notamment une modération ex ante, c’est-à-dire avant même que le contenu soit publié et donc visible par les utilisateurs. On parle alors d’une modération « industrielle », qui se différencie d’une modération dite « artisanale » effectuée par des équipes plus restreintes, avec une approche plus manuelle et une importance forte donnée à la contextualisation du contenu. La modération 100% automatisée n’est pas la solution parfaite puisqu’elle comprend son lot de risques, notamment en identifiant des contenus dits « faux positifs », c’est-à-dire modérés alors qu’ils n’auraient pas dû l’être, ou en incitant à une modération excessive, dite « modération préventive » des plateformes pour éviter des sanctions.

La modération ne se limite pas à l’identification des contenus problématiques, il faut ensuite savoir réagir au mieux pour limiter leur propagation ce qui ne passe pas nécessairement par la suppression. En effet, la modération par retrait du contenu peut avoir des effets néfastes comme l’augmentation des réactions toxiques en réponse à la suppression ou la légitimation du contenu supprimé aux yeux de certaines communautés. Les plateformes ont donc développé des méthodes alternatives, dites « graduelles », afin de limiter la visibilité du contenu sans avoir à le supprimer, tels que le déclassement ou le déréférencement du contenu ou sa mise en quarantaine. La propagation de ces contenus toxiques est en constante évolution, forçant les modérateurs à se renouveler et à innover régulièrement dans ce domaine.

Mythe de l’anonymat sur Internet

Malheureusement, la modération ne suffit pas toujours. Si les algorithmes des plateformes leurs permettent d’identifier la quasi-totalité des contenus à caractère illégal (Facebook déclare que « 99,5% des contenus terroristes ou pédopornographiques sont bloqués a priori, et automatiquement, avant même qu’un utilisateur ne puisse le voir. »), il leur est plus difficile de repérer d’autres comportements tels que le harcèlement en meute ou la diffusion de désinformations.

Dans les cas où des enquêtes de police sont ouvertes, notamment lorsqu’une victime porte plainte, l’une des premières étapes consiste à identifier les responsables potentiels, généralement cachés derrière des pseudonymes qui sont à distinguer de l’anonymat. En effet, la loi pour la confiance dans l’économie numérique (LCEN) de 2004 impose aux hébergeurs et opérateurs de conserver toutes les données de connexion (adresse postale, coordonnées bancaires, n° de téléphone, adresse IP, etc.) afin de pouvoir identifier la personne cachée derrière un pseudo. Ces données sont soumises au secret professionnel mais peuvent être communiquées à la justice en cas de demande. Ainsi, la levée d’un pseudonyme n’est jamais impossible en soi, au contraire, mais elle demande parfois énormément de temps et de moyens à la justice pour y parvenir.

Collaboration avec les services policiers et judiciaires

Lors d’une investigation sur les réseaux sociaux, les services de police tentent de corroborer les pistes en récupérant des traces numériques. Dans certains cas, les contenus en question sont partagés publiquement ce qui permet de répertorier rapidement des preuves. Cependant, lorsque les comptes sont cadenassés, cela doit passer par une réquisition invitant la plateforme à transmettre les données d’identification des comptes concernés. De nombreuses affaires de cyber-harcèlement, telles que l’affaire Mila ou la récente condamnation du Youtubeur Marvel Fitness, ont pu être portées en justice et aboutir à des condamnations grâce à cette collaboration entre les plateformes et les autorités publiques.

Cependant, d’après Matthieu Audibert, commandement de la gendarmerie dans le cyber-espace, alors que les opérateurs français sont très réactifs et répondent en moyenne à ces demandes en 15 min, les hébergeurs américains s’avèrent généralement moins collaboratifs. Pour leurs exiger le transfert des données, il faut envoyer une réquisition directement à la société mère. Cela peut parfois nécessiter préalablement une demande d’enquête pénale internationale, suivi de l’envoi de la réquisition via le ministère de la justice français auprès d’un magistrat de liaison à Washington, qui transmettra ensuite au procureur de l’État américain de domiciliation de la plateforme. Cela va sans dire, ces cas de figure correspondent à des délais d’action de plusieurs mois, voir n’aboutissent parfois à aucun retour de la part de la plateforme concernée.

© Twitter illustration — *SOPA Images/SIPA*

Le réseau Twitter est connu pour être le mauvais élève des réseaux sociaux en matière de collaboration avec la justice. L’avocat Éric Morain rappelle : « c’est une obligation dans le code de procédure pénale de déférer à ces réquisitions, et il ne viendrait pas à l’idée de la BNP, Orange ou Free de ne pas le faire. Les autorités adressent de la même façon régulièrement des réquisitions à Facebook ou à Twitter. […] Sauf que, si Facebook collabore depuis deux ou trois ans, en ce qui concerne Twitter, on reçoit des classements sans suite du parquet faute de collaboration. ». En janvier 2022, Twitter France et son DG Damien Viel ont été jugés pour « refus de répondre à une réquisition » et la Cour d’appel de Paris a confirmé une décision de juillet ordonnant à Twitter de détailler ses moyens de lutte contre la haine en ligne, jugés insuffisants.

Moins de lois, plus de moyens !

Une impunité importante persiste sur les réseaux sociaux et l’une des causes principales réside dans le manque de moyens accordés aux services de police et aux régulateurs. Avec plus de moyens, la justice pourrait réagir et condamner rapidement, ce qui refroidirait progressivement l’essor des contenus toxiques et ferait office de modération par incitation. La lenteur actuelle des décisions de condamnations est responsable du sentiment d’impunité récurrent sur Internet. Le mal français voudrait créer de nouvelles lois, épuiser les plateformes sous de nouvelles obligations, alors que la vraie solution serait de donner à la justice (l’un des ministères les moins bien financé) les moyens humains et financiers d’agir efficacement.

Actuellement, la plateforme Pharos en charge de la surveillance des contenus illicites sur Internet est sous-financée et sous-équipée, avec une vingtaine de cyber-gendarmes quand Facebook a plus de 15 000 personnes en charge de sa modération. Les missions sont éparpillées, les cyber-gendarmes n’ont accès qu’à ce qui est visible au public sur les plateformes et c’est les commissariats qui ont la charge d’examiner les conversations et groupes privés.

Par ailleurs, pour forcer ces super plateformes à respecter leurs obligations, l’échelle nationale ne semble pas la plus efficace puisque nos régulateurs semblent aujourd’hui incapables de faire respecter leurs propres mesures. Il est nécessaire d’engager les régulateurs à échelle européenne et de simplifier la définition des infractions en ligne afin de condamner régulièrement et jusqu’à l’épuisement les plateformes, plutôt que de sanctionner une fois par an ces géants du numérique, impassibles face aux montants de leurs condamnations précédentes.

Par Estelle Berdah