Dis moi tes recherches, je te dirai qui tu es !

Sachez le, et faites le savoir : vos recherches sur Internet dévoilent beaucoup de votre vie et de vos préoccupations.

Je conseille la lecture d’un excellent article de InternetActu.net dont voici quelques extraits :
Début août, une équipe d’AOL Research a mis en ligne, avant de le retirer promptement, un document contenant des millions de données sur les recherches effectuées par ses utilisateurs américains (concernant quelques 658 000 internautes ayant effectué quelques 20 millions de requêtes sur les mois de mars, avril et mai 2006). Téléchargé plusieurs centaines de fois, le fichier a été depuis livré en pâture sur l’internet (il existe même plusieurs moteurs de recherche spécifiques permettant de mener des requêtes sur ces données, notamment AOL Search Database, Datablunder ou Frogspy…).

Exemple du fichier divulgué par AOL

Le fichier a déjà été exploité par de nombreux chercheurs et blogueurs (comme BioloGeek), et a livré des premiers résultats généraux assez intéressants, indique SearchNewz :

  • 45 % des clics se font sur le premier résultat de recherche, le second ne totalisant déjà plus que 13 % des clics et ainsi de suite ;
  • Un fort pourcentage de requête ne porte pas sur un sujet, mais sur un nom de domaine ;
  • Le nombre de requête incomplètes ou mal orthographiées est très important ;
  • 28 % des requêtes sont une reformulation à la suite d’une première recherche infructueuse. En moyenne, les utilisateurs reformulent 2,6 fois leurs requêtes pour accéder à un meilleur résultat…

Pourtant l’essentiel n’était pas dans les résultats généraux.

Avant publication, le fichier avait été rendu anonyme : le nom des abonnés n’était pas visible et avait été remplacé par des numéros d’identification. Une anonymisation qui n’a pas servi à grand-chose : la liste des recherches associées à chaque identifiant a permis à de nombreux pisteurs de retrouver la trace d’internautes, d’identifier leurs numéros de sécurité sociale, leurs adresses parfois, jusqu’à leurs noms pour certains. En observant la seule liste des requêtes quotidiennes, sur plusieurs mois, il n’est souvent pas difficile de comprendre les préoccupations de l’internaute, d’imaginer son intimité, voire de retrouver son identité.

Autre exemple frappant ? L’utilisatrice 11110859 à New York qui, le 7 mars, a recherché des “fringues hip-hop”. Le 26, elle a cherché“perdre sa virginité” avant de s’interroger pendant plusieurs semaine pour savoir si on “pouvait tomber enceinte même après avoir eu ses règles”. Quelques temps plus tard, elle s’interroge à nouveau “pourquoi les gens font-ils mal aux autres ?” Le 19 mai, elle demande : “Comment aimer quelqu’un qui vous maltraite ?”, “Que dit Jésus à propos d’aimer ses ennemis ?” Ensuite, elle demandera encore “la direction de la prison de New York” avant de demander au moteur “quels objets a-t-on le droit d’y apporter ?”

Advertisements