Google a 20 ans

Ce que Google sait de vous |

Google est une énorme machine à récolter de l’information sur ses utilisateurs, de la recherche dans son célèbre moteur aux habitudes de navigation en passant par les courriels, les photos et les commandes vocales.

Qu’est-ce qui est enregistré au juste ? À quoi cela sert-il ? Et comment contrôler ce flux gigantesque d’informations ?

Nous avons fait le test.

Les sources

Google a essentiellement trois méthodes pour récolter de l’information sur ses utilisateurs.

La plus importante, et de loin, ce sont les activités sur l’internet comme les habitudes de navigation, les requêtes de recherche, les publicités sur lesquelles on a cliqué et les vidéos consultées.

On dispose ensuite du contenu produit ou déposé par les utilisateurs, qui est analysé et sert essentiellement à améliorer les algorithmes d’intelligence artificielle : les photos entreposées, les courriels envoyés avec le service Gmail, les commandes vocales, la musique stockée sur Play Music.

Enfin, on compile toutes les données envoyées souvent sans contrôle, comme les déplacements, les informations sur les appareils branchés et les applications installées.

Centres d’intérêt

Le modèle d’affaires de Google, c’est la promesse de publicités ciblées aux annonceurs, basée sur les centres d’intérêt de ses utilisateurs. Ceux-ci sont définis par les habitudes de navigation, les clics, la géolocalisation, le contenu affiché et, jusqu’en 2017, par les courriels envoyés et reçus sur Gmail. Toutes ces informations donnent un ensemble assez général qui tente de définir l’utilisateur.

Dans notre cas, on constate rapidement qu’il s’agit d’un ensemble de 35 champs d’intérêt plutôt général et bigarré, parfois juste, mais comportant plusieurs erreurs, notamment sur l’âge et notre amour de la téléréalité. On peut les effacer ou, carrément, annuler la « personnalisation des annonces »

Déplacements

De loin l’aspect le plus troublant de Google, tous les propriétaires d’un téléphone Android et les utilisateurs de Google Maps envoient, par défaut, leurs données de géolocalisation. On peut ensuite retrouver, en un coup d’œil sur une carte géographique, tous les endroits où on s’est rendu depuis 2009. Les lieux les plus fréquentés, le dernier voyage outre-Atlantique, votre épicerie préférée ou votre lieu de travail se retrouvent facilement sur cette carte.

Si l’historique permet de dresser un portrait plus ciblé pour les annonceurs, la géolocalisation en continu offre des perspectives encore plus alléchantes, notamment avec de la publicité localisée ou pour connaître l’état de la circulation, avec Google Maps.

18 millions de pages

L’écosystème Google, c’est plus de 200 « produits » qui enregistrent toutes les activités de ses utilisateurs. Toute interaction est enregistrée et peut être téléchargée, dans un service mis sur pied en 2011 appelé Google Takeout.

La somme des informations compilées est proprement astronomique : nous avons obtenu les nôtres une heure après en avoir fait la demande, dans 144 fichiers .zip totalisant 285,2 Go. Et nous n’utilisons « que » 50 produits de l’univers Google. Un document Word de cette taille – ce qui est techniquement impossible – ferait 18 millions de pages. À titre d’exemple, le téléchargement de nos données sur Facebook ne pesait que 50 Mo.

Il est possible, théoriquement, d’utiliser ces fichiers pour transférer son compte d’un service Google à l’autre ou chez un compétiteur.

Plongée en eaux numériques

Plus de 99 % des archives que nous avons téléchargées sont constituées de photos et de vidéos stockées depuis 2002 dans Google Photos et Google Drive. Il s’agit platement du contenu que nous y avons déposé.

Le reste, ce sont des dizaines de milliers de documents dans plusieurs formats, notamment html, mp3, csv et json. On y retrouve pêle-mêle nos favoris, la liste d’épicerie, les centaines d’ordres donnés au Google Home, les séances d’exercices compilées par Google Fit, l’agenda, les achats sur le Google Play Store, nos vidéos envoyées sur YouTube, nos livres commandés sur Google Play Livres.

Aucune mauvaise surprise ici, mais le volume et la précision des données récoltées sont frappants. Et évidemment, on réalise le danger si autant d’informations tombaient dans de mauvaises mains.

Les parades

L’utilisateur qui veut contrôler un peu mieux les flux de données qu’il transmet a accès à beaucoup, probablement trop, de pages explicatives sur le site de Google.

Le point de départ se trouve à l’adresse myaccount.google.com. C’est là qu’on peut configurer certaines fonctions, vérifier quelles applications accèdent aux données et, surtout, activer la validation en deux étapes qui protégera votre compte.

Le fait d’être connecté à votre compte lors de votre navigation augmente également la récolte de données qui viennent étoffer votre profil.

Enfin, si l’envoi de votre géolocalisation vous déplaît, vous pouvez désactiver cette fonction dans votre téléphone intelligent.

Un avertissement, cependant : il est pratiquement impossible d’effacer toute trace si on choisit d’utiliser les produits gratuits de Google.

Ce texte provenant de La Presse+ est une copie en format web. Consultez-le gratuitement en version interactive dans l’application La Presse+.