Pour Jer Thorp, expert de la data visualisation, ancien du New York Times et auteur de Living in Data, les citoyens ont tout intérêt à collecter eux-mêmes les données les concernant et à les utiliser à leur avantage.
Jer Thorp est un artiste canadien, professeur à l’université de New York et expert de la data visualisation. Il a été le premier data artist du New York Times, quotidien reconnu pour la qualité de ses infographies. Son livre Living in Data (MCD, mai 2021) est foisonnant d’anecdotes, issues des mille expériences de l’auteur. Le lecteur suit ses tribulations à travers le monde. En Angola où Jer Thorp collecte des données environnementales, en Nouvelle-Zélande à la rencontre d’un mouvement Maori pour la souveraineté des données indigènes, dans son appartement new-yorkais où il élabore l’algorithme qui a permis de disposer les 2 977 noms des victimes du 11 septembre sur le mémorial en leur honneur. De quoi nourrir des réflexions passionnantes sur notre rapport à ses fameuses data dans lesquelles nous baignons à longueur de journée.
Living in Data est aussi un appel à l’action. Jer Thorp invite les citoyens à collecter eux-mêmes les données les concernant et à s’en servir dans leur propre intérêt. Une vision stimulante.
Qu’entendez-vous par l’expression living in data (vivre dans les données) ?
JER THORP : Chacun de nous vit dans les données, dans les algorithmes qui les façonnent. Lorsque nous travaillons, nouons des relations, devenons parents... Nous vivons dans les données de la même manière que nous vivons dans un pays et une démocratie.
Vous présentez votre livre comme un guide, qu’est-ce qui cloche exactement avec nos rapports aux données ?
J.T. : Au début du livre, je raconte une histoire qui m’a particulièrement marquée : celle du lycée Hunter College High School à New York. Il y a quelques années, il a été désigné l’endroit le plus triste de New York par un groupe de chercheurs. Ils sont parvenus à cette conclusion en analysant les tweets publiés par les habitants de la ville. Ils y ont appliqué un algorithme pour identifier ceux qui contenaient des émotions négatives. L’idée était de faire une sorte de carte de la tristesse. Leur étude a été reprise par plusieurs médias.
Cette histoire a été pour moi un déclic : j’ai alors réalisé que l’acte de collecter des données et de les analyser n’a rien d’anodin ni d’inoffensif. Cette étude et les articles qui en ont découlé ont eu un impact sur ces élèves. Le lycée n’est déjà pas une période facile, alors imaginez lire un article racontant que vous êtes la personne la plus triste de la ville. C’est le moment où j’ai eu envie d’écrire ce livre. D’une part pour expliquer aux professionnels de la donnée que ce qu’ils font a un impact sur la vie des gens, d’autre part pour m’adresser aux gens qui vivent dans les données. Je veux les inviter à s’intéresser à ces structures, bien qu’elles soient la plupart du temps invisibles. On peut ressentir l’influence des données, sans être capable de bien la décrire.
Votre livre est plein d’histoires et de vos propres anecdotes. C’est un moyen de rendre le sujet plus compréhensible ?
J.T. : Oui et je voulais souligner le fait que les données ne sont pas issues d’un ordinateur. Ce sont des choses… humaines.
À vos yeux, considérer la collecte de données comme un acte passif est très dangereux. Pouvez-vous préciser cette idée ?
J.T. : Le terme “collecte” est en lui-même très passif. Comme si les données étaient des traces que nous laissons sur notre chemin, et que Facebook et compagnie se contentaient de les cueillir et de les mettre dans un petit panier. Cela ne semble pas très grave dit comme ça. Cela donne l’impression que de toute façon ces données existent, donc quelqu’un peut bien les récolter. Mais la réalité est tout autre. Cette collecte sert à prendre des décisions importantes à votre place. Ce que vous regardez sur Facebook : vidéo politique ou conspirationniste par exemple. C’est définir votre champ de vision, votre compréhension du monde. L’acte de collecter en lui-même n’est pas inoffensif non plus. Décider quelles données sont collectées ou non, quelles personnes sont incluses ou non dans cette collecte, relève bien d’une décision. Et cette décision est la plus importante du processus.
Je pense qu’il faudrait songer à une sorte de citoyenneté de la donnée. En tant que citoyen français ou américain, vous avez des droits, mais aussi des responsabilités envers ceux qui vivent dans cette démocratie. Concernant les données, quelles sont nos responsabilités en tant qu’individu, en tant que groupe ? Pour les architectes des bases de données et des algorithmes, quelles responsabilités ont-ils envers leurs proches et les autres citoyens qui vivent au sein des architectures qu’ils élaborent ?
Le problème des données est souvent associé à la protection de la vie privée. Mais vous abordez des sujets moins souvent traités : l’absence de certaines données, par exemple…
J.T. : L’artiste Mimi Onuha a réalisé un travail intéressant à ce sujet. Dans sa Library of Missing Data Sets (la bibliothèque des données manquantes), elle compile de faux dossiers de données qui n’ont jamais été agrégées : le nombre d’Américains sans compte en banque en 2008, le nombre de personnes trans assassinées, les prix et les ventes du monde de l’art... Ces absences sont pour elles des choix politiques.
Parfois le problème est différent : les données sur une certaine partie de la population peuvent être très abondantes, mais elles sont utilisées pour marginaliser cette population. Le représentant d’un mouvement Maori pour la souveraineté des données indigènes m’expliquait que les peuples indigènes étaient sous-représentés mais sur-surveillés. Je plaide pour que l’on boucle la boucle. C’est-à-dire rendre les données utiles aux personnes et aux communautés dont elles sont extraites. Nous ne devrions pas engager de projets de récolte de données sans inclure les populations concernées.
Vous incitez les citoyens à devenir plus actifs, à collecter eux aussi des données pour leur propre intérêt. Comment faire ?
J.T. : Oui, l’idée c’est d’être plus investi dans la manière dont les données sont collectées et de faire en sorte que cette collecte nous serve. On trouve déjà des exemples de ce type d’actions. Le mouvement Black Lives Matter a été en partie porté par la collecte de données. L’effort collectif de certains bénévoles a permis d'agréger des données sur les violences policières et les personnes tuées par la police. Il n’y avait pas auparavant de recensement de ces faits. À la fin des années 1990, des ingénieurs informaticiens de Seattles ont commencé à agréger des données sur les violences policières. Et de plus en plus de personnes ont continué à le faire, puis à s’intéresser plus spécifiquement aux violences policières envers les personnes noires. Tout cela s’est fait avec de simples feuilles de calcul. Il ne faut jamais sous-estimer le pouvoir d’un citoyen équipé d’une feuille de calcul.
À Chicago, en juillet 2020, BYP100, un groupe de jeunes activistes noirs a représenté de façon très claire la différence de budget entre la police, l’école et la santé. Ils ont installé des piles de cartons. L’une représentant le budget de la ville de Chicago alloué à la police, l’autre celui alloué à l’école et la santé. C’est un bon exemple d’un moyen simple et low tech de représenter des données dans l’espace public.
Je ne dis pas qu’il faut condamner la technologie, ni qu’il faut cesser de faire du machine learning, mais je pense qu’il existe des moyens de data visualisation très simples et intéressants accessibles à tous, notamment aux personnes habituellement exclues des discussions autour des données.
Je vais vous donner un autre exemple. Quand la pandémie de Covid a commencé, de nombreuses personnes ont essayé de mettre en place des solutions très sophistiquées pour tracer les cas, des algorithmes prédictifs qui promettaient de nous sauver la mise. Rien de cela n'a marché. Ce qui a fonctionné, ce sont des feuilles de calcul mises en place par des communautés de voisins pour s’entraider. Des communautés parviennent donc à prendre le pouvoir et s’aider grâce aux données, sans grand apport technologique. C’est une leçon très importante à retenir.
N’y a-t-il pas un risque à accorder trop d’importance aux données, à les consulter trop souvent ? Depuis la pandémie, certains sont par exemple devenus accros aux données journalières sur le nombre de morts, le taux d’incidence…
J.T. : Je ne pense pas vraiment que ça soit un problème. Par contre sur les chiffres liés à la pandémie, le problème se pose s’ils sont uniquement représentés sous forme de graphiques et de tableaux accessibles sur un ordinateur. Cela ne les rend pas accessibles à tous, à certaines personnes âgées, par exemple. Les data ingénieurs qui mettent en forme des données sur le suivi de l’épidémie et de la vaccination font déjà un travail remarquable. La prochaine étape serait de rendre ces données accessibles dans l’espace public, les rendre visibles par votre voisinage, votre communauté, autrement qu’en créant un site web. Cela peut prendre des formes très différentes : du street art, des performances... C’est un travail très intéressant et stimulant pour les personnes qui comme moi s’intéressent au potentiel créatif des données. Nous nous concentrons beaucoup sur les graphiques et les tableaux mais il y a bien plus de possibilités à explorer.
Sujet essentielle dont les éditeurs d'applications ainsi que les fabricants informatiques et de smartphones devraient autant se soucier que l'ajout de certaines fonctions nouvelles des appareils. La blockchain est une bonne solution mais ça doit pas être la seule non plus.