Il est cité par les chaînes d’info, repris par certains médecins et consulté par les hôpitaux… CovidTracker, un site d’outils statistiques sur le Covid-19, est devenu en quelques mois l’un des médias de la pandémie. Interview avec son créateur, Guillaume Rozier.
Nombre de morts, courbe sur les effets du confinement, taux d’incidence… Depuis le début de la pandémie, certains d’entre nous sont devenus accros aux statistiques. Un site est particulièrement suivi par ces aficionados de la data (et épidémiologistes en herbe) : CovidTracker. On y trouve un comparateur de vagues, un calculateur de risque, un time-lapse de la situation hospitalière… Depuis son lancement en mars, ce site a atteint les 10 millions de pages vues. Entre 10 000 à 200 000 internautes le consultent chaque jour. L’hôpital de Grasse l’utilise pour anticiper l’évolution de l’épidémie et s’organiser en fonction, Karine Lacombe, infectiologue très médiatisée, le partage sur Twitter, les chaînes d’info le citent régulièrement…
? Voici un tout nouveau calculateur de risque Covid19 ! Sélectionnez votre département, le nombre de personnes conviées à un événement, et vous obtiendrez la probabilité pour qu’un participant soit positif au #Covid19.
? ? https://t.co/lNnRfizife@eorphelin @CovidTracker_fr pic.twitter.com/thFfGjveNa— GRZ - Guillaume Rozier CovidTracker (@GuillaumeRozier) November 16, 2020
Au départ, son créateur Guillaume Rozier, un jeune diplômé de 24 ans, a bidouillé quelques données dans son coin pour comprendre la situation. Aujourd’hui cet ingénieur en data science fraîchement embauché en CDI passe une bonne partie de ses soirées et week-end à mettre son site à jour et développer de nouveaux outils bénévolement. Lui, comme d’autres producteurs de graphiques et analystes amateurs, est devenu une source d’informations sur l’épidémie suivie par des milliers de personnes.
Pourquoi avoir lancé CovidTracker ? Aviez-vous le sentiment que les données sur l’épidémie étaient mal utilisées ?
Guillaume Rozier : Au départ le constat ce n’était pas qu’on utilisait mal les données, mais qu’on ne les utilisait pas du tout. J’ai commencé à m’intéresser au sujet un peu avant que Santé Publique France recueille les données hospitalières. C’était début mars, une dizaine de jours avant le confinement. J’ai fait un graphique dans mon coin à partir de données publiées par l’Université de John Hopkins (États-Unis) pour voir comment le nombre de cas évoluait en France par rapport aux autres pays. J’ai remarqué que la France suivait la situation de l’Italie, les deux courbes correspondaient parfaitement avec un décalage de 8 à 10 jours. Or quand l’Italie a été confinée le 10 mars, on disait encore en France que ça n’arriverait jamais, que la situation était bien pire en Italie… Ça m’a vraiment alerté, donc j’ai partagé mes graphiques à mes amis, collègues, et abonnés sur Twitter. Des personnes sont devenues un peu addict à ces graphiques et me demandaient des mises à jour quotidiennes. C’est à ce moment que j’ai eu l’idée de créer un site consultable par tous pour éviter de refaire et envoyer de nouveaux graphiques chaque jour.
1/2
Comparaison du nombre de cas totaux déclarés en France et en Italie (au 10 mars 2020). #Covid19On remarque un retard de 8 à 9 jours de l’épidémie en France par rapport à l’Italie. pic.twitter.com/SgLvGPzEfN
— GRZ - Guillaume Rozier CovidTracker (@GuillaumeRozier) March 11, 2020
Définiriez-vous CovidTracker comme un média ?
G.R. : Je ne pense pas que « média » soit le bon qualificatif. Je ne définis pas trop CovidTracker, je laisse les gens le faire. Mon objectif au départ était simplement de comprendre l’épidémie : dans quelle région, quelle tranche d’âge elle se développait, à quelle vitesse... Je n’avais aucune ambition particulière. Il y a eu rapidement des articles de presse locale, je ne m’y attendais pas du tout. Les citoyens avaient besoin de s’informer, les médias ne semblaient pas remplir ce besoin, l’État non plus. Au début de l’épidémie, Santé Publique France ne publiait qu’un chiffre tous les jours : le nombre de cas, sans aucun contexte ni graphique.
Sur Twitter, vous pointez régulièrement du doigt la manière dont certains médias présentent les chiffres du Covid, le nombre de morts notamment. Que leur reprochez-vous ?
G.R. : Souvent, les données ne sont tout simplement pas traitées par les médias. Je généralise en disant ça, car il y a beaucoup de belles initiatives chez Les Décodeurs, Libé Labo, France Info… Mais quand on regardait en mars le journal de 20 heures, on avait une seule information chiffrée : le nombre de cas du jour, marqué en énorme sans aucune contextualisation, ni analyse. Un jour en mai, l’AFP a publié une dépêche faisant état d’un nombre record de morts, alors que nous étions dans une phase descendante de l’épidémie. C’est vrai qu’il y avait eu un nombre de décès plus élevé ce jour-là par rapport à la veille, qui était un dimanche. Mais c’était trompeur car certaines personnes en lisant vite on cru que l’épidémie repartait. Or en faisant la moyenne sur une semaine, on se rendait compte que le nombre de décès était en baisse.
Il existe énormément de données sur la pandémie. Pourtant, la situation semble encore nous échapper. Trop de données rendent-elles inintelligible la situation ? Ou au contraire, des infos manquent-elles ?
G.R. : Il n’y a jamais trop de données. On a de la chance en France car beaucoup de données d’assez bonne qualité sont en accès libre, ce n’est pas toujours le cas ailleurs. Mais il manque encore des informations. Concernant les tests par exemple, on ne sait pas si le test a été réalisé sur une personne symptomatique ou asymptomatique. Il serait aussi intéressant de demander à une personne testée positive si elle a une idée du lieu de sa contamination. Cela permettrait d'identifier les lieux les plus à risque. Concernant les hôpitaux, nous n’avons pas d’informations sur le parcours des patients. On ne sait pas, par exemple, si un patient hospitalisé est allé en réanimation ou s’il est retourné chez lui. Il faudrait un cadre strict pour encadrer cette collecte d’infos et bien sûr anonymiser les données. Ce qui inquiète Santé Publique France c’est la réidentification des personnes, qui pourraient, selon l'organisation, être possible si on recueille certaines de ces données.
Qu’est-ce que les graphiques vous ont permis de comprendre de la pandémie ? Qu’est-ce qui vous a marqué ?
G.R. : Ce qui m’a le plus marqué c’est à quel point les gens ont ignoré la deuxième vague jusqu’à début octobre. De nombreuses personnes ont l’impression que l’été et la rentrée se sont bien passés et que la situation n'a dégénéré qu'à partir d’octobre. Or quand on regarde les chiffres, on constate que la croissance était déjà exponentielle en août. Cela montre l’impossibilité pour un cerveau humain de comprendre une croissance exponentielle. J’ai alerté sur la situation, et d’autres producteurs de graphiques l’ont fait, mais à ce moment-là, j’ai reçu beaucoup de messages me disant d’arrêter d’être alarmiste.
Le % de tests #covid19 positifs (taux de positivité) continue d’augmenter chez les personnes âgées pic.twitter.com/I5EbSpSYb1
— GRZ - Guillaume Rozier CovidTracker (@GuillaumeRozier) September 16, 2020
En ce moment on entend dire que les années précédentes la grippe a fait autant de décès que le Covid cette année. Là encore, ce ne sont pas ce que disent les chiffres. Quand on regarde la courbe des décès toutes causes confondues selon les données de l’Insee, on voit très clairement que pendant la seconde vague le nombre de décès a décollé par rapport à 2018 et 2017.
On voit aussi circuler beaucoup de graphiques et tableaux, censés montrer qu’au contraire le Covid ne tue pas tant que ça, ou servir des théories du complot… Selon les données choisies et leur présentation, on peut faire dire beaucoup de choses à un graphique, c’est peut-être la limite de l'exercice.
G.R. : Oui, la manière dont on présente les chiffres compte beaucoup. Lorsque Jean Castex a donné une conférence de presse le 12 novembre par exemple, il a montré une courbe du nombre de décès quotidiens liés au Covid, sans faire de moyenne mobile (une moyenne lissée sur la semaine). La courbe fait donc des zig-zag car le nombre de décès les lundis est généralement plus important que ceux du dimanche. Ici la courbe s’arrêtait sur un point haut : ça donne l’impression que la deuxième vague est plus haute. Mais si la courbe s’était arrêtée un jour plus tôt le dernier point aurait été beaucoup plus bas, et les gens auraient sans doute eu une interprétation différente.
Que comptez-vous faire après CovidTracker, une fois que la pandémie sera derrière nous ?
G.R. : Je ne réfléchis pas du tout à quoi faire après pour continuer sur la même lancée. Ma démarche est complètement désintéressée. Je suis fier aujourd'hui que le site soit utilisé par des hôpitaux, même si ça ne me rassure pas, car ça aurait sans doute dû être le rôle de l’État de faire cela. Mais ça me fait plaisir de savoir que ça sert peut-être à sauver des vies. Plein de gens me remercient et me disent « tu es ma source principale d’informations sur le Covid, parce que tu donnes des chiffres qui sont clairs, désintéressés, non politiquement manipulés. » Une fois que la pandémie sera terminée, je me reposerai pour commencer. Mais j’aurai sans doute envie d’analyser des données sur d’autres sujets : les énergies par exemple. Ou un domaine utile en tout cas, c’est certain.
Participer à la conversation