Vue aérienne d'une foule

Les recherches Google peuvent révéler les foyers de la pandémie avant les gouvernements

© Orbon Alija via Getty Images

Elles sont particulièrement utiles pour comprendre la propagation du Covid-19 dans les pays qui ne publient pas ou peu de données. 

Qui n’a jamais tapé un symptôme médical un peu étrange dans la barre de recherche Google dans l’espoir de trouver une explication, voire un remède (et pour finalement finir complètement paniqué) ? Google sait tout de nos petits (et gros) tracas médicaux. Pas étonnant que des chercheurs s’intéressent à ce que nous tapons dans le moteur de recherche le plus utilisé au monde pour mieux connaître le développement d’une épidémie, identifier les foyers voire les anticiper.

« I can’t smell », la recherche phare du Covid-19

Pour le nouveau coronavirus, la recherche « I can’t smell » (Je ne sens plus les odeurs) est particulièrement pertinente. L’anosmie est l’un des symptômes caractéristiques du Covid-19. Deux tiers des personnes testées positives au virus le ressentent, selon une étude du King’s College de Londres.

Des chercheurs et analystes se sont donc intéressés aux corrélations qu’ils pouvaient y avoir entre les recherches Google sur l’anosmie et l’apparition de nouveaux foyers épidémiques. Dans un article pour le New York Times publié en avril, Seth Stephens-Davidowitz (ancien salarié de Google et auteur du livre Tout le monde ment… Et vous aussi - Internet et le Big Data : ce que nos recherches Google disent vraiment de vous) montre que la prévalence des recherches sur l’anosmie correspond quasiment parfaitement aux foyers connus comme New York, la Louisiane et le Michigan (des foyers qui étaient particulièrement importants en avril).

Le principal intérêt de l’analyse des recherches Google est de connaître la propagation du virus dans des pays où les gouvernements refusent de publier des données ou n’en révèlent qu’une partie. L’Équateur, par exemple, était le pays où les recherches Google sur la perte d’odorat était les plus nombreuses fin mars, observe Seth Stephens-Davidowitz. « No puedo oler » était tapé dix fois plus en Équateur qu’en Espagne alors qu’à ce moment-là l’Équateur reportait dix fois moins de cas que l’Espagne.

Des Google Ads pour obtenir des données en temps réel

L’analyse des recherches Google permet donc de mieux comprendre l’avancée de l’épidémie mais peut-elle prédire son développement voire le freiner ?

Pour cela il faut collecter des données en temps réel, estime Patrick Berlinquette. Pour ce faire, ce spécialiste de la publicité sur Google, a eu l’idée d’utiliser les Google Ads, explique-t-il sur OneZero. Il a acheté la phrase « I can’t smell » sur Google Ads et créé une publicité décrivant l’anosmie. Il a ensuite décidé des pays où ils souhaitaient publier son annonce. Ce qui signifie qu’à chaque fois que quelqu’un tape « I can’t smell », il sait où et quand cette personne a fait cette requête (que la personne clique sur la publicité ou non).

Grâce à ce système, l’analyste a pu identifier que le 5 juin Houston est passée devant New York en matière de nombre de recherches sur l’anosmie. Le 13 juin, la capitale du Texas était la ville qui cumulait le plus de recherches sur le sujet parmi les 250 villes les plus peuplées du pays. Or, depuis quelques jours, le Texas est l’un des États qui connaît une nouvelle flambée inédite du virus. Mercredi 8 juillet, 10 000 cas ont été enregistrés en 24 heures.

Le gros fail de Google Flu Trends

Patrick Berlinquette a également utilisé sa méthode pour établir des estimations du nombre de cas de coronavirus en Tanzanie, un pays où le gouvernement a cessé de compter les nouveaux cas depuis mai.

Utiliser les recherches Google pour prédire la progression d’une épidémie (ou de toute autre événement d'ailleurs) n’est pas un système infaillible. En 2008, des chercheurs de chez Google avaient élaboré un modèle (le Google Flu Trends) permettant de suivre les épidémies de grippe à partir de recherches Google sur les principaux symptômes. Sauf qu’en 2013, celui-ci avait totalement échoué à anticiper le pic de l’épidémie de H1N1. L'une des raisons de cet échec est que les recherches des personnes ayant véritablement des symptômes étaient noyées parmi celles des curieux qui souhaitaient simplement s'informer sur l'épidémie. 

Marine Protais

À la rubrique "Tech à suivre" de L'ADN depuis 2019. J'écris sur notre rapport ambigu au numérique, les bizarreries produites par les intelligences artificielles et les biotechnologies.
commentaires

Participer à la conversation

Laisser un commentaire