Siegel

Du bon usage des data

Le 9 janv. 2017

Consultant hilarant, ancien professeur et rappeur à ses heures perdues, Eric Siegel nous montre que la data peut être fun, et utilisée à bon escient, franchement efficace.

Vous proposez une approche très accessible de la data, à rebours de l’image que certains s’en font : un sujet opaque, réservé aux experts.

ERIC SIEGEL : Lorsque nous avons réalisé notre clip sur les analyses prédictives (predictthis.org), les paroles se sont quasiment écrites toutes seules. C’était au moment où le Chief Data Scientist du gouvernement américain avait décrit dans un article son métier comme étant « le plus sexy du xxie siècle ». Moi qui pensais que les pompiers l’étaient davantage… Quoi qu’il en soit, considérer le geek comme cool reste très ironique. Mais j’ai toujours pensé qu’il était plus utile, et drôle, d’expliquer des concepts techniques avec une chanson censée être cool. Au début des années 2000, lorsque j’étais professeur en science informatique à l’université de Columbia, à New York, j’inventais des chansons éducatives pour mes élèves. Je me souviens notamment d’un rock sur les angoisses que peut provoquer le débogage d’un logiciel…

Geek Professor Drops Rap Video, Tries to Dance

Pouvez-vous nous en dire plus sur votre ouvrage, Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie or Die ?

E. S. : Ce livre explique comment fonctionnent les analyses prédictives, et comment elles nous affectent tous au quotidien. Plutôt que de faire un condensé réservé aux techos, j’ai choisi de présenter des études de cas, et les dernières techniques en application en m’adressant aussi bien aux lecteurs aguerris qu’aux novices. Mon livre est une introduction complète sur le sujet, il est utilisé comme manuel dans plus de 35 universités. Et c’est vrai qu’il peut s’appréhender comme tel : il est accessible, et écrit de façon à rendre la science pop. En parallèle, les trois derniers chapitres couvrent des sujets qui peuvent intéresser même les plus grands experts.

Vous y citez beaucoup de corrélations mises au jour par le Big Data. Quelle est votre préférée ?

E. S. : J’aime particulièrement celle qui lie la consommation de crèmes glacées et l’augmentation du nombre d’attaques de requins. Est-ce parce que lorsqu’une personne mange une glace, elle a meilleur goût pour le requin ? Probablement pas. Une explication plus acceptable relève de la saison : quand il fait chaud, les gens se baignent plus, et mangent plus de glaces. Lorsque vous trouvez une connexion grâce à la data, il ne s’agit que d’une corrélation, autrement dit d’un lien qui aide à prédire mais qui ne dit évidemment rien en termes de causalité.

Pouvez-vous nous donner quelques exemples de marques qui ont réussi à améliorer leurs résultats grâce aux data ?

Mon livre recense 181 mini-études de cas, je ne saurais pas vraiment par où commencer… Airbnb, la BBC, Citibank, Con Edison, Facebook, Ford, Google, le fisc, LinkedIn, match.com, MTV, Netflix, PayPal, Pfizer, Spotify, Uber, UPS, Wikipédia… Les exemples sont aussi riches que variés. Cela dit, les distributeurs sont particulièrement remarquables, à l’instar de Target, et de nombreuses banques qui améliorent concrètement leurs bénéfices en utilisant les analyses prédictives pour proposer un marketing plus intelligemment ciblé.

Quid du bien-être des consommateurs ?

E. S. : Les usages des data dans le secteur de la santé ne cessent de croître. Nous organisons d’ailleurs un événement annuel dédié au sujet : la Predictive Analytics World Healthcare Conference.

Entre autres applications, nous retrouvons les diagnostics, des optimisations de traitement, des prédictions sur les admissions à l’hôpital, dans le suivi des traitements, la recherche médicale, les essais médicaux…

Comment des secteurs dits traditionnels, comme l’agriculture, peuvent-ils utiliser la data de manière efficace ?

E. S. : La plupart des grands secteurs font appel aux analyses prédictives, reconnaissant la valeur ajoutée du Big Data, qui permet de prévoir, pour chaque individu, son comportement probable. De telles prévisions influencent directement les décisions ou les relations entre les individus, entre une marque et ses consommateurs, entre un homme politique et un électeur… Elles permettent aussi d’identifier quel bâtiment présente des risques en cas d’incendie, de déterminer si une voiture doit être révisée, etc.

C’est une énorme nouveauté dans les processus de décision. On ne peut plus uniquement se fier aux calculs : il faut considérer les prédictions sous le prisme de l’analyse et les utiliser de façon à faire de meilleurs choix. Elles doivent être prises en compte.

Évidemment, le changement est toujours soumis à une forme de résistance. Mais les résultats rencontrés par les entreprises parlent d’eux-mêmes, et conduisent ce changement. Il n’y a aucun moyen de le stopper.

Dans certains secteurs, comme la santé, l’assurance ou la banque, l’usage des données peut impacter la relation entre la marque et le consommateur. Comment les entreprises doivent-elles communiquer sur ces sujets ?

Choisir de ne pas dévoiler l’usage des données, de cacher ses activités, aura forcément des conséquences négatives et ne pourra qu’endommager la confiance. En ce sens, la transparence est nécessaire. Mais la prudence également. Ainsi, quand le distributeur américain Target avait révélé pouvoir prédire quelles étaient leurs consommatrices enceintes afin de proposer des offres plus ciblées, l’annonce avait été faite avec maladresse, provoquant un véritable tollé. De mon point de vue, leur erreur a été de penser que le public verrait ça du même œil que leurs équipes internes…

Cependant, selon moi, les consommateurs bénéficient toujours de l’utilisation des données, c’est indiscutable : moins de spams, moins de courriers indésirables (ce qui est aussi mieux pour l’environnement), des publicités plus pertinentes, de meilleures recommandations de films, musique et livres, de meilleurs résultats de recherche Google, une meilleure organisation du fil d’actualités Facebook, et une plus grande sécurité liée à la prédiction des accidents.

Quel serait le plus grand danger lié à une utilisation abusive des données ?

E. S. : Comment peut-on maîtriser un outil prédictif qui doit anticiper les démissions, les grossesses, ou les crimes ? C’est un sujet majeur. J’ai dédié un chapitre entier à cette question dans mon livre : « Le pouvoir implique des responsabilités : Hewlett-Packard, Target, la police et la NSA peuvent déduire vos secrets ». Il traite des questions des libertés et du respect de la vie privée.

Comment pourrait-on utiliser les données pour assurer la sécurité d’un État sans entraver les libertés individuelles ?

Par ailleurs, une sécurité automatisée pourrait discriminer, sur des critères de religion par exemple. Il ne s’agirait alors pas simplement d’un état d’esprit, mais plus profondément d’un système d’actions automatiques.

La technologie est comme un couteau : elle peut être utilisée pour faire le bien ou le mal. Elle a de la valeur et du pouvoir : cela signifie qu’elle peut être dangereuse. Mais l’idée de l’interdire n’est pas envisageable.


À CONSULTER, À LIRE ET À VOIR

PARCOURS D’ERIC SIEGEL 

Consultant et fondateur de Predictive Analytics World et Text Analytics World, il est l’auteur du best-seller Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie or Die. C'est aussi un ancien professeur de l’université de Columbia qui chantait ses conseils à ses étudiants, et conférencier de renom, très présent dans les médias américains.


Cet article est paru dans le numéro 9 de la revue de L’ADN : Les nouveaux explorateurs. Votre exemplaire à commander ici.


Commentaires

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.

L'actualité du jour