habillage
premium1
Homme geek consulte un dictionnaire.
© RyanJLane via Getty Images

Data brokers, granularité, cruncher… Petit lexique spécial données

Le 24 juin 2019

Il faut cruncher les dark datas de son data lake pour obtenir une meilleure granularité. Cette phrase ne vous évoque rien de bon ? Ce lexique devrait vous aider.

Cruncher les données

Il s’agit de trier, modéliser, analyser les données pour les transformer en informations pertinentes. On ne « crunch » pas avec ses petites mains, mais plutôt à l’aide d’algorithmes.

Data lake (ou lac de données)

Un terme bien poétique pour désigner quelque chose qui l’est nettement moins : une méthode de stockage de données utilisée par les entreprises. Elle consiste à regrouper l’ensemble des données que l’entreprise possède : les données brutes côtoient les données transformées, les images côtoient feuilles de calculs, e-mails…

Granularité 

C’est l’un des principaux critères pour évaluer la valeur d’une donnée, explique l'Interactive Advertising Bureau (IAB, association regroupant les professionnels de la pub sur internet) dans son « Guide de la data », publié début juin. Il s’agit du degré de précision de la donnée.

Dark data 

Ce sont les données collectées par une entreprise sans être exploitées. Des informations négligées car elles ne paraissent pas essentielles. Certaines entreprises sont prêtes à dépenser des millions pour tirer davantage de ces données. À l’instar d’Apple qui a racheté Lattice Data, un spécialiste de l’extraction de dark data, en 2017 pour 200 millions de dollars. Mais attention ! Conserver trop longtemps des dark datas peut s’avérer dangereux. Car si celles-ci se font pirater, l’attaque peut longtemps passer inaperçue…

Data brokers (courtiers en données)

Certains négocient des marchandises ou du pétrole, d’autres préfèrent les données. Les data brokers achètent, agrègent, affinent et revendent des données. Ils s’appellent Acxiom, Experian, Datalogix (propriété d'Oracle) ou encore… Cambridge Analytica. Selon une enquête de La Croix en 2018, ce secteur récent pèserait déjà 150 milliards d’euros par an.

Données first party/second party/third party

Les données issues de l’environnement propre d’une marque comme son site web et ses applications. Ces données servent surtout à mesurer l’audience d’un site et à améliorer le parcours de navigation. Les données second party sont issues de partenariats entre deux ou plusieurs entreprises qui partagent la même cible. Mettre en commun leurs données leur permet d’enrichir la connaissance des utilisateurs. Par exemple une marque de cosmétiques peut décider de croiser ses données avec celles d’un blog de tutos sur le maquillage. Enfin les données dites third party sont collectées, agrégées, traitées par un prestataire externe ou tiers (comme des data brokers ou des régies publicitaires). Ces prestataires regroupent généralement les données qu’ils récoltent en segmentant selon l’âge, les habitudes d’achats, les intérêts…

Données directement identifiantes 

Ces données permettent d’identifier une personne physique : via son nom ou son prénom par exemple. Mais la définition des « données personnelles » s’est élargie avec l’arrivée du Règlement général sur la protection des données (RGPD). Les cookies sont devenus des données personnelles par exemple.

Données pseudonymisées 

Les données sont rattachées à un pseudonyme plutôt qu’un identifiant. Mais il est toujours possible d'établir le lien entre le pseudonyme et l’identifiant.

Données anonymisées 

Une partie des informations de la donnée est détruite afin d’empêcher toute possibilité d’identification directe ou indirecte de l’individu.

Open Data (ou donnée ouverte) 

Cette expression désigne les données dont l’accès et l’usage sont laissés libres aux usagers sans restriction technique, juridique ou financière, précise l'IAB. Elle peut être produite par une association, un service public ou une entreprise. 

Droit de portabilité des données 

Vous avez le droit de récupérer vos données personnelles auprès d’un site, mais aussi de les transférer d’un organisme à un autre. C’est l’un des droits permis grâce au RGPD.

Sources principales : Guide de la Data de l'IAB, la Cnil. 

LIRE AUSSI : 

White hat versus black hat : parlez-vous hacker ?

Do you speak dev ? Petit lexique pour apprendre à parler avec votre ingénieur informaticien

Petit lexique disruptif des mots de la tech

Commentaires

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.