Passer au contenu principal
Couverture de The Data Detective, le livre de Tim Harford
Articles de fond
Magazine Pivot

The Data Detective, de Tim Harford, porte un éclairage sur les mégadonnées

Dans son dernier livre, l’économiste explique comment trouver du sens dans la mer des données qui nous envahissent au quotidien.

 Couverture de The Data Detective, le livre de Tim HarfordDans The Data Detective, l'auteur conseille aux lecteurs de rester curieux, de contextualiser les données et de se demander quelle information manque.

Tim Harford, passé maître dans l’art de vulgariser les réalités économiques, signe The Data Detective: Ten Easy Rules to Make Sense of Statistics, où il propose dix principes à suivre pour mieux décoder les chiffres. Un excellent guide, à consulter pour rester vigilant à l’ère des mégadonnées. Il faut dire que si l’auteur prodigue des conseils élégants et judicieux, leur mise en œuvre n’aura parfois rien d’aisé. Citons sa première recommandation : dominer ses émotions. « Avant de reprendre une statistique, écrit-il, j’évalue d’abord quel sentiment elle fait naître en moi. Ce n’est pas une méthode infaillible pour éviter d’errer, mais une précaution inoffensive, qui se révèle parfois bénéfique. »

Soit, mais les statistiques font appel au raisonnement, et cet aspect de l’architecture mentale n’est pas celui que l’être humain applique d’emblée à une information qui l’attire ou le dérange. De tous les principes directeurs énoncés par l’économiste, le premier serait-il le plus exigeant à suivre?

Par ailleurs, on nous invite à jeter un regard avisé sur l’origine des données, surtout si les chiffres étonnent. Par exemple, les taux de mortalité infantile varient considérablement d’un pays à l’autre, et même d’une région à l’autre, quoique les systèmes de soins y soient tout aussi avancés. C’est un sujet brûlant, depuis des années. Y aurait-il des pratiques exemplaires à adopter pour sauver des vies? Un chercheur britannique a voulu comprendre pourquoi les résultats des hôpitaux dans les Midlands (au centre de l’Angleterre) n’étaient pas à la hauteur de ceux des établissements de Londres. Ses constats ont surpris. À Londres, les fausses couches tardives (22 et 23 semaines) n’étaient pas comptabilisées dans les données sur la mortalité infantile, tandis que dans les Midlands, ces événements tragiques étaient intégrés aux naissances. « Les chances de survie des nouveau-nés n’étaient pas supérieures à Londres. Ce qui différait, ce n’était pas tant les faits que la façon de les consigner. »

L’auteur suggère aussi de contextualiser les données et de se demander quelle information manque. Ainsi, de 2014 à 2018, Amazon s’est tournée vers un algorithme de recrutement fondé sur les similitudes entre les candidats et les postulants retenus antérieurement. Or, comme l’échantillon de départ était majoritairement constitué d’hommes, le modèle de l’algorithme pénalisait le terme « femmes » et déclassait les profils féminins.

De nombreuses études l’ont établi, les effets des médicaments varient souvent selon le sexe du patient, mais les femmes restent fréquemment exclues des essais cliniques. Et quand une enquête en sciences sociales ou en médecine donne des résultats déconcertants, Tim Harford invite ses lecteurs à voir si les études suivantes les confirment ou les invalident. En 2010, les politologues Brendan Nyhan et Jason Reifler ont publié une étude qui avalisait l’« effet retour de flamme », voulant qu’on s’accroche encore plus fort à une idée fausse après avoir vu des preuves qui la discréditent. Ces résultats troublants, pour des raisons évidentes, ont suscité le désarroi de certains journalistes, surtout après l’ascension de Donald Trump. Mais les deux chercheurs ont eux-mêmes encouragé la tenue d’études subséquentes, qui ont révélé que l’effet retour de flamme restait rare, et que la présentation de faits à l’appui s’avérait en général utile. Bref, toute statistique exceptionnelle issue d’une seule étude exige d’être considérée avec circonspection.

En fait, il faut s’estimer capable de décrire avec confiance l’article de journal ou l’entrefilet Facebook en question à un proche, pour aborder la méthodologie, expliquer qui a participé, et évoquer les constats des chercheurs (eux-mêmes choqués ou non par leurs propres résultats). Une étude montre que les bleuets donnent le cancer? Les journalistes qui la citent sans autre forme de justification doivent revoir leur copie.

L’auteur s’en voudrait de nous inciter à rejeter d’emblée les données statistiques et à n’y voir que de la désinformation. Il est vrai que les émotions et partis pris, d’ordre conscient et inconscient, dictent la marche du monde, autant que les faits et chiffres, mais « autant » ne signifie pas « entièrement », rappelle-t-il. Continuons de croire que les statistiques peuvent nous aider à faire le point. Tout se résume au dixième commandement, à une règle d’or : rester curieux de tout. Pour décrypter notre univers, les chiffres représentent l’atout maître.

PLONGÉE DANS LES MÉGADONNÉES

Pour analyser de grands ensembles de données, des CPA pourraient devoir renforcer leurs compétences actuelles et en acquérir d’autres. Aussi, découvrez quels sont les avantages, les enjeux et les stratégies de gestion des risques liés aux mégadonnées.