Pourquoi privilégions-nous les informations spécifiques aux statistiques ?

Erreur de taux de base

a expliqué.
Bias

Qu'est-ce que l'erreur du taux de base ?

Lorsque nous disposons à la fois d'informations individuelles, spécifiques à une personne ou à un événement, et d'informations de base, objectives et statistiques, nous avons tendance à accorder une plus grande valeur aux informations spécifiques et à ignorer complètement les informations de base. C'est ce que l'on appelle l'erreur du taux de base ou la négligence du taux de base.

Base rate fallacy illustration

Où ce biais se produit-il ?

Si vous avez déjà étudié à l'université, vous savez probablement qu'il existe certains stéréotypes liés aux différentes filières. Par exemple, les étudiants en ingénierie sont souvent considérés comme travailleurs mais arrogants, les étudiants en commerce sont stéréotypés comme étant BCBG et distants, et les étudiants en arts sont des activistes avec un sens de la mode avant-gardiste. Ces stéréotypes sont de vastes généralisations, souvent très éloignées de la réalité. Pourtant, ils sont fréquemment utilisés pour faire des projections sur la façon dont les individus pourraient agir.

Daniel Kahneman et Amos Tversky, spécialistes renommés des sciences du comportement, ont mené une étude au cours de laquelle ils ont présenté aux participants une esquisse de la personnalité d'un étudiant fictif nommé Tom W. Ils ont reçu une liste de neuf domaines d'études supérieures et ont été invités à les classer par ordre de probabilité que Tom W. poursuive des études dans le domaine en question. À l'époque, les étudiants étaient beaucoup plus nombreux à s'inscrire dans les domaines de l'éducation et des sciences humaines que dans celui de l'informatique. Cependant, 95 % des participants ont déclaré qu'il était plus probable que Tom W. étudie l'informatique que l'éducation ou les sciences humaines. Leurs prédictions étaient basées uniquement sur l'esquisse de personnalité - l'information d'individualisation - sans tenir compte de l'information du taux de base.1

Même si la personne qui suit votre cours facultatif d'histoire ressemble au stéréotype de l'étudiant en médecine, il y a très peu de chances qu'elle étudie réellement la médecine. Il n'y a généralement qu'une centaine de personnes dans ce programme, comparé aux milliers d'étudiants inscrits dans d'autres facultés comme la gestion ou les sciences. Il est facile de porter ce genre de jugement à l'emporte-pièce sur les gens, car les informations spécifiques l'emportent souvent sur les informations de base.

Effets individuels

L'erreur du taux de base peut nous amener à faire des jugements de probabilité inexacts dans de nombreux aspects de notre vie. Comme l'ont démontré Kahneman et Tversky dans l'exemple précédent, ce biais nous pousse à tirer des conclusions hâtives sur les gens en nous basant sur nos premières impressions à leur sujet.2 Cela peut nous amener à développer des idées préconçues sur les gens et à perpétuer des stéréotypes potentiellement nuisibles.

Cette erreur peut également avoir un impact sur nos décisions financières, en nous incitant à réagir de manière excessive à des changements transitoires dans nos investissements. Si les statistiques relatives au taux de base montrent une croissance constante, il est probable que les éventuels revers ne sont que temporaires et que les choses vont se rétablir. En revanche, si nous ignorons les informations relatives au taux de base, nous pouvons être enclins à vendre, car nous prévoyons que la valeur de nos actions va continuer à baisser.3

Effets systémiques

Les effets individuels du sophisme du taux de base peuvent s'accumuler et poser des problèmes importants lorsqu'il s'agit d'émettre des jugements de probabilité sur d'autres personnes, comme un médecin qui diagnostique un patient. Dans leur ouvrage de 1982, Judgment Under Uncertainty : Heuristics and Biases4, Kahneman et Tversky ont cité une étude qui présentait aux participants le scénario suivant : "Si un test de détection d'une maladie dont la prévalence est de 1/1000 a un taux de faux positifs de 5 %, quelle est la probabilité qu'une personne dont le résultat est positif soit réellement atteinte de la maladie, en supposant que vous ne sachiez rien des symptômes ou des signes de cette personne ?"

La moitié des participants a répondu 95 %, la réponse moyenne était de 56 % et seule une poignée de participants a donné la bonne réponse : 2%. Même si les participants à cette étude n'étaient pas médecins, cet exemple montre à quel point il est important que les professionnels de la santé comprennent les taux de base et ne commettent pas cette erreur. Oublier de prendre en compte les informations relatives au taux de base peut avoir des conséquences importantes sur le bien-être mental du patient et peut empêcher les médecins d'examiner d'autres causes potentielles, étant donné que des probabilités de 95 % semblent assez sûres.

Comment cela affecte-t-il le produit ?

L'erreur du taux de base entre en jeu lors des achats en ligne. Nous pouvons être plus enclins à acheter un produit sur la base d'un avis détaillé qui résonne en nous, plutôt que sur la base de son évaluation globale.

Imaginez que vous fassiez défiler les médias sociaux et que vous tombiez sur votre influenceur préféré qui fait la promotion d'un produit de soin de la peau. Nous pourrions croire que leur message prouve que le produit fonctionne - après tout, les ingrédients sont "entièrement naturels" et leur visage est rayonnant ! En revanche, nous pourrions ignorer l'évaluation à deux étoiles du produit sur Amazon ou le fait que ses ventes ont soudainement chuté peu de temps après sa mise sur le marché. En d'autres termes, cet avis reste dans notre esprit parce qu'il s'agit d'une information individuelle. En revanche, l'ensemble des avis nous échappe, car il s'agit d'informations individuelles sur le taux de base, ce qui nous induit en erreur lors de l'achat.

L'erreur du taux de base et l'IA

Alors que l'IA gagne en popularité, il est impossible d'échapper aux débats passionnés sur son utilité. Nous pouvons choisir d'adopter ou de rejeter l'apprentissage automatique en nous basant sur les témoignages d'autres personnes, sans tenir compte des preuves statistiques sur les performances réelles du logiciel. Par exemple, entendre un collègue s'extasier sur la façon dont ChatGPT l'a aidé à rédiger une proposition de projet peut nous amener à le considérer comme un excellent outil de rédaction, même si les informations sur le taux de base révèlent que ce n'est pas toujours le cas. En revanche, un parent plus âgé et sceptique qui s'insurge contre les problèmes d'éthique de l'IA peut nous inciter à ignorer les nombreuses preuves du contraire.

Pourquoi cela se produit-il ?

Un certain nombre d'explications ont été proposées pour expliquer l'erreur du taux de base, mais deux théories se distinguent des autres. La première théorie postule qu'il s'agit d'une question de pertinence : nous ignorons les informations relatives au taux de base parce que nous les considérons comme insignifiantes et estimons donc qu'elles doivent être ignorées. La seconde théorie suggère que l'erreur du taux de base résulte de l'heuristique de la représentativité.

Pertinence

L'article de Maya Bar-Hillel de 1980, "The base-rate fallacy in probability judgments",5 aborde les limites des théories précédentes et présente une autre explication : la pertinence. Plus précisément, nous ignorons les informations relatives au taux de base parce que nous pensons qu'elles ne sont pas pertinentes pour le jugement que nous portons.

Bar-Hillel soutient qu'avant de porter un jugement, nous classons les informations qui nous sont données selon différents niveaux de pertinence. Si un élément est jugé non pertinent, nous l'écartons et n'en tenons pas compte dans notre conclusion. Ce n'est pas que nous soyons incapables d'intégrer l'information, mais plutôt que nous considérons qu'elle n'a pas assez de valeur pour être intégrée. Cette tendance nous amène à ignorer des informations vitales, à accorder plus d'importance que nécessaire à certaines informations ou à nous concentrer sur une seule source d'information alors que nous devrions en intégrer plusieurs.

En outre, Bar-Hillel explique que la spécificité est l'un des éléments qui font que nous considérons certaines informations comme plus pertinentes que d'autres. Plus l'information est spécifique à la situation en question, plus elle semble pertinente. Les informations individuelles sont, par nature, incroyablement spécifiques. C'est pourquoi nous les considérons comme très pertinentes. En revanche, les informations sur le taux de base sont très générales. C'est pourquoi nous les considérons comme peu pertinentes. Ces différents niveaux de spécificité nous amènent à ne prendre en compte que les informations individuelles lors de la prise de décision. Nous sommes loin de nous rendre compte que les informations sur le taux de base sont souvent un meilleur indicateur de la probabilité, ce qui compromet la précision de nos jugements.

Représentativité

Bar-Hillel soutient que la représentativité seule ne suffit pas à expliquer pourquoi le sophisme du taux de base se produit, car elle ne peut pas tenir compte de tous les contextes.6 Cela dit, la représentativité reste un facteur contribuant au sophisme du taux de base, en particulier dans des cas tels que l'étude de Tom W. décrite par Kahneman et Tversky.7

Les heuristiques sont des raccourcis mentaux que nous utilisons pour faciliter les jugements lors de la prise de décision. En particulier, l'heuristique de représentativité, introduite par Kahneman et Tversky, décrit notre tendance à juger la probabilité en fonction de la mesure dans laquelle une chose est similaire à l'exemplaire prototypique de la catégorie dans laquelle elle s'inscrit.

Voyons comment cela fonctionne. En général, nous classons mentalement les objets et les événements, en les regroupant sur la base de caractéristiques similaires. Chaque catégorie possède un prototype : l'exemple moyen de tous les membres appartenant à cette catégorie. Plus l'objet ressemble à ce prototype, plus nous le jugeons représentatif de cette catégorie, y compris en termes de probabilité.8 L'heuristique de représentativité donne lieu à l'erreur du taux de base lorsque nous considérons un événement ou un objet comme extrêmement représentatif et que nous émettons un jugement de probabilité sur cette seule base, sans nous arrêter aux valeurs du taux de base.

Pour revenir à l'exemple de Tom W., les participants n'ont déduit son domaine d'études qu'à partir de l'apparence de la bande dessinée. Le jugeant représentatif d'un étudiant diplômé en informatique, les participants l'ont classé comme le plus susceptible d'étudier dans ce domaine, plutôt que dans des programmes ayant des taux d'inscription bien plus élevés. Étant donné qu'il y avait beaucoup plus d'étudiants en éducation et en sciences humaines à l'époque, il était beaucoup plus probable qu'il étudie dans l'un de ces domaines. Cependant, la représentativité a amené les participants à négliger l'information sur le taux de base, ce qui a donné lieu à des prédictions de probabilité inexactes.

Pourquoi c'est important

Dans certains cas, le fait de s'appuyer uniquement sur les informations d'individualisation nous aide à comprendre les valeurs aberrantes, c'est-à-dire les anomalies qui se situent en dehors du domaine de la probabilité. Mais la plupart du temps, le fait d'ignorer complètement les informations relatives au taux de base conduit à de mauvais jugements. Après tout, nous basons nos prédictions sur des stéréotypes plutôt que sur des statistiques.

Bien sûr, ce n'est pas très grave lorsque nous nous trompons sur la spécialité ou la profession de quelqu'un. Cependant, l'erreur du taux de base conduit à des suppositions infondées sur les individus qui peuvent avoir des conséquences réelles. Par exemple, nous pouvons soupçonner que notre collègue est plus susceptible de commettre un crime en raison de sa race ou de sa religion, même si les statistiques révèlent que c'est loin d'être le cas. Pour lutter contre les préjugés et s'assurer que nous traitons tout le monde de manière équitable, nous devons apprendre à nous défendre contre l'erreur du taux de base une fois pour toutes.

Comment l'éviter ?

Pour éviter de commettre l'erreur du taux de base, nous devons nous efforcer d'accorder plus d'attention aux informations du taux de base dont nous disposons et reconnaître que les informations individuelles ne sont pas un prédicteur très fiable du comportement futur. Dans les deux cas, nous devons faire preuve de plus d'intentionnalité lorsque nous évaluons la probabilité qu'un événement donné se produise. Il est plus facile de se rabattre sur des processus automatiques et sans effort, qui facilitent grandement la prise de décision. Cependant, cela augmente considérablement le risque d'erreur. En prenant conscience de cette erreur et en la combattant activement, nous pouvons réduire la fréquence à laquelle nous la commettons et mieux comprendre le monde qui nous entoure.

Comment tout a commencé

Il est impossible de parler de l'erreur du taux de base sans mentionner Kahneman et Tversky. Leur article de 1973, "On the Psychology of Prediction "9, décrit comment l'heuristique de représentativité peut nous amener à commettre l'erreur du taux de base. Ils l'ont illustré par l'étude de Tom W., mentionnée précédemment, dans laquelle les participants ont fait leurs prédictions sur la base de l'esquisse de personnalité et ont oublié de tenir compte du nombre d'étudiants diplômés inscrits dans chaque programme.

Une autre explication précoce de l'erreur du taux de base est l'article de Maya Bar-Hillel de 1980, "The base-rate fallacy in probability judgments".10 Elle décrit l'erreur comme "la tendance des gens à ignorer les taux de base en faveur, par exemple, de l'information d'individualisation (lorsqu'elle est disponible), plutôt que d'intégrer les deux". L'article souligne les limites de l'explication de la représentativité de Kahneman et Tversky et propose une autre théorie pour expliquer l'erreur du taux de base.

Plus précisément, Bar-Hillel désigne la pertinence perçue comme le facteur sous-jacent. Elle suggère que plus une information est spécifique, plus nous lui attribuons de pertinence. Ainsi, nous sommes attentifs aux informations sur l'individualisation parce qu'elles sont spécifiques et donc considérées comme pertinentes. En revanche, nous ignorons les informations sur le taux de base parce qu'elles sont générales et donc jugées moins pertinentes.

Exemple 1 - Le problème des taxis

Cet exemple classique du sophisme du taux de base est tiré du document fondateur de Bar-Hillel.11 Tout d'abord, les participants apprennent les informations suivantes sur le taux de base. Dans une ville fictive, il existe deux compagnies de taxis nommées d'après la couleur de leurs taxis : la compagnie "verte" et la compagnie "bleue". Sur l'ensemble des taxis de la ville, 85 % sont bleus et 15 % sont verts.

Les chercheurs ont ensuite présenté aux participants un scénario hypothétique dans lequel un témoin identifie un taxi impliqué dans un délit de fuite comme étant vert. Pour évaluer leur fiabilité, la cour teste la capacité du témoin à distinguer les taxis bleus des taxis verts. Les résultats révèlent que le témoin peut distinguer les couleurs avec précision dans 80 % des cas, mais qu'il les confond dans 20 % des cas. Après avoir entendu ce scénario, les participants ont prédit la probabilité que le taxi impliqué dans le délit de fuite soit effectivement vert.

La plupart des participants ont estimé que la probabilité que le témoin identifie correctement un taxi vert est de 80 %. Cependant, tous ceux qui donnent cette réponse sont victimes de l'erreur du taux de base. Rappelez-vous que l'information sur le taux de base a révélé que seuls 15 % des taxis de la ville sont verts, ce qui fait que la probabilité réelle que le témoin ait eu raison est de 41 %. Cette probabilité doit être calculée à l'aide de statistiques inférentielles, qui prennent en compte à la fois le pourcentage de taxis de chaque couleur dans la ville et la probabilité que le témoin ait correctement distingué les couleurs la nuit.

Exemple 2 - Quel est le montant de votre don ?

Dans leur article de 2000 intitulé "Feeling 'holier than thou' : are self-serving assessments produced by errors in self- or social prediction",12 Nicholas Epley et David Dunning ont découvert que nous avons tendance à commettre l'erreur du taux de base lorsque nous prédisons notre propre comportement parce que nous avons accès à de nombreuses informations individuelles sur nous-mêmes. Au cours de leurs recherches, ils ont donné cinq dollars à des étudiants universitaires et leur ont demandé de prédire la part de cet argent qu'ils donneraient à des œuvres caritatives, ainsi que la part que donnerait la personne moyenne. Après leurs prédictions initiales, les participants ont pris connaissance des dons de 13 de leurs pairs, un par un. Les participants ont été autorisés à revoir leurs prédictions après que les dons de trois d'entre eux ont été révélés, puis après que sept d'entre eux ont été révélés, et encore une fois après que le treizième a été révélé.

En général, les participants ont estimé que leur propre générosité était supérieure à celle de leurs pairs. Au début de l'étude, la prédiction moyenne de leur propre don était d'environ 2,75 $, tandis que la prédiction moyenne de leurs pairs était d'environ 2,25 $. Le montant moyen réel des dons était de 1,50 $. Aux trois moments où ils ont eu la possibilité de réviser leurs prévisions, les participants ont ajusté leurs prévisions concernant les dons de leurs pairs afin de les faire correspondre aux informations sur le taux de base qu'ils avaient acquises. Après avoir vu les 13 dons effectués par leurs pairs, la prédiction moyenne des dons de leurs pairs était très proche du montant moyen réel des dons, à savoir 1,50 $. Il est toutefois intéressant de noter que les prédictions des participants pour eux-mêmes n'ont pas changé, même s'ils ont obtenu davantage d'informations sur le taux de base.

La raison pour laquelle les participants ont pris en compte les informations de base lorsqu'ils ont fait des prédictions sur leurs pairs est qu'ils n'avaient pas accès à des informations individuelles sur ces personnes. Par conséquent, ils ont dû se fier uniquement aux informations sur le taux de base. Cependant, ce n'était pas le cas lorsqu'ils faisaient des prédictions sur eux-mêmes. Les participants ont utilisé leur propre personnalité et leurs comportements passés comme informations d'individualisation pour prédire combien d'argent ils allaient donner. Comme nous avons tendance à accorder plus d'importance aux informations individuelles qu'aux informations de base, ils n'ont pas ajusté leurs prédictions pour eux-mêmes lorsqu'ils ont eu accès à davantage d'informations de base.13

Cela démontre que, lorsqu'aucune information spécifique d'individualisation n'est disponible, nous utilisons l'information de base pour faire des prédictions. Cependant, dès que nous avons accès à ces informations, nous nous y accrochons et les utilisons à la place.

Résumé

Qu'est-ce que c'est ?

Le sophisme du taux de base fait référence au fait que nous avons tendance à nous fier davantage à des informations spécifiques qu'à des statistiques lorsque nous émettons des jugements de probabilité.

Pourquoi cela se produit-il ?

Deux facteurs principaux contribuent à l'apparition de l'erreur du taux de base. Le premier est l'heuristique de représentativité, selon laquelle la mesure dans laquelle un événement ou un objet est représentatif de sa catégorie influence nos jugements de probabilité, sans tenir compte des taux de base. Une autre est la pertinence, qui suggère que nous considérons les informations spécifiques comme plus pertinentes que les informations générales, et que nous nous intéressons donc sélectivement aux informations d'individualisation plutôt qu'aux informations de base.

Exemple 1 - Le problème des taxis

Une explication classique du sophisme du taux de base implique un scénario dans lequel 85% des taxis d'une ville sont bleus et les autres verts. Lorsqu'un taxi est impliqué dans un délit de fuite, un témoin affirme que le taxi était vert, mais des tests ultérieurs montrent qu'il n'identifie correctement la couleur du taxi la nuit que dans 80 % des cas.

Lorsqu'on leur demande quelle est la probabilité que le taxi impliqué dans le délit de fuite soit vert, les gens ont tendance à répondre qu'elle est de 80 %. Toutefois, cette réponse ne tient pas compte de l'information sur le taux de base, à savoir que seuls 15 % des taxis de la ville sont verts. En tenant compte de toutes les informations, les chiffres montrent que la probabilité que le témoin ait raison est en fait de 41 %.

Exemple 2 - Quel est le montant de votre don ?

Dans une autre étude, on a demandé à des participants combien, sur les cinq dollars qu'on leur avait donnés, ils feraient don à une organisation caritative donnée. On leur a demandé de faire la même prédiction au sujet de leur camarade moyen. Ensuite, on a présenté aux participants les dons réels de 13 autres pairs et on leur a donné la possibilité d'ajuster leurs prédictions. Ils ont modifié leurs prédictions concernant leurs pairs pour les faire correspondre aux informations sur le taux de base, mais n'ont pas modifié leurs prédictions pour eux-mêmes en raison de leur trop grande dépendance à l'égard des informations d'individualisation.

Comment l'éviter ?

Pour éviter de commettre l'erreur du taux de base, nous devons adopter une approche plus active de l'évaluation des probabilités en accordant plus d'attention aux informations du taux de base dont nous disposons et en reconnaissant que les informations individuelles ne sont pas des prédicteurs très fiables.

Articles connexes de TDL

Pourquoi utilise-t-on la similitude pour évaluer la probabilité statistique ?

Comme nous l'avons vu plus haut, Kahneman et Tversky ont émis l'hypothèse que l'erreur du taux de base est due à l'heuristique de représentativité, selon laquelle nous évaluons la probabilité d'un événement en fonction de sa ressemblance avec un prototype mental existant. Lisez cet article pour en savoir plus sur l'heuristique de représentativité et sur d'autres types de prédictions erronées qu'elle peut nous amener à faire.

Pourquoi sommes-nous trop confiants dans nos prévisions ?

Le sophisme du taux de base est l'un des principaux facteurs à l'origine de l'illusion de validité, c'est-à-dire de notre tendance à être trop confiants dans l'exactitude de nos jugements, en particulier de nos prédictions. Lisez cet article pour en savoir plus sur les types de situations dans lesquelles l'illusion de validité nous affecte, ainsi que sur ce que nous pouvons faire pour l'éviter.

Références

  1. Kahneman D. and Tversky, A. (1973). On the Psychology of Prediction. Psychology Review. 80(4), 237-251. doi: 10.1037/h0034747
  2. See 1
  3. Chen, J. (2020). Base Rate Fallacy. Investopedia. https://www.investopedia.com/terms/b/base-rate-fallacy.asp
  4. Kahneman, Daniel; Amos Tversky (1985). "Evidential impact of base rates". In Daniel Kahneman, Paul Slovic & Amos Tversky (ed.). Judgment under uncertainty: Heuristics and biases. Cambridge University Press. pp. 153–160.
  5. Bar-Hillel, M. (1980). The base-rate fallacy in probability judgments. Acta Psychologica, 44(3), 211–233. doi: 10.1016/0001-6918(80)90046-3
  6. See 5
  7. See 1
  8. Kahneman, D., & Tversky, A. (1972). Subjective probability: a judgment of representativeness. Cognitive Psychology, 3(3), 430–454. doi: 10.1016/0010-0285(72)90016-3
  9. See1
  10. See 5
  11. See 5
  12. Epley, N., & Dunning, D. (2000). Feeling "holier than thou": are self-serving assessments produced by errors in self- or social prediction? Journal of Personality and Social Psychology, 79(6), 861–75. doi: 10.1037/0022-3514.79.6.861
  13. See 12
Notes illustration

Vous souhaitez savoir comment les sciences du comportement peuvent aider votre organisation ?