Le dilemme du prisonnier

L'idée de base

Adam et Bianca sont arrêtés pour le braquage d'une banque et placés dans des cellules de détention séparées. Le procureur leur fait individuellement la proposition suivante : "Vous pouvez choisir d'avouer ou de garder le silence. Si l'un d'entre vous avoue et que l'autre garde le silence, celui qui avoue s'en sortira libre, tandis que l'autre risque 20 ans de prison. Si vous avouez tous les deux, vous risquez tous les deux cinq ans de prison. Si aucun de vous n'avoue, vous risquez tous les deux un an de prison".

Quelle est la meilleure décision à prendre pour Adam, quelle que soit la décision de Bianca, s'il ne pense qu'à son propre bien-être ? Quelle sera la décision de Bianca, compte tenu des conséquences de tous les scénarios ? Il semble qu'Adam et Bianca se soient retrouvés dans un dilemme de prisonnier.

Les personnes qui combattent le feu par le feu finissent généralement avec des cendres.


- Abigail Van Buren

Termes clés

Dilemme du prisonnier : paradoxe observé principalement dans la théorie des jeux, dans lequel deux individus agissant dans leur propre intérêt ne produisent pas le résultat optimal.1

Théorie des jeux : Analyse des décisions stratégiques prises par des joueurs en interaction, en tant que méthode de modélisation du comportement à l'aide d'une approche mathématique.2

Équilibre de Nash : Concept de la théorie des jeux, selon lequel l'issue optimale d'un jeu se produit lorsqu'aucun joueur n'est incité à s'écarter de la stratégie initiale.3

Stratégie dominante : Affirme que la stratégie choisie par un joueur aboutira aux meilleurs résultats parmi toutes les stratégies possibles pouvant être utilisées par ce joueur, indépendamment de ce que font les autres joueurs.3

L'histoire

Le dilemme du prisonnier a été conçu en 1950 par les mathématiciens Merrill Flood et Melvin Dresher dans un contexte militaire et stratégique pour une classe d'étudiants en psychologie de l'université de Stanford.4 Dans le scénario original (similaire à celui d'Adam et Bianca), deux personnes sont accusées de la même infraction à la loi et sont détenues séparément par les autorités. Dans le scénario original (similaire à celui d'Adam et Bianca), deux personnes sont accusées d'une même infraction à la loi et sont détenues séparément par les autorités. Si les deux avouent, ils seront tous deux condamnés à "une unité" de prison. Toutefois, si les deux parties gardent le silence, elles s'en sortiront toutes les deux libres. Ce jeu non coopératif à deux personnes est considéré comme un des premiers exemples de la théorie des jeux en économie au niveau mondial.

Le dilemme du prisonnier a été fortement popularisé dans la culture et les médias. Dans le film "A Beautiful Mind" (2001), Russel Crowe, qui incarne l'influent mathématicien John F. Nash, explique de façon célèbre le concept de l'équilibre de Nash. Il utilise l'analogie d'hommes abordant des femmes dans un bar et affirme qu'au lieu d'aborder la plus belle femme, les hommes devraient poursuivre les autres femmes du groupe afin de réduire la concurrence et d'obtenir un résultat favorable pour tous (si l'on suppose que l'objectif de chacun est de former un couple et que les femmes ne sont pas en mesure de poursuivre les hommes).5

Le film passe à côté d'un élément clé du dilemme du prisonnier (sans parler du fait qu'il l'applique à un scénario sexiste et déshumanisant). Il implique que l'issue défavorable, ou l'équilibre, peut être évitée ; or, une hypothèse fondamentale du dilemme du prisonnier est que chacun agit dans son propre intérêt. Dans le scénario du film, tous les messieurs se disputeraient la "plus belle femme", car chaque homme agirait dans son propre intérêt - la stratégie dominante. Nous devrions donc peut-être nous contenter d'apprendre l'économie comportementale en dehors des films populaires.

Les personnes

Melvin Dresher

Mathématicien américain d'origine polonaise, Dresher a notamment développé avec Merrill Flood le modèle de théorie des jeux connu sous le nom de dilemme du prisonnier. Ils ont développé ce modèle à la RAND Corporation, un groupe de réflexion américain à but non lucratif sur la politique mondiale, en 1950. Dresher a obtenu son doctorat à l'université de Yale et a travaillé comme professeur de mathématiques au Michigan State College, statisticien, physicien mathématicien, professeur de mathématiques et chercheur en mathématiques. Il est également l'auteur de nombreux documents de recherche de la RAND sur la théorie des jeux, ainsi que de The Mathematics of Games of Strategy, Theory and Applications (Les mathématiques des jeux de stratégie, théorie et applications), qui a été largement acclamé.6, 7

Merrill Flood

Mathématicien américain, Flood est reconnu comme un pionnier dans le développement des sciences des opérations et de la gestion. Il est surtout connu pour sa collaboration avec Melvin Dresher dans le développement du dilemme du prisonnier dans les années 1950. Après avoir terminé ses études d'algèbre à l'université de Princeton, Flood a été engagé par l'institution en tant qu'instructeur de mathématiques. Flood a également travaillé comme scientifique civil en chef au département de la guerre des États-Unis pendant la Seconde Guerre mondiale et pour l'Office of Naval Research. Avec son collègue mathématicien américain John Tukey, Flood est également à l'origine du nom de la discipline "programmation linéaire".8

Albert W. Tucker

Albert W. Tucker était un mathématicien canado-américain, principalement reconnu pour ses contributions à la topologie, à la théorie des jeux et à la programmation non linéaire. Tucker est reconnu pour avoir nommé et popularisé le dilemme du prisonnier, en concevant la situation couramment utilisée et reformulée, similaire à celle présentée au début de ce guide de référence. Il a obtenu son doctorat à l'université de Princeton et est devenu professeur de mathématiques dans cette institution en 1946. Pendant la Seconde Guerre mondiale, il a travaillé au sein du projet de contrôle des tirs de Merrill Flood et a géré la recherche sur les préradars et les télémètres optiques pour les systèmes antiaériens.4

Conséquences

Paradoxalement, le meilleur scénario pour le bien-être général d'Adam et de Bianca serait qu'ils gardent le silence. Cependant, s'ils agissent uniquement en fonction de leur bien-être personnel, ils choisiront d'avouer. Ce scénario représente l'équilibre de Nash non coopératif. L'ironie, cependant, c'est que lorsque chacun agit égoïstement, les résultats sont pires que s'ils coopéraient.9

Le cadre conceptuel du dilemme du prisonnier peut être appliqué à diverses disciplines qui présentent des caractéristiques similaires à celles observées dans le modèle. Le dilemme du prisonnier s'observe principalement dans les situations commerciales. Un exemple couramment utilisé est celui de deux commerçants qui se font concurrence dans le même quartier et qui doivent décider d'augmenter ou de baisser le prix de leurs services respectifs. Si l'un des commerçants baisse son prix en dessous de celui de son concurrent, il attirera les clients de ce dernier et augmentera ses bénéfices. En revanche, si les deux commerçants baissent leurs prix, aucun d'entre eux n'attirera de nouveaux clients et les bénéfices seront moindres.

Le dilemme du prisonnier peut également être un instrument utile pour prédire le résultat comportemental de certaines situations, telles que la mise en œuvre de nouvelles stratégies de marketing ou la décision d'abandonner d'anciens produits.10 Pour les entreprises, ce concept permet de prédire le comportement des concurrents et ses conséquences.

Controverses

Bien que le dilemme du prisonnier soit tenu en haute estime et puisse être appliqué à certaines situations du monde réel, certaines hypothèses menacent la validité écologique de ce modèle et son applicabilité en dehors du tableau 2×2 dans lequel il est généralement présenté. Tout d'abord, il est faux de croire que tous les joueurs sont complètement rationnels. Les humains font l'expérience de la rationalité limitée, ce qui signifie qu'ils ont une capacité de réflexion limitée qui dépend des informations disponibles et du temps.11 Bien que des efforts aient été faits pour prendre en compte la prise de décision irrationnelle dans les modèles économiques, la théorie des jeux a encore un long chemin à parcourir avant de pouvoir saisir l'impact considérable des biais cognitifs sur le comportement humain.10

Le dilemme du prisonnier suppose également que les joueurs n'agissent que dans le but d'optimiser leur propre bien-être, mais les humains sont des êtres sociaux qui se soucient du bien-être des autres. Le comportement altruiste, parfois au détriment du bien-être personnel, n'est pas inconnu de la société et les modèles de la théorie des jeux n'en tiennent pas encore compte.12

Études de cas

L'industrie du tabac

En 1971, le gouvernement américain a interdit aux fabricants de tabac de diffuser des publicités pour les cigarettes à la télévision. On pourrait penser que les fabricants de tabac ont souffert de cette restriction car ils ont été moins exposés, mais en fait, l'industrie du tabac a réalisé des bénéfices plus importants qu'auparavant. Pourquoi cela s'est-il produit ?

Tout d'abord, revenons à la situation qui prévalait avant l'interdiction de la publicité. Les fabricants de tabac qui font de la publicité auront un léger avantage sur ceux qui n'en font pas, car la publicité façonne la perception de la marque et peut influencer la préférence des clients pour une marque plutôt qu'une autre. Les fumeurs de tabac fumeront indépendamment du fait que les entreprises fassent de la publicité, il s'agit simplement de savoir à quelle entreprise ils choisissent de s'approvisionner. Il s'avère que tous les fabricants de tabac s'en sortiraient mieux sans publicité, à condition que tous les autres fabricants de tabac ne fassent pas non plus de publicité.13

Si l'on compare directement avec le dilemme du prisonnier, les trois scénarios possibles sont les suivants (en supposant qu'il n'y ait que deux fabricants de tabac dans l'industrie) : si l'un des fabricants fait de la publicité et l'autre non, celui qui fait de la publicité engrangera des bénéfices plus importants. Si les deux entreprises font de la publicité, elles feront toutes deux des bénéfices, mais dans une moindre mesure que si aucune d'entre elles n'avait fait de publicité. Le dernier résultat, le plus optimal, serait qu'aucune des deux entreprises ne fasse de publicité, ce qui leur laisserait à toutes deux un bénéfice plus important que dans le cas où les deux entreprises feraient de la publicité. Ici, nous pouvons voir que la stratégie dominante serait de faire de la publicité. Toutefois, avec l'interdiction du gouvernement, le résultat coopératif optimal est forcé et tous les fabricants de tabac finissent par réaliser des bénéfices plus importants.10

Course aux armements

Au début de la guerre froide, les États-Unis et l'Union soviétique se sont livrés à une course aux armements nucléaires. Dans leur lutte pour la suprématie, les deux pays ont consacré des milliards de dollars et de ressources à la fabrication d'armes nucléaires. Cette période de l'histoire peut être ramenée à la structure commune du dilemme du prisonnier.14

Les États-Unis et l'Union soviétique peuvent choisir de s'armer ou de se désarmer. Il existe donc trois scénarios possibles : Si l'un s'arme tandis que l'autre désarme, c'est celui qui s'arme qui en tirera le plus d'avantages. Si les deux choisissent de s'armer, ils devront tous deux faire face à des conséquences plus défavorables que si les deux choisissent de désarmer, ce qui est le troisième résultat, le plus optimal pour les deux parties concernées, permettant d'économiser des ressources et de maintenir la menace d'une guerre nucléaire à distance. Cependant, comme l'hypothèse du dilemme du prisonnier est que les deux parties n'agissent que pour leur bénéfice personnel, la stratégie dominante pour les deux parties est de s'armer.15

Contenu connexe de TDL

Guide de référence : Théorie des jeux

Vous souhaitez en savoir plus sur la théorie des jeux ? Ce guide de référence vous fournira tout ce que vous devez savoir sur ce concept applicable et intéressant.

Biais : L'aversion pour la perte

Ce biais cognitif permet de comprendre pourquoi nous pouvons agir de manière défavorable tout en essayant de prendre la meilleure décision pour notre bien-être personnel. De l'économie comportementale à la psychologie, cet article sur l'aversion à la perte est à la fois perspicace et important pour comprendre la motivation humaine.

Guide de référence : Tragédie des biens communs

Un modèle de théorie des jeux tout aussi intéressant et pertinent, la Tragédie des biens communs, illustre également un scénario qui aboutit à un résultat indésirable et non coopératif. Lisez ce guide de référence si vous souhaitez en savoir plus sur le sort unanimement accepté des ressources communes non réglementées.

Le jeu qui ne s'arrête jamais

Parmi les nombreuses applications de la théorie des jeux, cet article offre une perspective sur la manière dont vous pouvez différencier les dons de charité entre les véritables bonnes volontés et les donateurs qui donnent pour recevoir des récompenses ou éviter des punitions.

La théorie des jeux peut expliquer pourquoi vous devriez porter un masque, quelles que soient vos convictions

Vous souhaitez savoir comment le dilemme du prisonnier peut s'appliquer directement au monde réel ? Sanketh Andhavarapu explique comment la théorie des jeux peut aider à modéliser la décision de porter un masque, tout en examinant les différents arguments en faveur du non-port du masque. Cet article facile à comprendre est un excellent moyen de se plonger dans les nombreuses applications du dilemme du prisonnier.

Sources d'information

  1. Chappelow, J. (2021, 30 mai). Définition du dilemme du prisonnier. Investopedia. https://www.investopedia.com/terms/p/prisoners-dilemma.asp.
  2. Théorie des jeux (comportementale). BehavioralEconomics.com | The BE Hub. (2019, 29 mars). https://www.behavioraleconomics.com/resources/mini-encyclopedia-of-be/behavioral-game-theoy/.
  3. Chen, J. (2021, 19 mai). Équilibre de Nash. Investopedia. https://www.investopedia.com/terms/n/nash-equilibrium.asp.
  4. Informer. (n.d.). Tucker, Albert W. INFORMS. https://www.informs.org/Explore/History-of-O.R.-Excellence/Biographical-Profiles/Tucker-Albert-W.
  5. Hartley, J. (2015, 26 mai). La contribution indélébile de John Nash à l'analyse économique. Forbes. https://www.forbes.com/sites/jonhartley/2015/05/25/john-nashs-indelible-contribution-to-economic-analysis/?sh=3d 0c361d4d8a.
  6. Notice nécrologique, édition du 2 juillet 1992 du journal Palisadian-Post (Pacific Palisades, Californie).
  7. "In Remembrance", numéro du 9 juillet 1992 de RAND Items (publication bihebdomadaire destinée aux employés de RAND).
  8. Informer. (n.d.). Flood, Merrill M. INFORMS. https://www.informs.org/Explore/History-of-O.R.-Excellence/Biographical-Profiles/Flood-Merrill-M.
  9. Encyclopædia Britannica, inc. (n.d.). Le dilemme du prisonnier. Encyclopædia Britannica. https://www.britannica.com/science/game-theory/The-prisoners-dilemma.
  10. Théorie des jeux. The Decision Lab. (2021, 5 février). https://thedecisionlab.com/reference-guide/economics/game-theory/.
  11. Rationalité limitée. Économie comportementale. https://www.behavioraleconomics.com/resources/mini-encyclopedia-of-be/bounded-rationality/.
  12. Hayes, A. (2020). Définition de la théorie des jeux. Investopedia. https://www.investopedia.com/terms/g/gametheory.asp.
  13. YouTube. (2017). Leçons de théorie des jeux - Exemple historique : Les compagnies de tabac. YouTube. https://www.youtube.com/watch?v=27scYCyhd5o&ab_channel=365Careers.
  14. États-Unis contre Union soviétique : Prisoner's Dilemma. Université de Cornell. (2015, 11 septembre). https://blogs.cornell.edu/info2040/2015/09/11/united-states-vs-soviet-union-prisoners-dilemma/
  15. Plous, S. (1993). The Nuclear Arms Race : Prisoner's Dilemma or Perceptual Dilemma ? Journal of Peace Research, 30(2), 163-179. https://doi.org/10.1177/0022343393030002004

Read Next

Notes illustration

Vous souhaitez savoir comment les sciences du comportement peuvent aider votre organisation ?