Het Gevangenendilemma

Het gevangenendilemma is een spelvorm waarbij twee spelers of partijen de keuze hebben uit twee strategieën. Met deze keuzes komen de spelers voor een dilemma te staan. Wordt de keuze gemaakt op basis van eigenbelang of wordt er samengewerkt om voor beide partijen de meest gunstige uitkomst te realiseren. Hoe werkt het gevangenendilemma en hoe is dit spel op de praktijk toe te passen?

Het gevangenendilemma

Het gevangenendilemma is bedoeld om te laten dat zien dat wanneer twee partijen een keuze maken puur uit eigen belang, de uitkomst minder goed uitpakt dan wanneer de partijen samenwerken. Het gevangenendilemma is in eerste instantie ontworpen om de keuze van twee gevangen aan te geven.

Het dilemma

Het gevangenendilemma gaat over twee verdachten van een moord, Bonnie en Clyde. De moord is het gevolg van een gewapende overval. De rechter heeft concrete bewijzen om Bonnie en Clyde te veroordelen vanwege verboden wapenbezit en het plegen van een overval, maar heeft onvoldoende bewijs om Bonnie of Clyde te veroordelen voor het plegen van moord. De twee gevangen worden apart van elkaar opgesloten en worden verhoord. Ze krijgen beiden een gelijkwaardig voorstel voorgelegd. Bonnie krijgt het volgende voorstel: als je bekent en Clyde bekent ook, krijgen jullie allebei acht jaar gevangenisstraf. Als je bekent en Clyde bekent niet, krijg jij 1 jaar gevangenisstraf. Clyde gaat in dat geval 12 jaar de gevangenis in. Als jullie allebei zwijgen, hebben we geen bewijs en gaan jullie allebei 2 jaar de gevangenis in.

De keuze

Het lastige bij de keuze is dat Bonnie niet weet waarvoor Clyde zal kiezen. Bonnie zal de overweging moeten maken wat Clyde zal gaan kiezen. De gedachte is dat de keuze op eigenbelang gebaseerd zal zijn. Wanneer Clyde zwijgt, zal Bonnie beter kunnen bekennen. In dat geval hoeft zij maar 1 jaar naar de gevangenis in plaats van 2 jaar. Wanneer Clyde bekent, zal Bonnie ook beter kunnen bekennen. Ze hoeft dan maar 8 jaar naar de gevangenis in plaats van 12 jaar. Echter is de gezamenlijke uitkomst het beste wanneer zowel Bonnie als Clyde zwijgen. In dat geval gaan ze beiden 2 jaar naar de gevangenis. In alle andere situaties is het gezamenlijke aantal jaren gevangenisstraf hoger. De vraag is dus of Bonnie bereid is haar individuele winst deels opzij te zetten voor het groepsbelang (bij zwijgen stijgt de minimale gevangenisstraf van 1 naar 2 jaar).

Wanneer zowel Bonnie als Clyde vanuit eigenbelang denken, zullen ze bekennen. Bekennen levert immers altijd minder gevangenisstraf op (1 jaar in plaats van 2 jaar of 8 jaar in plaats van 12 jaar). Echter zullen zowel Bonnie en Clyde hierdoor bekennen en moeten ze allebei 8 jaar naar de gevangenis. Bekennen wordt daarmee ook wel de dominante strategie genoemd. Een dominante strategie is de strategie die het meeste voordeel oplevert, onafhankelijk wat de andere partij kiest.

Bonnie en Clyde zouden eigenlijk samen moeten werken om het beste gezamenlijke resultaat te behalen. Ze kunnen met elkaar afspreken om beide te zwijgen om zo 2 jaar naar de gevangenis te gaan en daarna samen vrij te komen. Het risico is echter groot dat deze afspraak toch wordt verbroken. Wanneer Bonnie zich aan de afspraak houdt en zwijgt en Clyde weet dit, kan Clyde ervoor kiezen om toch te bekennen. In dat geval hoeft hij maar 1 in plaats van 2 jaar naar de gevangenis.

Het gevangenendilemma en het Nash evenwicht

Een Nash evenwicht is een evenwicht wat ontstaat wanneer biede partijen een keuze hebben gemaakt en waarbij verandering van de strategie door één van de partijen niet leidt tot een verbetering voor die partij. In bovenstaand geval is er sprake van een Nash evenwicht wanneer beide partijen hebben gekozen om te bekennen. Ze hebben 8 jaar gevangenisstraf gekregen. Wanneer Bonnie heeft bekend en weet dat Clyde ook heeft bekend, behaalt zij geen voordeel om toch van strategie te wijzigen en te zwijgen. In dat geval gaat ze immers 12 jaar de gevangenis in.

Bij het gevangenendilemma is het Nash-evenwicht echter niet de meest optimale situatie. De meest optimale situatie is de situatie waarin partij A haar opbrengst niet kan verhogen, zonder dat dit leidt tot vermindering van de opbrengsten van partij B. In het geval van Bonnie en Clyde is dit de situatie waarin beide partijen zwijgen. Wanneer Bonnie of Clyde toch bekent, wordt de andere partij benadeeld.

Lange termijn winst door samenwerken

Het gevangenis dilemma toont aan dat samenwerken op de lange termijn de meeste winst oplevert. Stel dat Bonnie en Clyde samen afspreken om te zwijgen en zich aan deze afspraak houden. Na twee jaar zijn ze vrij en ze plegen samen weer een overval. Ze weten nu van elkaar dat ze zich de vorige keer aan de afspraak hebben gehouden. Door weer samen een afspraak te maken, zullen ze hun straf verminderen. Wanneer er geen zicht is op een verdere samenwerking, ligt de keuze wellicht anders. Wanneer Bonnie weet dat ze Clyde toch niet meer zal zien en Clyde houdt zich aan de afspraak, is het voor Bonnie verleidelijk om toch voor haar eigenbelang te kiezen en toch te bekennen. In dat geval hoeft ze maar 1 jaar naar de gevangenis. Het gevangenen dilemma geeft aan dat op korte termijn andere keuzes worden gemaakt dan op lange termijn.

Het gevangenendilemma in de praktijk

Het gevangenendilemma staat in feite symbool voor de samenleving waarin de afweging om wel of niet samen te werken de opbrengst op de korte of lange termijn bepaalt. Als iedereen meewerkt aan de samenleving of de normen en waarden die zijn gesteld, is de opbrengst het grootst. Wanneer de hele samenleving afspreekt om niet te stelen en geld alleen op een eerlijke manier te verdienen, zal de gezamenlijke opbrengst het grootst zijn wanneer iedereen zich aan deze afspraak houdt. Er hoeft immers geen geld besteed te worden aan beveiliging of diefstalpreventie. Er zijn echter altijd mensen die aan de korte termijn winst denken en uit eigenbelang toch besluiten te stelen. Zij gaan er hierdoor op vooruit, terwijl de gezamenlijke opbrengst achteruit gaat.

Het economische gevangenendilemma

Ook in de economie geeft het gevangenendilemma goed aan dat samenwerken op de lange termijn de meeste opbrengst oplevert.

Een markt waarin consumenten 100 miljoen euro kunnen besteden, wordt volledig gedomineerd door twee partijen. Ze hebben allebei dezelfde naamsbekendheid en de kwaliteit van de producten wordt als hetzelfde ervaren. De twee partijen bieden dezelfde prijzen aan. Bij een gelijke verdeling zal bedrijf X en bedrijf Y allebei 50 miljoen euro verdienen. Dan blijkt dat de consumenten gevoelig zijn voor reclame. Met reclame maken wordt de naamsbekendheid vergroot, wat leidt tot extra omzet, wat ten koste gaat van de omzet van bedrijf Y. Stel dat bedrijf X reclame gaat maken, wat het bedrijf 10 miljoen euro kost, en daardoor de helft van de omzet van bedrijf Y voor zich wint. De omzet van bedrijf X gaat dan omhoog naar 65 miljoen euro (50 miljoen euro + 25 miljoen euro - 10 miljoen euro). De omzet van bedrijf Y daalt naar 25 miljoen euro. Dit is te weinig, waardoor het bedrijf ook besluit om reclame te gaan maken. De verloren omzet wordt weer terugverdiend en de omzet stijgt van 25 miljoen euro naar 40 miljoen euro (25 miljoen euro + 25 miljoen euro - 10 miljoen euro). De omzet van bedrijf X daalt hierdoor ook naar 40 miljoen euro. De bedrijven bevinden zich nu in een Nash evenwicht. Een wijziging van de strategie van één van de partijen leidt immers niet tot verbetering van de opbrengsten. De wijziging om geen reclame te maken, leidt immers tot verlies van de klanten. Echter is de optimale situatie de situatie waarin beide partijen geen reclame maken. Hiermee verdienen ze ieder 50 miljoen euro. Omdat één bedrijf met een concurrentieslag is begonnen waarbij het andere bedrijf reageert, zijn uiteindelijk beide partijen slechter uit.

Het gevangenendilemma laat goed zien hoe op korte termijn vanuit eigen belang gehandeld kan worden om de winst of persoonlijke opbrengst te optimaliseren, maar dat het beter is om samen te werken om op de lange termijn in de meest optimale situatie terecht te komen.