Das Gefangenendilemma: Das Spiel, das die Welt erklärt

Zwei Verdächtige werden nach einem Raubüberfall verhaftet und in getrennten Räumen festgehalten. Die Polizei hat genug Beweise, um beide wegen eines kleineren Delikts zu verurteilen, nicht aber wegen des schwerwiegenden, also macht sie jedem Gefangenen dasselbe stille Angebot. Verrate deinen Partner, und du gehst frei aus, während er die lange Strafe absitzt. Schweige, während er redet, und du trägst stattdessen die Schuld. Wenn ihr beide redet, bekommt jeder von euch eine mittlere Strafe. Wenn ihr beide schweigt, bekommt jeder von euch nur die leichte. Keiner der Gefangenen kann den anderen sehen, mit ihm sprechen oder ihm trauen. Jeder hat nur Minuten, um sich zu entscheiden.

Es klingt nach dem Aufbau eines Kriminalfilms, und Varianten davon waren es auch. Doch diese kleine Szene, von Mathematikern der RAND Corporation um 1950 formalisiert und vom Princeton-Mathematiker Albert Tucker mit ihrem einprägsamen Namen versehen, wurde zu einem der am meisten untersuchten Rätsel der modernen Wissenschaft. Das Gefangenendilemma ist täuschend einfach, und doch erfasst es etwas Beunruhigendes über Kooperation, Vertrauen und Eigennutz, das überall auftaucht, von Wettrüsten über Klimaverhandlungen bis zum Preis einer Tankfüllung. Es ist in einem ganz realen Sinne ein Spiel, das die Welt erklärt.

Der klassische Aufbau

Die Kraft des Dilemmas liegt in seiner präzisen Struktur. Jeder Gefangene hat zwei Möglichkeiten: kooperieren (miteinander, indem sie schweigen) oder defektieren (indem sie den anderen an die Polizei verraten). Daraus ergeben sich vier mögliche Ausgänge. Wenn beide kooperieren, bekommt jeder eine leichte Strafe, sagen wir ein Jahr. Wenn beide defektieren, bekommt jeder eine schwerere, sagen wir drei Jahre. Doch in den asymmetrischen Fällen schnappt die Falle zu. Wenn einer defektiert, während der andere treu bleibt, geht der Verräter frei und der loyale Partner sitzt die volle Strafe ab, sagen wir fünf Jahre.

Legt man diese Auszahlungen nebeneinander, zeigt sich eine seltsame Logik. Aus Sicht jedes Gefangenen ist das beste persönliche Ergebnis, zu defektieren, während der andere kooperiert: Man geht ohne Strafe davon. Das schlechteste ist, zu kooperieren, während der andere defektiert: Man sitzt die längste Strafe ab, und der Partner lacht sich auf dem ganzen Heimweg ins Fäustchen. Das Rätsel besteht darin, dass das, was für jeden Einzelnen rational aussieht, ein Ergebnis hervorbringt, das für beide schlecht ist. Das Dilemma liegt nicht darin, dass die Gefangenen dumm sind. Es liegt darin, dass sie schlau sind, und ihre Schlauheit fängt sie in der Falle.

Warum rationale Spieler defektieren

Folgen wir der Überlegung so, wie jeder Gefangene sie anstellen würde. Angenommen, du gehst davon aus, dass dein Partner schweigt. Dann ist dein bester Zug, zu defektieren, denn frei auszugehen schlägt ein Jahr Gefängnis. Nun angenommen, dein Partner redet stattdessen. Dein bester Zug ist immer noch, zu defektieren, denn drei Jahre schlagen fünf. Egal, was die andere Person tut, du fährst besser, wenn du sie verrätst. In der Sprache der Spieltheorie ist Defektion eine dominante Strategie: Sie ist in jedem möglichen Szenario die bessere Wahl.

Beide Gefangenen stellen dieselbe Rechnung an, also defektieren beide, und beide enden mit der schwereren dreijährigen Strafe. Hätten sie hingegen beide geschwiegen, hätte jeder nur ein Jahr abgesessen. Sie haben sich in ein schlechteres Ergebnis hineingedacht, als ihnen zur Verfügung stand. Diese Kombination aus gegenseitigem Verrat ist das, was Ökonomen ein Nash-Gleichgewicht nennen, benannt nach dem Mathematiker John Nash, dessen Arbeit an diesen Problemen zentral für seinen Wirtschaftsnobelpreis von 1994 war. Ein Nash-Gleichgewicht ist ein Zustand, in dem kein Spieler sein Ergebnis verbessern kann, indem er seine Strategie allein ändert. Gegenseitige Defektion ist gerade deshalb stabil, weil kein Gefangener sich besserstellen kann, indem er zum Schweigen übergeht, während der andere weiter verrät.

Die tiefere Lektion ist die Kluft zwischen individueller Rationalität und kollektivem Nutzen. Das Ergebnis, das beide Spieler wollen (gegenseitige Kooperation), ist nicht stabil, weil jeder versucht ist, sich den zusätzlichen Vorteil des Verrats zu greifen. Vertrauen ist in dieser auf das Wesentliche reduzierten Welt nicht so sehr naiv als vielmehr nicht durchsetzbar. Es gibt keinen Vertrag, keinen Handschlag, keine Möglichkeit, einen Betrüger im Nachhinein zu bestrafen. Und ohne Durchsetzung zieht der Eigennutz unerbittlich zum schlechteren gemeinsamen Ergebnis.

Wenn sich das Spiel wiederholt

Die Geschichte ändert sich dramatisch, wenn das Spiel mehr als einmal gespielt wird. Eine einzige Runde belohnt den Verrat, doch reale Beziehungen, zwischen Ländern, Unternehmen oder Nachbarn, umfassen meist wiederholte Begegnungen. Das ist das iterierte Gefangenendilemma, und es öffnet die Tür zur Kooperation, denn der Verrat von heute kann morgen bestraft werden.

Die berühmteste Demonstration kam vom Politikwissenschaftler Robert Axelrod, der in den späten 1970er und frühen 1980er Jahren Forscher einlud, Computerstrategien einzureichen, die in wiederholten Runden des Spiels gegeneinander antreten sollten. Der überraschende Sieger war eines der einfachsten eingereichten Programme, genannt Tit for Tat (Wie du mir, so ich dir), eingereicht vom Mathematiker Anatol Rapoport. Seine Regel war fast kindlich: kooperiere im ersten Zug, dann tu, was dein Gegner zuletzt getan hat. Sei zu Beginn freundlich, vergelte Verrat, aber vergib, sobald die andere Seite wieder kooperiert. Diese Mischung aus Freundlichkeit, Vergeltung und Vergebung übertraf weitaus aufwändigere und aggressivere Strategien.

Axelrod zog aus diesen Turnieren eine weitreichende Lehre: Kooperation kann unter eigennützigen Spielern entstehen, aber nur unter den richtigen Bedingungen. Es hilft, wenn die Zukunft genug zählt (wenn Spieler erwarten, sich wiederzubegegnen), wenn Defektion bestraft und gutes Verhalten belohnt wird. Ein anschauliches Echo aus der realen Welt zeigte sich in den Schützengräben des Ersten Weltkriegs, wo sich gegnerische Soldaten manchmal auf informelle "Leben und leben lassen"-Waffenruhen einließen und das Feuer einstellten, solange die andere Seite dasselbe tat. Historiker wie Spieltheoretiker haben dies als iterierte Kooperation in Aktion gedeutet, getragen vom schlichten Wissen, dass dieselben Feinde sich morgen erneut gegenüberstehen würden.

Dilemmata, die sich in aller Öffentlichkeit verbergen

Sobald man die Gestalt des Gefangenendilemmas kennt, beginnt man, es überall zu sehen. Viele der härtesten Probleme in Wirtschaft und Politik teilen seine Struktur: Jede Partei würde von Kooperation profitieren, doch jede ist versucht zu defektieren, und so endet jeder schlechter dran.

Das Wettrüsten. Während des Kalten Krieges standen die Vereinigten Staaten und die Sowjetunion genau vor dieser Logik. Beide Nationen wären sicherer und reicher gewesen, hätten sie weniger für Waffen ausgegeben. Doch wenn eine abrüstete, während die andere aufrüstete, wäre die abrüstende Seite verwundbar geblieben. Also bauten beide weiter und steckten gewaltige Ressourcen in Arsenale, die keine Seite allein gefahrlos verkleinern konnte. Gegenseitige Defektion, zu schwindelerregenden Kosten.

Preiskriege. Zwei rivalisierende Tankstellen an derselben Ecke würden beide mehr verdienen, wenn sie die Preise hoch hielten. Doch jede ist versucht, die andere zu unterbieten, um Kunden zu gewinnen. Wenn beide die Preise senken, landen sie in einem Preiskrieg, der die Gewinne aller schmälert. Deshalb sind Kartelle von innen heraus instabil: Der Anreiz, beim vereinbarten Preis zu betrügen, ist in die Struktur eingebaut, noch bevor Aufsichtsbehörden ins Spiel kommen.

Übernutzung gemeinsamer Ressourcen. Wenn viele Menschen sich eine gemeinsame Ressource teilen, ein Fischgründe, eine Weidefläche, eine saubere Atmosphäre, gewinnt jeder Einzelne, indem er ein wenig mehr nimmt, während sich die Kosten der Erschöpfung auf alle verteilen. Das Ergebnis kann kollektiver Ruin sein, ein Muster, das der Ökologe Garrett Hardin 1968 als "Tragik der Allmende" populär machte. Es ist das Gefangenendilemma, hochskaliert auf Menschenmengen.

Klimawandel. Die vielleicht größte Version des Dilemmas heute sind die globalen Emissionen. Jedes Land würde von einem stabilen Klima profitieren, doch Emissionen zu senken ist kostspielig, und jede einzelne Nation ist versucht, andere die Last tragen zu lassen, während sie selbst weiter wächst. Die Belohnung für Defektion (billigere Energie jetzt) ist unmittelbar; die Kosten sind geteilt, verzögert und global. Genau deshalb stützen sich Klimaabkommen so stark auf Überwachung, Berichterstattung und gegenseitige Verpflichtungen, die reale Maschinerie, um eine einmalige Versuchung in ein wiederholtes Spiel mit Konsequenzen zu verwandeln.

Wie wir der Falle entkommen

Wäre das Dilemma unausweichlich, könnte die menschliche Gesellschaft kaum funktionieren. Die Tatsache, dass wir überhaupt kooperieren, dass wir Verträge einhalten, Steuern zahlen und an roten Ampeln anhalten, sagt uns, dass die Falle Ausgänge hat. Spieltheorie und Wirtschaftswissenschaft verweisen auf mehrere.

Wiederholung und Reputation sind die ersten. Wenn Menschen erwarten, wieder miteinander zu tun zu haben, trägt Verrat künftige Kosten. Ein Händler, der einen Kunden betrügt, kann viele verlieren. Online-Marktplätze stützen sich stark darauf, weshalb es Verkäuferbewertungen und Rezensionssysteme gibt: Sie verwandeln anonyme einmalige Transaktionen in etwas, das einem wiederholten Spiel näher kommt, bei dem die Reputation auf dem Spiel steht.

Durchsetzung ist die zweite. Verträge, Gesetze, Gerichte und Polizei existieren gerade, um die Auszahlungen zu ändern und Verrat kostspielig genug zu machen, sodass Kooperation zur rationalen Wahl wird. Eine verbindliche Vereinbarung tut, was die beiden Gefangenen nicht konnten: Sie lässt die Parteien sich zur Kooperation verpflichten und darauf vertrauen, dass Defektion bestraft wird.

Kommunikation und Vertrauen spielen ebenfalls eine Rolle. Das ursprüngliche Dilemma setzt voraus, dass die Gefangenen nicht reden können. Erlaubt man ihnen zu verhandeln, Beziehungen aufzubauen und guten Willen zu signalisieren, wird Kooperation weit leichter aufrechtzuerhalten. Ein Großteil der Diplomatie, von Handelsgesprächen bis zu Rüstungskontrollverträgen, ist die langsame Arbeit, ein Gefangenendilemma in ein Problem zu verwandeln, das zwei Seiten tatsächlich gemeinsam lösen können.

Es lohnt sich, hier ehrlich über die Grenzen zu sein. Das Gefangenendilemma ist ein Modell, eine bewusste Vereinfachung. Reale Menschen sind keine perfekt rationalen Rechner; sie empfinden Loyalität, Wut, Schuld und Fairness, und Experimente zeigen durchweg, dass Menschen häufiger kooperieren, als kalter Eigennutz allein vorhersagen würde. Wissenschaftler streiten noch immer darüber, warum genau, mit Erklärungen, die von evolutionär entstandenen Instinkten zur Gegenseitigkeit bis zu kulturellen Normen des Vertrauens reichen. Das Modell erfasst nicht das gesamte menschliche Verhalten. Was es erfasst, ist die zugrunde liegende Spannung, der Grund, warum Kooperation schwierig ist, selbst wenn alle von ihr profitieren würden.

Die wichtigsten Erkenntnisse

Das Gefangenendilemma überdauert, weil es eine harte Wahrheit auf vier Zahlen in einem Kästchen verdichtet: Was für jede Person individuell am besten ist, kann für alle gemeinsam am schlechtesten sein. In einer einzelnen Begegnung treibt der rationale Eigennutz die Spieler dazu, einander durch eine dominante Strategie der Defektion zu verraten, was sie in einem Nash-Gleichgewicht landen lässt, das beide schlechter stellt, als wenn sie kooperiert hätten. Doch die Falle ist kein Schicksal. Wiederholung, Reputation, durchsetzbare Regeln und offene Kommunikation können allesamt die Auszahlungen verschieben und Kooperation zur klügeren langfristigen Wette machen, wie Robert Axelrods Turniere und der Erfolg einfacher Tit-for-Tat-Strategien nahelegen. Von den Arsenalen des Kalten Krieges über Preiskriege und überfischte Meere bis zum globalen Kampf um die Kohlenstoffemissionen taucht dieselbe stille Logik immer wieder auf. Lerne, das Dilemma zu erkennen, und du gewinnst eine schärfere Linse dafür, warum Vertrauen so zerbrechlich ist, warum Institutionen existieren und warum es eines der ältesten und schwierigsten Probleme ist, denen wir gegenüberstehen, alle dazu zu bringen, das offensichtlich Vernünftige zu tun.

Learn more with Mindoria

Bite-sized lessons, spaced repetition, and live PvP trivia battles. Free on Android.

Download Free