Geschrieben von: CB Garcia und WI Zangwill

Professoren für Managementwissenschaften an der Booth School of Business (beide im Ruhestand)

Überarbeitet August 18, 2018 von (Garcia und Zangwill [8, 9]).

Schlüsselwörter: Spieltheorie, Gefangenendilemma, Bayesian, subjektive Wahrscheinlichkeiten

Abstrakt: Von Neumann und Morgenstern (VNM) lieferten unter Verwendung der erwarteten Nutzenhypothese die grundlegende Formulierung des spieltheoretischen Problems. Bis zu diesem Zeitpunkt war es jedoch schwierig, diese Formulierung zu lösen, ohne zusätzliche Annahmen zu treffen. Nash musste davon ausgehen, dass die Spieler entkoppelt waren, sodass die Wahrscheinlichkeit, dass Spieler A eine Aktion ausführt, unabhängig von der Wahrscheinlichkeit war, dass Spieler B eine Aktion ausführt. In diesem Artikel beseitigen wir Nashs Annahmen, einschließlich der Annahme, dass die Strategien der Spieler allgemein bekannt sind, und schlagen ein Modell vor, das dem allgemeinen VNM-Problem vollständig entspricht. Unsere leicht lösbare Formulierung beseitigt einige der inhärenten Schwierigkeiten mit dem Nash-Ansatz, die oft zu widersprüchlichen und kontraproduktiven Ergebnissen führten, z. Wenn wir zum Beispiel Nashs gegenseitige Unabhängigkeit im Gefangenendilemma fallen lassen, zeigt unser Modell, dass die Spieler in der Lage sind, überlegene Gewinne zu erzielen. Um dies zu erreichen, müssen sie nicht kooperativ spielen oder kommunizieren, sondern nur das Bayes-Theorem anwenden (Harsanyi [10]; Kadane und Larkey [11]). Unser Ansatz unterteilt den Wahrscheinlichkeitsraum in zwei Halbräume oder Regionen, deren relative Größe von den Auszahlungen abhängt. Nun muss man die Wahrscheinlichkeit nicht genau abschätzen, sondern nur bestimmen, in welcher Region sie sich befindet. Dies bietet erhebliche Vorteile, da eine Region, die erheblich größer als die andere ist, sofort einen wesentlichen Einblick in die Spielweise liefert. Unsere allgemeine Lösung, die nicht korreliert ist, etwa im Sinne von Aumann [1], enthält die Nash-Gleichgewichte als besondere Lösungen. Im Gegensatz zu den deskriptiven Nash-Lösungen ist unsere Lösung ein präskriptives Paar von reinen Strategien mit rationalen Erwartungen, die eine neue Grundlage für die Spieltheorie liefern. Wir erweitern unsere Herangehensweise auf allgemeine M-Person-Spiele, wie wir im Rock-Paper-Scissors-Spiel und dem Problem der Überfüllung von Bars veranschaulichen.

Zusammenfassung der Ergebnisse.

Wir fassen nun einige Ergebnisse zusammen, basierend auf den unten angegebenen Details und expliziten Auszahlungen. Wir glauben, dass diese Ergebnisse den Wert unseres Ansatzes für Lehre und Forschung belegen, da die Ergebnisse häufig neue Lösungen darstellen.

Koordinationsspiel: The Nash assumption of independence misses the superior Bayesian approach we take. For the payoffs provided below, play the first strategy if you believe that the opponent’s probability of playing its first strategy is at least 1 / 3, else play the second strategy. Nash provides no insights about when to apply which strategy. Also, if the payoffs are changed, our approach provides revised probabilities. Battle of the sexes: Two parties differ on where they should go, but are not allowed to communicate. Both parties obtain a good payoff if they both go to the same choice, since at least they are both together. A given party will get a bonus if they both go to that party’s choice. Neither gets a good payoff if they go different places. Given the payoffs presented below, player A should play its desired strategy if it believes the other player will also select A’s desired choice with probability of at least 33%. In contrast, Nash provides three equilibria without any insight into which to play when and no analysis of the probabilities. Matching pennies: Two players, Even and Odd, simultaneously reveal a penny. If the pennies match, Even keeps both pennies; otherwise Odd keeps both pennies. The unique Nash equilibrium for this zero-sum game is for both players to play randomly. Given the payoffs below, Even should play heads if it believes that Odd will play heads with probability of at least 50%. On the other hand, Odd should play heads if it believes that Even will play heads with probability of at most 50%. Chicken game: Two cars are speeding towards each other and about to have a head-on crash. Nash suggests one car should swerve and the other go straight, but offers little insight into which should swerve. Given the payoffs below, our approach suggests you swerve if you believe that the opponent will swerve with probability of at most 90%, else go straight. Observe here that both players swerving (or both going straight) is not a Nash equilibrium but that both players swerving (or both going straight) in the expectation that the opponent will go straight (or swerve) is an equilibrium scenario. Also, if the payoffs are changed, our approach provides updated probabilities. Arms Race: each country initially stockpiles arms lest it be attacked. But as demonstrated below, diminishing returns on stockpiling arms materialize, opening an opportunity for a peace treaty. Nash does not identify the opportunity for the peace treaty. Stag hunt: hunt stag if you believe that the opponent will hunt stag with probability at least 50%, else hunt hare. (The pure Nash equilibria are for both to hunt stag, or for both to hunt hare). Newcomb’s problem: if Newcomb’s problem is posed as a prisoner’s dilemma, the solution to Newcomb’s problem can be arrived at in two ways: as the non-cooperative Nash equilibrium using the dominance principle, or as a cooperative solution using the expected utility hypothesis. Rock-paper-scissors game: The Nash equilibrium is for you to play a 3-sided die randomly. What appears to be a new strategy for this ancient game is for you to play rock if you believe that your opponent will play paper with probability of at most 33% and scissors with probability of at least 33%; to play paper if you believe that your opponent will play scissors with probability of at most 33% and rock with probability of at least 33%; else to play scissors. (Our approach can help you if say, you have data on your opponent’s previous plays of the game.) Bar-crowding game has 3 friends A, B, and C: Anyone who goes to the bar alone gets nothing – staying home is a better choice. If two friends go to the bar, that is the best option. If all three go, the bar throws all three out. The Nash equilibria are for all to stay home, or for all to play their first strategy with probability equal to 33%. But if you have any insight into your friends and can estimate the Bayesian probabilities of their behavior, our strategy can help.

Wir erweitern unseren Ansatz auch auf das M-Person-Spiel und erhalten ähnliche Erkenntnisse. Zum Beispiel zeigen wir die Komplettlösung für allgemeine 2-Personenspiele und allgemeine 3-Personen x 2-Strategiespiele.

Die erwartete Nutzenhypothese.

Lassen Sie in einem 2-Person-Spiel die Spieler A und B über 2-Strategien verfügen: A1 oder A2 für Spieler A und B1 oder B2 für Spieler B.

Die Basis für die erwartete Nützlichkeitstheorie ist das von Neumann - Morgenstern - Theorem (von Neumann und Morgenstern [20]): Aij und Bij seien die Auszahlungen für Spieler A bzw. B, wenn Spieler A Ai spielt und Spieler B Bj, für i , j = 1 oder 2. Die erwartete Nutzenhypothese besagt, dass Spieler A und B ihre erwarteten Auszahlungen maximieren müssen1:

wobei pA (Ai und Bj) die Wahrscheinlichkeit von Spieler A ist, dass A Ai und B Bj spielt, und in ähnlicher Weise für Spieler B.

Bedingte Wahrscheinlichkeiten[1].

Für unseren Ansatz haben wir fallen lassen Nashs Annahme, dass die Wahrscheinlichkeiten der Spieler voneinander unabhängig sind. Dies ermöglicht es unserem Problem (1), allgemeiner zu sein und mehr Lösungen zu erhalten, die die erwartete Nutzenhypothese erfüllen.

Seien EP (A | Ai) und EP (B | Bj) die erwarteten Auszahlungen[2],[3] von A und B, vorausgesetzt A spielt Ai und B spielt Bj, für i, j = 1, 2:

Beginnen wir mit dem Beweis von elementares „Bayes'sches“ Theorem von Spielen Dies zeigt die Gleichwertigkeit unserer Herangehensweise an die VNM-Formulierung:

Theorem 1[5]. Probleme (3) unten entsprechen Problemen (1)[6]:

Beweis. Nach dem Satz von Bayes

Dann,

Das Maximum[7] der obigen Gleichung ist pA (A1) = 1 (dh Spielstrategie A1), wenn EP (A | A1) ≥ EP (A | A2), oder pA (A1) = 0 (dh Spielstrategie A2), wenn EP ( A | A1) EP (A | A2). Daher gilt (3) für Spieler A. Ein ähnliches Argument gilt für Spieler BQED

VNM-Regionen.

Definieren Sie die VNM-Regionen A1 und A2 als konvexe Polytope:

Wie unten gezeigt, sollte A die Strategie A1 spielen, wenn erwartet wird, dass B in der Region A1 liegt. Ansonsten sollte A A2 spielen. Die Gleichgewichtslinie

trennt den Wahrscheinlichkeitsraum in zwei Bereiche und bietet ein visuell hilfreiches Mittel zur Analyse der Situation[8].

Bedeutung der Regionen: Die beiden Regionen sind praktisch wichtig, da man die Wahrscheinlichkeit jetzt nicht genau abschätzen muss, sondern nur bestimmen kann, in welcher der beiden Regionen sie sich befindet. Häufig wird sich herausstellen, dass die vorherige Wahrscheinlichkeit wahrscheinlich in einer Region liegt und die Identifizierung dieser Region ist ausreichend Information, um das geeignete Spiel des Spiels vorzuschlagen. Angenommen, die Region A1 ist erheblich größer als die andere, sodass die Wahrscheinlichkeit sehr wahrscheinlich in dieser Region A1 liegt. Dies liefert überzeugende Informationen, dass Spieler A wahrscheinlich A1 spielen wird.

Analog für B:

Die VNM-Regionen hängen von den vorherigen Wahrscheinlichkeitsverteilungen der Spieler ab, die oft einfach als Prioren bezeichnet werden (Jaynes [13], Harsanyi [10], Kadane und Larkey [11]) ihr Gegner. [9]

Folgerung 2. Bei (3) spielt A die Strategie A1 genau dann, wenn erwartet wird, dass sich Spieler B in der VNM-Region A1 befindet. Ansonsten spielt A die Strategie A2. In ähnlicher Weise spielt B die Strategie B1 genau dann, wenn erwartet wird, dass sich Spieler A in der VNM-Region B1 befindet. Ansonsten spielt B die Strategie B2.

Beweis. EP (A | A1) ≥ EP (A | A2) genau dann, wenn A11 pA (B1 | A1) + A12 pA (B2 | A1) ≥ A21 pA (B1 | A2) + A22 pA (B2 | A2) genau dann, wenn (A11 - A12) pA (B1 | A1) + (A21 - A22) pA (B2 | A2) + A12 - A21 ≥ 0.

Ebenso ist EP (B | B1) ≥ EP (B | B2) genau dann, wenn B11 pB (A1 | B1) + B21 pB (A2 | B1) ≥ B12 pB (A1 | B2)

+ B22 pB (A2 | B2) genau dann, wenn (B11 - B21) pB (A1 | B1) + (B12 - B22) pB (A2 | B2) + B21 - B12 ≥ 0. QED

Nach Theorem 1 und Korollar 2 gilt für Punkte in den Regionen (5) und (7) die erwartete Gebrauchshypothese, dh die VNM-Regionen definieren die allgemeine Lösung für das 2-Person-Spiel[10].

Nash-Gleichgewicht.

Wenn die Wahrscheinlichkeiten der Spieler voneinander unabhängig sind, vereinfachen die VNM-Regionen Folgendes:

Proposition 3. Angenommen, ein Nash-Gleichgewicht (p (A1), p (B1)) liegt in der VNM-Region Ai bzw. in der VNM-Region Bj für einige i, j = 1, 2. Dann spielt Spieler A die Strategie Ai und Spieler B die Strategie

Bj.

Beweis. Nashs Gleichgewichtsproblem ist Problem (1), wobei pA (Ai und Bj) = pB (Ai und Bj) = p (Ai) p (Bj) oder Problem (3), wobei pA (Bj | Ai) = p (Bj ) und pB (Ai | Bj) = p (Ai) für i, j = 1, 2. Somit gilt Korollar 2, wobei VNM-Regionen durch (8) definiert sind, für pA (B1) = p (B1) und pB (A1) = p (A1). QED

Denken Sie daran, dass die Gleichgewichtsgleichungen

Trennen Sie die VNM-Regionen, um die allgemeine Lösung für jedes Spiel zu erhalten. Dieselben Gleichgewichtsgleichungen, bei denen pB (A1) = p (A1) und pA (B1) = p (B1), ergeben das gemischte Nash-Gleichgewicht11, wie in der folgenden Tabelle gezeigt.

Proposition 4. Bei jedem Spiel A = [[A11, A12], [A21, A22]] und B = [[B11, B12], [B21, B22]] werden die Nash-Gleichgewichte für das Spiel aus der zutreffenden Zeile der Tabelle 112 berechnet.

Beweis. Beachten Sie, dass (i, j) genau dann ein reines Nash-Gleichgewicht ist, wenn sgn (2i - 1) * (A11 - A21)> 0 und sgn (2j - 1) * (B11 - B12)> 0, für i, j = 0, 1. Unter Verwendung dieser Tatsache listen wir für jede Zeile in Tabelle 1 alle Paare (i, j) auf, die reine Nash-Gleichgewichte sind.

Schließlich müssen wir für das durch (9) definierte Paar (a, b) nur zeigen, dass 0 <a <1 und 0 <b <1 ist. Beachten Sie jedoch, dass für die Zeilen 6, 7, 10 und 11 der Tabelle 1 der Zähler und der Nenner von a, 1 - a, b oder 1 - b beide positiv oder beide negativ sind. daher sind a, 1 - a, b, 1 - b alle größer als 0. QED

Beispiel für iterierte Dominanz[13].

Es sei A = [[2, 2], [3, 1] und B = [[0, 1], [0, 2]. "Play A1 & B2" ist das Nash-Gleichgewicht.

Proposition 5. Wenn A = [[2, 2], [3, 1] und B = [[0, 1], [0, 2]], dann spielt Spieler A A1 und Spieler B B2.

Beweis. Die VNM-Region A1 ist: pA (B2 | A2) ≥ 1 / 2, und die VNM-Region B2 ist: pB (A2 | B2) ≥ -1. Daher wird Spieler B B2 spielen. Spieler A weiß auch, dass dies der Fall ist, daher ist pA (B2 | A2) = 1. Da pA (B2 | A2) = 1 ein Punkt in der VNM-Region A1 ist, spielt Spieler A A1. QED

Koordinationsbeispiel.

Sei A = B = [[2, 0], [0, 1]]. Es gibt 3-Nash-Gleichgewichtspunkte: "A1 & B1 spielen", "A2 & B2 spielen" und "A1 (oder B1) mit der Wahrscheinlichkeit 1 / 3 spielen". Die VNM-Region A1 ist: 2pA (B1 | A1) ≥ pA (B2 | A2) und die VNM-Region B1 ist: 2pB (A1 | B1) ≥ pB (A2 | B2). Durch visuelle Analyse dieser VNM-Regionen werden A und B wahrscheinlich die Strategien A1 bzw. B1 auswählen.

Proposition 6. A = B = [[2, 0], [0, 1]] vorausgesetzt, wenn die Wahrscheinlichkeiten der Spieler voneinander unabhängig sind, dann spiele die erste Strategie, wenn du glaubst, dass die Wahrscheinlichkeit des Gegners, seine erste Strategie zu spielen, mindestens 1 / 3, sonst spiele die zweite Strategie.

Beweis. Die VNM-Region A1 ist: pA (B1) ≥ 1 / 3 und die VNM-Region B1 ist: pB (A1) ≥ 1 / 3. QED

Kampf der Geschlechter Beispiel.

Es sei A = [[3, 1], [1, 2] und B = [[2, 1], [1, 3]. Es gibt 3-Nash-Gleichgewichtspunkte: "A1 & B1 spielen", "A2 & B2 spielen" und "A1 mit der Wahrscheinlichkeit 2 / 3 spielen, B1 mit der Wahrscheinlichkeit 1 / 3 spielen". Die VNM-Region A1 ist: 2pA (B1 | A1) ≥ pA (B2 | A2) und die VNM-Region B1 ist: pB (A1 | B1) ≥ 2pB (A2 | B2). A würde lieber A1 wählen und B würde lieber B2 wählen.

Proposition 7. A = [[3, 1], [1, 2] und B = [[2, 1], [1, 3]] vorausgesetzt, wenn die Wahrscheinlichkeiten der Spieler voneinander unabhängig sind, dann: A1 spielen, wenn pA (B1) ) ≥ 1 / 3, sonst A2 abspielen; spiele B1 wenn pB (A1) ≥ 2 / 3, sonst spiele B2.

Beweis. Die VNM-Region A1 ist: pA (B1) ≥ 1 / 3 und die VNM-Region B1 ist: pB (A1) ≥ 2 / 3. QED

Matching Pennies Beispiel.

Es sei A = [[1, -1], [-1, 1]] und B = [[-1, 1], [1, -1]]. Dieses Nullsummenspiel hat ein gemischtes Nash-Gleichgewicht: "A1 mit der Wahrscheinlichkeit 1 / 2 spielen, B1 mit der Wahrscheinlichkeit 1 / 2 spielen".

Proposition 8. A = [[1, -1], [-1, 1] und B = [[-1, 1], [1, -1]] vorausgesetzt, wenn die Wahrscheinlichkeiten der Spieler voneinander unabhängig sind, dann: A1 spielen Wenn pA (B1) ≥ 1 / 2 ist, spielen Sie A2 ab. spiele B1 wenn pB (A1) 1 / 2, sonst B2 spielen[14].

Beweis. Die VNM-Region A1 ist: pA (B1) ≥ 1 / 2 und die VNM-Region B1 ist: pB (A1) 1 / 2. QED

Hühnerspielbeispiel (Sugden [19]).

Es sei A = [[0, -1], [1, -10] und B = [[0, 1], [-1, -10]. Die Nash-Gleichgewichte lauten „A1 spielen (ausweichen) und B2 spielen (geradeaus gehen)“, „A2 spielen (geradeaus gehen) und B1 spielen (ausweichen)“ und „A1 spielen (B1) mit der Wahrscheinlichkeit 0.9“.

Proposition 9. Wenn im Hühnerspiel die Wahrscheinlichkeiten der Spieler voneinander unabhängig sind, gilt Folgendes: Ausweichen, wenn Sie glauben, dass der Gegner mit einer Wahrscheinlichkeit von höchstens 90% ausweichen wird, andernfalls gehen Sie geradeaus.

Beweis. Die VNM-Region A1 ist: pA (B1) + 11pA (B2) ≥ 2 oder pA (B1) ≤ 9 / 10. In ähnlicher Weise ist die VNM-Region B1: pB (A1) ≤ 9 / 10. QED

Beachten Sie, dass Sie geradeaus gehen sollten, wenn Ihr Gegner zu viel Begeisterung zeigt (mindestens 90%), um auszulenken.

Bevorzugtes Szenario: Die Spieler werden eher ausweichen als geradeaus gehen.

Hühnerszenario: Angenommen, pA (B1) = pB (A1) = 0. Beide Spieler erwarten, dass der andere Spieler geradeaus geht. Beide werden ausweichen.

Katastrophenszenario: Angenommen, pA (B1) = pB (A1) = 1. Beide Spieler erwarten, dass der andere Spieler ausweicht. Beides wird gerade gehen[15].

Nash-Gleichgewichts-Szenario: Angenommen, pA (B1) = 1 - pB (A1) und pB (A1) = 0 oder 1. Der Spieler, der erwartet, dass der andere Spieler gerade geht, wird ausweichen, und der Spieler, der erwartet, dass der andere Spieler gerade geht, wird ausweichen.

Wettrüsten-Beispiel.

In Satz 9 sei A = [[0, -x], [1, -10x], B = [[0, 1], [-y, -10y]] für x, y ≥ 0. Lassen Sie A1 oder B1 „Frieden suchen“ und A2 oder B2 „Atomangriff“ sein. Die Werte x und y bezeichnen den Waffenvorrat von B bzw. A.

Land A sucht Frieden, wenn die Wahrscheinlichkeit, dass Land B angreift, größer als 1 / (9x + 1) ist; Ansonsten greift A an. Die Wahrscheinlichkeitskurve pA (B1) = 1 / (9x + 1) fällt schnell ab, z. B. pA (B1) = 1 / 2 bei x = 1 / 9, wird aber bald dramatisch flacher: B muss sich zuerst schnell bevorraten, aber als Kurve Abflachen, für das Lagern von Waffen wird B wenig nützen.

Und ähnlich für Land B.

Zusammenfassend lässt sich sagen, dass jedes Land zunächst Waffen bevorratet, um nicht angegriffen zu werden. Aber es kommt zu einem raschen Rückgang der Einnahmen aus Waffenvorräten, was die Möglichkeit eröffnet, einen Friedensvertrag zu schließen.

Betrachten Sie zur Veranschaulichung den von 2018 geschätzten globalen Nuklearvorrat[16] der Tabelle 2.

Basierend auf den oben genannten Auszahlungen und Tabelle 2 sollte ein vernünftiger Nordkorea einen Friedensvertrag mit den Vereinigten Staaten und Russland anstreben.

Skyrms [16]).

Es sei A = [[4, 1], [3, 2] und B = [[4, 3], [1, 2]. Die Nash-Gleichgewichte lauten "Spiel A1 (Hirsch) & B1 (Hirsch)", "Spiel A2 (Hase) & B2 (Hase)" und "Spiel A1 (B1) mit der Wahrscheinlichkeit 0.5".

Proposition 10. Bei der Hirschjagd gilt Folgendes, wenn die Wahrscheinlichkeiten der Spieler voneinander unabhängig sind: Hirschjagd, wenn Sie glauben, dass der Gegner mit einer Wahrscheinlichkeit von mindestens 50% Hirschjagd macht, andernfalls Hasenjagd.

Beweis. Die VNM-Region A1 ist: 3pA (B1) + pA (B2) ≥ 2 oder pA (B1) ≥ 1 / 2. In ähnlicher Weise ist die VNM-Region B1: pB (A1) ≥ 1 / 2. QED

Gefangenendilemma[17].

Sei A12 <A22 <A11 <A21 und sei B gleich der Transponierung von A. Seit A11 <A21 und A12 <A22 ergibt die Anwendung des Dominanzprinzips das Nash-Gleichgewicht, nämlich die nicht kooperative Lösung „A2 spielen (Fehler) und B2 (defekt) ”. Aber da A22 <A11, sind A und B besser dran, wenn sie beide die kooperative Lösung „A1 (Stille) und B1 (Stille) spielen“ spielen.

Proposition 11. Wenn im Gefangenendilemma die Wahrscheinlichkeiten der Spieler voneinander unabhängig sind, spielen die Spieler nicht kooperativ[18].

Beweis. Betrachten Sie die linke Seite der VNM-Region A1:

(A11 - A12 - A21 + A22) pA(B1) + A12 - A22.

Wenn A11 - A12 - A21 + A22 ≤ 0, dann (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ A12 - A22 <0. Wenn andererseits A11 - A12 - A21 + A22> 0, dann (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ (A11 - A12 - A21 + A22) + A12 - A22 = A11 - A21 <0. Daher ist die VNM-Region A1 für alle Prioritäten für Spieler A der Nullsatz, daher muss sie Strategie 2 spielen.

Ebenso muss Spieler B Strategie 2 spielen. QED

Proposition 11 zeigt deutlich, dass die Annahme der Unabhängigkeit uns auf die nicht kooperative Lösung beschränkt.

Beispiel für ein klassisches Gefangenendilemma.

Im klassischen Gefangenendilemma ist A = [[-1, -3], [0, -2] und B = [[-1, 0], [-3, -2].

Proposition 12. Wenn im klassischen Gefangenendilemma die Prioritäten der Spieler sind: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, pB (A1 | B1) + pB (A2 | B2) ≥ 3, X Die Spieler spielen die kooperative Lösung 2.

Beweis. Die VNM-Region A1 ist: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, und die VNM-Region B1 ist: pB (A1 | B1) + pB (A2 | B2. X. Daher müssen die Spieler A und B für die gegebenen Prioren die kooperative Lösung spielen. QED

Beachten Sie in Proposition 12 den für die Wiedergabe der kooperativen Lösung erforderlichen Hochbalken. Die Spieler möchten lieber die nicht kooperative Lösung spielen.

Ein Fall, in dem der Nash-Ansatz nicht in Betracht zieht, die kooperative Strategie zu spielen.

Betrachten Sie das Gefangenendilemma, in dem A11 - A12 = A21 - A22, A21 = A11 + m und A22 = A11 - M, wobei m> 0 klein und M> 0 sehr groß ist. Beispiel: A = [[100, -3], [101, -2]]. Aus Satz 11 geht hervor, dass die Spieler nicht kooperativ spielen, wenn die Wahrscheinlichkeiten der Spieler voneinander unabhängig sind.

Offensichtlich wäre es töricht für die Spieler, nicht einmal über die Spielstrategie 1 nachzudenken, denn wenn ein Spieler 2 spielt, würde die Chance, dass der andere Spieler ebenfalls 2 spielt, einen erheblichen Verlust bedeuten. Warum also das Risiko eingehen? Es ist klar, dass der Nash-Ansatz nicht in Betracht zieht, die kooperative Lösung zu spielen, auch wenn dies die offensichtliche Lösung ist - ein sehr wichtiger Punkt bei Diskussionen über Marktzusammenbrüche in allgemeinen wirtschaftlichen Gleichgewichtsmodellen.

Auf der anderen Seite wird unser Ansatz, wie der nächste Satz zeigt, eher die kooperative Lösung als die nichtkooperative Lösung sein, indem wir die Annahme der Unabhängigkeit fallen lassen.

Die schwarze Linie ist die Indifferenzlinie für das klassische Gefangenendilemma. Es ist wahrscheinlicher, dass ein Spieler Strategie 2 spielt, da es unwahrscheinlich ist, dass er sich in der Region befindet, um eine Strategie zu spielen

1.

Die grüne Linie ist die Indifferenzlinie für diese Instanz des Gefangenen-Dilemmas: pA (B1 | A1) + pA (B2 | A2) = 1 + m / (M + m). Hier entspricht die Größe des Wahrscheinlichkeitsbereichs für Strategie 1 fast der für Strategie 2. Unser Ansatz ist es, den Spielern zu empfehlen, über die Spielstrategie 1 nachzudenken.

Proposition 13. Angesichts eines Gefangenendilemmas, in dem A11 - A12 = A21 - A22, A21 = A11 + m und A22 = A11 - M, wobei m> 0 klein und M> 0 sehr groß ist, spielen die Spieler A und B die kooperative Lösung 20.

  • Daher spielen die Spieler die nicht kooperative Lösung nicht.
  • Derzeit werden zur Erreichung der kooperativen Lösung Annahmen hinzugefügt, z. B. beschränkte Rationalität, unvollständige Informationen (Aumann und Maschler [2]; Acevedo und Krueger [4]; Daley Given A's erwartete gemeinsame Wahrscheinlichkeiten pA (Ai und Bj), A folgert daraus pA (A1 und B1) muss in der Nähe von 1 liegen, da A und B wahrscheinlich die Strategie 1 spielen, bei der ihre Auszahlungen ziemlich hoch sind und nur m Einheiten weniger als maximal sind.

Daher muss auch pA (B1 | A1) = pA (A1 und B1) / pA (A1) in der Nähe von 1 liegen.

A kommt auch zu dem Schluss, dass pA (A2 und B2) pA (A2 und B1), da B eher Strategie 2 spielt, wenn A Strategie 2 spielt. Daher ist pA (B2 | A2) = pA (A2 und B2) / (pA (A2 und B1) + pA (A2 und B2)) 1 / 2. A schließt unter Verwendung von 1, dass B ausreichend innerhalb der VNM-Region A1 ist. Ebenso wird B Strategie 1 spielen. QED

Newcombs Paradoxon als Version des Gefangenendilemmas.

In dem berühmten Newcomb-Paradoxon (Wolpert und Benford [21]) gibt es einen Prädiktor B, einen Spieler A und eine Box X. Dem Spieler A wird die Wahl gegeben, die Box X oder die Box X plus $ 1,000 zu nehmen. Bevor A eine Auswahl trifft, sagt B voraus, was A tun wird, und die Vorhersagen von B sind fast sicher. Wenn B voraussagt, dass A nur Box X nimmt, dann setzt B $ 1,000,000 in Box X. In diesem Fall erhält A $ 1,000,000 oder $ 1,000,000, je nachdem, ob A Box X oder wählt X plus $ 1,001,000. Wenn B dagegen voraussagt, dass A Box X plus $ 1,000 nimmt, platziert B nichts in Box X. In diesem Fall erhält A je nach Auswahl entweder $ 1,000 oder nichts.

Newcombs Paradox ist, dass zwei perfekt rationale Analysen das Optimierungsproblem von Spieler A widersprüchlich beantworten: Unter der erwarteten Nutzenhypothese sollte Spieler A nur Box X nehmen, da die erwartete Auszahlung von X viel höher ist. Andererseits sollte Spieler A nach dem Dominanzprinzip Box X plus $ 1,000 nehmen.

Das Paradoxon wird am besten durch eine Passage in (Wolpert und Benford [21]) verstanden: „… Newcomb sagte, dass er nur X nehmen würde; Warum gegen ein gottähnliches Wesen kämpfen? Nozick sagte jedoch: „Für fast alle ist es völlig klar und offensichtlich, was zu tun ist. Die Schwierigkeit besteht darin, dass sich diese Leute fast gleichmäßig über das Problem zu streiten scheinen, wobei eine große Anzahl denkt, dass die gegnerische Hälfte nur albern ist. '… ”.

Wolpert und Benford lösen das Paradoxon, indem sie zeigen, dass Newcombs Problem tatsächlich zwei verschiedene Spiele mit unterschiedlichen Wahrscheinlichkeitsergebnissen darstellt.

In diesem Abschnitt werden wir das Paradox lösen, indem wir Newcombs Problem als Gefangenendilemma auslegen. Dabei kann die Lösung des Newcomb-Problems auf zwei Arten erreicht werden: als nicht kooperative Lösung (Box X plus $ 1,000) unter Verwendung des Dominanzprinzips oder als kooperative Lösung (nur Box X) unter Verwendung des Erwarteten Gebrauchshypothese.

Angenommen, es gibt einen reichen Wohltäter, der verspricht, eine Auszahlungsmatrix für Prädiktor B zu finanzieren, die das folgende Spiel ergibt: A = [[$ 1,000,000, 0], [$ 1,001,000, $ 1,000]] und B = [[$ 1,000,000, $ 1,001,000 ], [0, $ 1,000]].

Wenn B richtig vorhersagt, bekommt B, was Spieler A bekommt. Aber wenn B falsch vorhersagt, bekommt B $ 1,001,000 minus dem, was A bekommt21.

Ab Proposition 13 spielen die Spieler A und B in diesem Spiel kooperativ.

Wenn der Spieler wie Nash das Problem unter Verwendung des Dominanzprinzips löst, dann auch der Prädiktor. Sowohl der Prädiktor als auch der Spieler werden an der nicht kooperativen Lösung teilnehmen: Nehmen Sie X plus $ 1,000. Wenn der Spieler das Problem unter Verwendung der erwarteten Nutzenhypothese löst, löst der Prädiktor dies auch, und sowohl der Prädiktor als auch der Spieler sind bei der kooperativen Lösung: Nehmen Sie nur X. In beiden Fällen lautet die Vorhersage des Prädiktors

und Sadowski [6]) oder neue Methoden werden beschrieben, z. B. Tit-for-Tat-Gleichgewichte (Axelrod [3]; Aumann [1]).

21 Beachten Sie, dass durch die Darstellung des Newcomb-Problems als PD-Problem dem Prädiktor ein persönlicher Anreiz gegeben wird, der im Newcomb-Problem fehlt.

sicher. Da die Spieler von Proposition 13 nicht die nicht kooperative Lösung spielen werden, stimmen wir Newcomb zu, dass Kooperation die naheliegende Strategie ist.

In Abb. 1 ist jedoch der Bereich für die Zusammenarbeit vernachlässigbar kleiner als der für die Nichtzusammenarbeit. Für uns ist es dann nicht verwunderlich, wenn sich die Menschen gleichmäßig auf die zu verfolgende Strategie einigen.

Eine Verallgemeinerung des Gefangenendilemmas auf M-Personen.

Um besser zu verstehen, wie die Nash-Lösung in allgemeinen ökonomischen Gleichgewichtsmodellen zusammenbrechen könnte, lassen Sie uns das Gefangenendilemma auf M-Personen verallgemeinern, wobei jeder Spieler 2-Strategien für M hat 2.

Beschreiben wir das M-Person-Spiel über binäre Bäume.

Abb. 2 ist das Gefangenendilemma für Spieler A. Tree (2, 1) ist der Binärbaum mit Spieler B (Spieler 2) als Eltern und Spieler A (Spieler 1) als Kind. Um die Auszahlung für Spieler B zu erhalten, wechseln Sie einfach die Rollen von Eltern und Kind zu Baum (1, 2). Denken Sie daran, dass für das Gefangenendilemma A12 <A22 <A11 <A21.

Nehmen wir als nächstes an, Tree (M - 1, M - 2, ..., 2, 1) bezeichnet die Auszahlung von Spieler A für ein (M - 1) -Personenspiel für M 3. Konstruieren Sie den Auszahlungsbaum von Spieler A (M, M - 1,…, 2, 1) für ein M-Person-Spiel, indem Sie den Baum von Spieler A (M - 1, M - 2,…, 2, 1) als Unterbaum auf beiden erstellen Zweige des Elternspielers M.

Die numerischen Werte der Auszahlung im rechten Teilbaum werden als unterschiedlich von denen im linken Teilbaum angenommen, solange die Beziehung A12 <A22 <A11 <A21 überall im Baum beibehalten wird.

Als letztes erhält Spieler A einen Baum (M, M - 1,…, 2, 1). Erstelle einen Baum (1, M, M - 1,…, 3, 2) für Spieler B (Spieler 2), indem du 1 zum höchsten machst Elternteil; Baum (1, 2, M, M - 1,…, 4, 3) für Spieler 3, indem Sie 2 zum zweithöchsten Elternteil machen,…, Baum (1, 2, 3,…, M - 2, M - 1 ) für Spieler M - 1, indem Sie M - 2 zum drittniedrigsten Kind machen, Tree (1, 2, 3, ..., M - 1, M) für Spieler M, indem Sie M - 1 zum zweitniedrigsten Kind machen.

Dies vervollständigt die Beschreibung der Auszahlungen der Spieler für ein M-Person-Gefangenendilemma, wobei jeder Spieler über 2-Strategien verfügt.

Theorem 14. Für das M-Person-Gefangenendilemma, M 2, nach dem Dominanzprinzip, ist die Nash-Lösung für die Spieler, die Strategie 2 zu spielen.

Beweis. Wir wissen bereits, dass der Satz für M = 2 gilt. Man nehme durch Induktion an, dass der Satz für M - 1 gilt, für M 3. Zeigen wir, dass der Satz für M gilt.

Wenn für Spieler A ein Baum (M, M - 1,…, 2, 1) angegeben ist, erinnern Sie sich, dass die Unterbäume am linken und rechten Zweig konstruktionsbedingt die Form Baum (M - 1, M - 2,…, 2) haben , 1) für Spieler 1, Baum (M, M - 1,…, 2) für Spieler 2, Baum (2, M, M - 1,…, 4, 3) für Spieler 3,…, Baum (2,… , M - 2, M, M - 1) für Spieler M - 1. Diese Unterbäume sind für die Spieler 1, 2,…, M - 1 identisch, mit Ausnahme der Beschriftung auf den Knoten der Eltern. Beachten Sie, dass die Strategie 2 jedes Spielers unter allen Bedingungen die Strategie 1 dominiert. Durch Induktion spielen die Spieler 1 bis M - 1 nach dem Dominanzprinzip die Strategie 2.

Wenn also M 1 spielt, ist die Auszahlung für Spieler M b (der zweithöchste Knoten des Baums), während M die Auszahlung ist, wenn M 2 spielt (1, 1,…, M - 2, M) für Spieler M ist A22 (der Knoten ganz rechts im Baum). Da A12 <A22 ist, spielt Spieler M nach dem Dominanzprinzip auch Strategie 2. QED

Angenommen, eine Auszahlung vom Typ A11 ist viel größer als eine Auszahlung vom Typ A22. und dass A21 = A11 + m, wobei sich die Auszahlungen A11 und A21 in benachbarten Knoten befinden.

Es ist klar, dass der Nash-Ansatz nicht in Betracht zieht, die kooperative Lösung „Spielstrategie 1“ zu spielen, auch wenn dies die naheliegende Lösung ist.

Dem induktiven Argument von Theorem 14 folgend können wir auch schließen, dass die Unterbäume am linken und rechten Zweig die Form Baum (M - 1, M - 2,…, 2, 1) für Spieler 1, Baum ( M - 1, M - 2,…, 2) für Spieler 2, Baum (2, M, M - 1,…, 4, 3) für Spieler 3,…, Baum (2,…, M - 2, M, M - 1) für den Spieler M - 1 spielen die Spieler 1 bis M - 1 gemäß der erwarteten Nutzenhypothese die Strategie 1, bei der die Auszahlung vom Typ A11 ist.

Wenn also M 1 spielt, ist die Auszahlung für Spieler M ein Baum (2, 1,…, M - 1, M), während M 2 spielt, die Auszahlung für Spieler M ist A21 = A11 + m (der zweitletzte Knoten des Baums). Da A11 <A21 ist, könnte Spieler M versucht sein, Strategie 2 zu spielen. Aber warum sollte man riskieren, die Strategie 2 für m-Einheiten mehr als A11 zu spielen, wenn dies zu einer Auszahlung des Typs A22 führen könnte, die deutlich geringer ist als die von A11?

Nach der erwarteten Nutzenhypothese muss Spieler M auch Strategie 1 spielen.

Allgemeine M-Person-Spiele.

Schließlich verallgemeinern wir Theorem 1 für allgemeine M-Person-Spiele.

Es gebe M Spieler, wobei jeder Spieler, den ich habe, keine möglichen Strategien für jeden i = 1, 2,…, M. Wenn der Strategie-Vektor (j1, j2,…, jM) gegeben ist, lasse die Auszahlung an Spieler, den ich habe, Ai seinj1j2… jM. Sei xi eine gemischte Strategie für Spieler i, dh eine Strategie xi wo Σj xij = 1, xij 0, all j und let x = (xi, xi) bezeichnen die Strategien aller Spieler. Nashs Problem ist:

Wobei EP (i | xi) die erwartete Auszahlung an den Spieler ist, dem ich xi gegeben habe, und wo die Summe über alle jk und alle k ist.

Eine Strategie x * ist ein Nash-Gleichgewicht, wenn xi * eine Lösung für das obige Problem von Spieler i ist, wenn xi * gegeben ist.

Für unseren Ansatz sei pij1, j2,…, jM Sei Spieler, mit der ich die Wahrscheinlichkeit erwarte, dass Spieler k jk spielt, für alle jk und alle k. Die von Neumann-Morgenstern erwartete Nützlichkeitstheorie besagt, dass es das Ziel von Spieler i ist, die erwartete Auszahlung zu maximieren:

wo die Summe über alle jk und alle k ist.

Definieren

wo -i spielt j-i bedeutet, dass Spieler k jk spielt und wo die Summe über alle jk ist, für alle k i.

Theorem 15. Die folgenden Probleme (13) entsprechen den Problemen (11):

Beweis.. Per Definition,

wo die Summe über alle rk ist, für jedes k i.

Der Nenner von (14) ist die Wahrscheinlichkeit pi (i spielt ji). Daher,

Da Σ pi (ich spiele ji) = 1 und pi (ich spiele ji) 0 für alle ji, es folgt, dass der Spieler i Strategie spielt [arg maxji EP (i | i spielt ji)]. QED

Eine Methode zum Finden der besten Strategie für Spieler i lautet wie folgt: Berechnen Sie für jedes Paar von Strategien für Spieler i, z. B. Strategie r und Strategie s, den Ort der Punkte, an denen die erwarteten Auszahlungen von Spieler i, der entweder r oder s spielt, gleich sind . Dies definiert eine Indifferenzfläche, die den bedingten Wahrscheinlichkeitsraum in 2-VNM-Regionen unterteilt. Eine VNM-Region wird mit r bezeichnet, weil die Strategie der Wahl r ist, und die andere VNM-Region wird mit s bezeichnet, weil die Strategie der Wahl s ist.

Nach den obigen Berechnungen wurde jede VNM-Region so oft markiert, wie es unterschiedliche Paare von Strategien gibt. Nehmen Sie für einen bestimmten VNM-Bereich zwei der mehreren Bezeichnungen und entfernen Sie eine von ihnen basierend auf der durch dieses Bezeichnungspaar erzeugten Indifferenzfläche. Der Vorgang endet, wenn jede VNM-Region nur eine Bezeichnung hat.

Allgemeine 2-Personenspiele.

Lassen Sie Spieler A die Strategien Ai, i = 1, 2,… n1 und Spieler B die Strategien Bj, j = 1, 2,… n2 haben. Angenommen, die Wahrscheinlichkeiten der Spieler sind voneinander unabhängig. Problem (13) ist:

Daher werden die VNM-Regionen durch konvexe Polytope definiert:

Wie in (16) zu sehen ist, ist es einfach, die Lösung für ein allgemeines 2-Personenspiel zu finden. Betrachten Sie zum Beispiel das über zweitausend Jahre alte Rock-Paper-Scissors-Spiel, in dem das Nash-Gleichgewicht wie folgt lautet: Spielen Sie eine beliebige Strategie mit 33% Wahrscheinlichkeit:

Strategie A1 oder B1 (Rock) verliert gegen Strategie A2 oder B2 (Papier) verliert gegen Strategie A3 oder B3 (Schere) verliert gegen Rock.

Für Spieler A haben wir im Allgemeinen, wo 0 pA (Bj) 1,

das reduziert sich auf

Und ähnlich für Spieler B.

Eine neue Strategie für dieses alte Spiel scheint zu sein: Rock spielen, wenn Sie glauben, dass Ihr Gegner mit einer Wahrscheinlichkeit von höchstens 33% Papier und mit einer Wahrscheinlichkeit von mindestens 33% eine Schere spielen wird; Spielen Sie Papier, wenn Sie glauben, dass Ihr Gegner mit einer Wahrscheinlichkeit von höchstens 33% eine Schere spielen und mit einer Wahrscheinlichkeit von mindestens 33% rocken wird. sonst spiele scissors22.

3-Personenspiele, bei denen jede Person 2-Strategien hat.

Wenden wir Theorem 15 an, um die Lösung für ein 3-Personenspiel zu finden, bei dem jeder Spieler A, B und C die 2-Strategien Ai, Bi, Ci für i = 1 bzw. 2 hat.

Angenommen, die Wahrscheinlichkeiten der Spieler sind voneinander unabhängig. Für Spieler A ist Gleichung (13)

und ähnlich für Spieler B und C. Mit Theorem 15 wird die Lösung definiert durch:

Lass uns das obige für das Bar-Crowding-Spiel verwenden[21]:

Wenn der Spieler zu Hause ist, ist seine Auszahlung 1; Wenn der Spieler alleine an der Bar ist, beträgt die Auszahlung 0. Wenn sich der Spieler mit einer anderen Person an der Bar befindet, beträgt die Auszahlung 2. Ansonsten ist die Auszahlung -1.

Wir haben: A111 - A211 = -2, A112 - A212 = A121 - A221 = 1, A122 - A222 = -1, daher ist die VNM-Region A1 die Region -3pA (B1) pA (C1NUM2NUMX (C1) - 2 ≥ 1 oder gleichwertig die Region[22] pA (B1) ≥ (1 - 2pA (C1)) / (2 - 3pA (C1)). In ähnlicher Weise ist die VNM-Region B1 die Region pB (A1) ≥ (1 - 2pB (C1)) / (2 - 3pB (C1)) und die VNM-Region C1 ist die Region pC (B1) ≥ (1NUMX - 2 / (1 - 2pC (A3)). Die Nash-Gleichgewichte sind p (A) = p (B) = p (C) = 1 und p (A) = p (B) = p (C) = 1 / 1.

Wissen.

Wir möchten Al Roth und Todd Davies für ihre wertvollen Ratschläge und Anleitungen bei der Erstellung dieses Papiers danken.

Fußnoten

[1] Der Einfachheit halber gehen wir allgemein davon aus, dass der Nutzen eine lineare Funktion der Auszahlung ist (Starmer [18]). Das Maximieren des erwarteten Nutzens ist daher dasselbe wie das Maximieren der erwarteten Auszahlung.

[2] Unser Bayes-Ansatz für Spiele unterscheidet sich von früheren Bayes-Arbeiten (zum Beispiel Acevedo und Krueger [4]; Aumann [1]; Daley und Sadowski [6]; McKelvey und Palfrey [12]; Quattrone und Tversky [15]). dadurch, dass unser Ansatz im Gegensatz zu den anderen Ansätzen bedingte Wahrscheinlichkeiten eindeutig an die erwartete Nutzenhypothese bindet, die unsere Lösung immer erfüllt.

[3] Ein Kritiker stellt fest, dass „vernünftige Spieler bedingte Wahrscheinlichkeiten nicht berücksichtigen und nicht berücksichtigen sollten… Stellen Sie sich einen Agenten vor, der weiß, dass die Regenwahrscheinlichkeit p ist. Ihre 'Lösung' scheint zu sein, dass der Agent einen Regenschirm mitnehmen sollte, wenn es regnet, und den Regenschirm verlassen sollte, wenn es nicht regnet. “
Theorem 1 zeigt, dass die frühere Kritik unbegründet ist. In Bezug auf die letztere Kritik sei EP (Agent | bring a Umbrella) = p und EP (Agent | bring a Umbrella) = 1 - p. Unsere Lösung wäre dann: einen Regenschirm mitzubringen, wenn p ≥ 1 / 2 ist; Bringen Sie keinen Regenschirm mit, wenn p ≤ 1 / 2 ist.

[4] Die bedingten Wahrscheinlichkeiten von (2) verstoßen nicht gegen das Prinzip von Spohn [17]: „Jedes angemessene quantitative Entscheidungsmodell darf weder explizit noch implizit subjektive Wahrscheinlichkeiten für Handlungen enthalten…“ Die bedingten Wahrscheinlichkeiten eines Spielers sind subjektive Wahrscheinlichkeiten für die des Gegners Strategien, nicht für ihre eigenen Strategien.

[5] Dieser Satz wird für M-Person-Spiele auf einen Satz verallgemeinert.

[6] Es gibt keine Signalisierung zwischen den Spielern.

[7] Die unabhängigen Variablen pA (B1 | A1) und pA (B2 | A2) werden im Maximierungsproblem angenommen, eine Vereinfachung, die das Problem der unendlichen Regression vermeidet (ähnlich der Annahme von Nash, dass p (B1) für den Spieler gegeben ist) A in der Formulierung seines Maximierungsproblems).

[8] Ungleichung (5) ist die (entdeckte) Lösung des Problems (1) auf dieselbe Weise wie die quadratische Formel die Lösung einer allgemeinen quadratischen Gleichung.

[9] Die Prioritäten des Spielers können von teilweise beobachtbaren zufälligen Ereignissen wie dem Wetter abhängen. Informationen zur Verwendung von Priors in Spielen mit unvollständigen Informationen, die von Bayes-Spielern gespielt werden, finden Sie unter (Harsanyi [10]).

[10] Diese allgemeine Lösung enthält die Nash-Gleichgewichte als bestimmte Lösungen. Im Gegensatz zu den deskriptiven Nash-Lösungen ist unsere Lösung ein Paar präskriptiver Strategien, die auf rationalen Erwartungen beruhen. Außerdem ist Spieler A fälschlicherweise in der VNM-Region A1 und spielt A2. Korollar 2 besagt, dass Spieler A eine niedrigere erwartete Auszahlung erhält.

[11] Es ist interessant festzustellen, dass bei einem Nash-Mischgleichgewicht die Strategie eines Spielers davon abhängt, die Auszahlungsfunktion des anderen Spielers zu kennen.

[12] Nullzeichen werden in der Tabelle ignoriert, da diese Fälle degeneriert sind: Ein Spieler kann nicht zwischen seinen beiden Strategien wählen. Interessanterweise erscheint jedes Nash-Gleichgewicht in genau vier Reihen.

[13] Die nächsten 3-Beispiele wurden von (Davies [7]) auf eine Weise adaptiert, die als pädagogische Technik für spieltheoretische Studenten dienen könnte. Die Tabelle 1 kann verwendet werden, um schnell die Nash-Gleichgewichte für alle hier beschriebenen 2-Personenspielbeispiele zu finden.

[14] Die Aktionen von A wirken sich nicht auf die Auswahl der Aktionen von B aus. Dies liegt daran, dass die Überzeugungen von A nicht mit den Überzeugungen von B korreliert sind. Andererseits müssen die Wahrscheinlichkeiten beider Spieler gleich 50% sein, wenn andererseits die Wahrscheinlichkeiten beider Spieler> 50% sind, weiß A, dass B die Strategie 2 (Tails) spielt und somit die Strategie 1 spielt (Köpfe) kann kein korrektes Rezept für A sein. Wenn die Wahrscheinlichkeit von A> 50% und die Wahrscheinlichkeit von B <50% ist, weiß B, dass A Köpfe spielt, daher kann das Spielen von Köpfen kein korrektes Rezept für A sein Einzigartige Lösung ist daher das Nash-Gleichgewicht: Spielen Sie für beide nach dem Zufallsprinzip.

[15] Beachten Sie, dass pA (B1) = pB (A1) = 0 oder 1 ein Gleichgewichtsszenario ist: Beide Spieler schwenken (oder beide gehen geradeaus), wenn beide Spieler erwarten, dass der andere Spieler geradeaus geht (oder schwenkt). Im Gegensatz dazu kann p (A1) = p (B1) = 0 oder 1 kein Nash-Gleichgewicht sein: Wenn B geradeaus geht (oder ausweicht), wird A ausweichen (oder geradeaus gehen).

[16] Quellen: Arms Control Association, Federation of American Scientists, Internationales Gremium für spaltbare Materialien, US-Verteidigungsministerium, US-Außenministerium und Stockholm International Peace Research Institute.

[17] Seit der Veröffentlichung von Flood und Dresher wurden Tausende von Artikeln dazu veröffentlicht. Die Suche eines Google-Gelehrten nach dem „Gefangenen-Dilemma“ liefert 104,000-Ergebnisse wie in dieser Veröffentlichung. Bitte konferieren (Kuhn [14]).

[18] Daher spielen die Spieler die kooperative Lösung nicht.

[19] Wenn Ihr Gegner nicht zufällig spielt, kann Ihr Prior durch die vorherigen Spiele Ihres Gegners in diesem Spiel beeinflusst werden.

[20] Die Formel kann für M> 3 auf M-Personen erweitert werden.

[21] Dieses Spiel basiert auf dem El Farol Bar Problem (Arthur [5]).

[22] Der Ort der Indifferenz ist eine quadratische Kurve, die durch die Punkte (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5) verläuft.

Referenzen

[1] Aumann RJ (1974) Subjektivität und Korrelation in randomisierten Strategien. Zeitschrift für Wirtschaftsmathematik 1: 67-96

[2] Aumann RJ, Maschler M (1995) Wiederholte Spiele mit unvollständigen Informationen. MIT Press, Cambridge London

[3] Axelrod R (1984) Die Evolution der Zusammenarbeit. Grundlegende Bücher

[4] Acevedo M, Krueger JI (2005) Beweisführung im Gefangenendilemma. Das amerikanische Journal of Psychology 118: 431-457

[5] Arthur WB (1994) Induktives Denken und begrenzte Rationalität. American Economic Review 84: 406-411

[6] Daley B, Sadowski P (2017) Magisches Denken: Ein Repräsentationsergebnis. Theoretische Ökonomie 12: 909-956 24 Dieses Spiel basiert auf dem El Farol-Balkenproblem (Arthur [5]). 25 Der Ort der Indifferenz ist eine quadratische Kurve, die durch die Punkte (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5) verläuft.

[7] Davies T (2004) Utility-Theorie und Spieltheorie. Vorlesungsnotizen

[8] Garcia CB, Zangwill WI (2017) Ein neuer Ansatz für Krieg oder Frieden. Arbeitspapier

[9] Garcia CB, Dominanz von Zangwill WI (2018), erwarteter Nutzen und das Gefangenendilemma. Arbeitspapier

[10] Harsanyi J (1967) -Spiele mit unvollständigen Informationen Gespielt von "Bayesian" -Spielern I - III. J. Management Science 14 (3): 159-182

[11] Kadane JB, Larkey PD (1982) Subjektive Wahrscheinlichkeit und Spieltheorie. Management Science 28 (2): 113-120

[12] McKelvey RD, Palfrey TR (1995) Gleichgewichte der quantalen Antwort für Spiele in normaler Form. Spiele und wirtschaftliches Verhalten 10: 6-38

[13] Jaynes ET (1968) Vorangegangene Wahrscheinlichkeiten. IEEE-Transaktionen zu Systemwissenschaften und Kybernetik 4 (3): 227-241

[14] Kuhn S (2017) Gefangenendilemma. Die Stanford Encyclopedia of Philosophy

[15] Quattrone GA, Tversky A (1984) Kausale versus diagnostische Eventualitäten: Über Selbsttäuschung und die Illusion des Wählers. Zeitschrift für Persönlichkeits- und Sozialpsychologie 46: 237-248

[16] Skyrms B (2004) Die Hirschjagd und die Entwicklung der Sozialstruktur. Cambridge University Press, Cambridge

[17] Spohn W (1977) Wo Luce und Krantz das Entscheidungsmodell von Savage wirklich verallgemeinern. Erkenntnis 11: 113-134

[18] Starmer C (2000) Entwicklungen in der unerwarteten Nützlichkeitstheorie: die Suche nach einer deskriptiven Theorie der Wahl unter Risikogesichtspunkten. Zeitschrift für Wirtschaftsliteratur 38: 332-382

[19] Sugden R (2005) Die Ökonomie von Rechten, Kooperation und Wohlfahrt. Palgrave MacMillan, 2-Ausgabe: 132

[20] Von Neumann J, Morgenstern O (1953) Theorie von Spielen und wirtschaftlichem Verhalten. Princeton University Press, New Jersey

[21] Wolpert DH, Benford G (2011) Die Lehre von Newcombs Paradoxon. Synthese 190: 1637-164