Korelovaná rovnováha - Correlated equilibrium
Korelovaná rovnováha | |
---|---|
A koncepce řešení v herní teorie | |
Vztah | |
Nadmnožina | Nashova rovnováha |
Význam | |
Navrhl | Robert Aumann |
Příklad | Kuře |
v herní teorie, a korelovaná rovnováha je koncepce řešení to je obecnější než dobře známé Nashova rovnováha. Poprvé o tom diskutoval matematik Robert Aumann v roce 1974.[1][2] Myšlenka je, že každý hráč si zvolí svou akci podle svého pozorování hodnoty stejného veřejného signálu. Strategie přiřadí akci každému možnému pozorování, které hráč může provést. Pokud by se žádný hráč nechtěl odchýlit od doporučené strategie (za předpokladu, že se ostatní neodchýlí), rozdělení se nazývá korelovaná rovnováha.
Formální definice
An - strategická hra hráče se vyznačuje akční sadou a užitná funkce pro každého hráče . Když hráč zvolí strategii a zbývající hráči si zvolí strategický profil popsaný v -tuple , pak hráč užitečnost je .
A modifikace strategie pro hráče je funkce . To znamená, říká hráč upravit jeho chování hraním akce na pokyn hrát .
Nechat být počitatelný pravděpodobnostní prostor. Pro každého hráče , nechť být jeho informačním oddílem, být je zadní a nechte , přiřazení stejné hodnoty stavům ve stejné buňce informační oddíl. Pak je korelovanou rovnováhou strategické hry pokud pro každého hráče a pro každou změnu strategie :
Jinými slovy, je korelovaná rovnováha, pokud žádný hráč nemůže zlepšit svou očekávanou užitečnost pomocí modifikace strategie.
Příklad
Djsou | Cvysmívat se | |
Djsou | 0, 0 | 7, 2 |
Cvysmívat se | 2, 7 | 6, 6 |
Hra kuře |
Zvažte kuřecí hra na obrázku. V této hře se dva jednotlivci navzájem vyzývají k soutěži, kde každý může odvážit se nebo kuře ven. Pokud se jeden chystá Dare, je lepší pro druhého vykouřit. Pokud se ale jeden chystá vykouřit, pro druhého je lepší Dare. To vede k zajímavé situaci, kdy se každý chce odvážit, ale pouze v případě, že by ten druhý mohl vyklouznout.
V této hře jsou tři Nashovy rovnováhy. Dva čistá strategie Nashovy rovnováhy jsou (D, C) a (C, D). Je tam také smíšená strategie rovnováha, kde se každý hráč odváží s pravděpodobností 1/3.
Nyní zvažte třetí stranu (nebo nějakou přirozenou událost), která lízne jednu ze tří karet označených: (C, C), (D, C), a (C, D), se stejnou pravděpodobností, tj. pravděpodobností 1/3 pro každou kartu. Po vytažení karty třetí strana informuje hráče o strategii, která jim byla na kartě přiřazena (ale ne strategie přidělená jejich soupeři). Předpokládejme, že je hráč přiřazen D, nechtěl by se odchýlit za předpokladu, že by druhý hráč hrál svoji přidělenou strategii, protože dostane 7 (nejvyšší možná výplata). Předpokládejme, že je hráč přiřazen C. Poté bude hrát druhý hráč C s pravděpodobností 1/2 a D s pravděpodobností 1/2. The očekávaná užitečnost of Daring je 7 (1/2) + 0 (1/2) = 3,5 a očekávaná užitečnost chickingu je 2 (1/2) + 6 (1/2) = 4. Takže hráč by preferoval chickening out .
Jelikož žádný z hráčů nemá motiv k odchýlení se, jedná se o korelovanou rovnováhu. Očekávaná výplata této rovnováhy je 7 (1/3) + 2 (1/3) + 6 (1/3) = 5, což je vyšší než očekávaná výplata smíšené strategie Nashova rovnováha.
Následující korelovaná rovnováha má pro oba hráče ještě vyšší výplatu: Doporučit (C, C) s pravděpodobností 1/2 a (D, C) a (C, D) s pravděpodobností po 1/4. Pak, když se hráči doporučuje hrát Cví, že druhý hráč bude hrát D s (podmíněnou) pravděpodobností 1/3 a C s pravděpodobností 2/3 a dostane očekávanou výplatu 14/3, což se rovná (ne méně než) očekávané výplatě, když hraje D. V této korelované rovnováze dostanou oba hráči očekávání 5,25. Lze ukázat, že se jedná o korelovanou rovnováhu s maximálním součtem očekávaných výplat pro oba hráče.
Jednou z výhod korelovaných rovnováh je, že jsou výpočetně levnější než Nashovy rovnováhy. To lze zachytit skutečností, že výpočet korelované rovnováhy vyžaduje pouze řešení lineárního programu, zatímco řešení Nashovy rovnováhy vyžaduje úplné nalezení jejího pevného bodu.[3] Další způsob, jak to vidět, je, že je možné, aby si dva hráči navzájem odpovídali na historické hry hry a nakonec se sblížili s korelovanou rovnováhou.[4]
Reference
- ^ Aumann, Robert (1974). "Subjektivita a korelace v randomizovaných strategiích". Journal of Mathematical Economics. 1 (1): 67–96. CiteSeerX 10.1.1.120.1740. doi:10.1016/0304-4068(74)90037-8.
- ^ Aumann, Robert (1987). „Korelovaná rovnováha jako výraz Bayesovské racionality“. Econometrica. 55 (1): 1–18. CiteSeerX 10.1.1.295.4243. doi:10.2307/1911154. JSTOR 1911154.
- ^ Papadimitriou, Christos H .; Roughgarden, Tim (2008). "Výpočet korelovaných rovnováh ve hrách pro více hráčů". J. ACM. 55 (3): 14:1–14:29. CiteSeerX 10.1.1.335.2634. doi:10.1145/1379759.1379762.
- ^ Foster, Dean P .; Vohra, Rakesh V. (1996). "Kalibrované učení a korelovaná rovnováha". Hry a ekonomické chování.
Zdroje
- Fudenberg, Drew a Jean Tirole (1991) Herní teorie, MIT Stiskněte, 1991, ISBN 0-262-06141-4
- Leyton-Brown, Kevin; Shoham, Yoav (2008), Základy teorie her: Stručný multidisciplinární úvod, San Rafael, CA: Morgan & Claypool Publishers, ISBN 978-1-59829-593-1. 88stránkový matematický úvod; viz část 3.5. Zdarma online na mnoha univerzitách.
- Osborne, Martin J. a Ariel Rubinstein (1994). Kurz teorie her, MIT Stiskněte. ISBN 0-262-65040-1 (moderní úvod na úrovni absolventa)
- Shoham, Yoav; Leyton-Brown, Kevin (2009), Multiagentní systémy: Algoritmické, herně teoretické a logické základy, New York: Cambridge University Press, ISBN 978-0-521-89943-7. Komplexní reference z výpočetní perspektivy; viz oddíly 3.4.5 a 4.6. Stahovatelné zdarma online.
- Éva Tardos (2004) Poznámky třídy z Algoritmická teorie her (všimněte si důležitého překlepu) [1]
- Iskander Karibžanov. Kód MATLAB vykreslit sadu korelovaných rovnováh ve hře pro dva hráče v normální formě
- Noam Nisan (2005) Poznámky k přednášce z kurzu Témata na hranici ekonomie a výpočtu (malá u by měla být nahrazena u_i) [2]