Epsilon-rovnováha - Epsilon-equilibrium
Epsilon-rovnováha | |
---|---|
A koncepce řešení v herní teorie | |
Vztah | |
Nadmnožina | Nashova rovnováha |
Význam | |
Používá | stochastické hry |
v herní teorie, an epsilon-rovnováha, nebo téměř Nashova rovnováha, je a profil strategie že přibližně uspokojuje stav Nashova rovnováha. V Nashově rovnováze nemá žádný hráč motiv ke změně svého chování. V přibližné Nashově rovnováze je tento požadavek oslaben, aby byla možnost, že hráč může mít malou motivaci udělat něco jiného. To lze stále považovat za koncept adekvátního řešení, například za předpokladu zkreslení status quo. Tento koncept řešení může být upřednostňován před Nashequilibrium kvůli snadnějšímu výpočtu nebo alternativně kvůli možnosti, že ve hrách více než 2 hráčů nemusí být pravděpodobnosti spojené s přesnou Nashovou rovnováhou racionální čísla.[1]
Definice
Existuje více než jedna alternativní definice.
Standardní definice
Daná hra a skutečný nezáporný parametr , a profil strategie se říká, že je-rovnováha, pokud není možné, aby kterýkoli hráč získal více než v očekávané výplaty jednostranným odklonem od jeho strategie.[2]:45 Každý Nashova rovnováha je ekvivalentní s -rovnováha kde .
Formálně, pojďme být - hráčská hra s akčními sadami pro každého hráče a užitná funkce .Nechat označuje výplatu hráči když profil strategie se hraje být prostorem rozdělení pravděpodobnosti Vektor strategií je -Nash rovnováha pro -li
- pro všechny
Dobře podporovaná přibližná rovnováha
Následující definice[3]ukládá přísnější požadavek, že hráč může čistě strategii přiřadit pouze pozitivní pravděpodobnost pokud je výplata očekával maximálně výplatu menší než nejlepší výplata odezvy pravděpodobnost, že strategický profil se hraje. Pro hráče nechat být strategickými profily hráčů jiných než ; pro a čistá strategie z nechat být strategickým profilem, kde hraje a další hráči hrají .Nechat být výplatou když strategický profil Požadavek lze vyjádřit vzorcem
Výsledek
Existence a schéma polynomiálního času (PTAS) pro ε-Nashovy rovnováhy odpovídá otázce, zda existuje jeden pro ε-dobře podporované přibližné Nashovy rovnováhy,[4] ale existence PTAS zůstává otevřeným problémem. Pro konstantní hodnoty ε jsou polynomiální časové algoritmy pro přibližné rovnováhy známé pro nižší hodnoty ε, než jsou známé pro dobře podporované přibližné rovnováhy. Pro hry s výplatami v rozmezí [0,1 ] a ε = 0,3393, ε-Nashovy rovnováhy lze vypočítat v polynomiálním čase[5]U her s výplatami v rozsahu [0,1] a ε = 2/3 lze ε dobře podporované rovnováhy vypočítat v polynomiálním čase[6]
Příklad
Pojem ε-rovnováhy je v teorii důležitý stochastické hry potenciálně nekonečného trvání. Existují jednoduché příklady stochastických her bez č Nashova rovnováha ale s rovnováhou ε pro libovolné ε přísně větší než 0.
Snad nejjednodušším příkladem je následující varianta Odpovídající haléře, navrhl Everett. Hráč 1 skrývá penny a hráč 2 musí hádat, zda má heads up nebo tails. Pokud hráč 2 uhádne správně, vyhraje penny od hráče 1 a hra končí. Pokud hráč 2 nesprávně odhadne, že penny směřuje nahoru, hra končí nulovou výplatou pro oba hráče. Pokud nesprávně odhadne, že je to ocas nahoru, hra opakování. Pokud hra bude pokračovat navždy, výplata pro oba hráče je nulová.
Vzhledem k parametru ε > 0, libovolné profil strategie kde hráč 2 hádá heads up s pravděpodobností ε a ocas nahoru s pravděpodobností 1 -ε (v každé fázi hry a nezávisle na předchozích fázích) je ε-rovnováha pro hru. Očekávaná výplata hráče 2 za strategický profil je alespoň 1 -ε. Je však snadno vidět, že pro hráče 2 existuje nostrategie, která může zaručit očekávanou výplatu přesně 1. Proto hra nemá Nashova rovnováha.
Dalším jednoduchým příkladem je konečně opakované dilema vězně pro období T, kde je průměrná výplata za období T. Jediný Nashova rovnováha této hry je zvolit Defekt v každém období. Nyní zvažte dvě strategie sýkorka a pochmurná spoušť. I když ani jeden sýkorka ani pochmurná spoušť jsou Nashovy rovnováhy pro hru, oba jsou -rovnováha pro některé pozitivní . Přijatelné hodnoty závisí na výplatách základní hry a na počtu T období.
V ekonomii je koncept a čistá strategie epsilon-rovnováha se používá, když je přístup smíšené strategie považován za nereálný. V čisté strategii epsilon-equilibrium si každý hráč vybere čistou strategii, která je v epsilonu jeho nejlepší čisté strategie. Například v Bertrand – Edgeworthův model, kde neexistuje rovnováha čisté strategie, může existovat rovnováha čisté strategie epsilon.
Reference
- Vložené citace
- ^ V. Bubelis (1979). "O rovnováze ve finálních hrách". International Journal of Game Theory. 8 (2): 65–79. doi:10.1007 / bf01768703.
- ^ Vazirani, Vijay V.; Nisan, Noame; Roughgarden, Tim; Tardos, Éva (2007). Algoritmická teorie her (PDF). Cambridge, Velká Británie: Cambridge University Press. ISBN 0-521-87282-0.
- ^ P.W. Goldberg a C.H. Papadimitriou (2006). "Redukovatelnost mezi rovnovážnými problémy". 38. symposium o teorii práce na počítači. 61–70. doi:10.1145/1132516.1132526.
- ^ C. Daskalakis, P.W. Goldberg a C.H. Papadimitriou (2009). "Složitost výpočtu Nashovy rovnováhy". SIAM Journal on Computing. 39 (3): 195–259. CiteSeerX 10.1.1.68.6111. doi:10.1137/070699652.
- ^ H. Tsaknakis a Paul G. Spirakis (2008). „Optimalizační přístup pro přibližnou Nashovu rovnováhu“. Internetová matematika. 5 (4): 365–382. doi:10.1080/15427951.2008.10129172.
- ^ Spyros C. Kontogiannis a Paul G. Spirakis (2010). "Dobře podporovaná přibližná rovnováha ve hrách Bimatrix". Algorithmica. 57 (4): 653–667. doi:10.1007 / s00453-008-9227-6.
- Zdroje
- H Dixone Přibližná Bertrandova rovnováha v replikovaném průmyslu, Review of Economic Studies, 54 (1987), strany 47–62.
- H. Everett. "Rekurzivní hry". V H.W. Kuhn a A.W. Tucker, redaktoři. Příspěvky k teorii her, sv. III, svazek 39 Annals of Mathematical Studies. Princeton University Press, 1957.
- Leyton-Brown, Kevin; Shoham, Yoav (2008), Základy teorie her: Stručný multidisciplinární úvod, San Rafael, CA: Morgan & Claypool Publishers, ISBN 978-1-59829-593-1. 88stránkový matematický úvod; viz část 3.7. Zdarma online na mnoha univerzitách.
- R. Radner. Hromadné chování v nespolupracujících epsilonových rovnováhách oligopolů s dlouhými, ale konečnými životy, Journal of Economic Theory, 22, 121–157, 1980.
- Shoham, Yoav; Leyton-Brown, Kevin (2009), Multiagentní systémy: Algoritmické, herně teoretické a logické základy, New York: Cambridge University Press, ISBN 978-0-521-89943-7. Komplexní reference z výpočetní perspektivy; viz část 3.4.7. Stahovatelné zdarma online.
- S.H. Tijs. Nashovy rovnováhy pro nespolupracující n-osobní hry v normální formě, SIAM recenze, 23, 225–237, 1981.