Dokonalá bayesiánská rovnováha - Perfect Bayesian equilibrium

Dokonalá bayesiánská rovnováha
	A koncepce řešení v herní teorie
Vztah
Podmnožina	Bayesian Nash rovnováha
Význam
Navrhl	Cho a Kreps[Citace je zapotřebí ]
Používá	Dynamický Bayesovské hry
Příklad	signalizační hra

v herní teorie, a Dokonalá bayesiánská rovnováha (PBE) je rovnovážný koncept relevantní pro dynamické hry s neúplné informace (sekvenční Bayesovské hry ). Je to zdokonalení Bayesian Nash rovnováha (BNE). PBE má dvě složky - strategií a víry:

The strategie hráče v dané informační sadě určuje, jak tento hráč v dané informační sadě jedná. Akce může záviset na historii. To je podobné jako u sekvenční hra.
The víra hráče v dané informační sadě určuje, na kterém uzlu v dané informační sadě hráč věří, že hraje. Víra může být a rozdělení pravděpodobnosti přes uzly v souboru informací (zejména: víra může být distribucí pravděpodobnosti přes možné typy ostatních hráčů). Formálně je systém víry přiřazením pravděpodobností každému uzlu ve hře tak, že součet pravděpodobností v jakékoli sadě informací je 1.

Strategie a přesvědčení by měly splňovat následující podmínky:

Sekvenční racionalita: každá strategie by měla být vzhledem k přesvědčení optimální v očekávání.
Konzistence: každá víra by měla být aktualizována podle strategií a Bayesovo pravidlo, v každé cestě pozitivní pravděpodobnosti (v cestách nulové pravděpodobnosti, aka dráhy mimo rovnováhu, víry mohou být libovolné).

PBE je vždy SV, ale nemusí být subgame dokonalá rovnováha (SPE).

PBE v signalizačních hrách

A signalizační hra je nejjednodušší druh dynamické bayesovské hry. Existují dva hráči, jeden z nich („přijímač“) má pouze jeden možný typ a druhý („odesílatel“) má několik možných typů. Nejprve přehraje odesílatel, až potom příjemce.

Pro výpočet PBE ve signalizační hře uvažujeme dva druhy rovnováhy: a oddělující rovnováhu a a rovnováha sdružování. V separační rovnováze hraje každý typ odesílatele jinou akci, takže akce odesílatele poskytuje informace příjemci; v rovnováze sdružování hrají všechny typy odesílatelů stejnou akci, takže akce odesílatele nedává příjemci žádné informace.

Dárková hra 1

Zvažte následující hra:^[1]

Odesílatel má dva možné typy: buď „přítele“ (s apriori pravděpodobností ${ displaystyle p}$ ) nebo „nepřítel“ (s apriori pravděpodobností ${ displaystyle 1-p}$ ). Každý typ má dvě strategie: buď dárek, nebo ne.
Přijímač má pouze jeden typ a dvě strategie: buď přijmout dar, nebo jej odmítnout.
Pomůcka odesílatele je 1, pokud je jeho dar přijat, -1, pokud je jeho dar odmítnut, a 0, pokud neposkytne žádný dar.
Obsluha přijímače závisí na tom, kdo dá dárek:
- Pokud je odesílatel přítel, je obslužný program příjemce 1 (pokud přijme) nebo 0 (pokud odmítne).
- Pokud je odesílatel nepřítelem, pak je přijímací utilita -1 (pokud přijme) nebo 0 (pokud odmítne).

Abychom mohli analyzovat PBE v této hře, podívejme se nejprve na následující potenciál oddělující rovnováhy:

Strategie odesílatele je: přítel dává a nepřítel nedává. Víry příjemce jsou odpovídajícím způsobem aktualizovány: pokud obdrží dárek, vědí, že odesílatel je přítel; jinak vědí, že odesílatel je nepřítel. Strategie přijímače je tedy: přijmout. Toto NENÍ rovnováha, protože strategie odesílatele není optimální: nepřátelský odesílatel může zvýšit svou výplatu z 0 na 1 zasláním daru.
Strategie odesílatele je: přítel nedává a nepřítel dává. Víry příjemce jsou odpovídajícím způsobem aktualizovány: pokud obdrží dárek, vědí, že odesílatel je nepřítel; jinak vědí, že odesílatel je přítel. Strategie příjemce je: odmítnout. Toto opět NENÍ rovnováha, protože strategie odesílatele není optimální: nepřátelský odesílatel může zvýšit svou výplatu z -1 na 0 tím, že neposílá dárek.

Dospěli jsme k závěru, že v této hře existuje Ne oddělující rovnováhu.

Pojďme se nyní podívat na následující potenciální sdružovací rovnováhy:

Strategie odesílatele je: vždy dávat. Víry příjemce nejsou aktualizovány: stále věří v apriorní pravděpodobnost, že odesílatel je přítel s pravděpodobností ${ displaystyle p}$ a nepřítel s pravděpodobností ${ displaystyle 1-p}$ . Jejich výplata z přijetí je ${ displaystyle 2p-1}$ , takže přijímají pouze a jen pokud ${ displaystyle p geq 1/2}$ . Jedná se tedy o PBE (nejlepší odezva pro odesílatele i příjemce), pokud a pouze - pokud apriori pravděpodobnost, že bude přítelem, splňuje ${ displaystyle p geq 1/2}$ .
Strategie odesílatele je: nikdy nedávat. Zde může být přesvědčení příjemce při přijímání daru libovolné, protože obdržení daru je událost s pravděpodobností 0, takže Bayesovo pravidlo neplatí. Předpokládejme například, že při přijímání daru víra příjemce je, že odesílatel je přítel s pravděpodobností 0,2 (nebo jakékoli jiné číslo menší než 0,5). Strategie příjemce je: odmítnout. Toto je PBE bez ohledu na apriori pravděpodobnost. Odesílatel i příjemce obdrží očekávanou výplatu 0 a žádný z nich nemůže odchylkou zlepšit očekávanou výplatu.

Shrnout:

Li ${ displaystyle p geq 1/2}$ , pak existují dvě PBE: buď odesílatel vždy dává a přijímač vždy přijímá, nebo odesílatel vždy nedává a přijímač vždy odmítá.
Li ${ displaystyle p <1/2}$ , pak existuje pouze jeden PBE: odesílatel vždy nedává a přijímač vždy odmítá. Tento PBE není Pareto efektivní, ale to je nevyhnutelné, protože odesílatel nemůže spolehlivě signalizovat jejich typ.

Dárková hra 2

V následujícím příkladu je sada PBE přísně menší než sada SPE a BNE. Jedná se o variantu výše uvedené dárkové hry s následující změnou v nástroji přijímače:

Pokud je odesílatel přítel, je obslužný program příjemce 1 (pokud přijme) nebo 0 (pokud odmítne).
Pokud je odesílatel nepřítel, pak je to nástroj přijímače 0 (pokud přijmou) nebo -1 (pokud odmítnou).

Upozorňujeme, že v této variantě je přijetí a dominantní strategie pro přijímač.

Podobně jako v příkladu 1 neexistuje separační rovnováha. Podívejme se na následující potenciální sdružovací rovnováhy:

Strategie odesílatele je: vždy dávat. Víry příjemce nejsou aktualizovány: stále věří v apriorní pravděpodobnost, že odesílatel je přítel s pravděpodobností ${ displaystyle p}$ a nepřítel s pravděpodobností ${ displaystyle 1-p}$ . Jejich výplata z přijetí je vždy vyšší než z odmítnutí, takže přijímají (bez ohledu na hodnotu ${ displaystyle p}$ ). Toto je PBE - je to nejlepší reakce pro odesílatele i příjemce.
Strategie odesílatele je: nikdy nedávat. Předpokládejme, že při přijímání daru víra příjemce je, že odesílatel je s největší pravděpodobností přítel ${ displaystyle q}$ , kde ${ displaystyle q}$ je libovolné číslo v ${ displaystyle [0,1]}$ . Bez ohledu na ${ displaystyle q}$ , optimální strategie příjemce je: přijmout. Toto NENÍ PBE, protože odesílatel může zlepšit svou výplatu z 0 na 1 tím, že dá dárek.
Strategie odesílatele je: nikdy nedávat a strategie příjemce: odmítnout. Toto NENÍ PBE, protože pro žádný víra přijímače, odmítnutí není nejlepší odpovědí.

Všimněte si, že možnost 3 je Nashova rovnováha! Ignorujeme-li přesvědčení, lze odmítnutí považovat za nejlepší reakci pro příjemce, protože to nemá vliv na jejich výplatu (protože stejně neexistuje žádný dar). Možnost 3 je navíc dokonce SPE, protože jedinou subgame je celá hra! Taková nepravděpodobná rovnováha může nastat i ve hrách s úplnými informacemi, ale lze je eliminovat aplikací subgame dokonalá Nashova rovnováha. Bayesiánské hry však často obsahují jiné než jednotlivé sady informací a od té doby podhry musí obsahovat kompletní sady informací, někdy existuje pouze jedna dílčí hra - celá hra - a tak je každá Nashova rovnováha triviálně dokonalá. I když hra má více než jednu podhru, neschopnost dokonalosti podhry proříznout soubory informací může mít za následek vyloučení nepravděpodobné rovnováhy.

Abych to shrnul: v této variantě dárkové hry existují dvě SPE: buď odesílatel vždy dává a příjemce vždy přijímá, nebo odesílatel vždy nedává a příjemce vždy odmítá. Z nich je pouze první PBE; druhý není PBE, protože nemůže být podporován žádným systémem víry.

Další příklady

Další příklady viz signalizační hra # Příklady. Viz také ^[2] pro více příkladů.

PBE ve vícestupňových hrách

A vícestupňová hra je sled simultánních her hraných jeden po druhém. Tyto hry mohou být identické (jako v opakované hry ) nebo jiné.

Opakovaná veřejně dobrá hra

	Stavět	Ne
Stavět	1-C1, 1-C2	1-C1, 1
Ne	1, 1-C2	0,0
Veřejná dobrá hra

Následující hra^[3]^{:oddíl 6.2} je jednoduchá reprezentace problém s jezdcem. Existují dva hráči, z nichž každý může buď postavit veřejné dobro nebo nestavět. Každý hráč získá 1, pokud je vybudován veřejný statek, a 0, pokud ne; navíc, pokud hráč ${ displaystyle i}$ buduje veřejné blaho, musí platit náklady ${ displaystyle C_ {i}}$ . Náklady jsou soukromé informace - každý hráč zná své vlastní náklady, ale ne náklady druhého. Je známo pouze to, že každá cena je náhodně čerpána nezávisle z nějakého rozdělení pravděpodobnosti. Díky tomu je tato hra a Bayesiánská hra.

V jednostupňové hře staví každý hráč pouze a jen za předpokladu, že jeho cena je menší než očekávaný zisk ze stavby. Očekávaný zisk z budovy je přesně 1krát větší pravděpodobnost, že druhý hráč NEBUDE stavět. V rovnováze, pro každého hráče ${ displaystyle i}$ , existuje prahová cena ${ displaystyle C_ {i} ^ {*}}$ , takže hráč přispívá pouze a jen tehdy, pokud jsou jeho náklady nižší než ${ displaystyle C_ {i} ^ {*}}$ . Tuto prahovou cenu lze vypočítat na základě rozdělení pravděpodobnosti nákladů hráčů. Například pokud jsou náklady rozděleny rovnoměrně na ${ displaystyle [0,2]}$ , pak existuje symetrická rovnováha, ve které je prahová cena obou hráčů 2/3. To znamená, že hráč, jehož cena je mezi 2/3 a 1, nepřispěje, i když jeho cena je nižší než výhoda, kvůli možnosti, že přispěje druhý hráč.

Nyní předpokládejme, že se tato hra opakuje dvakrát.^[3]^{:oddíl 8.2.3} Tyto dvě hry jsou nezávislé, tj. Každý den se hráči současně rozhodují, zda v ten den vybudují veřejné statky, získají výplatu 1, pokud je statek postaven v ten den, a zaplatí své náklady, pokud v ten den stavěli. Jediným spojením mezi hrami je to, že hraním prvního dne mohou hráči odhalit některé informace o svých nákladech a tyto informace mohou ovlivnit hraní druhého dne.

Hledáme symetrický PBE. Označit podle ${ displaystyle { hat {c}}}$ prahová cena obou hráčů v den 1 (takže v den 1 každý hráč vytvoří if-only-pokud je jejich cena nejvýše ${ displaystyle { hat {c}}}$ ). Vypočítat ${ displaystyle { hat {c}}}$ , pracujeme zpětně a analyzujeme akce hráčů v den 2. Jejich akce závisí na historii (= dvě akce v den 1) a existují tři možnosti:

V den 1 nebyl postaven žádný hráč. Nyní tedy oba hráči vědí, že cena jejich soupeře je vyšší ${ displaystyle { hat {c}}}$ . Podle toho aktualizují svou víru a docházejí k závěru, že existuje menší šance, že se jejich soupeř postaví v den 2. Proto zvyšují své prahové náklady a prahové náklady v den 2 jsou ${ displaystyle c ^ {00}> { klobouk {c}}}$ .
V den 1 postavili oba hráči. Nyní tedy oba hráči vědí, že cena jejich soupeře je nižší ${ displaystyle { hat {c}}}$ . Podle toho aktualizují svou víru a dospějí k závěru, že existuje větší šance, že se jejich oponent postaví v den 2. Proto snižují své prahové náklady a prahové náklady v den 2 jsou ${ displaystyle c ^ {11} <{ hat {c}}}$ .
V den 1 postavil přesně jeden hráč; Předpokládejme, že je to hráč 1. Takže nyní je známo, že cena hráče 1 je nižší ${ displaystyle { hat {c}}}$ a cena hráče 2 je výše ${ displaystyle { hat {c}}}$ . Existuje rovnováha, ve které jsou akce v den 2 stejné jako akce v den 1 - hráč 1 staví a hráč 2 nestaví.

Je možné vypočítat očekávanou výplatu „prahového hráče“ (hráče s cenou přesně ${ displaystyle { hat {c}}}$ ) v každé z těchto situací. Vzhledem k tomu, že prahový hráč by měl být lhostejný mezi přispíváním a nepřispíváním, je možné vypočítat prahovou cenu za den 1 ${ displaystyle { hat {c}}}$ . Ukazuje se, že tato prahová hodnota je dolní než ${ displaystyle c ^ {*}}$ - práh v jednostupňové hře. To znamená, že ve dvoustupňové hře jsou hráči méně ochotni stavět než v jednostupňové hře. Důvodem je intuitivní důvod, že když hráč nepřispěje první den, přiměje druhého hráče, aby věřil, že jeho cena je vysoká, a díky tomu je druhý hráč ochotnější přispět druhý den.

Skokové nabídky

V otevřeném výkřiku Anglická aukce, mohou uchazeči zvýšit aktuální cenu malými kroky (např. pokaždé v 1 USD). Často však existuje skočit přihazování - někteří uchazeči zvýší aktuální cenu mnohem více než minimální přírůstek. Jedním z vysvětlení je, že slouží jako signál ostatním uchazečům. Existuje PBE, ve kterém každý uchazeč skáče pouze a jen - pokud je jeho hodnota nad určitou prahovou hodnotou. Vidět Přeskočit nabídku # signalizace.

Viz také

Sekvenční rovnováha - zdokonalení PBE, které omezuje víry, které lze přiřadit k nerovnovážným informačním sadám, na „rozumné“.
Intuitivní kritérium a Božská rovnováha - další vylepšení PBE, specifická pro signalizační hry.

Reference

^ James Peck. „Perfect Bayesian Equilibrium“ (PDF). Ohio State University. Citováno 2. září 2016.
^ Zack Grossman. „Perfect Bayesian Equilibrium“ (PDF). University of California. Citováno 2. září 2016.
^ ^A ^b Fudenberg, Drew; Tirole, Jean (1991). Herní teorie. Cambridge, Massachusetts: MIT Stiskněte. ISBN 9780262061414. Náhled knihy.

[1] James Peck. „Perfect Bayesian Equilibrium“ (PDF). Ohio State University. Citováno 2. září 2016.

[2] Zack Grossman. „Perfect Bayesian Equilibrium“ (PDF). University of California. Citováno 2. září 2016.

[ft91-3] A ^b Fudenberg, Drew; Tirole, Jean (1991). Herní teorie. Cambridge, Massachusetts: MIT Stiskněte. ISBN 9780262061414. Náhled knihy.

[1]

[2]

[3]

Témata v herní teorie
Definice	Kooperativní hra Odhodlání Stupňování závazku Rozsáhlá hra Výhra prvního hráče a druhého hráče Složitost hry Grafická hra Hierarchie přesvědčení Informační sada Normální forma hry Přednost Sekvenční hra Simultánní hra Simultánní výběr akce Vyřešená hra Stručná hra
Rovnováha koncepty	Nashova rovnováha Dokonalost subgame Mertens-stabilní rovnováha Bayesian Nash rovnováha Dokonalá bayesiánská rovnováha Chvějící se ruka Správná rovnováha Epsilon-rovnováha Korelovaná rovnováha Sekvenční rovnováha Kvazi-dokonalá rovnováha Evolučně stabilní strategie Riziková dominance Jádro Shapleyova hodnota Paretova účinnost Gibbsova rovnováha Rovnováha kvantové odezvy Samy potvrzující rovnováha Silná Nashova rovnováha Markovova dokonalá rovnováha
Strategie	Dominantní strategie Čistá strategie Smíšená strategie Argument krádeže strategie Oko za oko Chmurná spoušť Koluze Zpětná indukce Dopředná indukce Markovova strategie Stínování nabídek
Třídy her	Symetrická hra Perfektní informace Opakovaná hra Signální hra Projekční hra Levná řeč Hra s nulovým součtem Návrh mechanismu Problém vyjednávání Stochastická hra Střední polní hra n- hráčská hra Velká hra Poisson Nepřenosná hra Globální hra Přísně určená hra Potenciální hra
Hry	Jít Šachy Nekonečný šach dáma Piškvorky Vězňovo dilema Hra na výměnu dárků Nepovinné vězeňské dilema Cestovatelské dilema Koordinační hra Kuře Hra Stonožka Dilema dobrovolníka Aukce dolaru Bitva pohlaví Lov jelenů Odpovídající haléře Hra Ultimatum Kámen, nůžky, papír Pirátská hra Diktátorská hra Hra pro veřejné statky Blotto hra Válka vyhlazování Problém s barem El Farol Spravedlivé rozdělení Spravedlivé krájení dortu Cournotova hra Zablokování Dinerovo dilema Hádejte 2/3 průměru Kuhn poker Nash vyjednávací hra Indukční hádanky Trust hra Hra Princezna a monstrum Rendezvous problém
Věty	Věta o nemožnosti šipky Aumannova věta o dohodě Lidová věta Věta o minimaxu Nashova věta Věta o čištění Princip odhalení Zermelova věta
Klíč čísla	Albert W. Tucker Amos Tversky Antoine Augustin Cournot Ariel Rubinstein Claude Shannon Daniel Kahneman David K. Levine David M. Kreps Donald B.Gillies Drew Fudenberg Eric Maskin Harold W. Kuhn Herbert Simon Hervé Moulin Jean Tirole Jean-François Mertens Jennifer Tour Chayes John Harsanyi John Maynard Smith John Nash John von Neumann Kenneth Arrow Kenneth Binmore Leonid Hurwicz Lloyd Shapley Melvin Dresher Merrill M. Flood Olga Bondareva Oskar Morgenstern Paul Milgrom Peyton Young Reinhard Selten Robert Axelrod Robert Aumann Robert B.Wilson Roger Myerson Samuel Bowles Suzanne Scotchmer Thomas Schelling William Vickrey
Viz také	Aukce za všechny platby Alfa – beta prořezávání Bertrandův paradox Omezená racionalita Kombinatorická teorie her Analýza konfrontace Spolupráce Evoluční teorie her Výhoda prvního tahu v šachu Herní mechanika Glosář teorie her Seznam herních teoretiků Seznam her v teorii her Situace bez výhry Řešení šachů Topologická hra Společná tragédie Tyranie malých rozhodnutí