Dokonalá bayesiánská rovnováha - Perfect Bayesian equilibrium
Dokonalá bayesiánská rovnováha | |
---|---|
A koncepce řešení v herní teorie | |
Vztah | |
Podmnožina | Bayesian Nash rovnováha |
Význam | |
Navrhl | Cho a Kreps[Citace je zapotřebí ] |
Používá | Dynamický Bayesovské hry |
Příklad | signalizační hra |
v herní teorie, a Dokonalá bayesiánská rovnováha (PBE) je rovnovážný koncept relevantní pro dynamické hry s neúplné informace (sekvenční Bayesovské hry ). Je to zdokonalení Bayesian Nash rovnováha (BNE). PBE má dvě složky - strategií a víry:
- The strategie hráče v dané informační sadě určuje, jak tento hráč v dané informační sadě jedná. Akce může záviset na historii. To je podobné jako u sekvenční hra.
- The víra hráče v dané informační sadě určuje, na kterém uzlu v dané informační sadě hráč věří, že hraje. Víra může být a rozdělení pravděpodobnosti přes uzly v souboru informací (zejména: víra může být distribucí pravděpodobnosti přes možné typy ostatních hráčů). Formálně je systém víry přiřazením pravděpodobností každému uzlu ve hře tak, že součet pravděpodobností v jakékoli sadě informací je 1.
Strategie a přesvědčení by měly splňovat následující podmínky:
- Sekvenční racionalita: každá strategie by měla být vzhledem k přesvědčení optimální v očekávání.
- Konzistence: každá víra by měla být aktualizována podle strategií a Bayesovo pravidlo, v každé cestě pozitivní pravděpodobnosti (v cestách nulové pravděpodobnosti, aka dráhy mimo rovnováhu, víry mohou být libovolné).
PBE je vždy SV, ale nemusí být subgame dokonalá rovnováha (SPE).
PBE v signalizačních hrách
A signalizační hra je nejjednodušší druh dynamické bayesovské hry. Existují dva hráči, jeden z nich („přijímač“) má pouze jeden možný typ a druhý („odesílatel“) má několik možných typů. Nejprve přehraje odesílatel, až potom příjemce.
Pro výpočet PBE ve signalizační hře uvažujeme dva druhy rovnováhy: a oddělující rovnováhu a a rovnováha sdružování. V separační rovnováze hraje každý typ odesílatele jinou akci, takže akce odesílatele poskytuje informace příjemci; v rovnováze sdružování hrají všechny typy odesílatelů stejnou akci, takže akce odesílatele nedává příjemci žádné informace.
Dárková hra 1
Zvažte následující hra:[1]
- Odesílatel má dva možné typy: buď „přítele“ (s apriori pravděpodobností ) nebo „nepřítel“ (s apriori pravděpodobností ). Každý typ má dvě strategie: buď dárek, nebo ne.
- Přijímač má pouze jeden typ a dvě strategie: buď přijmout dar, nebo jej odmítnout.
- Pomůcka odesílatele je 1, pokud je jeho dar přijat, -1, pokud je jeho dar odmítnut, a 0, pokud neposkytne žádný dar.
- Obsluha přijímače závisí na tom, kdo dá dárek:
- Pokud je odesílatel přítel, je obslužný program příjemce 1 (pokud přijme) nebo 0 (pokud odmítne).
- Pokud je odesílatel nepřítelem, pak je přijímací utilita -1 (pokud přijme) nebo 0 (pokud odmítne).
Abychom mohli analyzovat PBE v této hře, podívejme se nejprve na následující potenciál oddělující rovnováhy:
- Strategie odesílatele je: přítel dává a nepřítel nedává. Víry příjemce jsou odpovídajícím způsobem aktualizovány: pokud obdrží dárek, vědí, že odesílatel je přítel; jinak vědí, že odesílatel je nepřítel. Strategie přijímače je tedy: přijmout. Toto NENÍ rovnováha, protože strategie odesílatele není optimální: nepřátelský odesílatel může zvýšit svou výplatu z 0 na 1 zasláním daru.
- Strategie odesílatele je: přítel nedává a nepřítel dává. Víry příjemce jsou odpovídajícím způsobem aktualizovány: pokud obdrží dárek, vědí, že odesílatel je nepřítel; jinak vědí, že odesílatel je přítel. Strategie příjemce je: odmítnout. Toto opět NENÍ rovnováha, protože strategie odesílatele není optimální: nepřátelský odesílatel může zvýšit svou výplatu z -1 na 0 tím, že neposílá dárek.
Dospěli jsme k závěru, že v této hře existuje Ne oddělující rovnováhu.
Pojďme se nyní podívat na následující potenciální sdružovací rovnováhy:
- Strategie odesílatele je: vždy dávat. Víry příjemce nejsou aktualizovány: stále věří v apriorní pravděpodobnost, že odesílatel je přítel s pravděpodobností a nepřítel s pravděpodobností . Jejich výplata z přijetí je , takže přijímají pouze a jen pokud . Jedná se tedy o PBE (nejlepší odezva pro odesílatele i příjemce), pokud a pouze - pokud apriori pravděpodobnost, že bude přítelem, splňuje .
- Strategie odesílatele je: nikdy nedávat. Zde může být přesvědčení příjemce při přijímání daru libovolné, protože obdržení daru je událost s pravděpodobností 0, takže Bayesovo pravidlo neplatí. Předpokládejme například, že při přijímání daru víra příjemce je, že odesílatel je přítel s pravděpodobností 0,2 (nebo jakékoli jiné číslo menší než 0,5). Strategie příjemce je: odmítnout. Toto je PBE bez ohledu na apriori pravděpodobnost. Odesílatel i příjemce obdrží očekávanou výplatu 0 a žádný z nich nemůže odchylkou zlepšit očekávanou výplatu.
Shrnout:
- Li , pak existují dvě PBE: buď odesílatel vždy dává a přijímač vždy přijímá, nebo odesílatel vždy nedává a přijímač vždy odmítá.
- Li , pak existuje pouze jeden PBE: odesílatel vždy nedává a přijímač vždy odmítá. Tento PBE není Pareto efektivní, ale to je nevyhnutelné, protože odesílatel nemůže spolehlivě signalizovat jejich typ.
Dárková hra 2
V následujícím příkladu je sada PBE přísně menší než sada SPE a BNE. Jedná se o variantu výše uvedené dárkové hry s následující změnou v nástroji přijímače:
- Pokud je odesílatel přítel, je obslužný program příjemce 1 (pokud přijme) nebo 0 (pokud odmítne).
- Pokud je odesílatel nepřítel, pak je to nástroj přijímače 0 (pokud přijmou) nebo -1 (pokud odmítnou).
Upozorňujeme, že v této variantě je přijetí a dominantní strategie pro přijímač.
Podobně jako v příkladu 1 neexistuje separační rovnováha. Podívejme se na následující potenciální sdružovací rovnováhy:
- Strategie odesílatele je: vždy dávat. Víry příjemce nejsou aktualizovány: stále věří v apriorní pravděpodobnost, že odesílatel je přítel s pravděpodobností a nepřítel s pravděpodobností . Jejich výplata z přijetí je vždy vyšší než z odmítnutí, takže přijímají (bez ohledu na hodnotu ). Toto je PBE - je to nejlepší reakce pro odesílatele i příjemce.
- Strategie odesílatele je: nikdy nedávat. Předpokládejme, že při přijímání daru víra příjemce je, že odesílatel je s největší pravděpodobností přítel , kde je libovolné číslo v . Bez ohledu na , optimální strategie příjemce je: přijmout. Toto NENÍ PBE, protože odesílatel může zlepšit svou výplatu z 0 na 1 tím, že dá dárek.
- Strategie odesílatele je: nikdy nedávat a strategie příjemce: odmítnout. Toto NENÍ PBE, protože pro žádný víra přijímače, odmítnutí není nejlepší odpovědí.
Všimněte si, že možnost 3 je Nashova rovnováha! Ignorujeme-li přesvědčení, lze odmítnutí považovat za nejlepší reakci pro příjemce, protože to nemá vliv na jejich výplatu (protože stejně neexistuje žádný dar). Možnost 3 je navíc dokonce SPE, protože jedinou subgame je celá hra! Taková nepravděpodobná rovnováha může nastat i ve hrách s úplnými informacemi, ale lze je eliminovat aplikací subgame dokonalá Nashova rovnováha. Bayesiánské hry však často obsahují jiné než jednotlivé sady informací a od té doby podhry musí obsahovat kompletní sady informací, někdy existuje pouze jedna dílčí hra - celá hra - a tak je každá Nashova rovnováha triviálně dokonalá. I když hra má více než jednu podhru, neschopnost dokonalosti podhry proříznout soubory informací může mít za následek vyloučení nepravděpodobné rovnováhy.
Abych to shrnul: v této variantě dárkové hry existují dvě SPE: buď odesílatel vždy dává a příjemce vždy přijímá, nebo odesílatel vždy nedává a příjemce vždy odmítá. Z nich je pouze první PBE; druhý není PBE, protože nemůže být podporován žádným systémem víry.
Další příklady
Další příklady viz signalizační hra # Příklady. Viz také [2] pro více příkladů.
PBE ve vícestupňových hrách
A vícestupňová hra je sled simultánních her hraných jeden po druhém. Tyto hry mohou být identické (jako v opakované hry ) nebo jiné.
Opakovaná veřejně dobrá hra
Stavět | Ne | |
Stavět | 1-C1, 1-C2 | 1-C1, 1 |
Ne | 1, 1-C2 | 0,0 |
Veřejná dobrá hra |
Následující hra[3]:oddíl 6.2 je jednoduchá reprezentace problém s jezdcem. Existují dva hráči, z nichž každý může buď postavit veřejné dobro nebo nestavět. Každý hráč získá 1, pokud je vybudován veřejný statek, a 0, pokud ne; navíc, pokud hráč buduje veřejné blaho, musí platit náklady . Náklady jsou soukromé informace - každý hráč zná své vlastní náklady, ale ne náklady druhého. Je známo pouze to, že každá cena je náhodně čerpána nezávisle z nějakého rozdělení pravděpodobnosti. Díky tomu je tato hra a Bayesiánská hra.
V jednostupňové hře staví každý hráč pouze a jen za předpokladu, že jeho cena je menší než očekávaný zisk ze stavby. Očekávaný zisk z budovy je přesně 1krát větší pravděpodobnost, že druhý hráč NEBUDE stavět. V rovnováze, pro každého hráče , existuje prahová cena , takže hráč přispívá pouze a jen tehdy, pokud jsou jeho náklady nižší než . Tuto prahovou cenu lze vypočítat na základě rozdělení pravděpodobnosti nákladů hráčů. Například pokud jsou náklady rozděleny rovnoměrně na , pak existuje symetrická rovnováha, ve které je prahová cena obou hráčů 2/3. To znamená, že hráč, jehož cena je mezi 2/3 a 1, nepřispěje, i když jeho cena je nižší než výhoda, kvůli možnosti, že přispěje druhý hráč.
Nyní předpokládejme, že se tato hra opakuje dvakrát.[3]:oddíl 8.2.3 Tyto dvě hry jsou nezávislé, tj. Každý den se hráči současně rozhodují, zda v ten den vybudují veřejné statky, získají výplatu 1, pokud je statek postaven v ten den, a zaplatí své náklady, pokud v ten den stavěli. Jediným spojením mezi hrami je to, že hraním prvního dne mohou hráči odhalit některé informace o svých nákladech a tyto informace mohou ovlivnit hraní druhého dne.
Hledáme symetrický PBE. Označit podle prahová cena obou hráčů v den 1 (takže v den 1 každý hráč vytvoří if-only-pokud je jejich cena nejvýše ). Vypočítat , pracujeme zpětně a analyzujeme akce hráčů v den 2. Jejich akce závisí na historii (= dvě akce v den 1) a existují tři možnosti:
- V den 1 nebyl postaven žádný hráč. Nyní tedy oba hráči vědí, že cena jejich soupeře je vyšší . Podle toho aktualizují svou víru a docházejí k závěru, že existuje menší šance, že se jejich soupeř postaví v den 2. Proto zvyšují své prahové náklady a prahové náklady v den 2 jsou .
- V den 1 postavili oba hráči. Nyní tedy oba hráči vědí, že cena jejich soupeře je nižší . Podle toho aktualizují svou víru a dospějí k závěru, že existuje větší šance, že se jejich oponent postaví v den 2. Proto snižují své prahové náklady a prahové náklady v den 2 jsou .
- V den 1 postavil přesně jeden hráč; Předpokládejme, že je to hráč 1. Takže nyní je známo, že cena hráče 1 je nižší a cena hráče 2 je výše . Existuje rovnováha, ve které jsou akce v den 2 stejné jako akce v den 1 - hráč 1 staví a hráč 2 nestaví.
Je možné vypočítat očekávanou výplatu „prahového hráče“ (hráče s cenou přesně ) v každé z těchto situací. Vzhledem k tomu, že prahový hráč by měl být lhostejný mezi přispíváním a nepřispíváním, je možné vypočítat prahovou cenu za den 1 . Ukazuje se, že tato prahová hodnota je dolní než - práh v jednostupňové hře. To znamená, že ve dvoustupňové hře jsou hráči méně ochotni stavět než v jednostupňové hře. Důvodem je intuitivní důvod, že když hráč nepřispěje první den, přiměje druhého hráče, aby věřil, že jeho cena je vysoká, a díky tomu je druhý hráč ochotnější přispět druhý den.
Skokové nabídky
V otevřeném výkřiku Anglická aukce, mohou uchazeči zvýšit aktuální cenu malými kroky (např. pokaždé v 1 USD). Často však existuje skočit přihazování - někteří uchazeči zvýší aktuální cenu mnohem více než minimální přírůstek. Jedním z vysvětlení je, že slouží jako signál ostatním uchazečům. Existuje PBE, ve kterém každý uchazeč skáče pouze a jen - pokud je jeho hodnota nad určitou prahovou hodnotou. Vidět Přeskočit nabídku # signalizace.
Viz také
- Sekvenční rovnováha - zdokonalení PBE, které omezuje víry, které lze přiřadit k nerovnovážným informačním sadám, na „rozumné“.
- Intuitivní kritérium a Božská rovnováha - další vylepšení PBE, specifická pro signalizační hry.
Reference
- ^ James Peck. „Perfect Bayesian Equilibrium“ (PDF). Ohio State University. Citováno 2. září 2016.
- ^ Zack Grossman. „Perfect Bayesian Equilibrium“ (PDF). University of California. Citováno 2. září 2016.
- ^ A b Fudenberg, Drew; Tirole, Jean (1991). Herní teorie. Cambridge, Massachusetts: MIT Stiskněte. ISBN 9780262061414. Náhled knihy.