Teorie kauzálního rozhodování - Causal decision theory

Teorie kauzálního rozhodování je matematická teorie určená k určení souboru racionální volby v dané situaci. Je to myšlenkový směr teorie rozhodování. V neformálním smyslu tvrdí, že racionální volba je ta nejlepší očekávaný kauzální důsledky. Tato teorie je často v kontrastu s teorie důkazního rozhodování, která doporučuje akce, které poskytují nejlepší očekávaný výsledek, za předpokladu, že získáte nejlepší důkazy o světě.

Neformální popis

Teorie kauzálního rozhodnutí neformálně agentovi doporučuje, aby učinil rozhodnutí s nejlépe očekávanými kauzálními důsledky. Například: pokud konzumace jablka způsobí, že budete šťastní a konzumace pomeranče způsobí smutek, bylo by rozumné jablko konzumovat. Jednou z komplikací je představa očekávaný příčinné důsledky. Představte si, že když budete jíst dobré jablko, budete šťastní a když budete jíst špatné jablko, budete smutní, ale nejste si jisti, zda je jablko dobré nebo špatné. V tomto případě neznáte příčinné účinky konzumace jablka. Místo toho pak pracujete z očekávaný kauzální účinky, kde tyto budou záviset na třech věcech: (1) jak pravděpodobné si myslíte, že jablko je dobré a jak pravděpodobné si myslíte, že je špatné; (2) jak šťastná je konzumace dobrého jablka; a (3) to, jak tě smutné jíst špatné jablko dělá. Teorie kauzálního rozhodnutí neformálně radí agentovi, aby učinil rozhodnutí s nejlepšími očekávanými kauzálními účinky.

Formální popis

V článku z roku 1981 Allan Gibbard a William Harper vysvětlili teorii kauzálního rozhodnutí jako maximalizaci očekávané užitečnosti akce "vypočteno z pravděpodobností srovnávací údaje ":[1]

kde je žádoucí výsledek a je kontrafaktuální pravděpodobnost, že pokud byly tedy hotové bude držet.

Rozdíl od důkazní teorie rozhodování

David Lewis dokázal[2] že pravděpodobnost podmíněného ne vždy se rovná podmíněné pravděpodobnosti .[3] Pokud by tomu tak bylo, teorie kauzálního rozhodování by byla ekvivalentní teorii důkazního rozhodování, která využívá podmíněné pravděpodobnosti.

Gibbard a Harper ukázali, že pokud přijmeme dva axiomy (jeden souvisí s kontroverzním princip podmíněného vyloučeného středu[4]), poté statistická nezávislost z a to stačí k zajištění toho . Existují však případy, kdy akce a podmínky nejsou nezávislé. Gibbard a Harper dávají příklad, kdy král David chce Batšabu, ale obává se, že její svolání by vyvolalo vzpouru.

David dále studoval práce z psychologie a politologie, které ho učí následujícím: Králové mají dva typy osobnosti, charismatický a necharismatický. Královská míra charismatu závisí na jeho genetickém složení a zkušenostech z raného dětství a nelze jej v dospělosti změnit. Nyní mají charismatičtí králové tendenci jednat spravedlivě a charismatičtí králové neprávem. Úspěšné vzpoury proti charismatickým králům jsou vzácné, zatímco úspěšné vzpoury proti charismatickým králům jsou časté. Nespravedlivé činy samy o sobě nezpůsobují úspěšné vzpoury; důvodem, proč jsou charismatičtí králové náchylní k úspěšným vzpourám, je to, že mají záludné a nepoctivé chování. David neví, zda je či není charismatický; ví, že je nespravedlivé poslat pro manželku jiného muže. (str. 164)

V tomto případě teorie důkazního rozhodování doporučuje, aby se David zdržel Batšeby, zatímco teorie kauzálního rozhodování - s tím, že ať je David charismatický nebo charismatický, nelze změnit - doporučuje poslat pro ni.

Když se vyžaduje, aby si vybrali mezi teorií kauzálního rozhodování a evidenční teorií rozhodování, filozofové obvykle preferují teorii kauzálního rozhodování.[5]

Kritika

Neurčitost

Teorie teorie kauzálního rozhodnutí (CDT) sama o sobě nespecifikuje, jaký algoritmus se má použít k výpočtu pravděpodobností hypotetické hypotézy.[4] Jedním z návrhů je „zobrazovací“ technika navržená Lewisem:[6] Vyhodnotit , přesuňte pravděpodobnostní hmotu z každého možného světa do nejbližšího možného světa ve kterém drží, za předpokladu je možné. Tento postup však vyžaduje, abychom věděli, čemu bychom věřili, kdybychom si byli jisti ; to je samo o sobě podmínka, které bychom mohli přiřadit pravděpodobnost menší než 1, což by vedlo k regresi.[4]

Protiklady

Existuje nespočet „protikladů“, kde přímá aplikace CDT nepřináší obhájitelně „rozumné“ rozhodnutí. Filozof Andy Egan tvrdí, že je to kvůli zásadnímu rozpojení mezi intuitivním racionálním pravidlem „udělejte to, co očekáváte, že přinese nejlepší výsledky“ a algoritmus CDT „udělejte vše, co má nejlepší očekávaný výsledek, přičemž jsme si uchovali své původní názory na pravděpodobná kauzální struktura světa. “ Z tohoto pohledu je požadavek společnosti CDT „udržet pevnou bezpodmínečnou důvěryhodnost agenta v hypotézách závislosti“, který vede k iracionálním rozhodnutím.[7]

Prvotním údajným protikladem je Newcombův problém. Protože váš výběr jednoho nebo dvou políček nemůže kauzálně ovlivnit odhad Prediktora, teorie kauzálního rozhodnutí doporučuje strategii dvou boxů.[1] To však má za následek získání pouze 1 000 $, ne 1 000 000 $. Filozofové nesouhlasí s tím, zda je „racionální“ strategie boxování v boxech nebo boxování v boxech.[8] Podobné obavy mohou vyvstat i při zdánlivě přímých problémech, jako je vězňovo dilema,[9] zvláště když hrajete proti svému „dvojčeti“, jehož volba spolupráce nebo defektu silně koreluje, ale není způsobena vaší vlastní volbou.[10]

Ve scénáři „Smrt v Damašku“ předpovídá antropomorfní „Smrt“, kde zítra budete, a tam na vás čeká. Stejně jako v Newcombově problému předpokládáme, že smrt je spolehlivým prediktorem. Agent CDT by nebyl schopen zpracovat korelaci a v důsledku toho by mohl učinit iracionální rozhodnutí:[7][11][12] „Raději byste měli hrát na schovávanou proti někomu, kdo nedokáže předpovědět, kde se schováváte, než proti někomu, kdo to dokáže. Teorie kauzálního rozhodnutí to popírá. Takže teorie kauzálního rozhodnutí je falešná.“[13]

Dalším nedávným protikladem je tlačítko „Psychopat“:[7][14]

Paul diskutuje o tom, zda stisknout tlačítko „zabít všechny psychopaty“. Myslí si, že by bylo mnohem lepší žít ve světě bez psychopatů. Paul je bohužel docela přesvědčen, že takové tlačítko stiskne pouze psychopat. Paul velmi upřednostňuje život ve světě s psychopaty před smrtí. Měl by Paul stisknout tlačítko?

Podle Egana „skoro všichni“ souhlasí s tím, že Paul by neměl tlačítko stisknout, přesto CDT jeho stisknutí podporuje.[7]

Filozof Jim Joyce, možná nejvýznamnější moderní obránce CDT,[15] tvrdí, že CDT je ​​přirozeně schopna vzít v úvahu jakoukoli „informaci o tom, k čemu má někdo sklon nebo co by mohl udělat jako důkaz“. Tato interpretace CDT by vyžadovala řešení dalších otázek: Jak může agent CDT zabránit tomu, aby narazil na víru související s vlastními budoucími činy, a stal se tak prokazatelně nekonzistentním prostřednictvím Gödelianova neúplnost a Löbova věta ? Jak se agent stojící na útesu vyhýbá závěru, že kdyby skočil, měl by pravděpodobně padák, který by zlomil jeho pád?[16][17]

Alternativy k teorii kauzálního a důkazního rozhodování

Někteří vědci se domnívají, že novou teorii rozhodování je třeba budovat od základů. Filozof Christopher Meacham navrhuje „Cohesive Expected Utility Maximization“: Agent „by měl provést akt vybraný komplexní strategií, která maximalizuje soudržný očekávaný užitek“. Meacham také navrhuje, že toto může být rozšířeno na „Global Cohesive Expected Utility Maximization“, aby bylo povoleno nadřazenost stylová spolupráce mezi agenty.[18][19] V souvislosti s AI navrhuje průkopník bitcoinů Wei Dai „teorii rozhodování bez aktualizace“, která ke globálně soudržným mechanismům přidává nepochybně obtížný koncept „logických kontrafaktů“, aby nedocházelo k vydírání:[18]

Zvažte agenta, který by zaplatil v reakci na kontrafaktuální vydírání. Vyděrač by to předpověděl a vydíral agenta. Místo toho teď zvažte agenta, který by odmítl zaplatit v reakci na kontrafaktuální vydírání ... Vyděrač by to předpověděl také, a tak by agenta nevydíral. Pokud tedy budujeme agenta, který by se mohl setkat s kontrafaktním vydíráním, pak je lepší celkovou politikou postavit agenta, který by při vydírání tímto způsobem odmítl zaplatit.

Je otevřenou otázkou, zda existuje uspokojivá formalizace logických kontrafaktů.[20][21]

Viz také

Poznámky

  1. ^ A b Gibbard, A .; Harper, W.L. (1981), „Counterfactuals and two kinds of expect utility“, Ifs: Podmíněné podmínky, přesvědčení, rozhodnutí, šance a čas: 153–190
  2. ^ Lewis, D. (1976), "Pravděpodobnosti podmíněných a podmíněných pravděpodobností", Filozofický přehled, 85 (3): 297–315, doi:10.2307/2184045, JSTOR  2184045
  3. ^ Ve skutečnosti Lewis prokázal silnější výsledek: „pokud je třída pravděpodobnostních funkcí uzavřena za podmínky podmínění, pak pro tuto třídu nemůže existovat podmínka pravděpodobnosti, pokud tato třída sestává zcela z triviálních funkcí pravděpodobnosti,“ kde a triviální pravděpodobnostní funkce je ten, který „nikdy nepřisuzuje kladnou pravděpodobnost více než dvěma nekompatibilním alternativám, a proto má maximálně čtyři hodnoty [...].“
  4. ^ A b C Shaffer, Michael John (2009), „Theory Theory, Intelligent Planning and Counterfactuals“, Mysl a stroje, 19 (1): 61–92, doi:10.1007 / s11023-008-9126-2
  5. ^ Weirich, Paul, „The Causal Decision Theory“, Stanfordská encyklopedie filozofie (vydání zima 2016), Edward N. Zalta (ed.), URL = platón.stanford.edu/archiv/ win2016/ záznamů/ kauzální rozhodnutí/
  6. ^ Lewis, D. (1981), „Teorie kauzálního rozhodnutí“ (PDF), Australasian Journal of Philosophy, 59 (1): 5–30, doi:10.1080/00048408112340011, vyvoláno 2009-05-29
  7. ^ A b C d Egan, A. (2007), „Některé protipříklady teorie kauzálního rozhodnutí“ (PDF), Filozofický přehled, 116 (1): 93–114, CiteSeerX  10.1.1.642.5936, doi:10.1215/00318108-2006-023, archivovány z originál (PDF) dne 11.03.2017, vyvoláno 2017-07-27
  8. ^ Bellos, Alex (28. listopadu 2016). „Newcombův problém rozděluje filozofy. Na které straně jsi?“. Opatrovník. Citováno 27. července 2017.
  9. ^ Lewis, D. (1979), „Dilema vězňů je problém Newcombů“, Filozofie a veřejné záležitosti, 8 (3): 235–240, JSTOR  2265034
  10. ^ Howard, J. V. (květen 1988). „Spolupráce v dilematu vězně“. Teorie a rozhodnutí. 24 (3): 203–213. doi:10.1007 / BF00148954.
  11. ^ Meacham, Christopher JG. „Vazba a její důsledky.“ Filozofické studie 149.1 (2010): 49-71.
  12. ^ Harper, William (leden 1984). „Ratifikovatelnost a teorie kauzálního rozhodnutí: Komentáře k Eellsovi a Seidenfeldovi“. PSA: Sborník z bienále Setkání asociace filozofie vědy. 1984 (2): 213–228. doi:10.1086 / psaprocbienmeetp.1984.2.192506.
  13. ^ Ahmed, A. (1. září 2014). "Kostky se smrtí". Analýza. 74 (4): 587–592. doi:10.1093 / analys / anu084.
  14. ^ Škvarky, Hilary. „Teorie epistemického rozhodování.“ Mind 122,488 (2013): 915-952.
  15. ^ Wedgwood, Ralph. „Gandalfovo řešení problému Newcomb.“ Synthese (2013): 1-33.
  16. ^ Weirich, Paul, „The Causal Decision Theory“, Stanfordská encyklopedie filozofie (vydání zima 2016), Edward N. Zalta (ed.), URL = platón.stanford.edu/archiv/ win2016/ záznamů/ kauzální rozhodnutí/
  17. ^ Joyce, James M. „Lituji a nestability v teorii kauzálního rozhodování.“ Synthese 187.1 (2012): 123-145.
  18. ^ A b Soares, Nate a Benja Fallenstein. „Směrem k idealizované teorii rozhodování.“ Výzkumný ústav strojové inteligence. 2014.
  19. ^ Meacham, Christopher JG. „Vazba a její důsledky.“ Filozofické studie 149,1 (2010): 49-71.
  20. ^ Nate Soares a Benja Fallenstein. Protiklady podle potřeby pro teorii rozhodování. In Artificial General Intelligence. Springer, 2015.
  21. ^ Everitt, Tom, Jan Leike a Marcus Hutter. „Sekvenční rozšíření teorie kauzálního a důkazního rozhodování.“ Mezinárodní konference o teorii algoritmického rozhodování. Springer, Cham, 2015.

externí odkazy