Lindleyův paradox - Lindleys paradox - Wikipedia
Lindleyův paradox je neintuitivní situace v statistika ve kterém Bayesian a častý přístupy k a testování hypotéz problém dát různé výsledky pro určité volby předchozí distribuce. Problém neshody mezi těmito dvěma přístupy byl diskutován v Harold Jeffreys „Učebnice z roku 1939;[1] později se stal známým jako Lindleyův paradox Dennis Lindley nazval nesouhlas a paradox v papíru z roku 1957.[2]
Ačkoli se označuje jako a paradoxlze odlišit výsledky Bayesovského a frekventovaného přístupu tím, že je použijeme k zodpovězení zásadně odlišných otázek, spíše než ke skutečnému nesouhlasu mezi těmito dvěma metodami.
Nicméně u velké třídy předních jsou rozdíly mezi frekventovaným a bayesovským přístupem způsobeny udržováním pevné úrovně významnosti: jak dokonce Lindley uznal, „teorie neospravedlňuje praxi udržování pevné úrovně významnosti“ a dokonce „některé výpočty profesora Pearsona v diskusi k tomuto článku zdůraznily, jak by se úroveň významnosti musela měnit s velikostí vzorku, pokud by byly ztráty a předchozí pravděpodobnosti udržovány pevné. ''[2] Ve skutečnosti, pokud se kritická hodnota zvyšuje s velikostí vzorku vhodně rychle, pak se neshoda mezi častým a bayesovským přístupem stává zanedbatelnou, jak se velikost vzorku zvyšuje.[3]
Popis paradoxu
Výsledek experimentu má dvě možná vysvětlení, hypotézy a a některé předchozí distribuce představující nejistotu ohledně toho, která hypotéza je přesnější, než se zohlední .
Lindleyův paradox nastane, když
- Výsledek je „významný“ podle testu prováděného často , což naznačuje dostatečné důkazy k odmítnutí řekněme na 5% úrovni a
- The zadní pravděpodobnost z daný je vysoká, což naznačuje silné důkazy o tom je v lepší shodě s než .
Tyto výsledky mohou nastat současně je velmi konkrétní, více rozptýlené a předchozí distribuce silně neupřednostňuje jedno nebo druhé, jak je vidět níže.
Numerický příklad
Následující numerický příklad ilustruje Lindleyův paradox. V určitém městě se za určité časové období narodilo 49 581 chlapců a 48 870 dívek. Pozorovaný podíl narozených mužů je tedy 49 581/98 451 ≈ 0,5036. Předpokládáme, že podíl narozených mužů je a binomická proměnná s parametrem . Máme zájem otestovat, zda je 0,5 nebo jiná hodnota. To znamená, že naše nulová hypotéza je a alternativa je .
Častý přístup
Častý přístup k testování je vypočítat a p-hodnota, pravděpodobnost pozorování zlomku chlapců minimálně stejně velkých jako za předpokladu je pravda. Protože je počet porodů velmi vysoký, můžeme použít a normální aproximace za zlomek narozených mužů , s a , vypočítat
Byli bychom stejně překvapeni, kdybychom viděli 49 581 narozených žen, tj. , takže frekventant by obvykle provedl a oboustranný test, pro který by byla p-hodnota . V obou případech je hodnota p nižší než úroveň významnosti α, 5%, takže častý přístup odmítá protože nesouhlasí s pozorovanými údaji.
Bayesovský přístup
Za předpokladu, že není důvod upřednostňovat jednu hypotézu před druhou, by Bayesiánský přístup spočíval v přiřazení předchozích pravděpodobností a jednotné rozdělení do pod a poté vypočítat zadní pravděpodobnost použitím Bayesova věta,
Po pozorování chlapci ven narození, můžeme vypočítat zadní pravděpodobnost každé hypotézy pomocí funkce pravděpodobnostní hmotnosti pro binomickou proměnnou,
kde je Funkce Beta.
Z těchto hodnot zjistíme zadní pravděpodobnost , což silně upřednostňuje přes .
Zdá se, že dva přístupy - Bayesian a Frequist - jsou v konfliktu, a to je „paradox“.
Sladění bayesovských a frekventovaných přístupů
Alespoň v Lindleyově příkladu, vezmeme-li posloupnost úrovní významnosti, αn, takový, že αn = n−k s k > 1/2, pak zadní pravděpodobnost nuly konverguje k 0, což je v souladu s odmítnutím nuly.[3] V tomto číselném příkladu vezmeme k = 1/2, má za následek hladinu významnosti 0,00318, takže frekventant by neodmítl nulovou hypotézu, což je zhruba v souladu s bayesovským přístupem.

Pokud použijeme neinformativní předchozí a otestovat hypotézu podobnou té v častém přístupu, paradox zmizí.
Například pokud vypočítáme zadní rozdělení pomocí jednotné předchozí distribuce dne (tj. ), shledáváme
Použijeme-li to ke kontrole pravděpodobnosti, že novorozenec bude s větší pravděpodobností chlapec než dívka, tj. , shledáváme
Jinými slovy, je velmi pravděpodobné, že podíl narozených mužů je vyšší než 0,5.
Ani jedna z analýz neposkytuje odhad velikost efektu přímo, ale oba lze použít k určení například toho, zda je pravděpodobné, že podíl porodů chlapců bude nad určitou hranicí.
Chybějící skutečný paradox
![]() | Tato část obsahuje a seznam doporučení, související čtení nebo externí odkazy, ale její zdroje zůstávají nejasné, protože jí chybí vložené citace.Červenec 2012) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Zjevný nesouhlas mezi těmito dvěma přístupy je způsoben kombinací faktorů. Za prvé, častý přístup nad testy bez odkazu na . Bayesovský přístup hodnotí jako alternativa k , a shledává první, která lépe souhlasí s pozorováním. Je to proto, že druhá hypotéza je mnohem rozptýlenější může být kdekoli , což má za následek velmi nízkou zadní pravděpodobnost. Abychom pochopili proč, je užitečné považovat tyto dvě hypotézy za generátory pozorování:
- Pod , vybíráme si , a zeptejte se, jak je pravděpodobné, že uvidíte 49 581 chlapců v 98 451 porodech.
- Pod , vybíráme si náhodně odkudkoli v rozmezí 0 až 1 a položit stejnou otázku.
Většina možných hodnot pro pod jsou velmi špatně podporována pozorováním. V zásadě zjevný nesouhlas mezi metodami vůbec není neshodou, ale spíše dvěma různými výroky o tom, jak hypotézy souvisejí s údaji:
- Častý to zjistí je špatné vysvětlení pozorování.
- Bayesian to zjistil je mnohem lepším vysvětlením pozorování než .
Poměr pohlaví novorozenců je podle testu frekventanta nepravděpodobně 50/50 muž / žena. Přesto 50/50 je lepší aproximace než většina ostatních, ale ne Všechno, jiné poměry. Hypotéza by vyhovovalo pozorování mnohem lépe než téměř všechny ostatní poměry, včetně .
Například tato volba hypotéz a předchozích pravděpodobností implikuje tvrzení: „pokud > 0,49 a <0,51, pak předchozí pravděpodobnost být přesně 0,5 je 0,50 / 0,51 98%. “Vzhledem k takové silné preferenci pro , je snadné pochopit, proč je bayesovský přístup upřednostňován tváří v tvář , i když pozorovaná hodnota lži od 0,5. Odchylka více než 2 sigma od je považován za významný v frekventovaném přístupu, ale jeho význam je potlačen předchozím v Bayesianském přístupu.
Podíváme-li se na to jiným způsobem, vidíme, že předchozí distribuce je v podstatě plochá s delta funkcí na . Je zřejmé, že je to pochybné. Ve skutečnosti, pokud byste si měli představovat reálná čísla jako spojitá, pak by bylo logičtější předpokládat, že by bylo nemožné, aby jakékoli dané číslo bylo přesně hodnotou parametru, tj. Měli bychom předpokládat P (theta = 0,5) = 0.
Realističtější distribuce pro v alternativní hypotéze vytváří méně překvapivý výsledek pro zadní část . Například pokud nahradíme s , tj odhad maximální věrohodnosti pro , zadní pravděpodobnost by bylo jen 0,07 ve srovnání s 0,93 pro (Samozřejmě nelze ve skutečnosti použít MLE jako součást předchozí distribuce).
Nedávná diskuse
Paradox je i nadále zdrojem aktivní diskuse.[3][4][5][6]
Viz také
Poznámky
- ^ Jeffreys, Harold (1939). Teorie pravděpodobnosti. Oxford University Press. PAN 0000924.
- ^ A b Lindley, D.V. (1957). "Statistický paradox". Biometrika. 44 (1–2): 187–192. doi:10.1093 / biomet / 44.1-2.187. JSTOR 2333251.
- ^ A b C Naaman, Michael (01.01.2016). „Testování hypotéz a řešení paradoxu Jeffreys-Lindley téměř jisté“. Elektronický statistický věstník. 10 (1): 1526–1550. doi:10.1214 / 16-EJS1146. ISSN 1935-7524.
- ^ Spanos, Aris (2013). „Kdo by se měl bát paradoxu Jeffreys-Lindley?“. Filozofie vědy. 80.1: 73–93. doi:10.1086/668875.
- ^ Sprenger, Jan (2013). „Testování přesné nulové hypotézy: Případ Lindleyova paradoxu“ (PDF). Filozofie vědy. 80: 733–744. doi:10.1086/673730.
- ^ Robert, Christian P. (2014). „Na paradox Jeffreys-Lindley“. Filozofie vědy. 81.2: 216–232. arXiv:1303.5973. doi:10.1086/675729.
Další čtení
- Shafer, Glenn (1982). „Lindleyův paradox“. Journal of the American Statistical Association. 77 (378): 325–334. doi:10.2307/2287244. JSTOR 2287244. PAN 0664677.