Důvěryhodný interval - Credible interval
v Bayesovské statistiky, a důvěryhodný interval je interval ve kterém nepozorovaně parametr hodnota klesá s konkrétním pravděpodobnost. Jedná se o interval v doméně a zadní rozdělení pravděpodobnosti nebo a prediktivní distribuce.[1] Zobecnění na vícerozměrné problémy je důvěryhodný region. Důvěryhodné intervaly jsou analogické k intervaly spolehlivosti v časté statistiky,[2] i když se liší na filozofickém základě:[3] Bayesovské intervaly považují své hranice za pevné a odhadovaný parametr jako náhodnou proměnnou, zatímco intervaly spolehlivosti časté považují své hranice za náhodné proměnné a parametr za pevnou hodnotu. Bayesovské důvěryhodné intervaly také využívají (a skutečně vyžadují) znalosti specifické pro danou situaci předchozí distribuce, zatímco časté intervaly spolehlivosti ne.
Například v experimentu, který určuje distribuci možných hodnot parametru , pokud subjektivní pravděpodobnost že leží mezi 35 a 45 je 0,95, pak je 95% důvěryhodný interval.
Výběr důvěryhodného intervalu
Důvěryhodné intervaly nejsou při zadním rozdělení jedinečné. Metody pro definování vhodného důvěryhodného intervalu zahrnují:
- Výběr nejužšího intervalu, který pro a unimodální distribuce bude zahrnovat výběr těch hodnot s nejvyšší hustotou pravděpodobnosti, včetně režimu (dále jen maximálně a posteriori ). Toto se někdy nazývá nejvyšší interval zadní hustoty (HPDI).
- Volba intervalu, kde je pravděpodobnost, že bude pod intervalem, stejně pravděpodobná jako nad ním. Tento interval bude zahrnovat medián. Toto se někdy nazývá rovnoměrný interval.
- Za předpokladu, že průměr existuje, výběr intervalu, pro který znamenat je ústředním bodem.
Je možné zarámovat výběr důvěryhodného intervalu uvnitř teorie rozhodování a v tomto kontextu bude optimální interval vždy nejvyšší hustotou pravděpodobnosti.[4]
Kontrastuje s intervalem spolehlivosti
Častý 95% interval spolehlivosti znamená, že u velkého počtu opakovaných vzorků by 95% takto vypočítaných intervalů spolehlivosti zahrnovalo skutečnou hodnotu parametru. Parametrem je často pevný (nelze považovat za distribuci možných hodnot) a interval spolehlivosti je náhodný (záleží na náhodném vzorku).
Bayesovské důvěryhodné intervaly se mohou od intervalů spolehlivosti často lišit ze dvou důvodů:
- důvěryhodné intervaly obsahují kontextové informace specifické pro daný problém z předchozí distribuce vzhledem k tomu, že intervaly spolehlivosti vycházejí pouze z údajů;
- důvěryhodné intervaly a intervaly spolehlivosti zacházejí obtěžující parametry radikálně odlišnými způsoby.
Pro případ jediného parametru a dat, která lze shrnout do jediného dostatečná statistika, lze ukázat, že důvěryhodný interval a interval spolehlivosti vůle shodovat, pokud je neznámý parametr a parametr umístění (tj. funkce dopředné pravděpodobnosti má formu ), s prioritou, která je rovnoměrné ploché rozdělení;[5] a také pokud je neznámý parametr a parametr měřítka (tj. funkce dopředné pravděpodobnosti má formu ), s Jeffreysův prior [5] - druhý z následujících důvodů, protože logaritmus takového parametru měřítka jej promění v parametr umístění s rovnoměrným rozložením. Jedná se však o zřetelně zvláštní (i když důležité) případy; obecně takovou rovnocennost nelze provést.
Reference
- ^ Edwards, Ward, Lindman, Harold, Savage, Leonard J. (1963) „Bayesovský statistický závěr v psychologickém výzkumu“. Psychologický přehled, 70, 193-242
- ^ Lee, P.M. (1997) Bayesian Statistics: An IntroductionArnold. ISBN 0-340-67785-6
- ^ „Frequentism and Bayesianism“.
- ^ O'Hagan, A. (1994) Kendall's Advanced Theory of Statistics, Vol 2B, Bayesian Inference, Oddíl 2.51. Arnold, ISBN 0-340-52922-9
- ^ A b Jaynes, E. T. (1976). "Intervaly spolehlivosti vs Bayesovské intervaly ", v Základy teorie pravděpodobnosti, statistické inference a statistické teorie vědy(W. L. Harper a C. A. Hooker, eds.), Dordrecht: D. Reidel, str. 175 a další
Další čtení
- Morey, R. D .; Hoekstra, R .; Rouder, J. N .; Lee, M. D .; Wagenmakers, E.-J. (2016). „Klam vkládání důvěry do intervalů spolehlivosti“. Psychonomic Bulletin & Review. 23 (1): 103–123. doi:10,3758 / s13423-015-0947-8. PMC 4742505. PMID 26450628.