Důvěryhodný interval - Credible interval

v Bayesovské statistiky, a důvěryhodný interval je interval ve kterém nepozorovaně parametr hodnota klesá s konkrétním pravděpodobnost. Jedná se o interval v doméně a zadní rozdělení pravděpodobnosti nebo a prediktivní distribuce.[1] Zobecnění na vícerozměrné problémy je důvěryhodný region. Důvěryhodné intervaly jsou analogické k intervaly spolehlivosti v časté statistiky,[2] i když se liší na filozofickém základě:[3] Bayesovské intervaly považují své hranice za pevné a odhadovaný parametr jako náhodnou proměnnou, zatímco intervaly spolehlivosti časté považují své hranice za náhodné proměnné a parametr za pevnou hodnotu. Bayesovské důvěryhodné intervaly také využívají (a skutečně vyžadují) znalosti specifické pro danou situaci předchozí distribuce, zatímco časté intervaly spolehlivosti ne.

Například v experimentu, který určuje distribuci možných hodnot parametru , pokud subjektivní pravděpodobnost že leží mezi 35 a 45 je 0,95, pak je 95% důvěryhodný interval.

Výběr důvěryhodného intervalu

Důvěryhodné intervaly nejsou při zadním rozdělení jedinečné. Metody pro definování vhodného důvěryhodného intervalu zahrnují:

  • Výběr nejužšího intervalu, který pro a unimodální distribuce bude zahrnovat výběr těch hodnot s nejvyšší hustotou pravděpodobnosti, včetně režimu (dále jen maximálně a posteriori ). Toto se někdy nazývá nejvyšší interval zadní hustoty (HPDI).
  • Volba intervalu, kde je pravděpodobnost, že bude pod intervalem, stejně pravděpodobná jako nad ním. Tento interval bude zahrnovat medián. Toto se někdy nazývá rovnoměrný interval.
  • Za předpokladu, že průměr existuje, výběr intervalu, pro který znamenat je ústředním bodem.

Je možné zarámovat výběr důvěryhodného intervalu uvnitř teorie rozhodování a v tomto kontextu bude optimální interval vždy nejvyšší hustotou pravděpodobnosti.[4]

Kontrastuje s intervalem spolehlivosti

Častý 95% interval spolehlivosti znamená, že u velkého počtu opakovaných vzorků by 95% takto vypočítaných intervalů spolehlivosti zahrnovalo skutečnou hodnotu parametru. Parametrem je často pevný (nelze považovat za distribuci možných hodnot) a interval spolehlivosti je náhodný (záleží na náhodném vzorku).

Bayesovské důvěryhodné intervaly se mohou od intervalů spolehlivosti často lišit ze dvou důvodů:

  • důvěryhodné intervaly obsahují kontextové informace specifické pro daný problém z předchozí distribuce vzhledem k tomu, že intervaly spolehlivosti vycházejí pouze z údajů;
  • důvěryhodné intervaly a intervaly spolehlivosti zacházejí obtěžující parametry radikálně odlišnými způsoby.

Pro případ jediného parametru a dat, která lze shrnout do jediného dostatečná statistika, lze ukázat, že důvěryhodný interval a interval spolehlivosti vůle shodovat, pokud je neznámý parametr a parametr umístění (tj. funkce dopředné pravděpodobnosti má formu ), s prioritou, která je rovnoměrné ploché rozdělení;[5] a také pokud je neznámý parametr a parametr měřítka (tj. funkce dopředné pravděpodobnosti má formu ), s Jeffreysův prior   [5] - druhý z následujících důvodů, protože logaritmus takového parametru měřítka jej promění v parametr umístění s rovnoměrným rozložením. Jedná se však o zřetelně zvláštní (i když důležité) případy; obecně takovou rovnocennost nelze provést.

Reference

  1. ^ Edwards, Ward, Lindman, Harold, Savage, Leonard J. (1963) „Bayesovský statistický závěr v psychologickém výzkumu“. Psychologický přehled, 70, 193-242
  2. ^ Lee, P.M. (1997) Bayesian Statistics: An IntroductionArnold. ISBN  0-340-67785-6
  3. ^ „Frequentism and Bayesianism“.
  4. ^ O'Hagan, A. (1994) Kendall's Advanced Theory of Statistics, Vol 2B, Bayesian Inference, Oddíl 2.51. Arnold, ISBN  0-340-52922-9
  5. ^ A b Jaynes, E. T. (1976). "Intervaly spolehlivosti vs Bayesovské intervaly ", v Základy teorie pravděpodobnosti, statistické inference a statistické teorie vědy(W. L. Harper a C. A. Hooker, eds.), Dordrecht: D. Reidel, str. 175 a další

Další čtení