Distribuce důvěry - Confidence distribution - Wikipedia
v statistická inference, pojem a rozdělení důvěry (CD) byl často volně označován jako distribuční funkce v prostoru parametrů, která může představovat intervaly spolehlivosti všech úrovní pro požadovaný parametr. Historicky to bylo obvykle konstruováno převrácením horních mezí dolních stran intervalů spolehlivosti všech úrovní a také to bylo běžně spojováno s referenčním[1] tlumočení (základní rozdělení ), ačkoli se jedná o čistě frekventovaný koncept.[2] Distribuce spolehlivosti NENÍ funkcí distribuce pravděpodobnosti sledovaného parametru, ale přesto může být funkcí užitečnou pro vytváření závěrů.[3]
V posledních letech došlo k nárůstu obnoveného zájmu o rozdělení důvěry.[3] V novějším vývoji se koncept distribuce důvěry ukázal jako čistě častý koncept, bez jakéhokoli fiduciálního výkladu nebo uvažování. Koncepčně se distribuce důvěry neliší od a bodový odhad nebo odhad intervalu (interval spolehlivosti ), ale k odhadu sledovaného parametru používá distribuční funkci závislou na vzorku v prostoru parametrů (místo bodu nebo intervalu).
Jednoduchým příkladem rozdělení spolehlivosti, který se široce používá ve statistické praxi, je a bootstrap rozdělení.[4] Vývoj a interpretace distribuce bootstrapu nezahrnuje žádné základní argumenty; totéž platí pro koncept rozdělení důvěry. Pojem distribuce spolehlivosti je však mnohem širší než distribuce bootstrap. Nedávný výzkum zejména naznačuje, že zahrnuje a sjednocuje širokou škálu příkladů, od běžných parametrických případů (včetně většiny příkladů klasického vývoje Fisherovy základní distribuce) až po distribuce bootstrap, p-hodnota funkce,[5] normalizováno funkce pravděpodobnosti a v některých případech Bayesian předchůdci a Bayesian zadní.[6]
Stejně jako Bayesovská zadní distribuce obsahuje nepřeberné množství informací pro jakýkoli typ Bayesovský závěr, distribuce důvěry obsahuje velké množství informací pro vytváření téměř všech typů častých závěrů, včetně bodové odhady, intervaly spolehlivosti kritické hodnoty, statistická síla a hodnoty p,[7] mezi ostatními. Některé nedávné události zdůraznily slibný potenciál konceptu CD jako účinného inferenčního nástroje.[3]
Historie konceptu CD
Neyman (1937)[8] představil myšlenku „důvěry“ ve svém seminárním příspěvku o intervalech spolehlivosti, který objasnil vlastnost častého opakování. Podle Frasera,[9] zárodek (myšlenka) rozdělení důvěry lze vysledovat dokonce až k Bayesovi (1763)[10] a Fisher (1930).[1] Ačkoli se zdá, že fráze byla poprvé použita v Cox (1958).[11] Někteří vědci považují distribuci spolehlivosti za „neymanovskou interpretaci Fisherových fiduciálních distribucí“,[12] který byl „zuřivě sporný Fisherem“.[13] Rovněž se věří, že tyto „neproduktivní spory“ a Fisherova „tvrdohlavá naléhavost“[13] může být důvodem, že koncept distribuce důvěry byl dlouho nesprávně chápán jako základní koncept a nebyl plně rozvinut v rámci frekventovaného rámce.[6][14] Ve skutečnosti je distribuce důvěry čistě frekventovaný koncept s čistě frekventovanou interpretací a má také vazby na Bayesovské odvozovací koncepty a základní argumenty.
Definice
Klasická definice
Klasicky je distribuce spolehlivosti definována převrácením horních mezí řady spodních intervalů spolehlivosti.[15][16][stránka potřebná ] Zejména,
- Pro každého α in (0, 1), let (−∞,ξn(α)] být o 100α% nižší interval spolehlivosti pro θ, kde ξn(α) = ξn(Xn, α) je spojitý a zvyšuje se v α pro každý vzorek Xn. Pak, Hn(•) = ξn−1(•) je rozdělení důvěry proθ.
Efron uvedl, že toto rozdělení „přiřadí pravděpodobnost 0,05 θ leží mezi horními cílovými body intervalu spolehlivosti 0,90 a 0,95, atd. “a„ má silné intuitivní přitažlivost “.[16] V klasické literatuře[3] funkce distribuce spolehlivosti je interpretována jako distribuční funkce parametru θ, což je nemožné, pokud se nejedná o fiduciální uvažování, protože v častém prostředí jsou parametry pevné a nepravidelné.
Interpretovat funkci CD zcela z hlediska frekventanta a neinterpretovat ji jako distribuční funkci parametru (fixní / nenáhodný) je jedním z hlavních odchylek nedávného vývoje ve srovnání s klasickým přístupem. Pěkné na zacházení s distribucemi důvěry jako s čistě frekventovaným konceptem (podobně jako u odhadu bodů) je to, že je nyní osvobozeno od těch omezujících, ne-li kontroverzních, omezení stanovených Fisherem pro fiduciální distribuce.[6][14]
Moderní definice
Platí následující definice;[12][17][18] Θ je prostor parametrů neznámého sledovaného parametru θ, a χ je ukázkový prostor odpovídající datům Xn={X1, ..., Xn}:
- Funkce Hn(•) = Hn(Xn, •) zapnuto χ × Θ → [0, 1] se nazývá distribuce spolehlivosti (CD) parametru θ, pokud splňuje dva požadavky:
- (R1) Za každou danou Xn ∈ χ, Hn(•) = Hn(Xn, •) je spojitá kumulativní distribuční funkce na Θ;
- (R2) Na skutečné hodnotě parametru θ = θ0, Hn(θ0) ≡ Hn(Xn, θ0), jako funkce vzorku Xn, následuje rovnoměrné rozdělení U[0, 1].
Také funkce H je asymptotické CD (aCD), pokud U[0, 1] požadavek platí pouze asymptoticky a požadavek kontinuity na Hn(•) je zrušeno.
Z netechnického hlediska je distribuce spolehlivosti funkcí parametru i náhodného vzorku se dvěma požadavky. První požadavek (R1) jednoduše vyžaduje, aby CD bylo distribucí v prostoru parametrů. Druhý požadavek (R2) nastavuje omezení funkce tak, aby závěry (odhady bodů, intervaly spolehlivosti a testování hypotéz atd.) Založené na rozdělení spolehlivosti měly žádoucí frekventované vlastnosti. To je podobné omezením v odhadu bodu k zajištění určitých požadovaných vlastností, jako je nestrannost, konzistence, účinnost atd.[6][19]
Distribuce spolehlivosti odvozená převrácením horních mezí intervalů spolehlivosti (klasická definice) také splňuje požadavky ve výše uvedené definici a tato verze definice je v souladu s klasickou definicí.[18]
Na rozdíl od klasického základního závěru může být k dispozici více než jedno rozdělení spolehlivosti pro odhad parametru v jakémkoli konkrétním nastavení. Na rozdíl od klasického základního závěru také optimalita není součástí požadavku. V závislosti na nastavení a použitém kritériu někdy existuje jedinečné „nejlepší“ (z hlediska optimality) rozdělení spolehlivosti. Někdy ale není k dispozici optimální rozdělení spolehlivosti, nebo v některých extrémních případech možná nebudeme schopni najít ani smysluplné rozdělení spolehlivosti. To se neliší od praxe bodového odhadu.
Příklady
Příklad 1: Normální průměr a rozptyl
Předpokládejme, že normální vzorek Xi ~ N(μ, σ2), i = 1, 2, ..., n je dáno.
(1) Rozptyl σ2 je známo
Nechat, Φ být kumulativní distribuční funkcí standardního normálního rozdělení a kumulativní distribuční funkce Studenta rozdělení. Obě funkce a dána
splňují dva požadavky v definici CD a jsou to funkce distribuce důvěryμ.[3] Dále
splňuje definici asymptotického rozdělení spolehlivosti, když n→ ∞ a je to asymptotické rozdělení spolehlivosti pro μ. Použití a jsou ekvivalentní stavu, který používáme a odhadovat , resp.
(2) Rozptyl σ2 není známo
Pro parametr μ, od té doby zahrnuje neznámý parametr σ a porušuje dva požadavky v definici CD, již není „odhadem distribuce“ ani distribucí spolehlivosti proμ.[3] Nicméně, je stále CD pro μ a je aCD proμ.
Pro parametr σ2, funkce kumulativní distribuce závislá na vzorku
je funkce distribuce spolehlivosti pro σ2.[6] Tady, je kumulativní distribuční funkce rozdělení .
V případě, že je rozptyl σ2 je známo, je optimální z hlediska vytváření nejkratších intervalů spolehlivosti na jakékoli dané úrovni. V případě, že odchylka σ2 není známo, je optimální rozdělení spolehlivosti pro μ.
Příklad 2: Bivariační normální korelace
Nechat ρ označuje korelační koeficient a bivariate normální populace. Je dobře známo, že Fisher z definováno Fisherova transformace:
má omezující distribuce s rychlou rychlostí konvergence, kde r je ukázková korelace a n je velikost vzorku.
Funkce
je asymptotické rozdělení spolehlivosti pro ρ.[Citace je zapotřebí ]
Použití distribuce spolehlivosti pro odvození
Interval spolehlivosti

Z definice CD je zřejmé, že interval a poskytnout 100 (1 -α)% - intervaly spolehlivosti různých druhů, pro θ, pro všechny α ∈ (0, 1). Taky je úroveň 100 (1 -α1 − α2)% interval spolehlivosti pro parametr θ pro všechny α1 > 0, α2 > 0 a α1 + α2 <1. Tady, je 100β% kvantil nebo to řeší θ v rovnici . Totéž platí pro CD, kde je úroveň spolehlivosti dosažena v limitu. Někteří autoři navrhli jejich použití pro grafické zobrazení hodnot parametrů, které jsou konzistentní s daty, místo pro účely pokrytí nebo výkonu.[20][21]
Bodový odhad
Bodové odhady lze také sestavit na základě odhadu distribuce spolehlivosti pro sledovaný parametr. Například zadáno Hn(θ) CD pro parametr θ, přirozené volby bodových odhadců zahrnují medián Mn = Hn−1(1/2), průměr a maximální bod hustoty CD
Za určitých skromných podmínek lze mimo jiné dokázat, že všechny tyto bodové odhady jsou konzistentní.[6][22]
Testování hypotéz
Lze odvodit p-hodnotu pro test, buď jednostranný nebo dvoustranný, týkající se parametruθ, z jeho rozdělení důvěry Hn(θ).[6][22] Označme hmotností pravděpodobnosti množiny C pod funkcí rozdělení spolehlivosti Tento ps(C) se v závěru CD nazývá „podpora“ a v základní literatuře se také označuje jako „víra“.[23] My máme
(1) Pro jednostranný test K.0: θ ∈ C vs. K.1: θ ∈ CC, kde C je typu (−∞,b] nebo [b, ∞), z definice CD je patrné, že supθ ∈ CPθ(ps(C) ≤ α) = α. Tím pádem, ps(C) = Hn(C) je odpovídající p-hodnota testu.
(2) Pro jednorázový test K.0: θ = b vs. K.1: θ ≠ b, P{K.0: θ = b}(2 min {ps(Chle), lze z definice CD ukázat, že ps(Cnahoru)} ≤ α) = α. Tedy 2 min {ps(Chle), ps(Cnahoru)} = 2 min {Hn(b), 1 − Hn(b)} je odpovídající p-hodnota testu. Tady, Chle = (−∞, b] a Cnahoru = [b, ∞).
Viz obrázek 1 od Xie a Singha (2011)[6] pro grafické znázornění závěru o CD.
Implementace
Několik statistických programů implementovalo schopnost konstruovat a grafovat distribuce spolehlivosti.
R prostřednictvím souhlasit
,[24][25] pvaluefunctions
,[26] a epizoda
[27] balíčky
Viz také
Reference
- ^ A b Fisher, R.A. (1930). „Inverzní pravděpodobnost.“ Proc. Cambridge Pilos. Soc. 26, 528–535.
- ^ Cox, D.R. (1958). "Některé problémy spojené se statistickým odvozením ", "Annals of Mathematical Statistics "," 29 "357-372 (část 4, strana 363)
- ^ A b C d E F Xie, M. (2013). „Rejoinder of Confidence Distribution, the Frequentist Distribution Estimator of a Parameter - a Review“. "Mezinárodní statistický přehled, 81, 68-77.
- ^ Efron, B. (1998). „R.A.Fisher v 21. století“ Statistická věda. 13 95–122.
- ^ Fraser, D.A.S. (1991). „Statistická inference: Pravděpodobnost významnosti.“ Journal of the American Statistical Association, 86, 258–265.
- ^ A b C d E F G h Xie, M. a Singh, K. (2013). „Distribuce důvěry, častý odhad distribuce parametru - recenze (s diskusí)“. "Mezinárodní statistický přehled, 81, 3-39.
- ^ Fraser, D. A. S. (2019-03-29). „Funkce p-hodnota a statistická inference“. Americký statistik. 73 (sup1): 135–147. doi:10.1080/00031305.2018.1556735. ISSN 0003-1305.
- ^ Neyman, J. (1937). „Nástin teorie statistického odhadu založený na klasické teorii pravděpodobnosti.“ Phil. Trans. Roy. Soc A237 333–380
- ^ Fraser, D.A.S. (2011). „Je Bayes posterior jen rychlá a špinavá důvěra?“ Statistická věda 26, 299-316.
- ^ Bayes, T. (1763). "Esej o řešení problému v Nauce o šancích." Phil. Trans. Roy. Soc, Londýn 53 370–418 54 296–325. Přetištěno Biometrika 45 (1958) 293–315.
- ^ Cox, D. R. (červen 1958). „Některé problémy spojené se statistickým odvozením“. Annals of Mathematical Statistics. 29 (2): 357–372. doi:10.1214 / aoms / 1177706618. ISSN 0003-4851.
- ^ A b Schweder, T. a Hjort, N.L. (2002). "Důvěra a pravděpodobnost", Scandinavian Journal of Statistics. 29 309–332. doi:10.1111/1467-9469.00285
- ^ A b Zabell, S.L. (1992). "R.A.Fisher and fiducial argument", Stat. Sci., 7, 369–387
- ^ A b Singh, K. a Xie, M. (2011). „Diskuse o„ Je Bayes posterior jen rychlá a špinavá důvěra? “ autor D.A.S. Fraser. “ Statistická věda. Sv. 26, 319-321.
- ^ Cox, D. R. (2006). Principy statistické inferenceCUP. ISBN 0-521-68567-2. (strana 66)
- ^ A b Efron, B. (1993). „Bayesovy a pravděpodobnostní výpočty z intervalů spolehlivosti.Biometrika, 80 3–26.
- ^ Singh, K. Xie, M. a Strawderman, W.E. (2001). "Distribuce důvěry - koncepce, teorie a aplikace". Technická zpráva, odbor statistiky, Rutgers Univ. Revidováno 2004.
- ^ A b Singh, K. Xie, M. a Strawderman, W.E. (2005). „Kombinování informací z nezávislých zdrojů prostřednictvím distribuce důvěryhodnosti“ Annals of Statistics, 33, 159–183.
- ^ Xie, M., Liu, R., Daramuju, C.V., Olsan, W. (2012). „Začlenění znaleckých posudků s informacemi z binomických klinických studií.“ Annals of Applied Statistics. V tisku.
- ^ Cox, D. R .; Hinkley, D. V. (06.09.1979). Teoretická statistika. Chapman and Hall / CRC. doi:10.1201 / b14832. ISBN 978-0-429-17021-8.
- ^ Rafi, Zad; Grónsko, Sander (2020-09-30). „Sémantické a kognitivní nástroje na podporu statistické vědy: nahradit důvěru a význam kompatibilitou a překvapením“. Metodika lékařského výzkumu BMC. 20 (1): 244. doi:10.1186 / s12874-020-01105-9. ISSN 1471-2288. PMC 7528258. PMID 32998683.
- ^ A b Singh, K. Xie, M. a Strawderman, W.E. (2007). „Odhad důvěryhodnosti (CD) - odhad distribuce parametru“, v Složité datové sady a inverzní problémy Poznámky k přednášce IMS - Monografické série, 54„(R. Liu a kol. Eds) 132–150.
- ^ Kendall, M. a Stuart, A. (1974). Pokročilá teorie statistiky, Objem ?. (Kapitola 21). Wiley.
- ^ A b Rafi [aut, Zad; cre; Vigotsky, Andrew D. (2020-04-20), concurve: Intervaly výpočtů a grafů kompatibility (důvěryhodnosti), P-hodnoty, S-hodnoty a pravděpodobnost Intervaly pro vytvoření funkcí souznění, překvapení a pravděpodobnosti, vyvoláno 2020-05-05
- ^ "Concurve plots consonance curves, p-value functions, and S-value functions« Statistické modelování, kauzální inference a sociální vědy ". statmodeling.stat.columbia.edu. Citováno 2020-04-15.
- ^ Infanger, Denis (2019-11-29), pvaluefunctions: Vytváří a vykresluje funkce P-hodnoty, funkce S-hodnoty, distribuce spolehlivosti a hustoty spolehlivosti, vyvoláno 2020-04-15
- ^ Black, James; Rothman, Ken; Thelwall, Simon (2019-01-23), epizoda: Rothmanova epizoda, vyvoláno 2020-04-15
- ^ „Modern Epidemiology, 2nd Edition“. www.krothman.org. Citováno 2020-04-15.
Bibliografie
- Xie, M. a Singh, K. (2013). [1] "Distribuce důvěry, odhad častého distribuce parametru: recenze". Mezinárodní statistický přehled, 81, 3–39.
- Schweder, T a Hjort, N L (2016). [2]Důvěra, pravděpodobnost, pravděpodobnost: statistická inference s distribucí důvěry. London: Cambridge University Press. ISBN 9781139046671
- Fisher, RA (1956). Statistické metody a vědecké závěry. New York: Hafner. ISBN 0-02-844740-9.
- Fisher, R. A. (1955). „Statistické metody a vědecká indukce“ J. Roy. Statist. Soc. Ser. B. 17, 69—78. (kritika statistických teorií Jerzyho Neymana a Abrahama Walda z fiduciální perspektivy)
- Hannig, J. (2009). "Na generalizovaném základním závěru ". Statistica Sinica, 19, 491–544.
- Lawless, F. a Fredette, M. (2005). "Frekvenční predikční intervaly a prediktivní rozdělení." Biometrika. 92(3) 529–542.
- Lehmann, E.L. (1993). "Fisherova, Neyman-Pearsonova teorie testování hypotéz: jedna teorie nebo dvě? " Journal of the American Statistical Association 88 1242–1249.
- Neyman, Jerzy (1956). „Poznámka k článku od Sira Ronalda Fishera“. Journal of the Royal Statistical Society. Řada B (metodická) 18 (2): 288–294. JSTOR 2983716. (odpověď na Fishera 1955, který diagnostikuje klam „základního závěru“)
- Schweder T., Sadykova D., Rugh D. a Koski W. (2010) "Odhady populace z leteckých fotografických průzkumů přirozeně a variabilně označených Bowhead velryb " Journal of Agricultural Biological and Environmental Statistics 2010 15: 1–19
- Bityukov S., Krasnikov N., Nadarajah S. a Smirnova V. (2010) "Distribuce důvěry ve statistickou inferenci ". Sborník z konference AIP, 1305, 346-353.
- Singh, K. a Xie, M. (2012). „CD-posterior --- kombinující předchozí a data prostřednictvím distribuce spolehlivosti.“ Současný vývoj v Bayesovské analýze a teorii statistického rozhodování: Festschrift pro Williama E. Strawdermana. (D. Fourdrinier a kol., Eds.). Sbírka IMS, svazek 8, 200-214.