Pomocná statistika - Ancillary statistic
An doplňková statistika je opatření a vzorek jehož rozdělení nezávisí na parametry modelu. Pomocná statistika je a klíčové množství to je také statistika. Ke konstrukci lze použít pomocnou statistiku predikční intervaly.
Tento koncept představil statistický genetik Sir Ronald Fisher.
Příklad
Předpokládat X1, ..., Xn jsou nezávislé a identicky distribuované, a jsou normálně distribuováno s neznámým očekávaná hodnota μ a známé rozptyl 1. Nechte
být průměr vzorku.
Následující statistické míry disperze vzorku
- Rozsah: max (X1, ..., Xn) - min (X1, ..., Xn)
- Rozsah interkvartilní: Q3 − Q1
- Rozptyl vzorku:
všichni jsou doplňkové statistiky, protože jejich distribuce vzorkování se nemění jako μ Změny. Výpočtově je to proto, že ve vzorcích je μ termíny zrušit - přidání konstantního čísla do distribuce (a všech vzorků) změní její maximální a minimální vzorek o stejné množství, takže to nezmění jejich rozdíl, a podobně pro ostatní: tyto míry disperze nezávisí na umístění.
Naopak, vzhledem k i.i.d. normální proměnné se známým průměrem 1 a neznámou odchylkou σ2, průměr vzorku je ne pomocná statistika rozptylu, protože distribuční vzorek pro výběrový průměr je N(1, σ2/n), na čem záleží σ 2 - toto měřítko umístění (konkrétně jeho standardní chyba ) závisí na disperzi.
Pomocný doplněk
Vzhledem k statistice T to není dostatečný, an doplňkový doplněk je statistika U to je pomocné a takové, že (T, U) je dostačující.[1] Intuitivně doplňkový doplněk „přidá chybějící informace“ (bez duplikování).
Statistika je zvláště užitečná, pokud se vezme T být a odhad maximální pravděpodobnosti, což obecně nebude dostačující; pak lze požádat o doplňkový doplněk. V tomto případě Fisher tvrdí, že je třeba podmínit doplňkovým doplňkem ke stanovení informačního obsahu: je třeba vzít v úvahu Fisher informace obsah T nebýt okrajem T, ale podmíněné rozdělení T, vzhledem k tomu U: kolik informací dělá T přidat? To obecně není možné, protože nemusí existovat žádný doplňkový doplněk, a pokud existuje, nemusí být jedinečný a neexistuje ani maximální doplňkový doplněk.
Příklad
v baseball Předpokládejme, že průzkumník sleduje těsto N u netopýrů. Předpokládejme (nereálně) toto číslo N je vybrán nějakým náhodným procesem, který je nezávislý schopností těsta - řekněme, že po každém at-batu je hodena mince a výsledek určuje, zda zvěd zůstane, aby sledoval další at-bat těsta. Případné údaje jsou číslo N počtu netopýrů a jejich počtu X požadavků: data (X, N) jsou dostatečnou statistikou. Pozorováno průměr pálkování X/N nedokáže sdělit všechny informace dostupné v datech, protože nedokáže nahlásit číslo N u netopýrů (např. průměr pálkování 0,400, což je velmi vysoko, založený pouze na pěti netopýrech, nevyvolává zdaleka takovou důvěru ve schopnost hráče než průměr 0,400 na základě 100 netopýrů). Číslo N at-bats je pomocná statistika, protože
- Je součástí pozorovatelných údajů (je to statistický), a
- Jeho rozdělení pravděpodobnosti nezávisí na schopnosti těsta, protože bylo vybráno náhodným procesem nezávislým na schopnosti těsta.
Tato doplňková statistika je doplňkový doplněk na pozorovaný průměr pálkování X/Nprůměr pálkování X/N není dostatečná statistika, v tom, že přenáší méně než všechny relevantní informace v datech, ale spojené s N, to se stává dostatečným.
Viz také
![]() | Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.Listopad 2009) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Poznámky
- ^ Pomocná statistika: recenze autori M. Ghosh, N. Reid a D.A.S. Fraser