Úplnost (statistika) - Completeness (statistics)
![]() | tento článek potřebuje další citace pro ověření.Srpna 2009) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
v statistika, úplnost je vlastnost a statistický ve vztahu k modelu pro soubor pozorovaných dat. V podstatě zajišťuje, že distribuce odpovídající různým hodnotám parametrů jsou odlišná.
Úzce to souvisí s myšlenkou identifikovatelnost, ale v statistická teorie často se vyskytuje jako podmínka uložená a dostatečná statistika od kterého jsou odvozeny určité výsledky optimality.
Definice
Zvažte a náhodná proměnná X jehož rozdělení pravděpodobnosti náleží a parametrický model Pθ parametrizováno pomocíθ.
Říci T je statistický; tj. složení a měřitelná funkce s náhodným vzorkem X1,...,Xn.
Statistika T se říká, že je kompletní pro distribuci X pokud pro každou měřitelnou funkci G,:[1]
Statistika T se říká, že je bezpochyby kompletní pro distribuci X pokud tato implikace platí pro každou měřitelnou funkci G to je také omezené.
Příklad 1: Bernoulliho model
Model Bernoulli připouští úplnou statistiku.[2] Nechat X být náhodný vzorek velikosti n takové, že každý Xi má to samé Bernoulliho distribuce s parametrem str. Nechat T je počet 1 s pozorovaných ve vzorku. T je statistika X který má binomická distribuce s parametry (n,str). Pokud je prostor parametrů pro str je tedy (0,1) T je úplná statistika. Toto si všimněte
Všimněte si také, že ani jeden str ani 1 -str může být 0. Proto právě když:
Při označení str/(1 − str) od r, jeden dostane:
Nejprve si všimněte, že rozsah r je pozitivní reality. Také E (G(T)) je polynomiální v r a proto může být identický pouze s 0, pokud jsou všechny koeficienty 0, tj. G(t) = 0 pro všechnyt.
Je důležité si všimnout, že výsledek, že všechny koeficienty musí být 0, byl získán kvůli rozsahu r. Byl-li prostor parametrů konečný a s počtem prvků menším nebo rovným n, je možné vyřešit lineární rovnice v G(t) získané nahrazením hodnot r a získejte řešení odlišná od 0. Například pokud n = 1 a prostor parametrů je {0,5}, jediné pozorování a jedna hodnota parametru, T není kompletní. Všimněte si, že s definicí:
pak E (G(T)) = 0 ačkoli G(t) není 0 pro t = 0 ani pro t = 1.
Vztah k dostatečným statistikám
U některých parametrických rodin kompletní dostatečná statistika neexistuje (například viz Galili a Meilijson 2016 [3]). Také, a minimální dostatečné statistika nemusí existovat. (Případ, kdy neexistuje dostatečná minimální statistika, ukázal Bahadur v roce 1957.[Citace je zapotřebí ]) Za mírných podmínek vždy existuje minimální dostatečná statistika. Zejména tyto podmínky platí vždy, pokud náhodné proměnné (spojené s Pθ ) jsou všechny diskrétní nebo jsou spojité.[Citace je zapotřebí ]
Důležitost úplnosti
Pojem úplnosti má mnoho statistických aplikací, zejména v následujících dvou větách matematické statistiky.
Lehmann – Schefféova věta
Úplnost se vyskytuje v Lehmann – Schefféova věta,[4]který říká, že pokud je nestranná statistika, kompletní a dostatečný pro nějaký parametr θ, pak je to nejlepší průměrný objektivní odhadθ. Jinými slovy, tato statistika má menší očekávanou ztrátu pro všechny konvexní funkce ztráty; v mnoha praktických aplikacích s funkcí kvadratické ztráty má menší průměrnou kvadratickou chybu u všech odhadů se stejnou očekávaná hodnota.
Existují příklady, že když je minimální dostatečná statistika není kompletní pak existuje několik alternativních statistik pro objektivní odhad θ, zatímco některé z nich mají nižší rozptyl než jiné.[5]
Viz také objektivní odhad minimální odchylky.
Basuova věta
Ohraničená úplnost se vyskytuje v Basuova věta,[6] což uvádí, že statistika je obojí bezpochyby kompletní a dostatečný je nezávislý ze všech doplňková statistika.
Bahadurova věta
Ohraničená úplnost také se vyskytuje v Bahadurova věta. V případě, že existuje alespoň jeden minimální dostatečné statistika, statistika, která je dostatečný a bezpochyby kompletní, je nutně minimální.
Poznámky
![]() | Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.Únor 2012) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
- ^ Young, G. A. a Smith, R. L. (2005). Základy statistické inference. (str. 94). Cambridge University Press.
- ^ Casella, G. a Berger, R. L. (2001). Statistická inference. (str. 285–286). Duxbury Press.
- ^ Tal Galili a Isaac Meilijson (31. března 2016). „Příklad zlepšitelného zlepšení Rao – Blackwell, odhadu neúčinné maximální pravděpodobnosti a nestranný zobecněný Bayesův odhad“. Americký statistik. 70 (1): 108–113. doi:10.1080/00031305.2015.1100683. PMC 4960505. PMID 27499547.CS1 maint: používá parametr autoři (odkaz)
- ^ Casella, George; Berger, Roger L. (2001). Statistická inference (2. vyd.). Duxbury Press. ISBN 978-0534243128.
- ^ Tal Galili a Isaac Meilijson (31. března 2016). „Příklad zlepšitelného zlepšení Rao – Blackwell, odhadu neúčinné maximální pravděpodobnosti a nestranný zobecněný Bayesův odhad“. Americký statistik. 70 (1): 108–113. doi:10.1080/00031305.2015.1100683. PMC 4960505. PMID 27499547.CS1 maint: používá parametr autoři (odkaz)
- ^ Casella, G. a Berger, R. L. (2001). Statistická inference. (str. 287). Duxbury Press.
Reference
- Basu, D. (1988). J. K. Ghosh (ed.). Statistické informace a pravděpodobnost: Sbírka kritických esejů Dr. D. Basu. Poznámky k přednášce ve statistice. 45. Springer. ISBN 978-0-387-96751-6. PAN 0953081.CS1 maint: ref = harv (odkaz)
- Bickel, Peter J.; Doksum, Kjell A. (2001). Matematická statistika, svazek 1: Základní a vybraná témata (Druhý (aktualizovaný tisk 2007) vydání Holden-Day 1976). Pearson Prentice – Hall. ISBN 978-0-13-850363-5. PAN 0443141.CS1 maint: ref = harv (odkaz)
- E. L., Lehmann; Romano, Joseph P. (2005). Testování statistických hypotéz. Springer Texty ve statistice (třetí vydání). New York: Springer. str. xiv + 784. ISBN 978-0-387-98864-1. PAN 2135927. Archivovány od originál dne 02.02.2013.CS1 maint: ref = harv (odkaz)
- Lehmann, E.L .; Scheffé, H. (1950). „Úplnost, podobné oblasti a nestranný odhad. I.“ Sankhyā: Indian Journal of Statistics. 10 (4): 305–340. doi:10.1007/978-1-4614-1412-4_23. JSTOR 25048038. PAN 0039201.
- Lehmann, E.L .; Scheffé, H. (1955). „Úplnost, podobné oblasti a nestranný odhad. II.“. Sankhyā: Indický žurnál statistik. 15 (3): 219–236. doi:10.1007/978-1-4614-1412-4_24. JSTOR 25048243. PAN 0072410.