Statistický předpoklad - Statistical assumption
Statistika, stejně jako všechny matematické disciplíny, ne usoudit platné závěry z ničeho. Odvození zajímavých závěrů o skutečném statistické populace téměř vždy vyžaduje určité předpoklady pozadí. Tyto předpoklady musí být učiněny opatrně, protože nesprávné předpoklady mohou generovat divoce nepřesné závěry.
Zde je několik příkladů statistických předpokladů.
- Nezávislost vzájemných pozorování (tento předpoklad je obzvláště běžnou chybou[1]).
- Nezávislost pozorovací chyby na potenciálu matoucí účinky.
- Přesné nebo přibližné normálnost pozorování (nebo chyb).
- Linearita odstupňovaných odpovědí na kvantitativní podněty, např. v lineární regrese.
Třídy předpokladů
Existují dva přístupy statistická inference: modelový závěr a odvození založené na designu.[2][3][4] Oba přístupy se na některé spoléhají statistický model reprezentovat proces generování dat. V přístupu založeném na modelu je model původně považován za neznámý a jedním z cílů je vybrat vhodný model pro odvození. V přístupu založeném na designu se model považuje za známý a jedním z cílů je zajistit, aby byla vzorová data vybrána dostatečně náhodně pro odvození.
Statistické předpoklady lze rozdělit do dvou tříd podle toho, jaký přístup k závěru se použije.
- Předpoklady založené na modelu. Patří mezi ně následující tři typy:
- Distribuční předpoklady. Kde statistický model zahrnuje výrazy vztahující se k náhodné chyby, lze předpokládat, že rozdělení pravděpodobnosti těchto chyb.[5] V některých případech se distribuční předpoklad týká samotných pozorování.
- Strukturální předpoklady. Statistické vztahy mezi proměnnými se často modelují tak, že se jedna proměnná přirovná k funkci jiné (nebo několika dalších) plus a náhodná chyba. Modely často zahrnují vytvoření strukturálního předpokladu o formě funkčního vztahu, např. jako v lineární regrese. To lze zobecnit na modely zahrnující vztahy mezi základními nepozorovaně latentní proměnné.
- Mezioborové předpoklady. Tyto předpoklady zahrnují: společné rozdělení pravděpodobnosti samotných pozorování nebo náhodných chyb v modelu. Jednoduché modely mohou zahrnovat předpoklad, že pozorování nebo chyby jsou statisticky nezávislé.
- Předpoklady založené na designu. Ty se týkají způsobu, jakým byla pozorování shromažďována, a často zahrnují předpoklad randomizace v době vzorkování.[6][7]
Přístup založený na modelu je nejčastěji používán ve statistických závěrech; přístup založený na designu se používá hlavně u vzorkování průzkumu. S přístupem založeným na modelu jsou všechny předpoklady v modelu efektivně zakódovány.
Kontrola předpokladů
Vzhledem k tomu, že platnost jakéhokoli závěru vyvozeného ze statistického závěru závisí na platnosti provedených předpokladů, je zjevně důležité, aby tyto předpoklady byly v určité fázi přezkoumány. Některé instance - například kde údaje chybí —Může vyžadovat, aby vědci posoudili, zda je předpoklad rozumný. Vědci to mohou trochu rozšířit, aby zvážili, jaký efekt může mít odchylka od předpokladů. Tam, kde jsou k dispozici podrobnější údaje, různé typy postupů pro validace statistického modelu jsou k dispozici - např. pro validace regresního modelu.
Viz také
Poznámky
- ^ Kruskall, 1988
- ^ Koch G. G., Gillings D. B. (2006), „Inference, design-based vs. model-based“, Encyklopedie statistických věd (redaktor - Kotz S.), Wiley-Interscience.
- ^ Cox, 2006, kap.9
- ^ de Gruijter a kol., 2006, §2.2
- ^ McPherson, 1990, §3.4.1
- ^ McPherson, 1990, §3.3
- ^ de Gruijter a kol., 2006, §2.2.1
![]() | Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.Únor 2010) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Reference
- Cox D. R. (2006), Principy statistické inference, Cambridge University Press.
- de Gruijter J., Brus D., Bierkens M., Knotters M. (2006), Vzorkování pro monitorování přírodních zdrojů, Springer-Verlag.
- Kruskal, William (Prosinec 1988). „Zázraky a statistiky: příležitostné převzetí nezávislosti (adresa prezidenta ASA)“. Journal of the American Statistical Association. 83 (404): 929–940. doi:10.2307/2290117. JSTOR 2290117.
- McPherson, G. (1990), Statistika ve vědeckém výzkumu: její základy, aplikace a interpretace, Springer-Verlag. ISBN 0-387-97137-8