Normalizace (statistika) - Normalization (statistics)
v statistika a aplikace statistik, normalizace může mít řadu významů.[1] V nejjednodušších případech normalizace hodnocení znamená nastavení hodnot naměřených na různých stupnicích na pomyslně běžnou stupnici, často před průměrováním. Ve složitějších případech může normalizace odkazovat na sofistikovanější úpravy, kde je záměrem přinést celek rozdělení pravděpodobnosti upravených hodnot do zarovnání. V případě normalizace skóre při hodnocení vzdělávání může existovat záměr sladit distribuce s a normální distribuce. Jiný přístup k normalizaci rozdělení pravděpodobnosti je kvantilní normalizace, Kde kvantily různých opatření jsou uvedena do souladu.
V jiném použití ve statistice se normalizace týká vytváření posunutých a zmenšených verzí statistik, kde je záměrem, aby tyto normalizované hodnoty umožnit srovnání odpovídajících normalizovaných hodnot pro různé datové soubory způsobem, který eliminuje účinky určitých hrubých vlivů, jako v případě anomálie časová řada. Některé typy normalizace zahrnují pouze změnu měřítka, aby se dosáhlo hodnot relativních k nějaké proměnné velikosti. Ve smyslu úrovně měření, takové poměry mají smysl pouze pro poměr měření (kde jsou poměry měření smysluplné), ne interval měření (kde smysluplné jsou pouze vzdálenosti, ale nikoli poměry).
V teoretické statistice může parametrická normalizace často vést k stěžejní veličiny - funkce, jejichž Distribuce vzorků nezávisí na parametrech - a doplňkové statistiky - stěžejní veličiny, které lze vypočítat z pozorování bez znalosti parametrů.
Příklady
Ve statistice existují různé typy normalizací - nedimenzionální poměry chyb, zbytků, prostředků a standardní odchylky, které jsou tedy měřítko neměnné - některé z nich lze shrnout následovně. Všimněte si, že pokud jde o úrovně měření, tyto poměry mají smysl pouze pro poměr měření (kde jsou poměry měření smysluplné), ne interval měření (kde smysluplné jsou pouze vzdálenosti, ale nikoli poměry). Viz také Kategorie: Statistické poměry.
název | Vzorec | Použití |
---|---|---|
Standardní skóre | Normalizační chyby, když jsou známy parametry populace. Funguje dobře pro populace, které jsou normálně distribuováno[2] | |
Studentova t-statistika | odchylka odhadované hodnoty parametru od jeho předpokládané hodnoty, normalizovaná jeho standardní chybou. | |
Studentizovaný zbytek | Normalizace zbytků při odhadování parametrů, zejména v různých datových bodech v regresní analýza. | |
Standardizovaný moment | Normalizační momenty pomocí směrodatné odchylky jako měřítko měřítka. | |
Koeficient variace | Normalizace rozptylu pomocí střední hodnoty jako měřítko rozsahu, zejména pro pozitivní distribuci, jako je exponenciální rozdělení a Poissonovo rozdělení. | |
Min-max škálování funkcí | Škálování funkcí slouží k převedení všech hodnot do rozsahu [0,1]. Tomu se také říká normalizace založená na jednotě. To lze zobecnit, aby se omezil rozsah hodnot v datové sadě mezi libovolnými body a pomocí např . |
Všimněte si, že některé další poměry, například poměr rozptylu k střední hodnotě , jsou také prováděny pro normalizaci, ale nejsou nedimenzionální: jednotky se nezruší, a tak poměr má jednotky a není neměnný.
Jiné typy
Mezi další bezrozměrné normalizace, které lze použít bez předpokladů o distribuci, patří:
- Přiřazení percentily. To je běžné u standardizovaných testů. Viz také kvantilní normalizace.
- Normalizace přidáním nebo vynásobením konstantami, takže hodnoty spadají mezi 0 a 1. To se používá pro funkce hustoty pravděpodobnosti, s aplikacemi v oblastech, jako je fyzikální chemie při přiřazování pravděpodobností |ψ|2.
Viz také
Reference
- ^ Dodge, Y. (2003) Oxfordský slovník statistických pojmů, OUP. ISBN 0-19-920613-9 (položka pro normalizaci skóre)
- ^ Freedman, David; Pisani, Robert; Purves, Roger (2007-02-20). Statistiky: Čtvrté mezinárodní studentské vydání. W.W. Norton & Company. ISBN 9780393930436.