Statistická disperze - Statistical dispersion
![]() | tento článek potřebuje další citace pro ověření.Prosinec 2010) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |

v statistika, disperze (také zvaný variabilita, rozptylnebo šíření) je míra, do jaké a rozdělení je napnutá nebo stlačená.[1] Běžnými příklady měřítek statistického rozptylu jsou rozptyl, standardní odchylka, a Rozsah interkvartilní.
Rozptyl je v kontrastu s umístěním nebo centrální tendence a společně jsou nejpoužívanějšími vlastnostmi distribucí.
Opatření
Míra statistické disperze je nezáporná reálné číslo to je nula, pokud jsou všechna data stejná a zvyšuje se s tím, jak jsou data stále rozmanitější.
Většina měřítek rozptylu je stejná Jednotky jako Množství měří se. Jinými slovy, pokud jsou měření v metrech nebo sekundách, je to také míra rozptylu. Mezi příklady disperzních opatření patří:
- Standardní odchylka
- Rozsah interkvartilní (IQR)
- Rozsah
- Střední absolutní rozdíl (také známý jako Gini průměrný absolutní rozdíl)
- Střední absolutní odchylka (ŠÍLENÝ)
- Průměrná absolutní odchylka (nebo jednoduše nazývaná průměrná odchylka)
- Směrodatná odchylka vzdálenosti
Často se používají (společně s měřítkové faktory ) tak jako odhady z parametry měřítka, v jaké kapacitě jsou voláni odhady rozsahu. Důkladná měřítka jsou ty, kterých se nedotkne malý počet odlehlé hodnoty a zahrnují IQR a MAD.
Všechna výše uvedená měřítka statistického rozptylu mají užitečnou vlastnost, kterou jsou invariant umístění a lineární v měřítku. To znamená, že pokud a náhodná proměnná X má disperzi SX pak lineární transformace Y = sekera + b pro nemovitý A a b by měl mít rozptyl SY = |A|SX, kde |A| je absolutní hodnota z A, tj. ignoruje předchozí záporné znaménko –.
Další míry disperze jsou bezrozměrný. Jinými slovy, nemají žádné jednotky, i když samotná proměnná má jednotky. Tyto zahrnují:
- Variační koeficient
- Kvartilový koeficient disperze
- Relativní průměrný rozdíl, což se rovná dvojnásobku Giniho koeficient
- Entropie: Zatímco entropie diskrétní proměnné je lokačně invariantní a nezávislá na měřítku, a není tedy mírou disperze ve výše uvedeném smyslu, entropie spojité proměnné je lokačně invariantní a aditivní v měřítku: Pokud Hz je entropie spojité proměnné z a y = sekera + b, pak Hy = Hx + log (a).
Existují i další míry disperze:
- Rozptyl (čtverec směrodatné odchylky) - umístění neměnné, ale ne lineární v měřítku.
- Poměr rozptylu k průměru - většinou se používá pro počítat data když termín koeficient disperze a když je tento poměr bezrozměrný, protože údaje o počtu jsou samy o sobě bezrozměrné, jinak tomu tak není.
Některá měřítka rozptylu mají speciální účely, mezi nimi i Allanův rozptyl a Hadamardova odchylka.
Pro kategorické proměnné, je méně běžné měřit rozptyl jedním číslem; vidět kvalitativní variace. Jedno opatření, které tak činí, je diskrétní entropie.
Zdroje
V fyzikální vědy, taková variabilita může být výsledkem náhodných chyb měření: měření přístroje často nejsou dokonalá přesné, tj. reprodukovatelné, a je tu další variabilita mezi hodnotiteli při interpretaci a hlášení naměřených výsledků. Lze předpokládat, že měřená veličina je stabilní a že rozdíly mezi měřeními jsou způsobeny pozorovací chyba. Systém velkého počtu částic se vyznačuje středními hodnotami relativně malého počtu makroskopických veličin, jako je teplota, energie a hustota. Směrodatná odchylka je důležitým měřítkem teorie fluktuace, která vysvětluje mnoho fyzikálních jevů, včetně toho, proč je obloha modrá.[2]
V biologické vědy, měřená veličina je zřídka neměnná a stabilní a pozorovaná variace může být navíc vnitřní k jevu: Může to být způsobeno interindividuální variabilita, tj. odlišní členové populace, kteří se navzájem liší. Může to být také kvůli intraindividuální variabilita, tj. jeden a tentýž subjekt se liší v testech prováděných v různých dobách nebo v jiných odlišných podmínkách. Takové typy variability jsou také vidět v aréně vyráběných produktů; i tam pečlivý vědec najde variaci.
v ekonomika, finance a další disciplíny, regresní analýza pokusy vysvětlit rozptyl a závislá proměnná, obvykle měřeno jeho rozptylem, s použitím jednoho nebo více nezávislé proměnné každý z nich má pozitivní disperzi. Vysvětlený zlomek rozptylu se nazývá koeficient stanovení.
Částečné uspořádání disperze
A střední ochrana (MPS) je změna z jednoho rozdělení pravděpodobnosti A do jiného rozdělení pravděpodobnosti B, kde B je vytvořeno rozprostřením jedné nebo více částí funkce hustoty pravděpodobnosti A při ponechání střední hodnoty (očekávané hodnoty) beze změny.[3] Koncept šíření zachovávající střední hodnotu poskytuje a částečné objednání rozdělení pravděpodobnosti podle jejich disperzí: ze dvou rozdělení pravděpodobnosti může být jedno hodnoceno jako mající větší rozptyl než druhé, nebo alternativně ani jedno nemusí být hodnoceno jako mající větší rozptyl.
Viz také
Reference
- ^ Elektronická příručka statistických metod NIST / SEMATECH. „1.3.6.4. Parametry umístění a měřítka“. www.itl.nist.gov. Americké ministerstvo obchodu.
- ^ McQuarrie, Donald A. (1976). Statistická mechanika. NY: Harper & Row. ISBN 0-06-044366-9.
- ^ Rothschild, Michael; Stiglitz, Joseph (1970). "Zvyšující se riziko I: Definice". Journal of Economic Theory. 2 (3): 225–243. doi:10.1016/0022-0531(70)90038-4.