Mezikvartilní průměr - Interquartile mean
tento článek ne uvést žádný Zdroje.Dubna 2009) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
The mezikvartilní průměr (IQM) (nebo střední) je statistický míra centrální tendence založeno na zkrácený průměr z Rozsah interkvartilní. IQM je velmi podobný bodovací metodě používané ve sportu, která je hodnocena porotou: odhodit nejnižší a nejvyšší skóre; vypočítat střední hodnotu zbývajících skóre.
Výpočet
Při výpočtu IQM pouze data mezi prvním a třetím kvartily je použito a nejnižší 25% a nejvyšší 25% dat jsou zahozeny.
za předpokladu, že hodnoty byly objednány.
Příklady
Velikost datové sady dělitelná čtyřmi
Metodu je nejlépe vysvětlit na příkladu. Zvažte následující datovou sadu:
- 5, 8, 4, 38, 8, 6, 9, 7, 7, 3, 1, 6
Nejprve seřaďte seznam od nejnižšího po nejvyšší:
- 1, 3, 4, 5, 6, 6, 7, 7, 8, 8, 9, 38
V datové sadě je 12 pozorování (datových bodů), takže máme 4 kvartily o 3 číslech. Zlikvidujte nejnižší a nejvyšší 3 hodnoty:
1, 3, 4, 5, 6, 6, 7, 7, 8,8, 9, 38
Nyní nám zbývá 6 z 12 pozorování; dále vypočítáme aritmetiku znamenat z těchto čísel:
- XIQM = (5 + 6 + 6 + 7 + 7 + 8) / 6 = 6.5
Toto je mezikvartilní průměr.
Pro srovnání je aritmetický průměr původní datové sady
- (5 + 8 + 4 + 38 + 8 + 6 + 9 + 7 + 7 + 3 + 1 + 6) / 12 = 8.5
kvůli silnému vlivu odlehlé hodnoty, 38.
Velikost datové sady není dělitelná čtyřmi
Výše uvedený příklad sestával z 12 pozorování v datové sadě, což velmi usnadnilo stanovení kvartilů. Samozřejmě, ne všechny datové sady mají řadu pozorování, která jsou dělitelná 4. Můžeme upravit metodu výpočtu IQM tak, aby to vyhovovalo. V ideálním případě tedy chceme mít IQM rovnou znamenat pro symetrické distribuce, např .:
- 1, 2, 3, 4, 5
má střední hodnotu Xznamenat = 3, a protože se jedná o symetrické rozdělení, XIQM = 3 by bylo žádoucí.
Můžeme to vyřešit pomocí a vážený průměr kvartilů a mezikvartilní datová sada:
Zvažte následující datový soubor 9 pozorování:
- 1, 3, 5, 7, 9, 11, 13, 15, 17
V každém kvartilu je 9/4 = 2,25 pozorování a v mezikvartilovém rozsahu 4,5 pozorování. Zkrátte velikost zlomkového kvartilu a odeberte toto číslo z 1. a 4. kvartilu (2,25 pozorování v každém kvartilu, tedy nejnižší 2 a nejvyšší 2 jsou odstraněny).
1, 3, (5), 7, 9, 11, (13),15, 17
Existují tedy 3 úplný pozorování v mezikvartilovém rozsahu a 2 dílčí pozorování. Jelikož máme v mezikvartilovém rozsahu celkem 4,5 pozorování, počítá se každé dvě dílčí pozorování pro 0,75 (a tedy 3 × 1 + 2 × 0,75 = 4,5 pozorování).
IQM se nyní počítá takto:
- XIQM = {(7 + 9 + 11) + 0.75 × (5 + 13)} / 4.5 = 9
Ve výše uvedeném příkladu má průměr hodnotu xznamenat = 9. Stejné jako IQM, jak se očekávalo. Metoda výpočtu IQM pro libovolný počet pozorování je analogická; dílčí příspěvky do IQM mohou být buď 0, 0,25, 0,50 nebo 0,75.
Srovnání s průměrem a mediánem
Mezikvartilní průměr sdílí některé vlastnosti obou znamenat a medián:
- Jako medián, na které je IQM necitlivý odlehlé hodnoty; v uvedeném příkladu byla nejvyšší hodnota (38) zjevnou odchylkou od datové sady, ale její hodnota se při výpočtu IQM nepoužívá. Na druhé straně běžný průměr ( aritmetický průměr ) je citlivý na tyto odlehlé hodnoty: Xznamenat = 8.5.
- Jako znamenat, IQM je zřetelný parametr založený na velkém počtu pozorování z datové sady. The medián se vždy rovná jeden pozorování v datové sadě (za předpokladu lichého počtu pozorování). Průměr se může rovnat žádný hodnota mezi nejnižším a nejvyšším pozorováním, v závislosti na hodnotě Všechno ostatní pozorování. IQM se může rovnat žádný hodnota mezi prvním a třetím kvartilem, v závislosti na Všechno pozorování v mezikvartilovém rozsahu.
Viz také
Související statistiky
Aplikace
- Nabídková sazba pro mezibankovní Londýn odhaduje referenční úrokovou sazbu jako mezikvartilní průměr sazeb, které nabízí několik bank.
- Vše2 používá mezikvartilní průměr reputace zápisů uživatele k určení kvality příspěvku uživatele.[1]