Souhrn sedmi čísel - Seven-number summary

v deskriptivní statistika, shrnutí sedmi čísel je sbírka sedmi souhrnná statistika, a je rozšířením shrnutí pěti čísel. Existují dvě podobné, běžné formy.

Stejně jako u pětimístného souhrnu může být reprezentován upraveným krabicový graf, přidáním značek pro šrafování na "vousech" pro dvě z dalších čísel.

Souhrn sedmi čísel

Následující percentily jsou (přibližně) rovnoměrně rozmístěny pod a normálně distribuováno proměnná:

  1. druhý percentil
  2. 9. percentil
  3. 25. percentil nebo dolní kvartil nebo první kvartil
  4. 50. percentil nebo medián (střední hodnota, nebo druhý kvartil)
  5. 75. percentil nebo horní kvartil nebo třetí kvartil
  6. 91. percentil
  7. 98. percentil

Střední tři hodnoty - dolní kvartil, medián, a horní kvartil - jsou obvyklé statistiky z pětimístné shrnutí a jsou standardní hodnoty pro pole v a krabicový graf.

Používají se dva neobvyklé percentily na obou koncích, protože umístění všech sedmi hodnot bude přibližně stejně rozloženo, pokud jsou data normálně distribuováno (čtyři rovnoměrně rozmístěné percentily se třemi číslicemi přesnosti jsou 2,15, 8,87, 25,0 a 50,0). Některé statistické testy vyžadují normálně distribuovaná data, takže vynesené hodnoty poskytují pohodlnou vizuální kontrolu platnosti pozdějších testů, jednoduše skenováním, aby se zjistilo, zda se značky těchto sedmi percentilů zdají být v grafu stejné vzdálenosti od sebe.

Všimněte si, že zatímco extrémní hodnoty pětimístné shrnutí záleží na počtu vzorků, sedmimístné shrnutí ne.

Hodnoty lze reprezentovat pomocí upraveného krabicový graf. 2. a 98. percentil jsou reprezentovány konci vousů a značky šrafování přes vousy označují 9. a 91. percentil.

Bowleyho sedmimístné shrnutí

Arthur Bowley použil sadu neparametrické statistiky, nazývané „souhrn sedmimístného čísla“, včetně extrémů, decilů, a kvartily, spolu s mediánem.[1]

Čísla jsou tedy:

  1. the minimální vzorek
  2. 10. percentil (první slušný )
  3. 25. percentil nebo dolní kvartil nebo první kvartil
  4. 50. percentil nebo medián (střední hodnota, nebo druhý kvartil)
  5. 75. percentil nebo horní kvartil nebo třetí kvartil
  6. 90. percentil (poslední slušný )
  7. the maximální vzorek

Všimněte si, že prostředních pět ze sedmi čísel je téměř stejných jako výše uvedené shrnutí sedmi čísel.

Přidání decilů umožňuje vypočítat interdecile range, které lze pro normální rozdělení škálovat tak, aby poskytovalo přiměřeně efektivní odhad směrodatné odchylky, a 10% střední shrnutí, který ve srovnání s mediánem dává představu o šikmost v ocasy.

Viz také

Reference

  1. ^ Bowley, Arthur (1920). Základní statistický manuál (3. vyd.). str.62. sedm pozic je maximální a minimální, medián, kvartily a dva decily