Hopkinsova statistika - Hopkins statistic
![]() | tento článek potřebuje další citace pro ověření.Srpna 2017) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
The Hopkinsova statistika (představili Brian Hopkins a John Gordon Skellam ) je způsob měření klastrová tendence souboru dat.[1] Patří do rodiny řídkých vzorkovacích testů. Působí jako statistický test hypotéz Kde nulová hypotéza je to, že data jsou generována a Proces Poissonova bodu a jsou tedy rovnoměrně náhodně rozloženy.[2] Hodnota blízká 1 má tendenci indikovat, že data jsou vysoce klastrovaná, náhodná data budou mít tendenci mít za následek hodnoty kolem 0,5 a rovnoměrně distribuovaná data budou mít tendenci mít za následek hodnoty blízké 0.[3]
Předkola
Následuje typická formulace Hopkinsovy statistiky.[2]
- Nechat být množinou datové body.
- Zvažte náhodný vzorek (bez náhrady) datové body se členy .
- Vytvořte sadu z rovnoměrně náhodně distribuované datové body.
- Definujte dvě míry vzdálenosti,
- vzdálenost od nejbližšího souseda v , a
- vzdálenost počet náhodně vybraných od nejbližšího souseda v .
Definice
S výše uvedeným zápisem, pokud jsou data rozměrová, pak je Hopkinsova statistika definována jako:
Poznámky a odkazy
- ^ Hopkins, Brian; Skellam, John Gordon (1954). "Nová metoda pro určení typu distribuce rostlinných jedinců". Annals of Botany. Annals Botany Co. 18 (2): 213–227.
- ^ A b Banerjee, A. (2004). "Ověření shluků pomocí Hopkinsovy statistiky". Mezinárodní konference IEEE o fuzzy systémech: 149–153. doi:10.1109 / FUZZY.2004.1375706.
- ^ Aggarwal, Charu C. (2015). Dolování dat. Cham: Springer International Publishing. p. 158. doi:10.1007/978-3-319-14142-8. ISBN 978-3-319-14141-1.