Jenks přirozené přestávky optimalizace - Jenks natural breaks optimization
The Jenksova optimalizační metoda, také nazývaný Metoda klasifikace Jenksových přirozených zlomů, je shlukování dat metoda určená k určení nejlepšího uspořádání hodnot do různých tříd. Toho je dosaženo snahou minimalizovat průměrnou odchylku každé třídy od střední hodnoty třídy a zároveň maximalizovat odchylku každé třídy od průměrů ostatních skupin. Jinými slovy se metoda snaží snížit rozptyl v rámci tříd a maximalizovat rozptyl mezi třídami.[1][2]
Metoda optimalizace Jenks přímo souvisí s Otsuova metoda a Fisherova diskriminační analýza.
Dějiny
George Frederick Jenks
George Frederick Jenks byl Američan 20. století kartograf. Promoval s jeho Ph.D. v zemědělské geografii od Syrakuská univerzita v roce 1947 zahájil Jenks svou kariéru pod vedením Richard Harrison, kartograf pro Čas a Štěstí časopis.[3] Nastoupil na fakultu University of Kansas v roce 1949 a začal budovat kartografický program. Během svého 37letého působení na KU vyvinul Jenks program kartografie do jednoho ze tří programů proslulých absolventským vzděláním v oboru; ostatní jsou University of Wisconsin a University of Washington. Hodně času strávil vývojem a propagací vylepšených kartografických výcvikových technik a programů. Značný čas také věnoval zkoumání trojrozměrných map, výzkumu pohybu očí, tematická mapa komunikace a geostatistika.[2][3][4]
Pozadí a vývoj
Jenks byl povoláním kartograf. Jeho práce s statistika vyrostl z touhy dělat choroplethské mapy vizuálně přesnější pro diváka. Ve svém příspěvku Koncept datového modelu ve statistickém mapování, tvrdí, že vizualizací dat v trojrozměrném modelu by kartografové mohli navrhnout „systematickou a racionální metodu pro přípravu choropletických map“.[1] Jenks použil analogii „přikrývky chyb“ k popisu potřeby použít k zobecnění údajů jiné prvky, než je průměr. Trojrozměrné modely byly vytvořeny, aby pomohly Jenksovi vizualizovat rozdíl mezi datovými třídami. Jeho cílem bylo zobecnit data pomocí co nejmenšího počtu letadel a udržovat konstantní „chybu chyb“.
Popis metody
Metoda vyžaduje iterační proces. To znamená, že výpočty musí být opakovány s použitím různých přerušení datové sady, aby se určilo, která sada přerušení má nejmenší ve své třídě rozptyl. Proces je zahájen rozdělením objednaných dat do skupin. Počáteční rozdělení skupin může být libovolné. Je třeba opakovat tři kroky:
- Vypočítejte součet čtverců odchylek od třídních průměrů (SDCM).
- Vypočítejte součet čtverců odchylek od střední hodnoty pole (SDAM).
- Po kontrole každého SDCM je poté rozhodnuto přesunout jednu jednotku ze třídy s větším SDCM do sousední třídy s nižším SDCM.
Poté se vypočítají nové odchylky třídy a proces se opakuje, dokud součet odchylek uvnitř třídy nedosáhne minimální hodnoty.[1][5]
Alternativně lze zkoumat všechny kombinace zlomů, vypočítat SDCM pro každou kombinaci a vybrat kombinaci s nejnižším SDCM. Jelikož jsou zkoumány všechny kombinace zlomů, je zaručeno, že bude nalezena kombinace s nejnižším SDCM.
Nakonec se vypočítá shoda dobré odchylky (GVF). GVF je definován jako (SDAM - SDCM) / SDAM. GVF se pohybuje od 0 (nejhorší) až po 1 (perfektní).
Použití v kartografii
Jenksovým cílem při vývoji této metody bylo vytvořit mapu, která byla naprosto přesná, pokud jde o reprezentaci prostorových atributů dat. Sledováním tohoto procesu, tvrdí Jenks, lze „plošnou chybu“ rovnoměrně rozdělit po mapovaném povrchu. Vyvinul to se záměrem použít relativně málo datových tříd, méně než sedm, protože to byl limit při použití monochromatického stínování na choropletické mapě.[1]

Metoda klasifikace Jenks se běžně používá v tematických mapách, zejména choroplethových mapách, jako jedna z několika dostupných metod klasifikace. Při vytváření choroplethových map může být Jenksova klasifikační metoda výhodná, protože pokud jsou v hodnotách dat shluky, bude je identifikovat. Ve skutečnosti je v současných verzích softwaru ArcGIS od společnosti Esri Jenks výchozí metodou klasifikace. Klasifikace Jenks se však nedoporučuje pro data, která mají nízkou odchylku. Jenksovy přirozené zlomy v datech se používají k zajištění smysluplnější vizualizace mapových dat na základě „přirozených zlomů“ v datech identifikovaných iteračním procesem.
Alternativní metody
Mezi další metody klasifikace údajů patří Zlomení hlavy / ocasu, Přírodní přestávky (bez Jenksovy optimalizace), Rovný interval, Kvantil a Standardní odchylka.
Viz také
- k-znamená shlukování, zobecnění pro vícerozměrná data (optimalizace Jenksových přirozených zlomů se jeví jako jednorozměrný k-prostředek[6]).
Reference
- ^ A b C d Jenks, George F. 1967. „Koncept datového modelu ve statistickém mapování“, Mezinárodní ročenka kartografie 7: 186–190.
- ^ A b McMaster, Robert, „In Memoriam: George F. Jenks (1916–1996)“. Kartografie a geografická informační věda. 24 (1) str. 56-59.
- ^ A b McMaster, Robert a McMaster, Susanna. 2002. „Historie americké akademické kartografie dvacátého století“, Kartografie a geografická informační věda. 29 (3) s. 312-315.
- ^ Speciální skupina kartografie CSUN, Newsletter zima 1997 Archivováno 07.06.2010 na Wayback Machine
- ^ ESRI FAQ, Co je metoda Jenks Optimization Archivováno 16. 11. 2007 v Wayback Machine.
- ^ „Kapitola 9“.
externí odkazy
- Dobrovolnické geografické informace, Daniel Lewis, Jenks Natural Breaks Algorithm s implementací v pythonu
- Object Vision wiki, Fisher's Natural Breaks Classification, a O (k * n * log (n)) algoritmus
- Co jsou Jenks Natural Breaks?
- Literární Jenks Natural Breaks a jak se ztratila myšlenka kódu