Paralelní souřadnice - Parallel coordinates


Paralelní souřadnice jsou běžným způsobem vizualizace a analýzy vysoce dimenzionální datové sady.
Chcete-li zobrazit sadu bodů v n-rozměrný prostor je nakreslena kulisa skládající se z n paralelní čáry, obvykle svislé a rovnoměrně rozmístěné. Bod dovnitř n-dimenzionální prostor je reprezentován jako a křivka s vrcholy na paralelních osách; poloha vrcholu na i-tá osa odpovídá i-th koordinovat bodu.
Tato vizualizace úzce souvisí s časové řady vizualizace, kromě toho, že se aplikuje na data, kde osy neodpovídají časovým bodům, a proto nemají přirozený řád. Proto mohou být zajímavá různá uspořádání os.
Dějiny
Paralelní souřadnice byly často považovány za vynalezené Philbert Maurice d'Ocagne (fr) v roce 1885,[1] ale přestože se v názvu knihy objevují slova „Coordonnées parallèles“, tato práce nemá nic společného se stejnojmennými vizualizačními technikami; kniha popisuje pouze metodu transformace souřadnic. Ale ještě před rokem 1885 byly použity paralelní souřadnice, například v Henry Gannetts „General Summary, showing the Rank of States, by Ratios, 1880“,[2] nebo později v Henry Gannetts „Hodnost států a území v populaci při každém sčítání lidu, 1790-1890“ v roce 1898. Byly znovu popularizovány o 79 let později Alfred Inselberg [3] v roce 1959 a systematicky vyvíjen jako souřadnicový systém od roku 1977. Některé důležité aplikace jsou v algoritmy pro předcházení kolizím pro kontrola letového provozu (1987–3 USA patenty), dolování dat (Patent USA), počítačové vidění (Patent USA), Optimalizace, kontrola procesu, více nedávno v detekce narušení a jinde.
Vyšší rozměry
V letadle s xy kartézským souřadným systémem a přidáním dalších rozměry v paralelních souřadnicích (často zkráceno || -coords nebo PCP) zahrnuje přidání více os. Hodnota paralelních souřadnic spočívá v tom, že určité geometrické vlastnosti ve vysokých rozměrech se transformují do snadno viditelných 2D vzorů. Například sada bodů na řádku v n-prostor se transformuje na sadu křivky v paralelních souřadnicích se všechny protínají v n - 1 bod. Pro n = 2 získá se bodová dualita poukazující na to, proč jsou matematické základy paralelních souřadnic vyvinuty v projektivní spíše než euklidovský prostor. Dvojice linií protíná jedinečný bod, který má dvě souřadnice, a proto může odpovídat jedinečné linii, která je také určena dvěma parametry (nebo dvěma body). Naopak k určení křivky jsou zapotřebí více než dva body a také dvojice křivek nemusí mít jedinečný průnik. Proto se použitím křivek v rovnoběžných souřadnicích místo přímek ztrácí dualita bodové čáry spolu se všemi ostatními vlastnostmi projektivní geometrie a známými pěknými výškovými vzory odpovídajícími (hyper) rovinám, křivkám, několika hladkým (hyper) povrchům blízkosti, konvexnost a nedávno neorientovatelnost.[4] Cílem je mapovat n-dimenzionální vztahy do 2D vzorů. Paralelní souřadnice tedy nejsou mapováním point-to-point, ale spíše a nMapování podmnožiny D na 2D podmnožinu nedochází ke ztrátě informací. Poznámka: dokonce ani bod v nD není mapován do bodu ve 2D, ale na polygonální čáru - podmnožinu 2D.
Statistické úvahy

Při použití pro vizualizaci statistických dat existují tři důležité aspekty: pořadí, rotace a změna měřítka os.
Pořadí os je rozhodující pro hledání funkcí a při typické analýze dat bude třeba vyzkoušet mnoho přeskupení. Někteří autoři přišli s heuristikou objednávání, která by mohla vytvořit osvětlovací uspořádání.[5]
Otáčení os je posunutí rovnoběžných souřadnic a pokud se čáry protínají mimo rovnoběžné osy, lze je mezi nimi přenést pomocí rotací. Nejjednodušším příkladem je otočení osy o 180 stupňů.[6]
Škálování je nutné, protože graf je založen na interpolaci (lineární kombinaci) po sobě jdoucích párů proměnných.[6] Proto musí být proměnné v běžném měřítku a existuje mnoho metod škálování, které je třeba považovat za součást procesu přípravy dat, které mohou odhalit více informativních pohledů.
Hladkého paralelního souřadnicového grafu je dosaženo pomocí splajnů.[7] Na plynulém grafu je každé pozorování mapováno do parametrické čáry (nebo křivky), která je hladká, spojitá na osách a kolmá ke každé rovnoběžné ose. Tento design zdůrazňuje úroveň kvantizace pro každý datový atribut.[6]
Čtení
Inselberg (Inselberg 1997 ) provedl úplný přehled o tom, jak vizuálně přečíst relační vzorce paralelních coordů.[8] Když je většina přímek mezi dvěma rovnoběžnými osami navzájem poněkud paralelní, naznačuje to pozitivní vztah mezi těmito dvěma dimenzemi. Když se čáry protínají v jakési superpozici tvarů X, je to negativní vztah. Když se čáry protínají náhodně nebo jsou rovnoběžné, ukazuje to, že neexistuje žádný konkrétní vztah.
Omezení
V paralelních souřadnicích může mít každá osa nanejvýš dvě sousední osy (jednu vlevo a druhou vpravo). Pro d-dimenzionální datovou sadu lze najednou zobrazit maximálně d-1 vztahy. v časové řady vizualizace, existuje přirozený předchůdce a následník; proto v tomto zvláštním případě existuje výhodné uspořádání. Pokud však osy nemají jedinečné pořadí, nalezení dobrého uspořádání os vyžaduje použití heuristiky a experimentování. Aby bylo možné prozkoumat složitější vztahy, je nutné změnit pořadí os.
Uspořádáním os v trojrozměrném prostoru (stále však paralelně, jako hřebíky v lůžku na nehty) může mít osa více než dva sousedy v kruhu kolem centrálního atributu a problém s uspořádáním se usnadní (například používat minimální kostra ).[9] Prototyp této vizualizace je k dispozici jako rozšíření softwaru pro dolování dat ELKI. Vizualizace je však těžší interpretovat a interagovat s ním než s lineárním řádem.
Software
I když existuje velké množství článků o paralelních souřadnicích, existuje jen málo veřejně dostupného softwaru pro převod databází do grafiky paralelních souřadnic.[10] Pozoruhodný software je ELKI, GGobi, Mondrian, oranžový a VYKOŘENIT. Mezi knihovny patří Protovis.js, D3.js poskytuje základní příklady. Byl také publikován D3.Parcoords.js (knihovna založená na D3), která je speciálně věnována paralelní grafice. The Krajta datová struktura a analytická knihovna Pandy implementuje paralelní vykreslování souřadnic pomocí knihovny vykreslování matplotlib.[11]
Další vizualizace pro data s více proměnnými
- Radarový graf - vizualizace s radiálně uspořádanými souřadnými osami
- Andrews spiknutí - Fourierova transformace grafu paralelních souřadnic
Reference
- ^ d'Ocagne, Maurice (1885). Coordonnées parallèles et axiales: Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèles. Paříž: Gauthier-Villars.
- ^ Gannett, Henry. „Obecné shrnutí ukazující pořadí států podle poměrů 1880“. Citovat deník vyžaduje
| deník =
(Pomoc) - ^ Inselberg, Alfred (1985). "Rovina s paralelními souřadnicemi". Vizuální počítač. 1 (4): 69–91. doi:10.1007 / BF01898350.
- ^ Inselberg, Alfred (2009). Paralelní souřadnice: VISUAL Multidimensional Geometry and its Applications. Springer. ISBN 978-0387215075.
- ^ Yang, Jing; Peng, Wei; Ward, Matthew O .; Rundensteiner, Elke A. (2003). „Interaktivní hierarchická dimenze objednávání mezer a filtrování pro průzkum datových sad s vysokou dimenzí“ (PDF). Sympozium IEEE o vizualizaci informací (INFOVIS 2003): 3–4.
- ^ A b C Moustafa, Rida; Wegman, Edward J. (2006). "Vícerozměrné spojité údaje - paralelní souřadnice". In Unwin, A .; Theus, M .; Hofmann, H. (eds.). Grafika velkých datových sad: Vizualizace milionu. Springer. 143–156. ISBN 978-0387329062.
- ^ Moustafa, Rida; Wegman, Edward J. (2002). „K některým zevšeobecněním paralelních souřadnicových grafů“ (PDF). See a Million, A Data Visualization Workshop, Rain Am Lech (Nr.), Německo. Archivovány od originál (PDF) dne 24. 12. 2013.
- ^ Inselberg, A. (1997), „Multidimensional detective“, Informační vizualizace, 1997. Proceedings., IEEE Symposium on, str. 100–107, doi:10.1109 / INFVIS.1997.636793, ISBN 0-8186-8189-6
- ^ Elke Achtert, Hans-Peter Kriegel, Erich Schubert, Arthur Zimek (2013). "Interaktivní dolování dat pomocí stromů 3D-paralelních souřadnic". Sborník mezinárodní konference ACM o správě dat (SIGMOD). New York City, NY: 1009. doi:10.1145/2463676.2463696. ISBN 9781450320375.CS1 maint: více jmen: seznam autorů (odkaz)
- ^ Kosara, Robert (2010). "Paralelní souřadnice".
- ^ Paralelní souřadnice v pandách
Další čtení
- Heinrich, Julian a Weiskopf, Daniel (2013) Současný stav paralelních souřadnic, Eurographics 2013 - State of the Art Reports, s. 95–116
- Moustafa, Rida (2011) Paralelní souřadnice a grafy hustoty paralelních souřadnic, Wiley Interdisciplinary Reviews: Computational Statistics, Vol 3 (2), str. 134–148.
- Weidele, Daniel Karl I. (2019) Podmíněné paralelní souřadnice, IEEE Visualization Conference (VIS) 2019, s. 221–225
externí odkazy
- Domovská stránka Alfreda Inselberga, Vizuální výuka, Historie, Vybrané publikace a aplikace
- Vyšetřování metod pro vizualizaci vysoce vícerozměrných datových sad autori C. Brunsdon, A. S. Fotheringham a M. E. Charlton, University of Newcastle, Spojené království
- Použití křivek k vylepšení paralelních vizualizací souřadnic autor: Martin Graham & Jessie Kennedy, Napier University, Edinburgh, Spojené království
- Paralelní souřadnice, tutoriál od Roberta Kosary
- Podmíněné paralelní souřadnice - Rekurzivní varianta paralelních souřadnic, kde lze kategorickou hodnotu rozšířit a odhalit další úroveň paralelních souřadnic.