Vizualizace dat - Data visualization

Vizualizace dat je interdisciplinární obor, který se zabývá grafický zastoupení z data. Jedná se o obzvláště efektivní způsob komunikace, když je dat mnoho, jako například a Časové řady. Z akademického hlediska lze tuto reprezentaci považovat za mapování mezi původními daty (obvykle číselnými) a grafickými prvky (například čáry nebo body v grafu). Mapování určuje, jak se liší atributy těchto prvků podle dat. V tomto světle je sloupcový graf mapování délky pruhu na velikost proměnné. Protože grafický design mapování může nepříznivě ovlivnit čitelnost grafu,[1] mapování je základní kompetencí vizualizace dat. Vizualizace dat má své kořeny v oblasti Statistika a je proto obecně považována za pobočku Deskriptivní statistika. Jelikož jsou však k efektivní vizualizaci zapotřebí jak návrhářské dovednosti, tak statistické a výpočetní dovednosti, někteří autoři tvrdí, že se jedná o umění i vědu.[2]

Přehled

Vizualizace dat je jedním z kroků při analýze dat a jejich prezentaci uživatelům.


Pro jasnou a efektivní komunikaci informací využívá vizualizace dat statistická grafika, pozemky, informační grafika a další nástroje. Numerická data mohou být kódována pomocí teček, čar nebo pruhů pro vizuální komunikaci kvantitativní zprávy.[3] Efektivní vizualizace pomáhá uživatelům analyzovat a zdůvodňovat data a důkazy. Díky tomu jsou složitá data přístupnější, srozumitelnější a použitelnější. Uživatelé mohou mít konkrétní analytické úkoly, jako je porovnávání nebo porozumění kauzalita a návrhový princip grafiky (tj. porovnání nebo kauzalita) sleduje úkol. Tabulky se obecně používají tam, kde uživatelé vyhledají konkrétní měření, zatímco grafy různých typů se používají k zobrazení vzorů nebo vztahů v datech pro jednu nebo více proměnných.

Vizualizace dat označuje techniky používané ke komunikaci dat nebo informací jejich kódováním jako vizuálních objektů (např. Bodů, čar nebo pruhů) obsažených v grafice. Cílem je sdělit uživatelům informace jasně a efektivně. Je to jeden z kroků analýza dat nebo datová věda. Podle Vitaly Friedman (2008) „hlavním cílem vizualizace dat je sdělovat informace jasně a efektivně pomocí grafických prostředků. Neznamená to, že vizualizace dat musí vypadat nudně, aby byla funkční, nebo extrémně sofistikovaná, aby vypadala krásně. efektivně musí jít jak estetická forma, tak i funkčnost ruku v ruce a poskytnout vhled do poněkud řídkého a komplexního souboru dat prostřednictvím intuitivnější komunikace jejích klíčových aspektů. Designéři však často nedosahují rovnováhy mezi formou a funkcí a vytvářejí nádherné vizualizace dat, které nesplňují svůj hlavní účel - sdělovat informace ".[4]

Vskutku, Fernanda Viegas a Martin M. Wattenberg navrhl, že ideální vizualizace by měla nejen jasně komunikovat, ale stimulovat zapojení a pozornost diváka.[5]

Vizualizace dat úzce souvisí s informační grafika, informační vizualizace, vědecká vizualizace, průzkumná analýza dat a statistická grafika. V novém tisíciletí se vizualizace dat stala aktivní oblastí výzkumu, výuky a vývoje. Podle Post et al. (2002), sjednotila vědeckou a informační vizualizaci.[6]

V komerčním prostředí se vizualizace dat často označuje jako řídicí panely. Infografika jsou další velmi běžnou formou vizualizace dat.

Vlastnosti efektivních grafických zobrazení

Charles Joseph Minard diagram 1869 z roku 1869 Napoleonská invaze Francie do Ruska, časný příklad informační grafiky
Největší hodnota obrázku je, když nás nutí všímat si toho, co jsme nikdy nečekali.

John Tukey[7]

Profesor Edward Tufte vysvětlil, že uživatelé informačních displejů provádějí zejména analytické úkoly například dělat srovnání. The princip návrhu informační grafiky by měl podporovat analytický úkol.[8] Jak ukazují William Cleveland a Robert McGill, různé grafické prvky toho dosahují víceméně efektivně. Například tečkové grafy a pruhové grafy překonávají výsečové grafy.[9]

Ve své knize z roku 1983 Vizuální zobrazení kvantitativních informací, Edward Tufte definuje „grafické displeje“ a principy efektivního grafického zobrazení v následující pasáži: „Dokonalost ve statistické grafice se skládá ze složitých myšlenek komunikovaných s jasností, přesností a účinností. Grafická zobrazení by měla:

  • zobrazit data
  • přimět diváka, aby přemýšlel spíše o podstatě než o metodice, grafickém designu, technologii grafické produkce nebo něčem jiném
  • vyhněte se narušení toho, co mají údaje říkat
  • prezentovat mnoho čísel na malém prostoru
  • zajistit soudržnost velkých souborů dat
  • povzbuzujte oko, aby porovnávalo různé údaje
  • odhalit data na několika úrovních podrobností, od širokého přehledu až po jemnou strukturu
  • sloužit rozumně jasnému účelu: popisu, průzkumu, tabulkování nebo dekoraci
  • být úzce propojeny se statistickými a slovními popisy souboru údajů.

Grafika odhalit data. Grafika může být skutečně přesnější a odhalující než běžné statistické výpočty. “[10]

Například Minardův diagram ukazuje ztráty, které utrpěla Napoleonova armáda v období 1812–1813. Je vyneseno šest proměnných: velikost armády, její umístění na dvojrozměrném povrchu (x a y), čas, směr pohybu a teplota. Šířka čáry ilustruje srovnání (velikost armády v časových bodech), zatímco teplotní osa naznačuje příčinu změny velikosti armády. Toto vícerozměrné zobrazení na dvourozměrném povrchu vypráví příběh, který lze okamžitě uchopit při identifikaci zdrojových dat, aby se zvýšila důvěryhodnost. Tufte napsal v roce 1983, že: „Může to být nejlepší statistická grafika, která byla kdy nakreslena.“[10]

Nepoužívání těchto zásad může mít za následek zavádějící grafy, které narušují zprávu nebo podporují chybný závěr. Podle Tufte, chartjunk odkazuje na cizí vnitřní výzdobu grafiky, která nezvyšuje poselství, nebo bezdůvodné trojrozměrné nebo perspektivní efekty. Zbytečné oddělení vysvětlujícího klíče od samotného obrazu, vyžadující, aby oko cestovalo tam a zpět z obrazu na klíč, je formou „administrativního odpadu“. Poměr „dat k inkoustu“ by měl být maximalizován, pokud je to možné, mazání inkoustu, který není datový, by měl být vymazán.[10]

The Kongresová rozpočtová kancelář shrnul několik nejlepších postupů pro grafické displeje v prezentaci z června 2014. Patřilo mezi ně: a) znalost vašeho publika; b) Navrhování grafik, které mohou být samostatné mimo rámec zprávy; a c) navrhování grafik, které komunikují klíčové zprávy ve zprávě.[11]

Kvantitativní zprávy

Časová řada ilustrovaná spojnicovým grafem demonstrujícím trendy ve federálních výdajích a příjmech v USA v průběhu času
Bodový graf ilustrující negativní korelaci mezi dvěma proměnnými (inflací a nezaměstnaností) měřenou v jednotlivých časových bodech

Autor Stephen Few popsal osm typů kvantitativních zpráv, kterým se uživatelé mohou pokusit porozumět nebo komunikovat ze sady dat a přidružené grafy použité k komunikaci zprávy:

  1. Časové řady: Jedna proměnná je zachycena za určité časové období, například míra nezaměstnanosti za desetileté období. A spojnicový graf lze použít k prokázání trendu.
  2. Hodnocení: Kategorické členění je řazeno vzestupně nebo sestupně, například pořadí prodejních výkonů ( opatření) prodejci (dále jen kategorie, s každým prodejcem a kategorické dělení) během jednoho období. A sloupcový graf lze použít k zobrazení srovnání mezi prodejci.
  3. Část k celku: Kategorické členění se měří jako poměr k celku (tj. Procento ze 100%). A výsečový graf nebo sloupcový graf může ukázat srovnání poměrů, jako je podíl na trhu představovaný konkurenty na trhu.
  4. Odchylka: Kategorické členění se porovnává s referencí, jako je srovnání skutečných vs. rozpočtových výdajů pro několik oddělení podniku pro dané časové období. Sloupcový graf může zobrazit srovnání skutečné a referenční částky.
  5. Distribuce frekvence: Zobrazuje počet pozorování konkrétní proměnné pro daný interval, například počet let, během nichž se návratnost akciového trhu pohybuje mezi intervaly, například 0-10%, 11-20% atd. A histogram Pro tuto analýzu lze použít typ sloupcového grafu. A boxplot pomáhá vizualizovat klíčové statistiky o distribuci, jako je medián, kvartily, odlehlé hodnoty atd.
  6. Korelace: Porovnání pozorování představovaných dvěma proměnnými (X, Y), aby se zjistilo, zda mají tendenci se pohybovat ve stejném nebo opačném směru. Například vykreslení nezaměstnanosti (X) a inflace (Y) na vzorku měsíců. A bodový diagram se pro tuto zprávu obvykle používá.
  7. Nominální srovnání: Porovnání kategoriálního členění v žádném konkrétním pořadí, například objem prodeje podle kódu produktu. Pro toto srovnání lze použít sloupcový graf.
  8. Zeměpisný nebo geoprostorové: Porovnání proměnné na mapě nebo rozvržení, například míra nezaměstnanosti podle státu nebo počet osob na různých patrech budovy. A kartogram je typická použitá grafika.[3][12]

Analytici, kteří kontrolují soubor dat, mohou zvážit, zda jsou některé nebo všechny výše uvedené zprávy a grafické typy použitelné pro jejich úkol a publikum. Součástí je proces pokusů a omylů za účelem identifikace smysluplných vztahů a zpráv v datech průzkumná analýza dat.

Vizuální vnímání a vizualizace dat

Člověk dokáže snadno rozlišit rozdíly v délce, tvaru, orientaci, vzdálenostech a barevném odstínu čáry bez významného úsilí při zpracování; tyto jsou označovány jako „předběžné atributy ". Například může vyžadovat značné množství času a úsilí (" pozorné zpracování ") k identifikaci toho, kolikrát se číslice" 5 "objeví v řadě čísel; pokud se však tato číslice liší velikostí, orientací nebo barvou, instance číslice lze rychle zaznamenat pomocí pozorného zpracování.[13]

Efektivní grafika využívá výhod pozorného zpracování a atributů a relativní síly těchto atributů. Například protože lidé mohou snáze zpracovat rozdíly v délce čáry než v ploše, může být efektivnější použít sloupcový graf (který k porovnání slouží jako výhoda délky čáry) místo výsečových grafů (které k porovnání používají povrchovou plochu ).[13]

Lidské vnímání / poznávání a vizualizace dat

Téměř všechny vizualizace dat jsou vytvořeny pro lidskou spotřebu. Při navrhování intuitivních vizualizací je nutná znalost lidského vnímání a poznávání.[14] Poznání označuje procesy v lidských bytostech, jako je vnímání, pozornost, učení, paměť, myšlení, formování konceptů, čtení a řešení problémů.[15] Lidské vizuální zpracování je efektivní při zjišťování změn a porovnávání množství, velikostí, tvarů a variací lehkosti. Když jsou vlastnosti symbolických dat mapovány na vizuální vlastnosti, lidé mohou efektivně procházet velkým množstvím dat. Odhaduje se, že 2/3 mozkových neuronů mohou být zapojeny do vizuálního zpracování. Správná vizualizace poskytuje odlišný přístup k zobrazení potenciálních spojení, vztahů atd., Které v nevizualizovaných kvantitativních datech nejsou tak zřejmé. Vizualizace se může stát prostředkem průzkum dat.

Studie prokázaly, že jednotlivci využívají v průměru o 19% méně kognitivních zdrojů a o 4,5% lépe dokáží vybavit detaily při porovnání vizualizace dat s textem.[16]

Historie vizualizace dat

Vybrané milníky a vynálezy

Neexistuje žádná komplexní „historie“ vizualizace dat. Neexistují žádné účty, které by pokrývaly celý vývoj vizuálního myšlení a vizuální reprezentace dat a které shromažďují příspěvky různorodých disciplín.[17] Michael Friendly a Daniel J Denis z York University jsou zapojeni do projektu, který se pokouší poskytnout komplexní historii vizualizace. Navzdory obecnému přesvědčení není vizualizace dat moderním vývojem. Od pravěku byla hvězdná data nebo informace, jako je například umístění hvězd, vizualizována na stěnách jeskyní (například ty, které se nacházejí v Jeskyně Lascaux v jižní Francii) od Pleistocén éra.[18] Fyzické artefakty jako Mesopotamian hliněné žetony (5500 př. Nl), Inca quipus (2600 př. N. L.) A Marshallovy ostrovy tyčové grafy (n.d.) lze také považovat za vizualizaci kvantitativních informací.[19][20]

První dokumentovanou vizualizaci dat lze vysledovat zpět do roku 1160 př. N.l. s Turínská mapa papyru který přesně ilustruje distribuci geologických zdrojů a poskytuje informace o těžbě těchto zdrojů.[21] Takové mapy lze kategorizovat jako tematická kartografie, což je typ vizualizace dat, který prezentuje a sděluje konkrétní data a informace prostřednictvím geografické ilustrace určené k zobrazení konkrétního tématu spojeného s konkrétní geografickou oblastí. Nejdříve zdokumentované formy vizualizace dat byly různé tematické mapy z různých kultur a ideogramy a hieroglyfy, které poskytovaly a umožňovaly interpretaci ilustrovaných ilustrací. Například, Lineární B tablety Mykény poskytl vizualizaci informací týkajících se obchodů z doby pozdní doby bronzové ve Středomoří. Myšlenku souřadnic využili staroegyptští geodeti při vytyčování měst, pozemské a nebeské polohy se nacházely podle něčeho podobného zeměpisné šířce a délce alespoň do roku 200 př. N.l. Claudius Ptolemaios [c.85 – c. 165] v Alexandrii sloužil jako referenční standardy až do 14. století.[21]

Vynález papíru a pergamenu umožnil další vývoj vizualizací v celé historii. Obrázek ukazuje graf z 10. nebo možná 11. století, který má sloužit jako ilustrace planetárního hnutí a je použit v příloze učebnice klášterních škol.[22] Graf měl zjevně představovat graf sklonů planetárních oběžných drah v závislosti na čase. Z tohoto důvodu byla zóna zvěrokruhu znázorněna v rovině s vodorovnou čarou rozdělenou na třicet částí jako časová nebo podélná osa. Svislá osa označuje šířku zvěrokruhu. Zdá se, že horizontální měřítko bylo zvoleno pro každou planetu zvlášť, protože období nelze sladit. Doprovodný text se týká pouze amplitud. Křivky zjevně nesouvisí v čase.

Planetární pohyby

V 16. století byly dobře vyvinuty techniky a nástroje pro přesné pozorování a měření fyzikálních veličin a zeměpisná a nebeská poloha (například „nástěnný kvadrant“ zkonstruovaný Tycho Brahe [1546–1601], pokrývající celou zeď ve své hvězdárně). Obzvláště důležitý byl vývoj triangulace a dalších metod k přesnému určení míst mapování.[17]

Francouzský filozof a matematik René Descartes a Pierre de Fermat vyvinula analytickou geometrii a dvourozměrný souřadnicový systém, který silně ovlivnil praktické metody zobrazování a výpočtu hodnot. Fermat a Blaise Pascal Práce na statistice a teorii pravděpodobnosti položila základy pro to, co nyní pojmeme jako data.[17] Podle Interaction Design Foundation tento vývoj Williamovi umožnil a pomohl Hraj fér, kteří viděli potenciál pro grafickou komunikaci kvantitativních dat, generovat a rozvíjet grafické metody statistiky.[14]

Playfair TimeSeries

Ve druhé polovině 20. století Jacques Bertin používá kvantitativní grafy k reprezentaci informací „intuitivně, jasně, přesně a efektivně“.[14]

John Tukey a Edward Tufte posunuli hranice vizualizace dat; Tukey se svým novým statistickým přístupem k průzkumné analýze dat a Tufte se svou knihou „Vizuální zobrazení kvantitativních informací“ připravil cestu pro zdokonalení technik vizualizace dat pro více než statisty. S pokrokem technologie přišel i pokrok vizualizace dat; počínaje ručně kreslenými vizualizacemi a vývojem do více technických aplikací - včetně interaktivních návrhů vedoucích k vizualizaci softwaru.[23]

Programy jako SAS, GAUČ, R, Minitab, Základní kámen a další umožňují vizualizaci dat v oblasti statistiky. Další aplikace pro vizualizaci dat, více zaměřené a jedinečné pro jednotlivce, programovací jazyky, jako je D3, Krajta a JavaScript přispět k možnosti vizualizace kvantitativních údajů. Soukromé školy také vyvinuly programy, které uspokojí poptávku po vizualizaci dat učení a souvisejících programovacích knihoven, včetně bezplatných programů jako Datový inkubátor nebo placené programy jako Valné shromáždění.[24]

Počínaje sympoziem „Data to Discovery“ v roce 2013 uspořádaly ArtCenter College of Design, Caltech a JPL v Pasadeně každoroční program interaktivní vizualizace dat.[25] Program se ptá: Jak může interaktivní vizualizace dat pomoci vědcům a technikům efektivněji zkoumat jejich data? Jak může výpočet, design a designové myšlení pomoci maximalizovat výsledky výzkumu? Jaké metodiky jsou nejúčinnější pro využití znalostí z těchto oborů? Zakódováním relačních informací s vhodnými vizuálními a interaktivními charakteristikami, které pomáhají vyslýchat a nakonec získat nový pohled na data, program vyvíjí nové interdisciplinární přístupy ke komplexním vědeckým problémům, kombinuje designové myšlení a nejnovější metody od výpočetní techniky, designu zaměřeného na uživatele, designu interakce a 3D grafika.

Terminologie

Vizualizace dat zahrnuje specifickou terminologii, z nichž některé jsou odvozeny ze statistik. Například autor Stephen Few definuje dva typy dat, které se používají v kombinaci k podpoře smysluplné analýzy nebo vizualizace:

  • Kategorické: Představují skupiny objektů se zvláštní charakteristikou. Kategorické proměnné mohou být buď nominální, nebo řadové. Nominální proměnné, například pohlaví, mezi sebou nemají pořadí a jsou tedy nominální. Pořadové proměnné jsou kategorie s objednávkou, pro vzorkování záznamu věkové skupiny, do které někdo spadá.[26]
  • Kvantitativní: Reprezentujte měření, jako je výška osoby nebo teplota prostředí. Kvantitativní proměnné mohou být buď kontinuální nebo diskrétní. Kontinuální proměnné zachycují myšlenku, že měření lze vždy provádět přesněji. Zatímco diskrétní proměnné mají jen omezený počet možností, například počet některých výsledků nebo věk měřený v celých letech.[26]

Rozdíl mezi kvantitativními a kategorickými proměnnými je důležitý, protože tyto dva typy vyžadují různé metody vizualizace.

Dva primární typy informační displeje jsou tabulky a grafy.

  • A stůl obsahuje kvantitativní data uspořádaná do řádků a sloupců s kategorickými štítky. Primárně se používá k vyhledání konkrétních hodnot. Ve výše uvedeném příkladu může mít tabulka popisky kategorických sloupců představující název (a kvalitativní proměnná) a věk (a kvantitativní proměnná), přičemž každý řádek dat představuje jednu osobu (vzorkovaná experimentální jednotka nebo dělení kategorie).
  • A graf se primárně používá k zobrazení vztahů mezi daty a zobrazuje hodnoty kódované jako vizuální objekty (např. čáry, pruhy nebo body). Číselné hodnoty se zobrazují v oblasti vymezené jednou nebo více sekery. Tyto osy poskytují váhy (kvantitativní a kategorické) používané k označení a přiřazení hodnot vizuálním objektům. Mnoho grafů se také označuje jako grafy.[27]

Eppler a Lengler vyvinuli „Periodickou tabulku metod vizualizace“, interaktivní graf zobrazující různé metody vizualizace dat. Zahrnuje šest typů metod vizualizace dat: data, informace, koncept, strategie, metafora a sloučenina.[28]

Příklady diagramů používaných pro vizualizaci dat

názevVizuální rozměryPopis / Příklad použití
Sloupcový graf tipů podle dnů v týdnu
Sloupcový graf
  • délka / počet
  • kategorie
  • barva
  • Představuje kategorická data s obdélníkový bary s výšky nebo délky úměrné hodnotám, které představují. Pruty lze vykreslit svisle nebo vodorovně.
  • Sloupcový graf ukazuje srovnání mezi oddělený Kategorie. Jedna osa grafu zobrazuje konkrétní kategorie, které se porovnávají, a druhá osa představuje měřenou hodnotu.
  • Některé sloupcové grafy zobrazují sloupce seskupené do skupin více než jedné, ukazující hodnoty více než jedné měřené proměnné. Tyto seskupené skupiny lze rozlišit pomocí barvy.
  • Například; srovnání hodnot, jako je prodejní výkon u několika osob nebo podniků v jednom časovém období.
Histogram cen bydlení
Histogram
  • limity koše
  • počet / délka
  • barva
  • Přibližné znázornění rozdělení číselných údajů. Rozdělte celý rozsah hodnot do řady intervalů a poté spočítejte, kolik hodnot spadá do každého intervalu, který se nazývá binning. Zásobníky jsou obvykle specifikovány jako po sobě jdoucí, nepřekrývající se intervaly proměnné. Koše (intervaly) musí sousedit a jsou často (ale nemusí být) stejné velikosti.
  • Například stanovení četnosti ročního procentního výnosu akciového trhu v rámci konkrétních rozsahů (přihrádek), jako je 0-10%, 11-20% atd. Výška sloupce představuje počet pozorování (let) s návratností% v rozsah představovaný příslušným košem.
Základní bodový graf dvou proměnných
Bodový diagram
  • x pozice
  • y pozice
  • symbol / glyf
  • barva
  • velikost
  • Použití Kartézské souřadnice k zobrazení hodnot pro obvykle dva proměnné pro soubor dat.
  • Body lze kódovat pomocí barvy, tvaru a / nebo velikosti pro zobrazení dalších proměnných.
  • Každý bod na grafu má přidružený termín x a y, který určuje jeho umístění na kartézské rovině.
  • Bodové grafy se často používají ke zvýraznění korelace mezi proměnnými (xay).
Bodový diagram
Bodový graf (3D)
  • pozice x
  • pozice y
  • pozice z
  • barva
  • symbol
  • velikost
  • Podobně jako výše uvedený dvourozměrný bodový graf, trojrozměrný bodový graf vizualizuje vztah mezi typicky 3 proměnnými ze sady dat.
  • Bod lze znovu kódovat pomocí barvy, tvaru a / nebo velikosti pro zobrazení dalších proměnných
Síťová analýza
Síť
  • velikost uzlů
  • barva uzlů
  • tloušťka vazby
  • barva kravat
  • prostorovost
  • Hledání klastrů v síti (např. Seskupování přátel z Facebooku do různých klastrů).
  • Objevování mostů (informačních makléřů nebo hraničních klíčů) mezi klastry v síti
  • Určení nejvlivnějších uzlů v síti (např. Společnost chce cílit na malou skupinu lidí na Twitteru pro marketingovou kampaň).
  • Nalezení odlehlých aktérů, kteří se nevejdou do žádného klastru nebo jsou na okraji sítě.
Výsečový graf
Výsečový graf
  • barva
  • Představuje jednu kategoriální proměnnou, která je rozdělena do řezů pro ilustraci číselného poměru. V koláčovém grafu je délka oblouku každého řezu (a následně jeho středový úhel a plocha ), je úměrný na množství, které představuje.
  • Například, jak je znázorněno v grafu vpravo, podíl Angličtina rodilí mluvčí po celém světě
Čárový graf
Čárový graf
  • x pozice
  • y pozice
  • symbol / glyf
  • barva
  • velikost
  • Představuje informace jako řadu datových bodů zvaných „značky“ spojených přímkovými segmenty.
  • Podobně jako a bodový diagram kromě toho, že měřicí body jsou seřazeny (obvykle podle jejich hodnoty v ose x) a spojeny s přímými segmenty.
  • Často se používá k vizualizaci trendu v datech v časových intervalech - a časové řady - tedy čára je často vykreslena chronologicky.
Streamgraf
Streamgraf
  • šířka
  • barva
  • čas (průtok)
  • Typ skládaný plošný graf který je přemístěn kolem a středová osa, což má za následek plynulý tvar.
  • Na rozdíl od tradičního skládaného plošného grafu, ve kterém jsou vrstvy naskládány na osu, jsou v proudovém grafu vrstvy umístěny tak, aby se minimalizovalo jejich „kroucení“.
  • Streamgrafy zobrazují data pouze s kladnými hodnotami a nejsou schopné představovat záporné i kladné hodnoty.
  • Například pravý vizuál zobrazuje hudbu poslouchanou uživatelem na začátku roku 2012
Treemap
Treemap
  • velikost
  • barva
  • Je metoda pro zobrazení hierarchický použití dat vnořené postavy, obvykle obdélníky.
  • Například místo na disku podle umístění / typu souboru
Ganttův diagram
Ganttův diagram
  • barva
  • čas (průtok)
Teplotní mapa
Teplotní mapa
  • barva
  • kategorická proměnná
  • Představuje velikost jevu jako barvu ve dvou dimenzích.
  • Existují dvě kategorie tepelných map:
    • klastrová tepelná mapa: kde jsou veličiny rozloženy do matice pevné velikosti buněk, jejíž řádky a sloupce jsou kategorickými údaji. Například graf vpravo.
    • prostorová tepelná mapa: kde není matice pevné velikosti buněk, například tepelná mapa. Například teplotní mapa zobrazující hustotu obyvatelstva zobrazenou na geografické mapě
Pruhová grafika
Pruhová grafika
  • x pozice
  • barva
  • Používá řadu barevných pruhů chronologicky uspořádaných k vizuálnímu zobrazení dlouhodobých teplotních trendů.
  • Zobrazuje jedinou proměnnou - prototypicky teplota v průběhu času vylíčit globální oteplování
  • Záměrně minimalistický - bez technických indicií - komunikovat intuitivně s vědci[29]
  • Lze jej „skládat“, aby představoval množné číslo (příklad )
Animovaná spirálová grafika
Animovaná spirálová grafika
  • radiální vzdálenost (závislá proměnná)
  • úhel otáčení (cyklování po měsících)
  • barva (uplynulé roky)
  • Zobrazuje jednu závislou proměnnou - prototypicky teplota v průběhu času vylíčit globální oteplování
  • Závislá proměnná se postupně vykresluje podél spojité „spirály“, která je určena jako funkce (a) neustále se otáčejícího úhlu (dvanáct měsíců na otáčku) a (b) vyvíjející se barvy (změny barev v průběhu let)[30]
Krabice a vousy
Krabice a vousy
  • osa x
  • osa y
  • Metoda pro grafické znázornění skupin číselných dat prostřednictvím jejich kvartily.
  • Krabicové grafy mohou mít také čáry vybíhající z krabic (vousky) označující variabilitu mimo horní a dolní kvartily.
  • Odlehlé hodnoty lze vykreslit jako jednotlivé body.
  • Dva rámečky, které jsou navzájem graficky znázorněny, představují středních 50% dat, přičemž čára oddělující dva rámečky identifikující střední hodnotu dat a horní a spodní okraj rámečků představují 75. a 25. percentil datových bodů.
  • Krabicové grafy jsou neparametrické: zobrazují variace ve vzorcích a statistická populace aniž by činily jakékoli předpoklady podkladového aktiva statistické rozdělení, jsou tedy užitečné pro počáteční pochopení souboru dat. Například srovnání rozdělení věku mezi skupinu lidí (např. Muži a ženy).
Vývojový diagram
Vývojový diagram
  • Představuje a Pracovní postup, proces nebo postupný přístup k řešení úkolu.
  • Vývojový diagram zobrazuje kroky jako pole různých druhů a jejich pořadí propojením polí pomocí šipek.
  • Například odlehlé kroky, které je třeba provést, pokud lampa nefunguje, jak je znázorněno na obrázku vpravo.
Radarový graf
Radarový graf
  • atributy
  • hodnota přiřazená atributům
  • Displeje vícerozměrný data ve formě dvojrozměrného schéma tří nebo více kvantitativních proměnných představovaných na osách počínaje od stejného bodu.
  • Relativní poloha a úhel os je obvykle neinformativní, ale k seřazení proměnných (os) do relativních pozic, které odhalují odlišné korelace, kompromisy, lze použít různé heuristiky, jako jsou algoritmy, které vykreslují data jako maximální celkovou plochu. a mnoho dalších srovnávacích opatření.
  • Například srovnání atributů / dovedností (např. Komunikační, analytické, IT dovednosti) získaných na různých univerzitních stupních (např. Matematika, ekonomie, psychologie)
Vennův diagram
Vennův diagram
  • Všechno možný logický vztahy mezi konečnou sbírkou různých sady.
  • Pořady Všechno možný logický vztahy mezi konečnou sbírkou různých sady.
  • Tyto diagramy zobrazují elementy jako body v rovině a sady jako oblasti uvnitř uzavřených křivek.
  • Vennův diagram se skládá z několika překrývajících se uzavřených křivek, obvykle kruhů, z nichž každá představuje množinu.
  • Označené body uvnitř křivky S představují prvky množiny S, zatímco body mimo hranici představují prvky, které nejsou v množině S. To se hodí pro intuitivní vizualizace; například sada všech prvků, které jsou členy obou sad S a T, označeno ST a přečíst „křižovatku S a T", je vizuálně reprezentována oblastí překrytí regionů S a T. Ve Vennových diagramech se křivky všemožně překrývají a ukazují všechny možné vztahy mezi množinami.

Další perspektivy

K rozsahu vizualizace dat existují různé přístupy. Jedno společné zaměření je na prezentaci informací, jako je Friedman (2008). Friendly (2008) předpokládá dvě hlavní části vizualizace dat: statistická grafika, a tematická kartografie.[31] V tomto řádku poskytuje článek „Vizualizace dat: moderní přístupy“ (2007) přehled sedmi témat vizualizace dat:[32]

Všechny tyto předměty úzce souvisí grafický design a informační reprezentace.

Na druhou stranu od a počítačová věda perspektiva, Frits H. Post v roce 2002 kategorizoval pole do dílčích polí:[6][33]

V rámci Harvard Business Review vytvořil Scott Berinato rámec pro přístup k vizualizaci dat.[34] Aby uživatelé mohli začít myslet vizuálně, musí zvážit dvě otázky; 1) Co máte a 2) co děláte. Prvním krokem je identifikace, která data chcete vizualizovat. Je to založeno na datech, jako je zisk za posledních deset let, nebo koncepční nápad, jako je struktura konkrétní organizace. Jakmile je tato otázka zodpovězena, je možné se zaměřit na to, zda se snaží komunikovat informace (deklarativní vizualizace) nebo se snaží něco zjistit (průzkumná vizualizace). Scott Berinato kombinuje tyto otázky a dává čtyři typy vizuální komunikace, z nichž každý má své vlastní cíle.[34]

Tyto čtyři typy vizuální komunikace jsou následující;

  • myšlenková ilustrace (koncepční a deklarativní).[34]
    • Používá se k výuce, vysvětlování a / nebo jednoduše pojmy. Například organizační schémata a rozhodovací stromy.
  • generování nápadů (koncepční a průzkumné).[34]
    • Používá se k objevování, inovaci a řešení problémů. Například tabule po brainstormingu.
  • vizuální objev (založený na datech a průzkumný).[34]
    • Slouží k odhalení trendů a pochopení dat. Tento typ vizuálu je běžnější u velkých a složitých dat, kde je datová sada poněkud neznámá a úkol je otevřený.
  • každodenní vizualizace dat (řízená daty a deklarativní).[34]
    • Nejběžnější a nejjednodušší typ vizualizace používaný k potvrzení a nastavení kontextu. Například spojnicový graf HDP v průběhu času.

Architektura prezentace dat

Vizualizace dat z sociální média

Architektura prezentace dat (DPA) je sada dovedností, která se snaží identifikovat, lokalizovat, manipulovat, formátovat a prezentovat data takovým způsobem, aby optimálně sdělovala význam a správné znalosti.

Historicky termín architektura prezentace dat je přičítána Kelly Lauttové:[A] „Data Presentation Architecture (DPA) je zřídka používaná dovednost kritická pro úspěch a hodnotu Business Intelligence. Architektura prezentace dat vnáší vědu čísel, dat a statistik do systému Windows objevování cenných informací z dat a učinit je použitelnými, relevantními a použitelnými v umění vizualizace dat, komunikace, organizační psychologie a řízení změn za účelem poskytování řešení business intelligence s datovým rozsahem, časováním dodávek, formátem a vizualizacemi, které nejúčinněji podporují a řídí provozní, taktické a strategické chování směrem k pochopeným obchodním (nebo organizačním) cílům. DPA není ani IT ani obchodní dovedností, ale existuje jako samostatná odborná oblast. Architektura prezentace dat je často zaměňována s vizualizací dat a je mnohem širší sadou dovedností, která zahrnuje určení, jaká data v jakém harmonogramu a v jakém přesném formátu mají být prezentována, nejen nejlepší způsob prezentace dat, která již byla vybrána. Schopnosti vizualizace dat jsou jedním z prvků DPA. “

Cíle

DPA má dva hlavní cíle:

  • Využívat data k poskytování znalostí co nejefektivnějším možným způsobem (minimalizovat hluk, složitost a zbytečná data nebo podrobnosti vzhledem k potřebám a rolím každého publika)
  • Využívat data k poskytování znalostí co nejúčinnějším způsobem (poskytovat relevantní, včasná a úplná data každému členovi publika jasným a srozumitelným způsobem, který sděluje důležitý význam, je proveditelný a může ovlivnit porozumění, chování a rozhodnutí)

Rozsah

S ohledem na výše uvedené cíle se skutečná práce architektury prezentace dat skládá z:

  • Vytváření efektivních doručovacích mechanismů pro každého člena publika v závislosti na jeho roli, úkolech, umístění a přístupu k technologii
  • Definování důležitého významu (příslušných znalostí), který každý člen publika potřebuje v každém kontextu
  • Stanovení požadované periodicity aktualizací dat (měna dat)
  • Určení správného načasování prezentace dat (kdy a jak často musí uživatel data vidět)
  • Nalezení správných údajů (předmětná oblast, historický dosah, šířka, úroveň podrobností atd.)
  • Využití vhodných formátů pro analýzu, seskupování, vizualizaci a další formáty prezentace

Související pole

Práce DPA sdílí společné rysy s několika dalšími poli, včetně:

  • Obchodní analýzy při určování obchodních cílů, shromažďování požadavků, mapování procesů.
  • Zlepšení obchodního procesu v tom, že jeho cílem je zlepšit a zefektivnit akce a rozhodnutí při prosazování obchodních cílů
  • Vizualizace dat v tom, že využívá zavedené teorie vizualizace k přidání nebo zvýraznění významu nebo důležitosti prezentace dat.
  • Informační architektura, ale zaměřuje se na informační architekturu nestrukturovaná data a proto vylučuje jak analýzu (ve statistickém / datovém smyslu), tak přímou transformaci skutečného obsahu (data, pro DPA) do nových entit a kombinací.
  • HCI a návrh interakce, protože mnoho principů, jak navrhovat interaktivní vizualizaci dat, bylo vyvinuto mezioborově s HCI.
  • Vizuální žurnalistika a žurnalistika založená na datech nebo datová žurnalistika: Vizuální žurnalistika se zabývá všemi typy grafického usnadňování vyprávění novinových příběhů a datová a datová žurnalistika nemusí být nutně sdělována vizualizací dat. Přesto je oblast žurnalistiky v popředí vývoje nových vizualizací dat pro komunikaci dat.
  • Grafický design, zprostředkování informací prostřednictvím stylingu, typografie, polohy a dalších estetických hledisek.

Viz také

Poznámky

  1. ^ První formální, zaznamenané, veřejné použití pojmu architektura prezentace dat bylo na třech formálních akcích Microsoft Office 2007 Launch v prosinci, lednu a únoru 2007–08 v Edmontonu, Calgary a Vancouveru (Kanada) v prezentaci Kelly Lauttové popisující systém business intelligence navržený ke zlepšení kvality služeb ve společnosti na výrobu papíru a celulózy. Termín byl dále používán a zaznamenán ve veřejném používání 16. prosince 2009 v prezentaci společnosti Microsoft Canada o hodnotě sloučení Business Intelligence s procesy podnikové spolupráce.

Reference

  1. ^ Nussbaumer Knaflic, Cole. Vyprávění příběhů s daty: Průvodce vizualizací dat pro podnikové profesionály. ISBN  978-1-119-00225-3.
  2. ^ Gershon, Nahum; Page, Ward (1. srpna 2001). "Co může vyprávění příběhů udělat pro vizualizaci informací". Komunikace ACM. 44 (8): 31–37. doi:10.1145/381641.381653.
  3. ^ A b „Stephen Few-Perceptual Edge-Selecting the Right Graph for Your Message-2004“ (PDF). Archivováno (PDF) z původního dne 2014-10-05. Citováno 2014-09-08.
  4. ^ Vitaly Friedman (2008) „Vizualizace dat a infografika“ Archivováno 2008-07-22 na Wayback Machine v: Grafika, Pondělní inspirace, 14. ledna 2008.
  5. ^ Fernanda Viegas a Martin Wattenberg (19. dubna 2011). „Jak zajistit, aby data vypadala sexy“. CNN.com. Archivovány od originál 6. května 2011. Citováno 7. května 2017.CS1 maint: používá parametr autoři (odkaz)
  6. ^ A b Frits H. Post, Gregory M. Nielson a Georges-Pierre Bonneau (2002). Vizualizace dat: stav techniky. Výzkumná práce TU delft, 2002. Archivováno 2009-10-07 na Wayback Machine.
  7. ^ Tukey, Johne (1977). Průzkumná analýza dat. Addison-Wesley. ISBN  0-201-07616-0.
  8. ^ technický stát (7. srpna 2013). „Tech @ State: Data Visualization - Keynote by Dr. Edward Tufte“. Archivováno z původního dne 29. března 2017. Citováno 29. listopadu 2016 - přes YouTube.
  9. ^ Cleveland, W. S .; McGill, R. (1985). "Graphical perception and graphical methods for analyzing scientific data". Věda. 229 (4716): 828–33. doi:10.1126/science.229.4716.828. PMID  17777913. S2CID  16342041.
  10. ^ A b C Tufte, Edward (1983). Vizuální zobrazení kvantitativních informací. Cheshire, Connecticut: Graphics Press. ISBN  0-9613921-4-2. Archivováno from the original on 2013-01-14. Citováno 2019-08-10.
  11. ^ "Telling Visual Stories About Data - Congressional Budget Office". www.cbo.gov. Archivováno z původního dne 2014-12-04. Citováno 2014-11-27.
  12. ^ "Stephen Few-Perceptual Edge-Graph Selection Matrix" (PDF). Archivováno (PDF) from the original on 2014-10-05. Citováno 2014-09-08.
  13. ^ A b "Steven Few-Tapping the Power of Visual Perception-September 2004" (PDF). Archivováno (PDF) from the original on 2014-10-05. Citováno 2014-10-08.
  14. ^ A b C "Data Visualization for Human Perception". The Interaction Design Foundation. Archivováno od původního dne 2015-11-23. Citováno 2015-11-23.
  15. ^ „Vizualizace“ (PDF). SFU. SFU lecture. Archivovány od originál (PDF) dne 2016-01-22. Citováno 2015-11-22.
  16. ^ Graham, Fiona (2012-04-17). "Can images stop data overload?". BBC novinky. Citováno 2020-07-30.
  17. ^ A b C Přátelský, Michaele. "A Brief History of Data Visualization". Springer-Verlag. CiteSeerX  10.1.1.446.458. Citovat deník vyžaduje | deník = (Pomoc)
  18. ^ Whitehouse, D. (9 August 2000). "Ice Age star map discovered". BBC novinky. Archivováno z původního dne 6. ledna 2018. Citováno 20. ledna 2018.
  19. ^ Dragicevic, Pierre; Jansen, Yvonne (2012). "List of Physical Visualizations and Related Artefacts". Archivováno od originálu dne 2018-01-13. Citováno 2018-01-12.
  20. ^ Jansen, Yvonne; Dragicevic, Pierre; Isenberg, Petra; Alexander, Jason; Karnik, Abhijit; Kildal, Johan; Subramanian, Sriram; Hornbaek, Kasper (2015). "Opportunities and challenges for data physicalization". Proceedings of the 33rd Annual ACM Conference on Human Factors in Computing Systems: 3227–3236. Archivováno od originálu dne 2018-01-13. Citováno 2018-01-12.
  21. ^ A b Friendly, Michael (2001). „Milníky v historii tematické kartografie, statistické grafiky a vizualizace dat“. Archivovány od originál dne 2014-04-14.
  22. ^ Funkhouser, Howard Gray (January 1936). "A Note on a Tenth Century Graph". Osiris. 1: 260–262. doi:10.1086/368425. JSTOR  301609. S2CID  144492131.
  23. ^ Friendly, Michael (2006). "A Brief History of Data Visualization" (PDF). York University. Springer-Verlag. Archivováno (PDF) z původního dne 2016-05-08. Citováno 2015-11-22.
  24. ^ "NY gets new boot camp for data scientists: It's free but harder to get into than Harvard". Venture Beat. Archivováno od původního dne 2016-02-15. Citováno 2016-02-21.
  25. ^ Interactive Data Visualization
  26. ^ A b Bulmer, Michael (2013). A Portable Introduction to Data Analysis. The University of Queensland: Publish on Demand Centre. s. 4–5. ISBN  978-1-921723-10-0.
  27. ^ "Steven Few-Selecting the Right Graph for Your Message-September 2004" (PDF). Archivováno (PDF) from the original on 2014-10-05. Citováno 2014-09-08.
  28. ^ Lengler, Ralph; Eppler, Martin. J. "Periodic Table of Visualization Methods". www.visual-literacy.org. Archivováno z původního dne 16. března 2013. Citováno 15. března 2013.
  29. ^ Kahn, Brian (June 17, 2019). "This Striking Climate Change Visualization Is Now Customizable for Any Place on Earth". Gizmodo. Archivováno z původního dne 26. června 2019. Developed in May 2018 by Ed Hawkins, University of Reading.
  30. ^ Mooney, Chris (11 May 2016). „Tento vědec právě změnil naše myšlení o změně klimatu pomocí jednoho GIF“. The Washington Post. Archivováno from the original on 6 February 2019. Ed Hawkins took these monthly temperature data and plotted them in the form of a spiral, so that for each year, there are twelve points, one for each month, around the center of a circle – with warmer temperatures farther outward and colder temperatures nearer inward.
  31. ^ Michael Přátelský (2008). „Milníky v historii tematické kartografie, statistické grafiky a vizualizace dat“ Archivováno 2008-09-11 na Wayback Machine.
  32. ^ "Data Visualization: Modern Approaches" Archivováno 2008-07-22 na Wayback Machine. v: Grafika, August 2nd, 2007
  33. ^ Frits H. Post, Gregory M. Nielson and Georges-Pierre Bonneau (2002). Data Visualization: The State of the Art Archivováno 2009-10-07 na Wayback Machine.
  34. ^ A b C d E F Berinato, Scott (June 2016). "Visualizations That Really Work". Harvardský obchodní přehled: 92–100.

Další čtení

externí odkazy