Široká a úzká data - Wide and narrow data

Široký a úzký (někdy un-stacked and stacked, or wide and tall) are terms used to describe two different presentations for tabular data.[1][2]

Široký

Široká nebo nestohovaná data jsou prezentována s každou jinou proměnnou dat v samostatném sloupci.

OsobaStáříHmotnostVýška
Bob32168180
Alice24150175
Steve64144165

Úzký

Úzká, skládaná nebo dlouhá data jsou prezentována s jedním sloupcem obsahujícím všechny hodnoty a dalším sloupcem se seznamem kontextu hodnoty

OsobaVariabilníHodnota
BobStáří32
BobHmotnost168
BobVýška180
AliceStáří24
AliceHmotnost150
AliceVýška175
SteveStáří64
SteveHmotnost144
SteveVýška165

Toto je často snazší implementovat; přidání nového pole nevyžaduje žádné změny ve struktuře tabulky, ale pro lidi to může být těžší pochopit.

Implementace

Mnoho statistických systémů a systémů pro zpracování dat má funkce pro převod mezi těmito dvěma prezentacemi, například Programovací jazyk R. má několik balíčků, například tidyr balík. Balíček pand v Pythonu implementuje tuto operaci jako "tát" funkce, která převádí široký stůl na úzký. Proces převodu úzké tabulky na širokou tabulku se v kontextu transformace dat obecně označuje jako „otočný“. Balíček python "pandas" poskytuje a "pivot" metoda, která zajišťuje úzkou až širokou transformaci.

Viz také

Reference

  1. ^ Thompson, M. E. (1997), Teorie výběrových šetření, Chapman & Hall, Londýn. ISBN  0-412-31780-X
  2. ^ Chantala, K. (2006) „Používání STATA k analýze dat z ukázkového průzkumu“. 1-10-2001. UNC Chapel Hill, Carolina Population Center. 10-1-2006.

externí odkazy