Hodnoty oddělené tabulátorem - Tab-separated values
Přípona názvu souboru | .tsv , . tab |
---|---|
Typ internetového média | hodnoty oddělené textem / tabulátorem |
Typ formátu | multiplatformní, sériové datové toky |
Kontejner pro | databáze informace uspořádané jako seznamy oddělené od polí |
Standard | IANA MIM typ |
A hodnoty oddělené tabulátorem (TSV) soubor je jednoduchý textový formát pro ukládání dat v souboru tabelární struktura, např. databázová tabulka nebo tabulkový kalkulátor data,[1] a způsob výměny informací mezi nimi databáze.[2] Každý záznam v tabulce je jeden řádek textový soubor. Každá hodnota pole záznamu je od následující oddělena znakem a znak tabulátoru. Formát TSV je tedy typem obecnějšího hodnoty oddělené oddělovačem formát.
TSV je jednoduchý formát souboru, který je široce podporován, takže se často používá v výměna dat přesouvat tabulková data mezi různými počítačovými programy, které formát podporují. Například soubor TSV lze použít k přenosu informací z databázového programu do tabulky.
TSV je alternativou k běžnému hodnoty oddělené čárkami (CSV) formátu, který kvůli potřebě často způsobuje potíže uniknout čárky - doslovný čárky jsou v textových datech velmi běžné, ale doslovné zarážky tabulátorů jsou v běžícím textu zřídka. Standard IANA pro TSV[2] dosáhne jednoduchosti jednoduše zakázáním karet v polích.
Příklad
Například vedoucí Soubor údajů o květu kosatce lze uložit jako TSV pomocí následujícího prostého textu (všimněte si, že vykreslování HTML může převádět karty na mezery):
Sepal length Sepal width Délka okvětního lístku Šířka okvětního lístku Druh5,1 3,5 1,4 0,2 I. setosa4,9 3,0 1,4 0,2 I. setosa4,7 3,2 1,3 0,2 I. setosa4,6 3,1 1,5 0,2 I. setosa5,0 3,6 1,4 0,2 I. setosa
Prostý text TSV výše odpovídá následujícím tabulkovým údajům:
Sepal délka | Sepal šířka | Délka okvětního lístku | Šířka okvětního lístku | Druh |
---|---|---|---|---|
5.1 | 3.5 | 1.4 | 0.2 | I. setosa |
4.9 | 3.0 | 1.4 | 0.2 | I. setosa |
4.7 | 3.2 | 1.3 | 0.2 | I. setosa |
4.6 | 3.1 | 1.5 | 0.2 | I. setosa |
5.0 | 3.6 | 1.4 | 0.2 | I. setosa |
Konvence pro bezztrátový převod na TSV
Vzhledem k tomu, že hodnoty ve formátu TSV nemohou obsahovat tabulátory ani znaky nového řádku, je pro bezztrátový převod textových hodnot s těmito znaky nutná konvence. Běžnou konvencí je provádění následujících úniků:[3][4]
n pro nový řádek, t pro kartu, r pro návrat vozíku, pro zpětné lomítko.
Viz také
Reference
- ^ Jak používat soubory TSV (Tab Separated Value) Publikoval Mezinárodní měnový fond
- ^ A b "Definice hodnot oddělených tabulátory (tsv)". Autorita internetových přidělených čísel (IANA).
- ^ „Lineární TSV“. Datové protokoly - Open Knowledge Foundation.
- ^ "jq Manual". stedolan.github.io.
Bibliografie
- IANA Typy textových médií, Definice hodnot oddělených tabulátory (TSV), Paul Lindner, U z týmu MN Internet Gopher Team, červen 1993
- Hodnoty oddělené tabulátory (TSV): formát pro tabulkovou výměnu dat, Jukka Korpela, vytvořeno 1. 9. 2000, poslední aktualizace 12. 2. 2005.