Shapefile - Shapefile
Vektorová mapa s body, křivkami a mnohoúhelníky | |
Typ internetového média | soubor x-gis / x-shape |
---|---|
Vyvinul | Esri |
Typ formátu | GIS |
Standard | Technický popis Shapefile |
The tvarový soubor formát je geoprostorový vektor datový formát pro software geografického informačního systému (GIS). Je vyvíjen a regulován společností Esri jako většinou otevřená specifikace pro interoperabilitu dat mezi Esri a dalšími Softwarové produkty GIS.[1] Formát Shapefile lze prostorově popsat vektor funkce: bodů, řádky, a mnohoúhelníky, představující například studny, řeky, a jezera. Každá položka má obvykle atributy které to popisují, jako název nebo teplota.
Přehled
Formát Shapefile je formát digitálního vektorového úložiště pro ukládání geometrického umístění a souvisejících informací o atributech. Tento formát postrádá kapacitu pro ukládání topologické informace. Formát Shapefile byl zaveden s ArcView GIS verze 2 na počátku 90. let. Nyní je možné číst a zapisovat geografické datové sady pomocí formátu shapefile s širokou škálou softwaru.
Formát Shapefile ukládá data jako primitivní geometrické tvary, jako jsou body, čáry a mnohoúhelníky. Tyto tvary spolu s datovými atributy, které jsou propojeny s každým tvarem, vytvářejí reprezentaci geografických dat. Pojem „shapefile“ je poměrně běžný, ale formát se skládá z kolekce souborů se společnou předponou názvu souboru, uložených ve stejné adresář. Strom povinné soubory mají přípony souborů .shp
, .shx
, a .dbf
. Aktuální tvarový soubor se konkrétně týká .shp
soubor, ale sám o sobě je neúplný pro distribuci, protože jsou vyžadovány další podpůrné soubory. Starší software GIS může očekávat, že předpona názvu souboru bude omezena na osm znaků, aby vyhovovala systému DOS 8.3 název souboru konvence, ačkoli moderní softwarové aplikace přijímají soubory s delšími názvy.
- Povinné složky
.shp
- formát tvaru; samotná geometrie prvku {content-type: x-gis / x-shapefile}.shx
- formát indexu tvaru; poziční index geometrie prvku, který umožňuje rychlé vyhledávání vpřed a vzad {content-type: x-gis / x-shapefile}.dbf
- formát atributu; sloupcové atributy pro každý tvar v dBase IV formát {content-type: application / octet-stream OR text / plain}
- Ostatní soubory
.prj
- popis projekce pomocí a dobře známá textová reprezentace souřadnicových referenčních systémů {content-type: text / plain OR application / text}.sbn
a.sbx
- a prostorový index funkcí {content-type: x-gis / x-shapefile}.fbn
a.fbx
- prostorový index funkcí, které jsou jen pro čtení {content-type: x-gis / x-shapefile}.ain
a.aj
- index atributů aktivních polí v tabulce {content-type: x-gis / x-shapefile}.ixs
- geokódovací index pro datové sady pro čtení a zápis {content-type: x-gis / x-shapefile}.mxs
- geokódovací index pro datové sady pro čtení a zápis (formát ODB) {content-type: x-gis / x-shapefile}.atx
- index atributů pro.dbf
soubor ve formětvarový soubor.název sloupce.atx
(ArcGIS 8 a novější) {content-type:soubor x-gis / x-shape
}.shp.xml
— geoprostorová metadata ve formátu XML, například ISO 19115 nebo jiný Schéma XML {content-type: application / fgdc + xml}.cpg
- slouží k určení kódová stránka (pouze pro.dbf
) pro identifikaci Kódování znaků k použití {content-type:text / prostý
NEBOsoubor x-gis / x-shape
}.qix
- alternativní čtyřstrom prostorový index používaný MapServer a GDAL / OGR software {content-type: x-gis / x-shapefile}
V každém z .shp
, .shx
, a .dbf
soubory, tvary v každém souboru si navzájem odpovídají v pořadí (tj. první záznam v souboru .shp
soubor odpovídá prvnímu záznamu v souboru .shx
a .dbf
soubory atd.). The .shp
a .shx
soubory mají různá pole s různými endianismus, takže implementátor formátů souborů musí být velmi opatrný, aby respektoval endianismus každého pole a zacházel s ním správně.
Formát tvaru souboru tvaru (.shp)
Hlavní soubor (.shp) obsahuje geometrická data. The binární soubor sestává z jedné pevné délky záhlaví následuje jedna nebo více proměnných délek evidence. Každý z záznamů s proměnnou délkou obsahuje komponentu záhlaví záznamu a komponentu obsahu záznamu. Podrobný popis formátu souboru je uveden v souboru Technický popis ESRI Shapefile.[1] Tento formát by neměl být zaměňován s AutoCAD zdrojový formát písma tvaru, který sdílí .shp
rozšíření.
Pořadí 2D souřadnicových dat předpokládá a Kartézský souřadnicový systém, pomocí objednávky (X Y) nebo (Easting Northing). Toto pořadí os je konzistentní pro Geografické souřadnicové systémy, kde je pořadí podobné (zeměpisná délka, šířka). Geometrie mohou také podporovat 3 nebo 4dimenzionální Souřadnice Z a M, pro nadmořská výška a opatření. Rozměr Z ukládá nadmořskou výšku každé souřadnice 3D prostor, které lze použít pro analýzu nebo pro vizualizaci geometrií pomocí 3D počítačová grafika. Uživatelem definovanou dimenzi M lze použít pro jednu z mnoha funkcí, například pro ukládání lineární odkazování opatření nebo relativní čas funkce v 4D prostor.
Hlavička hlavního souboru je pevná na 100 bajtů a obsahuje 17 polí; devět 4bajtových (32bitové celé číslo se znaménkem nebo int32) celočíselných polí následovaných osmi 8bajtovými (dvojnásobek ) podepsaná pole s plovoucí desetinnou čárkou:
Bajty | Typ | Endianness | Používání |
---|---|---|---|
0–3 | int32 | velký | Kód souboru (vždy hexadecimální hodnota 0x0000270a) |
4–23 | int32 | velký | Nepoužitý; pět uint32 |
24–27 | int32 | velký | Délka souboru (v 16bitových slovech, včetně záhlaví) |
28–31 | int32 | málo | Verze |
32–35 | int32 | málo | Typ tvaru (viz odkaz níže) |
36–67 | dvojnásobek | málo | Minimální ohraničující obdélník (MBR) všech tvarů obsažených v datové sadě; čtyři čtyřhry v následujícím pořadí: min X, min Y, max X, max Y |
68–83 | dvojnásobek | málo | Rozsah Z; dvě dvojice v následujícím pořadí: min Z, max Z |
84–99 | dvojnásobek | málo | Rozsah M; dvě zdvojnásobí v následujícím pořadí: min M, max M |
Soubor poté obsahuje libovolný počet záznamů s proměnnou délkou. Každý záznam má předponu s hlavičkou záznamu o 8 bajtech:
Bajty | Typ | Endianness | Používání |
---|---|---|---|
0–3 | int32 | velký | Číslo záznamu (1) |
4–7 | int32 | velký | Délka záznamu (v 16bitových slovech) |
Po záhlaví záznamu je skutečný záznam:
Bajty | Typ | Endianness | Používání |
---|---|---|---|
0–3 | int32 | málo | Typ tvaru (viz odkaz níže) |
4– | – | – | Tvarujte obsah |
Obsah záznamu s proměnnou délkou závisí na typu tvaru, který musí být buď typ tvaru uvedený v záhlaví souboru, nebo Null. Možné typy tvarů jsou následující:
Hodnota | Typ tvaru | Pole |
---|---|---|
0 | Nulový tvar | Žádný |
1 | Směřovat | X, Y |
3 | Polyline | MBR, Počet dílů, Počet bodů, Díly, Body |
5 | Polygon | MBR, Počet dílů, Počet bodů, Díly, Body |
8 | MultiPoint | MBR, počet bodů, body |
11 | PointZ | X, Y, Z Volitelný: M |
13 | PolylineZ | Povinné: MBR, Počet dílů, Počet bodů, Díly, Body, rozsah Z, pole Z Volitelný: M rozsah, M pole |
15 | PolygonZ | Povinné: MBR, Počet dílů, Počet bodů, Díly, Body, Z rozsah, Z pole Volitelný: M rozsah, M pole |
18 | MultiPointZ | Povinné: MBR, počet bodů, body, rozsah Z, pole Z Volitelný: M rozsah, M pole |
21 | PointM | X, Y, M |
23 | PolylineM | Povinné: MBR, Počet dílů, Počet bodů, Díly, Body Volitelný: M rozsah, M pole |
25 | PolygonM | Povinné: MBR, Počet dílů, Počet bodů, Díly, Body Volitelný: M rozsah, M pole |
28 | MultiPointM | Povinné: MBR, počet bodů, body Nepovinná pole: M rozsah, M pole |
31 | MultiPatch | Povinné: MBR, Počet dílů, Počet bodů, Díly, Typy dílů, Body, Rozsah Z, Pole Z Volitelný: M rozsah, M pole |
Formát indexu tvaru souboru tvaru (.shx)
Index obsahuje stejnou 100bajtovou hlavičku jako .shp
soubor, následovaný libovolným počtem 8bajtových záznamů pevné délky, které se skládají z následujících dvou polí:
Bajty | Typ | Endianness | Používání |
---|---|---|---|
0–3 | int32 | velký | Posun záznamu (v 16bitových slovech) |
4–7 | int32 | velký | Délka záznamu (v 16bitových slovech) |
Pomocí tohoto indexu je možné hledat zpět ve tvaru souboru nejprve hledáním zpět v indexu tvaru (což je možné, protože používá záznamy s pevnou délkou), poté číst posun záznamu a pomocí tohoto posunu hledat na správná poloha v .shp
soubor. Stejnou metodou je také možné hledat vpřed libovolný počet záznamů.
Formát atributu Shapefile (.dbf)
Tento soubor ukládá atributy pro každý tvar; používá dBase Formát IV. Alternativní formát, který lze také použít, je xBase formát, který má otevřená specifikace, a používá se v otevřený zdroj tvarový soubor knihovny, například knihovna Shapefile C.[2]
Názvy a hodnoty atributů nejsou standardizované a budou se lišit v závislosti na zdroji obrazce.
Formát prostorového indexu Shapefile (.sbn)
Toto je binární soubor prostorový index soubor, který používá pouze software Esri. Formát není dokumentován Esri. Byl však vyvinut zpětně a zdokumentován [3] komunitou open source. Aktuálně není implementován jinými dodavateli. The .sbn
soubor není nezbytně nutný, protože .shp
Soubor obsahuje všechny informace potřebné k úspěšné analýze prostorových dat.
Omezení
Topologie a formát shapefile
Formát Shapefile nemá schopnost ukládat topologické informace. ESRI ArcInfo pokrytí a osobní / souborový / podnikový geodatabáze máte možnost ukládat topologii funkcí.
Prostorové zastoupení
Okraje a křivka nebo polygon jsou složeny z bodů. Rozteč bodů implicitně určuje měřítko, ve kterém je prvek vizuálně užitečný. Překročení této stupnice má za následek zubaté zastoupení. K dosažení hladkých tvarů ve větších měřítcích by bylo zapotřebí dalších bodů. Pro funkce lépe reprezentované hladkými křivkami vyžaduje polygonová reprezentace mnohem více datového úložiště než například splajny, který dokáže efektivně zachytit hladce se měnící tvary. Žádný z typů formátu shapefile nepodporuje splajny.
Datové úložiště
Velikost obou .shp
a .dbf
složkové soubory nesmí přesáhnout 2 GB (nebo 231 bajtů) - v nejlepším případě přibližně 70 milionů bodů.[4] Maximální počet prvků pro jiné typy geometrie se liší v závislosti na počtu použitých vrcholů.
Formát databáze atributů pro .dbf
soubor komponenty je založen na starším dBase Standard. Tento databázový formát má ze své podstaty řadu omezení:[4]
- Zatímco aktuální dBase standard a GDAL / OGR (hlavní softwarová knihovna s otevřeným zdrojovým kódem pro čtení a zápis datových sad ve formátu Shapefile) nula hodnoty, software ESRI představuje tyto hodnoty jako nuly - velmi závažný problém pro analýzu kvantitativních dat, protože může zkreslit reprezentaci a statistiku, pokud jsou nulové množství reprezentovány jako nula
- Špatná podpora pro Unicode názvy polí nebo úložiště polí
- Maximální délka názvů polí je 10 znaků
- Maximální počet polí je 255
- Podporované typy polí jsou: plovoucí desetinná čárka (13 znaků), celé číslo (4 nebo 9 znaků), datum (bez času, 8 znaků) a text (maximálně 254 znaků)
- Čísla s plovoucí desetinnou čárkou mohou obsahovat chyby zaokrouhlování, protože jsou uložena jako text
Míchání typů tvarů
Protože typ tvaru předchází každému záznamu geometrie, je soubor shapefile technicky schopný ukládat směs různých typů tvarů. Specifikace však uvádí: „Všechny tvary, které nemají hodnotu Null v souboru shapefile, musí být stejného typu tvaru.“ Proto musí být tato schopnost kombinovat typy tvarů omezena na střídající se tvary null s typem jednoho tvaru deklarovaným v záhlaví souboru. Tvarový soubor nesmí obsahovat data křivky a mnohoúhelníku, například popisy studny (bod), řeky (křivka) a jezera (mnohoúhelník) by byly uloženy ve třech samostatných souborech dat.
Viz také
- Geografický informační systém
- Otevřete geoprostorové konsorcium
- Open Source Geospatial Foundation (OSGeo)
- Seznam softwaru geografických informačních systémů
- Porovnání softwaru geografických informačních systémů
externí odkazy
- Přípony souborů Shapefile - Dokumenty Esri Webhelp pro ArcGIS 10.0 (2010)
- Esri - Pochopení topologie a tvarových souborů
- shapelib.maptools.org - Zdarma c knihovna pro čtení / zápis tvarových souborů
- Knihovna tvarů Pythonu - Knihovna Pythonu s otevřeným zdrojovým kódem (licence MIT) pro čtení / zápis tvarových souborů
- Vyhledávač projekcí tvarových souborů - automaticky detekuje neznámou projekci tvarového souboru [5] [6]
- Jáva Shapefile a Dbase Knihovny - Open Source (licence Apache) Knihovny Java pro čtení / zápis tvarových souborů a přidružené soubory dBase (knihovny jsou součástí Knihovna AFC ale lze je použít samostatně)
Reference
- ^ A b ESRI (Červenec 1998). "Technický popis ESRI Shapefile" (PDF). Citováno 2007-07-04. Citovat deník vyžaduje
| deník =
(Pomoc) - ^ "Knihovna Shapefile C v1.2".
- ^ (PDF). 13. srpna 2016 https://web.archive.org/web/20160813212443/https://pyshp.googlecode.com/files/sbn_format.pdf. Archivovány od originálu dne 13. srpna 2016. Chybějící nebo prázdný
| název =
(Pomoc)CS1 maint: BOT: stav původní adresy URL neznámý (odkaz) - ^ A b „Nápověda ArcGIS Desktop 9.3 - Úvahy o geoprocesu pro výstup shapefile“. Esri. 24.dubna 2009.
- ^ Egger, Manfred. "Projekční projektor Shapefile" (PDF). www.egger-gis.at.
- ^ "Projekční projektor Shapefile".