Formát výměny dat - Data Interchange Format
![]() | tento článek může být pro většinu čtenářů příliš technická na to, aby tomu rozuměli. Prosím pomozte to vylepšit na aby to bylo srozumitelné pro neodborníky, aniž by byly odstraněny technické podrobnosti. (Září 2010) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) |
Formát výměny dat (.dif) je a textový soubor formát slouží k importu / exportu jednoho tabulky mezi tabulkovými programy (OpenOffice.org Calc, Vynikat, Číselný, StarCalc, Lotus 1-2-3, FileMaker, dBase, Rámec, Multiplan, atd.). Jedním omezením je, že formát DIF nedokáže zpracovat více tabulek v jednom sešitu.
Vzhledem k podobnosti zkratek a věku (oba se datují do začátku 80. let) je formát tabulky DIF často zaměňován s Navy DIF; Navy DIF je však pro textové procesory nesouvisející „formát pro výměnu dokumentů“.[1]
Dějiny
DIF byl vyvinut společností Software Arts, Inc. (vývojáři VisiCalc programu) na začátku 80. let. Specifikace byla obsažena v mnoha kopiích VisiCalc a publikována v Časopis Byte. Bob Frankston vyvinul formát se vstupy od ostatních, včetně Mitch Kapor, který pomohl, aby to mohlo fungovat s jeho programem VisiPlot. (Kapor později našel Lotus a udělat Lotus 1-2-3 stalo se.) Specifikace byla chráněna autorskými právy z roku 1981.
DIF byla registrovaná ochranná známka společnosti Software Arts Products Corp. (v té době legální název pro Software Arts).
Syntax
DIF ukládá vše do ASCII textový soubor ke zmírnění mnoha problémů napříč platformami v dobách jeho vytvoření. Nicméně moderní tabulkový software, např. OpenOffice.org Calc a Číselný, nabídnout více Kódování znaků exportovat / importovat. Soubor je rozdělen do dvou částí: záhlaví a data. Vše v DIF je reprezentováno 2 nebo 3řádkovým blokem. Záhlaví dostávají 3řádkový blok; data, 2. Kruhy záhlaví začínají identifikátorem textu, který obsahuje všechna velká písmena, pouze abecední znaky a méně než 32 písmen. Následující řádek musí být dvojice čísel a třetí řádek musí být uvozený řetězec. Na druhou stranu datové bloky začínají dvojicí čísel a dalším řádkem je citovaný řetězec nebo klíčové slovo.
Hodnoty
Hodnota zabírá dva řádky, první pár čísel a druhý řetězec nebo klíčové slovo. První číslo dvojice označuje typ:
- −1 - typ direktivy, druhé číslo je ignorováno, následující řádek je jedno z těchto klíčových slov:
- BOT - začátek n-tice (začátek řady)
- EOD - konec dat
- 0 - číselný typ, hodnota je druhé číslo, následující řádek je jedno z těchto klíčových slov:
- V - platné
- NA - není k dispozici
- ERROR - chyba
- TRUE - skutečná logická hodnota
- FALSE - nepravdivá logická hodnota
- 1 - typ řetězce, druhé číslo je ignorováno, následující řádek je řetězec v uvozovkách
Kus záhlaví
Blok záhlaví se skládá z řádku identifikátoru následovaného dvěma řádky hodnoty.
- TABULKA - po verzi následuje číselná hodnota, nepoužívaný druhý řádek hodnoty obsahuje komentář generátoru
- VEKTORY - počet sloupců následuje jako číselná hodnota
- TUPLES - počet řádků následuje jako číselná hodnota
- DATA - po fiktivní číselné hodnotě 0 následují data tabulky, každému řádku předchází BOT hodnota, celá tabulka je ukončena hodnotou EOD
Číselné hodnoty v blocích záhlaví používají místo klíčových slov platnosti pouze prázdný řetězec.
Nesrovnalosti v implementacích
Některé implementace (zejména ty ze starších produktů Microsoft) vyměnily význam VEKTORŮ a TUPEL. Některé implementace jsou necitlivé na chyby v rozměrech tabulky, jak jsou zapsány v záhlaví, a jednoduše používají rozložení v části DATA.
Příklad
Předpokládejme například, že máme dva sloupce s jedním řádkem záhlaví sloupce a dvěma datovými řádky:
Text | Číslo |
---|---|
Ahoj | 1 |
má v textu dvojitou uvozovku " | -3 |
V souboru .dif by to bylo (→ označuje komentáře):
TABULKA 0,1 VEKTORY „EXCEL“ → počet sloupců následuje jako číselná hodnota 0,2 → „0“ označuje číselný typ, „2“, protože máme 2 sloupce „“ TUPLES → počet řádků následuje jako číselný value0,3 → '0' označuje, že se jedná o číselný typ, '3', protože máme 3 řádky "" DATA → po fiktivní číselné hodnotě 0 následují údaje pro tabulku0,0 → toto je fiktivní numerická hodnota "" "-1,0 → '-1' pro typ směrnice. Poté následuje buď „BOT“, nebo „EOD'BOT → znamená začátek řádku 1,0 →„ 1 “, protože buňka obsahuje řetězec. (Druhé číslo je ignorováno) „Text“ → toto je řetězec, který je v buňce1,0 → „1“, protože buňka obsahuje řetězec. „Číslo“ -1,0 BOT → další řádek 1,0 → následuje řetězec "ahoj" 0,1 → číselná hodnota ('0') hodnoty '1'V →' V 'je pro' Valid'-1,0 BOT → jiný řádek1,0 "má uvozovky" "v textu" 0 , -3V-1,0 EOD → Konec dat
Viz také
Reference
- ^ Petrosky, Mary (5. srpna 1985). „Roste trh převodu souborů“. InfoWorld. Sv. 7 č. 31. s. 36–37. „Mezi formáty souborů navrženými tak, aby usnadňovaly výměnu textových souborů mezi mikropočítači, na nichž je spuštěn jiný software pro zpracování textu, se zdá, že největší podporu mají dokumenty IBM Content Content Architecture (DCA) a U.S.
Zdroje
- Jeff Walden: Formáty souborů pro populární PC software. John Wiley & Sons, Inc., 1986. ISBN 0-471-83671-0
- Komentář z Dan Bricklin, jeden z vývojářů VisiCalc, na diskusní stránka tohoto článku
- Commodore 64 Data Files, ZÁKLADNÍ výuka. (1984). David Miller. ISBN 0835907910. Stránky 212-231.
externí odkazy
- Oznámení o DIF Clearinghouse od společnosti Software Arts Products Corp.