Konverze formátu zpáteční cesty - Round-trip format conversion
![]() | tento článek ne uvést žádný Zdroje.Ledna 2019) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Termín okružní výlet se používá v převod dokumentu zvláště zahrnující značkovací jazyky jako XML a SGML. Úspěšný zpáteční let sestává z převodu dokumentu ve formátu A (docA) na jeden ve formátu B (docB) a zpět zpět do formátu A (docA '). Pokud jsou docA a docA ′ identické, nedošlo ke ztrátě informací a zpáteční cesta byla úspěšná. Obecněji to znamená převod z libovolné reprezentace dat a zpět, včetně z jednoho datová struktura jinému.
Ztráta informací
Při převodu dokumentu v jednom formátu do jiného pravděpodobně dojde ke ztrátě informací. Předpokládejme například, že HTML dokument je uložen jako prostý text (* .txt). Poté budou všechny značky (struktura, formátování, horní indexy,…) ztraceny. Složené dokumenty často ztratí informace o obrázcích a dalších vložených objektech. Pokud je textový soubor převeden zpět do původního formátu, informace budou nutně chybět.
Podobný efekt nastává u obrazových formátů. Některé formáty jako JPEG dosáhnout komprese prostřednictvím malého množství ztráty informací. Pokud bezztrátový soubor, jako je a BMP nebo PNG soubor, je převeden na JPEG a zpět, pak se výsledek bude lišit od originálu (i když může být vizuálně velmi podobný).
Jen proto, že počáteční a závěrečné dokumenty nejsou bitově identické, neznamená, že dochází ke ztrátě informací. Některé formáty mají nedefinovaná pole nebo pole, kde obsah nemá žádný vliv na výsledek.
Značkovací jazyky
Značkovací jazyky, jako je XML, mohou v zásadě obsahovat jakékoli informace, a tak by proces docA → docX → docA 'mohl být navržen tak, aby nedocházelo ke ztrátě informací. Nyní je běžné převádět starší formáty na formáty XML, protože mají větší interoperabilitu a širší sadu dostupných nástrojů. Je tedy možné převést dokumenty Word do formátu XML a znovu je importovat.
Dokument XML by měl obsahovat stejné informace jako starší formát. Důležitou podmínkou je, že zpáteční cesta (starší → XML → starší ') by měla vést k efektivně identickým dokumentům. Protože některé struktury dokumentů umožňují určitou flexibilitu v pořadí obsahu, mezerách, rozlišování malých a velkých písmen atd., Je užitečné mít prostředky pro kanonizaci staršího formátu. Celý zpáteční let pak může být:
- legacy → canonicalLegacy → XML → legacy ′ → canonicalLegacy ′
Pokud canonicalLegacy = canonicalLegacy ′, zpáteční cesta byla úspěšná.
Kódování znaků
Unicode má zásadu zpáteční kompatibility se staršími standardizovanými staršími kódováními, takže převod dokumentů do Unicode neztrácí informace; lze je převést zpět. Dosáhnout toho, Znaky kompatibility Unicode byly zavedeny.
Omezení
Aplikace může tvrdit, že je zpáteční a nečestná. Například může uložit původní data z docA jako pole v docX, takže reverzní transformace na docA ′ jednoduše extrahuje toto pole. I když to může být v některých případech potřeba, myšlenkou zpětného převodu je projít jinou reprezentací formátu nebo datovou strukturou a zpět. Taková strategie znamená, že malé změny v dokumentu znamenají, že jej nelze převést zpět do původního formátu.
Používání
Termín se jeví jako běžný, ale ve slovnících se neuvádí. Typické použití se vyskytuje v [1] ale tento výraz byl pravděpodobně použit již dříve.