Předprocesor - Preprocessor

v počítačová věda, a preprocesor je program který zpracovává svá vstupní data a vytváří výstup, který se používá jako vstup do jiného programu. Výstup se říká, že předzpracováno forma vstupních dat, kterou často používají některé následné programy jako překladače. Množství a druh provedeného zpracování závisí na povaze preprocesoru; některé preprocesory jsou schopné provádět pouze relativně jednoduché textové substituce a makro expanze, zatímco jiné mají moc plnohodnotného programovací jazyky.

Běžný příklad z programování je zpracování prováděné dne zdrojový kód před dalším krokem kompilace. V některých počítačové jazyky (např., C a PL / I. ) je fáze překlad známý jako předzpracování. Může také zahrnovat zpracování maker, zahrnutí souborů a jazykové přípony.

Lexikální preprocesory

Lexikální preprocesory jsou nejnižší úrovní preprocesorů, protože pouze vyžadují lexikální analýza, to znamená, že fungují na zdrojovém textu dříve analýza jednoduchým nahrazením tokenizovaný posloupnosti znaků pro další tokenizované posloupnosti znaků podle uživatelsky definovaných pravidel. Obvykle vystupují makro substituce, textové začlenění dalších souborů a podmíněné kompilace nebo zahrnutí.

C preprocesor

Nejběžnějším příkladem je C preprocesor, který přebírá řádky začínající znakem „#“ jako směrnice. Protože neví nic o základním jazyce, jeho použití bylo kritizováno a mnoho jeho funkcí zabudováno přímo do jiných jazyků. Například makra nahrazená agresivním vložením a šablonami, zahrnuje importy v době kompilace (to vyžaduje zachování informací o typu v kódu objektu, což znemožňuje dodatečnou úpravu této funkce do jazyka); podmíněná kompilace je účinně dosaženo pomocí Jestliže pak jinak a odstranění mrtvého kódu v některých jazycích. Klíčovým bodem k zapamatování však je, že všechny direktivy preprocesoru by měly začínat na novém řádku.

Ostatní lexikální preprocesory

Mezi další lexikální preprocesory patří obecné účely m4, nejčastěji používané v multiplatformních systémech sestavování, jako je autoconf, a GEMA, procesor maker s otevřeným zdrojovým kódem, který pracuje na vzorcích kontextu.

Syntaktické preprocesory

Syntaktické preprocesory byly zavedeny s Lisp rodina jazyků. Jejich rolí je transformace syntaxových stromů podle řady uživatelsky definovaných pravidel. U některých programovacích jazyků jsou pravidla psána ve stejném jazyce jako program (reflexe kompilace). To je případ Lisp a OCaml. Některé další jazyky se při definování transformací spoléhají na zcela externí jazyk, například XSLT preprocesor pro XML, nebo jeho staticky napsaný protějšek CDuce.

Syntaktické preprocesory se obvykle používají k přizpůsobení syntaxe jazyka, rozšíření jazyka přidáním nových primitiv nebo k vložení programovací jazyk specifický pro doménu (DSL) v obecném jazyce.

Přizpůsobení syntaxe

Dobrým příkladem přizpůsobení syntaxe je existence dvou různých syntaxí v souboru Objektiv Caml programovací jazyk.[1] Programy mohou být psány lhostejně pomocí „normální syntaxe“ nebo „revidované syntaxe“ a mohou být pěkně vytištěny s libovolnou syntaxí na vyžádání.

Podobně je napsána řada programů OCaml přizpůsobte syntaxi jazyka přidáním nových operátorů.

Rozšíření jazyka

Nejlepší příklady rozšíření jazyka prostřednictvím maker najdete v Lisp rodina jazyků. Zatímco jazyky samy o sobě jsou jednoduchá dynamicky typovaná funkční jádra, standardní distribuce Systém nebo Společný Lisp povolit imperativní nebo objektově orientované programování i statické psaní. Téměř všechny tyto funkce jsou implementovány syntaktickým předzpracováním, i když je třeba poznamenat, že fázi „makroexpanze“ kompilace zpracovává kompilátor v Lispu. To lze stále považovat za formu předzpracování, protože probíhá před jinými fázemi kompilace.

Specializace na jazyk

Jednou z neobvyklých vlastností Lisp rodina jazyků je možnost použití maker k vytvoření interního DSL. Typicky ve velkém Lisp Na základě projektu může být modul napsán různými způsoby minilanguages, jeden možná používá a SQL - dialekt založený na Lisp, další napsaný v dialektu specializovaném na GUI nebo pěkný tisk atd. Společný Lisp Standardní knihovna obsahuje příklad této úrovně syntaktické abstrakce v podobě makra LOOP, které implementuje algolský minilanguage, který popisuje složitou iteraci, a přesto umožňuje použití standardních operátorů Lisp.

The MetaOCaml preprocesor / jazyk poskytuje podobné funkce pro externí DSL. Tento preprocesor přebírá popis sémantiky jazyka (tj. Tlumočníka) a kombinací interpretace v době kompilace a generování kódu promění tuto definici v kompilátor na OCaml programovací jazyk - az tohoto jazyka buď do bytecode, nebo do nativního kódu.

Univerzální preprocesor

Většina preprocesorů je specifická pro konkrétní úlohu zpracování dat (např. kompilace jazyk C). Předzpracovatel může být povýšen jako obecný účel, což znamená, že není zaměřen na konkrétní použití nebo programovací jazyk a je určen k použití pro širokou škálu úloh zpracování textu.

M4 je pravděpodobně nejznámějším příkladem takového preprocesoru pro všeobecné účely, ačkoli preprocesor C se někdy používá v roli, která není specifická pro C. Příklady:

  • pomocí C preprocesoru pro JavaScript předzpracování.[2]
  • pomocí preprocesoru C pro zpracování zařízení v rámci Linuxové jádro.[3]
  • použitím M4 (viz příklad na článku) nebo C preprocesor[4] jako stroj šablony, do HTML generace.
  • dělám, a udělat rozhraní pomocí preprocesoru C, napsané pro Systém X Window ale nyní zastaralé ve prospěch automake.
  • grompp, preprocesor pro vstupní soubory simulace pro GROMACS (rychlý, bezplatný open-source kód pro některé problémy v výpočetní chemie ), který volá systémový preprocesor C (nebo jiný preprocesor, jak je určeno vstupním souborem simulace), aby analyzoval topologii, přičemž většinou používá mechanismy #define a #include k určení efektivní topologie v době běhu grompp.
  • použitím GPP pro předzpracování markdownových souborů[5]

Viz také

Reference

externí odkazy