Lex (software) - Lex (software)

Lex
Původní autořiMike Lesk, Eric Schmidt
První vydání1975; Před 45 lety (1975)
Úložiště Upravte to na Wikidata
NapsánoC
Operační systémUnix, Unixový, Plán 9
TypPříkaz

Lex je počítačový program který generuje lexikální analyzátory („skenery“ nebo „lexery“).[1][2]

Lex se běžně používá s yacc generátor analyzátoru. Lex, původně napsán Mike Lesk a Eric Schmidt[3] a popsáno v roce 1975,[4][5] je standard lexikální analyzátor generátor na mnoha Unix systémy a ekvivalentní nástroj je specifikován jako součást POSIX Standard.[6]

Lex přečte vstup proud specifikování lexikálního analyzátoru a výstupů zdrojový kód implementace lexeru v Programovací jazyk C. Kromě C mohly některé staré verze Lexu také generovat lexer v Ratfor.[7]

Otevřený zdroj

Ačkoli jsou původně distribuovány jako proprietární software, některé verze Lex jsou nyní otevřený zdroj. Open source verze Lex, založené na původním proprietárním kódu, jsou nyní distribuovány s operačními systémy open source, jako je OpenSolaris a Plán 9 od Bell Labs. Jedna populární open source verze Lexu, tzv flex, nebo „rychlý lexikální analyzátor“, není odvozen z proprietárního kódování.

Struktura souboru Lex

Struktura souboru Lex je záměrně podobná struktuře souboru yacc; soubory jsou rozděleny do tří částí oddělených řádky, které obsahují pouze dvě procenta, a to následovně:

  • The definice část definuje makra a dovoz hlavičkové soubory napsáno v C. Je také možné napsat jakýkoli C kód, který bude doslovně zkopírován do generovaného zdrojového souboru.
  • The pravidla partneři sekce regulární výraz vzory s C. prohlášení. Když lexer uvidí na vstupu text odpovídající danému vzoru, provede související kód C.
  • The Kód C. část obsahuje příkazy C a funkce které jsou doslovně zkopírovány do vygenerovaného zdrojového souboru. Tyto příkazy pravděpodobně obsahují kód nazývaný pravidly v sekci pravidel. Ve velkých programech je pohodlnější umístit tento kód do samostatného souboru propojeného na kompilovat čas.

Příklad souboru Lex

Následuje ukázkový soubor Lex pro flex verze Lex. Rozpoznává řetězce čísel (kladná celá čísla) na vstupu a jednoduše je vytiskne.

/ *** Definiční část *** /%{/ * C kód, který se má kopírovat doslovně * /#zahrnout <stdio.h>%}/ * Toto říká flexu, aby četla pouze jeden vstupní soubor * /%volba noyywrap%%    / *** Pravidla sekce *** /    / * [0-9] + odpovídá řetězci jedné nebo více číslic * /[0-9]+  {            / * yytext je řetězec obsahující shodný text. * /            printf("Viděl jsem celé číslo:% s n", yytext);        }.|\n    {   / * Ignorovat všechny ostatní znaky. * /   }%%/ *** Sekce kódu C *** /int hlavní(prázdnota){    / * Zavolejte lexera a poté ukončete. * /    yylex();    vrátit se 0;}

Pokud je tento vstup zadán flex, bude převeden do souboru C, lex.rr.c. To lze zkompilovat do spustitelného souboru, který odpovídá a vydává řetězce celých čísel. Například vzhledem k vstupu:

abc123z.! & * 2gj6

program vytiskne:

Saw an integer: 123Saw an integer: 2Saw an integer: 6

Používání Lexu s dalšími programovacími nástroji

Používání Lex s generátory syntaktických analyzátorů

Generátory Lex a Parser, například Yacc nebo Bison, se běžně používají společně. Generátory syntaktických analyzátorů používají a formální gramatika analyzovat vstupní proud, něco, co Lex nedokáže jednoduše regulární výrazy (Lex je omezen na jednoduché konečné automaty ).[je zapotřebí objasnění ]

Obvykle je vhodnější nechat analyzátor (generovaný řekněme Yacc) přivádět token toků jako vstup, místo toho, aby přímo spotřebovával tok proudů znaků. Lex se často používá k výrobě takového tokenu tokenů.

Analýza bez skeneru odkazuje na přímou analýzu vstupního znakového proudu bez samostatného lexeru.

Lex a dělat

udělat je nástroj, který lze použít k údržbě programů zahrnujících Lex. Make předpokládá, že soubor, který má příponu .l je zdrojový soubor Lex. Vytvořit interní makro LFLAGS lze použít k určení možností Lex, které mají být automaticky vyvolány značkou.[8]

Viz také

Reference

  1. ^ Levine, John R.; Mason, Tony; Brown, Doug (1992). lex a yacc (2. vyd.). O'Reilly. str.1 –2. ISBN  1-56592-000-7.
  2. ^ Levine, Johne (Srpen 2009). flex & bison. O'Reilly Media. str. 304. ISBN  978-0-596-15597-1.
  3. ^ Lesk, M.E .; Schmidt, E. "Lex - generátor Lexical Analyzer". Citováno 16. srpna 2010.
  4. ^ Lesk, M.E .; Schmidt, E. (21. července 1975). "Lex - generátor Lexical Analyzer" (PDF). UNIXOVÝ ČASOVÝ SDÍLENÍ: UNIXOVÝ MANUÁL PROGRAMÁTORA, sedmé vydání, svazek 2B. bell-labs.com. Citováno 20. prosince 2011.
  5. ^ Lesk, M.E. (říjen 1975). "Lex - generátor Lexical Analyzer". Comp. Sci. Tech. Rep. Č. 39. Murray Hill, New Jersey: Bell Laboratories.
  6. ^ The Open Group Base Specification Issue 7, 2018 edition § Shell & Utilities § Utilities § lex
  7. ^ John R. Levine; John Mason; Doug Brown (1992). Lex & Yacc. O'Reilly.
  8. ^ "udělat". Základní specifikace otevřené skupiny. IEEE a The Open Group (6). 2004. IEEE Std 1003.1, vydání 2004.

externí odkazy