Metacharakter - Metacharacter - Wikipedia
The hlavní část tohoto článku možná bude třeba přepsat. Důvod je uveden: definice a olovo jsou pouze o metaznakech regulárního výrazu, ale článek tomu tak neníDubna 2019) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
A metaznak je znak, který má pro počítačový program zvláštní význam, například a shell tlumočník nebo a regulární výraz (regex) motor.
v POSIX rozšířené regulární výrazy,[1] musí existovat 14 metaznaků unikl (předchází zpětné lomítko (\
)), aby upustily od svého zvláštního významu a byly zacházeny doslova uvnitř výrazu: otevírání a zavírání hranaté závorky ([
a ]
); obrácené lomítko (\
); stříška (^
); znak dolaru ($
); doba/tečka / tečka (.
); svislá čára / symbol potrubí (|
); otazník (?
); hvězdička (*
); znaménko plus (+
a -
); otevírání a zavírání složené závorky / závorky ({
a }
); a otevírání a zavírání závorky ((
a )
).[2][3]
Například pro shodu s aritmetickým výrazem (1+1)*3=6
s regulárním výrazem je správný regulární výraz \(1\+1\)\*3=6
; jinak budou mít závorky, znaménko plus a hvězdička speciální význam.
Další příklady
Některé další znaky mohou mít v některých prostředích zvláštní význam.
- V některých Unix skořápky the středník (";") je oddělovač prohlášení.
- v XML a HTML, ampersand („&“) zavádí Entita HTML.[4] Má také zvláštní význam v MS-DOS /Příkazový řádek systému Windows.[5]
- V některých skořápkách Unixu a příkazovém řádku systému MS-DOS / Windows se znaménko méně než a znaménko větší než ("<" a ">") se používají pro přesměrování a vážný přízvuk / backquote ("" ") se používá pro substituce příkazů.[5]
- V mnoha programovací jazyky, struny jsou oddělený použitím citáty („nebo“). V některých případech uniknout znaky (a další metody) se používají, aby se zabránilo srážka oddělovače, např. „Řekl:„ Ahoj “.“
- v řetězce formátu printf, znak procenta ("%") se používá k zavedení specifikátoru formátu a je třeba jej uvést jako "%%", aby byl interpretován doslovně.[6] v SQL, procento se používá jako a zástupný znak.[7]
- V SQL je podtržítko ("_") se používá k přiřazení libovolného jednoho znaku.[7]
Unikající
Termín „uniknout metaznaku“ znamená učinit metaznak neúčinným (zbavit jej zvláštního významu), což způsobí, že bude mít svůj doslovný význam. Například v PCRE, tečka („.“) znamená libovolný jeden znak. Regulární výraz „A.C“ bude odpovídat „ABC“, „A3C“ nebo dokonce „A C“. Pokud však „.“ je unikl, ztratí význam jako metaznak a bude interpretován doslovně jako „.“, což způsobí, že regulární výraz „A .C“ bude odpovídat pouze řetězci „A.C“.
Obvyklým způsobem, jak uniknout znaku v regexu a jinde, je jeho předpona zpětným lomítkem (""). Jiná prostředí mohou využívat různé metody, například příkazový řádek systému MS-DOS / Windows, kde se místo nich používá stříška („^“).[5]
Viz také
Reference
- ^ „Specifikace Open Group Base, vydání 6: Kapitola 9 - regulární výrazy“. pubs.opengroup.org. Otevřená skupina. 2004. Citováno 2018-11-19.
- ^ Goyvaerts, leden (8. prosince 2016). „Rychlé spuštění regulárních výrazů“. www.regular-expressions.info. Citováno 2018-11-19.
- ^ Nield, Thomas (13. prosince 2017). „Úvod do regulárních výrazů“. O'Reilly Media. Citováno 2018-11-19.
- ^ "Odkazy na entity znaků v HTML 4". www.w3.org. W3C. 24. prosince 1999. Citováno 2018-11-19.
- ^ A b C "Přehled příkazového prostředí". docs.microsoft.com. Microsoft. 10. září 2009. Citováno 2018-11-19.
- ^ „Open Group Base Specification Issue 7: fprintf“. pubs.opengroup.org. Otevřená skupina. 2018. Citováno 2018-11-19.
- ^ A b „LIKE (Transact-SQL)“. docs.microsoft.com. Microsoft. 14. března 2017. Citováno 2018-11-19.
Tento programovací jazyk související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |