Ořezávání (počítačové programování) - Trimming (computer programming)
tento článek potřebuje další citace pro ověření.Února 2015) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
v programování, ořezávání (čalounění) nebo odizolování (pás) je manipulace s řetězci ve kterém vede a končí mezery je odstraněn z a tětiva.
Například řetězec (uzavřený apostrofy)
' tohle je zkouška '
se po ořezání změní na
'tohle je zkouška'
Varianty
Oříznutí vlevo nebo vpravo
Nejoblíbenější varianty funkčního pruhu oříznutí pouze začátek nebo konec řetězce. Typicky pojmenované ltrim a rtrim respektive v případě Pythonu: pás a proužek. C # používá TrimStart a TrimEnda Common Lisp string-left-trim a string-right-trim. Pascal a Java nemají tyto varianty zabudované Objekt Pascal (Delphi) má TrimLeft a TrimRight funkce.[1]
Parametrizace seznamu prázdných znaků
Mnoho funkcí oříznutí má volitelný parametr k určení seznamu znaků, které se mají oříznout, namísto výchozích mezer. Například PHP a Python povolují tento volitelný parametr, zatímco Pascal a Java nikoli. S Common Lisp strunová úprava
funkce, parametr (tzv taška na postavy) je požadováno. C ++ Zvyšte knihovnu definuje mezerové znaky podle národní prostředí, jakož i nabízet varianty s a predikát parametr (a funktor ) vyberte, které znaky budou oříznuty.
Speciální návratová hodnota prázdného řetězce
Neobvyklá varianta oříznutí vrací speciální výsledek, pokud po operaci oříznutí nezůstanou žádné znaky. Například, Apache Jakarta je StringUtils má funkci nazvanou stripToNull
který se vrací nula
místo prázdného řetězce.
Normalizace prostoru
Normalizace prostoru je související manipulace s řetězci, kde kromě odstranění okolních mezer je jakákoli sekvence mezer v řetězci nahrazena jednou mezerou. Normalizace prostoru se provádí pojmenovanou funkcí Oříznout ()
v tabulkových aplikacích (včetně Vynikat, Calc, Číselný, a Google dokumenty ) a normalizovat-prostor ()
funkce v XSLT a XPath,
Ořezávání na místě
Zatímco většina algoritmů vrací nový (ořezaný) řetězec, některé mění původní řetězec na místě. Je pozoruhodné, že Zvyšte knihovnu umožňuje vrácení buď oříznutí na místě, nebo oříznuté kopie.
Definice mezer
Znaky, které jsou považovány za mezery, se mezi programovacími jazyky a implementacemi liší. Například C tradičně počítá pouze znaky mezery, tabulátoru, posunu řádku a znaku konce řádku, zatímco podporované jazyky Unicode obvykle zahrnují všechny mezerové znaky Unicode. Některé implementace také zahrnují ASCII kontrolní kódy (netisknutelné znaky) spolu s mezerami.
Metoda trimování Java považuje ASCII mezery a řídicí kódy za mezery v kontrastu s Javou isWhitespace ()
metoda,[2] který rozpozná všechny mezerové znaky Unicode.
Funkce Trim společnosti Delphi považuje znaky U + 0000 (NULL) až U + 0020 (SPACE) za prázdné znaky.
Prázdné mezery
The Braillovo písmo Blok Unicode obsahuje U + 2800 ⠀ BRAILLE PATTERN BLANK (HTML⠀
), a Braillovo písmo vzor bez vyvýšených teček. Standard Unicode výslovně uvádí, že nepůsobí jako mezera.
The Nerozbitný prostor U + 00A0 BEZPLATNÝ PROSTOR (HTML 
· & nbsp ;, & NonBreakingSpace;
) lze pro účely ořezávání také považovat za neprostor.
Používání
Reference
- ^ "Oříznout". Freepascal.org. 02.02.2013. Citováno 2013-08-24.
- ^ „Character (Java 2 Platform SE 5.0)“. Java.sun.com. Citováno 2013-08-24.
externí odkazy
- Tcl: strunová úprava
- Rychlejší oříznutí JavaScriptu - porovnává různé implementace JavaScriptu
- řez a ořezávání řetězce php - řezání a ořezávání řetězce php