Comm - Comm
Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.Leden 2013) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Původní autoři | Lee E. McMahon |
---|---|
Vývojáři | AT&T Bell Laboratories, Richard Stallman, David MacKenzie |
První vydání | Listopadu 1973 |
Operační systém | Unix, Unixový, Plán 9, Peklo |
Typ | Příkaz |
Licence | coreutils: GPLv3 + |
The komunikace příkaz v Unix rodina počítačů operační systémy je nástroj, který se používá k porovnání dvou soubory pro běžné a odlišné linie. komunikace je uvedeno v POSIX Standard. Bylo široce dostupné na Unixový operační systémy od poloviny do konce 80. let.
Dějiny
Napsáno Lee E. McMahon, komunikace poprvé se objevil v Verze 4 Unix.[1]
Verze komunikace svázaný GNU coreutils napsal autor Richard Stallman a David MacKenzie.[2]
Používání
komunikace čte dva soubory jako vstup, považované za řádky textu. komunikace vypíše jeden soubor, který obsahuje tři sloupce. První dva sloupce obsahují řádky jedinečné pro první a druhý soubor. Poslední sloupec obsahuje řádky společné oběma. Toto je funkčně podobné rozdíl.
Sloupce se obvykle odlišují znakem <tab> charakter. Pokud vstupní soubory obsahují řádky začínající znakem oddělovače, výstupní sloupce mohou být nejednoznačné.
Pro efektivitu jsou standardní implementace komunikace očekávejte, že oba vstupní soubory budou seřazeny ve stejném řádku kompletace pořadí, řazeno lexikálně. The třídit (Unix) k tomuto účelu lze použít příkaz.
The komunikace Algoritmus využívá porovnávací sekvenci proudu národní prostředí. Pokud řádky v souborech nejsou oba tříděny v souladu s aktuálním národním prostředím, výsledek není definován.
Návratový kód
Na rozdíl od rozdíl, návratový kód z komunikace nemá logický význam, pokud jde o vztah těchto dvou souborů. Návratový kód 0 označuje úspěch, návratový kód> 0 označuje chybu během zpracování.
Příklad
$ kočka foojablkobanánlilek$ kočičí barjablkobanánbanáncuketa$ Comm foo bar jablko banán banánlilek cuketa
To ukazuje, že oba soubory mají jeden banán, ale pouze bar má druhý banán.
Podrobněji má výstupní soubor následující vzhled. Všimněte si, že sloupec je interpretován počtem předních znaků tabulátoru. t představuje znak tabulátoru a n představuje nový řádek (Escape Character # Programování a datové formáty ).
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | t | t | A | p | p | l | E | n | ||
1 | t | t | b | A | n | A | n | A | n | |
2 | t | b | A | n | A | n | A | n | ||
3 | E | G | G | p | l | A | n | t | n | |
4 | t | z | u | C | C | h | i | n | i | n |
Srovnání s rozdílem
Obecně řečeno, rozdíl je výkonnější nástroj než komunikace. Jednodušší komunikace je nejvhodnější pro použití ve skriptech.
Primární rozdíl mezi komunikace a rozdíl je to komunikace zahodí informace o pořadí řádků před tříděním.
Malý rozdíl mezi komunikace a rozdíl je to komunikace nebude se snažit naznačit, že se řádek „změnil“ mezi těmito dvěma soubory; řádky jsou zobrazeny ve sloupcích „ze souboru # 1“, „ze souboru # 2“ nebo „v obou“ sloupcích. To může být užitečné, pokud si přejete, aby dva řádky byly považovány za odlišné, i když mají jen jemné rozdíly.
Jiné možnosti
komunikace má možnosti příkazového řádku potlačit kterýkoli ze tří sloupců. To je užitečné pro skriptování.
K dispozici je také možnost přečíst jeden soubor (ale ne oba) ze standardního vstupu.
Limity
Před porovnáním řádků musí být z každého vstupního souboru do vyrovnávací paměti uložen až celý řádek, než bude zapsán další výstupní řádek.
Některé implementace čtou řádky s funkcí readlinebuffer () který neukládá žádná omezení délky řádku, pokud postačí systémová paměť.
Jiné implementace čtou řádky s funkcí fgets (). Tato funkce vyžaduje pevnou vyrovnávací paměť. U těchto implementací je velikost vyrovnávací paměti často podle POSIX makro LINE_MAX.
Viz také
- Porovnání nástrojů pro porovnávání souborů
- Seznam unixových příkazů
- cmp (Unix) Znakově orientované srovnání souborů -
- střih (Unix) - rozdělení souborů orientovaných na sloupce
Reference
- ^ McIlroy, M. D. (1987). Čtenář Research Unix: anotované výňatky z Programmer's Manual, 1971–1986 (PDF) (Technická zpráva). CSTR. Bell Labs. 139.
- ^ https://linux.die.net/man/1/comm
externí odkazy
- Specifikace Single UNIX, Vydání 7 od Otevřená skupina : vyberte nebo odmítněte řádky společné pro dva soubory - Příkazy a reference k nástrojům,
- Plán 9 Programátorská příručka, svazek 1 –
- Peklo Obecné příkazy Manuál –