Kontrola gramatiky - Grammar checker

A kontrola gramatiky, v výpočetní podmínky, je program, nebo část programu, který se pokouší ověřit psaný text pro gramatická správnost. Kontrola gramatiky se nejčastěji implementuje jako funkce většího programu, například a textový procesor, ale jsou k dispozici také samostatně aplikace které lze aktivovat v rámci programů, které pracují s upravitelným textem.
Implementace kontroly gramatiky využívá zpracování přirozeného jazyka.[1][2]
Dějiny
Prvními „kontrolami gramatiky“ byly programy, které kontrolovaly interpunkci interpunkcí a stylů, spíše než úplnou škálu možných gramatických chyb. Byl volán první systém Writer's Workbench, a byla sada psacích nástrojů součástí Unix systémy již v 70. letech.[3][4] Celý Writer's Workbench balíček obsahoval několik samostatných nástrojů pro kontrolu různých problémů s psaním. Nástroj „dikce“ zkontroloval, zda v textu nejsou rozvláčné, uvážlivé, klišé nebo zneužity fráze. Nástroj by vydal seznam pochybných frází a poskytl návrhy na zlepšení psaní. Nástroj „styl“ analyzoval styl psaní daného textu. Provedlo řadu testů čitelnosti textu a vydalo výsledky a poskytlo statistické informace o větách textu.
Aspen Software společnosti Albuquerque, Nové Mexiko vydala nejstarší verzi kontroly dikcí a stylů pro osobní počítače, Grammatik, v roce 1981. Grammatik byl poprvé k dispozici pro Rádio Shack - TRS-80 a brzy měl verze pro CP / M a IBM PC. Získán referenční software v San Francisku v Kalifornii Grammatik v roce 1985. Vývoj Grammatik pokračovala a stala se skutečnou kontrolou gramatiky, která dokázala detekovat chyby při psaní nad rámec jednoduché kontroly stylu.
Zahrnuty další programy pro včasnou dikci a kontrolu stylu Interpunkce a styl, Správná gramatika, RightWriter a PowerEdit.[5] Zatímco všechny nejčasnější programy začaly jako jednoduchá kontrola dikce a stylu, všechny nakonec přidaly různé úrovně zpracování jazyka a vyvinuly určitou úroveň schopnosti kontroly skutečné gramatiky.
Do roku 1992 se kontrola gramatiky prodávala jako doplňkové programy. V té době bylo k dispozici velké množství různých programů pro zpracování textu s WordPerfect a Microsoft Word první dva v podílu na trhu. V roce 1992 Microsoft rozhodl se přidat kontrolu gramatiky jako funkci Wordu a licencoval CorrecText, kontrolu gramatiky od Houghton Mifflin které ještě nebyly uvedeny na trh jako samostatný produkt. WordPerfect odpověděl na krok Microsoftu získáním referenčního softwaru a jeho přímého potomka Grammatik je stále součástí WordPerfectu.
Od roku 2019 jsou kontroly gramatiky zabudovány do systémů jako Google dokumenty a Sapling.ai,[6] rozšíření prohlížeče jako Gramaticky a Qordoba, desktopové aplikace jako Zrzavý, zdarma a open-source software jako LanguageTool,[7] a doplňky textového editoru, jako jsou ty, které jsou k dispozici v softwaru WebSpellChecker.
Technické problémy
Nejstarší programy stylu psaní byly zkontrolovány, banální, klišé nebo nesprávně použité fráze v textu. Tento proces byl založen na jednoduchém porovnávání vzorů. Jádrem programu byl seznam mnoha stovek nebo tisíců frází, které mnozí odborníci považují za špatné psaní. Seznam sporných frází obsahoval alternativní formulace pro každou frázi. Kontrolní program by jednoduše rozdělil text na věty, zkontroloval shody ve slovníku frází, označil podezřelé fráze a ukázal alternativu. Tyto programy mohou také provádět některé mechanické kontroly. Například by obvykle označili zdvojená slova, zdvojenou interpunkci, některá kapitalizace chyby a další jednoduché mechanické chyby.
Pravá kontrola gramatiky je složitější. Zatímco počítačový programovací jazyk má velmi specifickou syntaxi a gramatiku, není to tak přirozené jazyky. Dá se napsat něco úplně formální gramatika pro přirozený jazyk, ale ve skutečném použití je obvykle tolik výjimek, že formální gramatika je při psaní gramatické kontroly minimální pomocí. Jednou z nejdůležitějších částí kontroly gramatiky přirozeného jazyka je a slovník všech slov v jazyce spolu s částí řeči každého slova. Skutečnost, že přirozené slovo může být použito jako kterákoli z několika různých částí řeči (například „volné“, které se používá jako adjektivum, příslovce, podstatné jméno nebo sloveso), značně zvyšuje složitost jakéhokoli kontroleru gramatiky.
Kontrola gramatiky najde každou větu v textu, vyhledá každé slovo ve slovníku a pokusí se o něj analyzovat větu do podoby, která odpovídá gramatice. Pomocí různých pravidel pak program může detekovat různé chyby, například dohodu v čas, číslo, slovosled, a tak dále. Je také možné zjistit některé stylistické problémy s textem. Například někteří oblíbení průvodci stylem, jako je Prvky stylu odmítnout nadměrné používání pasivní hlas. Kontrola gramatiky se může pokusit identifikovat pasivní věty a navrhnout alternativu aktivního hlasu.
Softwarové prvky potřebné pro kontrolu gramatiky úzce souvisí s některými vývojovými problémy, které je třeba řešit software pro rozpoznávání hlasu. Při rozpoznávání hlasu lze parsování použít k předpovědi, které slovo je nejpravděpodobnější, na základě části řeči a polohy ve větě. Při kontrole gramatiky se syntaktická analýza používá k detekci slov, která nedodržují přijaté použití gramatiky.
Nedávno,[když? ] Výzkum se zaměřil na vývoj algoritmů, které dokáží rozpoznat gramatické chyby na základě kontext okolních slov.[je zapotřebí objasnění ]
Kritika
Gramatiky jsou považovány za typ cizojazyčná pomůcka pro psaní které mohou rodilí mluvčí použít ke korektuře svých spisů, protože takové programy se snaží identifikovat syntaktické chyby.[8] Stejně jako u jiných počítačových psacích pomůcek, jako je kontrola pravopisu, populární kontroly gramatiky jsou často kritizovány, když nedokážou odhalit chyby a nesprávně označit správný text jako chybný. Lingvista Geoffrey K. Pullum v roce 2007 tvrdili, že jsou obecně tak nepřesní, že způsobují více škody než užitku: „Přijetím doporučení kontrolora počítačové gramatiky ve vašich prózách se to většinou stane hodně horší, někdy veselý nesouvislý. “[9]
Viz také
Reference
- ^ Vikrant Bhateja; João Manuel R.S. Tavares; B. Padmaja Rani; V. Kamakši Prasad; K. Srujan Raju (23. července 2018). Sborník z druhé mezinárodní konference o výpočetní inteligenci a informatice: ICCII 2017. Springer. ISBN 978-981-10-8228-3.
- ^ Robert Dale; Hermann Moisl; Harold Somers (25. července 2000). Příručka pro zpracování přirozeného jazyka. CRC Press. ISBN 978-0-8247-9000-4.
- ^ „Ideas - O'Reilly Media“. www.linuxdevcenter.com.
- ^ A. Walker: Linuxová kuchařka
- ^ Inc, InfoWorld Media Group (28. října 1991). InfoWorld. InfoWorld Media Group, Inc. str.68 - prostřednictvím internetového archivu.
- ^ Kontrola gramatiky umělé inteligence AI
- ^ Porovnání kontroly gramatiky Dokumentů Google s jejími alternativami
- ^ Bustamante, F.R., a León, FS, (1996). GramCheck: kontrola gramatiky a stylu. Sborník ze 16. konference o počítačové lingvistice, 5. – 0. Srpna, Kodaň, Dánsko. Vyvolány 19 March 2012.
- ^ Geoffrey K. Pullum (26. října 2007). „Opice zkontrolují vaši gramatiku“. Jazykový protokol. Citováno 8. března 2010.