Sada nástrojů pro přirozený jazyk - Natural Language Toolkit
Původní autoři | Steven Bird, Edward Loper, Ewan Klein |
---|---|
Vývojáři | Tým NLTK |
První vydání | 2001[1] |
Stabilní uvolnění | 3,5 / 13 dubna 2020[2] |
Úložiště | |
Napsáno | Krajta |
Typ | Zpracování přirozeného jazyka |
Licence | Apache 2.0[3] |
webová stránka | www |
The Sada nástrojů pro přirozený jazyknebo častěji NLTK, je sada knihovny a programy pro symbolické a statistické zpracování přirozeného jazyka (NLP) pro angličtinu napsanou v Programovací jazyk Python. To bylo vyvinuto Stevenem Birdem a Edwardem Loperem na Katedře počítačové a informační vědy na University of Pennsylvania.[4] NLTK zahrnuje grafické ukázky a ukázková data. Je doprovázena knihou, která vysvětluje základní pojmy za úkoly zpracování jazyků podporovanými sadou nástrojů,[5] plus kuchařka.[6]
NLTK je určena na podporu výzkumu a výuky v NLP nebo úzce související oblasti, včetně empirických lingvistika, kognitivní věda, umělá inteligence, vyhledávání informací, a strojové učení.[7]NLTK se úspěšně používá jako učební nástroj, jako individuální studijní nástroj a jako platforma pro prototypování a budování výzkumných systémů. Existuje 32 univerzit v USA a 25 zemích, které používají NLTK ve svých kurzech. NLTK podporuje funkce klasifikace, tokenizace, odvozování, značkování, syntaktická analýza a sémantické uvažování.[8]
Hlavní body knihovny
- Lexikální analýza: Tokenizer slov a textu
- n-gram a kolokace
- Značkovač části řeči
- Stromový model a text chunker pro zachycení
- Rozpoznání pojmenované entity
Viz také
Reference
- ^ „Stránka projektu na SourceForge“. 9. července 2001.
- ^ "NLTK ChangeLog". nltk.org. Citováno 13. dubna 2020.
- ^ „Licence NLTK“. Projekt NLTK. Citováno 14. února 2015.
- ^ "Předmluva". www.nltk.org. Citováno 15. června 2016.
- ^ Bird, Steven; Klein, Ewan; Loper, Edward (2009). Zpracování přirozeného jazyka s Pythonem. O'Reilly Media Inc. ISBN 978-0-596-51649-9.
- ^ Perkins, Jacob (2010). Zpracování textu v Pythonu s kuchařkou NLTK 2.0. Packt Publishing. ISBN 978-1849513609.
- ^ Bird, Steven; Klein, Ewan; Loper, Edward; Baldridge, Jason (2008). „Multidisciplinární výuka pomocí sady nástrojů pro přirozený jazyk“ (PDF). Proceedings of the Third Workshop on the Issues in Teaching Computational Linguistics, ACL. Archivovány od originál (PDF) dne 2. září 2011. Citovat deník vyžaduje
| deník =
(Pomoc) - ^ „Kurzy NLTK“. Google dokumenty. Citováno 15. června 2016.
externí odkazy
Tento programovací jazyk související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |