Myšlenkový poklad - ThoughtTreasure
![]() | Tento článek má několik problémů. Prosím pomozte vylepši to nebo diskutovat o těchto otázkách na internetu diskusní stránka. (Zjistěte, jak a kdy tyto zprávy ze šablony odebrat) (Zjistěte, jak a kdy odstranit tuto zprávu šablony)
|
Myšlenkový poklad je zdravá znalostní báze a architektura pro zpracování přirozeného jazyka Obsahuje deklarativní i procedurální znalosti.
Deklarativní znalosti
Databáze znalostí ThoughtTreasure se skládá z koncepty, které jsou navzájem propojeny pomocí tvrzení. Tvrzení je znázorněno ve formě
@timestamp: timestamp | [koncept ...]
Některé příklady tvrzení v ThoughtTreasure jsou:
[isa soda drink] (Soda je nápoj.) [část vyzváněcího telefonu] (Zvonění telefonu je součástí telefonu.) [zelený zelený hrášek] (zelený hrášek je zelený.) [průměr- of green-pea .25in] (Průměr zeleného hrášku je 0,25 palce.) [doba trvání přehrávání ČÍSLO: sekunda: 10800] (doba trvání hry je 10 800 sekund.) [produkt Intel-8080 Intel ] (Intel 8080 je produktem společnosti Intel.) @ 19770120: 19810120 | [President-of-country-USA Jimmy-Carter] (Jimmy Carter byl prezidentem USA od 20. ledna 1977 do 20. ledna 1981).
ThoughtTreasure obsahuje celkem 27 000 konceptů a 51 000 tvrzení. Má horní ontologie a několik nižších ontologií specifických pro doménu, například pro oblečení, jídlo a hudbu.
Každý koncept je spojen s nulou nebo více lexikální záznamy (slova a fráze). Podporovány jsou dva jazyky: angličtina a francouzština. ThoughtTreasure má 35 000 anglických lexikálních záznamů a 21 000 francouzských lexikálních záznamů. Kromě otevřených lexikálních záznamů, jako jsou oznámení, slovesa, přídavná jména a příslovce, ThoughtTreasureal také obsahuje uzavřené- lexikální záznamy třídy, jako jsou spojky, determinanty, citoslovce, předložky a zájmena. Obsahuje také slovník jmen.
Nula nebo více funkce jsou připojeny ke každé lexikální položce. K dispozici je 118 funkcí. Příklady jsou ZEROART (nulový příjemce článku), SING (singulární), FML (formální), CAN (kanadský), ENG (anglický) a N (podstatné jméno). Argumentová struktura je například pro slovesa. Například struktura argumentu pro koncept vejít je
*> S ---- (z IO [2]) do IO
ThoughtTreasure obsahuje 93 skriptynebo reprezentace typických činností.
ThoughtTreasure obsahuje 29 mřížky, které představují uspořádání objektů na typických místech, jako jsou hotelové pokoje, kuchyně a divadla. Mřížky jsou spojeny dohromady pomocí červí díry.
Procedurální znalosti
ThoughtTreasure zahrnuje a plánovací agentura za dosažení cílů v simulovaném světě aporozumění agentuře pro pochopení příběhů a dotazování a zodpovězení otázek.
ThoughtTreasure obsahuje následující postupy pro zpracování přirozeného jazyka:
- Algoritmické, analogické a derivační morfologické mechanismy
- Anaforický analyzátor
- Chatterbot
- Nástroje pro analýzu korpusu
- Generátor slovníku
- Vyčerpávající lexikální značkovač
- Intension resolver (k vyhledání objektů odpovídajících popisu)
- Rozpoznávače pojmenovaných entit
- Generátor přirozeného jazyka
- Sémantický analyzátor
- Syntaktický analyzátor
- Extraktor informací o tabulce
ThoughtTreasure obsahuje následující procedury, které se zabývají prostorem:
- 2-dimenzionální mřížka (obsazení pole) plánovač cest
- Analogový mřížkový instanciátor
- Intergrid plánovač cest
- Plánovač výletů
Obsahuje operace zabývající se částmi a celky objektů, mřížkami (vzdálenost, podprostor), velkým prostorem (planetární vzdálenost, omezení polity) a vnořeným prostorem (místnost, podlaha, budova, město, planeta).
Mezi další postupy v ThoughtTreasure patří:
- Učení se
- Srovnávač barev oblečení
- Generátor bezplatných asociací
- Funkce ukládání a načítání znalostní báze
- Simulátor psaní s chybami
Použití
ThoughtTreasure lze použít k přidání zdravého rozumu do aplikací pomocí jeho znalostní báze nebo komunikací se serverem ThoughtTreasure.
ThoughtTreasure se používá k vytváření různých aplikací, jako je DJův asistent, program pro zodpovídání otázek o recenzi filmu a inteligentní kalendář.
Dějiny
ThoughtTreasure zahájil Erik Mueller v prosinci 1993. První verze byla vydána 28. dubna 1996. Mueller založil společnost Signiform v roce 1997, aby sledoval komerční aplikace ThoughtTreasure. Společnost však byla neúspěšná a společnost Signiform zavřela své brány v roce 2000. V roce 2000 se Erik Mueller přestěhoval do IBM Research, kde byl členem týmu, který vyvinul Watson (počítač) 31. července 2015 byl ThoughtTreasure zpřístupněn na GitHubu.
Viz také
Reference
- Mueller, Erik T. (1998). Zpracování přirozeného jazyka s ThoughtTreasure. New York: Signiform. ISBN 978-1478171652.
- Mueller, Erik T. (1999). Databáze a lexikon skriptů pro ThoughtTreasure.
- Mueller, Erik T. (2000). „Kalendář se zdravým rozumem.“ Sborník mezinárodní konference o inteligentních uživatelských rozhraních z roku 2000 (str. 198–201). New York: ACM.