Agregace (lingvistika) - Aggregation (linguistics)
![]() | tento článek je psán jako osobní reflexe, osobní esej nebo argumentační esej který uvádí osobní pocity editora Wikipedie nebo představuje originální argument o tématu.Květen 2011) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Agregace je dílčí úkol generace přirozeného jazyka, což zahrnuje sloučení syntaktických složek (jako jsou věty a fráze) dohromady. Někdy lze agregaci provést na koncepční úrovni.
Příklady
Jednoduchým příkladem syntaktické agregace je sloučení těchto dvou věty John šel do obchodu a John koupil jablko do jediné věty John šel do obchodu a koupil jablko.
Syntaktická agregace může být mnohem složitější. Například agregace může vložit jednu ze složek do druhé; můžeme například agregovat John šel do obchodu a Obchod byl zavřený do věty John šel do obchodu, který byl zavřený.
Z pragmatického pohledu agregace vět dohromady čtenáři často naznačuje, že tyto věty spolu souvisejí. Pokud tomu tak není, může dojít ke zmatení čtenáře. Například někdo, kdo čte John šel do obchodu a koupil jablko může odvodit, že jablko bylo zakoupeno v obchodě; pokud tomu tak není, neměly by se tyto věty agregovat.
Algoritmy a problémy
Agregační algoritmy musí dělat dvě věci:
- Rozhodněte, kdy se mají agregovat dvě složky
- Rozhodněte, jak mají být dvě složky agregovány, a vytvořte agregovanou strukturu
První otázka, rozhodování o tom, kdy agregovat, je špatně pochopena. Rozhodnutí o agregaci rozhodně závisí na sémantický vztahy mezi složkami, jak je uvedeno výše; také závisí na žánr (např. byrokratické texty bývají agregovanější než návody k použití). Pravděpodobně by měly záviset na rétorické a diskurzní struktuře.[1] The gramotnost úroveň čtenáře je také pravděpodobně důležitá (chudí čtenáři potřebují kratší věty).[2] Nemáme ale žádný integrovaný model, který by všechny tyto faktory spojil do jednoho algoritmus.
Pokud jde o druhé vydání, byly provedeny některé studie různých typů agregace a způsobu, jakým by měly být prováděny. Harbusch a Kempen popisují několik strategií syntaktické agregace. Podle jejich terminologie John šel do obchodu a koupil jablko je příkladem dopředná spojka Snížení [3]O koncepční agregaci se toho ví mnohem méně. Di Eugenio et al. Ukažte, jak lze v inteligentním systému doučování provést koncepční agregaci, a prokažte, že provedení takové agregace činí systém efektivnějším (a že koncepční agregace má větší dopad než syntaktická agregace).[4]
Software
Bohužel není k dispozici mnoho softwaru pro provádění agregace.[Citace je zapotřebí ] Systém SimpleNLG[5] zahrnuje omezenou podporu pro základní agregaci. Například následující kód způsobí, že se SimpleNLG vytiskne Muž má hlad a kupuje si jablko.
SPhraseSpec s1 = nlgFactory.createClause("muž", "být", "hladový");SPhraseSpec s2 = nlgFactory.createClause("muž", "Koupit", "jablko");NLGElement výsledek = Nový ClauseCoordinationRule().aplikovat(s1, s2);Systém.ven.tisk(realizátor.realiseSentence(výsledek));
externí odkazy
Reference
- ^ D Scott a C de Souza (1990). Získání zprávy napříč generováním textu na základě RST. In Dale et al (eds)Současný výzkum v generování přirozeného jazyka. Akademický tisk
- ^ S Williams a E Reiter (2008). Generování zpráv o základních dovednostech pro čtenáře s nízkou kvalifikací. Přirozené jazykové inženýrství 14:495-535
- ^ K Harbusch a G Kempen (2009). Generování elipsové souřadnicové elipsy vícejazyčně: Jednotný přístup založený na zveřejňování. v Proc ENLG-2009 28:105-144. [1]
- ^ B Di Eugenio, D Fossati, D Yu (2005). Agregace zlepšuje učení: experimenty v generování přirozeného jazyka pro inteligentní doučovací systémy. v Proc ACL-2005 str. 50–57. [2]
- ^ Gatt a E Reiter (2009). SimpleNLG: Realizační modul pro praktické aplikace. Sborník ENLG09 [3]