Generování odkazujícího výrazu - Referring expression generation

Generování odkazujícího výrazu (REG) je dílčí úkol generace přirozeného jazyka (NLG), kterému se dostalo největší odborné pozornosti. Zatímco NLG se zabývá převodem mimojazykových informací do přirozeného jazyka, REG se zaměřuje pouze na tvorbu odkazující výrazy (podstatné jméno fráze), které identifikují konkrétní entity zvané cíle.

Tuto úlohu lze rozdělit na dvě části. The výběr obsahu část určuje, která sada vlastností odlišuje zamýšlený cíl od jazyková realizace Část definuje, jak jsou tyto vlastnosti přeloženy do přirozeného jazyka. V komunitě NLG byla vyvinuta řada algoritmů pro generování různých typů odkazujících výrazů.

Typy odkazujících výrazů

A odkazující výraz (RE), v lingvistice, je jakýkoli jmenná fráze, nebo náhrada za podstatnou frázi, jejíž funkce v diskurzu je identifikovat nějaký individuální objekt (věc, bytí, událost ...) odborná terminologie pro identifikovat se velmi liší od jedné lingvistické školy k druhé. Nejrozšířenějším termínem je pravděpodobně viza identifikovaná věc je a referent, jako například v díle John Lyons. V lingvistice patří studium referenčních vztahů k pragmatika, studium používání jazyka, i když je to také otázka velkého zájmu filozofů, zejména těch, kteří chtějí pochopit podstatu znalost, vnímání a poznání obecněji.

Pro referenci lze použít různá zařízení: determinanty, zájmena, vlastní jména... Referenční vztahy mohou být různého druhu; referenti mohou být v „reálném“ nebo imaginárním světě, v samotném diskurzu, a mohou být singulární, množní nebo kolektivní.

Zájmena

Nejjednodušší typ odkazujících výrazů je zájmeno jako on a to. Lingvistické komunity a komunity pro zpracování přirozeného jazyka vyvinuly různé modely pro předpovídání anaphorových referentů, jako je teorie centrování,^[1] a v ideálním případě by generování odkazujícího výrazu bylo založeno na takových modelech. Většina systémů NLG však používá mnohem jednodušší algoritmy, například použití zájmena, pokud byl referent zmíněn v předchozí větě (nebo větě o větě), a v této větě nebyla zmíněna žádná jiná entita stejného pohlaví.

Určité podstatné fráze

Proběhlo značné množství výzkumu generování definitivních frází podstatného jména, jako např velká červená kniha. Hodně z toho vychází z modelu navrženého Daleem a Reiterem.^[2] To bylo rozšířeno různými způsoby, například Krahmer et al.^[3] představit graficko-teoretický model konečné generace NP s mnoha pěknými vlastnostmi. V posledních letech událost se sdíleným úkolem porovnávala různé algoritmy pro definitivní generování NP pomocí TUNA^[4] korpus.

Prostorový a časový odkaz

V poslední době došlo k dalšímu výzkumu generování odkazujících výrazů pro čas a prostor. Takové odkazy bývají nepřesné (jaký je jejich přesný význam) dnes večer?), A také, aby jej různí lidé interpretovali různými způsoby.^[5] Proto může být nutné explicitně uvažovat o falešně pozitivních a falešně negativních kompromisech a dokonce vypočítat užitečnost různých možných odkazujících výrazů v kontextu konkrétní úlohy.^[6]

Kritéria pro dobré výrazy

V ideálním případě by měl dobrý odkazující výraz splňovat řadu kritérií:

Referenční úspěch: Mělo by to jednoznačně identifikovat referenta čtenáři.
Snadné porozumění: Čtenář by měl být schopen rychle číst a rozumět mu.
Výpočetní složitost: Algoritmus generování by měl být rychlý
Žádné falešné závěry: Tento výraz by neměl čtenáře zmást nebo uvést v omyl tím, že naznačuje nepravdivý implikáty nebo jiné pragmatické závěry. Například čtenář může být zmatený, pokud mu to někdo řekne Posaďte se u hnědého dřevěného stolu v kontextu, kde existuje pouze jedna tabulka.^[2]

Dějiny

Éra před rokem 2000

REG se vrací do počátků NLG. Jeden z prvních přístupů provedl Winograd^[7] v roce 1972, který vyvinulpřírůstkové "REG algoritmus pro jeho SHRDLU program. Poté vědci začali v 80. letech modelovat lidské schopnosti a vytvářet odkazující výrazy. Tento nový přístup k tématu ovlivnili vědci Appelt a Kronfeld, kteří vytvořili programy KAMP a BERTRAND^[8]^[9]^[10] a považoval odkazující výrazy za součást větších řečových aktů.

Mezi jejich nejzajímavější zjištění patřila skutečnost, že odkazující výrazy lze použít k přidání informací nad rámec identifikace referenta^[9] stejně jako vliv komunikativního kontextu a Gricijské maximy o odkazujících výrazech.^[8] Navíc jeho skepse ohledně přirozenosti minimálních popisů učinila z výzkumu Appelta a Kronfelda základ pozdější práce na REG.

Hledání jednoduchých, dobře definovaných problémů změnilo směr výzkumu na počátku 90. let. Tento nový přístup vedli Dale a Reiter, kteří zdůraznili identifikaci referenta jako ústředního cíle.^[11]^[12]^[13]^[14]Jako Appelt^[8] diskutují o souvislosti mezi Gricijské maximy a odkazující výrazy v jejich vrcholném příspěvku^[2] ve kterém také navrhují formální definice problému. Reiter a Dale dále diskutují o Plná stručnost a Chamtivá heuristika algoritmy i jejich Inkrementální algoritmus (IA), který se stal jedním z nejdůležitějších algoritmů v REG.^{[poznámka 1]}

Pozdější vývoj

Po roce 2000 začal výzkum zvedat některé zjednodušující předpoklady, které byly učiněny v raných výzkumech REG za účelem vytvoření jednodušších algoritmů. Různé výzkumné skupiny se soustředily na různá omezení a vytvořily několik rozšířených algoritmů. Často tyto rozšiřují IA v jediné perspektivě, například ve vztahu k:

Odkaz na sady jako „nositelé triček“ nebo „zelená jablka a banán nalevo“^[15]^[16]^[17]^[18]
Relační popisy jako „šálek na stole“ nebo „žena, která má tři děti“^[19]^[20]^[21]^[22]^[23]
Kontextová závislost, Neurčitost a Stoupavost uveďte výroky jako „starší muž“ nebo „auto nalevo“, které jsou často bez kontextu nejasné^[6]^[24]^[25]
Nápadnost a Generování zájmen jsou vysoce závislí na diskurzu, například „ona“ je odkaz na „(nejvýznamnější) osobu ženy“^[26]^[27]^[28]^[29]^[30]^[31]^[32]

Mnoho zjednodušujících předpokladů stále existuje nebo se na nich právě začalo pracovat. Rovněž je třeba provést kombinaci různých rozšíření a Krahmer a van Deemter ji nazývají „netriviální podnik“.^[33]

Další důležitou změnou po roce 2000 bylo rostoucí využívání empirické studie za účelem vyhodnocení algoritmů. K tomuto vývoji došlo v důsledku vzniku transparentních korpusy. Přestože stále existují diskuse o tom, jaké jsou nejlepší metriky hodnocení, použití experimentálního hodnocení již vedlo k lepší srovnatelnosti algoritmů, diskusi o cílech REG a více zaměřenému na úkoly.

Výzkum dále rozšířil svou škálu na související témata, jako je výběr Reprezentace znalostí (KR) rámce. V této oblasti zůstává otevřená hlavní otázka, který rámec KR je nejvhodnější pro použití v REG. Odpověď na tuto otázku závisí na tom, jak dobře lze popisy vyjádřit nebo najít. Mnoho potenciálu rámců KR bylo dosud nevyužito.

Mezi různé přístupy patří použití:

Vyhledávání grafů který zachází se vztahy mezi cíli stejně jako s vlastnostmi.^[3]^[21]^[23]^[34]^[35]
Omezení spokojenosti což umožňuje oddělení mezi specifikací problému a implementací.^[19]^[36]
Moderní reprezentace znalostí který nabízí logický závěr například Popis Logika nebo Koncepční grafy.^[37]^[38]^[39]

^{[poznámka 1]}

Definice problému

Dale a Reiter (1995) uvažují o odkazování na výrazy jako na rozlišující popisy.

Definují:

The referent jako subjekt, který by měl být popsán
The kontextová sada jako soubor hlavních entit
The kontrastní sada nebo potenciální distraktory jako všechny prvky kontextové sady kromě referenta
A vlastnictví jako odkaz na singl dvojice atribut-hodnota

Každá entita v doméně může být charakterizována jako sada páry atribut-hodnota například ${displaystyle langle}$ typ, pes ${úhel zobrazení}$ , ${displaystyle langle}$ Pohlaví Žena ${úhel zobrazení}$ nebo ${displaystyle langle}$ věk, 10 let ${úhel zobrazení}$ .

Problém je pak definován takto:

Nechat ${displaystyle r}$ být zamýšleným referentem a ${displaystyle C}$ být kontrastní sadou. Pak sada ${displaystyle L}$ párů atribut-hodnota bude představovat rozlišující popis, pokud platí následující dvě podmínky:

Každý pár atribut – hodnota ${displaystyle L}$ platí pro ${displaystyle r}$ : to znamená každý prvek ${displaystyle L}$ určuje atribut – hodnotu, která ${displaystyle r}$ má.
Pro každého člena ${displaystyle c}$ z ${displaystyle C}$ , existuje alespoň jeden prvek ${displaystyle l}$ z ${displaystyle L}$ to se nevztahuje na ${displaystyle c}$ : to znamená, že existuje ${displaystyle l}$ v ${displaystyle L}$ který určuje atribut – hodnotu, která ${displaystyle c}$ nemá. ${displaystyle l}$ údajně vylučuje ${displaystyle c}$ .

Jinými slovy, pro vygenerování odkazujícího výrazu se hledá sada vlastností, které se vztahují na referenta, ale ne na distraktory.^[2]

Problém lze snadno vyřešit spojením všech vlastností referenta, což často vede k dlouhým popisům porušujícím druhý Griceanský maximální počet. Dalším přístupem by bylo najít nejkratší charakteristický popis, jako je Algoritmus plné stručnosti V praxi je však nejběžnější místo toho zahrnout podmínku, že odkazující výrazy vytvořené algoritmem by měly být co nejpodobnější lidským výrazům, i když to často není výslovně uvedeno.^{[poznámka 1]}

Základní algoritmy

Plná stručnost

Algoritmus Full Brevity vždy najde minimální rozlišovací popis, což znamená, že neexistuje žádný kratší rozlišovací popis použitých vlastností.

Proto iteruje znovu ${displaystyle n = 1,2,3,4, ...}$ a zkontroluje každý popis délky ${displaystyle n}$ vlastnosti, dokud není nalezen charakteristický popis.

Z tohoto způsobu vytváření odkazujících výrazů vyplývají dva problémy. Nejprve má algoritmus vysokou složitost, což znamená, že je NP-tvrdé což znemožňuje jeho použití.^[40] Zadruhé lidští mluvčí vytvářejí popisy, které nejsou v mnoha situacích minimální.^[41]^[42]^[43]^[44]^{[poznámka 1]}

Chamtivá heuristika

Algoritmus Greedy Heuristics^[11]^[12] aproximuje algoritmus Full Brevity iterativním přidáním nejvýraznější vlastnosti k popisu. Nejvýraznější vlastností se rozumí vlastnost, která vylučuje většinu zbývajících rušivých prvků. Algoritmus Greedy Heuristics je efektivnější než algoritmus Full Brevity.^{[poznámka 1]}

Dale a Reiter (1995)^[2] představte následující algoritmus pro chamtivou heuristiku:

Nechat ${displaystyle L}$ být soubor vlastností, které mají být realizovány v našem popisu; nechat ${displaystyle P}$ být soubor vlastností, o nichž je známo, že jsou pravdivé pro našeho zamýšleného referenta ${displaystyle r}$ (předpokládáme to ${displaystyle P}$ není prázdné); a nechte ${displaystyle C}$ být sada distraktorů (sada kontrastu). Počáteční podmínky jsou tedy následující:

 ${displaystyle C = {langle}$ všechny distraktory ${úhel zobrazení}}$ ; ${displaystyle P = {langle}$ všechny vlastnosti platí  ${displaystyle rangle}}$ ; ${displaystyle L = {}}$

Za účelem popisu zamýšleného referenta ${displaystyle r}$ s ohledem na sadu kontrastu ${displaystyle C}$ , děláme následující:

1. Zkontrolujte úspěch: -li  ${displaystyle | C | = 0}$  pak vrátit se  ${displaystyle L}$  jako rozlišovací popis elseif  ${displaystyle P = emptyset}$  pak selhat jiný jít do Krok 2.2. Vyberte vlastnost: pro každého  ${displaystyle p_ {i} v P}$  dělat:  ${displaystyle C_ {i} leftarrow Ccap {x | p_ {i} (x)}}$    Zvolená vlastnost je  ${displaystyle p_ {j}}$  , kde  ${displaystyle C_ {j}}$  je nejmenší sada. jít do Krok 3.3. Rozšířit popis (vybraný  ${displaystyle p_ {j}}$ ):    ${displaystyle Lleftarrow Lcup {p_ {j}}}$     ${displaystyle Cleftarrow C_ {j}}$     ${displaystyle Pleftarrow P- {p_ {j}}}$    jít do Krok 1.

Inkrementální algoritmus

Inkrementální algoritmus (IA) od Dale a Reitera^[2] byl nejvlivnějším algoritmem před rokem 2000. Je založen na myšlence a přednostní pořadí atributů nebo vlastností, kterými reproduktory procházejí. Aby bylo možné spustit přírůstkový algoritmus, je třeba nejprve zadat pořadí preferencí atributů. Algoritmus nyní sleduje toto pořadí a přidává tyto vlastnosti k popisu, které vylučují všechny zbývající rušivé prvky. Dále Dale a Reiter^[2] zdůrazněte typ atributu, který je vždy obsažen v jejich popisu, i když nevylučuje žádné rušivé prvky.

Hodnoty typu jsou také součástí a hierarchie subsumpcí včetně některých hodnoty základní úrovně. Například v mazlíček doména čivava je zahrnut do Pes a Pes podle zvíře. Protože Pes je definována jako základní úroveň Pes by byly preferovány algoritmy, pokud čivava nevylučuje žádné rušivé prvky.

Inkrementální algoritmus je snadno implementovatelný a také výpočetně efektivní polynomiální čas. Popis generovaný IA může obsahovat nadbytečné vlastnosti, které jsou nadbytečné z důvodu později přidaných vlastností. Tvůrci to nepovažují za slabost, ale za to, aby výrazy byly méně „psycholingvisticky nepravděpodobné“.^[2]

Následující algoritmus je zjednodušenou verzí Daleova a Reiterova přírůstkového algoritmu^[2] Krahmer a van Deemter^[33] který bere jako vstup referenta r, D obsahující kolekci doménových objektů a objednaný seznam specifický pro doménu Pref preferovaných atributů. V notaci L je popis, C kontextová sada distraktorů a funkce RulesOut (⟨A_i, V⟩) vrací sadu objektů, které mají pro atribut A jinou hodnotu než V_i.

IncrementalAlgorithm ({r}, D, Pref) L ← ∅ C ← D - {r} pro každého A_i v seznamu pref dělat        V = hodnota (r, A_i)        -li C ∩ RulesOut (⟨A_i, V⟩) ≠ ∅ pak L ← L ∪ {⟨A_i, V⟩} C ← C - RulesOut (⟨A_i, V⟩) endif        -li C = ∅ pak vrátit se L endif    vrátit se selhání^{[poznámka 1]}

Hodnocení REG systémů

Před rokem 2000 mělo hodnocení systémů REG teoretickou povahu, jakou provedli Dale a Reiter.^[2] V poslední době se staly populární empirické studie, které jsou většinou založeny na předpokladu, že generované výrazy by měly být podobné lidským. Korpus hodnocení na základě začalo v REG poměrně pozdě kvůli nedostatku vhodných datových sad. Hodnocení založené na korpusu je v současné době nejdominantnější metodou, i když existuje i hodnocení lidským úsudkem.^{[poznámka 1]}

Korpusové hodnocení

Nejprve rozdíl mezi textové korpusy a musí být vytvořeny experimentální korpusy. Textové korpusy jako korpus GNOME^[1] může obsahovat texty ze všech druhů domén. V REG se používají k hodnocení realizace část algoritmů. The výběr obsahu část REG na druhé straně vyžaduje korpus, který obsahuje vlastnosti všech doménových objektů i vlastnosti použité v referencích. Typicky ty plně „sémanticky transparentní“^[45] vytvořené v experimentech pomocí jednoduchého a kontrolovaného nastavení.

Tyto experimentální korpusy lze znovu rozdělit na Univerzální korpusy které byly shromážděny pro jiný účel, ale byly analyzovány na odkazující výrazy a Vyhrazené korpusy které se zaměřují konkrétně na odkazující výrazy. Příkladem korpusů pro všeobecné účely jsou hruškové příběhy,^[46] korpus Mapové úlohy^[47] nebo kokosový korpus^[48] zatímco biskupský korpus,^[49] korpus zásuvky^[50] a korpus TUNA^[51] počítat do vyhrazených korpusů. Korpus TUNA, který obsahuje data shromážděná z webu o dvou doménách nábytek a lidé, byl již použit ve třech sdílených výzvách REG.^{[poznámka 1]}

Metriky hodnocení

Pro měření korespondence mezi korpusy a výsledky algoritmů REG bylo vyvinuto několik metrik.

Pro měření výběr obsahu část Koeficient kostky^[52] nebo MASI (dohoda o měření u položek se stanovenou hodnotou)^[53] metrické. Ty měří překrývání vlastností ve dvou popisech. Při hodnocení se skóre obvykle zprůměrují nad referencemi provedenými různými lidskými účastníky korpusu. Někdy také míra zvaná Percentuální poměr Perfect Recall (PRP)^[51] nebo přesnost^[54] se používá k výpočtu procenta dokonalých shod mezi referencí vytvořenou algoritmem a lidskou produkcí.

Pro jazyková realizace část REG překrytí mezi řetězci bylo měřeno pomocí metrik jako BLEU^[55] nebo NIST.^[56] Problém, který se vyskytuje u metrik založených na řetězcích, spočívá v tom, že například „Malá opice“ se měří blíže k „Malému oslíkovi“ než k „Malé opici“.

Časově náročnější způsob hodnocení REG algoritmů je nechat lidi posoudit Přiměřenost (Jak jasný je popis?) A Plynulost (Je popis uveden v dobré a jasné angličtině?) Generovaného výrazu. Také Belz a Gatt^[57] vyhodnotil odkazující výrazy pomocí experimentálního nastavení. Účastníci získají vygenerovaný popis a poté musí kliknout na cíl. Zde lze vyhodnotit dobu čtení vnějších metrik, čas identifikace a chybovost.^{[poznámka 1]}

Poznámky

^ ^A ^b ^C ^d ^E ^F ^G ^h ⁱ Tato část je výňatkem z následujícího příspěvku. Více podrobností viz: E Krahmer, K van Deemter (2012). Výpočetní generování odkazujících výrazů: průzkum. Výpočetní lingvistika 38:173-218 [1]

Reference

^ ^A ^b M. Poesio, R. Stevenson, B. di Eugenio, J. Hitzeman (2004). Centrování: Parametrická teorie a její instance. Výpočetní lingvistika 30:309-363 [2]
^ ^A ^b ^C ^d ^E ^F ^G ^h ⁱ ^j R Dale, E Reiter (1995). Výpočetní interpretace Griceanových maxim při generování odkazujících výrazů. Kognitivní věda, 18:233–263.
^ ^A ^b E Krahmer, S van Erk, A Verleg (2003). Generování odkazujících výrazů na základě grafů. Computational Linguistics 23: 53-72 [3]
^ [4]
^ E Reiter, S Sripada, J Hunter, J Yu a I Davy (2005). Volba slov v počítačem generovaných předpovědích počasí. Umělá inteligence 167:137-169.
^ ^A ^b R Turner, Y Sripada, E Reiter (2009) Generating přibližný zeměpisný popis. Sborník z 12. evropského workshopu o generování přirozeného jazyka (ENLG), strany 42–49, Atény. [5]
^ T Winograd (1972). Porozumění přirozenému jazyku. Akademický tisk, New York. Oddíl 8.3.3, Pojmenování objektů a událostí
^ ^A ^b ^C D Appelt (1985). Plánování anglických odkazujících výrazů. Umělá inteligence, 26:1–33.
^ ^A ^b D Appelt, A Kronfeld (1987). Výpočtový model doporučení. Ve sborníku z 10. mezinárodní společné konference o umělé inteligenci (IJCAI), strany 640–647, Milan.
^ Kronfeld (1990). Reference a výpočet: Esej z aplikované filozofie jazyka. Cambridge University Press, Cambridge.
^ ^A ^b R. Dale (1989). Vaření odkazujících výrazů. Ve sborníku z 27. výročního zasedání Asociace pro počítačovou lingvistiku (ACL), strany 68–75.
^ ^A ^b R Dale (1992). Generování odkazujících výrazů: Vytváření popisů v doméně objektů a procesů. TheMIT Press, Cambridge, MA.
^ E. Reiter (1990). Výpočtová složitost vyhýbání se konverzačním implikacím. Ve sborníku z 28. výročního zasedání Asociace pro počítačovou lingvistiku (ACL), strany 97–104, Pittsburgh, PA.
^ E. Reiter, R. Dale (1992). Rychlý algoritmus pro generování odkazujících výrazů. Ve sborníku ze 14. mezinárodní konference o počítačové lingvistice (COLING), strany 232–238, Nantes.
^ H Horáček (2004). Přirozeně odkazovat na sady objektů. Sborník z 3. mezinárodní konference o generování přirozeného jazyka (INLG), strany 70–79, Brockenhurst.
^ Gatt, K van Deemter (2007). Lexikální volba a konceptuální perspektiva při generování množného počtu odkazujících výrazů. Journal of Logic, Language and Information, 16:423–443.
^ I H Khan, K van Deemter, G Ritchie (2008). Generování odkazujících výrazů: Správa strukturních nejednoznačností. Sborník z 22. mezinárodní konference o počítačové lingvistice (COLING), strany 433–440, Manchester.
^ M Stone (2000). O identifikačních sadách. Sborník z 1. mezinárodní konference o generování přirozeného jazyka (INLG), strany 116–123, Mitzpe Ramon.
^ ^A ^b R Dale, N Haddock (1991). Generování odkazujících výrazů zahrnujících vztahy. Sborník příspěvků z 5. konference evropské kapitoly Asociace výpočetních lingvistů (EACL), strany 161–166, Berlín.
^ E Krahmer, M Theune (2002). Efektivní vytváření kontextově citlivých popisů v kontextu. In K van Deemter, R Kibble, redaktoři, Sdílení informací: oddanost a novost ve zpracování jazyků. Publikace CSLI, Stanford, CA, strany 223–264.
^ ^A ^b J Viethen, R Dale (2008). Využití prostorových vztahů v odkazujících výrazech. Sborník z 5. mezinárodní konference o generování přirozeného jazyka (INLG), strany 59–67, Salt Fork, OH.
^ Y Ren, K van Deemter, J Pan (2010). Mapování potenciálu Description Logic pro generování odkazujících výrazů. Sborník ze 6. mezinárodní konference o generování přirozeného jazyka (INLG), strany 115–124, Dublin.
^ ^A ^b E Krahmer, M Goudbeek, M Theune (2014). Generování odkazujících výrazů v interakci: Perspektiva založená na grafech. Stent, S Bangalore (eds.), Generování přirozeného jazyka v interaktivních systémech. Cambridge University Press.
^ K van Deemter (2006). Generování odkazujících výrazů, které zahrnují gradovatelné vlastnosti. Výpočetní lingvistika, 32(2):195–222.
^ H Horáček (2005). Generování referenčních popisů za podmínek nejistoty. Sborník příspěvků z 10. evropského workshopu o generování přirozeného jazyka (ENLG), strany 58–67, Aberdeen.
^ R Passonneau (1996). Vycentrování k uvolnění gricijských informačních omezení diskurzu anaforických jmenných frází. Jazyk a řeč, 39:229–264.
^ P W Jordan (2000). Záměrné vlivy na přepisování objektů v dialogu: Důkazy z empirické studie. Ph.D. diplomová práce, University of Pittsburgh.
^ E Hajičová (1993). Problémy struktury věty a diskurzních vzorců - teoretická a výpočetní lingvistika, sv. 2. Univerzita Karlova, Praha.
^ B J Grosz, A K Joshi, S Weinstein (1995). Centrování: Rámec pro modelování místní koherence diskurzu. Výpočetní lingvistika, 21:203–225.
^ D DeVault, C Rich, C L Sidner (2004). Generování přirozeného jazyka a kontext diskurzu: Výpočet sad distraktorů ze zásobníku zaostření. Sborník ze 17. mezinárodního setkání Floridské společnosti pro výzkum umělé inteligence (FLAIRS), Miami Beach, FL.
^ Siddharthan, Copestake (2004). Generování odkazujících výrazů v otevřených doménách. Sborník 42. výročního zasedání Asociace pro počítačovou lingvistiku (ACL), strany 407–414, Barcelona.
^ I Paraboni, K van Deemter, J Masthoff (2007). Generování odkazujících výrazů: Usnadnění identifikace referentů. Výpočetní lingvistika, 33:229–254.
^ ^A ^b E Krahmer, K van Deemter (2012). Výpočetní generování odkazujících výrazů: průzkum. Výpočetní lingvistika 38:173-218 [6]
^ E Krahmer, M Theune, J Viethen, I Hendrickx (2008). Graf: Náklady na nadbytečnost v odkazujících výrazech. Sborník mezinárodní konference o generování přirozeného jazyka (INLG), strany 227–229, Salt Fork, OH.
^ K van Deemter, E Krahmer (2007). Graphs and Booleans: On the generation of referring expressions. In H Bunt, R Muskens, redaktoři, Výpočetní význam, svazek 3. Studium lingvistiky a filozofie. Vydavatelé Springer, Berlín, strany 397–422.
^ C Gardent (2002). Generování minimálních jednoznačných popisů. Sborník ze 40. výročního zasedání Asociace pro počítačovou lingvistiku (ACL), strany 96–103, Philadelphia, PA.
^ M Croitoru, K van Deemter (2007). Konceptuální grafický přístup ke generování odkazujících výrazů. Sborník příspěvků z 20. mezinárodní společné konference o umělé inteligenci (IJCAI), strany 2456–2461, Hyderabad.
^ C Gardent, K Striegnitz (2007). Generování překlenovacích jednoznačných popisů. In H Bunt, Reinhard Muskens, redaktoři, Výpočetní význam, svazek 3. Studium lingvistiky a filozofie. Vydavatelé Springer, strany 369–396, Berlín, DB.
^ C Areces, A Koller, K Striegnitz (2008). Odkazování na výrazy jako na vzorce popisné logiky. Sborník z 5. mezinárodní konference o generování přirozeného jazyka (INLG), strany 42–49, Salt Fork, OH.
^ M. R. Garey, S. S. Johnson (1979). Počítače a neodolatelnost: Průvodce po teorii NP – úplnosti. W. H. Freeman, New York.
^ D R Olson (1970). Jazyk a myšlení: Aspekty kognitivní teorie sémantiky. Psychologický přehled, 77:257–273.
^ S Sonnenschein (1984). Účinek redundantní komunikace na posluchače: Proč mohou mít různé typy různé účinky. Journal of Psycholinguistic Research, 13:147–166.
^ T Pechmann (1989). Inkrementální produkce řeči a referenční nadspecifikace. Lingvistika, 27:98–110.
^ P E Engelhardt, K G.D Bailey, F Ferreira (2006). Dodržují řečníci a posluchači Gricean Maxim of Quantity ?. Deník paměti a jazyka, 54:554–573.
^ K van Deemter, I van der Sluis, A Gatt (2006). Vytváření sémanticky transparentního korpusu pro generování odkazujících výrazů. Ve sborníku ze 4. mezinárodní konference o generování přirozeného jazyka (INLG), strany 130–132, Sydney.
^ W W Chafe (1980). Hruškové příběhy: kognitivní, kulturní a jazykové aspekty narativní produkce. Ablex, Norwood, NJ.
^ A A Anderson, M Bader, E Gurman Bard, E Boyle, G Doherty, S Garrod, S Isard, J Kowtko, J McAllister, J Miller, C Sotillo, H Thompson, R Weinert (1991). Korpus úlohy mapy HCRC. Jazyk a řeč, 34:351–366.
^ B Di Eugenio, P W Jordan, R H Thomason, J D Moore (2000). Proces dohody: empirické zkoumání dialogů spolupráce mezi člověkem a počítačem. International Journal of Human-Computer Studies, 53:1017–1076.
^ P Gorniak, D Roy (2004). Uzemněná sémantická kompozice pro vizuální scény. Journal of Artificial Intelligence Research, 21:429–470.
^ J Viethen, R Dale (2006). Algoritmy pro generování odkazujících výrazů: Dělají to, co dělají lidé ?. Sborník ze 4. mezinárodní konference o generování přirozeného jazyka (INLG), strany 63–70, Sydney.
^ ^A ^b Gatt, I van der Sluis, K van Deemter (2007). Vyhodnocování algoritmů pro generování odkazujících výrazů pomocí vyváženého korpusu. Sborník z 11. evropského workshopu o generování přirozeného jazyka (ENLG), strany 49–56, Schloss Dagstuhl.
^ L R kostky (1945). Míra míry ekologické asociace mezi druhy. Ekologie, 26:297–302.
^ R Passonneau (2006). Měření dohody o položkách se stanovenou hodnotou (MASI) pro sémantickou a pragmatickou anotaci. Sborník z 5. mezinárodní konference o jazykových zdrojích a hodnocení (LREC), strany 831–836, Janov.
^ Gatt, A Belz, E Kow (2008). Výzva TUNA 2008: Přehled a výsledky hodnocení. Sborník z 5. mezinárodní konference o generování přirozeného jazyka (INLG), strany 198–206, Salt Fork, OH.
^ K Papineni, S Roukos, T Ward, W Zhu (2002). BLEU: Metoda automatického vyhodnocení strojového překladu. Sborník ze 40. výročního zasedání Asociace pro počítačovou lingvistiku (ACL), strany 311–318, Philadelphia, PA.
^ G Doddington (2002). Automatické vyhodnocení kvality strojového překladu pomocí statistik společného výskytu n-gramů. Sborník z 2. mezinárodní konference o výzkumu technologií lidských jazyků (HLT), strany 138–145, San Diego, CA.
^ Belz, Gatt (2008). Vnitřní a vnější hodnocení pro měření generování odkazujících výrazů. Sborník ze 46. výročního zasedání Asociace pro počítačovou lingvistiku (ACL), Columbus, OH.

[Krahmer&van_Deemter-15] A ^b ^C ^d ^E ^F ^G ^h ⁱ Tato část je výňatkem z následujícího příspěvku. Více podrobností viz: E Krahmer, K van Deemter (2012). Výpočetní generování odkazujících výrazů: průzkum. Výpočetní lingvistika 38:173-218 [1]

[Poesio_et_al.-1] A ^b M. Poesio, R. Stevenson, B. di Eugenio, J. Hitzeman (2004). Centrování: Parametrická teorie a její instance. Výpočetní lingvistika 30:309-363 [2]

[Dale&Reiter-2] A ^b ^C ^d ^E ^F ^G ^h ⁱ ^j R Dale, E Reiter (1995). Výpočetní interpretace Griceanových maxim při generování odkazujících výrazů. Kognitivní věda, 18:233–263.

[Krahmer,Erk,Verleg-3] A ^b E Krahmer, S van Erk, A Verleg (2003). Generování odkazujících výrazů na základě grafů. Computational Linguistics 23: 53-72 [3]

[4] [4]

[5] E Reiter, S Sripada, J Hunter, J Yu a I Davy (2005). Volba slov v počítačem generovaných předpovědích počasí. Umělá inteligence 167:137-169.

[Turner_et_al.-6] A ^b R Turner, Y Sripada, E Reiter (2009) Generating přibližný zeměpisný popis. Sborník z 12. evropského workshopu o generování přirozeného jazyka (ENLG), strany 42–49, Atény. [5]

[7] T Winograd (1972). Porozumění přirozenému jazyku. Akademický tisk, New York. Oddíl 8.3.3, Pojmenování objektů a událostí

[Appelt-8] A ^b ^C D Appelt (1985). Plánování anglických odkazujících výrazů. Umělá inteligence, 26:1–33.

[Appelt&Kronfeld-9] A ^b D Appelt, A Kronfeld (1987). Výpočtový model doporučení. Ve sborníku z 10. mezinárodní společné konference o umělé inteligenci (IJCAI), strany 640–647, Milan.

[10] Kronfeld (1990). Reference a výpočet: Esej z aplikované filozofie jazyka. Cambridge University Press, Cambridge.

[Dale1989-11] A ^b R. Dale (1989). Vaření odkazujících výrazů. Ve sborníku z 27. výročního zasedání Asociace pro počítačovou lingvistiku (ACL), strany 68–75.

[Dale1992-12] A ^b R Dale (1992). Generování odkazujících výrazů: Vytváření popisů v doméně objektů a procesů. TheMIT Press, Cambridge, MA.

[13] E. Reiter (1990). Výpočtová složitost vyhýbání se konverzačním implikacím. Ve sborníku z 28. výročního zasedání Asociace pro počítačovou lingvistiku (ACL), strany 97–104, Pittsburgh, PA.

[14] E. Reiter, R. Dale (1992). Rychlý algoritmus pro generování odkazujících výrazů. Ve sborníku ze 14. mezinárodní konference o počítačové lingvistice (COLING), strany 232–238, Nantes.

[16] H Horáček (2004). Přirozeně odkazovat na sady objektů. Sborník z 3. mezinárodní konference o generování přirozeného jazyka (INLG), strany 70–79, Brockenhurst.

[17] Gatt, K van Deemter (2007). Lexikální volba a konceptuální perspektiva při generování množného počtu odkazujících výrazů. Journal of Logic, Language and Information, 16:423–443.

[18] I H Khan, K van Deemter, G Ritchie (2008). Generování odkazujících výrazů: Správa strukturních nejednoznačností. Sborník z 22. mezinárodní konference o počítačové lingvistice (COLING), strany 433–440, Manchester.

[19] M Stone (2000). O identifikačních sadách. Sborník z 1. mezinárodní konference o generování přirozeného jazyka (INLG), strany 116–123, Mitzpe Ramon.

[Dale&Haddock-20] A ^b R Dale, N Haddock (1991). Generování odkazujících výrazů zahrnujících vztahy. Sborník příspěvků z 5. konference evropské kapitoly Asociace výpočetních lingvistů (EACL), strany 161–166, Berlín.

[21] E Krahmer, M Theune (2002). Efektivní vytváření kontextově citlivých popisů v kontextu. In K van Deemter, R Kibble, redaktoři, Sdílení informací: oddanost a novost ve zpracování jazyků. Publikace CSLI, Stanford, CA, strany 223–264.

[Viethen&Dale-22] A ^b J Viethen, R Dale (2008). Využití prostorových vztahů v odkazujících výrazech. Sborník z 5. mezinárodní konference o generování přirozeného jazyka (INLG), strany 59–67, Salt Fork, OH.

[23] Y Ren, K van Deemter, J Pan (2010). Mapování potenciálu Description Logic pro generování odkazujících výrazů. Sborník ze 6. mezinárodní konference o generování přirozeného jazyka (INLG), strany 115–124, Dublin.

[Krahmer,Goudbeek,Theune-24] A ^b E Krahmer, M Goudbeek, M Theune (2014). Generování odkazujících výrazů v interakci: Perspektiva založená na grafech. Stent, S Bangalore (eds.), Generování přirozeného jazyka v interaktivních systémech. Cambridge University Press.

[25] K van Deemter (2006). Generování odkazujících výrazů, které zahrnují gradovatelné vlastnosti. Výpočetní lingvistika, 32(2):195–222.

[26] H Horáček (2005). Generování referenčních popisů za podmínek nejistoty. Sborník příspěvků z 10. evropského workshopu o generování přirozeného jazyka (ENLG), strany 58–67, Aberdeen.

[27] R Passonneau (1996). Vycentrování k uvolnění gricijských informačních omezení diskurzu anaforických jmenných frází. Jazyk a řeč, 39:229–264.

[28] P W Jordan (2000). Záměrné vlivy na přepisování objektů v dialogu: Důkazy z empirické studie. Ph.D. diplomová práce, University of Pittsburgh.

[29] E Hajičová (1993). Problémy struktury věty a diskurzních vzorců - teoretická a výpočetní lingvistika, sv. 2. Univerzita Karlova, Praha.

[30] B J Grosz, A K Joshi, S Weinstein (1995). Centrování: Rámec pro modelování místní koherence diskurzu. Výpočetní lingvistika, 21:203–225.

[31] D DeVault, C Rich, C L Sidner (2004). Generování přirozeného jazyka a kontext diskurzu: Výpočet sad distraktorů ze zásobníku zaostření. Sborník ze 17. mezinárodního setkání Floridské společnosti pro výzkum umělé inteligence (FLAIRS), Miami Beach, FL.

[32] Siddharthan, Copestake (2004). Generování odkazujících výrazů v otevřených doménách. Sborník 42. výročního zasedání Asociace pro počítačovou lingvistiku (ACL), strany 407–414, Barcelona.

[33] I Paraboni, K van Deemter, J Masthoff (2007). Generování odkazujících výrazů: Usnadnění identifikace referentů. Výpočetní lingvistika, 33:229–254.

[Krahmer&van_Deemter-34] A ^b E Krahmer, K van Deemter (2012). Výpočetní generování odkazujících výrazů: průzkum. Výpočetní lingvistika 38:173-218 [6]

[35] E Krahmer, M Theune, J Viethen, I Hendrickx (2008). Graf: Náklady na nadbytečnost v odkazujících výrazech. Sborník mezinárodní konference o generování přirozeného jazyka (INLG), strany 227–229, Salt Fork, OH.

[36] K van Deemter, E Krahmer (2007). Graphs and Booleans: On the generation of referring expressions. In H Bunt, R Muskens, redaktoři, Výpočetní význam, svazek 3. Studium lingvistiky a filozofie. Vydavatelé Springer, Berlín, strany 397–422.

[37] C Gardent (2002). Generování minimálních jednoznačných popisů. Sborník ze 40. výročního zasedání Asociace pro počítačovou lingvistiku (ACL), strany 96–103, Philadelphia, PA.

[38] M Croitoru, K van Deemter (2007). Konceptuální grafický přístup ke generování odkazujících výrazů. Sborník příspěvků z 20. mezinárodní společné konference o umělé inteligenci (IJCAI), strany 2456–2461, Hyderabad.

[39] C Gardent, K Striegnitz (2007). Generování překlenovacích jednoznačných popisů. In H Bunt, Reinhard Muskens, redaktoři, Výpočetní význam, svazek 3. Studium lingvistiky a filozofie. Vydavatelé Springer, strany 369–396, Berlín, DB.

[40] C Areces, A Koller, K Striegnitz (2008). Odkazování na výrazy jako na vzorce popisné logiky. Sborník z 5. mezinárodní konference o generování přirozeného jazyka (INLG), strany 42–49, Salt Fork, OH.

[41] M. R. Garey, S. S. Johnson (1979). Počítače a neodolatelnost: Průvodce po teorii NP – úplnosti. W. H. Freeman, New York.

[42] D R Olson (1970). Jazyk a myšlení: Aspekty kognitivní teorie sémantiky. Psychologický přehled, 77:257–273.

[43] S Sonnenschein (1984). Účinek redundantní komunikace na posluchače: Proč mohou mít různé typy různé účinky. Journal of Psycholinguistic Research, 13:147–166.

[44] T Pechmann (1989). Inkrementální produkce řeči a referenční nadspecifikace. Lingvistika, 27:98–110.

[45] P E Engelhardt, K G.D Bailey, F Ferreira (2006). Dodržují řečníci a posluchači Gricean Maxim of Quantity ?. Deník paměti a jazyka, 54:554–573.

[46] K van Deemter, I van der Sluis, A Gatt (2006). Vytváření sémanticky transparentního korpusu pro generování odkazujících výrazů. Ve sborníku ze 4. mezinárodní konference o generování přirozeného jazyka (INLG), strany 130–132, Sydney.

[47] W W Chafe (1980). Hruškové příběhy: kognitivní, kulturní a jazykové aspekty narativní produkce. Ablex, Norwood, NJ.

[48] A A Anderson, M Bader, E Gurman Bard, E Boyle, G Doherty, S Garrod, S Isard, J Kowtko, J McAllister, J Miller, C Sotillo, H Thompson, R Weinert (1991). Korpus úlohy mapy HCRC. Jazyk a řeč, 34:351–366.

[49] B Di Eugenio, P W Jordan, R H Thomason, J D Moore (2000). Proces dohody: empirické zkoumání dialogů spolupráce mezi člověkem a počítačem. International Journal of Human-Computer Studies, 53:1017–1076.

[50] P Gorniak, D Roy (2004). Uzemněná sémantická kompozice pro vizuální scény. Journal of Artificial Intelligence Research, 21:429–470.

[51] J Viethen, R Dale (2006). Algoritmy pro generování odkazujících výrazů: Dělají to, co dělají lidé ?. Sborník ze 4. mezinárodní konference o generování přirozeného jazyka (INLG), strany 63–70, Sydney.

[Gatt_Sluis_Deemter-52] A ^b Gatt, I van der Sluis, K van Deemter (2007). Vyhodnocování algoritmů pro generování odkazujících výrazů pomocí vyváženého korpusu. Sborník z 11. evropského workshopu o generování přirozeného jazyka (ENLG), strany 49–56, Schloss Dagstuhl.

[53] L R kostky (1945). Míra míry ekologické asociace mezi druhy. Ekologie, 26:297–302.

[54] R Passonneau (2006). Měření dohody o položkách se stanovenou hodnotou (MASI) pro sémantickou a pragmatickou anotaci. Sborník z 5. mezinárodní konference o jazykových zdrojích a hodnocení (LREC), strany 831–836, Janov.

[55] Gatt, A Belz, E Kow (2008). Výzva TUNA 2008: Přehled a výsledky hodnocení. Sborník z 5. mezinárodní konference o generování přirozeného jazyka (INLG), strany 198–206, Salt Fork, OH.

[56] K Papineni, S Roukos, T Ward, W Zhu (2002). BLEU: Metoda automatického vyhodnocení strojového překladu. Sborník ze 40. výročního zasedání Asociace pro počítačovou lingvistiku (ACL), strany 311–318, Philadelphia, PA.

[57] G Doddington (2002). Automatické vyhodnocení kvality strojového překladu pomocí statistik společného výskytu n-gramů. Sborník z 2. mezinárodní konference o výzkumu technologií lidských jazyků (HLT), strany 138–145, San Diego, CA.

[58] Belz, Gatt (2008). Vnitřní a vnější hodnocení pro měření generování odkazujících výrazů. Sborník ze 46. výročního zasedání Asociace pro počítačovou lingvistiku (ACL), Columbus, OH.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[poznámka 1]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]