FrameNet - FrameNet
tento článek potřebuje další citace pro ověření.Březen 2012) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
FrameNet | |
---|---|
Poslání | Budování lexikální databáze založené na tzv. Teorii významu Sémantika rámců. |
Komerční? | Ne (volně ke stažení) |
Typ projektu | Lexikální databáze (obsahující: rámce, prvky rámců (FE), lexikální jednotky (LU), příklady vět a vztahy rámců) |
Umístění | International Computer Science Institute v Berkeley, Kalifornie |
Majitel | Collin Baker (současný projektový manažer) |
Zakladatel | Charles J. Fillmore |
Založeno | 1997 |
webová stránka | framenet |
v výpočetní lingvistika, FrameNet je projekt sídlící v International Computer Science Institute v Berkeley, Kalifornie který produkuje elektronický zdroj založený na teorii významu zvanésémantika rámce. FrameNet například odhaluje, že věta „John prodal auto Mary“ v zásadě popisuje stejnou základní situaci (sémantický rámec) jako „Mary koupila auto od Johna“, jen z jiné perspektivy. Sémantický rámec lze považovat za koncepční strukturu popisující událost, vztah nebo objekt a jeho účastníky. The FrameNet lexikální databáze obsahuje přes 1 200 sémantiku rámy, 13,000 lexikální jednotky (párování a slovo s význam; polysemózní slova jsou reprezentována několika lexikální jednotky) a 202 000 příkladů vět. FrameNet je z velké části tvorba Charles J. Fillmore, který vyvinul teorii sémantiky rámců, na které je projekt založen, a původně byl vedoucím projektu, když projekt začal v roce 1997.[1] Collin Baker se stal projektovým manažerem v roce 2000.[2] Projekt FrameNet měl vliv na lingvistiku i zpracování přirozeného jazyka, kde vedl k automatickému úkolu Sémantické označování rolí.
Koncepty
Rámečky
Rámec je schematické znázornění situace zahrnující různé účastníky, rekvizity a další koncepční role. Příklady názvů rámců jsou Narodit se
a Locative_relation
. Rámec v FrameNet obsahuje textový popis toho, co představuje (definice rámce), přidružené prvky rámce, lexikální jednotky, ukázkové věty a vztahy mezi rámy.
Prvky rámu
Prvky rámce (FE) poskytují další informace k sémantické struktuře věty. Každý snímek má řadu základních a vedlejších FE, které lze považovat za sémantické role. Základní FE jsou zásadní pro význam rámce, zatímco vedlejší FE jsou obecně popisné (jako je čas, místo, způsob atd.).[3]
Některé příklady zahrnují:
- Jediným jádrem FE
Narodit se
rám se nazýváDítě
; ne-základní FE jsouČas
,Místo
,Příbuzní
, atd.[4] - Základní FE z
Commerce_goods-transfer
patříProdávající
,Kupující
,Zboží
, mimo jiné, zatímco vedlejší FE zahrnují aMísto
,Účel
, atd.[5]
FrameNet obsahuje mělká data o syntaktických rolích, které prvky rámce hrají ve vzorových větách. Například pro větu jako „Narodila se kolem roku 460 nl“ by společnost FrameNet označila „Ona“ jako jmenná fráze s odkazem na Dítě
FE a „asi 460 AD“ jako a jmenná fráze odpovídající Čas
prvek rámu. Podrobnosti o tom, jak lze prvky věty realizovat ve větě, jsou důležité, protože odhalují důležité informace o podkategorizační rámce co nejlépe alterace diatézy (např. „John rozbil okno“ vs. „Rozbilo okno“) slovesa.
Lexikální jednotky
Lexikální jednotky (LU) jsou lemma, jejichž část řeči evokuje konkrétní rámec. Jinými slovy, když je ve větě identifikována LU, může být tato konkrétní LU přidružena k jejímu specifickému rámci (rámcům). Pro každý rámec může být k tomuto rámci přidruženo mnoho LU a také může existovat mnoho rámců, které sdílejí konkrétní LU, což je obvykle případ LU, které mají více slovních smyslů.[6] Vedle rámečku je každá lexikální jednotka přidružena ke konkrétním prvkům rámečku pomocí anotovaných příkladů vět.
Příklad:
Lexikální jednotky, které evokují Stěžovat si
rám (nebo přesněji jeho konkrétnější verze), zahrnují slovesa „stěžovat si“, „tetřev“, „bědovat“ a další.[7]
Ukázkové věty
Rámečky jsou spojeny s ukázkovými větami a prvky rámců jsou označeny ve větách. Tedy věta
- Byla narozený asi 460 nl
je spojen s rámem Narodit se
, zatímco „Ona“ je označena jako prvek rámu Dítě
a „asi AD 460“ je označeno jako Čas
(Viz Report anotace FrameNet pro narozen. v
.) Projekt FrameNet se od začátku zavázal k prohlížení důkazů o skutečném používání jazyků, které lze najít v textových sbírkách, jako je Britský národní korpus. Na základě takových příkladů vět je automatické sémantické označení rolí nástroje jsou schopné určit rámce a označit prvky rámu v nových větách.
Valence
FrameNet také zveřejňuje statistiky o valence z rámy, to je počet a umístění prvky rámu v příkladových větách. Věta
- Byla narozený o inzerátu 460
spadá do valenčního vzoru
- NP Ext, INI -, NP Dep
který se vyskytuje dvakrát v příklad věty v FrameNet, konkrétně v:
- Ona byl narozenýasi 460 nl, dcera a vnučka římských a byzantských císařů, jejichž rodina byla v římské politice prominentní již více než 700 let.
- Brzy byl vyslán do severní Afriky a nikdy nepotkal jejich jediné dítě, dcera narozený8. června 1941.
Rámové vztahy
FrameNet navíc zachycuje vztahy mezi různými snímky pomocí vztahů. Patří mezi ně následující:
- Dědičnost: Když je jeden snímek konkrétnější verzí jiného, abstraktnějšího nadřazeného rámce. Cokoli, co platí o nadřazeném rámci, musí platit také o podřízeném rámci a je zadáno mapování mezi prvky rámce nadřazeného prvku a prvky rámce podřízeného.
- Perspectivized_in: Neutrální rámeček (jako
Commerce_transfer-goods
) je připojen k rámu se specifickou perspektivou stejného scénáře (napřCommerce_sell
rám, který předpokládá perspektivu prodejce neboCommerce_buy
rám, který předpokládá perspektivu kupujícího) - Subframe: Některé snímky jako
Criminal_process
frame odkazují na složité scénáře, které se skládají z několika jednotlivých stavů nebo událostí, které lze popsat samostatnými rámci jakoZatknout
,Soud
, a tak dále. - Preced: Relace Precedes zachycuje časové pořadí, které se drží mezi dílčími snímky komplexního scénáře.
- Causative_of and Inchoative_of: Existuje poměrně systematický vztah mezi stativními popisy (jako
Position_on_a_scale
rám, např. „Měla vysoký plat“) a kauzální popisy (jakoCause_change_of_scalar_position
rám, např. „Zvýšila jeho plat“) nebo úvodní popisy (jakoChange_position_on_a_scale
rám, např. "Její plat se zvýšil"). - Použití: Vztah, který drží mezi rámem, který nějakým způsobem zahrnuje další rámec. Například
Rozsudek_komunikace
rám používá obaRozsudek
rám aProhlášení
rám, ale nedědí ani jeden z nich, protože neexistuje jasná korespondence prvků rámce. - See_also: Spojuje rámce, které mají určitou podobnost, ale je třeba je pečlivě odlišit.
Aplikace
FrameNet se osvědčil v řadě výpočetních aplikací, protože počítače potřebují další znalosti, aby si uvědomily, že „John prodal auto Mary“ a „Mary koupila auto od Johna“ popisují v podstatě stejnou situaci, přestože používají dvě zcela různá slovesa, jiné předložky a jiný slovosled. FrameNet se používá v aplikacích jako odpověď na otázku, parafrázovat poznávání textové zapojení, a extrakce informací, buď přímo, nebo prostřednictvím Sémantické označování rolí nástroje. První automatický systém pro Sémantické označování rolí (SRL, někdy také označovaná jako „mělká sémantická analýza“) vyvinuli Daniel Gildea a Daniel Jurafsky založené na FrameNet v roce 2002.[8] Sémantické označování rolí se od té doby stalo jedním ze standardních úkolů při zpracování přirozeného jazyka, přičemž nejnovější verze (1.7) FrameNet je nyní plně podporována v Sada nástrojů pro přirozený jazyk.[9]
Vzhledem k tomu, že rámce jsou v podstatě sémantické popisy, jsou si podobné v různých jazycích a v průběhu let vzniklo několik projektů, které se spoléhaly na původní FrameNet jako základ pro další neanglické FrameNets, mimo jiné pro španělštinu, japonštinu, němčinu a polštinu .
Viz také
- BabelNet: vícejazyčná sémantická síť integrující FrameNet
- PropBank
- Nulová instance
- Rámcový jazyk
- UBY: databáze 10 zdrojů včetně FrameNet
Reference
- ^ Cliff Goddard (25. září 2011). Sémantická analýza: Praktický úvod. Oxford University Press. str. 78–81. ISBN 978-0-19-956028-8. Citováno 21. března 2012.
- ^ Heine, Bernd; Narrog, Heiko, eds. (17. prosince 2009). Oxfordská příručka lingvistické analýzy. Oxford University Press. str. 20. ISBN 978-0-19-160925-1. Citováno 21. března 2012.
- ^ https://framenet.icsi.berkeley.edu/fndrupal/glossary#core
- ^ https://framenet.icsi.berkeley.edu/fndrupal/index.php?q=frame_report&name=Being_born
- ^ https://framenet.icsi.berkeley.edu/fndrupal/index.php?q=frame_report&name=Commerce_goods-transfer
- ^ https://framenet.icsi.berkeley.edu/fndrupal/glossary
- ^ https://framenet2.icsi.berkeley.edu/fnReports/data/frameIndex.xml?frame=Complaining
- ^ Gildea, Daniel; Jurafsky, Daniel (2002). „Automatické označování sémantických rolí“ (PDF). Výpočetní lingvistika. 28 (3): 245–288. doi:10.1162/089120102760275983. S2CID 207747200.
- ^ Schneider, Nathan; Wooters, Chuck (2017). "NLTK FrameNet API: Návrh pro objevitelnost s bohatým jazykovým zdrojem". EMNLP 2017: Konference o empirických metodách ve zpracování přirozeného jazyka. arXiv:1703.07438. Bibcode:2017arXiv170307438S.
Další čtení
- Ruppenhofer, Josef; Ellsworth, Michael; Petruck, Miriam R. L.; Johnson, Christopher R .; Baker, Collin F .; Scheffczyk, Jan (1. listopadu 2016). FrameNet II: Rozšířená teorie a praxe (přepracované vydání). Berkeley, CA: International Computer Science Institute.