Statistická sémantika - Statistical semantics
Sémantika | ||||||||
---|---|---|---|---|---|---|---|---|
Výpočetní | ||||||||
| ||||||||
Bylo navrženo, aby tento článek byl sloučeny do Distribuční sémantika. (Diskutujte) Navrhováno od srpna 2020. |
v lingvistika, statistická sémantika aplikuje metody statistika k problému určování významu slov nebo frází, nejlépe prostřednictvím neřízené učení, s mírou přesnosti alespoň dostatečnou pro účely vyhledávání informací.
Dějiny
Termín statistická sémantika byl poprvé použit Warren Weaver ve své známé práci na strojový překlad.[1] Tvrdil to slovní smysl disambiguation pro strojový překlad by měl vycházet z společný výskyt frekvence kontextových slov poblíž daného cílového slova. Základní předpoklad, že „slovo je charakterizováno společností, kterou udržuje“, prosazoval J.R. Firth.[2] Tento předpoklad je známý v lingvistika jako distribuční hypotéza.[3] Emile Delavenay definován statistická sémantika jako „statistická studie významů slov a jejich četnosti a pořadí opakování“.[4] "Furnas et al. 1983 “je často uváděn jako základní příspěvek ke statistické sémantice.[5] Časný úspěch v této oblasti byl latentní sémantická analýza.
Aplikace
Výzkum statistické sémantiky vyústil v širokou škálu algoritmů, které používají distribuční hypotézu k objevení mnoha aspektů sémantika použitím statistických technik na velké korpusy:
- Měření podobnost ve významech slov[6][7][8][9]
- Měření podobnosti ve slovních vztazích [10]
- Modelování zobecnění založené na podobnosti[11]
- Objevování slov s daným vztahem[12]
- Klasifikace vztahů mezi slovy[13]
- Extrahování klíčových slov z dokumentů[14][15]
- Měření soudržnosti textu[16]
- Objevování různých smyslů slov[17]
- Rozlišování různých smyslů slov[18]
- Subkognitivní aspekty slov[19]
- Rozlišování chvály od kritiky[20]
Související pole
Statistická sémantika se na rozdíl od nich zaměřuje na významy běžných slov a na vztahy mezi běžnými slovy dolování textu, která má tendenci se soustředit na celé dokumenty, sbírky dokumentů nebo pojmenované entity (jména osob, míst a organizací). Statistická sémantika je dílčím polem výpočetní sémantika, což je zase podpole o výpočetní lingvistika a zpracování přirozeného jazyka.
Mnoho aplikací statistické sémantiky (uvedených výše) lze také řešit pomocí Lexikon algoritmy založené na korpus algoritmy statistické sémantiky. Jednou z výhod algoritmů založených na korpusu je, že obvykle nejsou tak náročné na pracovní sílu jako algoritmy založené na lexikonu. Další výhodou je, že se obvykle snáze přizpůsobují novým jazykům než algoritmy založené na lexikonu. Nejlepšího výkonu aplikace se však často dosahuje kombinací těchto dvou přístupů.[21]
Viz také
Reference
- ^ Weaver 1955
- ^ Firth 1957
- ^ Sahlgren 2008
- ^ Delavenay 1960
- ^ Furnas a kol. 1983
- ^ Lund, Burgess & Atchley 1995
- ^ Landauer & Dumais 1997
- ^ McDonald & Ramscar 2001
- ^ Terra & Clarke 2003
- ^ Turney 2006
- ^ Yarlett 2008
- ^ Hearst 1992
- ^ Turney & Littman 2005
- ^ Frank a kol. 1999
- ^ Turney 2000
- ^ Turney 2003
- ^ Pantel & Lin 2002
- ^ Turney 2004
- ^ Turney 2001
- ^ Turney & Littman 2003
- ^ Turney a kol. 2003
Zdroje
- Delavenay, Emile (1960). Úvod do strojového překladu. New York, NY: Temže a Hudson. OCLC 1001646.
- Firth, John R. (1957). "Synopse lingvistické teorie 1930-1955". Studium lingvistické analýzy. Oxford: Filologická společnost: 1–32.
- Frank, Eibe; Paynter, Gordon W .; Witten, Ian H .; Gutwin, Carl; Nevill-Manning, Craig G. (1999). Msgstr "Extrakce klíčových slov specifických pro doménu". Sborník ze šestnácté mezinárodní společné konference o umělé inteligenci. IJCAI-99. 2. Kalifornie: Morgan Kaufmann. 668–673. CiteSeerX 10.1.1.148.3598. ISBN 1-55860-613-0.
- Furnas, George W.; Landauer, T. K.; Gomez, L. M .; Dumais, S. T. (1983). „Statistická sémantika: Analýza potenciálního výkonu informačních systémů klíčových slov“ (PDF). Technický deník Bell System. 62 (6): 1753–1806. doi:10.1002 / j.1538-7305.1983.tb03513.x. S2CID 22483184. Archivovány od originál (PDF) dne 04.03.2016. Citováno 2012-07-12.
- Hearst, Marti A. (1992). „Automatické získávání hyponymů z velkých textových korpusů“ (PDF). Sborník příspěvků ze čtrnácté mezinárodní konference o počítačové lingvistice. COLING '92. Nantes, Francie. 539–545. CiteSeerX 10.1.1.36.701. doi:10.3115/992133.992154. Archivovány od originál (PDF) dne 2012-05-22. Citováno 2012-07-12.
- Landauer, Thomas K .; Dumais, Susan T. (1997). „Řešení Platónova problému: teorie latentní sémantické analýzy získávání, indukce a reprezentace znalostí“. Psychologický přehled. 104 (2): 211–240. CiteSeerX 10.1.1.184.4759. doi:10.1037 / 0033-295x.104.2.211.
- Lund, Kevin; Burgess, Curt; Atchley, Ruth Ann (1995). „Sémantická a asociativní aktivace ve vysokodimenzionálním sémantickém prostoru“ (PDF). Sborník 17. výroční konference Společnosti kognitivních věd. Společnost kognitivních věd. str. 660–665.[trvalý mrtvý odkaz ]
- McDonald, Scott; Ramscar, Michael (2001). „Testování distribuční hypotézy: Vliv kontextu na úsudky sémantické podobnosti“ (PDF). Sborník 23. výroční konference Společnosti kognitivních věd. str. 611–616. CiteSeerX 10.1.1.104.7535.[trvalý mrtvý odkaz ]
- Pantel, Patrick; Lin, Dekang (2002). Msgstr "Objevování slovních smyslů z textu". Sborník konference ACM SIGKDD o získávání znalostí a dolování dat. KDD '02. str. 613–619. CiteSeerX 10.1.1.12.6771. doi:10.1145/775047.775138. ISBN 1-58113-567-X.
- Sahlgren, Magnus (2008). „Distribuční hypotéza“ (PDF). Rivista di Linguistica. 20 (1): 33–53.
- Terra, Egidio L .; Clarke, Charles L. A. (2003). „Odhady frekvence pro statistická měření podobnosti slov“ (PDF). Sborník z konference Human Language Technology and North American Chapter of Association of Computational Linguistics Conference 2003. HLT / NAACL 2003. s. 244–251. CiteSeerX 10.1.1.12.9041. doi:10.3115/1073445.1073477. Archivovány od originál (PDF) dne 03.11.2013. Citováno 2012-07-12.
- Turney, Peter D. (květen 2000). Msgstr "Učící se algoritmy pro extrakci klíčových slov". Načítání informací. 2 (4): 303–336. arXiv:cs / 0212020. CiteSeerX 10.1.1.11.1829. doi:10.1023 / A: 1009976227802. S2CID 7007323.
- Turney, Peter D. (2001). "Odpovědi na subkognitivní Turingovy testové otázky: odpověď na francouzštinu". Journal of Experimental and Theoretical Artificial Intelligence. 13 (4): 409–419. arXiv:cs / 0212015. CiteSeerX 10.1.1.12.8734. doi:10.1080/09528130110100270. S2CID 59099.
- Turney, Peter D. (2003). Msgstr "Koherentní extrakce klíčových slov pomocí dolování z webu". Sborník příspěvků z osmnácté mezinárodní společné konference o umělé inteligenci. IJCAI-03. Acapulco, Mexiko. 434–439. arXiv:cs / 0308033. Bibcode:2003cs ........ 8033T. CiteSeerX 10.1.1.100.3751.
- Turney, Peter D. (2004). „Rozeznání slova podle těžby webu pro pravděpodobnosti společného výskytu slov“. Sborník ze třetího mezinárodního semináře o hodnocení systémů pro sémantickou analýzu textu. SENSEVAL-3. Barcelona, Španělsko. 239–242. arXiv:cs / 0407065. Bibcode:2004cs ........ 7065T.
- Turney, Peter D. (2006). "Podobnost sémantických vztahů". Výpočetní lingvistika. 32 (3): 379–416. arXiv:cs / 0608100. Bibcode:2006cs ........ 8100T. CiteSeerX 10.1.1.75.8007. doi:10.1162 / coli.2006.32.3.379. S2CID 2468783.
- Turney, Peter D .; Littman, Michael L. (říjen 2003). „Měření chvály a kritiky: Odvození sémantické orientace od asociace“. Transakce ACM v informačních systémech. 21 (4): 315–346. arXiv:cs / 0309034. Bibcode:2003cs ........ 9034T. CiteSeerX 10.1.1.9.6425. doi:10.1145/944012.944013. S2CID 2024.
- Turney, Peter D .; Littman, Michael L. (2005). „Korpusové učení analogií a sémantických vztahů“. Strojové učení. 60 (1–3): 251–278. arXiv:cs / 0508103. Bibcode:2005cs ........ 8103T. CiteSeerX 10.1.1.90.9819. doi:10.1007 / s10994-005-0913-1. S2CID 9322367.
- Turney, Peter D .; Littman, Michael L .; Bigham, Jeffrey; Shnayder, Victor (2003). „Kombinace nezávislých modulů k řešení problémů se synonymy a analogiemi s výběrem“. Sborník mezinárodní konference o posledních pokrokech ve zpracování přirozeného jazyka. RANLP-03. Borovec, Bulharsko. str. 482–489. arXiv:cs / 0309035. Bibcode:2003cs ........ 9035T. CiteSeerX 10.1.1.5.2939.
- Weaver, Warrene (1955). "Překlad" (PDF). V Locke, W.N .; Booth, D.A. (eds.). Strojový překlad jazyků. Cambridge, Massachusetts: MIT Stiskněte. str. 15–23. ISBN 0-8371-8434-7.
- Yarlett, Daniel G. (2008). Výuka jazyků prostřednictvím zobecnění založeného na podobnosti (PDF) (Disertační práce). Stanfordská Univerzita. Archivovány od originál (PDF) dne 2014-04-19.