Vysvětlující kombinatorický slovník - Explanatory combinatorial dictionary
![]() | tento článek příliš spoléhá na Reference na primární zdroje.Březen 2012) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
![]() | tento článek může být pro většinu čtenářů příliš technická na to, aby tomu rozuměli. Prosím pomozte to vylepšit na aby to bylo srozumitelné pro neodborníky, aniž by byly odstraněny technické podrobnosti. (Březen 2012) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) |
An vysvětlující kombinatorický slovník (ECD) je druh jednojazyčné slovník navržen tak, aby byl součástí a významový text jazykový model přirozeného jazyka.[1][2][3] Má to být úplný záznam lexikonu daného jazyka.[4] Jako takový identifikuje a popisuje v samostatných položkách každý jazyk lexémy (zhruba řečeno, každé slovo nebo množina skloněných tvarů založených na jednom kmeni) a frazémy (zhruba řečeno, idiomy a další víceslovné pevné výrazy). Každá položka mimo jiné obsahuje (1) definici, která zahrnuje sémantické aktéry lexémy (například definiendum dát má formu X dává Y až Z., kde jsou vyjádřeny jeho tři aktéři - dárce X, daná věc Ya osoba daná Z) (2) úplné informace o lexikálním společném výskytu (např. Položka pro Záchvat vám řekne, že jedna z jejích kolokací je zahájit útok, položka pro strana poskytuje pořádat zábavua položka pro přednáška poskytuje přednášet - umožnění uživateli vyhnout se chybě jako *uspořádat večírek); (3) rozsáhlý soubor příkladů. ECD je produkční slovník - to znamená, že si klade za cíl poskytnout všechny informace potřebné k tomu, aby zahraniční student nebo automat vytvořil perfektně formované výroky jazyka. Vzhledem k tomu, že lexémy a frazémy přirozeného jazyka jsou statisíce, úplná ECD v papírové podobě by zabírala prostor velké encyklopedie. Takové práce je ještě třeba dosáhnout; zatímco byly publikovány ECD v ruštině a francouzštině, každý popisuje méně než jedno procento slovníku příslušných jazyků.
ECD navrhl koncem 60. let Aleksandr Žolkovskij a Igor Mel'čuk[5][6][7] a později jej dále rozvinul Jurij Apresjan.[8][9][10][11][12][13][14][15][16] V současné době jsou v tisku k dispozici tři ECD, jedno pro ruštinu,[17] a dva pro francouzštinu.[18][19] Slovník španělštiny kolokace —DICE (= Diccionario de colocaciones del español) - je ve vývoji.[20][21]
Vlastnosti ECD
Kompletní ECD jazyka by poskytlo vstup pro každou lexému, konstrukce, nebo idiom - souhrnně označovaný jako „Lexikální jednotky“ (LU) - používaný v jazyce. Položky v ECD jsou založeny na sémantické definici LU a každá položka obsahuje její úplný seznam kolokace a lexikální funkce také.[22]
Záznamy pro historicky související lexikální jednotky, které jsou homofony a sdílejí významnou sémantickou složku (tj. Významy), jsou seskupeny do větších jednotek zvaných „vocables“, čímž se potvrzuje polysemy při zachování odlišného stavu dotyčných nezávislých položek. Anglická vocable zlepšitnapříklad zahrnuje šest lexikálních jednotek, z nichž každá má samostatnou lexikální položku:
ZLEPŠIT, sloveso
- ZLEPŠITI.1a X zlepšuje ≡ „Hodnota nebo kvalita X se zvyšuje“
- [Počasí se náhle zlepšilo; Systém se bude časem zlepšovat]
- ZLEPŠITI.1b X zlepšuje Y causes „X způsobuje1 že Y se zlepšujeI.1a’
- [Nejnovější změny drasticky vylepšily systém]
- ZLEPŠITI.2 X zlepšuje ≡ „Zdraví nemocného člověka X se zlepšujeI.1a’
- [Jim se neustále zlepšuje]
- ZLEPŠITI.3 X se zlepšuje v Y - X se zlepšuje provádění YI.1a, který je způsoben1 tím, že X cvičilo nebo cvičilo Y “
- [Jim se v algebře neustále zlepšuje]
- ZLEPŠITII X vylepšuje Y Z-ing - „X dobrovolně způsobuje2 že tržní hodnota nemovitosti Y se zvýší provedením Z-ing do Y ‘
- [Jim vylepšil svůj dům instalací vnitřní instalace]
- ZLEPŠITIII X vylepšuje Y ≡ „X vytváří nové Y“ vylepšovánímI.1b Y ‘
- [Jim drasticky vylepšil Patrickův překlad]
Lexikografická čísla (uvedená tučně za vstupním slovem) odrážejí stupně nebo úrovně sémantické vzdálenosti mezi lexikálními jednotkami ve vocable: římské číslice označují sémantická seskupení nejvyšší úrovně, zatímco arabské číslice označují další nejvyšší úroveň a písmena označují nejnižší výškové vzdálenosti. Čtyři lexémy seskupené pod ZLEPŠITJájsou například považovány za blíže k sobě navzájem než k VYLEPŠENÍII nebo ZLEPŠITIII, protože významy každého z VYLEPŠENÍI.1b a ZLEPŠITI.2 ve skutečnosti zahrnují význam VYLEPŠENÍI.1a. ZLEPŠITI.1a a ZLEPŠITI.1b jsou ještě těsněji příbuzné, protože v angličtině existuje mnoho párů slov - konkrétně labilní nebo ambitransitive slovesa - která souvisí s příčinou sémantické alternace „P“ ~ „1 na P “(jak je uvedeno výše,„ zlepšit “~„ způsobit zlepšení “).
The dolní a horní index čísla připojená ke slovům v definici se vztahují k subsenzům (dolní indexy) a homofonním záznamům (horní indexy) slova, jak je uvedeno v Longman Dictionary of Contemporary English[23] „Potom“ zařízení11”Odkazuje na první záznam pro přístroj v tomto slovníku první subense.
Struktura záznamu ECD
Položka ECD pro danou lexikální jednotku, nazveme ji „L“, je rozdělena do tří hlavních sekcí nebo „zón“:
Sémantická zóna
Sémantická zóna popisuje sémantické vlastnosti L a skládá se ze dvou dílčích zón:
- 1) definice L, která plně specifikuje význam L; a
- 2) Konotace L (významy, které si jazyk spojuje s L, ale které nejsou součástí jeho definice).[24][25]
Fonologická / grafická zóna
Fonologická / grafická zóna poskytuje všechna data o fonologických vlastnostech L. Zde opět najdeme dvě subzóny:
- 1) Výslovnost L's včetně její slabiky a jakýchkoli nestandardních prozodických vlastností;[26] a
- 2) pravopisné informace o pravopisných variantách L atd.
Zóna společného výskytu
Zóna společného výskytu představuje všechna data o kombinatorických vlastnostech L. Je rozdělena do pěti dílčích zón - morfologické, syntaktické, lexikální, stylistické a pragmatické.
- The morfologická subzóna obsahuje inflexní data včetně třídy konjugace / deklinace, nepravidelné tvary, chybějící tvary, povolené alternace atd.[27]
- The syntaktická subzóna má dvě části:
- a) Vládní vzorec, který popisuje prvky, které může L syntakticky ovládat (argumenty, doplňky atd.);
- b) Část řeči a syntaktické rysy, která popisuje konstrukce, ve kterých se L může jevit jako syntaktická závislý.
- The lexikální subzóna specifikuje lexikální funkce které se L účastní, pokrývající oba sémantické derivace a kolokace L s jinými jednotlivými LU nebo velmi malými a nepravidelnými skupinami LU.
- The stylistická podzóna specifikuje Lův řečový registr (neformální, hovorový, vulgární, poetický atd.), časovou (zastaralou, archaickou) a geografickou (britskou, indickou, australskou) variabilitu apod.
- The pragmatická subzóna popisuje skutečné situace, ve kterých je konkrétní výraz vhodný nebo nevhodný.
Reference
- ^ Mel’čuk, Igor A. (2006). Vysvětlující kombinatorický slovník. In Giandomenico Sica (ed.), Open Problems in Linguistics and Lexicography, 225–355. Monza: Polimetrica
- ^ Pearson, Jennifer. Podmínky z roku 1998 v kontextu. Amsterdam: John Benjamins 76–82.
- ^ Fontenelle, Thierry. (2008) Použití dvojjazyčného slovníku k vytvoření sémantických sítí. In Thierry Fontenelle (ed.), Practical Lexicography: A reader, 175. Oxford: Oxford University Press.
- ^ Frawley, William. (1988). Nové formy odborných slovníků. International Journal of Lexicography 1, 189–213.
- ^ Žolkovskij, Aleksandr; Igor A. Mel’čuk (1965). „O vozmožnom metode i instrumentax semantičeskogo sinteza [O možné metodě a nástrojích pro sémantickou syntézu]“. Naučno-texničeskaja informacija. 5: 23–28.
- ^ Žolkovskij, Aleksandr; Igor A. Mel’čuk (1966). „O sisteme semantičeskogo sinteza. I. Stroenie slovarja [O systému pro sémantickou syntézu. I. Struktura slovníku]“. Naučno-texničeskaja informacija. 11: 48–55.
- ^ Žolkovskij, Aleksandr; Igor A. Mel’čuk (1967). "O semantičeskom sinteze [O sémantické syntéze]". Problém kibernetiki. 19: 177–238.
- ^ Apresjan, Jurij (1969). „Tolkovanie leksičeskix značenij kak problema teoretičeskoj semantiki [Definice lexikálních významů jako problém teoretické sémantiky]“. Izvestija Akademii Nauk SSSR, Serija lit. i jazyka. 28: 11–23.
- ^ Apresjan, Jurij (1969). "O jazyke dlja opisanija značenij slov [O jazyce pro popis lexikálních významů]". Izvestija Akademii Nauk SSSR, Serija lit. i jazyka. 28: 415–428.
- ^ Apresjan, Jurij (1974). Leksičeskaja semantika. Sinonimičeskie sredstva jazyka [Lexical Semantics. Synonymické prostředky jazyka]. Moskva: Nauka.
- ^ Apresjan, Jurij (1980). Tipy informacii dlja poverxnostno-semantičeskogo komponenta modeli Smysl ⇔ Tekst [Druhy informací pro povrchově-sémantickou složku modelu významového textu]. Vídeň: Wiener Slawistischer Almanach.
- ^ Apresjan, Juirj (1988). Karaulov, Jurij (ed.). "Morfologičeskaja informacija dlja tolkovogo slovarja [Morfologické informace v jednojazyčném slovníku]". Slovarnye kategorie. Moskva: Nauka: 31–59.
- ^ Apresjan, Jurij (1988). "Tipy kommunikativnoj informacii dlja tolkovogo slovarja [Druhy komunikačních informací pro jednojazyčný slovník]". Jazyk: sistema i funkcionirovanie. Moskva: Nauka: 10–22.
- ^ Apresjan, Jurij (1990). "Tipy leksikografičeskoj informacii ob označajuščem leksemy [Types of Lexicographic Information on a Lexeme's Signifier]". Tipologija i grammatika. Moskva: Nauka: 91–108.
- ^ Apresjan, Jurij (1990). „Formální model jazyka a představování leksikografičeskix znanij [Formální model jazyka a reprezentace lexikografických znalostí]“. IVoprosy jazykoznanija. 6: 91–108.
- ^ Apresjan, Jurij (1995). Izbrannye trudy. Tom II. Integral´noe opisanie jazyka i sistemnaja leksikografija [Vybrané spisy. Svazek II. Integrovaný jazykový popis a systémová lexikografie]. Moskva: Škola «Jazyk ruskoj kul'tury».
- ^ Mel’čuk, Igor A .; Alexander Zholkovsky (1984). Vysvětlující kombinatorický slovník moderní ruštiny. Sémanticko-syntaktické studie ruského slovníku. Vídeň: Wiener Slawistischer Almanach.
- ^ Mel’čuk, Igor A .; Arbatchewsky-Jumarie, N .; Iordanskaja, Lida; Mantha, S .; Polguère, Alain (1999). Slovníkový výklad a současná kombinace francouzštiny. Recherches lexico-sémantiques IV. Montréal: Les Presses de l’Université de Montréal.
- ^ Mel’čuk, Igor A .; Alain Polguère (2007). Lexique actif du français: L'apprentissage du vocabulaire fondé sur 20000 dérivations sémantiques et collocations du français. Paris: Duculot.
- ^ Alonso Ramos, Margarita (2003). Fernández Montraveta, A., A. Martí Antonin & G. Vásquez García (ed.). „Hacia un diccionario de colocacionnes del español y su codificación“. Lexicografía computacional y semántica. Barcelona: Universidad de Barcelona: 11–34.
- ^ Alonso Ramos, Margarita (2004). Bataner, P. & J. DeCesaris García (ed.). „Elaboración del Diccionario de colocaciones del español y sus aplicaciones“. De lexicografia: Actes del I Symposium internacional de lexicografia, Barcelona: IULA: 149–162.
- ^ Frawley, William. (1988). Nové formy odborných slovníků. International Journal of Lexicography 1, 189–213.
- ^ Longman Dictionary of Contemporary English. London: Longman. 1978.
- ^ Iordanskaja, Lida; Igor A. Mel’čuk (1984). "Connotation en sémantique et lexicographie". Slovníkový výklad a současná kombinace franšízy: Recherches lexico-sémantiques I. Montréal: Presses de l'Université de Montréal: 33–40.
- ^ Iordanskaja, Lida; Igor A. Mel’čuk (2006). Berger, T., K. Gutschmidt, S. Kempgen a P. Kosta (ed.). "Konotace". Slovanské jazyky: Mezinárodní příručka o jejich historii, jejich struktuře a vyšetřování. New York: Walter de Gruyter.
- ^ Apresjan, Jurij (1990). "Tipy leksikografičeskoj informacii ob označajuščem leksemy [Types of Lexicographic Information on a Lexeme's Signifier]". Tipologija i grammatika. Moskva: Nauka: 91–108.
- ^ Apresjan, Juirj (1988). Karaulov, Jurij (ed.). "Morfologičeskaja informacija dlja tolkovogo slovarja [Morfologické informace v jednojazyčném slovníku]". Slovarnye kategorie. Moskva: Nauka: 31–59.