Lexikální podobnost - Lexical similarity
v lingvistika, lexikální podobnost je míra míry, do jaké jsou dané sady slov dvou jazyky jsou podobní. Lexikální podobnost 1 (nebo 100%) by znamenala úplné překrývání slovníků, zatímco 0 znamená, že neexistují běžná slova.
Existují různé způsoby, jak definovat lexikální podobnost, a podle toho se liší i výsledky. Například, Etnolog 'Metoda výpočtu spočívá v porovnání regionálně standardizovaného seznamu slov (srovnatelného s Seznam Swadesh ) a počítání těch forem, které vykazují podobnost ve formě i ve smyslu. Pomocí takové metody Angličtina byla hodnocena jako lexikální podobnost 60% s Němec a 27% s francouzština.
Lexikální podobnost lze použít k vyhodnocení stupně genetický vztah mezi dvěma jazyky. Procenta vyšší než 85% obvykle naznačují, že oba porovnávané jazyky pravděpodobně budou souviset dialekty.[1]
Lexikální podobnost je pouze jednou indikací vzájemná srozumitelnost obou jazyků, protože druhý také závisí na míře fonetické, morfologické a syntaktické podobnosti. Na to váží variace způsobené odlišnými seznamy slov. Například lexikální podobnost mezi francouzštinou a angličtinou je značná v lexikálních oblastech týkajících se kultury, zatímco jejich podobnost je menší, pokud jde o základní (funkční) slova. Na rozdíl od vzájemné srozumitelnosti může být lexikální podobnost pouze symetrická.
Indoevropské jazyky
Níže uvedená tabulka ukazuje některé hodnoty lexikální podobnosti pro páry vybraných románských, germánských a slovanských jazyků, jak byly shromážděny a publikovány Etnolog.[2]
Lang. kód | Jazyk 1 ↓ | Koeficienty lexikální podobnosti | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Katalánština | Angličtina | francouzština | Němec | italština | portugalština | rumunština | Romansh | ruština | Sardinský | španělština | ||
kočka | Katalánština | 1 | - | 0.85 | - | 0.87 | 0.85 | 0.73 | 0.76 | - | 0.75 | 0.85 |
angl | Angličtina | - | 1 | 0.27 | 0.60 | - | - | - | - | 0.24 | - | - |
fra | francouzština | 0.85 | 0.27 | 1 | 0.29 | 0.89 | 0.75 | 0.75 | 0.78 | - | 0.80 | 0.75 |
deu | Němec | - | 0.60 | 0.29 | 1 | - | - | - | - | - | - | - |
ita | italština | 0.87 | - | 0.89 | - | 1 | - | 0.77 | 0.78 | - | 0.85 | 0.82 |
por | portugalština | 0.85 | - | 0.75 | - | - | 1 | 0.72 | 0.74 | - | - | 0.89 |
ron | rumunština | 0.73 | - | 0.75 | - | 0.77 | 0.72 | 1 | 0.72 | - | 0.74 | 0.71 |
roh | Romansh | 0.76 | - | 0.78 | - | 0.78 | 0.74 | 0.72 | 1 | - | 0.74 | 0.74 |
rus | ruština | - | 0.24 | - | - | - | - | - | - | 1 | - | - |
srd | Sardinský | 0.75 | - | 0.80 | - | 0.85 | - | 0.74 | 0.74 | - | 1 | 0.76 |
lázně | španělština | 0.85 | - | 0.75 | - | 0.82 | 0.89 | 0.71 | 0.74 | - | 0.76 | 1 |
Katalánština | Angličtina | francouzština | Němec | italština | portugalština | rumunština | Romansh | ruština | Sardinský | španělština | ||
Jazyk 2 → | kočka | angl | fra | deu | ita | por | ron | roh | rus | srd | lázně |
Poznámky:
- Kódy jazyků jsou ze standardu ISO 639-3.
- Roberto Bolognesi a Wilbert Heeringa zjistili, že průměrná divergence mezi sardinštinou a italštinou je kolem 48,7%, od minimálního dialektálního stupně divergence 46,6% po nejvyšší 51,1%.[3] Tím by se různé sardinské dialekty mírně lišily od italštiny od španělštiny (průměrný stupeň odchylky od italštiny je kolem 46,0%).[3]
- „-“ označuje, že srovnávací údaje nejsou k dispozici.
- V případě anglicko-francouzské lexikální podobnosti minimálně dvě další studie[4][5] odhadnout počet anglických slov přímo zděděných z francouzštiny na 28,3%, respektive 41%, s 28,24% respektive 15% jiných anglických slov odvozených z latiny, přičemž anglicko-francouzská lexikální podobnost by byla přibližně 0,56, přičemž vzájemně nižší anglicko-německá lexikální podobnosti. Další studie odhaduje počet anglických slov s kurzívou na 51%, což je v souladu se dvěma předchozími analýzami.[6]
Viz také
Reference
- Ethnologue.com (hodnoty lexikální podobnosti jsou k dispozici u některých jednotlivých jazykových záznamů)
- Definice lexikální podobnosti v Ethnologue.com
- Rensch, Calvin R. 1992. „Výpočet lexikální podobnosti.“ V Eugene H. Casad (ed.), Windows o dvojjazyčnosti , 13-15. (Summer Institute of Linguistics and the University of Texas at Arlington Publications in Linguistics, 110). Dallas: Letní lingvistický institut a University of Texas v Arlingtonu.
Poznámky
- ^ „O společnosti Ethnologue“. Etnolog. 2012-09-25. Citováno 2019-02-24.
- ^ Viz například data lexikální podobnosti pro francouzština, Němec, Angličtina
- ^ A b „Bolognesi, Roberto; Heeringa, Wilbert. Sardegna fra tante lingue, str. 123, 2005, Condaghes " (PDF). Archivovány od originál (PDF) dne 11.02.2014. Citováno 2017-04-14.
- ^ Finkenstaedt, Thomas; Dieter Wolff (1973). Objednané množství; studium slovníků a anglického lexikonu. C. Zima. ISBN 3-533-02253-6.
- ^ „Joseph M. Willams, Origins of the English Language at“. Amazon.com. Citováno 2010-04-21.
- ^ Nation, I.S.P. (2001). Učení slovní zásoby v jiném jazyce. Cambridge University Press. str. 477. ISBN 0-521-80498-1.