Nejběžnější slova ve španělštině - Most common words in Spanish - Wikipedia
Níže jsou uvedeny dva odhady nejběžnějších slov v Moderní španělština. Každý odhad vychází z analýzy jiného textový korpus. A textový korpus je velká sbírka vzorků psaného nebo mluveného jazyka, která byla pečlivě připravena pro jazykovou analýzu. Aby vědci zjistili, která slova jsou nejběžnější, vytvořili a databáze všech slov nalezených v korpusu a roztřídit je podle kontextu, ve kterém jsou použita.
První tabulka uvádí 100 nejčastějších slovní tvary ze skutečného Corpus de Referencia del Español (CREA), textového korpusu sestaveného Real Academia Española (RAE). RAE je španělská oficiální instituce pro dokumentaci, plánování, a standardizace španělský jazyk. A slovní forma je jakákoli z gramatických variací slova.
Druhá tabulka je seznam 100 nejběžnějších lemmat nalezeno v textovém korpusu zkompilovaného uživatelem Mark Davies a další jazykovědci na Univerzita Brighama Younga ve Spojených státech. A lemma je primární forma slova - ta, která by se objevila ve slovníku. Spanel infinitiv tener („mít“) je lema, zatímco tiene („has“) - což je a časování z tener—Je slovní forma.
Real Academia Española
Seznam níže pochází z „1000 formulářů más frecuentes“ (překlad 1000 nejčastějších tvarů slov) “, seznam zveřejněný Real Academia Española (RAE) z analýzy více než 160 milionů slovní tvary ve Skutečném souboru Corpus de Referencia del Español (překlad Referenční korpus současné španělštiny) nebo CREA. CREA je počítačová korpus textů psaných ve španělštině a přepisů mluvené španělštiny. Zahrnuje knihy, časopisy a noviny s nejrůznějším obsahem a přepisy mluveného jazyka z rozhlasového a televizního vysílání a dalších zdrojů. Všechny práce ve sbírce pocházejí z let 1975 až 2004. CREA zahrnuje ukázky ze všech španělsky mluvících zemí.[1]
Seznam „1 000 nejčastějších tvarů slov“ pochází z analýzy CREA verze 3.2.[2] Množné číslo, časování sloves, a další skloňování jsou seřazeny samostatně. Homonyma se však navzájem nerozlišují. CREA 3.2 byla zveřejněna v červnu 2008.[1]
Hodnost | Slovní forma | Události | Část mluvy | Překlad |
---|---|---|---|---|
1 | de | 9,999,518 | předložka | z; z |
2 | Los Angeles | 6,277,560 | článek, zájmeno | ; třetí osoba ženské singulární zájmeno |
3 | que | 4,681,839 | spojení | to, které |
4 | el | 4,569,652 | článek | the |
5 | en | 4,234,281 | předložka | dovnitř, dál |
6 | y | 4,180,279 | spojení | a |
7 | A | 3,260,939 | předložka | do, v |
8 | los | 2,618,657 | článek, zájmeno | ; přímý mužský předmět třetí osoby |
9 | se | 2,022,514 | zájmeno | sám sebe (reflexní ) |
10 | del | 1,857,225 | předložka | z |
11 | las | 1,686,741 | článek, zájmeno | ; přímý ženský předmět třetí osoby |
12 | un | 1,659,827 | článek | a, an |
13 | por | 1,561,904 | předložka | od, pro, přes |
14 | ošidit | 1,481,607 | předložka | s |
15 | Ne | 1,465,503 | příslovce | Ne; ne |
16 | una | 1,347,603 | článek | a, an, one |
17 | su | 1,103,617 | Přivlastňovací | jeho / její / vaše |
18 | odst | 1,062,152 | předložka | pro, do, aby |
19 | es | 1,019,669 | sloveso | je |
20 | al | 951,054 | předložka | do |
21 | hle | 866,955 | článek, zájmeno | ; přímý mužský předmět třetí osoby |
22 | como | 773,465 | spojení | tak jako |
23 | más | 661,696 | přídavné jméno | více |
24 | Ó | 542,284 | spojení | nebo |
25 | pero | 450,512 | spojení | ale |
26 | sus | 449,870 | Přivlastňovací | vaše |
27 | le | 413,241 | zájmeno | nepřímý předmět třetí osoby |
28 | ha | 380,339 | sloveso | on / ona / to [něco udělal]; vy (formální) [udělali něco] |
29 | mě | 374,368 | zájmeno | mě |
30 | si | 327,480 | spojení | pokud, zda |
31 | hřích | 298,383 | předložka | bez |
32 | sobre | 289,704 | předložka | nahoře, kolem, kolem |
33 | vážnost | 285,461 | přídavné jméno | tento |
34 | ya | 274,177 | příslovce | již; ještě pořád |
35 | entre | 267,493 | předložka | mezi |
36 | cuando | 257,272 | spojení | když |
37 | dělat | 247,340 | přídavné jméno | všichni, všichni |
38 | esta | 238,841 | přídavné jméno | tento |
39 | ser | 232,924 | sloveso | být |
40 | syn | 232,415 | sloveso | oni jsou, vy (pl.) jsou |
41 | dos | 228,439 | číslo | dva |
42 | también | 227,411 | příslovce | také |
43 | fue | 223,791 | sloveso | byl |
44 | había | 223,430 | sloveso | Já / on / ona / to / tam byl (nebo býval) |
45 | éra | 219,933 | sloveso | byl |
46 | muy | 208,540 | příslovce | velmi |
47 | años | 203,027 | podstatné jméno (mužský) | let |
48 | hasta | 202,935 | předložka | dokud |
49 | desde | 198,647 | předložka | z; od té doby |
50 | está | 194,168 | sloveso | je |
51 | mi | 186,360 | Přivlastňovací | můj |
52 | porque | 185,700 | spojení | protože |
53 | qué | 184,956 | zájmeno | co?; který?; jak přídavné jméno |
54 | sólo | 170,552 | příslovce | pouze, pouze |
55 | han | 169,718 | sloveso | oni / vy (pl.) [udělali něco] |
56 | jo | 167,684 | zájmeno | Já |
57 | seno | 164,940 | sloveso | existuje / jsou |
58 | vez | 163,538 | podstatné jméno (ženský) | čas, instance |
59 | puede | 161,219 | sloveso | umět |
60 | todos | 158,168 | přídavné jméno | Všechno; každý |
61 | así | 155,645 | příslovce | takhle |
62 | nos | 154,412 | zájmeno | nás |
63 | ni | 153,451 | spojka, příslovce | ani; ani; ani ne |
64 | část | 148,750 | podstatné jméno (mužský / ženský) | část; zpráva |
65 | tiene | 147,274 | sloveso | má |
66 | el | 139,080 | zájmeno (mužský) | on, to |
67 | ne | 136,020 | číslo | jeden |
68 | donde | 132,077 | předložka | kde |
69 | bien | 130,957 | přídavné jméno | dobře, dobře |
70 | tiempo | 130,896 | podstatné jméno (mužský) | čas; počasí |
71 | mismo | 130,746 | přídavné jméno | stejný |
72 | ese | 127,976 | zájmeno | že |
73 | ahora | 125,661 | příslovce | Nyní |
74 | cada | 124,558 | určující | každý; každý |
75 | E | 123,729 | spojení | a |
76 | vida | 123,491 | podstatné jméno (ženský) | život |
77 | otro | 121,983 | přídavné jméno | jiný, další |
78 | después | 121,746 | předložka | po |
79 | te | 120,052 | zájmeno | vám, pro vás; vy sám |
80 | otros | 119,500 | zájmeno | ostatní |
81 | tetička | 115,556 | spojení | i když, i když |
82 | esa | 115,377 | přídavné jméno | že |
83 | eso | 114,523 | zájmeno | že |
84 | hace | 114,507 | sloveso | on / ona / to dělá / dělá |
85 | otra | 113,982 | přídavné jméno, zájmeno | jiný; další |
86 | gobierno | 113,011 | podstatné jméno (mužský) | vláda |
87 | opálení | 112,471 | příslovce | tak |
88 | durante | 112,020 | předložka | v průběhu |
89 | siempre | 111,557 | příslovce | vždy |
90 | día | 110,921 | podstatné jméno (mužský) | den |
91 | tanto | 110,679 | přídavné jméno, příslovce | tak moc |
92 | ella | 110,620 | zájmeno | ona, ona; to |
93 | tres | 109,542 | číslo | tři |
94 | sí | 108,631 | podstatné jméno, zájmeno | Ano; zvratné zájmeno |
95 | dijo | 108,471 | sloveso | řekl; řekl |
96 | sido | 107,352 | příčestí minulé | byl |
97 | gran | 106,991 | přídavné jméno | velký, velký, velký |
98 | país | 104,568 | podstatné jméno (mužský) | země |
99 | según | 104,204 | předložka | tak jako; podle |
100 | menu | 103,498 | přídavné jméno | méně; méně |
Mark Davies
V roce 2006 Mark Davies, docent z lingvistika v Univerzita Brighama Younga, zveřejnil svůj odhad 5 000 nejběžnějších slov v moderní španělštině. Aby vytvořil tento seznam, sestavil vzorky pouze ze zdrojů 20. století - zejména z let 1970 až 2000. Většina zdrojů pochází z 90. let. Z 20 milionů slov v korpusu pochází asi jedna třetina (~ 6 750 000 slov) z přepisů mluvené španělštiny: rozhovory, rozhovory, přednášky, kázání, tiskové konference, sportovní přenosy atd. Mezi písemné zdroje patří romány, divadelní hry, povídky, dopisy, eseje, noviny a encyklopedie Encarta. Ukázky, písemné i mluvené, pocházejí ze Španělska a nejméně z 10 latinskoamerických zemí. Většina vzorků byla dříve sestavena pro Corpus del Español (2001), korpus se 100 miliony slov, který obsahuje díla z 13. století skrz 20.[3][4]
5000 slov v Daviesově seznamu je lemmat.[5] A lemma je forma slova, jak by vypadala ve slovníku.[6] Například podstatná jména v jednotném čísle a množném čísle jsou považována za stejná slova infinitivy a konjugace sloves. Níže uvedená tabulka obsahuje 100 nejlepších slov z Daviesova seznamu 5 000.[7][8] Tento seznam rozlišuje mezi určité články hle a Los Angeles a zájmena hle a Los Angeles; všechny jsou seřazeny jednotlivě. Přídavná jména ese a esa jsou seřazeny společně (stejně jako vážnost a esta)), ale zájmeno eso je samostatný. Všechny časování slovesa jsou seřazeny společně.
Zvýrazněný řádek označuje, že bylo zjištěno, že se slovo vyskytuje zvláště často v ukázkách mluvené španělštiny.[9]
Hodnost | Lemma | Události | Část mluvy | Překlad |
---|---|---|---|---|
1 | el / Los Angeles | 2,037,803 | článek | the |
2 | de | 1,319,834 | předložka | v rozmezí od |
3 | que | 662,653 | spojení | to, které |
4 | y | 562,162 | spojení | a |
5 | A | 529,899 | předložka | do, v |
6 | en | 507,233 | předložka | dovnitř, dál |
7 | un | 434,022 | článek | a, an |
8 | ser | 374,194 | sloveso | být |
9 | se | 329,012 | zájmeno | sám sebe (reflexivní) |
10 | Ne | 257,365 | příslovce | Ne |
11 | haber | 196,962 | sloveso | mít |
12 | por | 190,975 | předložka | od, pro, přes |
13 | ošidit | 184,597 | předložka | s |
14 | su | 187,810 | přídavné jméno | jeho, ona, jejich, vaše |
15 | odst | 126,061 | předložka | pro, do, aby |
16 | como | 106,840 | spojení | tak jako |
17 | estar | 106,429 | sloveso | být |
18 | tener | 106,642 | sloveso | mít |
19 | le | 98,211 | zájmeno | nepřímý předmět třetí osoby |
20 | hle | 91,035 | článek | the |
21 | hle | 92,519 | zájmeno | přímý mužský předmět třetí osoby |
22 | dělat | 88,057 | přídavné jméno | všichni, všichni |
23 | pero | 82,435 | spojení | ale přesto, kromě |
24 | más | 92,352 | přídavné jméno | více |
25 | hacer | 81,619 | sloveso | dělat; dělat |
26 | Ó | 82,444 | spojení | nebo |
27 | poder | 76,738 | sloveso | být schopen, může |
28 | decir | 79,343 | sloveso | říct, říct |
29 | vážnost / esta | 80,544 | přídavné jméno | tento |
30 | ir | 70,352 | sloveso | jít |
31 | otro | 61,726 | přídavné jméno | jiný, další |
32 | ese / esa | 60,989 | přídavné jméno | že |
33 | Los Angeles | 55,523 | zájmeno | přímý ženský předmět třetí osoby |
34 | si | 53,608 | spojení | pokud, zda |
35 | mě | 95,577 | zájmeno | mě |
36 | ya | 46,778 | příslovce | už, stále |
37 | ver | 45,854 | sloveso | vidět |
38 | porque | 44,500 | spojení | protože |
39 | kámo | 40,233 | sloveso | dát |
40 | cuando | 39,726 | spojení | když |
41 | el | 38,597 | zájmeno | on |
42 | muy | 39,558 | příslovce | velmi, opravdu |
43 | hřích | 40,432 | předložka | bez |
44 | vez | 35,286 | podstatné jméno (ženský) | čas, výskyt |
45 | mucho | 36,391 | přídavné jméno | hodně, mnoho, hodně |
46 | šavle | 37,092 | sloveso | vědět |
47 | qué | 42,000 | zájmeno | co?; který?; jak přídavné jméno |
48 | sobre | 35,038 | předložka | nahoře, kolem, kolem |
49 | mi | 45,636 | přídavné jméno | můj |
50 | alguno | 30,485 | přídavné jméno / zájmeno | nějaký; někdo |
51 | mismo | 29,569 | přídavné jméno | stejný |
52 | jo | 54,635 | zájmeno | Já |
53 | también | 33,348 | příslovce | taky |
54 | hasta | 29,506 | předložka / příslovce | do, až; dokonce |
55 | año | 33,053 | podstatné jméno (mužský) | rok |
56 | dos | 27,733 | číslo | dva |
57 | dotazující se | 28,696 | sloveso | chtít, lásko |
58 | entre | 30,756 | předložka | mezi |
59 | así | 24,832 | příslovce | takhle |
60 | primero | 26,553 | přídavné jméno | za prvé |
61 | desde | 25,288 | předložka | od, protože |
62 | velký | 25,963 | přídavné jméno | velký, velký, velký |
63 | eso | 31,636 | zájmeno (střední pohlaví) | že |
64 | ni | 24,261 | spojení | ani, ani, ani |
65 | nos | 26,349 | zájmeno | nás |
66 | llegar | 22,878 | sloveso | přijet |
67 | pasar | 22,466 | sloveso | projít; stát se; trávit čas |
68 | tiempo | 22,432 | podstatné jméno (mužský) | čas, počasí |
69 | ella (s ) | 24,770 | zájmeno | ona; (množný) jim |
70 | sí | 33,828 | příslovce | Ano |
71 | día | 24,715 | podstatné jméno (mužský) | den |
72 | ne | 21,407 | číslo | jeden |
73 | bien | 21,589 | příslovce | studna |
74 | poco | 20,986 | přídavné jméno / příslovce | málo, málo; trochu |
75 | deber | 22,232 | sloveso | by měl, měl by; dlužit |
76 | entonces | 23,548 | příslovce | tak tedy |
77 | poner | 20,330 | sloveso | dát na); dostat [přídavné jméno] |
78 | cosa | 23,943 | podstatné jméno (ženský) | věc |
79 | tanto | 20,531 | přídavné jméno | hodně |
80 | hombre | 20,292 | podstatné jméno (mužský) | muž, lidstvo, manžel |
81 | parecer | 19,964 | sloveso | vypadat, vypadat |
82 | nuestro | 20,666 | přídavné jméno | náš |
83 | opálení | 19,002 | příslovce | takový, taky |
84 | donde | 18,852 | spojení | kde |
85 | ahora | 21,030 | příslovce | Nyní |
86 | část | 20,319 | podstatné jméno (ženský) | část, část |
87 | después | 20,229 | příslovce | po |
88 | vida | 18,045 | podstatné jméno (ženský) | život |
89 | quedar | 18,152 | sloveso | zůstat, zůstat |
90 | siempre | 17,689 | příslovce | vždy |
91 | creer | 21,257 | sloveso | věřit |
92 | hablar | 19,006 | sloveso | mluvit, mluvit |
93 | llevar | 17,062 | sloveso | vzít, nést |
94 | dejar | 18,185 | sloveso | nechat, odejít |
95 | nada | 19,365 | zájmeno | nic |
96 | cada | 17,155 | přídavné jméno | každý, každý |
97 | seguir | 16,104 | sloveso | následovat |
98 | menu | 15,527 | přídavné jméno | méně, méně |
99 | nuevo | 17,381 | přídavné jméno | Nový |
100 | zaklínadlo | 15,556 | sloveso | najít |
Viz také
Poznámky
- ^ A b „CREA“. RAE.es (ve španělštině). Real Academia Española. Citováno 2017-07-13.
- ^ „Corpus de Referencia del Español Actual (CREA) - Listado de frecuencias“. RAE.es (ve španělštině). Real Academia Española. Citováno 2017-07-13.
- ^ Davies (2006), s. 2–3
- ^ „El Corpus del Español“. corpusdelespanol.org. Citováno 2017-07-13.
- ^ Davies (2006), s. 4–6
- ^ Davies (2006), s. 4
- ^ Davies (2006), s. 12–14
- ^ „Nejlepší španělský slovník“. Vistawide World Languages & Cultures. Citováno 2017-07-13.
- ^ Davies (2006), s. 9
Reference
- Davies, Mark (2006). Frequency Dictionary of Spanish: Core Vocabulary for Learners. Routledge. OCLC 300359892.
externí odkazy
- Cardellino, Cristian (březen 2016). „Korpus španělských miliard slov a vložení“. crscardellino.github.io. Cristian Cardellino.