Nejběžnější slova v angličtině - Most common words in English
Studie, které odhadují a hodnotí nejběžnější slova v angličtině zkoumat texty psané v angličtině. Snad nejkomplexnější taková analýza je ta, která byla provedena proti Oxford English Corpus (OEC), velmi velká sbírka textů z celého světa, které jsou psány v anglickém jazyce. A textový korpus je velká sbírka písemných prací, které jsou organizovány způsobem, který takovou analýzu usnadňuje.
Celkově texty v Oxford English Corpus obsahují více než 2 miliardy slov.[1] OEC zahrnuje širokou škálu ukázek psaní, jako jsou literární díla, romány, akademické časopisy, noviny, časopisy, Hansardovy parlamentní rozpravy, blogy, protokoly chatu a e-maily.[2]
Dalším anglickým korpusem, který se používá ke studiu frekvence slov, je Hnědý korpus, který byl sestaven výzkumníky na Brown University v šedesátých letech. Vědci publikovali svou analýzu hnědého korpusu v roce 1967. Jejich nálezy byly podobné, ale ne identické, se závěry analýzy OEC.
Podle Kniha seznamů učitelů čtení, prvních 25 slov v OEC tvoří přibližně třetinu veškerého tištěného materiálu v angličtině a prvních 100 slov tvoří přibližně polovinu veškeré psané angličtiny.[3] Podle studie citované Robert McCrum v Příběh angličtiny, všech prvních stovek nejběžnějších slov v angličtině je z Anglosaský původ,[4] kromě „lidí“, nakonec z latiny „populus“ a „protože“, částečně z latiny „causa“.
Některé seznamy běžných slov rozlišují slovní tvary, zatímco ostatní hodnotí všechny formy slova jako jediné lexém (forma slova, jak by vypadala ve slovníku). Například lexém být (jako v být ) zahrnuje všechny jeho konjugace (je, byl, dopoledne, jsou, bylyatd.) a kontrakce těchto konjugací.[5] Tyto top 100 lemmat uvedené níže tvoří 50% všech slov v Oxford English Corpus.[1]
100 nejběžnějších slov
Níže je uveden seznam 100 slov, která se nejčastěji vyskytují v psané angličtině, na základě analýzy Oxford English Corpus (sbírka textů v anglickém jazyce, která obsahuje více než 2 miliardy slov).[1] A část mluvy je k dispozici pro většinu slov, ale kategorie řeči se mezi analýzami liší a nejsou uvedeny všechny možnosti. Například „I“ může být zájmeno nebo římská číslice; „to“ může být předložka nebo infinitiv; "čas" může být podstatné jméno nebo sloveso. Jediný pravopis může také představovat více než jeden kořen slova. Například „zpěvák“ může být formou „zpívat“ nebo „zpívat“. Různé korpusy mohou s tímto rozdílem zacházet odlišně.
Počet různých smyslů, které jsou uvedeny v Wikislovník je zobrazen v Polysemy sloupec. Například „out“ může odkazovat na únik, vyřazení ze hry v baseballu nebo na jakýkoli z 36 dalších konceptů. V průměru má každé slovo v seznamu 15,38 smyslů. Počet smyslů nezahrnuje použití termínů v frázová slovesa jako „jíst venku“ (kárat) a další víceslovné výrazy jako například citoslovce „vypadni!“, kde slovo „ven“ nemá individuální význam.[6] Například „out“ se vyskytuje u nejméně 560 frázových sloves[7] a objevuje se v téměř 1700 víceslovných výrazech.[1]
Tabulka také obsahuje frekvence z jiných korpusů, všimněte si, že stejně jako rozdíly v používání, lemmatizace se může lišit od korpusu k korpusu - například rozdělit předložkové použití „do“ od použití jako částice. Seznam COCA také zahrnuje rozptyl a frekvenci pro výpočet hodnosti.
Slovo | Části řeči | OEC hodnost | KOKA hodnost[8] | Úroveň dolch | Polysemy |
---|---|---|---|---|---|
the | Článek | 1 | 1 | Předběžný nátěr | 12 |
být | Sloveso | 2 | 2 | Primer | 21 |
na | Předložka | 3 | 7, 9 | Předběžný nátěr | 17 |
z | Předložka | 4 | 4 | Stupeň 1 | 12 |
a | Spojení | 5 | 3 | Předběžný nátěr | 16 |
A | Článek | 6 | 5 | Předběžný nátěr | 20 |
v | Předložka | 7 | 6, 128, 3038 | Předběžný nátěr | 23 |
že | Conjunction et al. | 8 | 12, 27, 903 | Primer | 17 |
mít | Sloveso | 9 | 8 | Primer | 25 |
Já | Zájmeno | 10 | 11 | Předběžný nátěr | 7 |
to | Zájmeno | 11 | 10 | Předběžný nátěr | 18 |
pro | Předložka | 12 | 13, 2339 | Předběžný nátěr | 19 |
ne | Adverb et al. | 13 | 28, 2929 | Předběžný nátěr | 5 |
na | Předložka | 14 | 17, 155 | Primer | 43 |
s | Předložka | 15 | 16 | Primer | 11 |
on | Zájmeno | 16 | 15 | Primer | 7 |
tak jako | Adverb, spojení a kol. | 17 | 33, 49, 129 | Stupeň 1 | 17 |
vy | Zájmeno | 18 | 14 | Předběžný nátěr | 9 |
dělat | Sloveso, podstatné jméno | 19 | 18 | Primer | 38 |
v | Předložka | 20 | 22 | Primer | 14 |
tento | Determinátor, příslovce, podstatné jméno | 21 | 20, 4665 | Primer | 9 |
ale | Předložka, příslovce, konjunkce | 22 | 23, 1715 | Primer | 17 |
jeho | Přivlastňovací zájmeno | 23 | 25, 1887 | Stupeň 1 | 6 |
podle | Předložka | 24 | 30, 1190 | Stupeň 1 | 19 |
z | Předložka | 25 | 26 | Stupeň 1 | 4 |
ony | Zájmeno | 26 | 21 | Primer | 6 |
my | Zájmeno | 27 | 24 | Předběžný nátěr | 6 |
říci | Verb a kol. | 28 | 19 | Primer | 17 |
její | Přivlastňovací zájmeno | 29, 106 | 42 | Stupeň 1 | 3 |
ona | Zájmeno | 30 | 31 | Primer | 7 |
nebo | Spojení | 31 | 32 | Stupeň 2 | 11 |
an | Článek | 32 | (A) | Stupeň 1 | 6 |
vůle | Sloveso, podstatné jméno | 33 | 48, 1506 | Primer | 16 |
můj | Přivlastňovací zájmeno | 34 | 44 | Předběžný nátěr | 5 |
jeden | Podstatné jméno, přídavné jméno a kol. | 35 | 51, 104, 839 | Předběžný nátěr | 24 |
Všechno | Přídavné jméno | 36 | 43, 222 | Primer | 15 |
bych | Sloveso | 37 | 41 | Stupeň 2 | 13 |
tam | Příslovce, zájmeno atd. | 38 | 53, 116 | Primer | 14 |
jejich | Přivlastňovací zájmeno | 39 | 36 | Stupeň 2 | 2 |
co | Zájmeno, příslovce atd. | 40 | 34 | Primer | 19 |
tak | Conjunction, příslovce a kol. | 41 | 55, 196 | Primer | 18 |
nahoru | Příslovce, předložka a kol. | 42 | 50, 456 | Předběžný nátěr | 50 |
ven | Předložka | 43 | 64, 149 | Primer | 38 |
-li | Spojení | 44 | 40 | Stupeň 3 | 9 |
o | Předložka, příslovce a kol. | 45 | 46, 179 | Stupeň 3 | 18 |
SZO | Zájmeno, podstatné jméno | 46 | 38 | Primer | 5 |
dostat | Sloveso | 47 | 39 | Primer | 37 |
který | Zájmeno | 48 | 58 | Stupeň 2 | 7 |
jít | Sloveso, podstatné jméno | 49 | 35 | Předběžný nátěr | 54 |
mě | Zájmeno | 50 | 61 | Předběžný nátěr | 10 |
když | Příslovce | 51 | 57, 136 | Stupeň 1 | 11 |
udělat | Sloveso, podstatné jméno | 52 | 45 | Stupeň 2 [jako „vyrobený“] | 48 |
umět | Sloveso, podstatné jméno | 53 | 37, 2973 | Předběžný nátěr | 18 |
jako | Předložka, sloveso | 54 | 74, 208, 1123, 1684, 2702 | Primer | 26 |
čas | Podstatné jméno | 55 | 52 | Dolch seznam 95 podstatných jmen | 14 |
Ne | Determinátor, příslovce | 56 | 93, 699, 916, 1111, 4555 | Primer | 10 |
prostě | Přídavné jméno | 57 | 66, 1823 | 14 | |
mu | Zájmeno | 58 | 68 | 5 | |
vědět | Sloveso, podstatné jméno | 59 | 47 | 13 | |
vzít | Sloveso, podstatné jméno | 60 | 63 | 66 | |
lidé | Podstatné jméno | 61 | 62 | 9 | |
do | Předložka | 62 | 65 | 10 | |
rok | Podstatné jméno | 63 | 54 | 7 | |
vaše | Přivlastňovací zájmeno | 64 | 69 | 4 | |
dobrý | Přídavné jméno | 65 | 110, 2280 | 32 | |
nějaký | Determinátor, zájmeno | 66 | 60 | 10 | |
mohl | Sloveso | 67 | 71 | 6 | |
jim | Zájmeno | 68 | 59 | 3 | |
vidět | Sloveso | 69 | 67 | 25 | |
jiný | Přídavné jméno, zájmeno | 70 | 75, 715, 2355 | 12 | |
než | Spojení, předložka | 71 | 73, 712 | 4 | |
pak | Příslovce | 72 | 77 | 10 | |
Nyní | Předložka | 73 | 72, 1906 | 13 | |
Koukni se | Sloveso | 74 | 85, 604 | 17 | |
pouze | Příslovce | 75 | 101, 329 | 11 | |
Přijít | Sloveso | 76 | 70 | 20 | |
své | Přivlastňovací zájmeno | 77 | 78 | 2 | |
přes | Předložka | 78 | 124, 182 | 19 | |
myslet si | Sloveso | 79 | 56 | 10 | |
taky | Příslovce | 80 | 87 | 2 | |
zadní | Podstatné jméno, příslovce | 81 | 108, 323, 1877 | 36 | |
po | Předložka | 82 | 120, 260 | 14 | |
použití | Sloveso, podstatné jméno | 83 | 92, 429 | 17 | |
dva | Podstatné jméno | 84 | 80 | 6 | |
jak | Příslovce | 85 | 76 | 11 | |
náš | Přivlastňovací zájmeno | 86 | 79 | 3 | |
práce | Sloveso, podstatné jméno | 87 | 117, 199 | 28 | |
První | Přídavné jméno | 88 | 86, 2064 | 10 | |
studna | Příslovce | 89 | 100, 644 | 30 | |
cesta | Podstatné jméno, příslovce | 90 | 84, 4090 | 16 | |
dokonce | Přídavné jméno | 91 | 107, 484 | 23 | |
Nový | Adjective et al. | 92 | 88 | 18 | |
chci | Sloveso | 93 | 83 | 10 | |
protože | Spojení | 94 | 89, 509 | 7 | |
žádný | Zájmeno | 95 | 109, 4720 | 4 | |
tyto | Zájmeno | 96 | 82 | 2 | |
dát | Sloveso | 97 | 98 | 19 | |
den | Podstatné jméno | 98 | 90 | 9 | |
většina | Příslovce | 99 | 144, 187 | 12 | |
nás | Zájmeno | 100 | 113 | 6 |
Části řeči
Následuje velmi podobný seznam, který je dále rozdělen na část mluvy.[1] Seznam označený jako „Ostatní“ zahrnuje zájmena, přivlastňovací prostředky, článků, modální slovesa, příslovce, a spojky.
Hodnost | Podstatná jména | Slovesa | Přídavná jména | Předložky | Ostatní |
---|---|---|---|---|---|
1 | čas | být | dobrý | na | the |
2 | osoba | mít | Nový | z | a |
3 | rok | dělat | První | v | A |
4 | cesta | říci | poslední | pro | že |
5 | den | dostat | dlouho | na | Já |
6 | věc | udělat | skvělý | s | to |
7 | muž | jít | málo | v | ne |
8 | svět | vědět | vlastní | podle | on |
9 | život | vzít | jiný | z | tak jako |
10 | ruka | vidět | starý | nahoru | vy |
11 | část | Přijít | že jo | o | tento |
12 | dítě | myslet si | velký | do | ale |
13 | oko | Koukni se | vysoký | přes | jeho |
14 | žena | chci | odlišný | po | ony |
15 | místo | dát | malý | její | |
16 | práce | použití | velký | ona | |
17 | týden | nalézt | další | nebo | |
18 | případ | sdělit | brzy | an | |
19 | směřovat | zeptat se | Mladá | vůle | |
20 | vláda | práce | Důležité | můj | |
21 | společnost | zdát se | málo | jeden | |
22 | číslo | cítit | veřejnost | Všechno | |
23 | skupina | Snaž se | špatný | bych | |
24 | problém | odejít | stejný | tam | |
25 | skutečnost | volání | schopný | jejich |
Viz také
- Základní angličtina
- Frekvenční analýza, studium četnosti písmen nebo skupin písmen
- Dopisové frekvence
- Oxford English Corpus
- Seznam Swadesh, kompilace základních pojmů pro účely historicko-srovnávací lingvistiky
- Zipfův zákon, teorie uvádějící, že frekvence kteréhokoli slova je nepřímo úměrná jeho pořadí v tabulce frekvencí
Seznamy slov
- Seznam slov Dolch, seznam často používaných anglických slov
- Seznam obecných služeb
- Seznamy slov podle frekvence
Reference
- ^ A b C d „The Oxford English Corpus: Facts about the language“. OxfordDictionaries.com. Oxford University Press. Jaké je nejběžnější slovo? Archivovány od originál 26. prosince 2011. Citováno 22. června 2011.
- ^ „Oxfordský anglický korpus“. AskOxford.com. Citováno 22. června 2006.
- ^ Prvních 100 nejčastěji používaných anglických slov Archivováno 16. 06. 2013 na Wayback Machine.
- ^ Bill Bryson, Mateřský jazyk: angličtina a jak se to dostalo, Harper Perennial, 2001, strana 58
- ^ Benjamin Zimmer. 22. června 2006. Čas od času za čas .... Jazykový protokol. Citováno 22. června 2006.
- ^ Benjamin, Martin (2019). „Polysemy in top 100 Oxford English Corpus words within Wiktionary“. Naučit vás zpět. Citováno 28. prosince 2019.
- ^ Garcia-Vega, M (2010). „Dráždíme význam“ ven"". 29. mezinárodní konference o lexisu a gramatice.
- ^ „Frekvence slov: na základě 450 milionů slov COCA korpusu“. www.wordfrequency.info. Citováno 11. dubna 2018.