Společný výskyt - Co-occurrence

V lingvistice společný výskyt nebo společný výskyt je náhodná frekvence výskyt ze dvou podmínky (také známý jako náhoda nebo souběh ) z a textový korpus vedle sebe v určitém pořadí. Společný výskyt v tomto jazykové smysl lze interpretovat jako indikátor sémantická blízkost nebo idiomatický výraz. Korpusová lingvistika a její statistické analýzy odhalují vzorce společného výskytu v jazyce a umožňují vypracovat typické kolokace pro jeho lexikální položky. A omezení společného výskytu je identifikován, když se jazykové prvky nikdy nevyskytují společně. Analýza těchto omezení může vést k objevům o struktura a rozvoj jazyka.^[1]

Společný výskyt lze vidět jako rozšíření počítání slov ve vyšších dimenzích. Společný výskyt lze kvantitativně popsat pomocí opatření jako korelace nebo vzájemné informace.

Viz také

Reference

^ Kroeger, Paul (2005). Analýza gramatiky: Úvod. Cambridge: Cambridge University Press. p. 20. ISBN 978-0-521-01653-7.
^ Bordag, Stefane. "Srovnání opatření společného výskytu a podobnosti jako simulace kontextu". CiteSeerX 10.1.1.471.5863. Citovat deník vyžaduje | deník = (Pomoc)

Tento lingvistika článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to.

[1] Kroeger, Paul (2005). Analýza gramatiky: Úvod. Cambridge: Cambridge University Press. p. 20. ISBN 978-0-521-01653-7.

[Bordag-2] Bordag, Stefane. "Srovnání opatření společného výskytu a podobnosti jako simulace kontextu". CiteSeerX 10.1.1.471.5863. Citovat deník vyžaduje | deník = (Pomoc)

[1]

[2]