Společný výskyt - Co-occurrence
V lingvistice společný výskyt nebo společný výskyt je náhodná frekvence výskyt ze dvou podmínky (také známý jako náhoda nebo souběh ) z a textový korpus vedle sebe v určitém pořadí. Společný výskyt v tomto jazykové smysl lze interpretovat jako indikátor sémantická blízkost nebo idiomatický výraz. Korpusová lingvistika a její statistické analýzy odhalují vzorce společného výskytu v jazyce a umožňují vypracovat typické kolokace pro jeho lexikální položky. A omezení společného výskytu je identifikován, když se jazykové prvky nikdy nevyskytují společně. Analýza těchto omezení může vést k objevům o struktura a rozvoj jazyka.[1]
Společný výskyt lze vidět jako rozšíření počítání slov ve vyšších dimenzích. Společný výskyt lze kvantitativně popsat pomocí opatření jako korelace nebo vzájemné informace.
Viz také
- Distribuční hypotéza
- Statistická sémantika
- Matice společného výskytu
- Sítě společného výskytu
- Měření podobnosti[2]
Reference
- ^ Kroeger, Paul (2005). Analýza gramatiky: Úvod. Cambridge: Cambridge University Press. p. 20. ISBN 978-0-521-01653-7.
- ^ Bordag, Stefane. "Srovnání opatření společného výskytu a podobnosti jako simulace kontextu". CiteSeerX 10.1.1.471.5863. Citovat deník vyžaduje
| deník =
(Pomoc)
![]() | Tento lingvistika článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |