Koeficient překrytí - Overlap coefficient
The koeficient překrytí,[1] nebo Szymkiewicz – Simpsonův koeficient, je opatření podobnosti který měří překrytí mezi dvěma konečnými sady. Souvisí to s Jaccardův index a je definována jako velikost souboru průsečík děleno menší z velikosti dvou sad:
Pokud je nastaven X je podmnožina z Y nebo naopak, koeficient překrytí se rovná 1.
Reference
- ^ Vijaymeena, M. K .; Kavitha, K. (březen 2016). „Průzkum opatření podobnosti při těžbě textu“ (PDF). Strojové učení a aplikace. 3 (1): 19–28. doi:10.5121 / mlaij.2016.3103.