Tverský index - Tversky index
The Tverský index, pojmenoval podle Amos Tversky,[1] je asymetrický opatření podobnosti na sady který porovnává variantu s prototypem. Tverský index lze chápat jako zobecnění indexu Sørensen – koeficient kostky a Koeficient Tanimoto (aka Jaccardův index ).
Pro sady X a Y index Tversky je číslo mezi 0 a 1 dané
,
Tady, označuje relativní doplněk Y v X.
Dále, jsou parametry Tverského indexu. Nastavení produkuje Tanimoto koeficient; nastavení produkuje koeficient Sørensen – Dice.
Pokud vezmeme v úvahu X být prototypem a Y tedy být variantou odpovídá hmotnosti prototypu a odpovídá hmotnosti varianty. Tversky měří s jsou zvláštního zájmu.[2]
Z důvodu inherentní asymetrie index Tversky nesplňuje kritéria pro metriku podobnosti. Pokud je však nutná symetrie, byla navržena varianta původní formulace max a min funkce[3].
,
,
,
Tato formulace také přeuspořádává parametry a . Tím pádem, řídí rovnováhu mezi a ve jmenovateli. Podobně, řídí účinek symetrického rozdílu proti ve jmenovateli.
Poznámky
- ^ Tversky, Amos (1977). „Vlastnosti podobnosti“ (PDF). Psychologický přehled. 84 (4): 327–352. doi:10.1037 / 0033-295x.84.4.327.
- ^ http://www.daylight.com/dayhtml/doc/theory/theory.finger.html
- ^ Jimenez, S., Becerra, C., Gelbukh, A. SOFTCARDINALITY-CORE: Zlepšení překrývání textu s distribučními opatřeními pro sémantickou textovou podobnost. Druhá společná konference o lexikální a výpočetní sémantice (* SEM), svazek 1: Sborník z hlavní konference a sdíleného úkolu: Sémantická textová podobnost, s. 194–201, 7. – 8. Června 2013, Atlanta, Georgia, USA.