Hellingerova vzdálenost - Hellinger distance
v pravděpodobnost a statistika, Hellingerova vzdálenost (úzce souvisí, i když se liší od, Bhattacharyya vzdálenost ) se používá ke kvantifikaci podobnosti mezi dvěma rozdělení pravděpodobnosti. Je to typ F-divergence. Hellingerova vzdálenost je definována z hlediska Hellingerův integrál, který představil Ernst Hellinger v roce 1909.[1][2]
Definice
Teorie měření
Definovat Hellingerovu vzdálenost z hlediska teorie míry, nechť P a Q označit dva pravděpodobnostní opatření to jsou absolutně kontinuální s ohledem na třetí míru pravděpodobnosti λ. Čtverec vzdálenosti Hellingerů mezi P a Q je definováno jako množství
Tady, dP / dλ a dQ / dλ jsou Deriváty radonu a nikodymu z P a Q resp. Tato definice nezávisí na λ, tedy Hellingerova vzdálenost mezi nimi P a Q se nemění, pokud je λ nahrazeno jiným měřítkem pravděpodobnosti, ve vztahu k němuž obě P a Q jsou naprosto spojité. Pro kompaktnost je výše uvedený vzorec často psán jako
Teorie pravděpodobnosti pomocí Lebesgueovy míry
Abychom definovali Hellingerovu vzdálenost z hlediska teorie základní pravděpodobnosti, považujeme λ za Lebesgueovo opatření, aby dP / dλ a dQ / dλ jsou jednoduše funkce hustoty pravděpodobnosti. Pokud označíme hustoty jako F a Gdruhou mocninu Hellingerovy vzdálenosti lze vyjádřit jako standardní integrál kalkulu
kde druhou formu lze získat rozšířením čtverce a použitím skutečnosti, že integrál hustoty pravděpodobnosti přes jeho doménu se rovná 1.
Hellingerova vzdálenost H(P, Q) uspokojuje majetek (odvozitelný z Cauchy – Schwarzova nerovnost )
Diskrétní distribuce
Pro dvě diskrétní rozdělení pravděpodobnosti a , jejich vzdálenost Hellinger je definována jako
který přímo souvisí s Euklidovská norma rozdílu vektorů druhé odmocniny, tj.
Taky,
Vlastnosti
Hellingerova vzdálenost tvoří a ohraničený metrický na prostor rozdělení pravděpodobnosti za dané pravděpodobnostní prostor.
Maximální vzdálenosti 1 je dosaženo, když P přiřadí každé sadě pravděpodobnost nula Q přiřadí kladnou pravděpodobnost a naopak.
Někdy je to faktor před integrálem je vynechán, v takovém případě se Hellingerova vzdálenost pohybuje od nuly do druhé odmocniny dvou.
Vzdálenost Hellingerů souvisí s Bhattacharyya koeficient jak to lze definovat jako
Hellingerovy vzdálenosti se používají v teorii sekvenční a asymptotické statistiky.[3][4]
Na druhou Hellingerova vzdálenost mezi dvěma normální distribuce a je:
Na druhou Hellingerova vzdálenost mezi dvěma vícerozměrné normální rozdělení a je
Na druhou Hellingerova vzdálenost mezi dvěma exponenciální distribuce a je:
Na druhou Hellingerova vzdálenost mezi dvěma Weibullovy distribuce a (kde je běžný tvarový parametr a jsou parametry měřítka):
Na druhou Hellingerova vzdálenost mezi dvěma Poissonovo rozdělení s parametry sazby a , aby a , je:
Na druhou Hellingerova vzdálenost mezi dvěma Beta distribuce a je:
kde je Funkce Beta.
Spojení s celkovou variační vzdáleností
Hellingerova vzdálenost a celková variační vzdálenost (nebo statistická vzdálenost) souvisí takto:[6]
Tyto nerovnosti vyplývají okamžitě z nerovností mezi 1-norma a 2-norma.
Viz také
- Statistická vzdálenost
- Kullback – Leiblerova divergence
- Bhattacharyya vzdálenost
- Celková variační vzdálenost
- Fisherova metrika informací
Poznámky
- ^ Nikulin, M.S. (2001) [1994], „Hellingerova vzdálenost“, Encyclopedia of Mathematics, Stiskněte EMS
- ^ Hellinger, Ernst (1909), „Neue Begründung der Theorie quadratischer Formen von unendlichvielen Veränderlichen“, Journal für die reine und angewandte Mathematik (v němčině), 136: 210–271, doi:10,1515 / crll.1909.136.210, JFM 40.0393.01
- ^ Torgerson, Erik (1991). "Porovnání statistických experimentů". Encyclopedia of Mathematics. 36. Cambridge University Press.
- ^ Liese, Friedrich; Miescke, Klaus-J. (2008). Teorie statistického rozhodování: Odhad, testování a výběr. Springer. ISBN 0-387-73193-8.
- ^ Pardo, L. (2006). Statistická inference založená na opatřeních divergence. New York: Chapman and Hall / CRC. str. 51. ISBN 1-58488-600-5.
- ^ Harsha, Prahladh (23. září 2011). „Přednášky o složitosti komunikace“ (PDF).
Reference
- Yang, Grace Lo; Le Cam, Lucien M. (2000). Asymptotika ve statistice: Některé základní pojmy. Berlín: Springer. ISBN 0-387-95036-2.
- Vaart, A. W. van der. Asymptotická statistika (Cambridge Series ve statistické a pravděpodobnostní matematice). Cambridge, Velká Británie: Cambridge University Press. ISBN 0-521-78450-6.
- Pollard, David E. (2002). Uživatelská příručka k měření teoretické pravděpodobnosti. Cambridge, Velká Británie: Cambridge University Press. ISBN 0-521-00289-3.