Wassersteinova metrika - Wasserstein metric
v matematika, Wassersteinova vzdálenost nebo Metrika Kantorovich – Rubinstein je funkce vzdálenosti definováno mezi rozdělení pravděpodobnosti na dané metrický prostor .
Intuitivně, pokud se na každou distribuci pohlíží jako na hromadné množství země (půdy) , metrika je minimální „cena“ přeměny jedné hromádky na druhou, o které se předpokládá, že je to množství Země, které je třeba přemístit krát střední vzdálenost, kterou je třeba přemístit. Kvůli této analogii je metrika známa v počítačová věda jako vzdálenost hybatelů Země.
Název „Wassersteinova vzdálenost“ vymyslel R. L. Dobrushin v roce 1970, po ruština matematik Leonid Vaseršteĭn kdo představil tento koncept v roce 1969. Most Angličtina -jazykové publikace používají Němec hláskování "Wasserstein" (připisováno jménu "Vaseršteĭn", které je z Němec původ).
Definice
Nechat být metrický prostor pro které je každé pravděpodobnostní měřítko zapnuto je Radonová míra (tzv Radonový prostor ). Pro , nechť označují soubor všech pravděpodobnostních opatření na s konečnou okamžik. Pak tam nějaké jsou v takové, že:
The Wassersteinova vzdálenost mezi dvěma měřítky pravděpodobnosti a v je definován jako
kde označuje sběr všech opatření na s marginální a na prvním a druhém faktoru. (Sada se také nazývá množina všech spojky z a .)
Výše uvedená vzdálenost je obvykle označena (obvykle mezi autory, kteří dávají přednost pravopisu "Wasserstein") nebo (obvykle mezi autory, kteří dávají přednost pravopisu „Vaserstein“). Ve zbývající části tohoto článku bude použito notace.
Wassersteinovu metriku lze ekvivalentně definovat pomocí
kde označuje očekávaná hodnota a náhodná proměnná a infimum převezme všechna společná rozdělení náhodných proměnných a s okraji a resp.
Intuice a spojení k optimální přepravě

Jedním ze způsobů, jak pochopit motivaci výše uvedené definice, je zvážit optimální dopravní problém. To znamená pro rozdělení hmoty na mezeru , chceme přenést hmotu takovým způsobem, aby byla přeměněna na distribuci ve stejném prostoru; transformace „hromady Země“ na hromadu . Tento problém má smysl pouze v případě, že hromada, která má být vytvořena, má stejnou hmotnost jako hromada, která má být přesunuta; proto bez ztráty obecnosti předpokládejme, že a jsou rozdělení pravděpodobnosti obsahující celkovou hmotnost 1. Předpokládejme také, že je dána nějaká nákladová funkce
což dává náklady na přepravu jednotkové hmoty z bodu do té míry Plán dopravy k přesunu do lze popsat funkcí což udává množství hmoty, ze které se lze pohybovat na . Úkol si můžete představit jako nutnost přemístit hromadu hlíny tvaru do díry v zemi tvaru tak, že na konci hromada země i díra v zemi úplně zmizí. Aby měl tento plán smysl, musí splňovat následující vlastnosti
To znamená, že se celková hmota pohnula mimo nekonečně malá oblast kolem musí se rovnat a celková hmotnost se pohnula do oblast kolem musí být . To odpovídá požadavku, že být společné rozdělení pravděpodobnosti s okraji a . To znamená, že nekonečně malá hmota transportována z na je a náklady na stěhování jsou , v návaznosti na definici nákladové funkce. Proto celkové náklady na plán dopravy je
Plán není jedinečný; optimální plán dopravy je plán s minimálními náklady ze všech možných plánů dopravy. Jak již bylo zmíněno, podmínkou platnosti plánu je to, že se jedná o společnou distribuci s marginálními částkami a ; pronájem označit soubor všech takových opatření, jako v první části, náklady na optimální plán je
Pokud je cena pohybu jednoduše vzdálenost mezi dvěma body, pak je optimální cena shodná s definicí vzdálenost.
Příklady
Bodové hmoty (degenerované distribuce)
Nechat a být dva zdegenerované distribuce (tj. Dirac delta distribuce ) umístěný v bodech a v . Existuje pouze jedna možná spojka těchto dvou měr, jmenovitě bodová hmotnost nachází se na . Tedy pomocí obvyklých absolutní hodnota funkce zapnutá funkce vzdálenosti , pro všechny , -Wassersteinova vzdálenost mezi a je
Podobným uvažováním, pokud a jsou bodové hmoty umístěné v bodech a v a používáme obvyklé Euklidovská norma na jako funkci vzdálenosti pak
Normální rozdělení
Nechat a být dva nedegenerovaní Gaussovy míry (tj. normální distribuce ) zapnuto , s příslušnými očekávané hodnoty a a symetrický kladný polořadový kovarianční matice a . Pak,[1] s ohledem na obvyklou euklidovskou normu dne , 2-Wassersteinova vzdálenost mezi a je
Tento výsledek zobecňuje dřívější příklad Wassersteinovy vzdálenosti mezi dvěma bodovými hmotami (alespoň v případě ), protože bodovou hmotu lze považovat za normální rozdělení s kovarianční maticí rovnou nule, v tom případě stopa termín zmizí a zůstane pouze člen zahrnující euklidovskou vzdálenost mezi prostředky.
Aplikace
Wassersteinova metrika je přirozeným způsobem, jak porovnat rozdělení pravděpodobnosti dvou proměnných X a Y, kde je jedna proměnná odvozena od druhé malou, nejednotnou odchylkou (náhodnou nebo deterministickou).
Například v informatice metrické Ž1 je široce používán k porovnání diskrétních distribucí, např. the barevné histogramy ze dvou digitální obrázky; vidět vzdálenost hybatelů Země Více podrobností.
Ve svém příspěvku „Wasserstein GAN“ Arjovsky et al.[2] použít metriku Wasserstein-1 jako způsob, jak zlepšit původní rámec Generativní Adversarial Networks (GAN), zmírnit mizející přechod a problémy se zhroucením režimu.
Wassersteinova metrika má formální souvislost s Analýza prokrustů, s aplikací na opatření chirality [3]a tvarovou analýzu [4].
Vlastnosti
Metrická struktura
To lze ukázat Žp vyhovuje všem axiomy a metrický na Pp(M). Dále konvergence s ohledem na Žp je ekvivalentní obvyklému slabá konvergence opatření plus konvergence prvního pth okamžiky.[5]
Duální zastoupení Ž1
—Následující dvojí znázornění Ž1 je speciální případ věty o dualitě Kantorovich a Rubinstein (1958): kdy μ a ν mít ohraničený Podpěra, podpora,
kde Lip (F) označuje minimální Lipschitzova konstanta pro F.
Porovnejte to s definicí Radonová metrika:
Pokud je metrika d je omezena nějakou konstantou C, pak
a tak konvergence v radonové metrice (shodná s celková variační konvergence když M je Polský prostor ) implikuje konvergenci v Wassersteinově metrice, ale ne naopak.
Rovnocennost Ž2 a Sobolevova norma záporného řádu
Za vhodných předpokladů Wassersteinova vzdálenost druhého řádu je Lipschitz ekvivalentní s homogenem záporného řádu Sobolevova norma.[6] Přesněji řečeno, pokud vezmeme být a připojeno Riemannovo potrubí vybaveno kladným měřítkem , pak můžeme definovat pro seminář
a pro podepsané opatření na dvojí norma
Pak jakákoli dvě pravděpodobnostní opatření a na uspokojit horní hranici
V opačném směru, pokud a každý má hustotu vzhledem k standardní měření objemu na které jsou nad některými omezeny , a má nezáporné Ricciho zakřivení, pak
Oddělitelnost a úplnost
Pro všechny p ≥ 1, metrický prostor (Pp(M), Žp) je oddělitelný, a je kompletní pokud (M, d) je oddělitelný a úplný.[7]
Viz také
- Lévyho metrika
- Lévy – Prochorovova metrika
- Celková variační vzdálenost pravděpodobnostních opatření
- Teorie dopravy
- Vzdálenost pohybujícího se Země
![]() | Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.Červenec 2012) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Reference
- ^ Olkin, I. a Pukelsheim, F. (1982). "Vzdálenost mezi dvěma náhodnými vektory s danými rozptylovými maticemi". Aplikace lineární algebry. 48: 257–263. doi:10.1016/0024-3795(82)90112-4. ISSN 0024-3795.CS1 maint: více jmen: seznam autorů (odkaz)
- ^ Arjovski (2017). "Wasserstein Generative Adversarial Networks". ICML.
- ^ Petitjean, M. (2002). "Chirální směsi" (PDF). Journal of Mathematical Physics. 43 (8): 4147–4157. doi:10.1063/1.1484559.
- ^ Petitjean, M. (2004). "Od podobnosti tvaru k doplňkovosti tvaru: směrem k dokovací teorii". Journal of Mathematical Chemistry. 35 (3): 147–158. doi:10.1023 / B: JOMC.0000033252.59423.6b. S2CID 121320315.
- ^ Clement, Philippe; Desch, Wolfgang (2008). „Elementární důkaz nerovnosti trojúhelníku pro Wassersteinovu metriku“. Proceedings of the American Mathematical Society. 136 (1): 333–339. doi:10.1090 / S0002-9939-07-09020-X.
- ^ Peyre, Rémi (2018). "Srovnání mezi Ž2 vzdálenost a Ḣ−1 norma a lokalizace vzdálenosti Wasserstein. Optimalizace řízení ESAIM. Calc. Var. 24 (4): 1489–1501. doi:10.1051 / cocv / 2017050. ISSN 1292-8119. (Viz věty 2.1 a 2.5.)
- ^ Bogachev, V.I .; Kolesnikov, A.V. (2012). „Monge-Kantorovichův problém: úspěchy, souvislosti a perspektivy“. Ruská matematika. Průzkumy. 67 (5): 785–890. doi:10.1070 / RM2012v067n05ABEH004808.
- Villani, Cédric (2008). Optimální doprava, stará i nová. Springer. ISBN 978-3-540-71050-9.
- Ambrosio, L., Gigli, N. & Savaré, G. (2005). Toky gradientu v metrických prostorech a v prostoru pravděpodobnostních opatření. Basilej: ETH Zürich, Birkhäuser Verlag. ISBN 3-7643-2428-7.CS1 maint: více jmen: seznam autorů (odkaz)
- Jordan, Richard; Kinderlehrer, David; Otto, Felixe (1998). "Variační formulace Fokker-Planckovy rovnice". SIAM J. Math. Anální. 29 (1): 1–17 (elektronický). CiteSeerX 10.1.1.6.8815. doi:10.1137 / S0036141096303359. ISSN 0036-1410. PAN 1617171.
- Rüschendorf, L. (2001) [1994], „Wassersteinova metrika“, Encyclopedia of Mathematics, Stiskněte EMS