Pinskersova nerovnost - Pinskers inequality - Wikipedia
v teorie informace, Pinskerova nerovnost, pojmenovaný po svém vynálezci Mark Semenovich Pinsker, je nerovnost který ohraničuje celková variační vzdálenost (nebo statistická vzdálenost) z hlediska Kullback – Leiblerova divergence Nerovnost je omezena stálými faktory.[1]
Formální prohlášení
Pinskerova nerovnost uvádí, že pokud a jsou dva rozdělení pravděpodobnosti na měřitelný prostor , pak
kde
je celková variační vzdálenost (nebo statistická vzdálenost) mezi a a
je Kullback – Leiblerova divergence v nats. Když ukázkový prostor je konečná množina, Kullback – Leiblerova divergence je dána vztahem
Všimněte si, že pokud jde o celková variační norma z podepsané opatření , Pinskerova nerovnost se liší od výše uvedené dvěma faktorem:
Důkaz Pinskerovy nerovnosti používá nerovnost oddílů pro F-rozdíly.
Dějiny
Pinsker nejprve dokázal nerovnost horší konstantou. Nerovnost ve výše uvedené formě byla nezávisle prokázána Kullback, Csiszár, a Kemperman.[2]
Inverzní problém
Přesná inverze nerovnosti nemůže platit: pro každého existují distribuce s ale . Snadný příklad je dán dvoubodovým prostorem s a . [3]
Na konečných prostorech však platí inverzní nerovnost s konstantou v závislosti na .[4] Přesněji lze ukázat, že s definicí máme pro každé opatření což je naprosto kontinuální
V důsledku toho, pokud má plný Podpěra, podpora (tj. pro všechny ), pak
Reference
- ^ Csiszár, Imre; Körner, János (2011). Informační teorie: Věty o kódování pro diskrétní systémy bez paměti. Cambridge University Press. str. 44. ISBN 9781139499989.
- ^ Tsybakov, Alexandre (2009). Úvod do neparametrického odhadu. Springer. str.132. ISBN 9780387790527.
- ^ Divergence se stává nekonečnou, kdykoli jedna ze dvou distribucí přiřadí události nulu pravděpodobnosti, zatímco druhá jí přiřadí nenulovou pravděpodobnost (bez ohledu na to, jak malá); viz např. Basu, Mitra; Ho, Tin Kam (2006). Složitost dat v rozpoznávání vzorů. Springer. str. 161. ISBN 9781846281723..
- ^ viz Lemma 4.1 v Götze, Friedrich; Sambale, Holger; Sinulis, Arthur. "Koncentrace vyššího řádu pro funkce slabě závislých náhodných proměnných". arXiv:1801.06348.
Další čtení
- Thomas M. Cover a Joy A. Thomas: Základy teorie informace, 2. vydání, Willey-Interscience, 2006
- Nicolo Cesa-Bianchi a Gábor Lugosi: Predikce, učení a hry, Cambridge University Press, 2006