Nerovnost Dvoretzky – Kiefer – Wolfowitz - Dvoretzky–Kiefer–Wolfowitz inequality

V teorii pravděpodobnost a statistika, Nerovnost Dvoretzky – Kiefer – Wolfowitz hranice, jak blízko empiricky určená distribuční funkce bude na distribuční funkce ze kterých jsou čerpány empirické vzorky. Je pojmenován po Aryeh Dvoretzky, Jack Kiefer, a Jacob Wolfowitz, který v roce 1956 prokázal nerovnost nespecifikovanou multiplikativní konstantouC před exponentem na pravé straně.[1] V roce 1990 Pascal Massart dokázala nerovnost s ostrou konstantou C = 2,[2] potvrzení domněnky kvůli Birnbaum a McCarty.[3]
Nerovnost DKW
Vzhledem k přirozenému číslu n, nechť X1, X2, …, Xn mít skutečnou hodnotu nezávislé a identicky distribuované náhodné proměnné s kumulativní distribuční funkce F(·). Nechat Fn označit přidružené empirická distribuční funkce definován
Tak je pravděpodobnost že a singl náhodná proměnná je menší než , a je zlomek náhodných proměnných, které jsou menší než .
Nerovnost Dvoretzky – Kiefer – Wolfowitz omezuje pravděpodobnost, že náhodná funkce Fn se liší od F o více než danou konstantu ε > 0 kdekoli na skutečné lince. Přesněji řečeno, existuje jednostranný odhad
což také znamená oboustranný odhad[4]
To posiluje Glivenkova – Cantelliho věta vyčíslením rychlost konvergence tak jako n inklinuje k nekonečnu. Rovněž odhaduje pravděpodobnost ocasu Statistika Kolmogorov – Smirnov. Výše uvedené nerovnosti vyplývají z případu, kdy F odpovídá rovnoměrné rozdělení dne [0,1] s ohledem na skutečnost[5]že Fn má stejné distribuce jako Gn(F) kde Gn je empirické rozděleníU1, U2, …, Un kde jsou nezávislé a jednotné (0,1), a upozorňujeme na to
s rovností právě tehdy F je spojitý.
Budování pásem CDF
Nerovnost Dvoretzky – Kiefer – Wolfowitz je jednou z metod pro vytváření hranic spolehlivosti založených na CDF a produkci pásmo spolehlivosti. Účelem tohoto intervalu spolehlivosti je obsáhnout celý CDF na zadané úrovni spolehlivosti, zatímco alternativní přístupy se pokoušejí dosáhnout úrovně spolehlivosti pouze v každém jednotlivém bodě, což umožňuje přísnější vazbu. Hranice DKW běží paralelně s empirickým CDF a je rovnoměrně nad i pod ním. Rovnoměrně rozmístěný interval spolehlivosti kolem empirického CDF umožňuje různé míry porušení přes podporu distribuce. Zejména je častější, že CDF je mimo vázaný CDF odhadovaný pomocí nerovnosti DKW blízko mediánu distribuce než blízko koncových bodů distribuce.
Interval, který obsahuje skutečný CDF, , s pravděpodobností je často specifikováno jako
Viz také
- Koncentrační nerovnost - souhrn hranic na sadách náhodných proměnných.
Reference
- ^ Dvoretzky, A.; Kiefer, J.; Wolfowitz, J. (1956), "Asymptotický charakter minimaxu funkce distribuce vzorku a klasického multinomálního odhadce", Annals of Mathematical Statistics, 27 (3): 642–669, doi:10.1214 / aoms / 1177728174, PAN 0083864
- ^ Massart, P. (1990), „Těsná konstanta v nerovnosti Dvoretzky – Kiefer – Wolfowitz“, Annals of Probability, 18 (3): 1269–1283, doi:10.1214 / aop / 1176990746, PAN 1062069
- ^ Birnbaum, Z. W .; McCarty, R. C. (1958). „Horní distribuce bez spolehlivosti vázaná na Pr {Y
. Annals of Mathematical Statistics. 29: 558–562. doi:10.1214 / aoms / 1177706631. PAN 0093874. Zbl 0087.34002. - ^ Kosorok, M. R. (2008), „Kapitola 11: Další výsledky empirických procesů“, Úvod do empirických procesů a semiparametrické inference, Springer, str. 210, ISBN 9780387749778
- ^ Shorack, G. R.; Wellner, J.A. (1986), Empirické procesy s aplikacemi pro statistikuWiley, ISBN 0-471-86725-X