Čebyševova nerovnost - Chebyshevs inequality - Wikipedia
v teorie pravděpodobnosti, Čebyševova nerovnost (nazývané také Nerovnost Bienaymé – Čebyšev) zaručuje, že pro širokou třídu rozdělení pravděpodobnosti, ne více než určitý zlomek hodnot může být více než určitá vzdálenost od znamenat. Konkrétně ne více než 1 /k2 hodnot distribuce může být více než k standardní odchylky mimo průměr (nebo ekvivalentně alespoň 1 - 1 /k2 hodnot distribuce je uvnitř k směrodatné odchylky průměru). Pravidlo se ve statistikách často nazývá Čebyševova věta o rozsahu standardních odchylek kolem průměru. Nerovnost má velkou užitečnost, protože ji lze použít na jakékoli rozdělení pravděpodobnosti, ve kterém jsou definovány průměr a rozptyl. Lze jej například použít k prokázání slabý zákon velkého počtu.
V praktickém použití, na rozdíl od Pravidlo 68–95–99,7, který se vztahuje na normální distribuce Čebyševova nerovnost je slabší s tím, že minimálně pouhých 75% hodnot musí ležet ve dvou standardních odchylkách od průměru a 88,89% ve třech standardních odchylkách.[1][2]
Termín Čebyševova nerovnost může také odkazovat na Markovova nerovnost, zejména v kontextu analýzy. Jsou úzce spjaty a někteří autoři na ně odkazují Markovova nerovnost jako „Čebyševova první nerovnost“ a obdobný se na této stránce označuje jako „Čebyševova druhá nerovnost“.
Dějiny
Věta je pojmenována po ruském matematikovi Pafnuty Čebyšev, ačkoli to nejprve formuloval jeho přítel a kolega Irénée-Jules Bienaymé.[3]:98 Věta byla poprvé uvedena bez důkazu Bienaymé v roce 1853[4] a později prokázal Čebyšev v roce 1867.[5] Jeho student Andrey Markov poskytl další důkaz ve svém 1884 Ph.D. teze.[6]
Prohlášení
Čebyševova nerovnost se obvykle uvádí pro náhodné proměnné, ale lze jej zobecnit na prohlášení o změřte mezery.
Pravděpodobnostní tvrzení
Nechat X (integrovatelný) být a náhodná proměnná s konečnou očekávaná hodnota μ a konečná nenulová rozptyl σ2. Pak pro všechny reálné číslo k > 0,
Pouze případ je užitečné. Když pravá strana a nerovnost je triviální, protože všechny pravděpodobnosti jsou ≤ 1.
Jako příklad použití ukazuje, že pravděpodobnost, že hodnoty leží mimo interval nepřesahuje .
Protože to může být aplikováno na zcela libovolné distribuce za předpokladu, že mají známou konečnou střední hodnotu a rozptyl, nerovnost obecně dává špatnou vazbu ve srovnání s tím, co by bylo možné odvodit, pokud je známo více aspektů o dané distribuci.
k | Min. % v rámci k Standard odchylky průměru | Max. % mimo k Standard odchylky od střední hodnoty |
---|---|---|
1 | 0% | 100% |
√2 | 50% | 50% |
1.5 | 55.56% | 44.44% |
2 | 75% | 25% |
2√2 | 87.5% | 12.5% |
3 | 88.8889% | 11.1111% |
4 | 93.75% | 6.25% |
5 | 96% | 4% |
6 | 97.2222% | 2.7778% |
7 | 97.9592% | 2.0408% |
8 | 98.4375% | 1.5625% |
9 | 98.7654% | 1.2346% |
10 | 99% | 1% |
Míra-teoretický výrok
Nechť (X, Σ, μ) být a změřte prostor a nechte F být rozšířené skutečné -hodnota měřitelná funkce definováno dne X. Pak pro jakékoli reálné číslo t > 0 a 0 < p < ∞,[7]
Obecněji, pokud G je rozšířená měřitelná funkce se skutečnou hodnotou, tedy nezáporná a neklesající[Citace je zapotřebí ]
Předchozí výrok poté následuje definováním tak jako -li a v opačném případě.
Příklad
Předpokládejme, že náhodně vybereme článek v časopise ze zdroje s průměrem 1 000 slov na článek se standardní odchylkou 200 slov. Potom můžeme odvodit, že pravděpodobnost, že má mezi 600 a 1400 slovy (tj. Uvnitř k = 2 standardní odchylky průměru) musí být alespoň 75%, protože tam není více než 1⁄k2
= 1/4 šance být mimo tento rozsah Čebyševovou nerovností. Pokud ale navíc víme, že distribuce je normální, můžeme říci, že existuje 75% šance, že počet slov je mezi 770 a 1230 (což je ještě přísnější hranice).
Ostrost hranic
Jak ukazuje výše uvedený příklad, věta obvykle poskytuje poměrně volné hranice. Tyto hranice však nelze obecně (zůstávají pravdivé pro libovolné distribuce) vylepšit. Hranice jsou ostré pro následující příklad: pro libovolný k ≥ 1,
Pro toto rozdělení průměr μ = 0 a směrodatná odchylka σ = 1/k, tak
Čebyševova nerovnost je rovností přesně pro ta rozdělení, která jsou a lineární transformace tohoto příkladu.
Důkaz (oboustranné verze)
Pravděpodobnostní důkaz
Markovova nerovnost uvádí, že pro libovolnou náhodnou proměnnou se skutečnou hodnotou Y a jakékoli kladné číslo A, máme Pr (|Y| > A) ≤ E (|Y|)/A. Jedním ze způsobů, jak dokázat Čebyševovu nerovnost, je použít Markovovu nerovnost na náhodnou proměnnou Y = (X − μ)2 s A = (kσ)2.
Lze to také prokázat přímo pomocí podmíněné očekávání:
Následuje Čebyševova nerovnost dělením k2σ2.
Tento důkaz také ukazuje, proč jsou hranice v typických případech poměrně volné: podmíněné očekávání u události, kde |X-μ|<σ je vyhozen a spodní hranice k2σ2 na akci |X-μ|≥k 'σ může být docela špatná.
Teoretický důkaz míry
Opravit a nechte být definován jako a nechte být funkce indikátoru sady. Pak je snadné to zkontrolovat ,
od té doby G neklesá, a proto
kde poslední nerovnost je odůvodněna nezáporností GPožadovaná nerovnost vyplývá z dělení výše uvedené nerovnostiG(t).
Důkaz za předpokladu, že náhodná proměnná X je spojitá
Pomocí definic funkce hustoty pravděpodobnosti f (x) a rozptyl Var (X):
my máme:
Výměna kσ s ε, kde k=ε/ σ, máme další formu Čebyševovy nerovnosti:
nebo ekvivalent
kde ε je definován stejným způsobem jako k; jakékoli kladné reálné číslo.
Rozšíření
Bylo vyvinuto několik rozšíření Čebyševovy nerovnosti.
Asymetrický oboustranný
Li X má znamenat μ a rozptyl σ2, pak
To se sníží na Čebyševovu nerovnost v symetrickém případě (l a u ve stejné vzdálenosti od průměru).
Bivariate generalizace
Nechat X1, X2 být dvě náhodné proměnné s prostředky μ1, μ2 a konečné odchylky σ1, σ2 resp. Pak odborově vázán ukázat to
Tato vazba nevyžaduje X1 a X2 nezávislý.[9]
Bivariate, známá korelace
Berge odvodil nerovnost pro dvě korelované proměnné X1, X2.[10] Nechat ρ být korelačním koeficientem mezi X1 a X2 a nechte σi2 být rozptyl Xi. Pak
Lal později získal alternativní vazbu[11]
Isii odvodil další zevšeobecnění.[12] Nechat
a definovat:
Nyní existují tři případy.
- Případ A: Li a pak
- Případ B: Pokud nejsou splněny podmínky v případě A, ale k1k2 ≥ 1 a
- pak
- Případ C: Pokud není splněna žádná z podmínek v případech A nebo B, pak neexistuje žádná univerzální vazba jiná než 1.
Vícerozměrný
Obecný případ je známý jako Birnbaum – Raymond – Zuckermanova nerovnost podle autorů, kteří to dokázali pro dvě dimenze.[13]
kde Xi je i-tá náhodná proměnná, μi je i- znamená a σi2 je i-tá varianta.
Pokud jsou proměnné nezávislé, lze tuto nerovnost zostřit.[14]
Olkin a Pratt odvodili nerovnost pro n korelované proměnné.[15]
kde je součet převzat n proměnné a
kde ρij je korelace mezi Xi a Xj.
Nerovnost Olkina a Pratta byla Godwinem následně zobecněna.[16]
Konečně-dimenzionální vektor
Ferentinos[9] ukázal, že pro a vektor X = (X1, X2, ...) s průměrem μ = (μ1, μ2, ...), standardní odchylka σ = (σ1, σ2, ...) a euklidovská norma || ⋅ || že
Chen také odvodil druhou související nerovnost.[17] Nechat n být dimenze stochastického vektoru X a nechte E(X) být průměrem X. Nechat S být kovarianční matice a k > 0. Pak
kde YT je přemístit z Y. Jednoduchý důkaz byl získán v Navarru[18] jak následuje:
kde
a je symetrická invertibilní matice taková, že: . Proto a kde představuje matici identity dimenzen. Pak a
Nakonec přihlášením Markovova nerovnost do Z dostaneme
a tak platí požadovaná nerovnost.
Nerovnost lze zapsat pomocí Mahalanobisova vzdálenost tak jako
kde Mahalanobisova vzdálenost založená na S je definována vztahem
Navarro[19] dokázal, že tyto hranice jsou ostré, to znamená, že jsou nejlepšími možnými hranicemi pro tyto oblasti, když známe pouze střední hodnotu a kovarianční matici X.
Stellato a kol.[20] ukázal, že tuto vícerozměrnou verzi Čebyševovy nerovnosti lze snadno analyticky odvodit jako speciální případ Vandenberghe et al.[21] kde je vazba vypočítána řešením a semidefinitní program (SDP).
Nekonečné rozměry
Existuje přímé rozšíření vektorové verze Čebyševovy nerovnosti na nekonečné dimenzionální nastavení. Nechat X být náhodná proměnná, která bere hodnoty v a Fréchetový prostor (vybavené semináři || ⋅ ||α). To zahrnuje nejběžnější nastavení vektorových náhodných proměnných, např. Kdy je Banachův prostor (vybavené jedinou normou), a Hilbertův prostor, nebo konečně-rozměrné nastavení, jak je popsáno výše.
Předpokládejme to X je „silný řád dva ", znamenající, že
pro každý seminář || ⋅ ||α. Jedná se o zobecnění požadavku, že X mají konečnou rozptyl a jsou nezbytné pro tuto silnou formu Čebyševovy nerovnosti v nekonečných dimenzích. Terminologie „silný řád dva“ má být Vachania.[22]
Nechat být Pettisův integrál z X (tj. vektorová zobecnění průměru), a let
být standardní odchylkou s ohledem na seminář || ⋅ ||α. V tomto nastavení můžeme uvést následující:
- Obecná verze Čebyševovy nerovnosti.
Důkaz. Důkaz je přímý a v zásadě stejný jako konečná verze. Li σα = 0, pak X je konstantní (a rovno μ) téměř jistě, takže nerovnost je triviální.
Li
pak ||X − μ||α > 0, takže můžeme bezpečně rozdělit ||X − μ||α. Zásadním trikem v Čebyševově nerovnosti je rozpoznat to .
Následující výpočty doplňují důkaz:
Vyšší okamžiky
Možné je i rozšíření na vyšší momenty:
Exponenciální moment
Související nerovnost někdy známá jako exponenciální Čebyševova nerovnost[23] je nerovnost
Nechat K.(t) být funkce generující kumulant,
Užívání Legendre – Fenchelova transformace[je zapotřebí objasnění ] z K.(t) a pomocí exponenciální Čebyševovy nerovnosti máme
Tuto nerovnost lze použít k získání exponenciálních nerovností pro neomezené proměnné.[24]
Ohraničené proměnné
Pokud P (X) má konečnou podporu založenou na intervalu [A, b], nechť M = max (|A|, |b|) kde |X| je absolutní hodnota z X. Pokud je průměr P (X) je nula pak pro všechny k > 0[25]
Druhá z těchto nerovností s r = 2 je vázán Čebyševem. První poskytuje dolní mez pro hodnotu P (X).
Niemitalo navrhl ostré hranice pro ohraničenou variantu, ale bez důkazu[26]
Nechat 0 ≤ X ≤ M kde M > 0. Pak
- Případ 1:
- Případ 2:
- Případ 3:
Konečné vzorky
Jednorozměrný případ
Viděl et al rozšířil Čebyševovu nerovnost na případy, kdy průměr a rozptyl populace nejsou známy a nemusí existovat, ale výběrový průměr a standardní odchylka od N vzorky se použijí k navázání očekávané hodnoty nového výkresu ze stejné distribuce.[27]
kde X je náhodná proměnná, kterou jsme vzorkovali N časy, m je průměr vzorku, k je konstanta a s je standardní směrodatná odchylka. G(X) je definován takto:
Nechat X ≥ 1, Q = N + 1 a R být největší celé číslo menší než Q/X. Nechat
Nyní
Tato nerovnost platí, i když momenty populace neexistují a když je vzorek pouze slabě zaměnitelně distribuováno; toto kritérium je splněno pro náhodný výběr vzorků. Tabulka hodnot pro nerovnost Saw – Yang – Mo pro konečné velikosti vzorků (N <100) určil Konijn.[28] Tabulka umožňuje výpočet různých intervalů spolehlivosti pro průměr na základě násobků C standardní chyby průměru vypočtené ze vzorku. Například Konijn to ukazuje pro N = 59, 95% interval spolehlivosti pro průměr m je (m − Čs, m + Čs) kde C = 4.447 × 1.006 = 4.47 (to je 2,28krát větší než hodnota zjištěná za předpokladu normality ukazující ztrátu přesnosti vyplývající z neznalosti přesné povahy distribuce).
Kabán uvádí poněkud méně složitou verzi této nerovnosti.[29]
Pokud je směrodatná odchylka násobkem střední hodnoty, lze odvodit další nerovnost,[29]
Tabulka hodnot pro nerovnost Saw – Yang – Mo pro konečné velikosti vzorků (N <100) určil Konijn.[28]
Pro pevné N a velké m nerovnost Saw – Yang – Mo je přibližně[30]
Beasley et al navrhli úpravu této nerovnosti[30]
V empirickém testování je tato modifikace konzervativní, ale zdá se, že má nízkou statistickou sílu. Jeho teoretický základ v současné době zůstává neprozkoumaný.
Závislost na velikosti vzorku
Hranice, které tyto nerovnosti dávají na konečný vzorek, jsou méně těsné než ty, které dává Čebyševova nerovnost pro rozdělení. Pro ilustraci nechte velikost vzorku N = 100 a nechat k = 3. Čebyševova nerovnost uvádí, že nanejvýš přibližně 11,11% rozdělení bude ležet nejméně tři standardní odchylky od průměru. Kabánova verze nerovnosti pro konečný vzorek uvádí, že maximálně přibližně 12,05% vzorku leží mimo tyto limity. Závislost intervalů spolehlivosti na velikosti vzorku je dále ilustrována níže.
Pro N = 10, 95% interval spolehlivosti je přibližně ± 13 578 směrodatných odchylek.
Pro N = 100 je 95% interval spolehlivosti přibližně ± 4,9595 standardní odchylky; 99% interval spolehlivosti je přibližně ± 140,0 směrodatných odchylek.
Pro N = 500 je 95% interval spolehlivosti přibližně ± 4,5574 směrodatných odchylek; 99% interval spolehlivosti je přibližně ± 11,1620 směrodatných odchylek.
Pro N = 1000 jsou 95% a 99% intervaly spolehlivosti přibližně ± 4,5141 a přibližně ± 10,5330 směrodatných odchylek.
Čebyševova nerovnost pro distribuci dává 95% a 99% intervaly spolehlivosti přibližně ± 4,472 směrodatných odchylek a ± 10 směrodatných odchylek.
Samuelsonova nerovnost
Ačkoli Čebyševova nerovnost je nejlepším možným prostředkem pro libovolné rozdělení, u konečných vzorků to nemusí nutně platit. Samuelsonova nerovnost uvádí, že všechny hodnoty vzorku budou ležet uvnitř √N − 1 směrodatné odchylky průměru. Čebyševova vazba se zlepšuje s rostoucí velikostí vzorku.
Když N = 10, Samuelsonova nerovnost uvádí, že všichni členové vzorku leží v rozmezí 3 standardních odchylek od průměru: na rozdíl od Čebyševových států, že 99,5% vzorku leží v rozmezí 13 578 standardních odchylek od průměru.
Když N = 100, Samuelsonova nerovnost uvádí, že všichni členové vzorku leží v rozmezí přibližně 9,9499 směrodatných odchylek od průměru: Čebyšev tvrdí, že 99% vzorku leží v rozmezí 10 směrodatných odchylek od průměru.
Když N = 500, Samuelsonova nerovnost uvádí, že všichni členové vzorku leží v rozmezí přibližně 22 3383 standardních odchylek od průměru: Čebyšev tvrdí, že 99% vzorku leží v rozmezí 10 standardních odchylek od průměru.
Vícerozměrný případ
Stellato a kol.[20] zjednodušil notaci a rozšířil empirickou Čebyševovu nerovnost od Saw et al.[27] na vícerozměrný případ. Nechat být náhodná proměnná a nechat . Kreslíme iid vzorky označeno jako . Na základě prvního vzorky, definujeme empirický průměr jako a nezaujatá empirická kovariance jako . Li je nesmyslná, tedy pro všechny pak
Poznámky
V jednorozměrném případě, tj. , tato nerovnost odpovídá té od Saw et al.[27] Pravou stranu lze navíc zjednodušit pomocí horního ohraničení funkce podlahy jejím argumentem
Tak jako , má pravá strana sklon což odpovídá vícerozměrná Čebyševova nerovnost přes elipsoidy ve tvaru podle a centrováno dovnitř .
Naostřené hranice
Čebyševova nerovnost je důležitá z důvodu její použitelnosti pro jakoukoli distribuci. V důsledku své obecnosti nemusí (a obvykle neposkytuje) tak ostrou vazbu jako alternativní metody, které lze použít, pokud je známo rozdělení náhodné proměnné. Pro zlepšení ostrosti hranic poskytovaných Čebyševovou nerovností byla vyvinuta řada metod; pro kontrolu viz např.[31]
Standardizované proměnné
Zaostřené hranice lze odvodit nejprve standardizováním náhodné proměnné.[32]
Nechat X být náhodná proměnná s konečnou odchylkou Var (X). Nechat Z být standardizovaný formulář definovaný jako
Cantelliho lemma je tedy
Tato nerovnost je ostrá a je jí dosaženo k a -1 /k s pravděpodobností 1 / (1 +k2) a k2/(1 + k2).
Li k > 1 a distribuce X je symetrický, pak máme
Rovnost platí tehdy a jen tehdy Z = −k, 0 nebo k s pravděpodobnostmi 1 / 2 k2, 1 − 1 / k2 a 1 / 2 k2 resp.[32]Možné je také rozšíření oboustranné nerovnosti.
Nechat u, proti > 0. Pak máme[32]
Semivariancie
Alternativní metodou získání ostřejších mezí je použití semivariances (částečné odchylky). Horní (σ+2) a nižší (σ−2) semivarianty jsou definovány jako
kde m je aritmetický průměr vzorku a n je počet prvků ve vzorku.
Rozptyl vzorku je součtem dvou semivariancí:
Z hlediska nižší semivariance lze napsat Čebyševovu nerovnost[33]
Uvedení
Čebyševovu nerovnost lze nyní zapsat
Podobný výsledek lze odvodit i pro horní semivariaci.
Pokud dáme
Čebyševovu nerovnost lze napsat
Protože σu2 ≤ σ2, použití semivariance zostří původní nerovnost.
Pokud je známo, že distribuce je symetrická, pak
a
Tento výsledek souhlasí s výsledkem odvozeným pomocí standardizovaných proměnných.
- Poznámka
- Bylo zjištěno, že nerovnost s nižší semivariací je užitečná pro odhad rizika zpomalení ve financích a zemědělství.[33][34][35]
Selbergova nerovnost
Selberg odvodil nerovnost pro P(X) když A ≤ X ≤ b.[36] Pro zjednodušení zápisu nechte
kde
a
Výsledkem této lineární transformace je provést P(A ≤ X ≤ b) rovná P(|Y| ≤ k).
Průměr (μX) a rozptyl (σX) z X souvisí s průměrem (μY) a rozptyl (σY) z Y:
S touto notací to říká Selbergova nerovnost
Je známo, že jde o nejlepší možné hranice.[37]
Cantelliho nerovnost
Cantelliho nerovnost[38] kvůli Francesco Paolo Cantelli uvádí, že pro skutečnou náhodnou proměnnou (X) se střední hodnotou (μ) a rozptyl (σ2)
kde A ≥ 0.
Tuto nerovnost lze použít k prokázání jednostranné varianty Čebyševovy nerovnosti s k > 0[39]
O vázané variantě s jedním ocasem je známo, že je ostrá. Chcete-li to vidět, zvažte náhodnou proměnnou X který bere hodnoty
- s pravděpodobností
- s pravděpodobností
Pak E (X) = 0 a E (X2) = σ2 a P (X < 1) = 1 / (1 + σ2).
Aplikace - vzdálenost mezi průměrem a mediánem
Jednostrannou variantu lze použít k prokázání tvrzení, že pro rozdělení pravděpodobnosti mít očekávaná hodnota a a medián, průměr a medián se nikdy nemohou lišit od sebe více než jedním standardní odchylka. Abychom to vyjádřili symboly, μ, ν, a σ být průměr, medián a směrodatná odchylka. Pak
Není třeba předpokládat, že odchylka je konečná, protože tato nerovnost je triviálně pravdivá, pokud je odchylka nekonečná.
Důkaz je následující. Nastavení k = 1 ve výpisu pro jednostrannou nerovnost dává:
Změna znaménka X a ze dne μ, dostaneme
Medián je podle definice jakékoli skutečné číslom který uspokojuje nerovnosti
to znamená, že medián leží v rámci jedné standardní odchylky od průměru. Důkaz využívající také Jensenovu nerovnost existuje.
Bhattacharyyova nerovnost
Bhattacharyya[40] rozšířil Cantelliho nerovnost pomocí třetího a čtvrtého okamžiku distribuce.
Nechat μ = 0 a σ2 být rozptyl. Nechat y = E (X3)/σ3 a κ = E (X4)/σ4.
Li k2 − kγ - 1> 0 pak
Nutnost k2 − kγ - 1> 0 to vyžaduje k být přiměřeně velký.
Nerovnost Mitzenmachera a Upfala
Mitzenmacher a Upfal[41] Všimněte si, že
pro jakékoli celé číslo k > 0 a to
je 2kth centrální moment. Pak to ukazují pro t > 0
Pro k = 1 získáme Čebyševovu nerovnost. Pro t ≥ 1, k > 2 a za předpokladu, že kth v okamžiku, kdy je tato hranice pevnější než Čebyševova nerovnost.
Související nerovnosti
Je také známo několik dalších souvisejících nerovností.
Zelenova nerovnost
Zelen to ukázal[42]
s
kde Mm je m-tý okamžik[je zapotřebí objasnění ] a σ je směrodatná odchylka.
On, Zhang a Zhangova nerovnost
Pro jakoukoli sbírku n nezáporné nezávislé náhodné proměnné Xi s očekáváním 1 [43]
Hoeffdingovo lemma
Nechat X být náhodná proměnná s A ≤ X ≤ b a E[X] = 0, pak pro všechny s > 0, my máme
Van Zuijlen je vázán
Nechat Xi být soubor nezávislých Rademacherovy náhodné proměnné: Pr (Xi = 1) = Pr (Xi = −1) = 0.5. Pak[44]
Vazba je ostrá a lepší než ta, kterou lze odvodit z normálního rozdělení (přibližně Pr> 0,31).
Unimodální distribuce
Distribuční funkce F je unimodální v ν pokud je jeho kumulativní distribuční funkce konvexní zapnuto (−∞, ν) a konkávní na (ν,∞)[45] Empirické rozdělení lze testovat na unimodalitu pomocí dip test.[46]
V roce 1823 Gauss ukázal, že pro a unimodální distribuce s režimem nula[47]
If the mode is not zero and the mean (μ) a směrodatná odchylka (σ) are both finite, then denoting the median as ν and the root mean square deviation from the mode by ω, my máme[Citace je zapotřebí ]
a
Winkler in 1866 extended Gauss' inequality na rth momenty [48] kde r > 0 and the distribution is unimodal with a mode of zero:
Gauss' bound has been subsequently sharpened and extended to apply to departures from the mean rather than the mode due to the Vysochanskiï–Petunin inequality. The latter has been extended by Dharmadhikari and Joag-Dev[49]
kde s is a constant satisfying both s > r + 1 a s(s − r − 1) = rr ar > 0.
It can be shown that these inequalities are the best possible and that further sharpening of the bounds requires that additional restrictions be placed on the distributions.
Unimodal symmetrical distributions
The bounds on this inequality can also be sharpened if the distribution is both unimodální a symetrický.[50] An empirical distribution can be tested for symmetry with a number of tests including McWilliam's R*.[51] It is known that the variance of a unimodal symmetrical distribution with finite support [A, b] is less than or equal to ( b − A )2 / 12.[52]
Let the distribution be supported on the finite interval [ −N, N ] and the variance be finite. Nech režimu of the distribution be zero and rescale the variance to 1. Let k > 0 and assume k < 2N/3. Pak[50]
Pokud 0 < k ≤ 2 / √3 the bounds are reached with the density[50]
If 2 / √3 < k ≤ 2N / 3 the bounds are attained by the distribution
kde βk = 4 / 3k2, δ0 je Diracova delta funkce a kde
The existence of these densities shows that the bounds are optimal. Od té doby N is arbitrary these bounds apply to any value of N.
The Camp–Meidell's inequality is a related inequality.[53] For an absolutely continuous unimodal and symmetrical distribution
DasGupta has shown that if the distribution is known to be normal[54]
Poznámky
Effects of symmetry and unimodality
Symmetry of the distribution decreases the inequality's bounds by a factor of 2 while unimodality sharpens the bounds by a factor of 4/9.[Citace je zapotřebí ]
Because the mean and the mode in a unimodal distribution differ by at most √3 standardní odchylky[55] at most 5% of a symmetrical unimodal distribution lies outside (2√10 + 3√3)/3 standard deviations of the mean (approximately 3.840 standard deviations). This is sharper than the bounds provided by the Chebyshev inequality (approximately 4.472 standard deviations).
These bounds on the mean are less sharp than those that can be derived from symmetry of the distribution alone which shows that at most 5% of the distribution lies outside approximately 3.162 standard deviations of the mean. The Vysochanskiï–Petunin inequality further sharpens this bound by showing that for such a distribution that at most 5% of the distribution lies outside 4√5/3 (approximately 2.981) standard deviations of the mean.
Symmetrical unimodal distributions
For any symmetrical unimodal distribution[Citace je zapotřebí ]
- at most approximately 5.784% of the distribution lies outside 1.96 standard deviations of the mode
- at most 5% of the distribution lies outside 2√10/3 (approximately 2.11) standard deviations of the mode
Normální rozdělení
DasGupta's inequality states that for a normal distribution at least 95% lies within approximately 2.582 standard deviations of the mean. This is less sharp than the true figure (approximately 1.96 standard deviations of the mean).
Bounds for specific distributions
- DasGupta has determined a set of best possible bounds for a normální distribuce for this inequality.[54]
- Steliga and Szynal have extended these bounds to the Paretova distribuce.[8]
- Grechuk et.al. developed a general method for deriving the best possible bounds in Chebyshev's inequality for any family of distributions, and any míra rizika odchylky in place of standard deviation. In particular, they derived Chebyshev inequality for distributions with log-konkávní hustoty.[56]
Zero means
When the mean (μ) is zero Chebyshev's inequality takes a simple form. Nechat σ2 be the variance. Pak
With the same conditions Cantelli's inequality takes the form
Unit variance
If in addition E( X2 ) = 1 and E( X4 ) = ψ then for any 0 ≤ ε ≤ 1[57]
The first inequality is sharp. Toto je známé jako Paley – Zygmundova nerovnost.
It is also known that for a random variable obeying the above conditions that[58]
kde
Je také známo, že[58]
The value of C0 is optimal and the bounds are sharp if
Li
then the sharp bound is
Integral Chebyshev inequality
There is a second (less well known) inequality also named after Chebyshev[59]
Li F, G : [A, b] → R jsou dva monotóní funkce of the same monotonicity, then
Li F a G are of opposite monotonicity, then the above inequality works in the reverse way.
This inequality is related to Jensenova nerovnost,[60] Kantorovich's inequality,[61] the Nerovnost Hermit – Hadamard[61] a Walter's conjecture.[62]
Other inequalities
There are also a number of other inequalities associated with Chebyshev:
Haldane's transformation
One use of Chebyshev's inequality in applications is to create confidence intervals for variates with an unknown distribution. Haldane poznamenal,[63] using an equation derived by Kendall,[64] that if a variate (X) has a zero mean, unit variance and both finite šikmost (y) a špičatost (κ) then the variate can be converted to a normally distributed standardní skóre (z):
This transformation may be useful as an alternative to Chebyshev's inequality or as an adjunct to it for deriving confidence intervals for variates with unknown distributions.
While this transformation may be useful for moderately skewed and/or kurtotic distributions, it performs poorly when the distribution is markedly skewed and/or kurtotic.
Poznámky
The Agentura na ochranu životního prostředí has suggested best practices for the use of Chebyshev's inequality for estimating confidence intervals.[65] This caution appears to be justified as its use in this context may be seriously misleading.[66]
Viz také
- Vícerozměrná Čebyševova nerovnost
- Koncentrační nerovnost - souhrn zadních hranic náhodných proměnných.
- Cornish – Fisherova expanze
- Eatonova nerovnost
- Kolmogorovova nerovnost
- Proof of the weak law of large numbers using Chebyshev's inequality
- Le Camova věta
- Paley – Zygmundova nerovnost
- Vysochanskiï–Petunin inequality — a stronger result applicable to unimodal probability distributions
Reference
- ^ Kvanli, Alan H.; Pavur, Robert J.; Keeling, Kellie B. (2006). Concise Managerial Statistics. cEngage Learning. 81–82. ISBN 9780324223880.
- ^ Chernick, Michael R. (2011). The Essentials of Biostatistics for Physicians, Nurses, and Clinicians. John Wiley & Sons. str. 49–50. ISBN 9780470641859.
- ^ Knuth, Donald (1997). The Art of Computer Programming: Fundamental Algorithms, Volume 1 (3. vyd.). Reading, Massachusetts: Addison – Wesley. ISBN 978-0-201-89683-1. Citováno 1. října 2012.
- ^ Bienaymé, I.-J. (1853). "Considérations àl'appui de la découverte de Laplace". Komptuje Rendus de l'Académie des Sciences. 37: 309–324.
- ^ Tchebichef, P. (1867). "Des valeurs moyennes". Journal de Mathématiques Pures et Appliquées. 2. 12: 177–184.
- ^ Markov A. (1884) On certain applications of algebraic continued fractions, Ph.D. thesis, St. Petersburg
- ^ Grafakos, Lukas (2004). Classical and Modern Fourier Analysis. Pearson Education Inc. str. 5.
- ^ A b Steliga, Katarzyna; Szynal, Dominik (2010). "On Markov-Type Inequalities" (PDF). International Journal of Pure and Applied Mathematics. 58 (2): 137–152. ISSN 1311-8080. Citováno 10. října 2012.
- ^ A b Ferentinos, K (1982). "On Tchebycheff type inequalities". Trabajos Estadıst Investigacion Oper. 33: 125–132. doi:10.1007/BF02888707.
- ^ Berge, P. O. (1938). "A note on a form of Tchebycheff's theorem for two variables". Biometrika. 29 (3/4): 405–406. doi:10.2307/2332015. JSTOR 2332015.
- ^ Lal D. N. (1955) A note on a form of Tchebycheff's inequality for two or more variables. Sankhya 15(3):317–320
- ^ Isii K. (1959) On a method for generalizations of Tchebycheff's inequality. Ann Inst Stat Math 10: 65–88
- ^ Birnbaum, Z. W.; Raymond, J .; Zuckerman, H. S. (1947). "A Generalization of Tshebyshev's Inequality to Two Dimensions". Annals of Mathematical Statistics. 18 (1): 70–79. doi:10.1214/aoms/1177730493. ISSN 0003-4851. PAN 0019849. Zbl 0032.03402. Citováno 7. října 2012.
- ^ Kotz, Samuel; Balakrishnan, N.; Johnson, Norman L. (2000). Continuous Multivariate Distributions, Volume 1, Models and Applications (2. vyd.). Boston [USA]: Houghton Mifflin. ISBN 978-0-471-18387-7. Citováno 7. října 2012.
- ^ Olkin, Ingram; Pratt, John W. (1958). "A Multivariate Tchebycheff Inequality". Annals of Mathematical Statistics. 29 (1): 226–234. doi:10.1214/aoms/1177706720. PAN 0093865. Zbl 0085.35204.
- ^ Godwin H. J. (1964) Inequalities on distribution functions. New York, Hafner Pub. Co.
- ^ Xinjia Chen (2007). "A New Generalization of Chebyshev Inequality for Random Vectors". arXiv:0707.0805v2 [matematika ].
- ^ A b Stellato, Bartolomeo; Parys, Bart P. G. Van; Goulart, Paul J. (2016-05-31). "Multivariate Chebyshev Inequality with Estimated Mean and Variance". Americký statistik. 0 (ja): 123–127. arXiv:1509.08398. doi:10.1080/00031305.2016.1186559. ISSN 0003-1305.
- ^ Vandenberghe, L.; Boyd, S .; Comanor, K. (2007-01-01). "Generalized Chebyshev Bounds via Semidefinite Programming". Recenze SIAM. 49 (1): 52–64. Bibcode:2007SIAMR..49...52V. CiteSeerX 10.1.1.126.9105. doi:10.1137/S0036144504440543. ISSN 0036-1445.
- ^ Vakhania, Nikolai Nikolaevich. Probability distributions on linear spaces. New York: North Holland, 1981.
- ^ Section 2.1 Archivováno 30. Dubna 2015, na Wayback Machine
- ^ Baranoski, Gladimir V. G.; Rokne, Jon G.; Xu, Guangwu (15 May 2001). "Applying the exponential Chebyshev inequality to the nondeterministic computation of form factors". Journal of Quantitative Spectroscopy and Radiative Transfer. 69 (4): 199–200. Bibcode:2001JQSRT..69..447B. doi:10.1016/S0022-4073(00)00095-9. (the references for this article are corrected by Baranoski, Gladimir V. G.; Rokne, Jon G.; Guangwu Xu (15 January 2002). "Corrigendum to: 'Applying the exponential Chebyshev inequality to the nondeterministic computation of form factors'". Journal of Quantitative Spectroscopy and Radiative Transfer. 72 (2): 199–200. Bibcode:2002JQSRT..72..199B. doi:10.1016/S0022-4073(01)00171-6.)
- ^ Dufour (2003) Properties of moments of random variables
- ^ Niemitalo O. (2012) One-sided Chebyshev-type inequalities for bounded probability distributions.
- ^ A b C Saw, John G.; Yang, Mark C. K.; Mo, Tse Chin (1984). "Chebyshev Inequality with Estimated Mean and Variance". Americký statistik. 38 (2): 130–2. doi:10.2307/2683249. ISSN 0003-1305. JSTOR 2683249.
- ^ A b Konijn, Hendrik S. (February 1987). "Distribution-Free and Other Prediction Intervals". Americký statistik. 41 (1): 11–15. doi:10.2307/2684311. JSTOR 2684311.
- ^ A b Kabán, Ata (2012). "Non-parametric detection of meaningless distances in high dimensional data". Statistiky a výpočty. 22 (2): 375–85. doi:10.1007/s11222-011-9229-0.
- ^ A b Beasley, T. Mark; Page, Grier P.; Brand, Jaap P. L.; Gadbury, Gary L.; Mountz, John D.; Allison, David B. (Leden 2004). "Chebyshev's inequality for nonparametric testing with small N and α in microarray research". Journal of the Royal Statistical Society. C (Applied Statistics). 53 (1): 95–108. doi:10.1111/j.1467-9876.2004.00428.x. ISSN 1467-9876.
- ^ Savage, I. Richard. "Probability inequalities of the Tchebycheff type." Journal of Research of the National Bureau of Standards-B. Mathematics and Mathematical Physics B 65 (1961): 211-222
- ^ A b C Ion, Roxana Alice (2001). "Chapter 4: Sharp Chebyshev-type inequalities". Nonparametric Statistical Process Control. Universiteit van Amsterdam. ISBN 978-9057760761. Citováno 1. října 2012.
- ^ A b Berck, Peter; Hihn, Jairus M. (May 1982). "Using the Semivariance to Estimate Safety-First Rules". American Journal of Agricultural Economics. 64 (2): 298–300. doi:10.2307/1241139. ISSN 0002-9092. JSTOR 1241139. Citováno 8. října 2012.
- ^ Nantell, Timothy J.; Price, Barbara (June 1979). "An Analytical Comparison of Variance and Semivariance Capital Market Theories". Časopis finanční a kvantitativní analýzy. 14 (2): 221–42. doi:10.2307/2330500. JSTOR 2330500.
- ^ Neave, Edwin H .; Ross, Michael N .; Yang, červen (2009). "Rozlišování potenciálu vzestupu od rizika poklesu". Novinky z oblasti managementu. 32 (1): 26–36. doi:10.1108/01409170910922005. ISSN 0140-9174.
- ^ Selberg, Henrik L. (1940). „Zwei Ungleichungen zur Ergänzung des Tchebycheffschen Lemmas“ [Dvě nerovnosti doplňující Tchebycheff Lemma]. Skandinavisk Aktuarietidskrift (Scandinavian Actuarial Journal) (v němčině). 1940 (3–4): 121–125. doi:10.1080/03461238.1940.10404804. ISSN 0346-1238. OCLC 610399869.
- ^ Conlon, J .; Dulá, J. H. „Geometrická derivace a interpretace Tchebyscheffovy nerovnosti“ (PDF). Citováno 2. října 2012. Citovat deník vyžaduje
| deník =
(Pomoc) - ^ Cantelli F. (1910) Intorno ad un teorema fondamentale della teoria del rischio. Bolletino dell Associazione degli Attuari Italiani
- ^ Grimmett a Stirzaker, problém 7.11.9. Několik důkazů o tomto výsledku lze najít v Čebyševovy nerovnosti A. G. McDowell.
- ^ Bhattacharyya, B. B. (1987). „Jednostranná nerovnost Čebyšev, když jsou známy první čtyři okamžiky“. Komunikace ve statistice - teorie a metody. 16 (9): 2789–91. doi:10.1080/03610928708829540. ISSN 0361-0926.
- ^ Mitzenmacher, Michael; Upfal, Eli (Leden 2005). Pravděpodobnost a výpočet: Randomizované algoritmy a pravděpodobnostní analýza (Repr. Ed.). Cambridge [u.a.]: Cambridge Univ. Lis. ISBN 9780521835404. Citováno 6. října 2012.
- ^ Zelen M. (1954) Hranice distribuční funkce, která je funkcí momentů řádu čtyři. J Res Nat Bur stánek 53: 377–381
- ^ On je.; Zhang, J .; Zhang, S. (2010). "Hraniční pravděpodobnost malé odchylky: přístup ve čtvrtém okamžiku". Matematika operačního výzkumu. 35 (1): 208–232. doi:10,1287 / měsíc 1090,0438. S2CID 11298475.
- ^ Martien C. A. van Zuijlen (2011) Na domněnce o součtu nezávislých Rademacherových náhodných proměnných
- ^ Feller, William (1966). Úvod do teorie pravděpodobnosti a jejích aplikací, svazek 2 (2. vyd.). Wiley. str. 155. Citováno 6. října 2012.
- ^ Hartigan, J. A .; Hartigan, P. M. (1985). „Dip test unimodality“. Annals of Statistics. 13: 70–84. doi:10.1214 / aos / 1176346577. PAN 0773153.
- ^ Gauss C. F. Theoria Combinationis Observationum Erroribus Minimis Obnoxiae. Pars Prior. Pars posterior. Supplementum. Teorie kombinace pozorování, která byla nejméně předmětem chyb. První část. Část dvě. Doplněk. 1995. Přeložil G. W. Stewart. Classics in Applied Mathematics Series, Society for Industrial and Applied Mathematics, Philadelphia
- ^ Winkler A. (1886) Math-Natur theorie Kl. Akad. Wiss Wien Zweite Abt 53, 6–41
- ^ Dharmadhikari, S. W .; Joag-Dev, K. (1985). „Nerovnost Gauss – Tchebyshev pro unimodální rozdělení“ (PDF). Teoriya Veroyatnostei i ee Primeneniya. 30 (4): 817–820.
- ^ A b C Clarkson, Eric; Denny, J. L .; Shepp, Larry (2009). „ROC a hranice pravděpodobností ocasu pomocí vět o Dubinsovi a F. Rieszovi“. Annals of Applied Probability. 19 (1): 467–76. arXiv:0903.0518. Bibcode:2009arXiv0903.0518C. doi:10.1214 / 08-AAP536. PMC 2828638. PMID 20191100.
- ^ McWilliams, Thomas P. (1990). „Test distribuce bez symetrie na základě statistik běhů“. Journal of the American Statistical Association. 85 (412): 1130–3. doi:10.2307/2289611. ISSN 0162-1459. JSTOR 2289611.
- ^ Seaman, John W., Jr.; Young, Dean M .; Odell, Patrick L. (1987). Msgstr "Vylepšení odhadů odchylky malého vzorku pro omezené náhodné proměnné". Průmyslová matematika. 37: 65–75. ISSN 0019-8528. Zbl 0637.62024.
- ^ Bickel, Peter J.; Krieger, Abba M. (1992). „Rozšíření Čebyševovy nerovnosti s aplikacemi“ (PDF). Pravděpodobnost a matematická statistika. 13 (2): 293–310. ISSN 0208-4147. Citováno 6. října 2012.
- ^ A b DasGupta, A (2000). "Nejlepší konstanty v Čebyčevových nerovnostech s různými aplikacemi". Metrika. 5 (1): 185–200. doi:10,1007 / s184-000-8316-9.
- ^ „Další myšlenky na jednostrannou verzi Čebyševovy nerovnosti - Henry Bottomley“. se16.info. Citováno 2012-06-12.[trvalý mrtvý odkaz ]
- ^ Grechuk, B., Molyboha, A., Zabarankin, M. (2010).Čebyševovy nerovnosti s opatřeními zákonné odchylky, Pravděpodobnost v technických a informačních vědách, 24 (1), 145-170.
- ^ Godwin H. J. (1964) Nerovnosti distribučních funkcí. (Kapitola 3) New York, Hafner Pub. Co.
- ^ A b Lesley F. D., Rotar V. I. (2003) Několik poznámek k dolním mezím Čebyševova typu pro poloviční čáry. J Nerovnosti Pure Appl Math 4 (5), článek 96
- ^ Fink, A. M .; Jodeit, Max, Jr. (1984). „Na další Čebyševovu nerovnost“. In Tong, Y. L .; Gupta, Shanti S. (eds.). Nerovnosti ve statistice a pravděpodobnosti. Ústav přednášek o matematické statistice - monografické série. 5. str. 115–120. doi:10.1214 / lnms / 1215465637. ISBN 978-0-940600-04-1. PAN 0789242. Citováno 7. října 2012.
- ^ Niculescu, Constantin P. (2001). „Rozšíření Čebyševovy nerovnosti a její souvislost s Jensenovou nerovností“. Journal of Nerovností a aplikací. 6 (4): 451–462. CiteSeerX 10.1.1.612.7056. doi:10.1155 / S1025583401000273. ISSN 1025-5834. Citováno 6. října 2012.
- ^ A b Niculescu, Constantin P .; Pečarić, Josip (2010). „Rovnocennost Čebyševovy nerovnosti s nerovností Hermita – Hadamarda“ (PDF). Matematické zprávy. 12 (62): 145–156. ISSN 1582-3067. Citováno 6. října 2012.
- ^ Malamud, S. M. (15. února 2001). „Některá doplnění nerovností Jensen a Čebyšev a problém W. Waltera“. Proceedings of the American Mathematical Society. 129 (9): 2671–2678. doi:10.1090 / S0002-9939-01-05849-X. ISSN 0002-9939. PAN 1838791. Citováno 7. října 2012.
- ^ Haldane, J. B. (1952). "Jednoduché testy na bimodalitu a bitangenciálnost". Annals of Eugenics. 16 (4): 359–364. doi:10.1111 / j.1469-1809.1951.tb02488.x. PMID 14953132.
- ^ Kendall M. G. (1943) Pokročilá teorie statistiky, 1. Londýn
- ^ Výpočet horních mezí spolehlivosti pro koncentrace bodů expozice na místech s nebezpečným odpadem (Zpráva). Úřad pro mimořádné události a nápravná opatření Agentury pro ochranu životního prostředí USA. Prosinec 2002. Citováno 5. srpna 2016.
- ^ „Statistické testy: návrh Čebyševova UCL“. Kvantitativní rozhodnutí. 25. března 2001. Citováno 26. listopadu 2015.
Další čtení
- A. Papoulis (1991), Pravděpodobnost, náhodné proměnné a stochastické procesy, 3. vyd. McGraw – Hill. ISBN 0-07-100870-5. str. 113–114.
- G. Grimmett a D. Stirzaker (2001), Pravděpodobnost a náhodné procesy, 3. vyd. Oxford. ISBN 0-19-857222-0. Oddíl 7.3.