Černoff svázán - Chernoff bound

v teorie pravděpodobnosti, Černoff svázán, pojmenoval podle Herman Černoff ale kvůli Hermanovi Rubinovi,[1] dává exponenciálně klesající hranice ocasní distribuce součtu nezávislých náhodných proměnných. Je to ostřejší ohraničení než známé ocasní hranice založené na prvním nebo druhém okamžiku, jako je Markovova nerovnost nebo Čebyševova nerovnost, které přinášejí pouze meze zákona o moci na rozkladu ocasu. Chernoffova vazba však vyžaduje, aby byly variace nezávislé - podmínka, kterou nevyžadují ani Markovova nerovnost, ani Čebyševova nerovnost, ačkoli Čebyševova nerovnost vyžaduje, aby variace byly párově nezávislé.

Souvisí to s (historicky před) Bernsteinovy ​​nerovnosti a do Hoeffdingova nerovnost.

Obecná vazba

Obecný Černoff vázaný na náhodnou proměnnou X je dosaženo aplikací Markovova nerovnost na EtX.[2] Pro každého :

Když X je součet n náhodné proměnné X1, ..., Xn, dostaneme za každou t > 0,

Zejména optimalizace přes t a za předpokladu, že Xi jsme nezávislí, získáváme,

 

 

 

 

(1)

Podobně,

a tak,

Specifických Černoffových mezí je dosaženo výpočtem pro konkrétní instance základních proměnných .

Příklad

Nechat X1, ..., Xn být nezávislý Bernoulliho náhodné proměnné, jehož součet je X, z nichž každý má pravděpodobnost p > 1/2 rovna 1. Pro proměnnou Bernoulli:

Tak:

Pro všechny , přičemž a dává:

a

a obecná vazba Chernoff dává:

Pravděpodobnost současného výskytu více než n/ 2 z akcí {Xk = 1} má přesnou hodnotu:

Dolní mez této pravděpodobnosti lze vypočítat na základě Chernoffovy nerovnosti:

To si opravdu všiml μ = np, dostaneme multiplikativní formu Chernoffovy vazby (viz níže nebo Corollary 13.3 v poznámkách Sinclaira ke třídě),[3]

Tento výsledek připouští různé zobecnění, jak je uvedeno níže. Lze narazit na mnoho příchutí černoffských hranic: originál aditivní forma (což dává vazbu na absolutní chyba ) nebo praktičtější multiplikativní forma (který ohraničuje relativní chyba průměrně).

Aditivní forma (absolutní chyba)

Následující věta je způsobena Wassily Hoeffding[4] a proto se nazývá Chernoff – Hoeffdingova věta.

Chernoff – Hoeffdingova věta. Předpokládat X1, ..., Xn jsou i.i.d. náhodné proměnné, přičemž hodnoty v {0, 1}. Nechat p = E [X]/ na a ε > 0.
kde
je Kullback – Leiblerova divergence mezi Bernoulli distribuován náhodné proměnné s parametry X a y resp. Li p1/2, pak což znamená

Následuje uvolnění věty uvolněním věty pomocí D(p + ε || p) ≥ 2ε2, který vyplývá z konvexnost z D(p + ε || p) a skutečnost, že

Tento výsledek je zvláštním případem Hoeffdingova nerovnost. Někdy hranice

které jsou silnější pro p < 1/8, jsou také používány.

Multiplikativní forma (relativní chyba)

Multiplikativní Chernoff vázán. Předpokládat X1, ..., Xn jsou nezávislý náhodné proměnné s hodnotami v {0, 1}. Nechat X označit jejich součet a nechat μ = E [X] označte očekávanou hodnotu součtu. Pak pro všechny δ > 0,

K prokázání toho lze použít podobnou důkazní strategii

Výše uvedený vzorec je v praxi často nepraktický,[5] často se používají následující volnější, ale pohodlnější hranice:

které vyplývají z nerovnosti z seznam logaritmických nerovností Nebo ještě volnější:

Aplikace

Černoffovy hranice mají velmi užitečné aplikace v nastavit vyvážení a balíček směrování v řídký sítí.

Problém vyvážení sady nastává při navrhování statistických experimentů. Typicky při navrhování statistického experimentu, vzhledem k vlastnostem každého účastníka experimentu, musíme vědět, jak rozdělit účastníky do 2 disjunktních skupin tak, aby každá funkce byla zhruba co nejvíce vyvážená mezi těmito dvěma skupinami. Viz toto sekce knihy pro více informací o problému.

Černoffovy meze se také používají k získání těsných mezí pro problémy s směrováním permutací, které snižují přetížení sítě při směrování paketů v řídkých sítích. Viz toto sekce knihy za důkladné řešení problému.

Černoffovy hranice jsou použity v teorie výpočetního učení dokázat, že algoritmus učení je pravděpodobně přibližně správný, tj. s vysokou pravděpodobností má algoritmus malou chybu na dostatečně velkém souboru tréninkových dat.[6]

Černoffovy hranice lze efektivně využít k vyhodnocení „úrovně robustnosti“ aplikace / algoritmu zkoumáním jejího perturbačního prostoru s randomizací.[7]Použití vazby Chernoff umožňuje člověku opustit silnou - a většinou nerealistickou - hypotézu malých poruch (velikost poruchy je malá). Úroveň robustnosti lze zase použít buď k ověření nebo odmítnutí konkrétní volby algoritmu, hardwarové implementace nebo vhodnosti řešení, jehož strukturální parametry jsou ovlivněny nejistotami.

Matice svázána

Rudolf Ahlswede a Andreas Winter představil Chernoff vázaný na maticové náhodné proměnné.[8] Následující verzi nerovnosti naleznete v práci Troppa.[9]

Nechat M1, ..., Mt být nezávislé matice oceněné náhodné proměnné takové, že a Označme tím normou operátoru matice . Li platí téměř jistě pro všechny , pak pro každého ε > 0

Všimněte si, že aby bylo možné dojít k závěru, že odchylka od 0 je omezena ε s vysokou pravděpodobností musíme vybrat několik vzorků úměrný logaritmu . Obecně bohužel závislost na je nevyhnutelné: vezměte například diagonální matici náhodných znaků dimenze . Norma operátora součtu t nezávislých vzorků je přesně maximální odchylka mezi d nezávislé náhodné procházky délky t. Abychom dosáhli pevné hranice maximální odchylky s konstantní pravděpodobností, je snadné to vidět t by měl růst logaritmicky s d v tomto scénáři.[10]

Následující větu lze získat za předpokladu M má nízké hodnocení, aby se zabránilo závislosti na dimenzích.

Věta bez závislosti na dimenzích

Nechat 0 < ε < 1 a M být náhodná symetrická reálná matice s a téměř jistě. Předpokládejme, že každý prvek na podporu M má nanejvýš hodnost r. Soubor

Li tedy téměř jistě

kde M1, ..., Mt jsou i.i.d. kopie M.

Věta s maticemi, které nejsou zcela náhodné

Garg, Lee, Song a Srivastava [11] prokázal Chernoffův typ vázaný na součty náhodných proměnných s hodnotou matice vzorkovaných náhodným procházením na expandéru, což potvrdilo domněnku způsobenou Wigdersonem a Xiao.

Kyng a píseň [12] se ukázal jako černoffův typ vázaný na součty laplaciánské matice náhodných koster.

Varianta vzorkování

Následující varianta Chernoffova vazby může být použita k omezení pravděpodobnosti, že se většina populace stane ve vzorku menšinou, nebo naopak.[13]

Předpokládejme, že existuje obecná populace A a dílčí populace BA. Označte relativní velikost dílčí populace (|B|/|A|) od r.

Předpokládejme, že vybereme celé číslo k a náhodný vzorek SA velikosti k. Označte relativní velikost dílčí populace ve vzorku (|BS|/|S|) od rS.

Pak pro každou frakci d∈[0,1]:

Zejména pokud B je většina v A (tj. r > 0,5) můžeme omezit pravděpodobnost, že B v roce 2006 zůstane většinou S (rS> 0,5) tím, že: d = 1 - 1 / (2 r):[14]

Tato vazba samozřejmě není vůbec těsná. Například když r= 0,5 dostaneme triviální vazbu Prob > 0.

Důkazy

Chernoff – Hoeffdingova věta (aditivní forma)

Nechat q = p + ε. Brát A = nq v (1), získáváme:

Teď, když to vím Pr (Xi = 1) = p, Pr (Xi = 0) = 1 − p, my máme

Proto můžeme snadno vypočítat infimum pomocí kalkulu:

Nastavení rovnice na nulu a řešení máme

aby

Tím pádem,

Tak jako q = p + ε > p, vidíme to t > 0, takže náš závazek je spokojen t. Po vyřešení pro t, můžeme se připojit k výše uvedeným rovnicím, abychom to našli

Nyní máme náš požadovaný výsledek

Abychom dokončili důkaz pro symetrický případ, jednoduše definujeme náhodnou proměnnou Yi = 1 − Xi, použijte stejný důkaz a připojte jej k naší vazbě.

Multiplikativní forma

Soubor Pr (Xi = 1) = pi.Podle (1),

Třetí řádek výše následuje, protože bere hodnotu Et s pravděpodobností pi a hodnota 1 s pravděpodobností 1 − pi. Toto je totožné s výpočtem výše v dokladu o Věta pro aditivní formu (absolutní chyba).

Přepisování tak jako a připomíná to (s přísnou nerovností, pokud X > 0), jsme si stanovili . Stejného výsledku lze dosáhnout přímou výměnou A v rovnici pro Černoffa vázanou na (1 + δ)μ.[15]

Tím pádem,

Pokud jednoduše nastavíme t = log (1 +.) δ) aby t > 0 pro δ > 0, můžeme nahradit a najít

To dokazuje požadovaný výsledek.

Viz také

Reference

  1. ^ Chernoff, Herman (2014). „Statistická kariéra“ (PDF). V Lin, Xihong; Genest, Christian; Banks, David L .; Molenberghs, Geert; Scott, David W .; Wang, Jane-Ling (eds.). Minulost, současnost a budoucnost statistiky. CRC Press. str. 35. ISBN  9781482204964.
  2. ^ Tuto metodu poprvé použil Sergej Bernstein prokázat související Bernsteinovy ​​nerovnosti.
  3. ^ Sinclair, Alistair (podzim 2011). „Poznámky ke kurzu“ Náhodnost a výpočet"" (PDF). Archivovány od originál (PDF) dne 31. října 2014. Citováno 30. října 2014.
  4. ^ Hoeffding, W. (1963). "Pravděpodobnostní nerovnosti pro součty ohraničených náhodných proměnných" (PDF). Journal of the American Statistical Association. 58 (301): 13–30. doi:10.2307/2282952. JSTOR  2282952.
  5. ^ Mitzenmacher, Michael; Upfal, Eli (2005). Pravděpodobnost a výpočet: Randomizované algoritmy a pravděpodobnostní analýza. Cambridge University Press. ISBN  978-0-521-83540-4.
  6. ^ M. Kearns, U. Vazirani. Úvod do teorie výpočetního učení. Kapitola 9 (dodatek), strany 190-192. MIT Press, 1994.
  7. ^ C.Alippi: Kapitola "Randomizované algoritmy" v Inteligence pro vestavěné systémy. Springer, 2014, 283pp, ISBN  978-3-319-05278-6.
  8. ^ Ahlswede, R .; Winter, A. (2003). "Silná konverzace pro identifikaci pomocí kvantových kanálů". Transakce IEEE na teorii informací. 48 (3): 569–579. arXiv:quant-ph / 0012127. doi:10.1109/18.985947.CS1 maint: ref = harv (odkaz)
  9. ^ Tropp, J. (2010). "Uživatelsky přívětivé ocasní hranice pro součty náhodných matic". Základy výpočetní matematiky. 12 (4): 389–434. arXiv:1004.4389. doi:10.1007 / s10208-011-9099-z.CS1 maint: ref = harv (odkaz)
  10. ^ Magen, A.; Zouzias, A. (2011). „Nízké hodnoceni černoffových hranic s matičkami a přibližné násobení matic“. arXiv:1005.2724 [cs.DM ].
  11. ^ Garg, Ankit; Lee, Yin Tat; Song, Zhao; Srivastava, Nikhil (2018). Matrix Expander Chernoff Bound. STOC '18 Sborník z padesáti výročních sympozií ACM o teorii práce s počítačem. arXiv:1704.03864.
  12. ^ Kyng, Rasmus; Song, Zhao (2018). Matrix Chernoff Bound for Strongly Rayleigh Distribuce and Spectral Sparsifiers from a few Random Spanning Trees. FOCS '18 IEEE Symposium on Foundations of Computer Science. arXiv:1810.08345.
  13. ^ Goldberg, A. V .; Hartline, J. D. (2001). "Konkurenční aukce pro více digitálních statků". Algoritmy - ESA 2001. Přednášky z informatiky. 2161. str. 416. CiteSeerX  10.1.1.8.5115. doi:10.1007/3-540-44676-1_35. ISBN  978-3-540-42493-2.; lemma 6.1
  14. ^ Viz grafy: vázaný jako funkce r když k Změny a vázaný jako funkce k když r Změny.
  15. ^ Viz výše uvedený důkaz

Další čtení