Redukce odchylky - Variance reduction

Rozptyl náhodně generovaných bodů v jednotkovém čtverci lze snížit procesem stratifikace.

v matematika, konkrétněji v teorii Metody Monte Carlo, redukce rozptylu je postup používaný ke zvýšení přesnosti odhadů, které lze získat pro danou simulaci nebo výpočetní úsilí.[1] Každá výstupní náhodná proměnná ze simulace je spojena s a rozptyl což omezuje přesnost výsledků simulace. Aby byla simulace statisticky efektivní, tj. Aby byla získána větší přesnost a menší intervaly spolehlivosti pro výstupní náhodnou proměnnou, která nás zajímá, lze použít techniky snižování odchylek. Hlavní jsou běžná náhodná čísla, antitetický variuje, ovládání se liší, vzorkování důležitosti, stratifikovaný odběr vzorků, porovnávání momentů, podmíněné Monte Carlo a kvazi náhodné proměnné. Pro simulaci s Černá skříňka modely simulace podmnožiny a vzorkování linky lze také použít. Pod těmito nadpisy je řada specializovaných technik; například simulace transportu částic hojně využívají techniky „váhových oken“ a „rozdělení / ruské rulety“, které jsou formou vzorkování důležitosti.

Surová simulace Monte Carlo

Předpokládejme, že někdo chce počítat s náhodnou proměnnou definované na pravděpodobnostní prostor . Monte Carlo to dělá vzorkováním i.i.d. kopie z a poté odhadnout pomocí odhadce průměrné hodnoty vzorku

Za dalších mírných podmínek, jako je , a teorém centrálního limitu bude platit tak, že pro velké , distribuce konverguje k normálnímu rozdělení se střední hodnotou a směrodatná odchylka . Protože směrodatná odchylka konverguje pouze k rychlostí , což znamená, že je třeba zvýšit počet simulací () faktorem na polovinu standardní odchylky , metody snižování odchylek jsou často užitečné pro získání přesnějších odhadů pro aniž byste potřebovali velké množství simulací.

Společná náhodná čísla (CRN)

Běžná technika snižování odchylek náhodných čísel je populární a užitečná technika snižování odchylek, která platí, když místo zkoumání jedné konfigurace porovnáváme dvě nebo více alternativních konfigurací (systému). Bylo také nazýváno CRN korelovaný odběr vzorků, shodné streamy nebo uzavřené páry.

CRN vyžaduje synchronizaci proudů náhodných čísel, což zajišťuje, že kromě použití stejných náhodných čísel k simulaci všech konfigurací se konkrétní náhodné číslo použité pro konkrétní účel v jedné konfiguraci použije pro stejný účel ve všech ostatních konfiguracích. Například v teorii čekání ve frontě, pokud porovnáváme dvě různé konfigurace pokladníků v bance, chtěli bychom (náhodný) čas příjezdu N-ten zákazník má být generován pomocí stejného losování ze streamu náhodných čísel pro obě konfigurace.

Základní princip techniky CRN

Předpokládat a jsou pozorování z první a druhé konfigurace na internetu j-nezávislá replikace.

Chceme to odhadnout

Pokud budeme hrát n replikace každé konfigurace a nechat

pak a je nezaujatý odhadce .

A protože jsou nezávislé identicky distribuované náhodné proměnné,

V případě nezávislého vzorkování, tj. Nepoužívají se žádná běžná náhodná čísla, pak Cov (X1j, X2j) = 0. Ale pokud se nám podaří vyvolat prvek pozitivní korelace mezi X1 a X2 takový, že Cov (X1j, X2j)> 0, z výše uvedené rovnice je patrné, že rozptyl je snížen.

Lze také pozorovat, že pokud CRN indukuje negativní korelaci, tj. Cov (X1j, X2j) <0, tato technika může ve skutečnosti selhat, kde se rozptyl zvyšuje a ne snižuje (jak bylo zamýšleno).[2]

Viz také

Reference

  1. ^ Botev, Z .; Ridder, A. (2017). "Redukce odchylky". Wiley StatsRef: Statistická reference online: 1–6. doi:10.1002 / 9781118445112.stat07975. ISBN  9781118445112.
  2. ^ Hamrick, Jeff. „Metoda běžných náhodných čísel: příklad“. Demonstrační projekt Wolfram. Citováno 29. března 2016.