Rozdělení pravděpodobnosti extrémních bodů vídeňského stochastického procesu - Probability distribution of extreme points of a Wiener stochastic process

V matematické teorii pravděpodobnosti se Wienerův proces, pojmenoval podle Norbert Wiener, je stochastický proces používané při modelování různých jevů, včetně Brownův pohyb a fluktuace na finančních trzích. Vzorec pro podmíněné rozdělení pravděpodobnosti extrému Wienerova procesu a náčrt jeho důkazu se objeví v díle H. J. Kushera (dodatek 3, strana 106) publikovaném v roce 1964.[1] podrobný konstruktivní důkaz se objevuje v práci Daria Ballabia v roce 1978.[2] Tento výsledek byl vyvinut v rámci výzkumného projektu o Bayesovská optimalizace algoritmy.

V některých problémech s globální optimalizací není analytická definice objektivní funkce známa a je možné získat hodnoty pouze v pevných bodech. Existují objektivní funkce, u nichž jsou náklady na hodnocení velmi vysoké, například když je hodnocení výsledkem experimentu nebo obzvláště obtížného měření. V těchto případech lze hledání globálního extrému (maximálního nebo minimálního) provést pomocí metodiky s názvem „Bayesovská optimalizace ", které mají tendenci a priori získat nejlepší možný výsledek s předem stanoveným počtem hodnocení. Souhrnně se předpokládá, že mimo body, ve kterých již byla hodnocena, má objektivní funkce vzor, ​​který může být reprezentován stochastickým procesem s patřičnými charakteristikami. Stochastický proces je považován za model objektivní funkce za předpokladu, že rozdělení pravděpodobnosti jejích extrémů dává nejlepší indikaci extrémů objektivní funkce. V nejjednodušším případě jednorozměrné optimalizace, vzhledem k tomu, že objektivní funkce byla hodnocena v řadě bodů, je problém zvolit, ve kterém z takto identifikovaných intervalů je vhodnější investovat do dalšího hodnocení. Pokud je jako model objektivní funkce zvolen Wienerův stochastický proces, je možné vypočítat rozdělení pravděpodobnosti extrémních bodů modelu uvnitř každého intervalu, podmíněné známými hodnotami na inte hranice rval. Porovnání získaných distribucí poskytuje kritérium pro výběr intervalu, ve kterém by měl být proces iterován. Jako kritérium zastavení lze použít hodnotu pravděpodobnosti identifikace intervalu, ve kterém spadne bod globálního extrému objektivní funkce. Bayesiánská optimalizace není efektivní metodou pro přesné vyhledávání lokálních extrémů, takže jakmile je rozsah vyhledávání omezen, v závislosti na charakteristikách problému lze použít konkrétní metodu místní optimalizace.

Tvrzení

Nechat být Wiener stochastický proces v intervalu s počáteční hodnotou

Podle definice Wienerův proces, přírůstky mají normální rozdělení:

Nechat

být funkce distribuce kumulativní pravděpodobnosti minimální hodnoty funkce na intervalu podmíněné podle hodnoty

Ukazuje se, že:[1][3][poznámka 1]

Konstruktivní důkaz

Případ je bezprostředním důsledkem minimální definice, v následujícím se bude vždy předpokládat .

Předpokládejme definováno v konečném počtu bodů.

Nechat změnou celého čísla být posloupností množin takhle a být hustá sada v ,

tedy každý sousedství každého bodu v obsahuje prvek jedné ze sad .

Pojďme být skutečné kladné číslo takové, že

Nech událost být definován jako: .

Nechat jsou události definované jako: a nechte být první k mezi které definují .

Od té doby je to evidentně . Nyní rovnice (2.1) bude prokázáno.

(2.1)

Podle definice událostí,, proto . Nyní bude vztah ověřen proto (2.1) bude prokázáno.

Definice kontinuita a hypotéza naznačují tím, že věta o střední hodnotě, .

Kontinuitou a hypotéza, že je hustá v odečte se to takové, že pro to musí být ,

proto z čehož vyplývá (2.1).

(2.2)

(2.2) se odečte od (2.1), vezmeme-li v úvahu, že znamená, že posloupnost pravděpodobností je monotónní neklesající, a proto konverguje ke svému supremum. Definice událostí naznačuje a (2.2) naznačuje .

Od té doby má normální distribuci, to je jistě . V následujícím bude vždy předpokládáno , tak je dobře definován.

(2.3)

Ve skutečnosti, podle definice to je , tak .

Podobným způsobem, protože podle definice to je , (2.4) je platný:

(2.4)

(2.5)

Výše uvedené je vysvětleno skutečností, že náhodná proměnná má symetrickou hustotu pravděpodobnosti ve srovnání s jeho průměrem, který je nula.

Použitím v sekvenčních vztazích (2.3), (2.5) a (2.4) dostaneme (2.6) :

(2.6)

Stejným postupem, jaký byl použit k získání (2.3), (2.4) a (2.5) tentokrát využít vztah dostaneme (2.7):

(2.7)

Postupnou aplikací (2.6) a (2.7) dostaneme:

(2.8)

Z , s ohledem na kontinuitu a věta o střední hodnotě dostaneme ,

z čehož vyplývá .

Výměna výše uvedeného v (2.8) a předání limitům: a pro , událost konverguje k

(2.9)

, nahrazením s v (2.9) dostaneme ekvivalentní vztah:

(2.10)

Uplatnění Bayesova věta na společnou akci

(2.11)

Nechat ; z těchto definic vyplývá:

(2.12)

Střídání (2.12) do (2.11), dostaneme ekvivalent:

(2.13)

Střídání (2.9) a (2.10) do (2.13):

(2.14)

Lze pozorovat, že u druhého člena (2.14) se objeví rozdělení pravděpodobnosti náhodné proměnné , normální se střední hodnotou e rozptyl .

Realizace a náhodné proměnné odpovídat hustotám pravděpodobnosti:

(2.15)

(2.16)

Střídání (2.15) E (2.16) do (2.14) a brát limit pro práce je prokázána:

Bibliografie

  • Všestranný stochastický model funkce neznámé a časově proměnlivé formy - Harold J Kushner - Journal of Mathematical Analysis and Applications Volume 5, Issue 1, August 1962, Pages 150-167.
  • Aplikace Bayesiánských metod při hledání extrému - J. Mockus, J. Tiesis, A. Zilinskas - Kongres IFIP 1977, 8. - 12. srpna v Torontu.

Viz také

Poznámky

  1. ^ Věta, jak je uvedena a ukázána pro případ minima Wienerova procesu, platí také pro maximum.

Reference

  1. ^ A b H. J. Kushner, „Nová metoda lokalizace maximálního bodu libovolné multipeakové křivky za přítomnosti šumu“, J. Basic Eng 86 (1), 97–106 (1. března 1964).
  2. ^ Dario Ballabio, „Una nuova classe di algoritmi stocastici per l'ottimizzazione globale“ (Nová třída stochastických algoritmů pro globální optimalizaci), Milánská univerzita, Matematický ústav, disertační práce prezentovaná 12. července 1978, s. 29–33.
  3. ^ János D. Pintér, Global Optimization in Action: Continuous and Lipschitz Optimization, 1996 Springer Science & Business Media, strana 57.