V matematické teorii pravděpodobnosti se Wienerův proces, pojmenoval podle Norbert Wiener, je stochastický proces používané při modelování různých jevů, včetně Brownův pohyb a fluktuace na finančních trzích. Vzorec pro podmíněné rozdělení pravděpodobnosti extrému Wienerova procesu a náčrt jeho důkazu se objeví v díle H. J. Kushera (dodatek 3, strana 106) publikovaném v roce 1964.[1] podrobný konstruktivní důkaz se objevuje v práci Daria Ballabia v roce 1978.[2] Tento výsledek byl vyvinut v rámci výzkumného projektu o Bayesovská optimalizace algoritmy.
V některých problémech s globální optimalizací není analytická definice objektivní funkce známa a je možné získat hodnoty pouze v pevných bodech. Existují objektivní funkce, u nichž jsou náklady na hodnocení velmi vysoké, například když je hodnocení výsledkem experimentu nebo obzvláště obtížného měření. V těchto případech lze hledání globálního extrému (maximálního nebo minimálního) provést pomocí metodiky s názvem „Bayesovská optimalizace ", které mají tendenci a priori získat nejlepší možný výsledek s předem stanoveným počtem hodnocení. Souhrnně se předpokládá, že mimo body, ve kterých již byla hodnocena, má objektivní funkce vzor, který může být reprezentován stochastickým procesem s patřičnými charakteristikami. Stochastický proces je považován za model objektivní funkce za předpokladu, že rozdělení pravděpodobnosti jejích extrémů dává nejlepší indikaci extrémů objektivní funkce. V nejjednodušším případě jednorozměrné optimalizace, vzhledem k tomu, že objektivní funkce byla hodnocena v řadě bodů, je problém zvolit, ve kterém z takto identifikovaných intervalů je vhodnější investovat do dalšího hodnocení. Pokud je jako model objektivní funkce zvolen Wienerův stochastický proces, je možné vypočítat rozdělení pravděpodobnosti extrémních bodů modelu uvnitř každého intervalu, podmíněné známými hodnotami na inte hranice rval. Porovnání získaných distribucí poskytuje kritérium pro výběr intervalu, ve kterém by měl být proces iterován. Jako kritérium zastavení lze použít hodnotu pravděpodobnosti identifikace intervalu, ve kterém spadne bod globálního extrému objektivní funkce. Bayesiánská optimalizace není efektivní metodou pro přesné vyhledávání lokálních extrémů, takže jakmile je rozsah vyhledávání omezen, v závislosti na charakteristikách problému lze použít konkrétní metodu místní optimalizace.
Tvrzení
Nechat
být Wiener stochastický proces v intervalu
s počáteční hodnotou 
Podle definice Wienerův proces, přírůstky mají normální rozdělení:

Nechat

být funkce distribuce kumulativní pravděpodobnosti minimální hodnoty
funkce na intervalu
podmíněné podle hodnoty 
Ukazuje se, že:[1][3][poznámka 1]

Konstruktivní důkaz
Případ
je bezprostředním důsledkem minimální definice, v následujícím se bude vždy předpokládat
.
Předpokládejme
definováno v konečném počtu bodů
.
Nechat
změnou celého čísla
být posloupností množin
takhle
a
být hustá sada v
,
tedy každý sousedství každého bodu v
obsahuje prvek jedné ze sad
.
Pojďme
být skutečné kladné číslo takové, že 
Nech událost
být definován jako:
.
Nechat
jsou události definované jako:
a nechte
být první k mezi
které definují
.
Od té doby
je to evidentně
. Nyní rovnice (2.1) bude prokázáno.
(2.1) 
Podle
definice událostí,
, proto
. Nyní bude vztah ověřen
proto (2.1) bude prokázáno.
Definice
kontinuita
a hypotéza
naznačují tím, že věta o střední hodnotě,
.
Kontinuitou
a hypotéza, že
je hustá v
odečte se to
takové, že pro
to musí být
,
proto
z čehož vyplývá (2.1).
(2.2) 
(2.2) se odečte od (2.1), vezmeme-li v úvahu, že
znamená, že posloupnost pravděpodobností
je monotónní neklesající, a proto konverguje ke svému supremum. Definice událostí
naznačuje
a (2.2) naznačuje
.
Od té doby
má normální distribuci, to je jistě
. V následujícím bude vždy předpokládáno
, tak
je dobře definován.
(2.3) 
Ve skutečnosti, podle definice
to je
, tak
.
Podobným způsobem, protože podle definice
to je
, (2.4) je platný:
(2.4) 
(2.5)
Výše uvedené je vysvětleno skutečností, že náhodná proměnná
má symetrickou hustotu pravděpodobnosti ve srovnání s jeho průměrem, který je nula.
Použitím v sekvenčních vztazích (2.3), (2.5) a (2.4) dostaneme (2.6) :
(2.6) 
Stejným postupem, jaký byl použit k získání (2.3), (2.4) a (2.5) tentokrát využít vztah
dostaneme (2.7):
(2.7) 

Postupnou aplikací (2.6) a (2.7) dostaneme:
(2.8)

Z
, s ohledem na kontinuitu
a věta o střední hodnotě dostaneme
,
z čehož vyplývá
.
Výměna výše uvedeného v (2.8) a předání limitům:
a pro
, událost
konverguje k 
(2.9) 

, nahrazením
s
v (2.9) dostaneme ekvivalentní vztah:
(2.10)

Uplatnění Bayesova věta na společnou akci 
(2.11) 

Nechat
; z těchto definic vyplývá:

(2.12)
Střídání (2.12) do (2.11), dostaneme ekvivalent:
(2.13)
Střídání (2.9) a (2.10) do (2.13):
(2.14)


Lze pozorovat, že u druhého člena (2.14) se objeví rozdělení pravděpodobnosti náhodné proměnné
, normální se střední hodnotou
e rozptyl
.
Realizace
a
náhodné proměnné
odpovídat hustotám pravděpodobnosti:
(2.15) 
(2.16) 
Střídání (2.15) E (2.16) do (2.14) a brát limit pro
práce je prokázána:





Bibliografie
- Všestranný stochastický model funkce neznámé a časově proměnlivé formy - Harold J Kushner - Journal of Mathematical Analysis and Applications Volume 5, Issue 1, August 1962, Pages 150-167.
- Aplikace Bayesiánských metod při hledání extrému - J. Mockus, J. Tiesis, A. Zilinskas - Kongres IFIP 1977, 8. - 12. srpna v Torontu.
Viz také
Poznámky
- ^ Věta, jak je uvedena a ukázána pro případ minima Wienerova procesu, platí také pro maximum.
Reference
- ^ A b H. J. Kushner, „Nová metoda lokalizace maximálního bodu libovolné multipeakové křivky za přítomnosti šumu“, J. Basic Eng 86 (1), 97–106 (1. března 1964).
- ^ Dario Ballabio, „Una nuova classe di algoritmi stocastici per l'ottimizzazione globale“ (Nová třída stochastických algoritmů pro globální optimalizaci), Milánská univerzita, Matematický ústav, disertační práce prezentovaná 12. července 1978, s. 29–33.
- ^ János D. Pintér, Global Optimization in Action: Continuous and Lipschitz Optimization, 1996 Springer Science & Business Media, strana 57.