The Hamiltonian je funkce slouží k řešení problému optimální ovládání pro dynamický systém. Lze jej chápat jako okamžitý přírůstek Lagrangeový výraz problému, který má být optimalizován po určité časové období.[1] Inspirováno, ale odlišné od, Hamiltonián klasické mechaniky, Hamiltonián teorie optimálního řízení vyvinul Lev Pontryagin jako součást jeho maximální princip.[2] Pontryagin prokázal, že nezbytnou podmínkou pro řešení problému s optimální regulací je, že kontrola by měla být zvolena tak, aby optimalizovala hamiltonián.[3]
kde označuje vektor stavových proměnných a vektor řídicích proměnných. Jednou počáteční podmínky a ovládací prvky jsou specifikována, řešení diferenciálních rovnic, zvané a trajektorie, Může být nalezeno. Problém optimálního ovládání je zvolit si (od některých kompaktní a konvexní sada) aby maximalizuje nebo minimalizuje určité Objektivní funkce mezi počátečním časem a konečný čas (kde možná nekonečno ). Konkrétně je cílem optimalizovat výkonnostní index v každém časovém okamžiku,
s výhradou výše uvedených pohybových rovnic stavových proměnných. Metoda řešení zahrnuje definování pomocné funkce známé jako Hamiltonian
který kombinuje objektivní funkci a stavové rovnice podobně jako a Lagrangian v problému statické optimalizace, pouze že multiplikátory , označované jako nákladné proměnné, jsou spíše funkcí času než konstantami.
Cílem je najít optimální funkci politiky řízení a tím i optimální trajektorii stavové proměnné , který Maximální princip společnosti Pontryagin jsou argumenty, které maximalizují Hamiltonian,
pro všechny
Podmínky prvního řádu nezbytné pro maximum jsou dány
který generuje ,
který generuje
druhé z nich se označuje jako nákladné rovnice. Společně stavové a nákladové rovnice popisují Hamiltonovský dynamický systém (opět analogický, ale odlišný od Hamiltonovský systém ve fyzice), jehož řešení zahrnuje dva body problém mezní hodnoty, vzhledem k tomu, že existují okrajové podmínky zahrnující dva různé časové body, počáteční čas ( diferenciální rovnice pro stavové proměnné) a koncový čas ( diferenciální rovnice pro nákladné proměnné; pokud není zadána konečná funkce, okrajové podmínky jsou nebo pro nekonečné časové horizonty).[4]
Postačující podmínkou pro maximum je konkávnost hamiltoniánu vyhodnocená při řešení, tj.
kde je optimální ovládání a je výsledkem optimální trajektorie pro stavovou proměnnou.[5] Alternativně podle výsledku kvůli Olvi L. Mangasarian, postačují nezbytné podmínky, pokud funkce a jsou oba konkávní a .[6]
Odvození od Lagrangeovy
A omezená optimalizace problém, jak je uvedeno výše, obvykle naznačuje Lagrangeův výraz, konkrétně
který může být nahrazen zpět do Lagrangeova výrazu
Chcete-li odvodit podmínky prvního řádu pro optimum, předpokládejme, že řešení bylo nalezeno a Lagrangian je maximalizován. Pak jakákoli změna na nebo musí způsobit pokles hodnoty Lagrangeova. Konkrétně celková derivace z poslouchá
Aby se tento výraz rovnal nule, vyžaduje následující podmínky optimalizace:
Pokud obě počáteční hodnota a koncová hodnota jsou pevné, tj. , žádné podmínky a jsou potřeba. Pokud je koncová hodnota volná, což je často případ, další podmínka je nezbytné pro optimálnost. Druhá se nazývá podmínka transverzality pro problém s pevným horizontem.[7]
Je vidět, že nezbytné podmínky jsou shodné s podmínkami uvedenými výše pro Hamiltonian. Hamiltonián lze tedy chápat jako zařízení ke generování nezbytných podmínek prvního řádu.[8]
Hamiltonián v diskrétním čase
Když je problém formulován v diskrétním čase, je hamiltonián definován jako:
(Všimněte si, že diskrétní čas Hamiltonian v čase zahrnuje nákladnou proměnnou v čase [9] Tento malý detail je nezbytný, takže když rozlišujeme s ohledem na dostaneme termín zahrnující na pravé straně nákladných rovnic. Použití nesprávné konvence zde může vést k nesprávným výsledkům, tj. Nákladné rovnici, která není zpětně rozdílovou rovnicí).
Chování Hamiltonianů v čase
Z maximálního principu Pontryagina lze odvodit speciální podmínky pro hamiltonián.[10] Když konečný čas je pevná a Hamiltonian nezávisí výslovně na čase , pak:
Hamilton poté formuloval své rovnice, aby popsal dynamiku systému jako
Hamiltonian teorie řízení nepopisuje dynamika systému, ale podmínky pro extremizaci některé jeho skalární funkce (Lagrangeovy) s ohledem na řídicí proměnnou . Jak je normálně definováno, je to funkce 4 proměnných
kde je stavová proměnná a je kontrolní proměnná vzhledem k té, kterou extremizujeme.
Přidružené podmínky pro maximum jsou
Tato definice souhlasí s definicí uvedenou v článku Sussmanna a Willemse.[12] (viz str. 39, rovnice 14). Sussmann a Willems ukazují, jak lze použít ovládací Hamiltonian v dynamice, např. pro brachistochrone problém, ale nezmiňujte předchozí práci Carathéodory na tomto přístupu.[13]
Aktuální hodnota a současná hodnota Hamiltonian
v ekonomika, objektivní funkce v problémech s dynamickou optimalizací často závisí přímo na čase pouze prostřednictvím exponenciální diskontování, takže má formu
která se označuje jako současná hodnota Hamiltonian, na rozdíl od současné hodnoty Hamiltonian definované v první části. Nejpozoruhodnější je, že nákladné proměnné jsou nově definovány jako , což vede ke změně podmínek prvního řádu.
,
který bezprostředně vyplývá z produktové pravidlo. Ekonomicky, představují aktuální hodnotu stínové ceny pro investiční statky .
být maximalizován výběrem optimální cesty spotřeby . Funkce označuje nástroj the zástupce agenta konzumace v daném okamžiku. Faktor představuje diskontování. Problém maximalizace je předmětem následující diferenciální rovnice pro kapitálová náročnost, popisující časový vývoj kapitálu na efektivního pracovníka:
kde je období t spotřeba, je období t kapitál na pracovníka (s ), je období t produkce, je míra růstu populace, je míra odpisu kapitálu, agent slevuje budoucí užitek sazbou , s a .
Tady, je stavová proměnná, která se vyvíjí podle výše uvedené rovnice, a je kontrolní proměnná. Hamiltonian se stává
Podmínky optimality jsou
kromě podmínky transversality . Pokud to necháme , pak rozlišování protokolů první podmínka optimality s ohledem na výnosy
Vložením této rovnice do druhé podmínky optimality se získá
který je známý jako Keynes – Ramseyovo pravidlo, což dává podmínku pro spotřebu v každém období, které, pokud bude dodrženo, zajistí maximální životnost po celou dobu životnosti.
Reference
^Ferguson, Brian S .; Lim, G. C. (1998). Úvod do dynamických ekonomických problémů. Manchester: Manchester University Press. 166–167. ISBN0-7190-4996-2.
^Seierstad, Atle; Sydsæter, Knut (1987). Teorie optimálního řízení s ekonomickými aplikacemi. Amsterdam: Severní Holandsko. 107–110. ISBN0-444-87923-4.
^Mangasarian, O. L. (1966). "Dostatečné podmínky pro optimální řízení nelineárních systémů". SIAM Journal on Control. 4 (1): 139–152. doi:10.1137/0304013.
^Kamien, Morton I .; Schwartz, Nancy L. (1991). Dynamická optimalizace: Variační počet a optimální řízení v ekonomice a managementu (Druhé vydání.). Amsterdam: Severní Holandsko. str. 126–127. ISBN0-444-01609-0.
Léonard, Daniel; Long, Ngo Van (1992). „Maximální princip“. Optimální teorie řízení a statická optimalizace v ekonomii. New York: Cambridge University Press. str. 127–168. ISBN0-521-33158-7.
Wulwick, Nancy (1995). „Hamiltonovský formalismus a teorie optimálního růstu“. In Rima, I. H. (ed.). Měření, kvantifikace a ekonomická analýza. London: Routledge. ISBN978-0-415-08915-9.