Maximální princip Pontryagins - Pontryagins maximum principle - Wikipedia

Maximální princip společnosti Pontryagin se používá v optimální ovládání teorie najít nejlepší možnou kontrolu pro přijetí a dynamický systém z jednoho stavu do druhého, zejména za přítomnosti omezení pro stavové nebo vstupní ovládací prvky.[1] Tvrdí, že je nutné pro jakékoli optimální řízení spolu s optimální trajektorií stavu k řešení takzvaného hamiltonovského systému, který je dvoubodový problém mezní hodnoty, plus maximální stav Hamiltonian.[A] Tyto nezbytné podmínky se stanou dostatečnými za určitých podmínek konvexity pro objektivní a omezující funkce.[2][3]

Princip maxima formuloval v roce 1956 ruský matematik Lev Pontryagin a jeho studenti,[4][5] a jeho počáteční aplikace byla k maximalizaci koncové rychlosti rakety.[6] Výsledek byl odvozen pomocí myšlenek z klasiky variační počet.[7] Po mírném rozrušení optimální kontroly se uvažuje člen prvního řádu a Taylor expanze s ohledem na rušení; vyslání poruchy na nulu vede k variační nerovnosti, z níž vyplývá princip maxima.[8]

Široce považovaný za milník v teorii optimální regulace,[1] význam principu maxima spočívá ve skutečnosti, že maximalizace hamiltoniánu je mnohem snazší než původní problém nekonečné dimenze; spíše než maximalizovat přes a funkční prostor, problém se převede na a bodově optimalizace.[9] Podobná logika vede k Bellmanův princip optimality, související přístup k problémům optimálního řízení, který uvádí, že optimální trajektorie zůstává optimální v mezilehlých bodech v čase.[10] Výsledný Hamilton – Jacobi – Bellmanova rovnice poskytuje nezbytnou a dostatečnou podmínku pro optimální a připouští přímé rozšíření k stochastickým problémům optimální kontroly, zatímco princip maxima ne.[8] Avšak na rozdíl od Hamiltonovy-Jacobiho-Bellmanovy rovnice, která musí platit nad celým stavovým prostorem, je Pontryaginův maximální princip potenciálně výpočetně efektivnější v tom, že podmínky, které specifikuje, musí vydržet pouze určitou trajektorii.[1]

Zápis

V následujícím textu použijeme následující zápis.

Formální prohlášení o nezbytných podmínkách pro minimalizaci problému

Zde jsou zobrazeny nezbytné podmínky pro minimalizaci funkčnosti. Vzít být státem dynamický systém se vstupem , takový, že

kde je soubor přípustných kontrol a je koncový (tj. konečný) čas systému. Kontrola musí být vybrán pro všechny minimalizovat funkční objektiv který je definován aplikací a může být abstrahován jako

K omezením dynamiky systému lze připojit Lagrangian zavedením časově proměnných Lagrangeův multiplikátor vektor , jehož prvky se nazývají náklady systému. To motivuje k výstavbě Hamiltonian definováno pro všechny podle:

kde je transpozice .

Pontryaginův minimální princip uvádí, že optimální trajektorie stavu , optimální ovládání a odpovídající Lagrangeův multiplikační vektor musí minimalizovat Hamiltonian aby

na Pořád a pro všechny přípustné řídicí vstupy . Musí tomu tak být také

Navíc nákladné rovnice

musí být spokojen. Pokud je konečný stav není pevná (tj. její rozdílná variace není nulová), musí být také to, že koncové náklady jsou takové

Tyto čtyři podmínky v (1) - (4) jsou nezbytnými podmínkami pro optimální ovládání. Upozorňujeme, že (4) platí pouze tehdy, když je zdarma. Pokud je opravena, není tato podmínka pro optimální nutnost nutná.

Viz také

Poznámky

  1. ^ Zda je extrémní hodnota maximální nebo minimální, závisí jak na problému, tak na znaménkové konvenci použité pro definici Hamiltonian. Normální konvence proto vede k maximu maximální princip.

Reference

  1. ^ A b C Ross, Isaac (2015). Základní nátěr na principu Pontryagin v optimální kontrole. San Francisco: Collegiate Publishers. ISBN  978-0-9843571-0-9. OCLC  625106088.CS1 maint: datum a rok (odkaz)
  2. ^ Mangasarian, O. L. (1966). "Dostatečné podmínky pro optimální řízení nelineárních systémů". SIAM Journal on Control. 4 (1): 139–152. doi:10.1137/0304013.
  3. ^ Kamien, Morton I.; Schwartz, Nancy L. (1971). "Dostatečné podmínky v teorii optimální kontroly". Journal of Economic Theory. 3 (2): 207–214. doi:10.1016/0022-0531(71)90018-4.
  4. ^ Boltyanski, V .; Martini, H .; Soltan, V. (1998). „Maximální princip - jak se to stalo?“. Geometrické metody a problémy s optimalizací. New York: Springer. 204–227. ISBN  0-7923-5454-0.
  5. ^ Gamkrelidze, R. V. (1999). "Objev maximálního principu". Journal of Dynamical and Control Systems. 5 (4): 437–451. doi:10.1023 / A: 1021783020548. S2CID  122690986. Přetištěno Bolibruch, A. A.; et al., eds. (2006). Matematické události dvacátého století. Berlín: Springer. str. 85–99. ISBN  3-540-23235-4.
  6. ^ Pro první publikovaná díla viz odkazy v Fuller, A. T. (1963). „Bibliografie maximálního principu Pontryaginu“. J. Elektronika a řízení. 15 (5): 513–517. doi:10.1080/00207216308937602.
  7. ^ McShane, E. J. (1989). "Variační počet od začátku přes teorii optimální kontroly". SIAM J. Control Optim. 27 (5): 916–939. doi:10.1137/0327049.
  8. ^ A b Yong, J .; Zhou, X. Y. (1999). "Maximální princip a stochastické hamiltonovské systémy". Stochastické kontroly: Hamiltonovské systémy a HJB rovnice. New York: Springer. str.101 –156. ISBN  0-387-98723-1.
  9. ^ Sastry, Shankar (29. března 2009). „Poznámky k přednášce 8. Optimální ovládání a dynamické hry“ (PDF).
  10. ^ Zhou, X. Y. (1990). "Maximální princip, dynamické programování a jejich spojení v deterministickém řízení". Journal of Optimization Theory and Applications. 65 (2): 363–373. doi:10.1007 / BF01102352. S2CID  122333807.

Další čtení

externí odkazy