Karush – Kuhn – Tuckerovy podmínky - Karush–Kuhn–Tucker conditions
v matematická optimalizace, Podmínky Karush – Kuhn – Tucker (KKT), také známý jako Podmínky Kuhn – Tucker, jsou první derivační testy (někdy se tomu říká první objednávka nezbytné podmínky ) pro řešení v nelineární programování být optimální, za předpokladu, že některé podmínky pravidelnosti jsou spokojeni.
Přístup KKT k nelineárnímu programování umožňuje omezení nerovnosti a zobecňuje metodu Lagrangeovy multiplikátory, což umožňuje pouze omezení rovnosti. Podobně jako Lagrangeův přístup je problém s omezenou maximalizací (minimalizací) přepsán jako Lagrangeova funkce, jejíž optimální bod je sedlový bod, tj. globální maximum (minimum) nad doménou proměnných volby a globální minimum (maximum) nad multiplikátory, a proto se Karush – Kuhn – Tuckerova věta někdy označuje jako věta o sedlovém bodě.[1]
Podmínky KKT byly původně pojmenovány po Harold W. Kuhn a Albert W. Tucker, který poprvé zveřejnil podmínky v roce 1951.[2] Později vědci zjistili, že podmínky nezbytné pro tento problém byly uvedeny v William Karush ve své diplomové práci v roce 1939.[3][4]
Nelineární optimalizační problém
Zvažte následující nelineární problém s minimalizací nebo maximalizací:
- Optimalizovat
- podléhá
kde je optimalizační proměnná vybraná z a konvexní podmnožina z , je objektivní nebo nástroj funkce, jsou nerovnosti omezení funkce a jsou rovnost omezení funkce. Počty nerovností a rovností jsou označeny a resp. Odpovídající problému optimalizace omezení lze vytvořit Lagrangeovu funkci
kde , . The Karush – Kuhn – Tuckerova věta pak uvádí následující.
Teorém. Li je sedlový bod z v , , pak je optimální vektor pro výše uvedený problém s optimalizací. Předpokládejme to a , , jsou konvexní v a že existuje takhle . Pak s optimálním vektorem pro výše uvedený optimalizační problém je přidružen nezáporný vektor takhle je sedlovým bodem .[5]
Protože myšlenkou tohoto přístupu je najít a podpůrná nadrovina na proveditelné sadě , důkaz věty Karush – Kuhn – Tucker využívá věta o oddělení hyperplánů.[6]
Systém rovnic a nerovnic odpovídajících podmínkám KKT obvykle není přímo vyřešen, kromě několika zvláštních případů, kdy uzavřená forma řešení lze odvodit analyticky. Obecně lze mnoho optimalizačních algoritmů interpretovat jako metody numerického řešení systému KKT rovnic a nerovností.[7]
Nezbytné podmínky
Předpokládejme, že Objektivní funkce a omezovací funkce a jsou průběžně diferencovatelné v určitém okamžiku . Li je místní optimum a problém optimalizace splňuje některé podmínky pravidelnosti (viz níže), pak existují konstanty a zvané multiplikátory KKT, takže platí následující čtyři skupiny podmínek:

- Stacionarita
- Pro minimalizaci :
- Pro maximalizaci :
- Prvotní proveditelnost
- Duální proveditelnost
- Doplňková ochablost
Poslední podmínka je někdy psána v ekvivalentní formě:
V konkrétním případě , tj. když neexistují žádná omezení nerovnosti, podmínky KKT se změní na Lagrangeovy podmínky a multiplikátory KKT se nazývají Lagrangeovy multiplikátory.
Pokud jsou některé funkce nediferencovatelné, subdiferenciální jsou k dispozici verze podmínek Karush – Kuhn – Tucker (KKT).[8]
Maticová reprezentace
Potřebné podmínky lze napsat s Jacobian matice omezujících funkcí. Nechat být definován jako a nechte být definován jako . Nechat a . Poté lze potřebné podmínky zapsat jako:
- Stacionarita
- Pro maximalizaci :
- Pro minimalizaci :
- Prvotní proveditelnost
- Duální proveditelnost
- Doplňková ochablost
Podmínky pravidelnosti (nebo omezení kvalifikace)
Lze se zeptat, zda bod minimalizátoru původního omezeného optimalizačního problému (za předpokladu, že existuje) musí splňovat výše uvedené podmínky KKT. Je to podobné, jako když se ptáte, za jakých podmínek minimalizátor funkce v neomezeném problému musí podmínku splnit . Pro omezený případ je situace komplikovanější a lze uvést řadu (stále komplikovanějších) podmínek „pravidelnosti“, za kterých omezený minimalizátor rovněž splňuje podmínky KKT. Některé běžné příklady podmínek, které to zaručují, jsou uvedeny v následujících tabulkách, přičemž LICQ je nejčastěji používaný:
Omezení | Akronym | Tvrzení |
---|---|---|
Kvalifikace omezení linearity | LCQ | Li a jsou afinní funkce, pak není nutná žádná další podmínka. |
Kvalifikace omezení lineární nezávislosti | LICQ | Přechody omezení aktivní nerovnosti a přechody omezení rovnosti jsou lineárně nezávislé na . |
Mangasarian-Fromovitz omezení kvalifikace | MFCQ | Gradienty omezení rovnosti jsou lineárně nezávislé na a existuje vektor takhle pro všechna aktivní omezení nerovnosti a pro všechna omezení rovnosti.[9] |
Konstantní kvalifikace omezení pozice | CRCQ | U každé podmnožiny přechodů aktivních omezení nerovnosti a přechodů omezení rovnosti je pořadí v blízkosti je konstantní. |
Kvalifikace omezení konstantní pozitivní lineární závislosti | CPLD | Pro každou podmnožinu přechodů aktivních omezení nerovnosti a přechody omezení rovnosti, pokud je podmnožina vektorů lineárně závislá na s nezápornými skaláry spojenými s omezeními nerovnosti pak zůstává lineárně závislý v sousedství . |
Kvalifikace omezení kvazi-normality | QNCQ | Pokud jsou přechody omezení aktivní nerovnosti a přechody omezení rovnosti lineárně závislé na s přidruženými multiplikátory pro rovnost a pro nerovnosti pak neexistuje žádná sekvence takhle a |
Slaterův stav | SC | Pro konvexní problém (tj. za předpokladu minimalizace, jsou konvexní a je afinní), existuje bod takhle a |
To lze ukázat
- LICQ ⇒ MFCQ ⇒ CPLD ⇒ QNCQ
a
- LICQ ⇒ CRCQ ⇒ CPLD ⇒ QNCQ
(a konverze nejsou pravdivé), i když MFCQ není ekvivalentní CRCQ.[10]V praxi se dává přednost slabším kvalifikacím, protože se vztahují na širší výběr problémů.
Dostatečné podmínky
V některých případech jsou nezbytné podmínky také dostatečné pro dosažení optimality. Obecně platí, že nezbytné podmínky nejsou dostatečné pro dosažení optimality a jsou vyžadovány další informace, například Dostatečné podmínky druhého řádu (SOSC). Pro plynulé funkce zahrnuje SOSC druhé derivace, což vysvětluje jeho název.
Nezbytné podmínky jsou dostatečné pro optimálnost, pokud objektivní funkce problému maximalizace je konkávní funkce, omezení nerovnosti jsou průběžně diferencovatelné konvexní funkce a omezení rovnosti jsou afinní funkce. Podobně, pokud objektivní funkce problému minimalizace je konvexní funkce, nezbytné podmínky jsou také dostatečné pro optimálnost.
Martin v roce 1985 ukázal, že širší třídou funkcí, v nichž podmínky KKT zaručují globální optimálnost, jsou tzv. Typ 1 funkce invex.[11][12]
Dostatečné podmínky druhého řádu
Pro hladký, nelineární optimalizace problémů, je dostatečná podmínka druhého řádu dána následujícím způsobem.
Řešení ve výše uvedené části je omezené místní minimum, pokud pro lagrangisty,
pak,
kde je vektor splňující následující,
kde pouze ta aktivní omezení nerovnosti odpovídající přísné doplňkovosti (tj. kde ). Řešením je přísně omezené místní minimum v případě, že nerovnost je také přísná.
Li by měla být použita Taylorova expanze Lagrangeova třetího řádu k ověření, zda je místní minimum. Minimalizace je dobrým protikladem, viz také Peano povrch.
Ekonomika
Často v matematická ekonomie přístup KKT se používá v teoretických modelech za účelem získání kvalitativních výsledků. Například,[13] zvažte společnost, která maximalizuje své tržby s omezením minimálního zisku. Pronájem být množství vyrobeného výstupu (bude vybráno), být tržbami z prodeje s kladným prvním derivátem as nulovou hodnotou při nulovém výstupu, být výrobní náklady s kladným prvním derivátem as nezápornou hodnotou při nulovém výstupu, a být pozitivní minimální přijatelná úroveň zisk, pak je problém smysluplný, pokud se příjmová funkce vyrovná, takže je nakonec méně strmá než nákladová funkce. Problém vyjádřený v dříve uvedené minimalizační formě je
- Minimalizovat
- podléhá
a podmínky KKT jsou
Od té doby by porušilo omezení minimálního zisku, máme a tedy třetí podmínka znamená, že první podmínka platí s rovností. Řešení, které rovnost dává
Protože to bylo dáno a jsou přísně pozitivní, tato nerovnost spolu s podmínkou nezápornosti zaručuje to je pozitivní, a tak firma maximalizující výnosy pracuje na úrovni výstupu, na které vedlejší příjem je méně než mezní náklady - výsledek, který je zajímavý, protože kontrastuje s chováním a maximalizace zisku firma, která funguje na úrovni, na které jsou si rovni.
Hodnotová funkce
Pokud přehodnotíme problém s optimalizací jako problém s maximalizací s omezeními konstantní nerovnosti:
Hodnotová funkce je definována jako
takže doména je
Vzhledem k této definici každý koeficient je rychlost, s jakou se hodnotová funkce zvyšuje jako zvyšuje. Tedy pokud každý je interpretováno jako omezení zdroje, koeficienty vám řeknou, o kolik zvýšení zdroje zvýší optimální hodnotu naší funkce . Tato interpretace je obzvláště důležitá v ekonomii a používá se například v problémy s maximalizací užitku.
Zobecnění
S extra multiplikátorem , což může být nula (pokud ), před podmínky stacionárnosti KKT se promění
které se nazývají Podmínky Fritze Johna. Tato podmínka optimality platí bez omezení omezení a je ekvivalentní podmínce optimality KKT nebo (ne-MFCQ).
Podmínky KKT patří do širší třídy nezbytných podmínek prvního řádu (FONC), které umožňují plynulé funkce pomocí subderiváty.
Viz také
- Farkasovo lemma
- Lagrangeův multiplikátor
- The Metoda Big M., pro lineární problémy, které rozšiřují simplexní algoritmus k problémům, které obsahují omezení „větší než“.
- Povolená proměnná
Reference
- ^ Tabak, Daniel; Kuo, Benjamin C. (1971). Optimální řízení pomocí matematického programování. Englewood Cliffs, NJ: Prentice-Hall. str. 19–20. ISBN 0-13-638106-5.
- ^ Kuhn, H. W.; Tucker, A. W. (1951). „Nelineární programování“. Sborník z 2. Berkeley Symposium. Berkeley: University of California Press. 481–492. PAN 0047303.
- ^ W. Karush (1939). Minima funkcí několika proměnných s nerovnostmi jako vedlejší omezení (Magisterská práce). Katedra matematiky, Univ. z Chicaga, Chicaga, Illinois.
- ^ Kjeldsen, Tinne Hoff (2000). „Kontextová historická analýza Kuhn-Tuckerovy věty v nelineárním programování: dopad druhé světové války“. Historia Math. 27 (4): 331–361. doi:10,1006 / hmat.2000.2289. PAN 1800317.
- ^ Walsh, G. R. (1975). "Vlastnost sedlového bodu Lagrangeovy funkce". Metody optimalizace. New York: John Wiley & Sons. 39–44. ISBN 0-471-91922-5.
- ^ Kemp, Murray C .; Kimura, Yoshio (1978). Úvod do matematické ekonomie. New York: Springer. str.38–44. ISBN 0-387-90304-6.
- ^ Boyd, Stephen; Vandenberghe, Lieven (2004). Konvexní optimalizace. Cambridge: Cambridge University Press. p. 244. ISBN 0-521-83378-7. PAN 2061575.
- ^ Ruszczyński, Andrzej (2006). Nelineární optimalizace. Princeton, NJ: Princeton University Press. ISBN 978-0691119151. PAN 2199043.
- ^ Dimitri Bertsekas (1999). Nelineární programování (2. vyd.). Athena Scientific. 329–330. ISBN 9781886529007.
- ^ Rodrigo Eustaquio; Elizabeth Karas; Ademir Ribeiro. Omezení kvalifikace pro nelineární programování (PDF) (Technická zpráva). Federální univerzita v Paraně.
- ^ Martin, D. H. (1985). „Esence neohroženosti“. J. Optim. Teorie Appl. 47 (1): 65–76. doi:10.1007 / BF00941316. S2CID 122906371.
- ^ Hanson, M. A. (1999). „Invexity and the Kuhn-Tucker Theorem“. J. Math. Anální. Appl. 236 (2): 594–604. doi:10.1006 / jmaa.1999.6484.
- ^ Chiang, Alpha C. Základní metody matematické ekonomie, 3. vydání, 1984, s. 750–752.
Další čtení
- Andreani, R .; Martínez, J. M .; Schuverdt, M. L. (2005). "O vztahu mezi podmínkou konstantní pozitivní lineární závislosti a kvalifikací omezení kvazinormality". Journal of Optimization Theory and Applications. 125 (2): 473–485. doi:10.1007 / s10957-004-1861-9. S2CID 122212394.
- Avriel, Mordechaj (2003). Nelineární programování: Analýza a metody. Doveru. ISBN 0-486-43227-0.
- Boltyanski, V .; Martini, H .; Soltan, V. (1998). „The Kuhn – Tuckerova věta“. Geometrické metody a problémy s optimalizací. New York: Springer. str. 78–92. ISBN 0-7923-5454-0.
- Boyd, S .; Vandenberghe, L. (2004). „Podmínky optimality“ (PDF). Konvexní optimalizace. Cambridge University Press. str. 241–249. ISBN 0-521-83378-7.
- Kemp, Murray C .; Kimura, Yoshio (1978). Úvod do matematické ekonomie. New York: Springer. str.38–73. ISBN 0-387-90304-6.
- Rau, Nicholas (1981). "Lagrangeovy multiplikátory". Matice a matematické programování. Londýn: Macmillan. str. 156–174. ISBN 0-333-27768-6.
- Nocedal, J .; Wright, S. J. (2006). Numerická optimalizace. New York: Springer. ISBN 978-0-387-30303-1.
- Sundaram, Rangarajan K. (1996). „Omezení nerovnosti a teorém Kuhna a Tuckera“. První kurz teorie optimalizace. New York: Cambridge University Press. str. 145–171. ISBN 0-521-49770-1.