Frank – Wolfeův algoritmus - Frank–Wolfe algorithm
The Frank – Wolfeův algoritmus je iterativní první objednávka optimalizace algoritmus pro omezený konvexní optimalizace. Také známý jako metoda podmíněného přechodu,[1] algoritmus sníženého gradientu a konvexní kombinační algoritmus, metodu původně navrhl Marguerite Frank a Philip Wolfe v roce 1956.[2] V každé iteraci považuje algoritmus Frank – Wolfe a lineární aproximace objektivní funkce a pohybuje se směrem k minimalizátoru této lineární funkce (převzaté ve stejné doméně).
Problémové prohlášení
Předpokládat je kompaktní konvexní sada v vektorový prostor a je konvexní, rozlišitelný funkce se skutečnou hodnotou. Algoritmus Frank-Wolfe řeší optimalizační problém
- Minimalizovat
- podléhá .
Algoritmus

- Inicializace: Nechat a nechte být v jakémkoli bodě .
- Krok 1. Dílčí problém s určováním směru: Nalézt Řešení
- Minimalizovat
- S výhradou
- (Interpretace: Minimalizujte lineární aproximaci problému daného prvním řádem Taylorova aproximace z kolem .)
- Krok 2. Určení velikosti kroku: Soubor , nebo alternativně najít který minimalizuje podléhá .
- Krok 3. Aktualizace: Nechat , nechť a přejděte ke kroku 1.
Vlastnosti
Zatímco konkurenční metody jako klesání pro omezenou optimalizaci vyžadují a krok projekce zpět na proveditelnou množinu v každé iteraci potřebuje algoritmus Frank-Wolfe řešení lineárního problému přes stejnou množinu v každé iteraci a automaticky zůstane v proveditelné množině.
Konvergence Frank-Wolfeova algoritmu je obecně sublimní: chyba objektivní funkce k optimálnímu je po k iterace, pokud je přechod Lipschitz kontinuální s ohledem na nějakou normu. Stejnou míru konvergence lze také zobrazit, pokud jsou dílčí problémy vyřešeny pouze přibližně.[3]
Iteráty algoritmu lze vždy představovat jako řídkou konvexní kombinaci extrémních bodů proveditelné množiny, což pomohlo popularitě algoritmu pro řídkou chamtivou optimalizaci v strojové učení a zpracování signálu problémy,[4] stejně jako například optimalizace toky minimálních nákladů v dopravní sítě.[5]
Pokud je proveditelná množina dána množinou lineárních omezení, pak se dílčí problém, který má být vyřešen v každé iteraci, stává lineární program.
Zatímco nejhorší míra konvergence s nelze obecně zlepšit, lze dosáhnout rychlejší konvergence pro speciální třídy úloh, jako jsou některé silně konvexní problémy.[6]
Dolní hranice hodnoty řešení a analýza primal-dual
Od té doby je konvexní, za jakékoli dva body my máme:
To platí i pro (neznámé) optimální řešení . To znamená, . Nejlepší dolní mez vzhledem k danému bodu je dána
Druhý problém s optimalizací je řešen při každé iteraci Frank-Wolfeova algoritmu, tedy řešení zaměřovacího dílčího problému -tou iteraci lze použít ke stanovení zvyšujících se dolních mezí během každé iterace nastavením a
Takové dolní hranice neznámé optimální hodnoty jsou v praxi důležité, protože je lze použít jako kritérium zastavení a poskytnout efektivní certifikát kvality přiblížení v každé iteraci, protože vždy .
Ukázalo se, že to odpovídá rozdíl v dualitě, to je rozdíl mezi a dolní mez , klesá se stejnou mírou konvergence, tj.
Poznámky
- ^ Levitin, E. S .; Polyak, B. T. (1966). "Omezené metody minimalizace". SSSR výpočetní matematika a matematická fyzika. 6 (5): 1. doi:10.1016/0041-5553(66)90114-5.
- ^ Frank, M .; Wolfe, P. (1956). Msgstr "Algoritmus pro kvadratické programování". Naval Research Logistics Quarterly. 3 (1–2): 95–110. doi:10.1002 / nav.3800030109.
- ^ Dunn, J. C .; Harshbarger, S. (1978). "Podmíněné gradientní algoritmy s pravidly velikosti kroku otevřené smyčky". Journal of Mathematical Analysis and Applications. 62 (2): 432. doi:10.1016 / 0022-247X (78) 90137-3.
- ^ Clarkson, K.L. (2010). "Korzety, řídká chamtivá aproximace a Frank-Wolfeův algoritmus". Transakce ACM na algoritmech. 6 (4): 1–30. CiteSeerX 10.1.1.145.9299. doi:10.1145/1824777.1824783.
- ^ Fukushima, M. (1984). "Upravený Frank-Wolfeův algoritmus pro řešení problému s přiřazením provozu". Dopravní výzkum Část B: Metodický. 18 (2): 169–177. doi:10.1016/0191-2615(84)90029-8.
- ^ Bertsekas, Dimitri (1999). Nelineární programování. Athena Scientific. p. 215. ISBN 978-1-886529-00-7.
Bibliografie
- Jaggi, Martin (2013). „Revisiting Frank – Wolfe: Projection-Free Sparse Convex Optimization“. Journal of Machine Learning Research: Workshop and Conference Proceedings. 28 (1): 427–435. (Přehledový papír)
- Algoritmus Frank-Wolfe popis
- Nocedal, Jorge; Wright, Stephen J. (2006). Numerická optimalizace (2. vyd.). Berlín, New York: Springer-Verlag. ISBN 978-0-387-30303-1.CS1 maint: ref = harv (odkaz).