Algoritmus MM - MM algorithm
The Algoritmus MM je iterativní optimalizace metoda, která využívá konvexnost funkce za účelem nalezení jejích maxim nebo minim. MM znamená „Majorize-Minimization“ nebo „Minorize-Maximization“, podle toho, zda je požadovaná optimalizace maximalizací nebo minimalizací. MM sám o sobě není algoritmus, ale popis toho, jak postavit optimalizační algoritmus.
The algoritmus očekávání – maximalizace lze považovat za speciální případ MM algoritmu.[1][2]V algoritmu EM podmíněná očekávání jsou obvykle zahrnuty, zatímco v algoritmu MM jsou hlavním zaměřením konvexita a nerovnosti a ve většině případů je snazší pochopit a aplikovat je.[je zapotřebí objasnění ]
Dějiny
Historický základ algoritmu MM lze datovat přinejmenším do roku 1970, kdy Ortega a Rheinboldt prováděli studie týkající se vyhledávání linek metody.[3] Stejný koncept se nadále objevoval v různých oblastech v různých formách. V roce 2000 navrhli Hunter a Lange „MM“ jako obecný rámec.[4] Nedávné studie[SZO? ] aplikovali metodu v široké škále tematických oblastí, jako např matematika, statistika, strojové učení a inženýrství.[Citace je zapotřebí ]
Algoritmus
Algoritmus MM funguje tak, že najde náhradní funkci, která zmenší nebo zvětší objektivní funkci. Optimalizace náhradní funkce buď zlepší hodnotu objektivní funkce, nebo ji ponechá beze změny.
Vezmeme-li verzi minorize-maximization, dovolte být cílem konkávní funkce, která má být maximalizována. Na m krok algoritmu, , vytvořená funkce bude nazývána minorizovanou verzí objektivní funkce (náhradní funkce) v -li
Pak maximalizujte namísto a nechte
Výše uvedená iterační metoda to zaručí bude konvergovat k místnímu optimálnímu nebo sedlovému bodu jako m jde do nekonečna.[5] Podle výše uvedené konstrukce
Pochodující z a náhradní funkce vzhledem k objektivní funkci jsou znázorněny na obrázku.
![](http://upload.wikimedia.org/wikipedia/commons/thumb/c/cc/Mmalgorithm.jpg/220px-Mmalgorithm.jpg)
Majorize-Minimization je stejný postup, ale s konvexním cílem je minimalizován.
Sestavení náhradní funkce
Lze použít libovolnou nerovnost ke konstrukci požadované majorizované / minorizované verze objektivní funkce. Mezi typické možnosti patří
- Jensenova nerovnost
- Konvexita nerovnost
- Cauchy – Schwarzova nerovnost
- Nerovnost aritmetických a geometrických prostředků
- Kvadratická majorizace / mininorizace prostřednictvím druhého řádu Taylorova expanze dvakrát rozlišitelných funkcí s omezeným zakřivením.
Reference
- ^ Lange, Kenneth. „Algoritmus MM“ (PDF).
- ^ Kenneth Lange: „MM Optimization Algorithms“, SIAM, ISBN 978-1-611974-39-3 (2016).
- ^ Ortega, J.M .; Rheinboldt, W.C. (1970). Iterativní řešení nelineárních rovnic v několika proměnných. New York: Academic. str.253 –255. ISBN 9780898719468.
- ^ Hunter, D.R .; Lange, K. (2000). Msgstr "Kvantilní regrese pomocí MM algoritmu". Journal of Computational and Graphical Statistics. 9 (1): 60–77. CiteSeerX 10.1.1.206.1351. doi:10.2307/1390613. JSTOR 1390613.
- ^ Wu, C. F. Jeff (1983). „O vlastnostech konvergence EM algoritmu“. Annals of Statistics. 11 (1): 95–103. doi:10.1214 / aos / 1176346060. JSTOR 2240463.