Řízení strojového učení - Machine learning control - Wikipedia
Řízení strojového učení (MLC) je podpole z strojové učení, inteligentní ovládání a teorie řízení který řeší optimální ovládání problémy s metodami strojové učení.Klíčové aplikace jsou složité nelineární systémy, pro které teorie lineárního řízení metody nejsou použitelné.
Druhy problémů a úkolů
Běžně se setkáváme se čtyřmi typy problémů.
- Identifikace kontrolních parametrů: MLC se promítne do identifikace parametrů[1] pokud je dána struktura regulačního zákona, ale parametry nejsou známy. Jedním z příkladů je genetický algoritmus pro optimalizaci koeficientů a PID regulátor[2] nebo diskrétní optimální řízení.[3]
- Návrh řízení jako regresní problém prvního druhu: MLC aproximuje obecné nelineární mapování od signálů senzoru po akční příkazy, pokud jsou signály senzoru a optimální akční příkaz známy pro každý stav. Jedním z příkladů je výpočet zpětné vazby senzoru od známého úplná zpětná vazba stavu. A nervová síť je běžně používanou technikou pro tento úkol.[4]
- Návrh řízení jako regresní problém druhého druhu: MLC může také identifikovat libovolné nelineární regulační zákony, které minimalizují nákladovou funkci zařízení. V tomto případě není třeba znát ani model, ani strukturu řídicího zákona, ani optimalizační ovládací příkaz. Optimalizace je založena pouze na výkonu řízení (nákladové funkci) měřeném v zařízení. Genetické programování je pro tento účel výkonná regresní technika.[5]
- Řízení učení výztuže: Zákon kontroly může být průběžně aktualizován pomocí změřených změn výkonu (odměn) pomocí posilování učení.[6]
MLC zahrnuje například řízení neuronových sítí, řízení založené na genetických algoritmech, řízení genetického programování, řízení učení posílení a má metodické překrývání s jinými řízeními založenými na datech, jako je umělá inteligence a ovládání robota.
Aplikace
MLC bylo úspěšně aplikováno na mnoho nelineárních problémů s ovládáním, zkoumáním neznámých a často neočekávaných aktivačních mechanismů. Mezi příklady aplikací patří
- Ovládání výšky satelitů.[7]
- Tepelná regulace budovy.[8]
- Řízení turbulence zpětné vazby.[2][9]
- Dálkově ovládané pod vodním vozidlem.[10]
- Mnoho dalších technických MLC aplikací je shrnuto v článku PJ Fleming & RC Purshouse (2002).[11]
Stejně jako u všech obecných nelineárních metod MLC nepřináší zaručenou konvergenci, optimálnost ani robustnost pro řadu provozních podmínek.
Reference
- ^ Thomas Bäck & Hans-Paul Schwefel (jaro 1993) "Přehled evolučních algoritmů pro optimalizaci parametrů", Journal of Evolutionary Computation (MIT Press), sv. 1, č. 1, s. 1-23
- ^ A b Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J.-P. Bonnet & E. Moreau, (2015) „Genetický algoritmus pro více vstupů pro experimentální optimalizaci opětovného připojení po směru zpětného kroku s povrchovým plazmatickým aktuátorem“, Paper AIAA 2015-2957 at 46th AIAA Plasmadynamics and Lasers Conference, Dallas, TX, USA, pp. 1-23.
- ^ Zbigniew Michalewicz, Cezary Z. Janikow a Jacek B. Krawczyk (červenec 1992) „Upravený genetický algoritmus pro optimální problémy s řízením“, [Počítače a matematika s aplikacemi], sv. 23, č. 12, s. 83-94.
- ^ C. Lee, J. Kim, D. Babcock a R. Goodman (1997) "Aplikace neuronových sítí na řízení turbulencí pro redukci odporu", Fyzika tekutin, sv. 6, č. 9, str. 1740-1747
- ^ D. C. Dracopoulos & S.Kent (prosinec 1997) „Genetické programování pro predikci a řízení“, Neural Computing & Applications (Springer), sv. 6, č. 4, str. 214-228.
- ^ Andrew G. Barto (prosinec 1994) „Posílení kontroly učení“, Aktuální názor v neurobiologii, sv. 6, č. 4, str. 888–893
- ^ Dimitris. C. Dracopoulos a Antonia. J. Jones (1994) Neuro-genetická adaptivní kontrola postoje, Neural Computing & Applications (Springer), sv. 2, č. 4, s. 183-204.
- ^ Jonathan A. Wright, Heather A. Loosemore a Raziyeh Farmani (2002) "Optimalizace návrhu a řízení budovy pomocí genetického algoritmu s více kritérii.", [Energie a budovy], roč. 34, č. 9, str. 959-972.
- ^ Steven J. Brunton a Bernd R. Noack (2015) Řízení turbulence v uzavřené smyčce: pokrok a výzvy, Recenze aplikované mechaniky, sv. 67, č. 5, článek 050801, s. 1-48.
- ^ J. Javadi-Moghaddam & A. Bagheri (2010 „Adaptivní neurofuzní posuvný režim založený na genetickém algoritmu založeném na algoritmu řízení pro dálkově ovládané vozidlo pod vodou“, Expertní systémy s aplikacemi, sv. 37 č. 1, str. 647-660.
- ^ Peter J. Fleming, R. C. Purshouse (2002 „Evoluční algoritmy v inženýrství řídicích systémů: průzkum“Praxe řídicí techniky, sv. 10, č. 11, str. 1223-1241
Další čtení
- Dimitris C Dracopoulos (Srpen 1997) „Evoluční výukové algoritmy pro neurální adaptivní řízení“ Springer. ISBN 978-3-540-76161-7.
- Thomas Duriez, Steven L. Brunton & Bernd R. Noack (Listopad 2016) „Řízení strojového učení - zkrocení nelineární dynamiky a turbulence“ Springer. ISBN 978-3-319-40624-4.