Řízení strojového učení - Machine learning control - Wikipedia

Řízení strojového učení (MLC) je podpole z strojové učení, inteligentní ovládání a teorie řízení který řeší optimální ovládání problémy s metodami strojové učení.Klíčové aplikace jsou složité nelineární systémy, pro které teorie lineárního řízení metody nejsou použitelné.

Druhy problémů a úkolů

Běžně se setkáváme se čtyřmi typy problémů.

Identifikace kontrolních parametrů: MLC se promítne do identifikace parametrů^[1] pokud je dána struktura regulačního zákona, ale parametry nejsou známy. Jedním z příkladů je genetický algoritmus pro optimalizaci koeficientů a PID regulátor^[2] nebo diskrétní optimální řízení.^[3]
Návrh řízení jako regresní problém prvního druhu: MLC aproximuje obecné nelineární mapování od signálů senzoru po akční příkazy, pokud jsou signály senzoru a optimální akční příkaz známy pro každý stav. Jedním z příkladů je výpočet zpětné vazby senzoru od známého úplná zpětná vazba stavu. A nervová síť je běžně používanou technikou pro tento úkol.^[4]
Návrh řízení jako regresní problém druhého druhu: MLC může také identifikovat libovolné nelineární regulační zákony, které minimalizují nákladovou funkci zařízení. V tomto případě není třeba znát ani model, ani strukturu řídicího zákona, ani optimalizační ovládací příkaz. Optimalizace je založena pouze na výkonu řízení (nákladové funkci) měřeném v zařízení. Genetické programování je pro tento účel výkonná regresní technika.^[5]
Řízení učení výztuže: Zákon kontroly může být průběžně aktualizován pomocí změřených změn výkonu (odměn) pomocí posilování učení.^[6]

MLC zahrnuje například řízení neuronových sítí, řízení založené na genetických algoritmech, řízení genetického programování, řízení učení posílení a má metodické překrývání s jinými řízeními založenými na datech, jako je umělá inteligence a ovládání robota.

Aplikace

MLC bylo úspěšně aplikováno na mnoho nelineárních problémů s ovládáním, zkoumáním neznámých a často neočekávaných aktivačních mechanismů. Mezi příklady aplikací patří

Ovládání výšky satelitů.^[7]
Tepelná regulace budovy.^[8]
Řízení turbulence zpětné vazby.^[2]^[9]
Dálkově ovládané pod vodním vozidlem.^[10]
Mnoho dalších technických MLC aplikací je shrnuto v článku PJ Fleming & RC Purshouse (2002).^[11]

Stejně jako u všech obecných nelineárních metod MLC nepřináší zaručenou konvergenci, optimálnost ani robustnost pro řadu provozních podmínek.

Reference

^ Thomas Bäck & Hans-Paul Schwefel (jaro 1993) "Přehled evolučních algoritmů pro optimalizaci parametrů", Journal of Evolutionary Computation (MIT Press), sv. 1, č. 1, s. 1-23
^ ^A ^b Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J.-P. Bonnet & E. Moreau, (2015) „Genetický algoritmus pro více vstupů pro experimentální optimalizaci opětovného připojení po směru zpětného kroku s povrchovým plazmatickým aktuátorem“, Paper AIAA 2015-2957 at 46th AIAA Plasmadynamics and Lasers Conference, Dallas, TX, USA, pp. 1-23.
^ Zbigniew Michalewicz, Cezary Z. Janikow a Jacek B. Krawczyk (červenec 1992) „Upravený genetický algoritmus pro optimální problémy s řízením“, [Počítače a matematika s aplikacemi], sv. 23, č. 12, s. 83-94.
^ C. Lee, J. Kim, D. Babcock a R. Goodman (1997) "Aplikace neuronových sítí na řízení turbulencí pro redukci odporu", Fyzika tekutin, sv. 6, č. 9, str. 1740-1747
^ D. C. Dracopoulos & S.Kent (prosinec 1997) „Genetické programování pro predikci a řízení“, Neural Computing & Applications (Springer), sv. 6, č. 4, str. 214-228.
^ Andrew G. Barto (prosinec 1994) „Posílení kontroly učení“, Aktuální názor v neurobiologii, sv. 6, č. 4, str. 888–893
^ Dimitris. C. Dracopoulos a Antonia. J. Jones (1994) Neuro-genetická adaptivní kontrola postoje, Neural Computing & Applications (Springer), sv. 2, č. 4, s. 183-204.
^ Jonathan A. Wright, Heather A. Loosemore a Raziyeh Farmani (2002) "Optimalizace návrhu a řízení budovy pomocí genetického algoritmu s více kritérii.", [Energie a budovy], roč. 34, č. 9, str. 959-972.
^ Steven J. Brunton a Bernd R. Noack (2015) Řízení turbulence v uzavřené smyčce: pokrok a výzvy, Recenze aplikované mechaniky, sv. 67, č. 5, článek 050801, s. 1-48.
^ J. Javadi-Moghaddam & A. Bagheri (2010 „Adaptivní neurofuzní posuvný režim založený na genetickém algoritmu založeném na algoritmu řízení pro dálkově ovládané vozidlo pod vodou“, Expertní systémy s aplikacemi, sv. 37 č. 1, str. 647-660.
^ Peter J. Fleming, R. C. Purshouse (2002 „Evoluční algoritmy v inženýrství řídicích systémů: průzkum“Praxe řídicí techniky, sv. 10, č. 11, str. 1223-1241

Další čtení

Dimitris C Dracopoulos (Srpen 1997) „Evoluční výukové algoritmy pro neurální adaptivní řízení“ Springer. ISBN 978-3-540-76161-7.
Thomas Duriez, Steven L. Brunton & Bernd R. Noack (Listopad 2016) „Řízení strojového učení - zkrocení nelineární dynamiky a turbulence“ Springer. ISBN 978-3-319-40624-4.

[Baeck1993-1] Thomas Bäck & Hans-Paul Schwefel (jaro 1993) "Přehled evolučních algoritmů pro optimalizaci parametrů", Journal of Evolutionary Computation (MIT Press), sv. 1, č. 1, s. 1-23

[Benard2015aiaa-2] A ^b Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J.-P. Bonnet & E. Moreau, (2015) „Genetický algoritmus pro více vstupů pro experimentální optimalizaci opětovného připojení po směru zpětného kroku s povrchovým plazmatickým aktuátorem“, Paper AIAA 2015-2957 at 46th AIAA Plasmadynamics and Lasers Conference, Dallas, TX, USA, pp. 1-23.

[3] Zbigniew Michalewicz, Cezary Z. Janikow a Jacek B. Krawczyk (červenec 1992) „Upravený genetický algoritmus pro optimální problémy s řízením“, [Počítače a matematika s aplikacemi], sv. 23, č. 12, s. 83-94.

[4] C. Lee, J. Kim, D. Babcock a R. Goodman (1997) "Aplikace neuronových sítí na řízení turbulencí pro redukci odporu", Fyzika tekutin, sv. 6, č. 9, str. 1740-1747

[5] D. C. Dracopoulos & S.Kent (prosinec 1997) „Genetické programování pro predikci a řízení“, Neural Computing & Applications (Springer), sv. 6, č. 4, str. 214-228.

[6] Andrew G. Barto (prosinec 1994) „Posílení kontroly učení“, Aktuální názor v neurobiologii, sv. 6, č. 4, str. 888–893

[7] Dimitris. C. Dracopoulos a Antonia. J. Jones (1994) Neuro-genetická adaptivní kontrola postoje, Neural Computing & Applications (Springer), sv. 2, č. 4, s. 183-204.

[8] Jonathan A. Wright, Heather A. Loosemore a Raziyeh Farmani (2002) "Optimalizace návrhu a řízení budovy pomocí genetického algoritmu s více kritérii.", [Energie a budovy], roč. 34, č. 9, str. 959-972.

[9] Steven J. Brunton a Bernd R. Noack (2015) Řízení turbulence v uzavřené smyčce: pokrok a výzvy, Recenze aplikované mechaniky, sv. 67, č. 5, článek 050801, s. 1-48.

[10] J. Javadi-Moghaddam & A. Bagheri (2010 „Adaptivní neurofuzní posuvný režim založený na genetickém algoritmu založeném na algoritmu řízení pro dálkově ovládané vozidlo pod vodou“, Expertní systémy s aplikacemi, sv. 37 č. 1, str. 647-660.

[11] Peter J. Fleming, R. C. Purshouse (2002 „Evoluční algoritmy v inženýrství řídicích systémů: průzkum“Praxe řídicí techniky, sv. 10, č. 11, str. 1223-1241

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]