Řízení strojového učení - Machine learning control - Wikipedia

Řízení strojového učení (MLC) je podpole z strojové učení, inteligentní ovládání a teorie řízení který řeší optimální ovládání problémy s metodami strojové učení.Klíčové aplikace jsou složité nelineární systémy, pro které teorie lineárního řízení metody nejsou použitelné.

Druhy problémů a úkolů

Běžně se setkáváme se čtyřmi typy problémů.

  • Identifikace kontrolních parametrů: MLC se promítne do identifikace parametrů[1] pokud je dána struktura regulačního zákona, ale parametry nejsou známy. Jedním z příkladů je genetický algoritmus pro optimalizaci koeficientů a PID regulátor[2] nebo diskrétní optimální řízení.[3]
  • Návrh řízení jako regresní problém prvního druhu: MLC aproximuje obecné nelineární mapování od signálů senzoru po akční příkazy, pokud jsou signály senzoru a optimální akční příkaz známy pro každý stav. Jedním z příkladů je výpočet zpětné vazby senzoru od známého úplná zpětná vazba stavu. A nervová síť je běžně používanou technikou pro tento úkol.[4]
  • Návrh řízení jako regresní problém druhého druhu: MLC může také identifikovat libovolné nelineární regulační zákony, které minimalizují nákladovou funkci zařízení. V tomto případě není třeba znát ani model, ani strukturu řídicího zákona, ani optimalizační ovládací příkaz. Optimalizace je založena pouze na výkonu řízení (nákladové funkci) měřeném v zařízení. Genetické programování je pro tento účel výkonná regresní technika.[5]
  • Řízení učení výztuže: Zákon kontroly může být průběžně aktualizován pomocí změřených změn výkonu (odměn) pomocí posilování učení.[6]

MLC zahrnuje například řízení neuronových sítí, řízení založené na genetických algoritmech, řízení genetického programování, řízení učení posílení a má metodické překrývání s jinými řízeními založenými na datech, jako je umělá inteligence a ovládání robota.

Aplikace

MLC bylo úspěšně aplikováno na mnoho nelineárních problémů s ovládáním, zkoumáním neznámých a často neočekávaných aktivačních mechanismů. Mezi příklady aplikací patří

  • Ovládání výšky satelitů.[7]
  • Tepelná regulace budovy.[8]
  • Řízení turbulence zpětné vazby.[2][9]
  • Dálkově ovládané pod vodním vozidlem.[10]
  • Mnoho dalších technických MLC aplikací je shrnuto v článku PJ Fleming & RC Purshouse (2002).[11]

Stejně jako u všech obecných nelineárních metod MLC nepřináší zaručenou konvergenci, optimálnost ani robustnost pro řadu provozních podmínek.

Reference

  1. ^ Thomas Bäck & Hans-Paul Schwefel (jaro 1993) "Přehled evolučních algoritmů pro optimalizaci parametrů", Journal of Evolutionary Computation (MIT Press), sv. 1, č. 1, s. 1-23
  2. ^ A b Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J.-P. Bonnet & E. Moreau, (2015) „Genetický algoritmus pro více vstupů pro experimentální optimalizaci opětovného připojení po směru zpětného kroku s povrchovým plazmatickým aktuátorem“, Paper AIAA 2015-2957 at 46th AIAA Plasmadynamics and Lasers Conference, Dallas, TX, USA, pp. 1-23.
  3. ^ Zbigniew Michalewicz, Cezary Z. Janikow a Jacek B. Krawczyk (červenec 1992) „Upravený genetický algoritmus pro optimální problémy s řízením“, [Počítače a matematika s aplikacemi], sv. 23, č. 12, s. 83-94.
  4. ^ C. Lee, J. Kim, D. Babcock a R. Goodman (1997) "Aplikace neuronových sítí na řízení turbulencí pro redukci odporu", Fyzika tekutin, sv. 6, č. 9, str. 1740-1747
  5. ^ D. C. Dracopoulos & S.Kent (prosinec 1997) „Genetické programování pro predikci a řízení“, Neural Computing & Applications (Springer), sv. 6, č. 4, str. 214-228.
  6. ^ Andrew G. Barto (prosinec 1994) „Posílení kontroly učení“, Aktuální názor v neurobiologii, sv. 6, č. 4, str. 888–893
  7. ^ Dimitris. C. Dracopoulos a Antonia. J. Jones (1994) Neuro-genetická adaptivní kontrola postoje, Neural Computing & Applications (Springer), sv. 2, č. 4, s. 183-204.
  8. ^ Jonathan A. Wright, Heather A. Loosemore a Raziyeh Farmani (2002) "Optimalizace návrhu a řízení budovy pomocí genetického algoritmu s více kritérii.", [Energie a budovy], roč. 34, č. 9, str. 959-972.
  9. ^ Steven J. Brunton a Bernd R. Noack (2015) Řízení turbulence v uzavřené smyčce: pokrok a výzvy, Recenze aplikované mechaniky, sv. 67, č. 5, článek 050801, s. 1-48.
  10. ^ J. Javadi-Moghaddam & A. Bagheri (2010 „Adaptivní neurofuzní posuvný režim založený na genetickém algoritmu založeném na algoritmu řízení pro dálkově ovládané vozidlo pod vodou“, Expertní systémy s aplikacemi, sv. 37 č. 1, str. 647-660.
  11. ^ Peter J. Fleming, R. C. Purshouse (2002 „Evoluční algoritmy v inženýrství řídicích systémů: průzkum“Praxe řídicí techniky, sv. 10, č. 11, str. 1223-1241

Další čtení

  • Dimitris C Dracopoulos (Srpen 1997) „Evoluční výukové algoritmy pro neurální adaptivní řízení“ Springer. ISBN  978-3-540-76161-7.
  • Thomas Duriez, Steven L. Brunton & Bernd R. Noack (Listopad 2016) „Řízení strojového učení - zkrocení nelineární dynamiky a turbulence“ Springer. ISBN  978-3-319-40624-4.