Multiagentní učení - Multi-agent learning - Wikipedia

Multiagentní učení je použití strojové učení v multiagentní systém.[1] Agenti obvykle vylepšují svá rozhodnutí na základě zkušeností. Agent se musí zejména naučit, jak se koordinovat s ostatními agenty.

Přehled

Podle článku Shoham et al. v roce 2007 je obtížné určit všechny relevantní články v doméně.[2] S multiagentním učením hlubokého posílení existují určité inherentní potíže.[3] Prostředí již není stacionární, tedy Majetek Markov je porušeno: přechody a odměny nezávisí pouze na aktuálním stavu agenta.

Reference

  1. ^ Albrecht, Stefano; Stone, Peter (2017), „Multiagent Learning: Foundations and Recent Trends. Tutorial“, Konference IJCAI-17 (PDF)
  2. ^ Shoham, Yoav; Powers, Rob; Grenager, Trond (01.05.2007). „Pokud je odpovědí učení s více agenty, jaká je otázka?“ (PDF). Umělá inteligence. Základy učení více agentů. 171 (7): 365–377. doi:10.1016 / j.artint.2006.02.006. ISSN  0004-3702.
  3. ^ Hernandez-Leal, Pablo; Kartal, Bilal; Taylor, Matthew E. (01.11.2019). „Průzkum a kritika multiagentního učení hlubokého posílení“. Autonomní agenti a multiagentní systémy. 33 (6): 750–797. arXiv:1810.05587. doi:10.1007 / s10458-019-09421-1. ISSN  1573-7454. S2CID  52981002.