Multiagentní učení - Multi-agent learning - Wikipedia

Multiagentní učení je použití strojové učení v multiagentní systém.^[1] Agenti obvykle vylepšují svá rozhodnutí na základě zkušeností. Agent se musí zejména naučit, jak se koordinovat s ostatními agenty.

Přehled

Podle článku Shoham et al. v roce 2007 je obtížné určit všechny relevantní články v doméně.^[2] S multiagentním učením hlubokého posílení existují určité inherentní potíže.^[3] Prostředí již není stacionární, tedy Majetek Markov je porušeno: přechody a odměny nezávisí pouze na aktuálním stavu agenta.

Reference

^ Albrecht, Stefano; Stone, Peter (2017), „Multiagent Learning: Foundations and Recent Trends. Tutorial“, Konference IJCAI-17 (PDF)
^ Shoham, Yoav; Powers, Rob; Grenager, Trond (01.05.2007). „Pokud je odpovědí učení s více agenty, jaká je otázka?“ (PDF). Umělá inteligence. Základy učení více agentů. 171 (7): 365–377. doi:10.1016 / j.artint.2006.02.006. ISSN 0004-3702.
^ Hernandez-Leal, Pablo; Kartal, Bilal; Taylor, Matthew E. (01.11.2019). „Průzkum a kritika multiagentního učení hlubokého posílení“. Autonomní agenti a multiagentní systémy. 33 (6): 750–797. arXiv:1810.05587. doi:10.1007 / s10458-019-09421-1. ISSN 1573-7454. S2CID 52981002.

Tento umělá inteligence související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to.

[1] Albrecht, Stefano; Stone, Peter (2017), „Multiagent Learning: Foundations and Recent Trends. Tutorial“, Konference IJCAI-17 (PDF)

[2] Shoham, Yoav; Powers, Rob; Grenager, Trond (01.05.2007). „Pokud je odpovědí učení s více agenty, jaká je otázka?“ (PDF). Umělá inteligence. Základy učení více agentů. 171 (7): 365–377. doi:10.1016 / j.artint.2006.02.006. ISSN 0004-3702.

[3] Hernandez-Leal, Pablo; Kartal, Bilal; Taylor, Matthew E. (01.11.2019). „Průzkum a kritika multiagentního učení hlubokého posílení“. Autonomní agenti a multiagentní systémy. 33 (6): 750–797. arXiv:1810.05587. doi:10.1007 / s10458-019-09421-1. ISSN 1573-7454. S2CID 52981002.

[1]

[2]

[3]