Optimalizace distribuovaných omezení - Distributed constraint optimization
Optimalizace distribuovaných omezení (DCOP nebo DisCOP) je distribuováno analogicky k optimalizace omezení. DCOP je problém, při kterém skupina agentů musí distribuovaně volit hodnoty pro sadu proměnných tak, aby byla minimalizována cena sady omezení přes proměnné.
Distributed Constraint Satisfaction je rámec pro popis problému z hlediska omezení, která jsou známá a vynucená různými účastníky (agenty). Omezení jsou popsána u některých proměnných s předdefinovanými doménami a různým agentům musí být přiřazena ke stejným hodnotám.
Problémy definované v tomto rámci lze vyřešit kterýmkoli z algoritmů, které jsou pro něj navrženy.
Rámec byl používán pod různými názvy v 80. letech. První známé použití se současným názvem je v roce 1990.[Citace je zapotřebí ]
Definice
DCOP
A DCOP lze definovat jako a n-tice , kde:
- je soubor z agenti;
- je sada proměnných, ;
- je sada domén, , kde každý je konečná množina obsahující hodnoty, ke kterým lze přiřadit přidruženou proměnnou;
- je funkce[1][2]
který mapuje každé možné přiřazení proměnné k ceně. Tuto funkci lze také považovat za definování omezení mezi proměnnými, avšak proměnné nesmí být Hermitian; - je funkce mapování proměnných na jejich přidruženého agenta. znamená, že jde o agenta Odpovědnost za přiřazení hodnoty proměnné . Všimněte si, že to nemusí být nutně pravda je buď injekce nebo surjection; a
- je operátor který agreguje všechny jednotlivce náklady na všechna možná přiřazení proměnných. Toho se obvykle dosahuje součtem:
.
Cílem DCOP je nechat každého agenta přiřadit hodnoty jeho přidruženým proměnným, aby se buď minimalizovalo, nebo maximalizovalo pro dané přiřazení proměnných.
Kontext
A kontext je přiřazení proměnné pro DCOP. Lze to považovat za funkci mapující proměnné v DCOP na jejich aktuální hodnoty:
Všimněte si, že kontext je v podstatě částečné řešení a nemusí obsahovat hodnoty pro každý proměnná v problému; proto, znamená, že agent dosud nepřiřadil hodnotu proměnné . Vzhledem k tomuto zastoupenídoména " (tj., sada vstupních hodnot) funkce F
lze považovat za soubor všech možných kontextů pro DCOP. Proto ve zbývající části tohoto článku můžeme použít pojem kontext (tj., funkce) jako vstup do funkce.
Ukázkové problémy
Distribuované zbarvení grafu
The zbarvení grafu problém je následující: daný a graf a sada barev , přiřadit každý vrchol, , barva, , takže je minimalizován počet sousedních vrcholů se stejnou barvou.
Jako DCOP existuje jeden agent na vrchol, který je přiřazen k rozhodnutí o přidružené barvě. Každý agent má jednu proměnnou, jejíž přidružená doména je mohutnost (pro každou možnou barvu existuje jedna hodnota domény). Pro každý vrchol , vytvořte proměnnou v DCOP s doménou . Pro každou dvojici sousedních vrcholů , vytvořte omezení ceny 1, pokud mají obě přidružené proměnné přiřazenu stejnou barvu:
Cílem tedy je minimalizovat .
Distribuovaný problém s více batohy
The distribuováno více varianta batoh problém je následující: vzhledem k sadě položek s různým objemem a sadě batohů s různou kapacitou přiřaďte každou položku k batohu tak, aby bylo minimalizováno množství přetečení. Nechat být souborem položek, být sadou batohů, být funkcí mapující položky na jejich objem a být funkcí mapující batohy na jejich kapacitu.
Chcete-li tento problém kódovat jako DCOP, pro každou z nich vytvořit jednu proměnnou s přidruženou doménou . Pak pro všechny možné kontexty :
kde je funkce taková, že
Algoritmy
Algoritmy DCOP lze klasifikovat podle vyhledávací strategie (nejlepší vyhledávání první nebo hloubkové vyhledávání větví a vazeb), synchronizace mezi agenty (synchronní nebo asynchronní), komunikace mezi agenty (bod-bod se sousedy v graf omezení nebo vysílání) a hlavní topologie komunikace (řetězec nebo strom).[3]Například ADOPT používá jako první topologii vyhledávání vyhledávání podle první, asynchronní synchronizaci, komunikaci mezi dvěma sousedními agenty v grafu omezení a strom omezení.
Název algoritmu | Rok představen | Složitost paměti | Počet zpráv | Správnost (informatika) / Úplnost (logika) | Implementace |
---|---|---|---|---|---|
NCBB Pobočka bez závazků a vázaná[4] | 2006 | Polynomiální (nebo jakýkoli prostor[5]) | Exponenciální | Osvědčený | Referenční implementace: není veřejně zveřejněno |
DPOP Distribuovaný postup optimalizace pseudotree[6] | 2005 | Exponenciální | Lineární | Osvědčený | Referenční implementace: FRODO (GNU Affero GPL ) |
OptAPO Asynchronní částečné překrytí[7] | 2004 | Polynomiální | Exponenciální | Osvědčeno, ale byl zpochybněn důkaz úplnosti[8] | Referenční implementace: „OptAPO“. Centrum umělé inteligence. SRI International. Archivovány od originál dne 2007-07-15. |
Přijmout Asynchronní zpětné sledování[9] | 2003 | Polynomiální (nebo jakýkoli prostor[10]) | Exponenciální | Osvědčený | Referenční implementace: Přijmout |
Zabezpečený výpočet více stran pro řešení disCSP (MPC-DisCSP1-MPC-DisCSP4)[Citace je zapotřebí ] | 2003 | [Citace je zapotřebí ] | [Citace je zapotřebí ] | Poznámka: zabezpečeno, pokud 1/2 účastníků je důvěryhodných | [Citace je zapotřebí ] |
Zabezpečený výpočet s polodůvěryhodnými servery[Citace je zapotřebí ] | 2002 | [Citace je zapotřebí ] | [Citace je zapotřebí ] | Poznámka: Bezpečnost se zvyšuje s počtem důvěryhodných serverů | [Citace je zapotřebí ] |
ABTR[Citace je zapotřebí ] Asynchronní zpětné sledování s přeuspořádáním | 2001 | [Citace je zapotřebí ] | [Citace je zapotřebí ] | Poznámka: řazení v ABT s ohraničenými nogoody | [Citace je zapotřebí ] |
DMAC[Citace je zapotřebí ] Údržba asynchronně konzistence | 2001 | [Citace je zapotřebí ] | [Citace je zapotřebí ] | Poznámka: nejrychlejší algoritmus | [Citace je zapotřebí ] |
AAS[Citace je zapotřebí ] Asynchronní agregační vyhledávání | 2000 | [Citace je zapotřebí ] | [Citace je zapotřebí ] | agregace hodnot v ABT | [Citace je zapotřebí ] |
DFC[Citace je zapotřebí ] Distribuované dopředné řetězení | 2000 | [Citace je zapotřebí ] | [Citace je zapotřebí ] | Poznámka: nízká, srovnatelná s ABT | [Citace je zapotřebí ] |
DBA Distribuovaný Breakout Algoritmus | 1995 | [Citace je zapotřebí ] | [Citace je zapotřebí ] | Poznámka: neúplné, ale rychlé | FRODO verze 1[trvalý mrtvý odkaz ] |
AWC[Citace je zapotřebí ] Asynchronní slabý závazek | 1994 | [Citace je zapotřebí ] | [Citace je zapotřebí ] | Poznámka: přeuspořádání, rychlé, úplné (pouze s exponenciálním prostorem) | [Citace je zapotřebí ] |
ABT[Citace je zapotřebí ] Asynchronní zpětné sledování | 1992 | [Citace je zapotřebí ] | [Citace je zapotřebí ] | Poznámka: statické objednávání, kompletní | [Citace je zapotřebí ] |
CFL Učení bez komunikace[11] | 2013 | Lineární | Žádný Poznámka: nejsou odesílány žádné zprávy, ale předpokládá znalosti o uspokojení místních omezení | Neúplný |
Hybridy těchto DCOP algoritmů také existují. BnB - přijmout,[3] například změní vyhledávací strategii aplikace Adopt z nejlepšího prvního vyhledávání do hloubkového prvního větveného a vázaného vyhledávání.
Viz také
Poznámky a odkazy
- ^ ""označuje napájecí sada z
- ^ "" a ""označit kartézský součin.
- ^ A b Yeoh, William; Felner, Ariel; Koenig, Sven (2008), „BnB-ADOPT: Asynchronous Branch-and-Bound DCOP Algorithm“, Sborník ze sedmé mezinárodní společné konference o autonomních agentech a multiagentních systémech, str. 591–598
- ^ Chechetka, Anton; Sycara, Katia (květen 2006), „Větev bez závazků a vázané vyhledávání pro optimalizaci distribuovaných omezení“ (PDF), Sborník z páté mezinárodní společné konference o autonomních agentech a multiagentních systémech, str. 1427–1429
- ^ Chechetka, Anton; Sycara, Katia (březen 2006), „Algoritmus libovolného prostoru pro optimalizaci distribuovaných omezení“ (PDF), Proceedings of the AAAI Spring Symposium on Distributed Plan and Schedule Management
- ^ Petcu, Adrian; Faltings, Boi (srpen 2005), „DPOP: Škálovatelná metoda pro optimalizaci multiagentních omezení“, Sborník 19. mezinárodní společné konference o umělé inteligenci, IJCAI 2005, Edinburgh, Skotsko, s. 266-271
- ^ Mailler, Roger; Lesser, Victor (2004), „Řešení problémů s optimalizací distribuovaných omezení pomocí kooperativní mediace“ (PDF), Sborník ze třetí mezinárodní společné konference o autonomních agentech a multiagentních systémech, IEEE Computer Society, str. 438–445
- ^ Grinshpoun, Tal; Zazon, Moshe; Binshtok, Maxim; Meisels, Amnon (2007), „Problém s ukončením algoritmu APO“ (PDF), Sborník příspěvků z osmého mezinárodního semináře o uvažování o distribuovaném omezení, str. 117–124
- ^ Původně publikovaná verze aplikace Adopt byla neinformovaná, vizModi, Pragnesh Jay; Shen, Wei-Min; Tambe, Milind; Yokoo, Makoto (2003), "Asynchronní úplná metoda pro optimalizaci distribuovaných omezení" (PDF), Sborník z druhé mezinárodní společné konference o autonomních agentech a multiagentních systémech, ACM Stiskněte, str. 161–168. Původní verze aplikace Adopt byla později rozšířena, aby byla informována, to znamená použít odhady nákladů na řešení k zaměření vyhledávání a rychlejšímu spuštění, vizAli, Syed; Koenig, Sven; Tambe, Milind (2005), „Techniky předzpracování pro zrychlení algoritmu DCOP ADOPT“ (PDF), Sborník ze čtvrté mezinárodní společné konference o autonomních agentech a multiagentních systémech, ACM Stiskněte, str. 1041–1048. Toto rozšíření Adopt se obvykle používá jako referenční implementace Adopt.
- ^ Matsui, Toshihiro; Matsuo, Hiroši; Iwata, Akira (únor), „Efektivní metoda pro asynchronní algoritmus optimalizace distribuovaných omezení“ (PDF), Sborník umělé inteligence a aplikací, str. 727–732 Zkontrolujte hodnoty data v:
| datum =
a| rok = / | datum = nesoulad
(Pomoc) - ^ Duffy, K.R .; Leith, D.J. (Srpen 2013), „Decentralizovaná omezení spokojenosti“, Transakce IEEE / ACM v síti, 21 (4), 21, str. 1298–1308, arXiv:1103.3240, doi:10.1109 / TNET.2012.2222923
Knihy a průzkumy
- Fioretto, Ferdinando; Pontelli, Enrico; Yeoh, William (2018), „Problémy a aplikace s optimalizací distribuovaných omezení: průzkum“, Journal of Artificial Intelligence Research, 61: 623–698, arXiv:1602.06347, doi:10.1613 / jair.5565
- Faltings, Boi (2006), „Programování distribuovaných omezení“, ve Walsh, Toby (ed.), Příručka programování omezení, Elsevier, ISBN 978-0-444-52726-4 Kapitola v upravené knize.
- Meisels, Amnon (2008), Distribuované vyhledávání omezenými agenty, Springer, ISBN 978-1-84800-040-7
- Shoham, Yoav; Leyton-Brown, Kevin (2009), Multiagentní systémy: Algoritmické, herně teoretické a logické základy, New York: Cambridge University Press, ISBN 978-0-521-89943-7 Viz kapitoly 1 a 2; ke stažení zdarma online.
- Yokoo, Makoto (2001), Spokojenost s distribuovaným omezením: Základy spolupráce v systémech s více agenty, Springer, ISBN 978-3-540-67596-9
- Yokoo, M. a Hirayama, K. (2000). Algoritmy pro uspokojení distribuovaných omezení: Přehled. Sborník z mezinárodní společné konference o autonomních agentech a multiagentních systémech (str. 185–207). Průzkum.