Metrický K-střed - Metric k-center
v teorie grafů, metrický k-centrum nebo umístění metrického zařízení problém je kombinatorická optimalizace problém studoval v teoretická informatika. Dáno n města se specifikovanými vzdálenostmi chce člověk stavět k sklady v různých městech a minimalizovat maximální vzdálenost města od skladu. V teorii grafů to znamená nalezení množiny k vrcholy, pro které je největší vzdálenost kteréhokoli bodu k jeho nejbližšímu vrcholu v k-set je minimum. Vrcholy musí být v metrickém prostoru, za předpokladu, že kompletní graf který uspokojuje nerovnost trojúhelníku.
Formální definice
Nechat být metrický prostor kde je sada a je metrický
Sada , je poskytován společně s parametrem . Cílem je najít podmnožinu s tak, aby maximální vzdálenost bodu v do nejbližšího bodu v je minimalizován. Problém lze formálně definovat takto:
Pro metrický prostor (, d),
- Vstup: sada a parametr .
- Výstup: sada z bodů.
- Cíl: Minimalizovat náklady d (v,)
To znamená, že každý bod v klastru je nanejvýš ve vzdálenosti z příslušného středu. [1]
Problém k-Center Clustering lze definovat také na úplném neorientovaném grafu G = (PROTI, E) jak následuje:
Vzhledem k úplnému neorientovanému grafu G = (PROTI, E) se vzdálenostmi d(protii, protij) ∈ N uspokojení nerovnosti trojúhelníku, najděte podmnožinu C ⊆ PROTI s |C| = k při minimalizaci:
Výpočetní složitost
V úplném neorientovaném grafu G = (PROTI, E), pokud seřadíme hrany v neklesajícím pořadí vzdáleností: d(E1) ≤ d(E2) ≤ … ≤ d(Em) a nechte Gi = (V,Ei), kde Ei = {E1, E2, …, Ei}. The k-center problém je ekvivalentní nalezení nejmenšího indexu i takhle Gi má dominující sada maximálně velikosti k.[2]
Ačkoli dominující sada je NP-kompletní, k-středový problém přetrvává NP-tvrdé. To je jasné, protože optimálnost daného proveditelného řešení pro k-středový problém lze určit pomocí redukce Dominující sady pouze v případě, že víme na prvním místě velikost optimálního řešení (tj. nejmenší index i takhle Gi má dominující sada maximálně velikosti k), což je přesně obtížné jádro NP-tvrdý problémy.
Aproximace
Jednoduchý chamtivý algoritmus
Jednoduchý chamtivý aproximační algoritmus který dosahuje aproximačního faktoru 2 sestavení používat nejdále první průchod v k iterace. Tento algoritmus jednoduše vybere bod nejvzdálenější od aktuální sady středů v každé iteraci jako nový střed. Lze to popsat takto:
- Vyberte libovolný bod do
- Za každý bod vypočítat z
- Vyberte si bod s nejvyšší vzdáleností od .
- Přidejte jej do sady center a označte tuto rozšířenou sadu center jako . Pokračujte až do k centra jsou nalezena
Provozní doba
- Ith iterace výběru ith centrum trvá čas.
- Existují k takové iterace.
- Algoritmus tedy celkově trvá čas.[3]
Prokázání aproximačního faktoru
Řešení získané pomocí jednoduchého chamtivého algoritmu je 2-aproximace optimálního řešení. Tato část se zaměřuje na prokázání tohoto přibližného faktoru.
Vzhledem k souboru n bodů , patřící do metrického prostoru (, d), chamtivý K.-centrický algoritmus vypočítá množinu K. z k centra, taková K. je 2-přiblížení k optimálnímu k-centrování shluků PROTI.
tj. [1]
Tuto větu lze dokázat pomocí dvou následujících případů,
Případ 1: Každý shluk obsahuje přesně jeden bod
- Zvažte bod
- Nechat být centrem, kam patří
- Nechat být centrem to je v
- Podobně,
- Podle nerovnosti trojúhelníku:
Případ 2: Existují dvě centra a z které jsou oba uvnitř , pro některé (Podle principu holubí díry je to jediná další možnost)
- Předpokládejme to, aniž bychom ztratili obecnost byl přidán později do středové sady chamtivým algoritmem, řekněme v ith opakování.
- Ale protože chamtivý algoritmus vždy vybírá bod nejdále od aktuální sady center, máme to a,
Další dvoufaktorový aproximační algoritmus
Další algoritmus se stejným aproximačním faktorem využívá skutečnosti, že k-center problém je ekvivalentní nalezení nejmenšího indexu i takhle Gi má nejvýše dominující množinu k a vypočítá maximum nezávislá sada z Gi, hledající nejmenší index i který má maximální nezávislou množinu o velikosti alespoň k.[4]Pro žádné ε> 0 není možné najít aproximační algoritmus s aproximačním faktorem 2 - ε, pokud P = NP.[5]Dále vzdálenosti všech hran v G musí splňovat nerovnost trojúhelníku, pokud k-středový problém má být aproximován v rámci libovolného konstantního faktoru, pokud P = NP.[6]
Viz také
- Problém obchodního cestujícího
- Minimální k-řez
- Dominující sada
- Nezávislá množina (teorie grafů)
- Problém s umístěním zařízení
Reference
- ^ A b C Har-peled, Sariel (2011). Algoritmy geometrické aproximace. Boston, MA, USA: Americká matematická společnost. ISBN 0821849115.
- ^ Vazirani, Vijay V. (2003), Aproximační algoritmy, Berlín: Springer, s. 47–48, ISBN 3-540-65367-8
- ^ Gonzalez, Teofilo F. (1985), „Shlukování, aby se minimalizovala maximální vzdálenost mezi klastry“, Teoretická informatika, 38, Elsevier Science B.V., str. 293–306, doi:10.1016/0304-3975(85)90224-5
- ^ Hochbaum, Dorit S.; Shmoys, David B. (1986), „Jednotný přístup k aproximačním algoritmům pro problémy s úzkým hrdlem“, Deník ACM, 33, str. 533–550, ISSN 0004-5411
- ^ Hochbaum, Dorit S. (1997), Aproximační algoritmy pro NP-Hard problémy, Boston: PWS Publishing Company, s. 346–398, ISBN 0-534-94968-1
- ^ Crescenzi, Pierluigi; Kann, Viggo; Halldórsson, Magnús; Karpinski, Marek; Woeginger, Gerhard (2000), „Minimum k-center“, Kompendium problémů s optimalizací NP
Další čtení
- Hochbaum, Dorit S.; Shmoys, David B. (1985), „Nejlepší možná heuristika pro problém k-centra“, Matematika operačního výzkumu, 10, s. 180–184