Metrický K-střed - Metric k-center

v teorie grafů, metrický k-centrum nebo umístění metrického zařízení problém je kombinatorická optimalizace problém studoval v teoretická informatika. Dáno n města se specifikovanými vzdálenostmi chce člověk stavět k sklady v různých městech a minimalizovat maximální vzdálenost města od skladu. V teorii grafů to znamená nalezení množiny k vrcholy, pro které je největší vzdálenost kteréhokoli bodu k jeho nejbližšímu vrcholu v k-set je minimum. Vrcholy musí být v metrickém prostoru, za předpokladu, že kompletní graf který uspokojuje nerovnost trojúhelníku.

Formální definice

Nechat být metrický prostor kde je sada a je metrický
Sada , je poskytován společně s parametrem . Cílem je najít podmnožinu s tak, aby maximální vzdálenost bodu v do nejbližšího bodu v je minimalizován. Problém lze formálně definovat takto:
Pro metrický prostor (, d),

  • Vstup: sada a parametr .
  • Výstup: sada z bodů.
  • Cíl: Minimalizovat náklady d (v,)

To znamená, že každý bod v klastru je nanejvýš ve vzdálenosti z příslušného středu. [1]

Problém k-Center Clustering lze definovat také na úplném neorientovaném grafu G = (PROTIE) jak následuje:
Vzhledem k úplnému neorientovanému grafu G = (PROTIE) se vzdálenostmi d(protiiprotij) ∈ N uspokojení nerovnosti trojúhelníku, najděte podmnožinu C ⊆ PROTI s |C| = k při minimalizaci:

Výpočetní složitost

V úplném neorientovaném grafu G = (PROTIE), pokud seřadíme hrany v neklesajícím pořadí vzdáleností: d(E1) ≤ d(E2) ≤ … ≤ d(Em) a nechte Gi = (V,Ei), kde Ei = {E1E2, …, Ei}. The k-center problém je ekvivalentní nalezení nejmenšího indexu i takhle Gidominující sada maximálně velikosti k.[2]

Ačkoli dominující sada je NP-kompletní, k-středový problém přetrvává NP-tvrdé. To je jasné, protože optimálnost daného proveditelného řešení pro k-středový problém lze určit pomocí redukce Dominující sady pouze v případě, že víme na prvním místě velikost optimálního řešení (tj. nejmenší index i takhle Gidominující sada maximálně velikosti k), což je přesně obtížné jádro NP-tvrdý problémy.

Aproximace

Jednoduchý chamtivý algoritmus

Jednoduchý chamtivý aproximační algoritmus který dosahuje aproximačního faktoru 2 sestavení používat nejdále první průchod v k iterace. Tento algoritmus jednoduše vybere bod nejvzdálenější od aktuální sady středů v každé iteraci jako nový střed. Lze to popsat takto:

  • Vyberte libovolný bod do
  • Za každý bod vypočítat z
  • Vyberte si bod s nejvyšší vzdáleností od .
  • Přidejte jej do sady center a označte tuto rozšířenou sadu center jako . Pokračujte až do k centra jsou nalezena

Provozní doba

  • Ith iterace výběru ith centrum trvá čas.
  • Existují k takové iterace.
  • Algoritmus tedy celkově trvá čas.[3]

Prokázání aproximačního faktoru

Řešení získané pomocí jednoduchého chamtivého algoritmu je 2-aproximace optimálního řešení. Tato část se zaměřuje na prokázání tohoto přibližného faktoru.

Vzhledem k souboru n bodů , patřící do metrického prostoru (, d), chamtivý K.-centrický algoritmus vypočítá množinu K. z k centra, taková K. je 2-přiblížení k optimálnímu k-centrování shluků PROTI.

tj. [1]

Tuto větu lze dokázat pomocí dvou následujících případů,

Případ 1: Každý shluk obsahuje přesně jeden bod

  • Zvažte bod
  • Nechat být centrem, kam patří
  • Nechat být centrem to je v
  • Podobně,
  • Podle nerovnosti trojúhelníku:


Případ 2: Existují dvě centra a z které jsou oba uvnitř , pro některé (Podle principu holubí díry je to jediná další možnost)

  • Předpokládejme to, aniž bychom ztratili obecnost byl přidán později do středové sady chamtivým algoritmem, řekněme v ith opakování.
  • Ale protože chamtivý algoritmus vždy vybírá bod nejdále od aktuální sady center, máme to a,

[1]

Další dvoufaktorový aproximační algoritmus

Další algoritmus se stejným aproximačním faktorem využívá skutečnosti, že k-center problém je ekvivalentní nalezení nejmenšího indexu i takhle Gi má nejvýše dominující množinu k a vypočítá maximum nezávislá sada z Gi, hledající nejmenší index i který má maximální nezávislou množinu o velikosti alespoň k.[4]Pro žádné ε> 0 není možné najít aproximační algoritmus s aproximačním faktorem 2 - ε, pokud P = NP.[5]Dále vzdálenosti všech hran v G musí splňovat nerovnost trojúhelníku, pokud k-středový problém má být aproximován v rámci libovolného konstantního faktoru, pokud P = NP.[6]

Viz také

Reference

  1. ^ A b C Har-peled, Sariel (2011). Algoritmy geometrické aproximace. Boston, MA, USA: Americká matematická společnost. ISBN  0821849115.
  2. ^ Vazirani, Vijay V. (2003), Aproximační algoritmy, Berlín: Springer, s. 47–48, ISBN  3-540-65367-8
  3. ^ Gonzalez, Teofilo F. (1985), „Shlukování, aby se minimalizovala maximální vzdálenost mezi klastry“, Teoretická informatika, 38, Elsevier Science B.V., str. 293–306, doi:10.1016/0304-3975(85)90224-5
  4. ^ Hochbaum, Dorit S.; Shmoys, David B. (1986), „Jednotný přístup k aproximačním algoritmům pro problémy s úzkým hrdlem“, Deník ACM, 33, str. 533–550, ISSN  0004-5411
  5. ^ Hochbaum, Dorit S. (1997), Aproximační algoritmy pro NP-Hard problémy, Boston: PWS Publishing Company, s. 346–398, ISBN  0-534-94968-1
  6. ^ Crescenzi, Pierluigi; Kann, Viggo; Halldórsson, Magnús; Karpinski, Marek; Woeginger, Gerhard (2000), „Minimum k-center“, Kompendium problémů s optimalizací NP

Další čtení