Clique problém - Clique problem

The algoritmus hrubé síly najde 4 kliky v tomto 7-vrcholném grafu (doplněk 7-vrcholu) graf cesty ) systematickou kontrolou všech C (7,4) = 35 4-vrcholných podgrafů pro úplnost.

v počítačová věda, klika problém je výpočetní problém hledání kliky (podmnožiny vrcholů, všechny přilehlý navzájem, také volal kompletní podgrafy ) v graf. Má několik různých formulací podle toho, které kliky a jaké informace o klikách by se měly najít. Mezi běžné formulace problému s klikou patří nalezení a maximální klika (klika s největším možným počtem vrcholů), nalezení kliky o maximální hmotnosti ve váženém grafu se seznamem všech maximální kliky (kliky, které nelze zvětšit) a řešení rozhodovací problém testování, zda graf obsahuje kliku větší než daná velikost.

Problém s klikami nastává v následujícím reálném prostředí. Zvažte a sociální síť, kde je graf vrcholy představují lidi a grafy hrany představují vzájemné seznámení. Potom klika představuje podmnožinu lidí, kteří se navzájem znají, a k vyhledání těchto skupin společných přátel lze použít algoritmy pro nalezení kliky. Spolu se svými aplikacemi v sociálních sítích má problém s klikami také mnoho aplikací v bioinformatika, a výpočetní chemie.

Většina verzí problému s klikami je těžká. Problém rozhodování o klikání je NP-kompletní (jeden z Karpových 21 NP-úplných problémů ). Problém nalezení maximální kliky je obojí pevný parametr nepoddajný a těžko aproximovat. Seznam všech maximálních kliků může vyžadovat exponenciální čas protože existují grafy s exponenciálně mnoha maximálními klikami. Proto se velká část teorie o problému klikání věnuje identifikaci speciálních typů grafů, které připouštějí efektivnější algoritmy, nebo stanovení výpočetní obtížnosti obecného problému v různých modelech výpočtu.

K nalezení maximální kliky lze systematicky kontrolovat všechny podmnožiny, ale tento druh vyhledávání hrubou silou je příliš časově náročné na to, aby to bylo praktické pro sítě zahrnující více než několik desítek vrcholů. Ačkoli ne polynomiální čas algoritmus je pro tento problém známý, efektivnější algoritmy než je známo vyhledávání hrubou silou. Například Bron – Kerboschův algoritmus lze použít k vypsání všech maximálních klik v nejhorším optimálním čase a je také možné je vypsat v polynomiálním čase na jednu klik.

Historie a aplikace

Studium úplných podgrafů v matematice předchází „klikatou“ terminologii. Například úplné podgrafy se brzy objevují v matematické literatuře v graficko-teoretické formulaci Ramseyova teorie podle Erdős & Szekeres (1935). Termín „klika“ a problém algoritmického vypisování kliek však pocházejí ze společenských věd, kde se k modelování používají úplné podgrafy sociální kliky, skupiny lidí, kteří se navzájem znají. Luce & Perry (1949) použil grafy k modelování sociálních sítí a přizpůsobil terminologii společenských věd teorii grafů. Jako první nazývali úplné podgrafy „klikami“. První algoritmus pro řešení problému s klikou je algoritmus Harary & Ross (1957),[1] kteří byli motivováni sociologickou aplikací. Vědci v oblasti sociální vědy také definovali různé další typy klik a maximálních klik v sociální síti, „soudržné podskupiny“ lidí nebo aktérů v síti, z nichž všichni sdílejí jeden z několika různých druhů vztahu konektivity. Mnoho z těchto zobecněných pojmů kliky lze najít také vytvořením neorientovaného grafu, jehož hrany představují související dvojice aktérů ze sociální sítě, a poté aplikováním algoritmu pro problém kliky na tento graf.[2]

Od práce Hararyho a Rosse mnozí další vymysleli algoritmy pro různé verze problému s klikami.[1] V sedmdesátých letech začali vědci studovat tyto algoritmy z hlediska nejhorší analýza. Viz například Tarjan & Trojanowski (1977), raná práce na nejhorším případě složitosti problému s maximální klikou. Také v 70. letech, počínaje prací Cook (1971) a Karp (1972), začali vědci používat teorii NP-úplnost a související výsledky neřešitelnosti, aby poskytly matematické vysvětlení vnímané obtížnosti problému kliky. V 90. letech 20. století začala průlomová řada příspěvků Feige a kol. (1991) a nahlášeno v The New York Times,[3] ukázal, že (za předpokladu P ≠ NP ) to ani není možné přibližný problém přesně a efektivně.

Algoritmy pro vyhledání kliky byly použity v chemie, abyste našli chemikálie, které odpovídají cílové struktuře[4] a modelovat molekulární dokování a vazebná místa chemických reakcí.[5] Mohou být také použity k nalezení podobných struktur v různých molekulách.[6]V těchto aplikacích jeden tvoří graf, ve kterém každý vrchol představuje párový atom, jeden z každé ze dvou molekul. Dva vrcholy jsou spojeny hranou, pokud jsou shody, které představují, vzájemně kompatibilní. Být kompatibilní může znamenat například to, že vzdálenosti mezi atomy uvnitř dvou molekul jsou přibližně stejné, v rámci určité dané tolerance. Klika v tomto grafu představuje sadu spárovaných párů atomů, ve kterých jsou všechny shody navzájem kompatibilní.[7] Zvláštním případem této metody je použití modulární součin grafů snížit problém hledání maximální společný indukovaný podgraf dvou grafů k problému nalezení maximální kliky v jejich produktu.[8]

v automatické generování testovacího vzoru, nalezení klik může pomoci omezit velikost testovací sady.[9] v bioinformatika, k odvození byly použity algoritmy pro vyhledání klik evoluční stromy,[10] předpovídat proteinové struktury,[11] a najít úzce interagující shluky proteinů.[12] Výpis kliků v a graf závislosti je důležitým krokem v analýze určitých náhodných procesů.[13] V matematice Kellerova domněnka na obklad tváří v tvář hyperkrychle byl vyvrácen uživatelem Lagarias & Shor (1992), který použil algoritmus pro vyhledání kliky na přidruženém grafu k nalezení protipříkladu.[14]

Definice

Zobrazený graf obsahuje jednu maximální kliku, trojúhelník {1,2,5} a další čtyři maximální kliky, páry {2,3}, {3,4}, {4,5} a {4,6} .

An neorientovaný graf je tvořen a konečná množina z vrcholy a sada neuspořádané páry vrcholů, které se nazývají hrany. Podle konvence je v analýze algoritmů počet vrcholů v grafu označen n a počet hran je označen m. A klika v grafu G je kompletní podgraf z G. To znamená, že se jedná o podmnožinu K. vrcholů tak, že každé dva vrcholy v K. jsou dva koncové body hrany v G. A maximální klika je klika, do které nelze přidat žádné další vrcholy. Pro každý vrchol proti která není součástí maximální kliky, musí existovat další vrchol w který je v klice a nesousedí s proti, prevence proti od přidání do kliky. A maximální klika je klika, která zahrnuje největší možný počet vrcholů. Číslo kliky ω(G) je počet vrcholů v maximální klikě G.[1]

Bylo studováno několik úzce souvisejících problémů s hledáním klik.[15]

  • V problému maximální kliky je vstupem neorientovaný graf a výstupem je maximální klika v grafu. Pokud existuje více maximálních klik, může být jedna z nich zvolena libovolně.[15]
  • V problému váženého maxima kliky je vstupem neorientovaný graf s váhami na jeho vrcholech (nebo méně často na okrajích) a výstupem je klika s maximální celkovou hmotností. Problémem maximální kliky je speciální případ, kdy jsou všechny váhy stejné.[16] Kromě problému optimalizace součtu vah byly studovány také další komplikovanější problémy s optimalizací dvoukritérií.[17]
  • V problému se seznamem maximálních klik je vstupem neorientovaný graf a výstupem je seznam všech jeho maximálních klik. Problém maximální kliky lze vyřešit pomocí podprogramu algoritmu pro problém se seznamem maximálních kliky, protože maximální klika musí být zahrnuta mezi všechny maximální kliky.[18]
  • V k-klikový problém, vstupem je neorientovaný graf a číslo k. Výstupem je klika s k vrcholy, pokud existují, nebo speciální hodnota označující, že neexistuje k-klika jinak. V některých variantách tohoto problému by měl výstup obsahovat seznam všech velikostí klik k.[19]
  • V problému s rozhodnutím o klikání je vstupem neorientovaný graf a číslo ka výstup je a Booleovská hodnota: true, pokud graf obsahuje a k-klika a jinak false.[20]

První čtyři z těchto problémů jsou všechny důležité v praktických aplikacích. Problém rozhodování o klikách nemá praktický význam; je formulován tímto způsobem za účelem uplatnění teorie NP-úplnost k problémům s hledáním klik.[20]

Problém kliky a problém nezávislé množiny se doplňují: klika dovnitř G je nezávislá sada v doplňkový graf z G a naopak.[21] Proto lze mnoho výpočtových výsledků aplikovat stejně dobře na oba problémy a některé výzkumné práce tyto dva problémy jasně nerozlišují. Tyto dva problémy však mají odlišné vlastnosti při použití na omezené rodiny grafů. Například problém kliky lze vyřešit v polynomiálním čase pro rovinné grafy[22] zatímco problém nezávislých množin zůstává na rovinných grafech NP-tvrdý.[23]

Algoritmy

Nalezení jediné maximální kliky

A maximální klika, někdy nazývaná inkluze-maximální, je klika, která není zahrnuta do větší kliky. Proto je každá klika obsažena v maximální klice.[24]Maximální kliky mohou být velmi malé. Graf může obsahovat ne-maximální kliku s mnoha vrcholy a samostatnou kliku o velikosti 2, která je maximální. Zatímco maximální (tj. Největší) klika je nutně maximální, konverzace neplatí. Existují některé typy grafů, ve kterých je každá maximální klika maximální; tohle jsou doplňuje z dobře pokryté grafy, ve kterém je každá maximální nezávislá množina maximální.[25]Jiné grafy však mají maximální kliky, které nejsou maximální.

Jedinou maximální kliku najdete přímo chamtivý algoritmus. Počínaje libovolnou klikou (například libovolný jeden vrchol nebo dokonce prázdná množina) zvětšete aktuální kliku po jednom vrcholu procházením zbývajícími vrcholy grafu. Pro každý vrchol proti které tato smyčka zkoumá, přidejte proti do kliky, pokud sousedí s každým vrcholem, který je již v klice, a zahodit proti v opačném případě. Tento algoritmus běží lineární čas.[26] Kvůli snadnému nalezení maximálních klik a jejich potenciálně malé velikosti byla věnována větší pozornost mnohem těžšímu algoritmickému problému s hledáním maximální nebo jinak velké kliky, než tomu bylo věnováno problému s nalezením jediné maximální kliky. nějaký výzkum v paralelní algoritmy studoval problém nalezení maximální kliky. Zejména problém najít lexikograficky první Ukázalo se, že maximální klika (nalezená algoritmem výše) kompletní pro třída polynomiálně-časových funkcí. Tento výsledek naznačuje, že je nepravděpodobné, že by problém byl řešitelný v rámci paralelní třídy složitosti NC.[27]

Kliky pevné velikosti

Lze otestovat, zda graf G obsahuje a k-vertexová klika a pomocí a. najděte jakoukoli takovou kliku, kterou obsahuje algoritmus hrubé síly. Tento algoritmus zkoumá každý podgraf s k vrcholy a zkontroluje, zda tvoří kliku. Chce to čas Ó(nk k2), vyjádřeno pomocí velká O notace Je to proto, že existují Ó(nk) podgrafy ke kontrole, z nichž každý má Ó(k2) hrany, jejichž přítomnost v G je třeba zkontrolovat. Problém tedy lze vyřešit v polynomiální čas kdykoli k je pevná konstanta. Kdy však k nemá pevnou hodnotu, ale místo toho se může lišit jako součást vstupu do problému, čas je exponenciální.[28]

Nejjednodušším netriviálním případem problému s nalezením kliky je nalezení trojúhelníku v grafu nebo ekvivalentní určení, zda je graf bez trojúhelníků.V grafu G s m hran, může jich být maximálně Θ (m3/2) trojúhelníky (pomocí velká theta notace což naznačuje, že tato vazba je těsná). Nejhorší případ pro tento vzorec nastane, když G je sama klika. Algoritmy pro vypsání všech trojúhelníků proto musí trvat alespoň Ω (m3/2) čas v nejhorším případě (pomocí velká omega notace ) a jsou známy algoritmy, které odpovídají této časové vazbě.[29] Například, Chiba a Nishizeki (1985) popsat algoritmus, který třídí vrcholy v pořadí od nejvyššího stupně po nejnižší a poté iteruje každým vrcholem proti v seřazeném seznamu hledejte trojúhelníky, které obsahují proti a do seznamu nezahrnují žádný předchozí vrchol. K tomu algoritmus označí všechny sousedy proti, prohledá všechny hrany dopadající na souseda proti výstup trojúhelníku pro každou hranu, která má dva označené koncové body, a poté značky odstraní a odstraní proti z grafu. Jak ukazují autoři, čas pro tento algoritmus je úměrný času arboricita grafu (označeno A(G)) vynásobený počtem hran, což je Ó(m A(G)). Protože arboricita je nanejvýš Ó(m1/2), tento algoritmus běží v čase Ó(m3/2). Obecněji vše k-vertexové kliky lze vypsat podobným algoritmem, který zabere čas úměrný počtu hran vynásobený arboricitou k síle (k − 2). Pro grafy s konstantní arboricitou, jako jsou rovinné grafy (nebo obecně grafy z jiných než triviálních) malá uzavřená rodina grafů ), tento algoritmus trvá Ó(m) čas, který je optimální, protože je lineární ve velikosti vstupu.[19]

Pokud si přejete pouze jeden trojúhelník nebo ujištění, že graf neobsahuje trojúhelníky, jsou možné rychlejší algoritmy. Tak jako Itai & Rodeh (1978) pozorovat, graf obsahuje trojúhelník právě tehdy, je-li jeho matice sousedství a čtverec matice sousedství obsahuje nenulové položky ve stejné buňce. Proto techniky rychlého násobení matic, jako je Coppersmith – Winogradův algoritmus lze použít k nalezení trojúhelníků v čase Ó(n2.376). Alon, Yuster & Zwick (1994) použil rychlé násobení matic ke zlepšení Ó(m3/2) algoritmus pro hledání trojúhelníků do Ó(m1.41). Tyto algoritmy založené na rychlém násobení matic byly také rozšířeny na problémy hledání k-kliky pro větší hodnoty k.[30]

Seznam všech maximálních kliků

Výsledkem Moon & Moser (1965), každý n-vertexový graf má maximálně 3n/3 maximální kliky. Mohou být uvedeny podle Bron – Kerboschův algoritmus, rekurzivní ustoupit postup Bron & Kerbosch (1973). Hlavní rekurzivní podprogram tohoto postupu má tři argumenty: částečně vytvořenou (ne-maximální) kliku, sadu kandidátských vrcholů, které lze přidat do kliky, a další sadu vrcholů, které by neměly být přidány (protože by to vedlo do kliky, která již byla nalezena). Algoritmus se pokusí přidat kandidátní vrcholy jeden po druhém do částečné kliky, čímž provede rekurzivní volání pro každý z nich. Po vyzkoušení každého z těchto vrcholů ji přesune na sadu vrcholů, které by se neměly znovu přidávat. Je možné ukázat, že varianty tohoto algoritmu mají nejhorší dobu běhu Ó(3n/3), což odpovídá počtu kliků, které mohou být uvedeny.[31] Proto to poskytuje nejhorší případ optimálního řešení problému se seznamem všech maximálních klik. Dále se uvádí, že algoritmus Bron – Kerbosch je v praxi rychlejší než jeho alternativy.[32]

Pokud je však počet klik výrazně nižší než v nejhorším případě, mohou být vhodnější jiné algoritmy. Tak jako Tsukiyama a kol. (1977) ukázáno, je také možné vypsat všechny maximální kliky v grafu v čase, který je polynomický na vygenerovanou kliku. Algoritmus, jako je jejich, ve kterém doba běhu závisí na velikosti výstupu, je známý jako algoritmus citlivý na výstup. Jejich algoritmus je založen na následujících dvou pozorováních, týkajících se maximálních klik daného grafu G na maximální kliky grafu G \ proti vytvořený odstraněním libovolného vrcholu proti z G:

  • Pro každou maximální kliku K. z G \ proti, buď K. pokračuje ve vytváření maximální kliky Gnebo K. ⋃ {proti} tvoří maximální klik G. Proto, G má alespoň tolik maximálních kliků jako G \ proti dělá.
  • Každá maximální klika G který neobsahuje proti je maximální klika v G \ protia každá maximální klika dovnitř G který obsahuje proti lze vytvořit z maximální kliky K. v G \ proti přidáváním proti a odstranění nesousedů z proti z K..

Pomocí těchto pozorování mohou generovat všechny maximální kliky G rekurzivním algoritmem, který zvolí vrchol proti libovolně a poté pro každou maximální kliku K. v G \ proti, výstupy oba K. a klika vytvořená přidáním proti na K. a odstranění nesousedů z proti. Některé kliky z G lze generovat tímto způsobem z více než jedné nadřazené kliky G \ proti, takže eliminují duplikáty výstupem kliky dovnitř G pouze když je jeho rodič v G \ proti je lexikograficky maximum ze všech možných nadřazených klik. Na základě tohoto principu ukazují, že všechny maximální kliky jsou v G mohou být generovány včas Ó(mn) na kliku, kde m je počet hran v G a n je počet vrcholů. Chiba a Nishizeki (1985) vylepšit to Ó(ma) na kliku, kde A je arboricita daného grafu. Makino & Uno (2004) poskytují alternativní algoritmus citlivý na výstup založený na rychlém násobení matic. Johnson & Yannakakis (1988) ukázat, že je dokonce možné vypsat všechny maximální kliky lexikografický řád s polynomiální zpoždění na kliku. Pro efektivitu tohoto algoritmu je však důležitá volba pořadí: pro obrácení tohoto pořadí neexistuje žádný algoritmus polynomiálního zpoždění, pokud P = NP.

Na základě tohoto výsledku je možné vypsat všechny maximální kliky v polynomiálním čase pro rodiny grafů, ve kterých je počet kliček polynomiálně ohraničen. Mezi tyto rodiny patří chordální grafy, kompletní grafy, grafy bez trojúhelníků, intervalové grafy, grafy ohraničené boxicita, a rovinné grafy.[33] Zejména rovinné grafy mají Ó(n) kliky, maximálně konstantní velikosti, které mohou být uvedeny v lineárním čase. Totéž platí pro každou rodinu grafů, která je obojí řídký (s počtem hran maximálně konstantní násobkem počtu vrcholů) a Zavřeno v provozu pořizování podgrafů.[19][34]

Nalezení maxima klik v libovolných grafech

Je možné najít maximum kliky nebo číslo kliky libovolné n-vrcholový graf v čase Ó(3n/3) = Ó(1.4422n) pomocí jednoho z výše popsaných algoritmů k vypsání všech maximálních klik v grafu a vrácení největšího. U této varianty problému s klikou jsou však možné lepší nejhorší časové hranice. Algoritmus Tarjan & Trojanowski (1977) řeší tento problém včas Ó(2n/3) = Ó(1.2599n). Je to rekurzivní schéma zpětného sledování podobné schématu Bron – Kerboschův algoritmus, ale je schopen eliminovat některá rekurzivní volání, když lze prokázat, že kliky nalezené v rámci volání budou neoptimální. Jian (1986) zlepšil čas na Ó(20.304n) = Ó(1.2346n), a Robson (1986) vylepšil na Ó(20.276n) = Ó(1.2108n) času, na úkor většího využití prostoru. Robsonův algoritmus kombinuje podobné schéma zpětného sledování (s komplikovanější analýzou případů) a a dynamické programování technika, při které je předpočítáno optimální řešení pro všechny malé spojené podgrafy doplňkový graf. Tato částečná řešení se používají ke zkrácení zpětné rekurze. Nejrychlejším dnes známým algoritmem je vylepšená verze této metody od Robson (2001) který běží v čase Ó(20.249n) = Ó(1.1888n).[35]

Došlo také k rozsáhlému výzkumu heuristické algoritmy pro řešení maximálních klikových problémů bez nejhorších záruk za běhu na základě metod včetně větev a svázaný,[36] místní vyhledávání,[37] chamtivé algoritmy,[38] a programování omezení.[39] Mezi nestandardní výpočetní metodiky, které byly navrženy pro hledání klik, patří Výpočet DNA[40] a adiabatický kvantový výpočet.[41] Problém maximální kliky byl předmětem implementační výzvy sponzorované společností DIMACY v letech 1992–1993,[42] a sbírka grafů používaných jako měřítka pro výzvu, která je veřejně dostupná.[43]

Speciální třídy grafů

V tomhle permutační graf, maximální kliky odpovídají nejdelší klesající subsekvence (4,3,1) a (4,3,2) definující permutace.

Rovinné grafy a další rodiny řídkých grafů byly diskutovány výše: mají lineárně mnoho maximálních klik, omezené velikosti, které lze vypsat v lineárním čase.[19] Zejména u rovinných grafů může mít každá klika maximálně čtyři vrcholy o Kuratowského věta.[22]

Perfektní grafy jsou definovány vlastnostmi, kterým se jejich počet klik rovná chromatické číslo, a že tato rovnost platí i v každém z nich indukované podgrafy. Pro dokonalé grafy je možné najít maximální kliku v polynomiálním čase pomocí algoritmu založeného na semidefinitní programování.[44]Tato metoda je však složitá a nekombinatorní a pro mnoho podtříd dokonalých grafů byly vyvinuty specializované algoritmy pro hledání klik.[45] V doplňkové grafy z bipartitní grafy, Kőnigova věta umožňuje vyřešit maximální problém s klikou pomocí technik pro vhodný. V další třídě dokonalých grafů je permutační grafy, maximální klika je a nejdelší klesající posloupnost permutace definující graf a lze ji najít pomocí známých algoritmů pro nejdelší problém s klesající subsekvencí. Naopak každou instanci problému s nejdelší klesající subsekvencí lze ekvivalentně popsat jako problém s nalezením maximální kliky v permutačním grafu.[46] Even, Pnueli & Lempel (1972) poskytnout alternativní algoritmus kvadratického času pro maximální kliky v srovnatelné grafy, širší třída dokonalých grafů, která obsahuje permutační grafy jako speciální případ.[47] v chordální grafy, maximální kliky lze najít uvedením vrcholů v eliminačním pořadí a kontrolou kliky sousedství každého vrcholu v tomto pořadí.[48]

V některých případech lze tyto algoritmy rozšířit i na jiné nedokonalé třídy grafů. Například v a kruhový graf, sousedství každého vrcholu je permutační graf, takže maximální klika v kruhovém grafu může být nalezena použitím algoritmu permutačního grafu na každé sousedství.[49] Podobně v a graf jednotkového disku (se známým geometrickým vyjádřením) existuje polynomiální časový algoritmus pro maximální kliky založený na aplikaci algoritmu pro doplňky bipartitních grafů na sdílená sousedství dvojic vrcholů.[50]

Algoritmický problém nalezení maximální kliky v a náhodný graf čerpáno z Erdős – Rényiho model (ve kterém se každá hrana objeví s pravděpodobností 1/2, nezávisle na ostatních okrajích) navrhl Karp (1976). Protože maximální klika v náhodném grafu má logaritmickou velikost s vysokou pravděpodobností, lze ji najít vyhledáváním hrubou silou v očekávaném čase 2Ó(log2n). Tohle je kvazi-polynomiální časová vazba.[51] Přestože počet takových grafů je obvykle velmi blízký 2 log2n, jednoduché chamtivé algoritmy stejně jako sofistikovanější techniky randomizované aproximace najdou pouze kliky s velikostí log2n, napůl tak velký. Počet maximálních klik v takových grafech je s vysokou pravděpodobností exponenciální log2n, což brání metodám, které vypisují všechny maximální kliky, v polynomiálním čase.[52] Kvůli obtížnosti tohoto problému několik autorů zkoumalo zasazená klika problém, problém s klikami na náhodných grafech, které byly rozšířeny přidáním velkých klik.[53] Zatímco spektrální metody[54] a semidefinitní programování[55] dokáže detekovat skryté kliky velikosti Ω (n), v současné době nejsou známy žádné algoritmy polynomiálního času, které by detekovaly algoritmy velikosti Ó(n) (vyjádřeno pomocí malý-o zápis ).[56]

Aproximační algoritmy

Zvažovalo to několik autorů aproximační algoritmy pokus o nalezení kliky nebo nezávislé množiny, která, i když není maximální, má velikost tak blízkou maximu, jaké lze najít v polynomiálním čase. Ačkoli se velká část této práce zaměřila na nezávislé množiny v řídkých grafech, případ, který nedělá smysl pro problém doplňkové kliky, také se pracovalo na aproximačních algoritmech, které takové předpoklady řídkosti nepoužívají.[57]

Feige (2004) popisuje polynomiální časový algoritmus, který najde velikostní kliku Ω ((logn/ log logn)2) v každém grafu, který má číslo kliky Ω (n/ logkn) pro jakoukoli konstantu k. Použitím tohoto algoritmu, když je číslo kliky daného vstupního grafu mezi n/ logn a n/ log3n, přepnutí na jiný algoritmus Boppana & Halldórsson (1992) pro grafy s vyšším počtem klik a výběr dvouvertexové kliky, pokud oba algoritmy nic nenajdou, Feige poskytuje aproximační algoritmus, který najde kliku s počtem vrcholů v rámci faktoru Ó(n(log logn)2/ log3n) maxima. Ačkoliv přibližný poměr tohoto algoritmu je slabý, je dosud nejznámější.[58] Výsledky na tvrdost aproximace popsané níže naznačují, že nemůže existovat žádný aproximační algoritmus s aproximačním poměrem výrazně menším než lineární.

Dolní hranice

NP-úplnost

Instance 3-CNF Satisfiability (x ∨ x ∨ y) ∧ (~ x ∨ ~ y ∨ ~ y) ∧ (~ x ∨ y ∨ y) snížena na Clique. Zelené vrcholy tvoří 3 kliky a odpovídají uspokojivému zadání.[59]

Problém s klikovým rozhodnutím je NP-kompletní. Byl to jeden z Původních 21 problémů Richarda Karpa ukázal NP-complete ve svém článku z roku 1972 „Reducibility Among Combinatorial Problems“.[60] Tento problém byl také zmíněn v Stephen Cook příspěvek představující teorii NP-úplných problémů.[61] Kvůli tvrdosti rozhodovacího problému je problém s nalezením maximální kliky také NP-tvrdý. Pokud by to někdo dokázal vyřešit, mohl by také vyřešit problém s rozhodováním, a to porovnáním velikosti maximální kliky s parametrem size uvedeným jako vstup v problému s rozhodnutím.

Důkaz úplnosti NP společnosti Karp je a mnoho-jedna redukce z Booleovský problém uspokojivosti Popisuje, jak převést booleovské vzorce do jazyka konjunktivní normální forma (CNF) do ekvivalentních případů maximálního problému s klikou.[62]Splnitelnost se zase ukázala jako NP-úplná v EU Cook – Levinova věta. Z daného vzorce CNF vytvoří Karp graf, který má vrchol pro každou dvojici (proti,C), kde proti je proměnná nebo její negace a C je klauzule ve vzorci, který obsahuje proti. Dva z těchto vrcholů jsou spojeny hranou, pokud představují kompatibilní přiřazení proměnných pro různé klauze. To znamená, že existuje výhoda z (proti,C) na (u,d) kdykoli C ≠ d a u a proti nejsou vzájemnými negacemi. Li k označuje počet klauzulí ve vzorci CNF, poté k-vertexové kliky v tomto grafu představují konzistentní způsoby přiřazování pravdivostní hodnoty k některým jeho proměnným, aby splnil vzorec. Proto je vzorec uspokojivý právě tehdy, když a k-vertexová klika existuje.[60]

Některé NP-úplné problémy (například problém obchodního cestujícího v rovinné grafy ) lze vyřešit v čase, který je exponenciální ve sublearní funkci parametru vstupní velikosti n, výrazně rychlejší než vyhledávání hrubou silou.[63]Je však nepravděpodobné, že taková subexponenciální časová vazba je možná pro problém kliky v libovolných grafech, protože by to znamenalo podobně subexponenciální hranice pro mnoho dalších standardních NP-úplných problémů.[64]

Složitost obvodu

Monotónní obvod pro detekci a k-klika v n-vrcholový graf pro k = 3 a n = 4. Každý vstup do obvodu kóduje přítomnost nebo nepřítomnost určité (červené) hrany v grafu. Obvod používá k detekci každého potenciálu jednu interní a bránu k-klika.

Výpočtová obtížnost problému s klikou vedla k jeho použití k prokázání několika dolních mezí složitost obvodu. Existence kliky dané velikosti je a vlastnost monotónního grafu, což znamená, že pokud v daném grafu existuje klika, bude existovat v kterémkoli supergraf. Protože tato vlastnost je monotónní, musí existovat monotónní obvod, který používá pouze a brány a nebo brány, vyřešit problém s rozhodnutím kliky pro danou pevnou velikost kliky. Velikost těchto obvodů však může být prokázána jako superpolynomiální funkce počtu vrcholů a velikosti kliky, exponenciální v kořenové krychli počtu vrcholů.[65] I když malý počet NE brány jsou povoleny, složitost zůstává superpolynomiální.[66] Navíc hloubka monotónního obvodu pro problém kliky pomocí bran ohraničeného fan-in musí být ve velikosti kliky alespoň polynom.[67]

Složitost rozhodovacího stromu

Jednoduchý rozhodovací strom pro detekci přítomnosti 3 kliky ve 4-vrcholném grafu. Používá až 6 otázek ve tvaru „Existuje červená hrana?“, Odpovídající optimální hranici n(n − 1)/2.

(Deterministický) složitost rozhodovacího stromu stanovení a vlastnost grafu je počet otázek ve formuláři „Existuje hrana mezi vrcholem u a vrchol proti? ", které musí být zodpovězeny v nejhorším případě, aby bylo možné určit, zda má graf určitou vlastnost. To znamená, že se jedná o minimální výšku logické hodnoty rozhodovací strom kvůli problému. Existují n(n − 1)/2 možné otázky. Proto lze libovolnou vlastnost grafu určit nanejvýš n(n − 1)/2 otázky. Je také možné definovat složitost vlastnosti náhodného a kvantového rozhodovacího stromu, očekávaný počet otázek (pro vstup v nejhorším případě), na které musí náhodný nebo kvantový algoritmus odpovědět, aby správně určil, zda daný graf má vlastnost .[68]

Protože vlastnost obsahující kliku je monotónní, je pokryta Aanderaa – Karp – Rosenbergova domněnka, který uvádí, že deterministická složitost rozhodovacího stromu při určování jakékoli netriviální vlastnosti monotónního grafu je přesná n(n − 1)/2. Pro vlastnosti libovolného monotónního grafu zůstává tato domněnka neprokázaná. Pro deterministické rozhodovací stromy a pro všechny k v dosahu 2 ≤ kn, vlastnost obsahující a k-klique bylo prokázáno, že má složitost rozhodovacího stromu přesně n(n − 1)/2 podle Bollobás (1976). Deterministické rozhodovací stromy také vyžadují exponenciální velikost pro detekci klik, nebo velkou velikost polynomu pro detekci klik s omezenou velikostí.[69]

Domněnka Aanderaa – Karp – Rosenberg také uvádí, že složitost randomizovaného rozhodovacího stromu netriviálních monotónních funkcí je Θ (n2). Domněnka opět zůstává neprokázaná, ale byla vyřešena pro vlastnost obsahující a k klika pro 2 ≤ kn. O této vlastnosti je známo, že má randomizovanou složitost rozhodovacího stromu Θ (n2).[70] U kvantových rozhodovacích stromů je nejznámější dolní mez Ω (n), ale není znám žádný algoritmus shody pro případ k ≥ 3.[71]

Nepostižitelnost s pevnými parametry

Parametrizovaná složitost je teoretická složitost studium problémů, které jsou přirozeně vybaveny malým celočíselným parametrem k a pro které se problém stává obtížnějším k zvyšuje, jako je hledání k-kliky v grafech. Říká se, že problém je vyřešitelný s pevnými parametry, pokud existuje algoritmus pro jeho řešení na vstupech velikosti na funkce F, takže algoritmus běží v čase F(knÓ(1). To znamená, že je fixovatelný s pevnými parametry, pokud jej lze vyřešit v polynomiálním čase pro jakoukoli pevnou hodnotu k a navíc, pokud exponent polynomu nezávisí na k.[72]

Pro nalezení k-vertexové kliky, algoritmus pro vyhledávání hrubou silou má dobu běhu Ó(nkk2). Protože exponent n záleží na k, tento algoritmus není fixovatelný s pevným parametrem. Ačkoli jej lze zlepšit rychlým násobením matice, doba běhu má stále exponent, který je lineární k I když je tedy doba běhu známých algoritmů pro problém s klikou polynomická pro všechny pevné k, tyto algoritmy nestačí pro fixovatelnost s pevnými parametry. Downey & Fellows (1995) definovali hierarchii parametrizovaných problémů, hierarchii W, o které se domnívali, neměli fixovatelné algoritmy s pevnými parametry. Dokázali, že nezávislý soubor (nebo ekvivalentně klika) je pro první úroveň této hierarchie obtížný, W [1]. Podle jejich domněnky tedy klika nemá žádný traktovatelný algoritmus s pevnými parametry. Tento výsledek navíc poskytuje základ pro důkazy tvrdosti W [1] mnoha dalších problémů, a slouží tak jako analogie Cook – Levinova věta pro parametrizovanou složitost.[73]

Chen a kol. (2006) ukázal toto zjištění k-vertexové kliky nelze provést včas nÓ(k) pokud exponenciální časová hypotéza selže. To opět poskytuje důkaz, že není možný žádný traktovatelný algoritmus s pevnými parametry.[74]

Ačkoli je nepravděpodobné, že by problémy se seznamem maximálních klik nebo hledáním maximálních klik byly odstranitelné s pevným parametrem k, mohou být fixovatelné s jinými parametry složitosti instance. Například je známo, že oba problémy jsou fixovatelné, pokud jsou parametrizovány parametrem zvrhlost vstupního grafu.[34]

Tvrdost aproximace

Graf vztahů kompatibility mezi 2bitovými vzorky 3bitových zkušebních řetězců. Každá maximální klika (trojúhelník) v tomto grafu představuje všechny způsoby vzorkování jednoho 3bitového řetězce. Důkaz o nepřístupnosti problému s klikou zahrnuje indukované podgrafy analogicky definovaných grafů pro větší počet bitů.

Slabé výsledky, které naznačují, že problém s klikami lze jen těžko odhadnout, jsou známy již dlouhou dobu. Garey & Johnson (1978) poznamenal, že vzhledem k tomu, že číslo kliky přebírá malé celočíselné hodnoty a je těžké jej vypočítat, nemůže mít schéma plně polynomiálního času. Pokud by byla k dispozici příliš přesná aproximace, zaokrouhlením její hodnoty na celé číslo by se získalo přesné číslo kliky. O něco více však bylo známo až do začátku 90. let, kdy několik autorů začalo vytvářet spojení mezi aproximací maximálních klik a pravděpodobnostně ověřitelné důkazy. Použili tato spojení k prokázání tvrdost aproximace výsledky pro maximální problém s klikou.[75]Po mnoha vylepšeních těchto výsledků je nyní známo, že pro každého reálné číslo ε > 0, nemůže existovat žádný algoritmus polynomiálního času, který aproximuje maximální kliku na faktor lepší než Ó(n1 − ε), pokud P = NP.[76]

Hrubou myšlenkou těchto výsledků nepřístupnosti je vytvoření grafu, který představuje pravděpodobnostně kontrolovatelný kontrolní systém pro NP-úplný problém, jako je například Booleovský problém uspokojivosti. V pravděpodobnostně ověřitelném systému kontroly je důkaz představován jako posloupnost bitů. Instance problému uspokojivosti by měla mít platný důkaz, pouze a jen v případě, že je uspokojivý. Důkaz je kontrolován algoritmem, který se po výpočtu polynomiálního času na vstupu do problému uspokojivosti rozhodne prozkoumat malý počet náhodně vybraných pozic řetězce důkazu. V závislosti na tom, jaké hodnoty jsou u daného vzorku bitů nalezeny, kontrola buď přijme, nebo odmítne důkaz, aniž by se podíval na zbývající bity. Falešné negativy nejsou povoleny: vždy musí být přijat platný důkaz. Někdy však může být omylem přijat neplatný důkaz. U každého neplatného důkazu musí být nízká pravděpodobnost, že jej dáma přijme.[77]

K transformaci pravděpodobnostně ověřitelného systému kontroly tohoto typu na problém klikání se vytvoří graf s vrcholem pro každý možný přijímací chod kontroly kontroly. To znamená, že vrchol je definován jednou z možných náhodných voleb sad pozic, které se mají zkoumat, a bitovými hodnotami pro ty pozice, které by způsobily, že kontrola přijme důkaz. Může to být reprezentováno a částečné slovo s 0 nebo 1 v každé zkoumané poloze a a zástupný znak na každé zbývající pozici. Two vertices are adjacent, in this graph, if the corresponding two accepting runs see the same bit values at every position they both examine. Each (valid or invalid) proof string corresponds to a clique, the set of accepting runs that see that proof string, and all maximal cliques arise in this way. One of these cliques is large if and only if it corresponds to a proof string that many proof checkers accept. If the original satisfiability instance is satisfiable, it will have a valid proof string, one that is accepted by all runs of the checker, and this string will correspond to a large clique in the graph. However, if the original instance is not satisfiable, then all proof strings are invalid, each proof string has only a small number of checker runs that mistakenly accept it, and all cliques are small. Therefore, if one could distinguish in polynomial time between graphs that have large cliques and graphs in which all cliques are small, or if one could accurately approximate the clique problem, then applying this approximation to the graphs generated from satisfiability instances would allow satisfiable instances to be distinguished from unsatisfiable instances. However, this is not possible unless P = NP.[77]

Poznámky

  1. ^ A b C Bomze a kol. (1999); Gutin (2004).
  2. ^ Wasserman & Faust (1994).
  3. ^ Kolata (1990).
  4. ^ Rhodes et al. (2003).
  5. ^ Kuhl, Crippen & Friesen (1983).
  6. ^ National Research Council Committee on Mathematical Challenges from Computational Chemistry (1995). Viz zejména str. 35–36.
  7. ^ Muegge & Rarey (2001). Viz zejména s. 6–7.
  8. ^ Barrow & Burstall (1976).
  9. ^ Hamzaoglu & Patel (1998).
  10. ^ Day & Sankoff (1986).
  11. ^ Samudrala & Moult (1998).
  12. ^ Spirin & Mirny (2003).
  13. ^ Frank & Strauss (1986).
  14. ^ The Keller graph used by Lagarias & Shor (1992) has 1048576 vertices and clique size 1024. They described a synthetic construction for the clique, but also used clique-finding algorithms on smaller graphs to help guide their search. Mackey (2002) simplified the proof by finding a clique of size 256 in a 65536-vertex Keller graph.
  15. ^ A b Valiente (2002); Pelillo (2009).
  16. ^ Pelillo (2009).
  17. ^ Sethuraman & Butenko (2015).
  18. ^ Valiente (2002).
  19. ^ A b C d Chiba a Nishizeki (1985).
  20. ^ A b Cormen a kol. (2001).
  21. ^ Cormen a kol. (2001), Exercise 34-1, p. 1018.
  22. ^ A b Papadimitriou & Yannakakis (1981); Chiba a Nishizeki (1985).
  23. ^ Garey, Johnson & Stockmeyer (1976).
  24. ^ Viz např. Frank & Strauss (1986).
  25. ^ Plummer (1993).
  26. ^ Skiena (2009), str. 526.
  27. ^ Cook (1985).
  28. ^ Např. Viz Downey & Fellows (1995).
  29. ^ Itai & Rodeh (1978) provide an algorithm with Ó(m3/2) running time that finds a triangle if one exists but does not list all triangles; Chiba a Nishizeki (1985) list all triangles in time Ó(m3/2).
  30. ^ Eisenbrand & Grandoni (2004); Kloks, Kratsch & Müller (2000); Nešetřil & Poljak (1985); Vassilevska & Williams (2009); Yuster (2006).
  31. ^ Tomita, Tanaka & Takahashi (2006).
  32. ^ Cazals & Karande (2008); Eppstein, Löffler & Strash (2013).
  33. ^ Rosgen & Stewart (2007).
  34. ^ A b Eppstein, Löffler & Strash (2013).
  35. ^ Robson (2001).
  36. ^ Balas & Yu (1986); Carraghan & Pardalos (1990); Pardalos & Rogers (1992); Östergård (2002); Fahle (2002); Tomita & Seki (2003); Tomita & Kameda (2007); Konc & Janežič (2007).
  37. ^ Battiti & Protasi (2001); Katayama, Hamamoto & Narihisa (2005).
  38. ^ Abello, Pardalos & Resende (1999); Grosso, Locatelli & Della Croce (2004).
  39. ^ Régin (2003).
  40. ^ Ouyang et al. (1997). Although the title refers to maximal cliques, the problem this paper solves is actually the maximum clique problem.
  41. ^ Childs et al. (2002).
  42. ^ Johnson & Trick (1996).
  43. ^ DIMACS challenge graphs for the clique problem Archivováno 2018-03-30 na Wayback Machine, accessed 2009-12-17.
  44. ^ Grötschel, Lovász & Schrijver (1988).
  45. ^ Golumbic (1980).
  46. ^ Golumbic (1980), str. 159.
  47. ^ Even, Pnueli & Lempel (1972).
  48. ^ Blair & Peyton (1993), Lemma 4.5, p. 19.
  49. ^ Gavril (1973); Golumbic (1980), str. 247.
  50. ^ Clark, Colbourn & Johnson (1990).
  51. ^ Song (2015).
  52. ^ Jerrum (1992).
  53. ^ Arora & Barak (2009), Example 18.2, pp. 362–363.
  54. ^ Alon, Krivelevich & Sudakov (1998).
  55. ^ Feige & Krauthgamer (2000).
  56. ^ Meka, Potechin & Wigderson (2015).
  57. ^ Boppana & Halldórsson (1992); Feige (2004); Halldórsson (2000).
  58. ^ Liu a kol. (2015): "In terms of the number of vertices in graphs, Feige shows the currently known best approximation ratio". Liu a kol. are writing about the maximální nezávislá množina but for purposes of approximation there is no difference between the two problems.
  59. ^ Převzato z Sipser (1996)
  60. ^ A b Karp (1972).
  61. ^ Cook (1971).
  62. ^ Cook (1971) gives essentially the same reduction, from 3-SAT instead of Satisfiability, to show that podgraf izomorfismus je NP-kompletní.
  63. ^ Lipton & Tarjan (1980).
  64. ^ Impagliazzo, Paturi & Zane (2001).
  65. ^ Alon & Boppana (1987). For earlier and weaker bounds on monotone circuits for the clique problem, see Valiant (1983) a Razborov (1985).
  66. ^ Amano & Maruoka (2005).
  67. ^ Goldmann & Håstad (1992) použitý složitost komunikace to prove this result.
  68. ^ Vidět Arora & Barak (2009), Chapter 12, "Decision trees", pp. 259–269.
  69. ^ Wegener (1988).
  70. ^ For instance, this follows from Gröger (1992).
  71. ^ Childs & Eisenberg (2005); Magniez, Santha & Szegedy (2007).
  72. ^ Downey & Fellows (1999). Technically, there is usually an additional requirement that F být vypočítatelná funkce.
  73. ^ Downey & Fellows (1995).
  74. ^ Chen a kol. (2006).
  75. ^ Kolata (1990); Feige et al. (1991); Arora & Safra (1998); Arora et al. (1998).
  76. ^ Håstad (1999) showed inapproximability for this ratio using a stronger complexity theoretic assumption, the inequality of NP a ZPP. Khot (2001) described more precisely the inapproximability ratio, but with an even stronger assumption. Zuckerman (2006) derandomizováno the construction weakening its assumption to P ≠ NP.
  77. ^ A b This reduction is originally due to Feige et al. (1991) and used in all subsequent inapproximability proofs; the proofs differ in the strengths and details of the probabilistically checkable proof systems that they rely on.

Reference

Průzkumy a učebnice

  • Arora, Sanjeev; Barak, Boaz (2009), Výpočetní složitost: moderní přístup, Cambridge University Press, ISBN  978-0-521-42426-4.
  • Blair, Jean R. S.; Peyton, Barry (1993), "An introduction to chordal graphs and clique trees", Graph theory and sparse matrix computation, IMA sv. Matematika. Appl., 56, Springer, New York, pp. 1–29, doi:10.1007/978-1-4613-8369-7_1, PAN  1320296.
  • Bomze, I.M .; Budinich, M .; Pardalos, P. M .; Pelillo, M. (1999), „Maximum clique problem“, Příručka kombinatorické optimalizace, 4, Kluwer Academic Publishers, s. 1–74, CiteSeerX  10.1.1.48.4074.
  • Cormen, Thomas H.; Leiserson, Charles E.; Rivest, Ronald L.; Stein, Clifford (2001), "34.5.1 The clique problem", Úvod do algoritmů (2nd ed.), MIT Press and McGraw-Hill, pp. 1003–1006, ISBN  0-262-03293-7.
  • Downey, R. G.; Fellows, M. R. (1999), Parametrizovaná složitost, Springer-Verlag, ISBN  0-387-94883-X.
  • Golumbic, M. C. (1980), Algorithmic Graph Theory and Perfect Graphs, Computer Science and Applied Mathematics, Akademický tisk, ISBN  0-444-51530-5.
  • Grötschel, M.; Lovász, L.; Schrijver, A. (1988), "9.4 Coloring Perfect Graphs", Geometric Algorithms and Combinatorial OptimizationAlgoritmy a kombinatorika, 2, Springer-Verlag, pp. 296–298, ISBN  0-387-13624-X.
  • Gutin, G. (2004), "5.3 Independent sets and cliques", in Gross, J. L.; Yellen, J. (eds.), Příručka teorie grafů, Discrete Mathematics & Its Applications, CRC Press, pp. 389–402, ISBN  978-1-58488-090-5.
  • Muegge, Ingo; Rarey, Matthias (2001), "Small molecule docking and scoring", Recenze v oblasti výpočetní chemie, 17: 1–60, doi:10.1002/0471224413.ch1, ISBN  9780471398455.
  • National Research Council Committee on Mathematical Challenges from Computational Chemistry (1995), Mathematical Challenges from Theoretical/Computational Chemistry, Národní akademie Press, doi:10.17226/4886, ISBN  978-0-309-05097-5.
  • Pelillo, Marcello (2009), "Heuristics for maximum clique and independent set", Encyklopedie optimalizace, Springer, pp. 1508–1520, doi:10.1007/978-0-387-74759-0_264.
  • Plummer, Michael D. (1993), "Well-covered graphs: a survey", Quaestiones Mathematicae, 16 (3): 253–287, doi:10.1080/16073606.1993.9631737, PAN  1254158.
  • Sipser, M. (1996), Úvod do teorie výpočtu, International Thompson Publishing, ISBN  0-534-94728-X.
  • Skiena, Steven S. (2009), Příručka pro návrh algoritmu (2. vyd.), Springer, ISBN  978-1-84800-070-4.
  • Valiente, Gabriel (2002), "Chapter 6: Clique, Independent Set, and Vertex Cover", Algorithms on Trees and Graphs, Springer, pp. 299–350, doi:10.1007/978-3-662-04921-1_6.
  • Wasserman, Stanley; Faust, Katherine (1994), Analýza sociálních sítí: metody a aplikace, Structural Analysis in the Social Sciences, 8, Cambridge University Press, str. 276, ISBN  978-0-521-38707-1.

Popular press

Články výzkumu