Vzdálenost úpravy grafu - Graph edit distance - Wikipedia
v matematika a počítačová věda, vzdálenost pro úpravy grafů (GED) je míra podobnosti (nebo odlišnost) mezi dvěma grafy Koncept vzdálenosti pro úpravy grafů byl poprvé matematicky formalizován Albertem Sanfeliuem a King-Sun Fu v roce 1983.[1]Hlavní aplikace vzdálenosti pro úpravy grafů je v nepřesná shoda grafu, jako tolerantní k chybám rozpoznávání vzorů v strojové učení.[2]
Vzdálenost úpravy grafu mezi dvěma grafy souvisí svzdálenost úpravy řetězce mezi struny S interpretací řetězců jako připojeno, směrované acyklické grafy z maximální stupeň jedna, klasická definice úpravy vzdálenosti jako Levenshteinova vzdálenost,[3][4]Hammingova vzdálenost[5]a Vzdálenost Jaro – Winkler lze interpretovat jako vzdálenosti úprav grafů mezi vhodně omezenými grafy. Podobně je vzdálenost pro úpravy grafů také zobecněním vzdálenost pro úpravy stromu mezizakořeněné stromy.[6][7][8][9]
Formální definice a vlastnosti
Matematická definice vzdálenosti úprav grafu závisí na definicích grafů, nad kterými je definována, tj. Zda a jak jsou vrcholy a hrany grafu označeno a zda jsou hrany režie Obecně platí, že vzhledem k souboru operace úprav grafů (také známý jako základní operace grafu ), vzdálenost mezi dvěma grafy a , psáno jako lze definovat jako
kde označuje sadu transformačních cest úprav do (graf izomorfní na) a je cena každé operace úpravy grafu .
Sada operátorů úpravy elementárních grafů obvykle zahrnuje:
- vložení vrcholu zavést do grafu jeden nový označený vrchol.
- odstranění vrcholu odstranit jeden (často odpojený) vrchol z grafu.
- substituce vrcholů změnit štítek (nebo barvu) daného vrcholu.
- vkládání hran zavést novou barevnou hranu mezi dvojicí vrcholů.
- vymazání okraje k odstranění jedné hrany mezi dvojicí vrcholů.
- náhrada hrany změnit štítek (nebo barvu) dané hrany.
Mezi další, ale méně běžné operátory, patří operace jako rozdělení hran který zavádí nový vrchol do hrany (také vytváří novou hranu) a kontrakce hran který eliminuje vrcholy stupně dva mezi hranami (stejné barvy). Ačkoli lze takové složité editační operátory definovat z hlediska více elementárních transformací, jejich použití umožňuje jemnější parametrizaci nákladové funkce když je provozovatel levnější než součet jeho složek.
Podrobná analýza operátorů úpravy elementárního grafu je uvedena v [10][11]
Byly předloženy některé metody automatického odvození těchto operátorů elementární úpravy grafů[12][13][14][15]
Aplikace
Vzdálenost pro úpravy grafů vyhledá aplikace v rozpoznávání rukopisu,[16] rozpoznávání otisků prstů[17] a cheminformatika.[18]
Algoritmy a složitost
Přesné algoritmy pro výpočet editační vzdálenosti grafu mezi dvojicí grafů obvykle transformují problém na jednu z možností nalezení minimální editační cesty mezi dvěma grafy. Výpočet optimální editační cesty je vržen jako hledání cesty hledat nebo problém s nejkratší cestou, často implementován jako * Vyhledávací algoritmus.
Kromě přesných algoritmů je také známa řada efektivních aproximačních algoritmů. Většina z nich má kubický výpočetní čas [19][20][21][22][23]
Kromě toho existuje algoritmus, který odvozuje aproximaci GED v lineárním čase [24]
Navzdory výše uvedeným algoritmům, které v praxi někdy fungují dobře, je obecně problém výpočtu vzdálenosti pro úpravy grafů NP-úplný[25] (důkaz, který je k dispozici online, najdete v části 2 z Zeng a kol. ), a je dokonce těžké jej aproximovat (formálně je.) APX -tvrdý[26]).
Reference
- ^ Sanfeliu, Alberto; Fu, King-Sun (1983). Msgstr "Míra vzdálenosti mezi přiřazenými relačními grafy pro rozpoznávání vzorů". Transakce IEEE na systémech, člověku a kybernetice. 13 (3): 353–363. doi:10.1109 / TSMC.1983.6313167.
- ^ Gao, Xinbo; Xiao, Bing; Tao, Dacheng; Li, Xuelong (2010). Msgstr "Průzkum vzdálenosti úprav grafu". Analýza vzorů a aplikace. 13: 113–129. doi:10.1007 / s10044-008-0141-r.
- ^ Влади́мир И. Левенштейн (1965). Двоичные коды с исправлением выпадений, вставок и замещений символов [Binární kódy schopné opravit vymazání, vložení a zrušení]. Доклады Академий Наук СССР (v Rusku). 163 (4): 845–848.
- ^ Levenshtein, Vladimir I. (únor 1966). "Binární kódy schopné opravit vymazání, vložení a zrušení". Sovětská fyzika Doklady. 10 (8): 707–710.
- ^ Hamming, Richard W. (1950). „Detekce chyb a opravy chyb kódy“ (PDF). Technický deník Bell System. 29 (2): 147–160. doi:10.1002 / j.1538-7305.1950.tb00463.x. hdl:10945/46756. PAN 0035935. Archivovány od originálu na 2006-05-25.CS1 maint: BOT: stav původní adresy URL neznámý (odkaz)
- ^ Shasha, D; Zhang, K (1989). Msgstr "Jednoduché rychlé algoritmy pro úpravu vzdálenosti mezi stromy a související problémy". SIAM J. Comput. 18 (6): 1245–1262. CiteSeerX 10.1.1.460.5601. doi:10.1137/0218082.
- ^ Zhang, K (1996). Msgstr "Omezená editační vzdálenost mezi neuspořádanými označenými stromy". Algorithmica. 15 (3): 205–222. doi:10.1007 / BF01975866.
- ^ Bille, P (2005). „Průzkum o vzdálenosti úprav stromu a souvisejících problémech“. Teor. Comput. Sci. 337 (1–3): 22–34. doi:10.1016 / j.tcs.2004.12.030.
- ^ Demaine, Erik D.; Mozes, Shay; Rossman, Benjamin; Weimann, Oren (2010). Msgstr "Optimální algoritmus rozkladu pro vzdálenost úprav stromu". Transakce ACM na algoritmech. 6 (1): A2. CiteSeerX 10.1.1.163.6937. doi:10.1145/1644015.1644017. PAN 2654906.
- ^ Serratosa, Francesc (2019). Vzdálenost úpravy grafu: Omezení, která mají být metrikou. Rozpoznávání vzorů, 90, str: 250-256.
- ^ Serratosa, Francesc; Cortés, Xavier (2015). Vzdálenost pro úpravy grafů: přechod z globální do místní struktury k vyřešení problému s porovnáváním grafů. Letter Recognition Letters, 65, str: 204-210.
- ^ Santacruz, Pep; Serratosa, Francesc (2020). Učení nákladů na úpravy grafů na základě modelu učení použitého pro suboptimální párování grafů. Neural Processing Letters, 51, str: 881–904.
- ^ Algabli, Shaima; Serratosa, Francesc (2018). Vložením mapování uzel na uzel se naučíte parametry vzdálenosti grafu upravit. Letter Recognition Letters, 112, pp: 353-360.
- ^ Xavier, Cortés; Serratosa, Francesc (2016). Učení grafu shody substitučních vah založených na korespondenci uzlu uzemnění. International Journal of Pattern Recognition and Artificial Intelligence, 30 (2), pp: 1650005 [22 stran].
- ^ Xavier, Cortés; Serratosa, Francesc (2015). Naučit se porovnávat náklady na úpravy grafů na základě optimality korespondence uzlů Oracle. Dopisy pro rozpoznávání vzorů, 56, s.: 22 - 29.
- ^ Fischer, Andreas; Suen, Ching Y .; Frinken, Volkmar; Riesen, Kaspar; Bunke, Horst (2013), „Algoritmus rychlé shody pro rozpoznávání rukopisu na základě grafů“, Grafická znázornění v rozpoznávání vzorů, Přednášky z informatiky, 7877, str. 194–203, doi:10.1007/978-3-642-38221-5_21, ISBN 978-3-642-38220-8
- ^ Neuhaus, Michel; Bunke, Horst (2005), „Přístup porovnávání grafů ke klasifikaci otisků prstů pomocí směrové odchylky“, Ověření biometrické osoby na základě zvuku a videa, Přednášky z informatiky, 3546, s. 191–200, doi:10.1007/11527923_20, ISBN 978-3-540-27887-0
- ^ Birchall, Kristian; Gillet, Valerie J .; Harper, Gavin; Pickett, Stephen D. (leden 2006). "Opatření podobnosti školení pro konkrétní činnosti: aplikace na redukované grafy". Journal of Chemical Information and Modeling. 46 (2): 557–586. doi:10.1021 / ci050465e. PMID 16562986.
- ^ Neuhaus, Michel; Bunke, Horst (listopad 2007). Překlenutí mezery mezi vzdálenostmi úprav grafů a stroji jádra. Strojové vnímání a umělá inteligence. 68. World Scientific. ISBN 978-9812708175.
- ^ Riesen, Kaspar (únor 2016). Rozpoznávání strukturních vzorů s úpravou vzdálenosti grafu: Aproximační algoritmy a aplikace. Pokroky v počítačovém vidění a rozpoznávání vzorů. Springer. ISBN 978-3319272511.
- ^ Serratosa, Francesc (2014). Rychlý výpočet porovnávání bipartitních grafů. Dopisy pro rozpoznávání vzorů, 45, str.: 244 - 250.
- ^ Serratosa, Francesc (2015). Urychlení rychlého bipartitního porovnávání grafů prostřednictvím nové matice nákladů. International Journal of Pattern Recognition and Artificial Intelligence, 29 (2), 1550010, [17 stran].
- ^ Serratosa, Francesc (2015). Výpočet vzdálenosti pro úpravy grafů: Odůvodnění o optimalitě a zrychlení. Image and Vision Computing, 40, s: 38-48.
- ^ Santacruz, Pep; Serratosa, Francesc (2018). Odpovídající tolerování chyb grafu v lineárních výpočetních nákladech pomocí počáteční malé částečné shody. Písmena pro rozpoznávání vzorů.
- ^ Garey a Johnson (1979). Počítače a neodolatelnost: Průvodce po teorii NP-úplnosti. W. H. Freeman and Company. ISBN 978-0-7167-1045-5.
- ^ Lin, Chih-Long (1994-08-25). "Tvrdost problému přibližné transformace grafu". V Du, Ding-Zhu; Zhang, Xiang-Sun (eds.). Algoritmy a výpočet. Přednášky z informatiky. 834. Springer Berlin Heidelberg. str. 74–82. doi:10.1007/3-540-58325-4_168. ISBN 9783540583257.