Graphon - Graphon

Realizace vyměnitelného náhodného grafu definovaného a grafon. Grafon je zobrazen jako purpurová teplotní mapa (vpravo dole). Náhodný graf velikosti je generováno samostatným přiřazením ke každému vrcholu latentní náhodná proměnná (hodnoty podél svislé osy) a včetně každé hrany nezávisle s pravděpodobností . Například hrana (zelená, tečkovaná) je přítomna s pravděpodobností ; zelené políčka na pravém čtverci představují hodnoty a . Levý horní panel zobrazuje realizaci grafu jako matici sousedství.

v teorie grafů a statistika, a grafon (také známý jako limit grafu) je symetrický měřitelný funkce , to je důležité při studiu husté grafy. Grafony vznikají jednak jako přirozený pojem pro limit posloupnosti hustých grafů, jednak jako základní definující objekty vyměnitelné náhodné modely grafů. Grafony jsou spojeny s hustými grafy pomocí následující dvojice pozorování: náhodné modely grafů definované grafony dávají vzniknout hustým grafům téměř jistě a lemma pravidelnosti, grafony zachycují strukturu libovolných velkých hustých grafů.

Statistická formulace

Grafon je symetrická měřitelná funkce . Grafonem se obvykle rozumí definování vyměnitelného náhodného modelu grafu podle následujícího schématu:

  1. Každý vrchol grafu je přiřazena nezávislá náhodná hodnota
  2. Okraj je do grafu nezávisle zahrnuta s pravděpodobností .

Model náhodného grafu je vyměnitelný model náhodného grafu právě tehdy, pokud jej lze takto definovat z hlediska (případně náhodného) grafu. Model založený na pevném grafu je někdy označován , analogicky s Erdős – Rényi model náhodných grafů. Graf vygenerovaný grafem tímto způsobem se nazývá a - náhodný graf.

Z této definice a zákona velkého počtu vyplývá, že pokud , vyměnitelné náhodné modely grafů jsou husté téměř jistě.[1]

Příklady

Nejjednodušší příklad grafonu je pro nějakou konstantu . V tomto případě je přidružený vyměnitelný model náhodného grafu Erdős – Rényi Modelka který zahrnuje každou hranu samostatně s pravděpodobností .

Pokud místo toho začneme s grafonem, který je po částech konstantní pomocí:

  1. dělení čtverce jednotek na bloky a
  2. nastavení rovnat se na blok,

výsledný vyměnitelný model náhodného grafu je společenství stochastický model bloku, zobecnění Erdős – Rényiho modelu. Můžeme to interpretovat jako náhodný grafový model skládající se z odlišné Erdős – Rényiho grafy s parametry respektive s bigrafy mezi nimi, kde každý možný okraj mezi bloky a je zahrnut samostatně s pravděpodobností .

Mnoho dalších populárních modelů náhodných grafů lze chápat jako vyměnitelné modely náhodných grafů definované nějakým grafonem, podrobný průzkum je zahrnut v Orbanz a Roy.[1]

Společně vyměnitelné matice sousedství

Náhodný graf velikosti může být reprezentován jako náhodný matice sousedství. Za účelem zavedení konzistence (ve smyslu projektivita ) mezi náhodnými grafy různých velikostí je přirozené studovat posloupnost sousedních matic vznikající jako levý horní dílčí matice nějaké nekonečné řady náhodných proměnných; to nám umožňuje generovat přidáním uzlu do a vzorkování hran pro . S touto perspektivou jsou náhodné grafy definovány jako náhodná nekonečná symetrická pole .

V návaznosti na zásadní význam vyměnitelné sekvence v klasické pravděpodobnosti je přirozené hledat analogický pojem v nastavení náhodného grafu. Jedna taková představa je dána společně vyměnitelnými maticemi; tj. náhodné matice vyhovující

pro všechny obměny přirozených čísel, kde prostředek stejný v distribuci. Tato podmínka intuitivně znamená, že distribuce náhodného grafu se nezmění pomocí rebrandingu jeho vrcholů: to znamená, že štítky vrcholů neobsahují žádné informace.

Existuje věta o reprezentaci pro společně vyměnitelné matice náhodných sousedů, analogické k de Finettiho věta o reprezentaci pro vyměnitelné sekvence. Toto je zvláštní případ Aldous – Hooverova věta pro společně vyměnitelná pole a v tomto nastavení tvrdí, že náhodná matice generuje:

  1. Vzorek nezávisle
  2. nezávisle náhodně s pravděpodobností

kde je (možná náhodný) grafon. To znamená, že model náhodného grafu má společně vyměnitelnou matici sousedství právě tehdy, pokud se jedná o společně vyměnitelný model náhodného grafu definovaný v podmínkách nějakého grafu.

Odhad grafu

Kvůli problémům s identifikovatelností není možné odhadnout ani grafovou funkci nebo latentní polohy uzlu a existují dva hlavní směry odhadu grafonu. Jeden směr má za cíl odhadnout až do třídy ekvivalence,[2][3] nebo odhadněte matici pravděpodobnosti vyvolanou .[4][5]

Analytická formulace

Libovolný graf vrcholy lze identifikovat s jeho matice sousedství .Tato matice odpovídá stupňovité funkci , definované rozdělením do intervalů takhle má interiér

a pro každého nastavení rovná se vstup z .Tato funkce je související grafon grafu .

Obecně platí, že pokud máme posloupnost grafů kde je počet vrcholů jde do nekonečna, můžeme analyzovat omezující chování sekvence zvážením omezujícího chování funkcí . Pokud tyto grafy konvergují (podle nějaké vhodné definice konvergence ), pak očekáváme, že limit těchto grafů bude odpovídat limitu těchto přidružených funkcí.

To motivuje definici grafonu (zkratka pro „funkci grafu“) jako symetrické měřitelné funkce který zachycuje pojem limitu posloupnosti grafů. Ukazuje se, že pro sekvence hustých grafů je několik zjevně odlišných představ o konvergenci ekvivalentních a pod všemi z nich je přirozeným limitním objektem graf.[6]

Příklady

Příklad 1: Vezměte náhodnou sekvenci Erdős – Rényiho grafy s nějakým pevným parametrem .Intuitivně, jak má tendenci k nekonečnu, limit této posloupnosti grafů je určen pouze hustotou hran těchto grafů.

V prostoru grafonů se ukazuje, že taková posloupnost konverguje téměř jistě do konstanty , který zachycuje výše uvedenou intuici.


Příklad 2: Vezměte sekvenci z poloviční grafy, definovaný převzetím být bipartitním grafem vrcholy a takhle sousedí s přesně kdy . Pokud jsou vrcholy uvedeny v uvedeném pořadí, pak matice sousedství má dva rohy blokových matic „půl čtverečních“ vyplněných jednotkami, přičemž ostatní položky se rovnají nule. Například matice sousedství je dána

Tak jako zvětší se, tyto rohy těch „vyhladí“. Shoduje se s touto intuicí, posloupností konverguje k půl grafu definován když a v opačném případě.


Příklad 3: Vezměte sekvenci z kompletní bipartitní grafy Pokud objednáme vrcholy umístěním všech vrcholů do jedné části na začátku a umístěním vrcholů druhé části na konec, matice sousedství vypadá jako blok mimo diagonální matici se dvěma bloky jednotek a dvěma bloky nul. Například matice sousedství je dána

Tak jako zvětšuje se, tato bloková struktura matice sousedství zůstává konstantní, takže tato posloupnost grafů konverguje k „úplnému bipartitnímu“ grafu definován kdykoli a a nastavení v opačném případě.


Příklad 4: Zvažte sekvenci Pokud si místo toho objednáme vrcholy střídáním částí, matice sousedství má šachovnicovou strukturu nul a jedniček. Například v tomto pořadí matice sousedství je dána

Tak jako zvětší, matice sousedství se stanou jemnější a jemnější šachovnicí. I přes toto chování stále chceme limit být jedinečný a vyústit v graf z příkladu 4. To znamená, že když formálně definujeme konvergenci pro posloupnost grafů, definice limitu by měla být agnostická vůči relabelingům vrcholů.


Příklad 5: Vezměte náhodnou sekvenci z - běžné grafy kreslením pro nějaký pevný graf Pak se stejně jako v prvním příkladu z této části ukazuje, že konverguje k téměř jistě.


Příklad 6: Daný graf s přidruženým grafonem , můžeme obnovit teoretické vlastnosti grafů a parametry integrací transformací .

Například okrajová hustota (tj. Průměrný stupeň dělený počtem vrcholů) z je dáno integrálemTo je proto, že je -hodnota a každá hrana v odpovídá regionu oblasti kde rovná se .

Podobné uvažování ukazuje, že počet trojúhelníků v je rovný

Pojmy konvergence

Existuje mnoho různých způsobů, jak měřit vzdálenost mezi dvěma grafy. Pokud nás zajímají metriky, které „zachovávají“ extrémní vlastnosti grafů, měli bychom omezit naši pozornost na metriky, které identifikují náhodné grafy jako podobné. Například pokud náhodně nakreslíme dva grafy nezávisle na modelu Erdős – Rényi pro některé pevné , vzdálenost mezi těmito dvěma grafy pod „rozumnou“ metrikou by měla být blízká nule s velkou pravděpodobností pro velké .

Existují dvě přirozené metriky, které se v tomto smyslu chovají dobře na hustých náhodných grafech. První je metrika vzorkování, která říká, že dva grafy jsou blízké, pokud jsou jejich distribuce podgrafů blízké. Druhá je hrana rozpor metrika, která říká, že dva grafy jsou blízké, když jsou jejich okrajové hustoty blízké u všech jejich odpovídajících podmnožin vrcholů.

Sekvence grafů jako zázrakem konverguje s ohledem na jednu vzdálenost právě tehdy, když konverguje s ohledem na druhou. Limitní objekty pod oběma vzdálenostmi se navíc projeví v grafech. Ekvivalence těchto dvou pojmů konvergence zrcadlí, jak různé pojmy kvazirandom grafy jsou ekvivalentní.[7]

Počty podgrafů

Jeden způsob, jak měřit vzdálenost mezi dvěma grafy a je porovnat jejich relativní počty podgrafů. To znamená pro každý graf můžeme porovnat počet kopií v a v Pokud jsou tato čísla blízká pro každý graf , potom intuitivně a jsou podobně vypadající grafy.

Hustoty homomorfismu

Spíše než pracovat přímo s podgrafy se ukazuje, že je snadnější pracovat s homomorfismy grafů, což je v pořádku, když se jedná o velké a husté grafy, protože v tomto scénáři je počet podgrafů a počet homomorfismů grafů z pevného grafu asymptoticky stejný .

Vzhledem ke dvěma grafům a , hustota homomorfismu z v je definován jako počet homomorfismy grafů z na .Jinými slovy, je pravděpodobnost náhodně vybrané mapy z vrcholů k vrcholům posílá sousední vrcholy dovnitř na sousední vrcholy v .

Grafony nabízejí jednoduchý způsob výpočtu hustoty homomorfismu. Daný graf s přidruženým grafonem a další , my máme

kde je integrál vícerozměrný, převzatý jednotkou hyperkrychle To vyplývá z definice přidruženého grafonu tím, že se vezme v úvahu, kdy se výše uvedená integrand rovná Poté můžeme definici hustoty homomorfismu rozšířit na libovolné grafony pomocí stejného integrálu a definování

pro jakýkoli graf .

Meze z hlediska hustoty homomorfismu

Vzhledem k tomuto nastavení říkáme posloupnost grafů konverguje, pokud pro každý pevný graf posloupnost hustot homomorfismu konverguje. Ačkoli to není zřejmé ze samotné definice, pokud konverguje v tomto smyslu, pak vždy existuje grafon tak, že pro každý graf , my máme

zároveň.

Vzdálenost řezu

Vezměte dva grafy a protože tyto grafy sdílejí stejné vrcholy, jedním ze způsobů měření jejich vzdálenosti je omezení na podmnožiny sady vrcholů a pro každou takovou dvojici podmnožiny porovnejte počet hran z na v na počet hran mezi a v Pokud jsou tato čísla pro každou dvojici podmnožin podobná (vzhledem k celkovému počtu vrcholů), pak to naznačuje a jsou podobné grafy.

Abychom to formalizovali, pro jakoukoli symetrickou měřitelnou funkci , definovat řezná norma z být množství

převzal všechny měřitelné podmnožiny jednotkového intervalu. [6]Tato norma zachycuje naši dřívější představu o vzdálenosti, protože pro dva grafy a se stejnou sadou vrcholů velikosti , řezná norma s přidruženými grafony

pojďme vypočítat maximální rozdíl mezi hraničními hustotami a .Tato definice může být stále použita, i když porovnávané grafy nesdílejí sadu vrcholů.

Toto měření vzdálenosti má stále jedno hlavní omezení: může přiřadit nenulovou vzdálenost dvěma izomorfním grafům. Aby se ujistilo, že izomorfní grafy mají vzdálenost nula, měli bychom vypočítat minimální normu řezu pro všechna možná „zpětná vazba“ vrcholů. To motivuje definici the vzdálenost řezu mezi dvěma grafony a být

kde je složení s mapou a infimum je převzato všemi zachování opatření bijekce z jednotkového intervalu k sobě samému.[8]Vzdálenost řezu mezi dvěma grafy je definována jako vzdálenost řezu mezi jejich přidruženými grafony.

Jako metrický prostor

Abychom provedli vzdálenost řezu do metriky, vezmeme množinu všech grafů a identifikovat dva grafony kdykoli Výsledný prostor grafonů je označen a společně s tvoří a metrický prostor.

Ukázalo se, že tento prostor je kompaktní Kromě toho obsahuje sadu všech konečných grafů jako a hustá podmnožina Zde jsou grafy identifikovány jako - funkce krokových funkcí na jednotkovém čtverci. Tato pozorování ukazují, že prostor grafonů je a dokončení prostoru grafů s ohledem na vzdálenost řezu.

Aplikace

Lemma pravidelnosti

Využití kompaktnosti prostoru grafonů , lze prokázat silnější verze Szemerédiho lemma pravidelnosti.

Sidorenkova domněnka

Analytická povaha grafonů umožňuje větší flexibilitu při útoku na nerovnosti související s homomorfismy.

Například Sidorenkova domněnka je hlavním otevřeným problémem teorie extrémních grafů, který tvrdí, že pro jakýkoli graf na vrcholy s průměrným stupněm (pro některé ) a bipartitní graf na vrcholy a hran, počet homomorfismy z na je alespoň .[9]Jelikož se jedná o množství, je očekávaný počet označených podgrafů v náhodném grafu , lze domněnku interpretovat jako tvrzení, že pro jakýkoli bipartitní graf , náhodný graf dosahuje (v očekávání) minimálního počtu kopií přes všechny grafy s určitou pevnou hranovou hustotou.

Mnoho přístupů k Sidorenkově domněnce formuluje problém jako integrální nerovnost na grafech, což pak umožňuje útok na problém pomocí jiných analytických přístupů. [10]

Zobecnění

Grafony jsou přirozeně spojeny s hustými jednoduchými grafy. Existují rozšíření tohoto modelu o husté směrované vážené grafy, často označované jako zdobené grafony.[11] Existují také nedávná rozšíření režimu řídkých grafů, a to jak z pohledu modelů náhodných grafů [12] a teorie mezí grafů.[13][14]

Reference

  1. ^ A b Orbanz, P .; Roy, D.M. (2015). "Bayesiánské modely grafů, polí a dalších výměnných náhodných struktur". Transakce IEEE na analýze vzorů a strojové inteligenci. 37 (2): 437–461. arXiv:1312.7857. doi:10.1109 / tpami.2014.2334607. PMID  26353253.
  2. ^ Wolfe, Patrick J .; Olhede, Sofia C. (2013-09-23). Msgstr "Neparametrický odhad grafu". arXiv:1309.5936 [matematika ].
  3. ^ Choi, David; Wolfe, Patrick J. (únor 2014). "Společné seskupování samostatně vyměnitelných síťových dat". Annals of Statistics. 42 (1): 29–63. arXiv:1212.4093. doi:10.1214 / 13-AOS1173. ISSN  0090-5364.
  4. ^ Gao, Chao; Lu, Yu; Zhou, Harrison H. (prosinec 2015). Msgstr "Odhad optimální rychlosti grafu". Annals of Statistics. 43 (6): 2624–2652. arXiv:1410.5837. doi:10.1214 / 15-AOS1354. ISSN  0090-5364.
  5. ^ Yuan, Zhang; Elizaveta, Levina; Ji, Zhu (2017). "Odhad pravděpodobnosti okraje sítě podle vyhlazení sousedství". Biometrika. 104 (4): 771–783. doi:10.1093 / biomet / asx042. ISSN  0006-3444.
  6. ^ A b Lovász, L. Velké sítě a limity grafů. Americká matematická společnost.
  7. ^ Chung, Fan R. K.; Graham, Ronald L.; Wilson, R. M. (1989). "Kvazi-náhodné grafy". Combinatorica. 9 (4): 345–362. doi:10.1007 / BF02125347.CS1 maint: ref = harv (odkaz)
  8. ^ Glasscock, D. (2015). "Co je to grafon". Oznámení Americké matematické společnosti. 62 (1): 46–48. arXiv:1611.00718.CS1 maint: ref = harv (odkaz)
  9. ^ Sidorenko, A. (1993). Msgstr "Korelační nerovnost pro bipartitní grafy". Grafy a kombinatorika. 9 (2–4): 201–204. doi:10.1007 / BF02988307.CS1 maint: ref = harv (odkaz)
  10. ^ Hatami, H. (2010). "Grafové normy a Sidorenkova domněnka". Israel Journal of Mathematics. 175 (1): 125–150. arXiv:0806.0047. doi:10.1007 / s11856-010-0005-1.CS1 maint: ref = harv (odkaz)
  11. ^ Vaishampayan, V. A. (2019). Msgstr "Klasifikace ve velké síti". arXiv:1902.05531 [cs.IT ].CS1 maint: ref = harv (odkaz)
  12. ^ Veitch, V .; Roy, D. M. (2015). "Třída náhodných grafů vycházejících z vyměnitelných náhodných měr". arXiv:1512.03099 [matematika ].
  13. ^ Borgs, C .; Chayes, J. T .; Cohn, H .; Zhao, Y. (2019). „An Lstr teorie konvergence řídkých grafů I: limity, řídké náhodné modely grafů a rozdělení zákonů moci ". Transakce Americké matematické společnosti. 372 (5): 3019–3062. arXiv:1401.2906. doi:10.1090 / tran / 7543.
  14. ^ Borgs, C .; Chayes, J. T .; Cohn, H .; Zhao, Y. (2018). „An Lstr teorie konvergence řídkých grafů II: konvergence LD, kvocienty a konvergence vpravo ". Annals of Probability. 46 (2018): 337–396. arXiv:1408.0744. doi:10.1214 / 17-AOP1187.