Exponenciální modely náhodných grafů - Exponential random graph models
Síťová věda | ||||
---|---|---|---|---|
Typy sítí | ||||
Grafy | ||||
| ||||
Modely | ||||
| ||||
| ||||
| ||||
Exponenciální modely náhodných grafů (ERGM) jsou rodinou statistické modely pro analýzu dat o sociální a jiné sítě.[1] Příklady sítí zkoumaných pomocí ERGM zahrnují znalostní sítě,[2] organizační sítě,[3] sítě kolegů,[4] sítě sociálních médií, sítě vědeckého rozvoje,[5] a další.
Pozadí
Existuje mnoho metrik popisujících strukturální vlastnosti pozorované sítě, jako je hustota, centralita nebo sortiment.[6][7] Tyto metriky však popisují pozorovanou síť, která je pouze jednou instancí velkého počtu možných alternativních sítí. Tato sada alternativních sítí může mít podobné nebo odlišné strukturální vlastnosti. Podporovat statistická inference o procesech ovlivňujících formování struktury sítě, a statistický model by měl zvážit soubor všech možných alternativních sítí vážených na jejich podobnosti s pozorovanou sítí. Protože jsou však síťová data ve své podstatě relační, porušují předpoklady nezávislosti a identického rozdělení standardních statistických modelů lineární regrese.[8][9] Alternativní statistické modely by měly odrážet nejistotu spojenou s daným pozorováním, umožňovat odvození relativní četnosti síťových podstruktur teoretického zájmu, disambiguating vliv matoucích procesů, efektivní reprezentaci složitých struktur a propojení procesů na místní úrovni s vlastnostmi na globální úrovni.[10] Randomizace zachovávající stupeň je například specifický způsob, jakým lze pozorovanou síť považovat za více alternativních sítí.
Definice
The Exponenciální rodina je široká rodina modelů pro pokrytí mnoha typů dat, nejen sítí. ERGM je model z této rodiny, který popisuje sítě.
Formálně a náhodný graf sestává ze sady uzly a dyády (hrany) kde pokud uzly jsou propojeny a v opačném případě.
Základním předpokladem těchto modelů je struktura ve pozorovaném grafu lze vysvětlit daným vektorem dostatečné statistiky které jsou funkcí pozorované sítě a v některých případech uzlovými atributy. Tímto způsobem je možné popsat jakýkoli druh závislosti mezi neyadickými proměnnými:
kde je vektor parametrů modelu spojený s a je normalizační konstanta.
Tyto modely představují rozdělení pravděpodobnosti v každé možné síti na uzly. Velikost sady možných sítí pro neorientovanou síť (jednoduchý graf) o velikosti je . Protože počet možných sítí v sadě výrazně převyšuje počet parametrů, které mohou model omezovat, ideální rozdělení pravděpodobnosti je takové, které maximalizuje Gibbsova entropie.[11]
Reference
- ^ Harris, Jenine K (2014). Úvod do exponenciálního náhodného modelování grafů. ISBN 9781452220802. OCLC 870698788.
- ^ Brennecke, Julia; Rank, Olaf (01.05.2017). „Znalostní síť firmy a přenos poradenství mezi podnikovými vynálezci - víceúrovňová síťová studie“. Politika výzkumu. 46 (4): 768–783. doi:10.1016 / j.respol.2017.02.002. ISSN 0048-7333.
- ^ Harris, Jenine K (2013). "Komunikační vazby napříč národní sítí místních zdravotnických oddělení". AMEPRE American Journal of Preventive Medicine. 44 (3): 247–253. doi:10.1016 / j.amepre.2012.10.028. ISSN 0749-3797. OCLC 4937103196. PMID 23415121.
- ^ Brennecke, Julia (2019). „Rezonanční vazby v intraorganizačních sítích: Proč jednotlivci hledají pomoc při řešení problémů od obtížných kolegů“. AMJ Academy of Management Journal. ISSN 0001-4273. OCLC 8163488129.
- ^ Harris, Jenine K; Luke, Douglas A; Shelton, Sarah C; Zuckerman, Rachael B (2009). „Čtyřicet let výzkumu kouře z druhé ruky. Mezera mezi objevem a dodáním“. American Journal of Preventive Medicine. 36 (6): 538–548. doi:10.1016 / j.amepre.2009.01.039. ISSN 0749-3797. OCLC 6980180781. PMID 19372026.
- ^ Wasserman, Stanley; Faust, Katherine (1994). Analýza sociálních sítí: metody a aplikace. ISBN 978-0-521-38707-1.
- ^ Newman, M.E.J. (2003). "Struktura a funkce komplexních sítí". Recenze SIAM. 45 (2): 167–256. arXiv:cond-mat / 0303516. Bibcode:2003SIAMR..45..167N. doi:10.1137 / S003614450342480.
- ^ Dodavatel, Noshir; Wasserman, Stanley; Faust, Katherine (2006). „Testování více teoretických, víceúrovňových hypotéz o organizačních sítích: analytický rámec a empirický příklad“ (PDF). Academy of Management Review. 31 (3): 681–703. doi:10.5465 / AMR.2006.21318925.
- ^ Harris, Jenine K (2014). Úvod do exponenciálního náhodného modelování grafů. ISBN 9781452220802. OCLC 870698788.
- ^ Robins, G .; Pattison, P .; Kalish, Y .; Lusher, D. (2007). "Úvod do exponenciálních modelů náhodných grafů pro sociální sítě". Sociální sítě. 29 (2): 173–191. doi:10.1016 / j.socnet.2006.08.002. hdl:1959.3/216571.
- ^ Newman, M.E.J. (2010-03-25). "Další modely sítě". Sítě. 565–585. ISBN 978-0-19-920665-0.
Další čtení
- Byshkin, M .; Stivala, A .; Mira, A .; Robins, G .; Lomi, A. (2018). „Rychlý odhad maximální pravděpodobnosti prostřednictvím ekvilibrního očekávání pro data velké sítě“. Vědecké zprávy. 8 (1): 11509. arXiv:1802.10311. Bibcode:2018NatSR ... 811509B. doi:10.1038 / s41598-018-29725-8. PMC 6068132. PMID 30065311.
- Caimo, A .; Friel, N (2011). Msgstr "Bayesiánský závěr pro exponenciální modely náhodných grafů". Sociální sítě. 33: 41–55. arXiv:1007.5192. doi:10.1016 / j.socnet.2010.09.004.
- Erdős, P .; Rényi, A (1959). "Na náhodných grafech". Publicationes Mathematicae. 6: 290–297.
- Fienberg, S.E .; Wasserman, S. (1981). "Diskuse o exponenciální skupině rozdělení pravděpodobnosti pro směrované grafy od Hollanda a Leinhardta". Journal of the American Statistical Association. 76 (373): 54–57. doi:10.1080/01621459.1981.10477600.
- Frank, O .; Strauss, D (1986). "Markovovy grafy". Journal of the American Statistical Association. 81 (395): 832–842. doi:10.2307/2289017. JSTOR 2289017.
- Handcock, M. S .; Hunter, D. R .; Butts, C. T .; Goodreau, S. M .; Morris, M. (2008). "statnet: Softwarové nástroje pro reprezentaci, vizualizaci, analýzu a simulaci síťových dat". Žurnál statistického softwaru. 24: 1–11. doi:10.18637 / jss.v024.i01.
- Harris, Jenine K (2014). Úvod do exponenciálního náhodného modelování grafů. Šalvěj.[1]
- Hunter, D. R .; Goodreau, S. M .; Handcock, M. S. (2008). "Dobrá shoda modelů sociálních sítí". Journal of the American Statistical Association. 103 (481): 248–258. CiteSeerX 10.1.1.206.396. doi:10.1198/016214507000000446.
- Hunter, D. R; Handcock, M. S. (2006). Msgstr "Odvození zakřivených modelů exponenciální rodiny pro sítě". Journal of Computational and Graphical Statistics. 15 (3): 565–583. CiteSeerX 10.1.1.205.9670. doi:10.1198 / 106186006X133069.
- Hunter, D. R.; Handcock, M. S .; Butts, C. T .; Goodreau, S. M .; Morris, M. (2008). „ergm: Balíček pro přizpůsobení, simulaci a diagnostiku modelů exponenciálních rodin pro sítě“. Žurnál statistického softwaru. 24 (3): 1–29. doi:10.18637 / jss.v024.i03.
- Jin, I.H .; Liang, F. (2012). "Přizpůsobení modelů sociálních sítí pomocí různého zkrácení stochastické aproximační algoritmu MCMC". Journal of Computational and Graphical Statistics. 22 (4): 927–952. doi:10.1080/10618600.2012.680851.
- Koskinen, J. H .; Robins, G. L .; Pattison, P. E. (2010). "Analýza modelů exponenciálního náhodného grafu (p-hvězdy) s chybějícími daty pomocí Bayesianského datového zvětšení". Statistická metodika. 7 (3): 366–384. doi:10.1016 / j.stamet.2009.09.007.
- Morris, M .; Handcock, M. S .; Hunter, D. R. (2008). „Specifikace modelů náhodných grafů exponenciální rodiny: pojmy a výpočetní aspekty“. Žurnál statistického softwaru. 24 (4). doi:10.18637 / jss.v024.i04.
- Rinaldo, A .; Fienberg, S.E .; Zhou, Y. (2009). "Na geometrii descrete exponenciálních náhodných rodin s aplikací na exponenciální náhodné modely grafů". Elektronický statistický věstník. 3: 446–484. arXiv:0901.0026. doi:10.1214 / 08-EJS350.
- Robins, G .; Snijders, T .; Wang, P .; Handcock, M .; Pattison, P (2007). „Nejnovější vývoj v modelech exponenciálního náhodného grafu (p *) pro sociální sítě“ (PDF). Sociální sítě. 29 (2): 192–215. doi:10.1016 / j.socnet.2006.08.003.
- Schweinberger, Michael (2011). „Nestabilita, citlivost a degenerace diskrétních exponenciálních rodin“. Journal of the American Statistical Association. 106 (496): 1361–1370. doi:10.1198 / jasa.2011.tm10747. PMC 3405854. PMID 22844170.
- Schweinberger, Michael; Handcock, Mark (2015). "Místní závislost v náhodných modelech grafů: charakterizace, vlastnosti a statistická inference". Journal of the Royal Statistical Society, Series B. 77 (3): 647–676. doi:10.1111 / rssb.12081. PMC 4637985. PMID 26560142.
- Schweinberger, Michael; Stewart, Jonathan (2020). "Výsledky koncentrace a konzistence pro kanonické a zakřivené modely exponenciálních rodin náhodných grafů". Annals of Statistics. 48 (1): 374–396. arXiv:1702.01812. doi:10.1214 / 19-AOS1810.
- Snijders, T. A. B. (2002). „Markovův řetězec Monte Carlo odhad exponenciálních náhodných modelů grafů“ (PDF). Journal of Social Structure. 3.
- Snijders, T. A. B .; Pattison, P.E .; Robins, G. L .; Handcock, M. S. (2006). Msgstr "Nové specifikace pro exponenciální modely náhodných grafů". Sociologická metodologie. 36: 99–153. CiteSeerX 10.1.1.62.7975. doi:10.1111 / j.1467-9531.2006.00176.x.
- Strauss, D; Ikeda, M (1990). „Odhad pseudonáhodnosti pro sociální sítě“. Journal of the American Statistical Association. 5 (409): 204–212. doi:10.2307/2289546. JSTOR 2289546.
- van Duijn, M. A .; Snijders, T. A. B .; Zijlstra, B. H. (2004). "p2: model náhodných efektů s proměnnými pro směrované grafy". Statistica Neerlandica. 58 (2): 234–254. doi:10.1046 / j.0039-0402.2003.00258.x.
- van Duijn, M. A. J .; Gile, K. J.; Handcock, M. S. (2009). „Rámec pro srovnání maximální pseudopravděpodobnosti a odhadu maximální pravděpodobnosti modelů náhodných grafů exponenciální rodiny“. Sociální sítě. 31 (1): 52–62. doi:10.1016 / j.socnet.2008.10.003. PMC 3500576. PMID 23170041.
- ^ Harris, Jenine K (2014). Úvod do exponenciálního náhodného modelování grafů. ISBN 9781452220802. OCLC 870698788.