Referenční hodnota Lancichinetti – Fortunato – Radicchi - Lancichinetti–Fortunato–Radicchi benchmark

Lancichinetti – Fortunato – Radicchi měřítko je algoritmus, který generuje měřítko sítě (umělé sítě, které se podobají sítím v reálném světě). Oni mají a priori známý komunity a slouží k porovnání různých metod detekce komunity.[1] Výhodou srovnávacího testu oproti jiným metodám je to, že odpovídá za heterogenita v distribucích uzel stupňů a velikostí komunity.[2]

Algoritmus

Stupně uzlů a velikosti komunity jsou rozděleny podle a mocenský zákon, s různými exponenty. Benchmark předpokládá, že jak stupeň, tak velikost komunity ano rozdělení moci s různými exponenty, a , resp. je počet uzlů a průměrný stupeň je . Existuje směšovací parametr , což je průměrný zlomek sousedních uzlů uzlu, které nepatří do žádné komunity, do které referenční uzel patří. Tento parametr řídí zlomek hran, které jsou mezi komunitami.[2] Odráží tedy množství šumu v síti. V extrémech, když všechny odkazy jsou v rámci komunitních odkazů, pokud všechny odkazy jsou mezi uzly patřícími do různých komunit.[3]

Jeden může generovat srovnávací síť pomocí následujících kroků.

Krok 1: Vytvořte síť s uzly podle rozdělení zákonu moci s exponentem a zvolit extrémy distribuce a získat požadovaný průměrný stupeň je .

Krok 2: zlomek odkazů každého uzlu je s uzly stejné komunity, zatímco zlomek je s ostatními uzly.

Krok 3: Generujte velikosti komunity z distribuce zákonů moci s exponentem . Součet všech velikostí se musí rovnat . Minimální a maximální velikost komunity a musí vyhovovat definici komunity tak, aby každý neizolovaný uzel byl alespoň v jedné komunitě:

Krok 4: Zpočátku nejsou komunitám přiřazovány žádné uzly. Poté je každý uzel náhodně přiřazen ke komunitě. Dokud počet sousedních uzlů v komunitě nepřesáhne velikost komunity, do komunity se přidá nový uzel, jinak zůstane mimo. V následujících iteracích je uzel „bezdomovec“ náhodně přiřazen nějaké komunitě. Pokud je tato komunita úplná, tj. Její velikost je vyčerpána, musí být náhodně vybraný uzel této komunity odpojen. Zastavte iteraci, když jsou všechny komunity kompletní a všechny uzly patří alespoň jedné komunitě.

Krok 5: Implementujte opětovné zapojení uzlů při zachování stejných stupňů uzlů, ale ovlivňujících pouze zlomek interních a externích odkazů tak, aby počet odkazů mimo komunitu pro každý uzel byl přibližně stejný jako parametr míchání .[2]

Testování

Zvažte a rozdělit do komunit, které se nepřekrývají. Komunita náhodně vybraných uzlů v každé iteraci následují a distribuce, která představuje pravděpodobnost, že náhodně vybraný uzel je z komunity . Zvažte oddíl stejné sítě, který byl předpovězen nějakým algoritmem hledání komunity a má rozdělení. Referenční oddíl má Společná distribuce je . Podobnost těchto dvou oddílů je zachycena normalizací vzájemné informace.

Li benchmark a detekované oddíly jsou identické, a pokud pak jsou na sobě nezávislí.[4]

Reference

  1. ^ Hua-Wei Shen (2013). "Struktura komunity složitých sítí". Springer Science & Business Media. 11–12.
  2. ^ A b C A. Lancichinetti, S. Fortunato a F. Radicchi. (2008) Srovnávací grafy pro testování algoritmů detekce komunity. Fyzická recenze E, 78. arXiv:0805.4770
  3. ^ Twan van Laarhoven a Elena Marchiori (2013). "Detekce síťové komunity s hraničními klasifikátory trénovanými na LFR grafech". https://www.cs.ru.nl/~elenam/paper-learning-community.pdf
  4. ^ Barabasi, A.-L. (2014). "Síťová věda". Kapitola 9: Komunity.