Matice Google - Google matrix
![]() | Tento článek má několik problémů. Prosím pomozte vylepši to nebo diskutovat o těchto otázkách na internetu diskusní stránka. (Zjistěte, jak a kdy tyto zprávy ze šablony odebrat) (Zjistěte, jak a kdy odstranit tuto zprávu šablony)
|

A Matice Google je zvláštní stochastická matice který používá Google je PageRank algoritmus. Matice představuje graf s hranami představujícími odkazy mezi stránkami. PageRank každé stránky lze poté iterativně generovat z matice Google pomocí metoda napájení. Aby se však energetická metoda sbíhala, musí být matice stochastická, neredukovatelné a neperiodické.
Matice sousedství A a Markovova matice S
Za účelem vygenerování matice Google G, musíme nejprve vygenerovat matici sousedství A což představuje vztahy mezi stránkami nebo uzly.
Za předpokladu, že existují N stránky, můžeme vyplnit A provedením následujícího:
- Maticový prvek je naplněn 1 if uzlem má odkaz na uzel a 0 jinak; toto je matice sousedství odkazů.
- Související matice S odpovídající přechodům v a Markovův řetězec dané sítě je konstruováno z A dělením prvků sloupce "j" počtem kde je celkový počet odchozích odkazů z uzluj do všech ostatních uzlů. Sloupce s prvky nulové matice, které odpovídají visícím uzlům, jsou nahrazeny konstantní hodnotou 1 / N. Takový postup přidává odkaz z každého stavu klesání a houpání do každého dalšího uzlu.
- Nyní konstrukcí součet všech prvků v libovolném sloupci matice S se rovná jednotě. Tímto způsobem matice S je matematicky dobře definovaný a patří do třídy Markovových řetězců a do třídy operátorů Perron-Frobenius. To dělá S vhodné pro PageRank algoritmus.
Konstrukce Google matice G

Potom může být konečná matice Google G vyjádřena pomocí S tak jako:
Konstrukcí se součet všech nezáporných prvků uvnitř každého sloupce matice rovná jednotce. Numerický koeficient je známý jako tlumící faktor.
Obvykle S je řídká matice a pro moderní směrované sítě má pouze asi deset nenulových prvků v řádku nebo sloupci, tedy jen asi 10N k násobení vektoru maticí je zapotřebí násobeníG.[2][3]
Příklady matice Google
Příklad matice konstrukce v rovnici (1) v rámci jednoduché sítě je uvedena v článku CheiRank.
Pro vlastní matici používá Google tlumicí faktor kolem 0,85.[2][3][4] Termín dává pravděpodobnost surfaře, že náhodně skočí na libovolnou stránku. Matice patří do třídy Provozovatelé společnosti Perron-Frobenius z Markovovy řetězy.[2] Příklady struktury matice Google jsou uvedeny na obrázku 1 pro síť hypertextových odkazů na články Wikipedie v roce 2009 v malém měřítku a na obrázku 2 pro síť University of Cambridge v roce 2006 ve velkém měřítku.
Spektrum a vlastní stavy G matice

Pro existuje pouze jedna maximální vlastní hodnota s odpovídajícím pravým vlastním vektorem, který má nezáporné prvky což lze považovat za stacionární rozdělení pravděpodobnosti.[2] Tyto pravděpodobnosti seřazené podle jejich klesajících hodnot dávají vektor PageRank s hodnocením PageRank používá vyhledávání Google k hodnocení webových stránek. Obvykle je to pro World Wide Web s . Počet uzlů s danou hodnotou PageRank se změní na s exponentem .[6][7] Levý vlastní vektor v má konstantní maticové prvky. S všechna vlastní čísla se pohybují jako kromě maximálního vlastního čísla , který zůstává nezměněn.[2] Vektor PageRank se liší podle ale jiné vlastní vektory s zůstanou nezměněny kvůli jejich ortogonalitě vůči konstantnímu levému vektoru v . Rozdíl mezi a další bytí vlastních čísel poskytuje rychlou konvergenci náhodného počátečního vektoru do PageRank přibližně po 50 násobeních matice.

Na matice má obecně mnoho zdegenerovaných vlastních čísel (viz např. [6][8]). Příklady spektra vlastních čísel matice Google různých směrovaných sítí je znázorněno na obr.3 z [5] a obr. 4 z.[8]
Matici Google lze také vytvořit pro sítě Ulam generované metodou Ulam [8] pro dynamické mapy. Spektrální vlastnosti takových matic jsou popsány v [9,10,11,12,13,15].[5][9] V řadě případů je spektrum popsáno fraktálním Weylovým zákonem [10,12].


Matici Google lze vytvořit i pro jiné směrované sítě, např. pro síť volání procedur softwaru Linux Kernel představeného v [15]. V tomto případě spektrum je popsán fraktálním Weylovým zákonem s fraktální dimenzí (viz obr. 5 z [9]). Numerická analýza ukazuje, že vlastní stavy matice jsou lokalizovány (viz obr.6 z [9]). Arnoldiho iterace metoda umožňuje vypočítat mnoho vlastních čísel a vektorů pro matice poměrně velké velikosti [13].[5][9]
Další příklady matice zahrnuje Google matici mozku [17] a řízení podnikových procesů [18], viz také.[1] Aplikace maticové analýzy Google na sekvence DNA jsou popsány v [20]. Takový přístup pomocí matice Google umožňuje také analyzovat zapletení kultur prostřednictvím hodnocení vícejazyčných článků na Wikipedii o osobách [21]
Historické poznámky
Matici Google s tlumícím faktorem popsal Sergej Brin a Larry Page v roce 1998 [22], viz také články o historii PageRank [23], [24].
Viz také
Reference
- ^ A b C Ermann, L .; Chepelianskii, A. D .; Shepelyansky, D. L. (2011). "Směrem k dvourozměrným vyhledávačům". Journal of Physics A. 45 (27): 275101. arXiv:1106.6215. Bibcode:2012JPhA ... 45A5101E. doi:10.1088/1751-8113/45/27/275101.
- ^ A b C d E Langville, Amy N.; Meyer, Carl (2006). Google PageRank a další. Princeton University Press. ISBN 978-0-691-12202-1.
- ^ A b Austin, David (2008). „Jak Google najde vaši jehlu v kupce sena na webu“. Sloupce funkcí AMS.
- ^ Law, Edith (09.10.2008). „Přednáška PageRank 12“ (PDF).
- ^ A b C d Frahm, K. M .; Georgeot, B .; Shepelyansky, D. L. (01.11.2011). "Univerzální vznik PageRank". Journal of Physics A. 44 (46): 465101. arXiv:1105.1062. Bibcode:2011JPhA ... 44T5101F. doi:10.1088/1751-8113/44/46/465101.
- ^ Donato, Debora; Laura, Luigi; Leonardi, Stefano; Millozzi, Stefano (30. 3. 2004). "Vlastnosti Webgraph ve velkém měřítku" (PDF). Evropský fyzický deník B. 38 (2): 239–243. Bibcode:2004EPJB ... 38..239D. CiteSeerX 10.1.1.104.2136. doi:10.1140 / epjb / e2004-00056-6.
- ^ Pandurangan, Gopal; Ranghavan, Prabhakar; Upfal, Eli (2005). „Použití PageRank k charakterizaci struktury webu“ (PDF). Internetová matematika. 3 (1): 1–20. doi:10.1080/15427951.2006.10129114.
- ^ A b C Georgeot, Bertrand; Giraud, Olivier; Shepelyansky, Dima L. (2010-05-25). "Spektrální vlastnosti matice Google v síti WWW a dalších směrovaných sítích". Fyzický přehled E. 81 (5): 056109. arXiv:1002.3342. Bibcode:2010PhRvE..81e6109G. doi:10.1103 / PhysRevE.81.056109. PMID 20866299.
- ^ A b C d E F Ermann, L .; Chepelianskii, A. D .; Shepelyansky, D. L. (2011). "Fractal Weylův zákon pro linuxovou jádrovou architekturu". Evropský fyzický deník B. 79 (1): 115–120. arXiv:1005.1395. Bibcode:2011EPJB ... 79..115E. doi:10.1140 / epjb / e2010-10774-7.
- Serra-Capizzano, Stefano (2005). „Jordan Canonical Form of the Google Matrix: a Potential Contribution to the PageRank Computation“. SIAM J. Matrix Anal. Appl. 27: 305. doi:10.1137 / s0895479804441407. hdl:11383/1494937.
- Ulam, Stanislaw (1960). Sbírka matematických problémů. Mezivědní trakty v čisté a aplikované matematice. New York: Mezivědnost. str. 73.
- Froyland G .; Padberg K. (2009). „Téměř invariantní množiny a invariantní varietá - propojení pravděpodobnostních a geometrických popisů koherentních struktur v tocích“. Physica D. 238: 1507. doi:10.1016 / j.physd.2009.03.002.
- Shepelyansky D.L .; Žirov O.V. (2010). "Google matice, dynamické atraktory a Ulamovy sítě". Phys. Rev.. 81: 036213. arXiv:0905.4162. doi:10.1103 / physreve.81.036213.
- Ermann L .; Shepelyansky D.L. (2010). Msgstr "Google matice a Ulamovy sítě periodických map". Phys. Rev.. 81: 036221. arXiv:0911.3823. doi:10.1103 / physreve.81.036221.
- Ermann L .; Shepelyansky D.L. (2010). "Ulamova metoda a fraktální Weylův zákon pro operátory Perron-Frobenius". Eur. Phys. J. B.. 75: 299. arXiv:0912.5083. doi:10.1140 / epjb / e2010-00144-0.
- Frahm K.M .; Shepelyansky D.L. (2010). "Ulamova metoda pro Chirikovovu standardní mapu". Eur. Phys. J. B.. 76: 57. arXiv:1004.1349. doi:10.1140 / epjb / e2010-00190-6.
- Chepelianskii, Alexei D. (2010). "Směrem k fyzickým zákonům pro softwarovou architekturu". arXiv:1003.5455 [cs.SE ].
- Shepelyansky D.L .; Žirov O.V. (2010). "Směrem k matici mozku Google". Phys. Lett. A. 374: 3206. arXiv:1002.4583. doi:10.1016 / j.physleta.2010.06.007.
- Abel M .; Shepelyansky D.L. (2011). Msgstr "Google matice řízení podnikových procesů". Eur. Phys. J. B.. 84 (4): 493. arXiv:1009.2631. Bibcode:2011EPJB ... 84..493A. doi:10.1140 / epjb / e2010-10710-r.
- Kandiah, Vivek; Shepelyansky, Dima L. (2013). „Google Matrix Analysis of DNA Sequences“. PLOS ONE. 8 (5): e61519. doi:10.1371 / journal.pone.0061519. PMC 3650020. PMID 23671568.
- Eom, Young-Ho; Shepelyansky, Dima L. (2013). „Zvýraznění zapletení kultur prostřednictvím hodnocení vícejazyčných článků na Wikipedii“. PLOS ONE. 8 (10): e74554. doi:10.1371 / journal.pone.0074554. PMC 3789750. PMID 24098338.
- Brin S .; Strana L. (1998). "Anatomie rozsáhlého hypertextového webového vyhledávače". Počítačové sítě a systémy ISDN. 30: 107. doi:10.1016 / s0169-7552 (98) 00110-x.
- Massimo, Franceschet (2010). „PageRank: Stojící na bedrech obrů“. arXiv:1002.2858 [cs.IR ].
- Vigna, Sebastiano (2010). „Spektrální hodnocení“ (PDF).