De Bruijnův graf - De Bruijn graph

v teorie grafů, an n-dimenzionální De Bruijnův graf z m symboly je a řízený graf představující přesahy mezi sekvencemi symbolů. Má to mn vrcholy, skládající se ze všech možných délek-n sekvence daných symbolů; stejný symbol se může objevit několikrát za sebou. Pokud máme sadu m symboly pak sada vrcholů je:

Pokud lze jeden z vrcholů vyjádřit jako jiný vrchol posunutím všech jeho symbolů o jedno místo doleva a přidáním nového symbolu na konec tohoto vrcholu, pak má druhý orientovaný okraj k předchozímu vrcholu. Sada oblouků (tj. Směrované hrany) tedy je

Ačkoli jsou De Bruijnovy grafy pojmenovány Nicolaas Govert de Bruijn, objevili je nezávisle oba De Bruijn[1] a I. J. Dobrý.[2] Mnohem dříve, Camille Flye Sainte-Marie[3] implicitně využily jejich vlastnosti.

Vlastnosti

  • Li pak podmínka pro libovolné dva vrcholy tvořící hranu drží vakuově, a proto jsou všechny vrcholy spojeny a tvoří celkem hrany.
  • Každý vrchol má přesně příchozí a odchozí hrany.
  • Každý -dimenzionální De Bruijn graf je řádkový digraf z -dimenzionální De Bruijn graf se stejnou sadou symbolů.[4]
  • Každý graf De Bruijn je Eulerian a Hamiltonian. Eulerovy cykly a Hamiltonovské cykly těchto grafů (navzájem ekvivalentní konstrukcí spojnicového grafu) jsou De Bruijn sekvence.

The hranový graf níže je znázorněna konstrukce tří nejmenších binárních De Bruijnových grafů. Jak je vidět na obrázku, každý vrchol -dimenzionální graf De Bruijn odpovídá okraji -dimenzionální graf De Bruijn a každá hrana v -dimenzionální graf De Bruijn odpovídá dvousměrné cestě v -rozměrný graf De Bruijn.

DeBruijn-as-line-digraph.svg

Dynamické systémy

Binární De Bruijn grafy lze kreslit (dole, vlevo) takovým způsobem, že se podobají objektům z teorie dynamické systémy, tak jako Lorenzův atraktor (dole vpravo):

DeBruijn-3-2.svg         Lorenzův atraktor yb.svg

Tuto analogii lze učinit přísnou: n-dimenzionální m-symbol De Bruijn graf je model Satelitní mapa Bernoulli

Mapa Bernoulli (nazývaná také 2x mapa mod 1 pro m = 2) je ergodický dynamický systém, který lze chápat jako jediný posun a m-adic číslo.[5] Trajektorie tohoto dynamického systému odpovídají procházkám v grafu De Bruijn, kde je korespondence dána mapováním každé skutečné X v intervalu [0,1] k vrcholu odpovídajícímu prvnímu n číslice v základna -m zastoupení X. Ekvivalentně procházky v grafu De Bruijn odpovídají jednostranným trajektoriím podřazení konečného typu.

Směrované grafy dvou B (2, 3) de Bruijn sekvence a a B (2, 4) sekvence. V B (2,3). každý vrchol je navštíven jednou, zatímco v B (2,4) je každá hrana jednou projet.

Vložení podobné tomuto lze použít k ukázce, že binární grafy De Bruijn mají číslo fronty 2[6] a že mají tloušťka knihy nanejvýš 5.[7]

Použití

Viz také

Reference

  1. ^ de Bruijn; N. G. (1946). "Kombinatorický problém". Koninklijke Nederlandse Akademie V. Wetenschappen. 49: 758–764.
  2. ^ Dobře, I. J. (1946). Msgstr "Normální opakující se desetinná místa". Journal of the London Mathematical Society. 21 (3): 167–169. doi:10.1112 / jlms / s1-21.3.167.
  3. ^ Flye Sainte-Marie, C. (1894). „Otázka 48“. L'Intermédiaire des Mathématiciens. 1: 107–110.
  4. ^ Zhang, Fu Ji; Lin, Guo Ning (1987). „Na grafech de Bruijn-Good“. Acta Math. Sinica. 30 (2): 195–205.
  5. ^ Leroux, Philippe (2002). „Coassociative grammar, periodic orbits and quantum random walk over Z“. arXiv:quant-ph / 0209100.
  6. ^ Heath, Lenwood S .; Rosenberg, Arnold L. (1992). "Rozložení grafů pomocí front". SIAM Journal on Computing. 21 (5): 927–958. doi:10.1137/0221055. PAN  1181408.
  7. ^ Obrenić, Bojana (1993). "Vložení de Bruijna a náhodné výměny grafů na pět stránek". SIAM Journal on Discrete Mathematics. 6 (4): 642–654. doi:10.1137/0406049. PAN  1241401.
  8. ^ Pevzner, Pavel A .; Tang, Haixu; Waterman, Michael S. (2001). „Eulerianský přístup k sestavě fragmentů DNA“. PNAS. 98 (17): 9748–9753. Bibcode:2001PNAS ... 98.9748P. doi:10.1073 / pnas.171285098. PMC  55524. PMID  11504945.
  9. ^ Pevzner, Pavel A .; Tang, Haixu (2001). „Fragment Assembly with Double-Barreled Data“. Bioinformatika. 17 (Suppl 1): S225 – S233. doi:10.1093 / bioinformatika / 17.suppl_1.S225. PMID  11473013.
  10. ^ Zerbino, Daniel R .; Birney, Ewan (2008). "Velvet: algoritmy pro de novo sestavení krátkého čtení pomocí grafů de Bruijn". Výzkum genomu. 18 (5): 821–829. doi:10.1101 / gr.074492.107. PMC  2336801. PMID  18349386.
  11. ^ Chikhi, R; Limasset, A; Jackman, S; Simpson, J; Medvedev, P (2014). "K reprezentaci de Bruijnových grafů". Journal of Computational Biology: Journal of Computational Molecular Cell Biology. 22 (5): 336–52. arXiv:1401.5383. doi:10.1089 / cmb.2014.0160. PMID  25629448.
  12. ^ Iqbal, Zamin; Caccamo, Mario; Turner, Isaac; Flicek, Paul; McVean, Gil (2012). „Sestavení de novo a genotypizace variant pomocí barevných de Bruijnových grafů“. Genetika přírody. 44 (2): 226–32. doi:10.1038 / ng.1028. PMC  3272472. PMID  22231483.

externí odkazy