Fylogenetický strom - Phylogenetic tree


A fylogenetický strom nebo evoluční strom je větvení diagram nebo „strom "zobrazující evoluční vztahy mezi různými biologickými druh nebo jiné entity - jejich fylogeneze (/Faɪˈlɒdʒ.ni/) - na základě podobností a rozdílů v jejich fyzikálních nebo genetických vlastnostech. Celý život na Zemi je součástí jediného fylogenetického stromu, což naznačuje společný původ.
V zakořeněné fylogenetický strom, každý uzel s potomky představuje odvozený poslední společný předek těchto potomků a délky hran u některých stromů lze interpretovat jako časové odhady. Každý uzel se nazývá taxonomická jednotka. Vnitřní uzly se obecně nazývají hypotetické taxonomické jednotky, protože je nelze přímo pozorovat. Stromy jsou užitečné v oblastech biologie, jako je bioinformatika, systematičnost, a fylogenetika. Bez kořenů stromy ilustrují pouze příbuznost listové uzly a nevyžadují, aby byl známý nebo odvozený kořen předků.
Dějiny
Myšlenka „strom života „vznikl ze starověkých představ o žebříkovém postupu z nižší do vyšší formy život (například v Velký řetěz bytí ). Rané reprezentace „větvících se“ fylogenetických stromů zahrnují „paleontologický graf“ zobrazující geologické vztahy mezi rostlinami a zvířaty v knize Základní geologietím, že Edward Hitchcock (první vydání: 1840).
Charles Darwin (1859) také vytvořil jednu z prvních ilustrací a zásadně popularizoval pojem evoluční "strom" ve své klíčové knize Původ druhů. O více než století později evoluční biologové stále používat stromové diagramy líčit vývoj protože takové diagramy účinně vyjadřují koncept speciace dochází prostřednictvím adaptivní a částečněnáhodný rozdělení linií. V průběhu doby se klasifikace druhů stala méně statickou a dynamičtější.
Termín fylogenetickénebo fylogeneze, pochází z těchto dvou starořečtina slova φῦλον (phûlon), což znamená „rasa, linie“ a γένεσις (Genesis), což znamená „původ, zdroj“.[3][4]
Vlastnosti
Zakořeněný strom

Zakořeněný fylogenetický strom (viz dvě grafiky nahoře) je a režie strom s jedinečným uzlem - kořenem - odpovídajícím (obvykle přičteno ) poslední společný předek všech entit v listy stromu. Kořenový uzel nemá nadřazený uzel, ale slouží jako nadřazený uzel všech ostatních uzlů ve stromu. Kořen je tedy uzlem stupeň 2, zatímco ostatní vnitřní uzly mají minimální stupeň 3 (kde „stupeň“ zde označuje celkový počet příchozích a odchozích hran).
Nejběžnější metodou pro zakořenění stromů je použití nekontroverzního outgroup — Dostatečně blízko, aby umožňovalo odvození z údajů o vlastnostech nebo molekulárního sekvenování, ale dostatečně daleko na to, aby byla jasnou outgroup.
Nezakořeněný strom
Nezakořeněné stromy ilustrují příbuznost listových uzlů, aniž by předpokládaly předky. Nevyžadují, aby byl známý nebo odvozený kořen předků.[6] Nezakořeněné stromy lze vždy vygenerovat ze zakořeněných jednoduchým vynecháním kořene. Naproti tomu odvození kořene nezakořeněného stromu vyžaduje určité prostředky k identifikaci původu. To se obvykle provádí zahrnutím outgroup do vstupních dat, takže kořen je nutně mezi outgroup a zbytkem taxonů ve stromu, nebo zavedením dalších předpokladů o relativních rychlostech vývoje na každé větvi, jako je aplikace z molekulární hodiny hypotéza.[7]
Bifurcating versus multifurcating
Zakořeněné i nezakořeněné stromy mohou být buď rozdvojení nebo multifurcating. Zakořeněný bifurkační strom má z každého přesně dva potomky vnitřní uzel (to znamená, že tvoří a binární strom ) a nezakořeněný bifurkační strom má podobu nekořenovaný binární strom, a strom zdarma s přesně třemi sousedy v každém interním uzlu. Naproti tomu zakořeněný vícevrstvý strom může mít v některých uzlech více než dvě děti a nezakořeněný vícevrstvý strom může mít v některých uzlech více než tři sousedy.
Označené versus neoznačené
Zakořeněné i nezakořeněné stromy lze označit štítkem nebo bez štítku. Označený strom má specifické hodnoty přiřazené jeho listím, zatímco neoznačený strom, někdy nazývaný tvar stromu, definuje pouze topologii. Některé stromy založené na sekvenci postavené z malého genomového lokusu, jako je Phylotree[8], mají vnitřní uzly označené odvozenými haplotypy předků.
Výčet stromů

Počet možných stromů pro daný počet listových uzlů závisí na konkrétním typu stromu, ale vždy existuje více označených než neoznačených stromů, více multifunkčních než bifurkačních stromů a více zakořeněných než nezakořeněných stromů. Poslední rozdíl je biologicky nejrelevantnější; vzniká proto, že na nezakořeněném stromu je mnoho míst, kde se dá kořen. U rozdvojených označených stromů je celkový počet zakořeněných stromů:
- pro , představuje počet listových uzlů.[9]
U rozdvojených označených stromů je celkový počet nezakořeněných stromů:[9]
- pro .
Mezi označenými rozdvojujícími se stromy je počet nezakořeněných stromů s listy se rovná počtu zakořeněných stromů s listy.[10]
Počet zakořeněných stromů rychle roste v závislosti na počtu špiček. U 10 tipů jich je více než možných bifurkačních stromů a počet multifunkčních stromů roste rychleji, s ca. 7krát více z toho druhého než z toho prvního.
Označené listy | Binární nezakořeněné stromy | Binární zakořeněné stromy | Víceúčelový zakořeněné stromy | Všechno možné zakořeněné stromy |
---|---|---|---|---|
1 | 1 | 1 | 0 | 1 |
2 | 1 | 1 | 0 | 1 |
3 | 1 | 3 | 1 | 4 |
4 | 3 | 15 | 11 | 26 |
5 | 15 | 105 | 131 | 236 |
6 | 105 | 945 | 1,807 | 2,752 |
7 | 945 | 10,395 | 28,813 | 39,208 |
8 | 10,395 | 135,135 | 524,897 | 660,032 |
9 | 135,135 | 2,027,025 | 10,791,887 | 12,818,912 |
10 | 2,027,025 | 34,459,425 | 247,678,399 | 282,137,824 |
Speciální typy stromů
![]() | Tato sekce potřebuje další citace pro ověření.Ledna 2019) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Dendrogram

A dendrogram je obecný název pro strom, ať už fylogenetický nebo ne, a tedy také pro schematické znázornění fylogenetického stromu.[11]
Kladogram
A kladogram představuje pouze vzor větvení; tj. jeho délky větví nepředstavují čas ani relativní množství změny znaků a jeho vnitřní uzly nepředstavují předky.[12]
Fylogram
Fylogram je fylogenetický strom, který má délky větví úměrné množství změny charakteru.[13]
Chronogram

Chronogram je fylogenetický strom, který ve svých délkách větví výslovně představuje čas.[15]
Dahlgrenogram
A Dahlgrenogram je diagram představující průřez fylogenetickým stromem
Fylogenetická síť
A fylogenetická síť není přísně řečeno strom, ale spíše obecnější graf nebo směrovaný acyklický graf v případě rootovaných sítí. Slouží k překonání některých z nich omezení neodmyslitelnou součástí stromů.
Vřetenový diagram

Vřetenový diagram nebo bublinový diagram se po popularizaci americkým paleontologem často nazývá romerogram Alfred Romer.[16]Představuje taxonomickou rozmanitost (vodorovnou šířku) proti geologický čas (vertikální osa), aby odrážela variaci hojnosti různých taxonů v čase. Vřetenový diagram však není evolučním stromem:[17] taxonomická vřetena zakrývají skutečné vztahy mateřského taxonu k dceřinému taxonu[16] a mají tu nevýhodu, že zapojují parafylově rodičovské skupiny.[18]Tento typ diagramu se již nepoužívá v původně navržené podobě.[18]
Korál života

Darwine[19] také zmínil, že korál může být vhodnější metafora než strom. Vskutku, fylogenetické korály jsou užitečné pro zobrazení minulého a současného života a mají některé výhody oproti stromům (povolené anastomózy atd.).[18]
Konstrukce
Fylogenetické stromy složené s netriviálním počtem vstupních sekvencí jsou konstruovány pomocí výpočetní fylogenetika metody. Metody distanční matice, jako je sousedství nebo UPGMA, které počítají genetická vzdálenost z vícenásobné zarovnání sekvence, je nejjednodušší implementovat, ale nevyvolávají evoluční model. Mnoho metod zarovnání sekvence, jako je ClustalW také vytvářejte stromy pomocí jednodušších algoritmů (tj. těch, které jsou založeny na vzdálenosti) konstrukce stromu. Maximální šetrnost je další jednoduchá metoda odhadu fylogenetických stromů, ale implikuje implicitní model evoluce (tj. šetrnost). Pokročilejší metody používají kritérium optimality z maximální pravděpodobnost, často v rámci Bayesovský rámec a na odhad fylogenetického stromu použít explicitní model evoluce.[10] Identifikace optimálního stromu pomocí mnoha z těchto technik je NP-tvrdé,[10] tak heuristický hledat a optimalizace metody se používají v kombinaci s funkcemi bodování stromů k identifikaci přiměřeně dobrého stromu, který vyhovuje datům.
Metody budování stromů lze hodnotit na základě několika kritérií:[20]
- účinnost (jak dlouho trvá výpočet odpovědi, kolik paměti potřebuje?)
- síla (dobře využívá data nebo dochází k plýtvání informacemi?)
- konzistence (bude konvergovat na stejnou odpověď opakovaně, pokud bude mít pokaždé jiná data pro stejný problém modelu?)
- robustnost (zvládá dobře porušení předpokladů podkladového modelu?)
- falsifiability (varuje nás, když není dobré jej používat, tj. když jsou porušeny předpoklady?)
Techniky budování stromů si také získaly pozornost matematiků. Stromy lze také stavět pomocí T-teorie.[21]
Formáty souborů
Stromy lze kódovat v mnoha různých formátech, přičemž všechny musí představovat vnořenou strukturu stromu. Mohou nebo nemusí kódovat délky větví a další funkce. Standardizované formáty jsou rozhodující pro distribuci a sdílení stromů, aniž by se spoléhaly na grafický výstup, který je těžké importovat do existujícího softwaru. Běžně používané formáty jsou
Omezení fylogenetické analýzy
![]() | Tato sekce potřebuje další citace pro ověření.Říjen 2012) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Přestože fylogenetické stromy se vyráběly na základě sekvenování geny nebo genomický údaje o různých druzích mohou poskytnout evoluční vhled, mají tyto analýzy důležitá omezení. Nejdůležitější je, že stromy, které generují, nemusí být nutně správné - nemusí nutně přesně představovat evoluční historii zahrnutých taxonů. Stejně jako u jiných vědeckých výsledků podléhají padělání dalším studiem (např. shromažďováním dalších údajů, analýzou stávajících údajů pomocí vylepšených metod). Údaje, na nichž jsou založeny, mohou být hlučný;[22] analýzu lze zmást pomocí genetická rekombinace,[23] horizontální přenos genů,[24] hybridizace mezi druhy, které nebyly nejbližšími sousedy na stromě před hybridizací, konvergentní evoluce, a konzervované sekvence.
Existují také problémy při zakládání analýzy na jediném typu postavy, například na jedné gen nebo protein nebo pouze na základě morfologické analýzy, protože takové stromy vytvořené z jiného nesouvisejícího zdroje dat se často liší od prvního, a proto je třeba odvodit fylogenetické vztahy mezi druhy velmi opatrně. To platí nejvíce o genetickém materiálu, který podléhá laterálnímu přenosu genů a rekombinace, kde se liší haplotyp bloky mohou mít různé historie. U těchto typů analýz je výstupním stromem fylogenetické analýzy jediného genu odhad fylogeneze genu (tj. Genového stromu), a nikoli fylogeneze taxony (tj. druhový strom), ze kterého byly tyto znaky odebrány, i když v ideálním případě by si oba měly být velmi blízké. Z tohoto důvodu vážné fylogenetické studie obecně používají kombinaci genů, které pocházejí z různých genomových zdrojů (např. Z mitochondriálních nebo plastidových vs. jaderných genomů),[25] nebo geny, u nichž se očekává, že se budou vyvíjet v různých selektivních režimech, takže homoplazmy (Nepravdivé homologie ) je nepravděpodobné, že by byl výsledkem přirozeného výběru.
Pokud jsou vyhynulé druhy zahrnuty jako koncové uzly v analýze (spíše než například k omezení vnitřních uzlů) se má za to, že nepředstavují přímé předky žádných existujících druhů. Vyhynulé druhy obvykle neobsahují vysoce kvalitní DNA.
Rozsah užitečných materiálů DNA se rozšířil o pokrok v technologiích extrakce a sekvenování. Vývoj technologií schopných odvodit sekvence z menších fragmentů nebo z prostorových vzorů produktů degradace DNA by dále rozšířil rozsah DNA považované za užitečnou.
Fylogenetické stromy lze odvodit také z řady dalších datových typů, včetně morfologie, přítomnosti nebo nepřítomnosti konkrétních typů genů, událostí vložení a delece - a jakéhokoli jiného pozorování, o kterém se předpokládá, že obsahuje evoluční signál.
Fylogenetické sítě se používají, když bifurkační stromy nejsou vhodné, kvůli těmto komplikacím, které naznačují síťovější evoluční historii vzorkovaných organismů.
Viz také
Reference
- ^ Letunic, Ivica; Bork, Peer (1. ledna 2007). „Interactive Tree Of Life (iTOL): an online tool for phylogenetic tree display and annotation“ (PDF). Bioinformatika. 23 (1): 127–128. doi:10.1093 / bioinformatika / btl529. ISSN 1367-4803. PMID 17050570. Archivováno (PDF) od originálu 29. listopadu 2015. Citováno 2015-07-21.
- ^ Ciccarelli, F. D .; Doerks, T .; Von Mering, C .; Creevey, C. J .; Snel, B .; Bork, P. (2006). „Směrem k automatické rekonstrukci vysoce vyřešeného stromu života“ (PDF). Věda. 311 (5765): 1283–1287. Bibcode:2006Sci ... 311.1283C. CiteSeerX 10.1.1.381.9514. doi:10.1126 / science.1123061. PMID 16513982. S2CID 1615592.
- ^ Bailly, Anatole (01.01.1981). Abrégé du dictionnaire grec français. Paris: Hachette. ISBN 978-2010035289. OCLC 461974285.
- ^ Bailly, Anatole. "Řecko-francouzský slovník online". www.tabularium.be. Archivováno od originálu 21. dubna 2014. Citováno 2. března 2018.
- ^ Hodge T, Cope M (1. října 2000). „Rodokmen myosinů“. J Cell Sci. 113 (19): 3353–4. PMID 10984423. Archivováno z původního dne 30. září 2007.
- ^ ""Strom „Fakta: zakořeněné versus nezakořeněné stromy“. Archivováno od originálu 2014-04-14. Citováno 2014-05-26.
- ^ Maher BA (2002). „Vykořenění stromu života“. Vědec. 16 (2): 90–95. Bibcode:2000SciAm.282b..90D. doi:10.1038 / scientificamerican0200-90. PMID 10710791. Archivováno od originálu dne 10.10.2003.
- ^ van Oven, Mannis; Kayser, Manfred (2009). "Aktualizovaný komplexní fylogenetický strom globální variace lidské mitochondriální DNA". Lidská mutace. 30 (2): E386 – E394. doi:10.1002 / humu.20921. PMID 18853457. S2CID 27566749.
- ^ A b C Felsenstein, Joseph (01.03.1978). „Počet evolučních stromů“. Systematická biologie. 27 (1): 27–33. doi:10.2307/2412810. ISSN 1063-5157. JSTOR 2412810.
- ^ A b C Felsenstein J. (2004). Odvozovat fylogeneze Sinauer Associates: Sunderland, MA.
- ^ Fox, Emily. „Dendrogram“. Coursea. Coursea. Archivováno z původního dne 28. září 2017. Citováno 28. září 2017.
- ^ Mayr, Ernst (2009) „Kladistická analýza nebo kladistická klasifikace?“. Journal of Zoological Systematics and Evolutionary Research. 12: 94–128. doi: 10.1111 / j.1439-0469.1974.tb00160.x ..
- ^ Soares, Antonio; Râbelo, Ricardo; Delbem, Alexandre (2017). Msgstr "Optimalizace založená na analýze fylogramu". Expertní systémy s aplikacemi. 78: 32–50. doi:10.1016 / j.eswa.2017.02.012. ISSN 0957-4174.
- ^ Labandeira, C. C .; Dilcher, D. L .; Davis, D.R .; Wagner, D. L. (06.12.1994). „Devadesát sedm milionů let asociace krytosemenných hmyzu: paleobiologický pohled na význam koevoluce“. Sborník Národní akademie věd. 91 (25): 12278–12282. Bibcode:1994PNAS ... 9112278L. doi:10.1073 / pnas.91.25.12278. ISSN 0027-8424. PMC 45420. PMID 11607501.
- ^ Santamaria, R .; Theron, R. (2009-05-26). „Treevolution: vizuální analýza fylogenetických stromů“. Bioinformatika. 25 (15): 1970–1971. doi:10.1093 / bioinformatika / btp333. PMID 19470585.
- ^ A b „Evoluční systematika: Vřetenové diagramy“. Palaeos.com. 2014-11-10. Citováno 2019-11-07.
- ^ „Stromy, bubliny a kopyta“. Mozek opice se třemi librami - biologie, programování, lingvistika, fylogeneze, systematika…. 2007-11-21. Citováno 2019-11-07.
- ^ A b C Podani, János (01.06.2019). "Korál života". Evoluční biologie. 46 (2): 123–144. doi:10.1007 / s11692-019-09474-w. ISSN 1934-2845.
- ^ Darwin, Charles (1837). Notebook B. str. 25.
- ^ Penny, D .; Hendy, M. D .; Steel, M. A. (1992). "Pokrok v metodách konstrukce evolučních stromů". Trendy v ekologii a evoluci. 7 (3): 73–79. doi:10.1016/0169-5347(92)90244-6. PMID 21235960.
- ^ A. Dress, K. T. Huber a V. Moulton. 2001. Metrické prostory v čisté a aplikované matematice. Documenta Mathematica LSU 2001: 121-139
- ^ Townsend JP, Su Z, Tekle Y (2012). „Fylogenetický signál a šum: Predikce síly souboru dat k vyřešení fylogeneze“. Genetika. 61 (5): 835–849. doi:10.1093 / sysbio / sys036. PMID 22389443.
- ^ Arenas M, Posada D (2010). "Účinek rekombinace na rekonstrukci předků". Genetika. 184 (4): 1133–1139. doi:10.1534 / genetika.109.113423. PMC 2865913. PMID 20124027.
- ^ Woese C (2002). „O vývoji buněk“. Proc Natl Acad Sci USA. 99 (13): 8742–7. Bibcode:2002PNAS ... 99.8742W. doi:10.1073 / pnas.132266999. PMC 124369. PMID 12077305.
- ^ Parhi, J .; Tripathy, P.S .; Priyadarshi, H .; Mandal, SC; Pandey, P.K. (2019). "Diagnóza mitogenomu pro robustní fylogenezi: Případ skupiny ryb Cypriniformes". Gen. 713: 143967. doi:10.1016 / j.gene.2019.143967. PMID 31279710.
Další čtení
- Schuh, R. T. a A. V. Z. Brower. 2009. Biologická systematika: principy a aplikace (2. vydání) ISBN 978-0-8014-4799-0
- Manuel Lima, Kniha stromů: Vizualizace větví znalostí, 2014, Princeton Architectural Press, New York.
- MEGA, bezplatný software pro kreslení fylogenetických stromů.
- Gontier, N. 2011. „Zobrazování stromu života: Filozofické a historické kořeny evolučních stromových diagramů.“ Evoluce, vzdělávání, dosah 4: 515–538.
externí odkazy
snímky
- Fylogenetický strom lidského Y-chromozomu 2002
- iTOL: Interaktivní strom života
- Fylogenetický strom umělých organismů vyvinutých na počítačích
- Miyamoto a Goodmanův fylogram eutherianských savců
Všeobecné
- Přehled různých metod vizualizace stromu je k dispozici na Page, R. D. M. (2011). "Prostor, čas, forma: Pohled na Strom života". Trendy v ekologii a evoluci. 27 (2): 113–120. doi:10.1016 / j.tree.2011.12.002. PMID 22209094.
- OneZoom: Tree of Life - všechny živé druhy jako intuitivní a zvětšitelný průzkumník fraktálů (responzivní design)
- Objevte život Interaktivní strom založený na projektu Assembling the Tree of Life (Národní shromáždění USA) z Národní vědecké nadace USA
- PhyloCode
- Vícenásobné zarovnání 139 sekvencí myosinu a fylogenetický strom
- Webový projekt Tree of Life
- Fylogenetické odvození na serveru T-REX
- Databáze taxonomie NCBI[1]
- ETE: Prostředí Python pro průzkum stromů Toto je programovací knihovna pro analýzu, manipulaci a vizualizaci fylogenetických stromů. Čj.
- Denně aktualizovaný strom života (v pořadí) Fang, H .; Oates, M.E .; Pethica, R. B .; Greenwood, J. M .; Sardar, A. J .; Rackham, O. J. L .; Donoghue, P. C. J .; Stamatakis, A .; De Lima Morais, D. A .; Gough, J. (2013). „Denně aktualizovaný strom (sekvencovaného) života jako reference pro výzkum genomu“. Vědecké zprávy. 3: 2015. Bibcode:2013NatSR ... 3E2015F. doi:10.1038 / srep02015. PMC 6504836. PMID 23778980.