T-REX (webový server) - T-REX (webserver)
tento článek může být pro většinu čtenářů příliš technická na to, aby tomu rozuměli. Prosím pomozte to vylepšit na aby to bylo srozumitelné pro neodborníky, aniž by byly odstraněny technické podrobnosti. (Říjen 2012) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) |
T REX(webová stránka ) (Rekonstrukce stromu a retikulogramu)[1][2] je volně dostupný webový server, vyvinutý na katedře výpočetní techniky Université du Québec à Montréal, věnovaný odvození, ověření a vizualizaci fylogenetické stromy a fylogenetické sítě. Webový server T-REX[1][2] umožňuje uživatelům provádět několik populárních metod fylogenetické analýzy i některé nové fylogenetické aplikace pro odvozování, kreslení a ověřování fylogenetických stromů a sítí.
Fylogenetická inference
K dispozici jsou následující metody pro odvození a ověření fylogenetických stromů pomocí vzdáleností: Soused se připojil (NJ), NINJA ve velkém sousedním připojení, BioNJ, UNJ, ADDTREE, MW, FITCH a rekonstrukce kruhových objednávek. Pro maximální šetrnost: DNAPARS, PROTPARS, PARS a DOLLOP, všechny z PHYLIP balíček a pro maximální pravděpodobnost: PhyML,[3] RAxML,[4] DNAML, DNAMLK, PROML a PROMLK, poslední čtyři metody jsou z PHYLIP balíček, jsou k dispozici.
Kresba stromu
K dispozici jsou hierarchické vertikální, horizontální, radiální a axiální typy stromových výkresů.
Vstupní data mohou být ve třech následujících formátech: Newick formát, PHYLIP a Formát FASTA. Všechny grafické výsledky poskytované serverem T-REX lze uložit ve formátu SVG (Scalable Vector Graphics) a poté je otevřít a upravit (např. Připravit pro publikaci nebo prezentaci) v preferovaném grafickém editoru uživatele.
Budova stromu
Vyvinutá aplikace pro kreslení fylogenetických stromů, která umožňuje jejich uložení v Newick formát.
Odvození stromu z neúplných matic
K dispozici jsou následující metody rekonstrukce fylogenetických stromů z matice vzdálenosti obsahující chybějící hodnoty, tj. Neúplné matice: Metoda trojúhelníků od Guénocheho a Leclerca (2001), Ultrametrický postup pro odhad chybějících hodnot Landryho, Lapointa a Kirsche (1996) NJ, Aditivní postup pro odhad chybějících hodnot Landry, Lapointe a Kirsch (1996), následovaný NJ, a metoda Modified Weighted najmenších čtverců (MW *) Makarenkov a Lapointe (2004). Metoda MW * přiřadí váhu 1 stávajícím položkám, váhu 0,5 odhadovaným položkám a váhu 0, když odhad vstupu nebyl možný. Simulace popsané v (Makarenkov a Lapointe 2004) ukázaly, že metoda MW * jasně překonává postupy Triangles, Ultrametric a Additive.
Detekce horizontálního přenosu genů
Úplné a částečné Horizontální přenos genů detekční a ověřovací metody jsou součástí serveru T-REX. Program detekce HGT[5] si klade za cíl určit optimální, tj. minimální náklady, scénář horizontálních genových přenosů, přičemž postupuje postupným sladěním daného druhu a genových stromů.
Závěr retikulogramu
Program retikulogramu, tj. Síťový rekonstrukční program, nejprve vytvoří podpůrný fylogenetický strom pomocí jedné ze stávajících metod odvozování stromu. V návaznosti na to je do stromu (nebo sítě počínaje krokem 2) v každém kroku algoritmu přidána větev síťování, která minimalizuje funkci nejmenších čtverců nebo váženého cíle nejméně čtverců.[6] Byla navržena dvě statistická kritéria, Q1 a Q2, aby bylo možné měřit zisk fit poskytnutý každou větvenou větví.
Verze webového serveru T-REX také poskytuje možnost odvodit podpůrný strom z jedné matice vzdálenosti a poté přidat větve mřížky pomocí jiné matice vzdálenosti. Takový algoritmus může být užitečný pro zobrazení morfologických nebo genetických podobností mezi danými druhy nebo pro identifikaci událostí HGT pomocí první matice vzdálenosti k odvození stromu druhů a druhé matice (obsahující vzdálenosti související s geny) k odvození větví síťování představujících domnělou horizontální genové transfery [6].[7]
Sekvenční zarovnání
MAFFT, MUSCLE (vyrovnávací software) a ClustalW, které patří mezi nejpoužívanější vícenásobné zarovnání sekvence nástroje, jsou k dispozici s možností pomalého a rychlého párového zarovnání.
Substituční modely (transformace sekvence na vzdálenost)
Do T-REX byly zahrnuty následující populární substituční modely evoluce DNA a aminokyselin, které umožňují odhadnout evoluční vzdálenosti ze sekvenčních dat: Neopravená vzdálenost, Jukes-Cantor (Jukes a Cantor 1969), K80 - 2 parametry (Kimura 1980) , T92 (Tamura 1992), Tajima-Nei (Tajima a Nei 1984), Jin-Nei gama (Jin a Nei 1990), protein Kimura (Kimura 1983), LogDet (Lockhart et al. 1994), F84 (Felsenstein 1981), WAG (Whelan a Goldman 2001), JTT (Jones et al. 1992) a LG (Le a Gascuel 2008).
Robinson a Foulds topologická vzdálenost
Tento program počítá Robinson – Fouldsova metrika (RF) topologická vzdálenost (Robinson and Foulds 1981), což je populární měřítko podobnosti stromů, mezi prvním stromem a všemi následujícími stromy specifikovanými uživatelem. Stromy lze dodávat ve formátech newick nebo distanční matice. Pro výpočet RF metriky se provádí optimální algoritmus popsaný v (Makarenkov a Leclerc 2000).
Převod Newick na Matrix
Převod formátu Newick na vzdálenost a matice vzdálenosti na Newick. Interní aplikace umožňuje uživateli převést a fylogenetický strom z Newick formát do Distanční matice formát a naopak.
Generátor náhodných stromů
Tato aplikace generuje k náhodné fylogenetické stromy s n listy, tj. druhy nebo taxony, a průměrnou délkou větve l pomocí postupu generování náhodných stromů popsaného Kuhnerem a Felsensteinem (1994),[8] kde proměnné k, n a l jsou definovány uživatelem. Délky větví stromů sledují exponenciální rozdělení. Délky větví se vynásobí 1+sekera, kde proměnná X se získá z exponenciálního rozdělení (P (X>k) = exp (-k)) a konstanta a je ladicí faktor, který zohledňuje intenzitu odchylky (jak je popsáno v Guindon a Gascuel (2002),[9] hodnota a byla nastavena na 0,8). Náhodné stromy generované tímto postupem mají hloubku O (log (n)).
Reference
- ^ A b Boc A, Diallo Alpha B, Makarenkov V (červen 2012). „T-REX: webový server pro odvozování, ověřování a vizualizaci fylogenetických stromů a sítí“. Nucleic Acids Res. 40 (Problém s webovým serverem): W573 – W579. doi:10.1093 / nar / gks485. PMC 3394261. PMID 22675075.
- ^ A b Makarenkov V (červenec 2001). „T-REX: Rekonstrukce a vizualizace fylogenetických stromů a síťových sítí“. Bioinformatika. 17 (7): 664–668. doi:10.1093 / bioinformatika / 17.7.664. PMID 11448889.
- ^ Guindon S, Delsuc F, Dufayard JF, Gascuel O (2009). Odhad maximální pravděpodobnosti fylogeneze pomocí PhyML. Methods Mol. Biol. Metody v molekulární biologii. 537. Humana Press. 113–137. CiteSeerX 10.1.1.464.7907. doi:10.1007/978-1-59745-251-9_6. ISBN 978-1-58829-910-9. PMID 19378142.
- ^ Stamatakis A. (srpen 2006). „RAxML-VI-HPC: fylogenetické analýzy založené na maximální věrohodnosti s tisíci taxonů a smíšenými modely“. Bioinformatika. 22 (21): 2688–2690. doi:10.1093 / bioinformatika / btl446. PMID 16928733.
- ^ Boc A, Philippe H, Makarenkov V (leden 2010). „Odvození a ověření horizontálních událostí přenosu genů pomocí bipartiční odlišnosti“. Syst. Biol. 59 (2): 195–211. doi:10.1093 / sysbio / syp103. PMID 20525630.
- ^ A b Legendre P, Makarenkov V (duben 2002). „Rekonstrukce biogeografických a evolučních sítí pomocí retikulogramů“. Syst. Biol. 51 (2): 199–216. doi:10.1080/10635150252899725. PMID 12028728.
- ^ Makarenkov V, Legendre P (2004). "Od fylogenetického stromu k síťové síti". J. Comput. Biol. 11 (1): 195–212. doi:10.1089/106652704773416966. PMID 15072696.
- ^ Kuhner MK, Felsenstein J (květen 1994). „Simulační srovnání fylogenetických algoritmů za stejných a nerovných evolučních rychlostí“. Mol Biol Evol. 11 (3): 459–468. doi:10.1093 / oxfordjournals.molbev.a040126. PMID 8015439.
- ^ Guindon S, Gascuel O (duben 2002). „Efektivní zkreslený odhad evolučních vzdáleností, když se míra substituce na různých webech liší“. Mol Biol Evol. 19 (4): 534–43. doi:10.1093 / oxfordjournals.molbev.a004109. PMID 11919295.
zemřít