BAli-Phy - BAli-Phy
Vývojáři | Benjamin Redelings |
---|---|
Stabilní uvolnění | 3,5 / 2 20. března |
Napsáno | C ++ |
Operační systém | Okna, Operační Systém Mac, UNIX, Linux |
Typ | Bioinformatický nástroj |
Licence | GPLv2 |
webová stránka | bali-phy |
BAli-Phy je bezplatný softwarový program pro současný odhad a vícenásobné zarovnání sekvence a jeho fylogenetický strom. BAli-Phy dosahuje vysoké přesnosti v odhadu zarovnání pomocí informací z společně odhadnuté fylogeneze. BAli-Phy bere v úvahu nejistotu zarovnání při odhadu fylogeneze průměrováním možných zarovnání. Na rozdíl od většiny software pro odvození fylogeneze nemusí být vstupní sekvence předem zarovnány. To se liší od tradičních přístupů k odhadu zarovnání a fylogeneze, které nejprve odhadnou zarovnání bez vysoce kvalitního odhadu stromu a poté odhadnou strom vzhledem k zarovnání.
BAli-Phy vyrábí a Bayesian zadní distribuce na zarovnání i na strom. Software ukazuje nejistotu v zarovnání i ve stromu. BAli-Phy používá Markovský řetězec Monte Carlo metody odhadu. Spustit může trvat několik dní.
Nejistota zarovnání
Nejistota zarovnání vychází ze dvou hlavních zdrojů: téměř optimálního vyrovnání a nejistoty evolučních parametrů. Evoluční parametry zahrnují délky větví, míry substituce, rychlosti vkládání / mazání a samotnou fylogenezi. Pokud přesná hodnota pro tyto parametry není známa a odhad zarovnání je citlivý na parametr, nelze zarovnání s jistotou znát.
I když jsou evoluční parametry plně známy, může být mnoho různých zarovnání optimální nebo téměř optimální. V tomto případě výzkumník nemůže mít důvěru v žádné jednotlivé zarovnání, ale musí průměrovat v oblaku téměř optimálních zarovnání.
BAli-Phy dokáže zpracovat téměř nejistotu zarovnání i nejistotu evolučního parametru integrací přes možné zarovnání a hodnoty parametrů.
Vstup a výstup
BAli-Phy přijímá nukleotid, aminokyselina, a kodon sekvence v Formát FASTA. Vstupní sekvence nemusí být zarovnány. Jsou podporovány nejednoznačné nukleotidy jako R a Y, stejně jako nejednoznačné aminokyseliny B, Z a J.
Stromy jsou vydávány Newick formát. Zarovnání jsou vydávána ve formátu FASTA. Zarovnání výstupu zahrnuje informace o homologii pro sekvence na vnitřních uzlech stromu.