PHYLIP - PHYLIP
Původní autoři | Joseph Felsenstein |
---|---|
Vývojáři | University of Washington |
První vydání | Říjen 1980 |
Stabilní uvolnění | 3.697 / 2. listopadu 2014 |
Úložiště | |
Napsáno | C |
Operační systém | Okna, Mac OS X, Linux |
Plošina | x86, x86-64 |
K dispozici v | Angličtina |
Typ | Fylogenetika |
Licence | => v3.697: open-source = |
webová stránka | vývoj |
Balíček odvození PHYLogeny (PHYLIP) je zdarma výpočetní fylogenetika balíček programů pro odvození evolučních stromů (fylogeneze ).[1] Skládá se z 35 přenosný programy, tj zdrojový kód je napsán v programovacím jazyce C. Od verze 3.696 je licencován jako open-source software; verze 3.695 a starší byly proprietární software freeware. Vydání se vyskytují jako zdrojový kód a předkompilované spustitelné soubory pro mnoho operační systémy počítaje v to Okna (95, 98, ME, NT, 2000, XP, Vista), Mac OS 8, Mac OS 9, OS X, Linux (Debian, červená čepice ); a FreeBSD z FreeBSD.org.[2]Kompletní dokumentace je napsána pro všechny programy v balíčku a je v ní obsažena. Autorem balíčku je profesor Joseph Felsenstein, z Katedry genomových věd a Katedry biologie, University of Washington, Seattle.[3]
Mezi metody (implementované každým programem), které jsou k dispozici v balíčku, patří šetrnost, matice vzdálenosti, a metody pravděpodobnosti, včetně bootstrappingu a konsensuálních stromů. Mezi datové typy, které lze zpracovat, patří molekulární sekvence, genové frekvence, restrikční weby a fragmenty, matice vzdálenosti a diskrétní znaky.[2]
Každý program je ovládán pomocí nabídky, která se ptá uživatelů, jaké možnosti chtějí nastavit, a umožňuje jim zahájit výpočet. Data se do programu načítají z textového souboru, který si uživatel může připravit pomocí libovolného textového editoru nebo textového editoru (tento textový soubor však nemůže být ve speciálním formátu tohoto textového procesoru, musí být místo toho v plochý ASCII nebo pouze text formát). Některé programy pro sekvenční analýzu, například Clustal Program W alignment může zapisovat datové soubory ve formátu PHYLIP. Většina programů hledá data v souboru s názvem infile. Pokud tento soubor nenajdou, požádají uživatele, aby zadal název souboru datového souboru.[2]
Výstup se zapisuje do souborů s názvy jako outfile
a outtree
. Stromy napsané na outtree
jsou v Newick formát, neformální standard schválený v roce 1986 autory sedmi hlavních fylogenetických balíčků.
Programy komponent
Název programu | Popis |
---|---|
protpars | Odhaduje fylogeneze peptidové sekvence za použití šetrnost metoda |
dnapars | Odhaduje fylogeneze sekvencí DNA pomocí metody šetrnosti |
dnapenny | Metoda šetrnosti k DNA a vázané metody, vyhledává všechny nejšetrnější fylogeneze pro sekvence nukleových kyselin pomocí vyhledávání větví a vazeb |
dnamove | Interaktivní konstrukce fylogenezí ze sekvencí nukleových kyselin, s jejich hodnocením metodou DNA šetrnosti, s kompatibilitou a zobrazením rekonstruovaných předků |
dnacomp | Odhaduje fylogeneze z údajů o sekvenci nukleových kyselin pomocí kritéria kompatibility |
dnaml | Odhaduje fylogeneze z nukleotidových sekvencí pomocí maximální pravděpodobnost metoda |
dnamlk | Metoda maximální věrohodnosti DNA s molekulárními hodinami; společné použití dnaml a dnamlk umožňuje a test poměru pravděpodobnosti pro molekulární hodiny hypotéza |
proml | Odhaduje fylogeneze z proteinových aminokyselinových sekvencí pomocí metody maximální pravděpodobnosti |
promlk | Metoda maximální věrohodnosti proteinové sekvence s molekulárními hodinami |
restml | Odhad fylogenií podle maximální pravděpodobnosti s využitím údajů o restrikčních webech; ne z restrikčních fragmentů, ale z přítomnosti nebo nepřítomnosti jednotlivých míst |
dnainvar | Pro údaje o sekvenci nukleových kyselin u čtyř druhů spočítáme Lake a Cavender fylogenetické invarianty, které testují alternativní stromové topologie |
dnadist | Metoda vzdálenosti DNA, která počítá čtyři různé vzdálenosti mezi druhy ze sekvencí nukleových kyselin; vzdálenosti lze poté použít v programech matice vzdáleností |
protdist | Metoda vzdálenosti sekvence proteinů, která počítá vzdálenost pro sekvence, za použití odhadů maximální pravděpodobnosti na základě Dayhoff PAM matice, Kimurova aproximace z roku 1983, nebo model založený na genetickém kódu plus omezení při změně na jinou kategorii aminokyselin |
restdist | Vzdálenosti vypočítané z dat restrikčních míst nebo dat restrikčních fragmentů |
seqboot | Bootstrapping-jackknifing program; čte v soubor dat a vydává z něj několik datových sad převzorkováním bootstrapu |
tchoř | Fitch-Margoliash matice vzdálenosti metoda; odhaduje fylogeneze z dat matice vzdálenosti pod aditivní stromový model podle nichž se očekává, že se vzdálenosti budou rovnat součtu délek větví mezi druhy |
kýč | Fitch-Margoliashova metoda distanční matice s molekulárními hodinami; odhaduje fylogeneze z dat matice vzdálenosti pod ultrametrický model, který je stejný jako aditivní stromový model, kromě evolučních hodin |
soused | Implementace metod soused se připojí a UPGMA |
kontml | Maximální pravděpodobnost spojitých znaků a genových frekvencí; odhaduje fylogeneze z údajů o genové frekvenci s maximální pravděpodobností podle modelu, ve kterém jsou všechny divergence způsobeny genetickým driftem při absenci nových mutací; také provádí analýzu maximální pravděpodobnosti spojitých znaků, které se vyvíjejí pomocí Brownian Motion modelu, za předpokladu, že se postavy vyvíjejí stejnou rychlostí a nesouvisle; nezohledňuje korelace znaků |
kontrast | Čte strom ze souboru stromu a datovou sadu s daty spojitých znaků a vydává nezávislé kontrasty pro tyto znaky pro použití v jakémkoli statistickém balíčku s více proměnnými |
rodák | Program genetické vzdálenosti, který vypočítává jeden ze tří různých vzorců genetické vzdálenosti z údajů o genové frekvenci |
pars | Neuspořádaná metoda vícestupňových diskrétních znaků šetrnosti |
směs | Odhaduje fylogeneze některými metodami šetrnosti pro data diskrétních znaků se dvěma stavy (0, 1); umožňuje použití metod: Wagner, Camin-Sokal nebo libovolné směsi |
penny | Metoda větve a vázané smíšené metody, která vyhledává všechny nejšetrnější fylogeneze pro data diskrétních znaků se dvěma stavy, pro kritéria Wagnera, Camin-Sokala a smíšené šetrnosti pomocí metody větvení a vázání přesného vyhledávání |
hýbat se | Interaktivní konstrukce fylogenezí z dat diskrétních znaků se dvěma stavy (0, 1); hodnotí šetrnost a kritéria kompatibility pro tyto fylogeneze a zobrazuje rekonstruované stavy v celém stromu |
panenka | Odhaduje fylogeneze podle Dollo nebo polymorfismus kritéria šetrnosti pro data diskrétních znaků se dvěma stavy (0, 1) |
dolpenny | Najde všechny nebo nejvíce šetrné fylogeneze pro data s diskrétními znaky se dvěma stavy, pro kritéria šetrnosti Dollo nebo polymorfismu pomocí metody přesného vyhledávání s větvením a vazbou |
dolmove | Interaktivní konstrukce fylogenezí z dat diskrétních znaků se dvěma stavy (0, 1) pomocí kritérií šetrnosti Dollo nebo polymorfismu; hodnotí šetrnost a kritéria kompatibility pro tyto fylogeneze; zobrazuje rekonstruované stavy v celém stromu |
klika | Najde největší kliku vzájemně kompatibilních znaků a fylogenezi, kterou doporučují, pro data samostatných znaků se dvěma stavy (0, 1); největší klika (nebo všechny kliky v daném rozsahu velikostí největší) jsou nalezeny pomocí rychlé větve a metody vázaného hledání |
faktor | Program pro překódování znaků, který bere diskrétní vícestupňová data se stromy stavu znaků a vydává odpovídající datovou sadu se dvěma stavy (0, 1) |
drawgram | Kořenový program pro kreslení stromů, který vykresluje zakořeněné fylogeneze, kladogramy a fenogramy v široké škále formátů, které lze ovládat uživatelem. Program je interaktivní a umožňuje náhled stromu na grafické obrazovky PC nebo Macintosh a grafické terminály Tektronix nebo Digital. |
drawtree | Nezakořeněný program pro kreslení stromů podobný programu DRAWGRAM, ale vykresluje fylogeneze |
souhlasit | Program konsensuálního stromu, který počítá stromy metodou stromu většinových pravidel, který také umožňuje snadné nalezení přísného konsensuálního stromu; nelze vypočítat Adamsův konsensuální strom |
treedist | Vypočítá Robinson - Foulds vzdálenost symetrických rozdílů mezi stromy, což umožňuje rozdíly v topologii stromů |
přehodnotit | Interaktivní program přeskupení stromů, který čte ve stromu (v případě potřeby s délkou větve) a umožňuje přesměrování stromu, převrácení větví, změnu názvů druhů a délky větví a následný zápis výsledku; lze použít k převodu mezi kořenovými a nezakořeněnými stromy |
Reference
- ^ Felsenstein, J. (1981). "Evoluční stromy ze sekvencí DNA: přístup s maximální pravděpodobností". Journal of Molecular Evolution. 17 (6): 368–376. Bibcode:1981JMolE..17..368F. doi:10.1007 / BF01734359. PMID 7288891.
- ^ A b C „Stránka obecných informací PHYLIP“. Citováno 2010-02-14.
- ^ Joseph Felsenstein (Srpen 2003). Odvozovat fylogeneze. Sinauer Associates. ISBN 0-87893-177-5. Archivovány od originál dne 22.10.2011. Citováno 2006-03-24.
- ^ „Zrcadlový web dokumentace k balíčku PHYLIP“. Archivovány od originál dne 19. 10. 2005. Citováno 2006-03-24.
externí odkazy
- Oficiální webové stránky
- Seznam fylogenetických programů: Velký seznam fylogenetických balíčků s podrobnostmi o každém z nich. Aktuální počet[Aktualizace] na 366.