Matice podobnosti proteinů - Similarity Matrix of Proteins
Matice podobnosti proteinů (SIMAP) je databáze z protein podobnosti vytvořené pomocí distribuované výpočty.[1][2] Je volně přístupný pro vědecké účely. SIMAP používá FASTA algoritmus k předpočtu podobnosti proteinů, zatímco používá jiná aplikace skryté Markovovy modely něco hledat proteinové domény. SIMAP je společný projekt Technická univerzita v Mnichově, Helmholtz Zentrum München a Vídeňská univerzita.
Projekt
Projekt obvykle dostal nové pracovní jednotky na začátku každého měsíce. V poslední době (2010) vyžaduje zařazení sekvencí prostředí do databáze delší dobu činnosti, například několik měsíců nepřetržité práce. Tyto aktualizace se obvykle vyskytovaly dvakrát ročně.[Citace je zapotřebí ]
Ve čtvrtém čtvrtletí roku 2010 se projekt přestěhoval do Vídeňská univerzita kvůli selhávající elektrické infrastruktuře na Technické univerzitě v Mnichově. Součástí tohoto cvičení bylo vytvoření konkrétního projektu URL vyžadující, aby se stávající dobrovolníci a uživatelé odpojili / znovu připojili k projektu.
Dne 30. května 2014 oznámili správci projektů, že po 10leté historii SIMAP odejde BOINC do konce roku 2014. Výzkum SIMAP však půjde kupředu s využitím místního hardwaru skládajícího se z „běžných vícejádrových procesorů (několik stovek), které prolomí SSE-optimalizovanou verzi Smith-Watermanův algoritmus."
Výpočetní platforma
SIMAP použil Berkeley Open Infrastructure for Network Computing (BOINC) distribuované výpočty plošina.
Poznámky k výkonu aplikace. Časy CPU pracovní jednotky se značně lišily a pohybovaly se mezi 15 minutami a 3 hodinami. Velikost pracovních jednotek se pohybovala od 1,5 do 2,2 MB každý, v průměru kolem 2 MB. Klientský software poskytovaný SIMAP optimalizovaný pro SSE povolené procesory a x86-64 procesory. Pro starší procesory nejsou k dispozici aplikace SSE, ale vyžadují ruční instalační kroky. Operační systémy podporované SIMAP jsou Linux, Okna, Operační Systém Mac, Android a další platformy UNIX. Protože databáze byla někdy doplněna všemi veřejně známými proteinové sekvence a metagenomy po předběžném výpočtu projektu se dostupné práce skládaly z nově publikovaných proteinových sekvencí a metagenomů, které bylo nutné předpočítat pro SIMAP.
Viz také
Reference
- ^ Arnold, R .; Rattei, T .; Tischler, P .; Truong, M.-D .; Stümpflen, V .; Mewes, H. W. (2005). „SIMAP - Matice podobnosti proteinů“. Bioinformatika. 21 (Suppl 2): ii42 – ii46. doi:10.1093 / bioinformatika / bti1107. ISSN 1367-4803. PMID 16204123.
- ^ Rattei, T .; Arnold, R .; Tischler, P .; Lindner, D .; Stümpflen, V .; Mewes, H. W. (2006). „SIMAP: matice podobnosti proteinů“. Výzkum nukleových kyselin. 34 (90001): D252 – D256. doi:10.1093 / nar / gkj106. ISSN 0305-1048. PMC 1347468. PMID 16381858.
externí odkazy
Tento vědecký software článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |