SnpEff - SnpEff
Obsah | |
---|---|
Popis | Nástroj, který anotuje varianty a předpovídá jejich účinky kódování. |
Kontakt | |
Autoři | Pablo Cingolani |
Datum vydání | 2012 |
Přístup | |
webová stránka | snpeff |
Smíšený | |
Licence | otevřený zdroj - LGPLv3 |
![]() | tento článek obsahuje obsah, který je napsán jako reklama.Březen 2020) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
SnpEff je open source nástroj, který anotuje varianty a předpovídá jejich účinky na geny pomocí přístupu intervalového lesa. Tento program přebírá předem určené varianty uvedené v datovém souboru, který obsahuje změnu nukleotidu a jeho polohu, a předpovídá, zda jsou varianty škodlivé. Tento program poprvé vytvořil Pablo Cingolani k předpovědi účinků jednonukleotidových polymorfismů (SNP) v Drosphila,[1] a je nyní široce používán na mnoha univerzitách, jako je Harvard University, UC Berkeley, Stanford University atd.[2] SnpEff se používá pro různé aplikace[3][4][5] - z personalizované medicíny na Stanford University,[6] k profilování bakterií.[7] Tento anotační a predikční software lze srovnávat s ANNOVAR a Variant Effect Predictor, ale každá používá jinou nomenklaturu [8][9]

Používání
SnpEff má schopnost pracovat v systémech Windows, Unix nebo Mac, i když se instalační kroky liší. U všech systémů se SnpEff nejprve stáhne jako soubor ZIP dekomprimovaný [10] a poté zkopírujte do požadovaného softwaru (Windows) nebo vyžaduje další příkazový řádek (Unix a Mac). Jakmile je software nainstalován, uživatel zadá a VCF nebo Soubor TXT do sady nástrojů, která obsahuje sloupce oddělené tabulátory: Chromozóm jméno, pozice, ID varianty, Referenční genom „Alternativa, Skóre kvality, Filtr kvality a Informace.

Sloupce s názvem a pozicí chromozomu popisují, kde se varianta nachází - číslo chromozomu a poloha nukleotidů. Pokud má varianta dříve určený název (příklad: rs34567), jde do sloupce ID. Referenční sloupec poskytuje konkrétní nukleotid v referenčním genomu - rozdíly v porovnání s referenčním jsou uvedeny v části Alternativní. Jak přesná bude varianta, bude sloupec Kvalita a její výstup z filtrů kvality je zahrnut ve sloupci filtru. Veškeré další genomové informace jsou vloženy do sloupce INFO, který je změněn tak, aby zobrazoval výstup po spuštění SnpEff.

Výstup v sekci INFO obsahuje: účinek varianty (stop loss, stop gain, atd.), Dopad účinku na gen (High, Střední, Low nebo Modifier), funkční třída varianty (nesmysl, missense, frameshift atd. .), změna kodonu, změna aminokyseliny, délka aminokyseliny, název genu, biotyp genu (kódování proteinu, pseudogen, rRNA atd.)[11]), informace o kódování, informace o přepisu, informace o exonu a jakékoli zjištěné chyby nebo varování. Dopad Effect je to, co SnpEff používá k určení, jak škodlivá je varianta genů. Například výstup VYSOKÝ dopad znamená, že SnpEff předpovídá, že varianta způsobí škodlivé genové účinky.
SnpEff se obvykle používá pro výzkumné a akademické účely v institucích a společnostech - a v některých případech v personalizované medicíně.[Citace je zapotřebí ] Pablo Cingolani však nyní doporučuje, aby byl pro lékařské účely používán ClinEff (kombinace SnpEff a SnpSift).[Citace je zapotřebí ]
Výhody a omezení
![]() | Tato sekce potřebuje další citace pro ověření.Březen 2020) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Výhody SnpEff:
- Rychlý nástroj, který dokáže analyzovat všechny varianty z projektu Genome 1000 za méně než 15 minut
- Lze integrovat do dalších nástrojů, jako jsou Galaxy, GATK a GKNO
- Lze kombinovat s jinými sadami nástrojů a zúžit tak předpovědní parametry varianty (příklad: whitelist [12])
- Uvádí, jak byla varianta klasifikována
- Čtecí rámec 5 kb upstream / downstream poskytuje důkladnější analýzu regionů upstream / downstream (1 kB v ANNOVAR by mohly chybět důležité regulační regiony)
Omezení SnpEff:
- Falešné pozitivy
- Výsledky se u jednotlivých predikčních nástrojů liší
- Neposkytuje nejlepší vysvětlení účinku - příklad: někdy místo zastavení ztráty vypíše posun snímků
- Čtecí rámec 5 kb upstream / downstream může chybně považovat nekódující oblasti za regulační body
Aktuální stav
SnpEff nebyl aktualizován od listopadu 2017.
Viz také
- ANNOVAR
- Variant Effect Predictor
- ClinEff
- dbNSFP
Reference
- ^ „Program pro anotaci a předpovídání účinků jednonukleotidových polymorfismů, SnpEff: SNP v genomu kmene Drosophila melanogaster w1118; iso-2; iso-3.“, Cingolani P, Platts A, Wang le L, Coon M, Nguyen T, Wang L, Land SJ, Lu X, Ruden DM. Fly (Austin). 2012 duben-červen; 6 (2): 80-92. PMID 22728672 [PubMed - probíhá]
- ^ „SnpEff.“ SnpEff. N.p., n.d. Web. 28. února 2017. <http://snpeff.sourceforge.net/SnpEff.html#who >.
- ^ Medina, Ignacio a kol. „VARIANT: Příkazový řádek, webová služba a webové rozhraní pro rychlou a přesnou funkční charakterizaci variant nalezených sekvenováním nové generace.“ Nucleic Acids Research 40.W1 (2012): W54-W58.
- ^ Kim, Yun Joong a kol. „Neuroimagingové studie a sekvenování celé exome neurodegenerace spojené s PLA2G6 v rodině s intrafamiliální fenotypovou heterogenitou.“ Parkinsonismus a související poruchy 21,4 (2015): 402-406.
- ^ Reddy, Mettu M. a Kandasamy Ulaganathan. „Navrhněte sekvenci genomu Oryza sativa elitní kultivar indiky RP Bio-226.“ Frontiers in plant science 6 (2015).
- ^ Dewey, Frederick E. a kol. „Distribuce a klinický dopad funkčních variant v 50 726 sekvencích celého exomu ze studie DiscovEHR.“ Science 354,6319 (2016): aaf6814.
- ^ Medvedeva, E. S. a kol. „Genomické a proteomické profily kmenů Acholeplasma laidlawii lišící se citlivostí na ciprofloxacin.“ Doklady Biochemistry and Biofhysics. Sv. 466. Č. 1. Plejády Publishing, 2016.
- ^ Wang K, Li M, Hakonarson H. ANNOVAR: Funkční anotace genetických variant ze sekvenčních dat nové generace Nucleic Acids Research, 38: e164, 2010
- ^ „Variant Effect Predictor.“ Variant Effect Predictor. EMBL-EBI, prosinec 2016. Web. 28. února 2017. <http://uswest.ensembl.org/info/docs/tools/vep/index.html >.
- ^ „SnpEff.“ SnpEff. N.p., n.d. Web. 28. února 2017. <http://snpeff.sourceforge.net/SnpEff_manual.html >.
- ^ „Nápověda - Často kladené otázky - Homo sapiens - Prohlížeč genomu souboru 87.“ Nápověda - Často kladené otázky - Homo sapiens - Prohlížeč genomu souboru 87. N.p., n.d. Web. 28. února 2017.
- ^ Dewey, Frederick E. a kol. „Distribuce a klinický dopad funkčních variant v 50 726 sekvencích celého exomu ze studie DiscovEHR.“ Science 354,6319 (2016): aaf6814.