Anotace SNP - SNP annotation
Klasifikace | Bioinformatika |
---|---|
Subklasifikace | Jednonukleotidový polymorfismus |
Typ použitých nástrojů | Funkční anotační nástroje |
Další související předměty | Projekt genomu, Genomika |
Anotace polymorfismu s jedním nukleotidem (SNP anotace) je proces predikce účinku nebo funkce jednotlivých SNP pomocí anotačních nástrojů SNP. V SNP anotace biologický informace je extrahován, shromažďován a zobrazen v přehledné formě vhodné pro dotazování. Funkční anotace SNP se obvykle provádí na základě dostupných informací o nukleová kyselina a proteinové sekvence.[1]
Úvod
Jednonukleotidové polymorfismy (SNP) hrají důležitou roli v genomová asociace studie, protože fungují jako primární biomarkery. SNP jsou v současné době markerem volby díky svému velkému počtu prakticky ve všech populace jednotlivců. Umístění těchto biomarkerů může být nesmírně důležité z hlediska předpovědi funkčního významu, genetické mapování a populační genetika.[3] Každý SNP představuje změnu nukleotidů mezi dvěma jedinci na definovaném místě. SNP jsou nejčastější genetickou variantou, která se vyskytuje u všech jedinců, s jedním SNP každých 100–300 bp v některých druh.[4] Protože na internetu je obrovské množství SNP genom existuje jasná potřeba upřednostnit SNP podle jejich potenciálního účinku, aby se urychlila genotypizace a analýza.[5]
Anotace velkého počtu SNP je obtížný a složitý proces, který ke zpracování takové velké datové sady vyžaduje výpočetní metody. Pro anotaci SNP u různých organismů bylo vyvinuto mnoho dostupných nástrojů: některé z nich jsou optimalizovány pro použití s organismy hustě vzorkovány pro SNP (např lidé ), ale v současné době je k dispozici několik nástrojů, které jsou druhově nespecifické nebo podporují údaje o nemodelovém organismu. Většina nástrojů pro anotaci SNP poskytuje výpočetně predikované předpokládané škodlivé účinky SNP. Tyto nástroje zkoumají, zda SNP sídlí ve funkčních genomických oblastech, jako jsou exony, místa sestřihu nebo místa regulace transkripce, a předpovídají potenciální odpovídající funkční účinky, které může mít SNP pomocí různých přístupů strojového učení. Nástroje a systémy, které upřednostňují funkčně významné SNP, však trpí několika omezeními: Nejprve zkoumají domnělé škodlivé účinky SNP s ohledem na jedinou biologickou funkci, která poskytuje pouze částečné informace o funkčním významu SNP. Za druhé, současné systémy klasifikují SNP do škodlivé nebo neutrální skupiny.[6]
Mnoho anotačních algoritmů se zaměřuje na varianty jednotlivých nukleotidů (SNV), považované za vzácnější než SNP, jak je definováno jejich frekvencí vedlejších alel (MAF).[7][8] V důsledku toho se mohou tréninková data pro odpovídající metody predikce lišit, a proto je třeba při výběru vhodného nástroje pro konkrétní účel postupovat opatrně. Pro účely tohoto článku bude „SNP“ použito jak pro SNP, tak pro SNV, ale čtenáři by měli mít na paměti rozdíly.
Anotace SNP
Pro anotaci SNP se používá mnoho druhů genetických a genomových informací. Na základě různých funkcí používaných jednotlivými anotačními nástroji lze metody anotací SNP rozdělit zhruba do následujících kategorií:
Genová anotace
Genomické informace z okolních genomových prvků patří mezi nejužitečnější informace pro interpretaci biologické funkce pozorované varianty. Informace od známého gen se používá jako reference k označení, zda pozorovaná varianta spočívá v genu nebo v jeho blízkosti a zda má potenciál narušit proteinová sekvence a jeho funkce. Genová anotace je založena na skutečnosti, že nesynonymní mutace může změnit proteinovou sekvenci a tak mutace místa sestřihu může narušit vzor sestřihu transkriptu.[9]
Znalostní anotace
Anotace znalostní báze se provádí na základě informací o atributu genu, funkci proteinu a jejích metabolismus. U tohoto typu anotace je kladen větší důraz genetická variace který narušuje funkční doménu bílkovin, interakce protein-protein a biologická cesta. Nekódující oblast genomu obsahuje mnoho důležitých regulačních prvků včetně promotér, zesilovač a izolátor, jakákoli změna v tomto regulační oblast může změnit funkčnost tohoto proteinu.[10] Mutace v DNA může změnit Sekvence RNA a poté ovlivnit Sekundární struktura RNA, Rozpoznávání RNA vázajícího proteinu a miRNA vazebná aktivita.[11][12]
Funkční anotace
Tato metoda identifikuje hlavně variantní funkci na základě informace, zda jsou varianty lokusů ve známé funkční oblasti, která obsahuje genomické nebo epigenomické signály. Funkce nekódujících variant jsou rozsáhlé, pokud jde o postiženou genomovou oblast, a zahrnují téměř všechny procesy genové regulace od transkripční po posttranslační úroveň [13]
Regulace transkripčního genu
Proces regulace transkripčního genu závisí na mnoha prostorových a časových faktorech v jádře, jako jsou globální nebo lokální stavy chromatinu, umístění nukleosomů, vazba TF, aktivity zesilovače / promotoru. Varianty, které mění funkci kteréhokoli z těchto biologických procesů, mohou změnit regulaci genů a způsobit fenotypovou abnormalitu.[14] Genetické varianty, které se nacházejí v distální regulační oblasti, mohou ovlivnit vazebný motiv TF, regulátorů chromatinu a dalších distálních transkripčních faktorů, které narušují interakci mezi zesilovačem / tlumičem a jeho cílovým genem.[15]
Alternativní sestřih
Alternativní sestřih je jednou z nejdůležitějších složek, které ukazují funkční složitost genomu. Modifikované sestřih má významný účinek na fenotyp, který je relevantní pro onemocnění nebo metabolismus léků. Změna spojování může být způsobena úpravou jakékoli součásti spojovacího zařízení, jako jsou místa spojování nebo zesilovače spojů nebo tlumiče.[16] Modifikace v alternativním sestřihovacím místě může vést k odlišné formě proteinu, která bude vykazovat jinou funkci. Lidé používají odhadem 100 000 různých proteinů nebo více, takže některé geny musí být schopné kódovat mnohem více než jen jeden protein. Alternativní sestřih se vyskytuje častěji, než se dříve myslelo, a může být obtížné jej ovládat; geny mohou produkovat desítky tisíc různých transkriptů, což vyžaduje nový genový model pro každou alternativní sestřih.
Zpracování RNA a post transkripční regulace
Mutace v nepřekládané oblasti (UTR) ovlivňují mnoho post-transkripční regulace. K provádění účinných funkcí během genové regulace jsou u mnoha molekul RNA a cis působících regulačních prvků vyžadovány charakteristické strukturní rysy. SNV mohou změnit sekundární strukturu molekul RNA a poté narušit správné skládání RNA, jako je skládání tRNA / mRNA / lncRNA a oblasti rozpoznávání vazby miRNA.[17]
Překlad a úpravy po překladu
Varianta s jedním nukleotidem může také ovlivnit cis působící regulační prvky v mRNA a inhibovat / podporovat iniciaci translace. Změna v oblasti synonymních kodonů v důsledku mutace může ovlivnit účinnost translace z důvodu zkreslení použití kodonů. Prodloužení translace lze také zpomalit mutacemi podél rampy ribozomálního pohybu. Na posttranslační úrovni mohou genetické varianty přispívat k proteostáze a modifikacím aminokyselin. Mechanismy efektu varianty v této oblasti jsou však komplikované a k dispozici je jen několik nástrojů k předpovědi účinku varianty na úpravy související s překladem.[18]
Funkce bílkovin
Nesynonymní je varianta v exonech, které mění aminokyselinovou sekvenci kódovanou genem, včetně změn jedné báze a indelů bez posunu rámců. Byla extrémně zkoumána funkce nesynonymních variant na proteinu a bylo vyvinuto mnoho algoritmů k předpovědi škodlivosti a patogeneze variant jednotlivých nukleotidů (SNV). Klasické bioinformatické nástroje, jako jsou SIFT, Polyphen a MutationTaster, úspěšně předvídat funkční důsledek nesynonymní substituce.[19][20][21][22] Webový server PopViz poskytuje přístup zaměřený na geny k vizualizaci skóre predikce poškození mutací (CADD, SIFT, PolyPhen-2) nebo populační genetiky (frekvence menších alel) versus polohy aminokyselin všech kódujících variant určitého lidského genu.[23] PopViz je také propojen s databází UniProt, kde lze najít informace o proteinové doméně, a poté identifikovat předpokládané škodlivé varianty spadající do těchto proteinových domén na grafu PopViz.[23]
Evoluční ochrana a výběr přírody
K predikci funkčně relevantních variant byly použity komparativní genomické přístupy za předpokladu, že funkční genetický lokus by měl být konzervován u různých druhů na velkou fylogenetickou vzdálenost. Na druhou stranu, některé adaptivní vlastnosti a populační rozdíly jsou poháněny pozitivním výběrem výhodných variant a tyto genetické mutace jsou funkčně relevantní pro populačně specifické fenotypy. Funkční predikce účinku variant v různých biologických procesech je stěžejní pro určení molekulárního mechanismu nemocí / znaků a řízení experimentální validace.[24]
Seznam dostupných nástrojů pro anotaci SNP
K anotaci obrovského množství dostupných dat NGS je v současné době k dispozici velké množství nástrojů pro anotace SNP. Některé z nich jsou specifické pro konkrétní SNP, zatímco jiné jsou obecnější. Některé z dostupných anotačních nástrojů SNP jsou SNPeff, Ensembl Variant Effect Predictor (VEP), ANNOVAR, FATHMM, PhD-SNP, PolyPhen-2, SuSPect, F-SNP, AnnTools, SeattleSeq, SNPit, SCAN, Snap, SNPs & GO, LS-SNP, Snat, TREAT, TRAMS, Maviant, MutationTaster, SNPdat, Snpranker, NGS - SNP, SVA, VARIANT, SIFT, LIST-S2, PhD-SNP a FAST-SNP. Níže jsou uvedeny funkce a přístupy používané v anotačních nástrojích SNP.
Nástroje | Popis | Využití externích zdrojů | URL stránky | Reference |
---|---|---|---|---|
PhyreRisk | Mapuje genetické varianty na experimentální a předpokládané proteinové struktury | Prediktor variačního efektu, UniProt, Proteinová datová banka, TŘÍDY, Phyre2 pro předpokládané struktury | http://phyrerisk.bc.ic.ac.uk/home | |
Missense3D | Hlásí strukturální dopad varianty missense na PDB a uživatelem dodané proteinové souřadnice. Vyvinuto tak, aby bylo použitelné pro experimentální a předpokládané proteinové struktury | Proteinová datová banka, Phyre2 pro předpokládané struktury | http://www.sbg.bio.ic.ac.uk/~missense3d/ | |
SNPeff | SnpEff anotuje varianty na základě jejich genomických poloh a předpovídá účinky kódování. Používá intervalový lesní přístup | ENSEMBL, UCSC a organismus založený např. FlyBase, WormBase a TAIR | http://snpeff.sourceforge.net/SnpEff_manual.html | [27] |
Soubor VEP | Určuje účinky variant (SNP, inzerce, delece, CNV nebo strukturní varianty) na geny, transkripty, proteiny a regulační oblasti | dbSNP, RefSeq, UniProt, COSMIC, PDBe, 1000 genů, gnomAD, PubMed | https://www.ensembl.org/info/docs/tools/vep/index.html | [28] |
ANNOVAR | Tento nástroj je vhodný k určení malé podmnožiny funkčně důležitých variant. Pro anotaci používá přístup k predikci mutací | UCSC, RefSeq a Ensembl | http://annovar.openbioinformatics.org/ | [29] |
Jannovar | Toto je nástroj a knihovna pro anotaci genomu | RefSeq, Ensembl, UCSC atd. | https://github.com/charite/jannovar | [30] |
PhD-SNP | Metoda založená na SVM využívající informace o sekvenci získávané algoritmem BLAST. | UniRef90 | http://snps.biofold.org/phd-snp/ | [31] |
PolyPhen-2 | Vhodné pro predikci škodlivých účinků mutací missense. Používá zachování sekvence, strukturu k modelové poloze substituce aminokyselin a anotaci SWISS-PROT | UniProt | http://genetics.bwh.harvard.edu/pph2/ | [32] |
MutationTaster | Vhodné pro predikci škodlivých účinků všech intragenních mutací (hladina DNA a proteinů), včetně InDels. | Ensembl, 1000 Genomes Project, ExAC, UniProt, ClinVar, phyloP, phastCons, nnsplice, polyadq (...) | http://www.mutationtaster.org/ | [33] |
Tušit | Prediktor škodlivých účinků mutací missense vyškolených SVM. Využívá informace o zachování sekvence, struktuře a síti (interaktomu) k modelování fenotypového účinku substituce aminokyselin. Přijímá soubor VCF | UniProt, PDB, Phyre2 pro předpokládané struktury, DOMINE a STRING pro interaktomy | http://www.sbg.bio.ic.ac.uk/suspect/index.html | [34] |
F-SNP | Výpočtově předpovídá funkční SNP pro asociační studie onemocnění. | PolyPhen, SIFT, SNPeffect, SNPs3D, LS-SNP, ESEfinder, RescueESE, ESRSearch, PESX, Ensembl, TFSearch, Consite, GoldenPath, Ensembl, KinasePhos, OGPET, Sulfinator, GoldenPath | http://compbio.cs.queensu.ca/F-SNP/ | [35] |
AnnTools | Návrh k identifikaci nových a SNP / SNV, INDEL a SV / CNV. AnnTools hledá překryvy s regulačními prvky, lokusy spojené s chorobami / vlastnostmi, známými segmentovými duplikacemi a oblastmi náchylnými k artefaktům | dbSNP, UCSC, GATK refGene, GAD, publikované seznamy běžných strukturních genomových variací, databáze genomových variant, seznamy konzervovaných TFB, miRNA | http://anntools.sourceforge.net/ | [36] |
SNPit | Analyzuje potenciální funkční význam SNP odvozených z asociačních studií zaměřených na celý genom | dbSNP, EntrezGene, UCSC Browser, HGMD, ECR Browser, Haplotter, SIFT | -/- | [37] |
SKENOVAT | Používá fyzickou a funkční anotaci ke kategorizaci podle jejich polohy vzhledem k genům a podle vzorců vazebné nerovnováhy (LD) a účinků na úrovně exprese | -/- | http://www.scandb.org/newinterface/about.html | [38] |
SNAP | Metoda založená na neuronové síti pro predikci funkčních účinků nesynonymních SNP | Ensembl, UCSC, Uniprot, UniProt, Pfam, DAS-CBS, MINT, BIND, KEGG, TreeFam | http://www.rostlab.org/services/SNAP | [39] |
SNP a GO | Metoda založená na SVM využívající informace o sekvenci, anotaci genové ontologie a je-li k dispozici proteinová struktura. | UniRef90, GO, PANTHER, PDB | http://snps.biofold.org/snps-and-go/ | [40] |
LS-SNP | Mapuje nsSNP na proteinové sekvence, funkční dráhy a srovnávací modely proteinové struktury | UniProtKB, prohlížeč genomu, dbSNP, PD | http://www.salilab.org/LS-SNP | [41] |
ZACHÁZET | TREAT je nástroj pro snadnou navigaci a těžbu variant jak z cíleného resekvenování, tak ze sekvenování celého exomu | -/- | http://ndc.mayo.edu/mayo/research/biostat/stand-alone-packages.cfm | [42] |
SNPdat | Vhodné pro druhy nespecifické nebo podporující údaje o nemodelovém organismu. SNPdat nevyžaduje vytváření žádných místních relačních databází ani předběžné zpracování jakýchkoli povinných vstupních souborů | -/- | https://code.google.com/p/snpdat/downloads/ | [43] |
NGS - SNP | Anotujte SNP porovnávající referenční aminokyselinu a nereferenční aminokyselinu s každým ortologem | Ensembl, NCBI a UniProt | http://stothard.afns.ualberta.ca/downloads/NGS-SNP/ | [44] |
SVA | Předpokládaná biologická funkce pro identifikované varianty | NCBI RefSeq, Ensembl, databáze variací, UCSC, HGNC, GO, KEGG, HapMap, 1000 Genomes Project a DG | http://www.svaproject.org/ | [45] |
VARIANTA | VARIANT zvyšuje rozsah informací mimo kódující oblasti tím, že zahrnuje všechny dostupné informace o regulaci, struktuře DNA, konzervaci, evolučních tlacích atd. Regulační varianty představují uznávanou, ale stále neprozkoumanou příčinu patologií | dbSNP, 1 000 genomů, varianty spojené s onemocněním od GWAS, OMIM, COSMIC | http://variant.bioinfo.cipf.es/ | [46] |
PROSÍT | SIFT je program, který předpovídá, zda substituce aminokyselin ovlivňuje funkci bílkovin. SIFT používá sekvenční homologii k předpovědi, zda substituce aminokyselin ovlivní funkci proteinu | PROT / TrEMBL nebo NCBI | http://blocks.fhcrc.org/sift/SIFT.html | [47] |
LIST-S2 | LIST-S2 (Local Identity and Shared Taxa, Species-specific) je založen na předpokladu, že odchylky pozorované u blízce příbuzných druhů jsou významnější při hodnocení ochrany ve srovnání s odchylkami u vzdáleně příbuzných druhů | UniProt SwissProt / TrEMBL a NCBI taxonomie | https://gsponerlab.msl.ubc.ca/software/list/ | [48][49] |
RYCHLE-SNP | Webový server, který umožňuje uživatelům efektivně identifikovat a upřednostňovat vysoce rizikové SNP podle jejich fenotypových rizik a domnělých funkčních efektů | NCBI dbSNP, Ensembl, TFSearch, PolyPhen, ESEfinder, RescueESE, FAS-ESS, SwissProt, UCSC Golden Path, NCBI Blast a HapMap | http://fastsnp.ibms.sinica.edu.tw/ | [50] |
PANTER | PANTHER souvisí s vývojem proteinové sekvence s vývojem specifických proteinových funkcí a biologických rolí. Zdroj proteinových sekvencí použitý k sestavení stromů proteinových rodin a k lepšímu definování shluků proteinových rodin byl použit krok manuální kurace pomocí počítače. | STKE, KEGG, MetaCyc, FREX a Reactome | http://www.pantherdb.org/ | [51] |
Meta-SNP | Meta prediktor založený na SVM včetně 4 různých metod. | PhD-SNP, PANTHER, SIFT, SNAP | http://snps.biofold.org/meta-snp | [52] |
PopViz | Integrativní a interaktivní vizualizace populační genetiky a skóre predikce poškození mutací lidských genových variant zaměřená na gen | gnomAD, Ensembl, UniProt, OMIM, UCSC, CADD, EIGEN, LINSIGHT, SIFT, PolyPhen-2, | http://shiva.rockefeller.edu/PopViz/ | [23] |
Algoritmy používané v anotačních nástrojích
Nástroje anotací variant využívají algoritmy strojového učení k předpovídání anotací variant. Různé anotační nástroje používají různé algoritmy. Mezi běžné algoritmy patří:
- Interval / náhodný les - např. MutPred, SNPeff
- Neuronové sítě -Např. SNAP
- Podporujte vektorové stroje -např. PhD-SNP, SNP a GO
- Bayesovská klasifikace - např. PolyPhen-2
Porovnání variantních anotačních nástrojů
Pro variantní anotace je k dispozici velké množství nástrojů anotace variant. Anotace různými nástroji se vždy navzájem neshodují, protože definovaná pravidla pro zpracování dat se mezi aplikacemi liší. Je upřímně nemožné provést dokonalé srovnání dostupných nástrojů. Ne všechny nástroje mají stejný vstup a výstup ani stejnou funkčnost. Níže je tabulka hlavních anotačních nástrojů a jejich funkční oblasti.
Nástroje | Vložte soubor | Výstupní soubor | SNP | INDEL | CNV | WEB nebo Program | Zdroj | |
---|---|---|---|---|---|---|---|---|
AnnoVar | VCF, pileup, CompleteGenomics, GFF3-SOLiD, SOAPsnp, MAQ, CASAVA | TXT | Ano | Ano | Ano | Program | [53] | |
Jannovar | VCF | VCF | Ano | Ano | Ano | Program Java | [54] | |
SNPeff | VCF, pileup / TXT | VCF, TXT, HTML | Ano | Ano | Ne | Program | [55] | |
Soubor VEP | Ensembl default (souřadnice), VCF, identifikátory variant, HGVS, SPDI, regiony ve stylu REST | VCF, VEP, TXT, JSON | Ano | Ano | Ano | Web, skript Perl, REST API | [56] | |
AnnTools | VCF, pileup, TXT | VCF | Ano | Ano | Ne | Ne | [57] | |
SeattleSeq | VVCF, MAQ, CASAVA, GATK BED | VCF, SeattleSeq | Ano | Ano | Ne | Web | [58] | |
VARIANTA | VCF, GFF2, BED | webový report, TXT | Ano | Ano | Ano | Web | [59] |
aplikace
Různé anotace zachycují různé aspekty variantní funkce.[61] Mohlo by se zlepšit současné použití více různých funkčních anotací vzácné varianty síla asociační analýzy celý exome a sekvenování celého genomu studie.[62]
Závěry
Nová generace webových serverů s anotací SNP může využít výhody rostoucího množství dat v základních zdrojích bioinformatiky a použít inteligentní agenty k načtení dat z různých zdrojů podle potřeby. Z pohledu uživatele je efektivnější odeslat sadu SNP a přijímat výsledky v jednom kroku, což z meta serverů dělá nejatraktivnější volbu. Pokud však anotační nástroje SNP poskytují heterogenní data pokrývající sekvenci, strukturu, regulaci, cesty atd., Musí také poskytovat rámce pro integraci dat do rozhodovacích algoritmů a kvantitativní opatření spolehlivosti, aby uživatelé mohli posoudit, která data jsou relevantní a které nejsou.
Reference
- ^ Aubourg S, Rouzé P (2001). "Anotace genomu". Plant Physiol. Biochem. 29 (3–4): 181–193. doi:10.1016 / S0981-9428 (01) 01242-6.
- ^ Karchin R (leden 2009). „Nástroje nové generace pro anotaci lidských SNP“. Briefings in Bioinformatics. 10 (1): 35–52. doi:10.1093 / bib / bbn047. PMC 2638621. PMID 19181721.
- ^ Shen TH, Carlson CS, Tarczy-Hornoch P (srpen 2009). „SNPit: federovaný systém integrace dat pro účely funkční anotace SNP“. Počítačové metody a programy v biomedicíně. 95 (2): 181–9. doi:10.1016 / j.cmpb.2009.02.010. PMC 2680224. PMID 19327864.
- ^ N. C. Oraguzie, E.H.A. Rikkerink, S.E. Gardiner, H.N. de Silva (eds.), "Association Mapping in Plants", Springer, 2007
- ^ Capriotti E, Nehrt NL, Kann MG, Bromberg Y (červenec 2012). „Bioinformatika pro interpretaci osobního genomu“. Briefings in Bioinformatics. 13 (4): 495–512. doi:10.1093 / bib / bbr070. PMC 3404395. PMID 22247263.
- ^ P. H. Lee, H. Shatkay, „Hodnocení polymorfismů jednotlivých nukleotidů podle potenciálních škodlivých účinků“, Výpočetní biologie and Machine Learning Lab, School of Computing, Queen’s University, Kingston, ON, Canada
- ^ „Jednonukleotidový polymorfismus“, Wikipedia, 2019-08-12, vyvoláno 2019-09-03
- ^ "Menší frekvence alely", Wikipedia, 2019-08-12, vyvoláno 2019-09-03
- ^ M. J. Li, J. Wang, „Aktuální trend anotace variací jednotlivých nukleotidů u lidí - případová studie o SNVrap“, Elsevier, 2014, s. 1–9
- ^ Wang Z, Gerstein M, Snyder M (leden 2009). „RNA-Seq: revoluční nástroj pro transkriptomiku“. Genetika hodnocení přírody. 10 (1): 57–63. doi:10.1038 / nrg2484. PMC 2949280. PMID 19015660.
- ^ Halvorsen M, Martin JS, Broadaway S, Laederach A (srpen 2010). „Mutace spojené s onemocněním, které mění strukturní celek RNA“. Genetika PLOS. 6 (8): e1001074. doi:10.1371 / journal.pgen.1001074. PMC 2924325. PMID 20808897.
- ^ Wan Y, Qu K, Zhang QC, Flynn RA, Manor O, Ouyang Z, Zhang J, Spitale RC, Snyder MP, Segal E, Chang HY (leden 2014). "Krajina a variace sekundární struktury RNA napříč lidským transkriptomem". Příroda. 505 (7485): 706–9. Bibcode:2014 Natur.505..706W. doi:10.1038 / příroda12946. PMC 3973747. PMID 24476892.
- ^ Sauna ZE, Kimchi-Sarfaty C (srpen 2011). "Pochopení příspěvku synonymních mutací k lidské nemoci". Genetika hodnocení přírody. 12 (10): 683–91. doi:10.1038 / nrg3051. PMID 21878961. S2CID 8358824.
- ^ Li MJ, Yan B, Sham PC, Wang J (květen 2015). „Zkoumání funkce genetických variant v nekódujících genomových oblastech: přístupy k identifikaci lidských regulačních variant ovlivňujících genovou expresi“. Briefings in Bioinformatics. 16 (3): 393–412. doi:10.1093 / bib / bbu018. PMID 24916300.
- ^ French JD, Ghoussaini M, Edwards SL, Meyer KB, Michailidou K, Ahmed S, et al. (Duben 2013). „Funkční varianty v rizikovém ložisku 11q13 pro rakovinu prsu regulují expresi cyklinu D1 prostřednictvím zesilovačů dlouhého dosahu“. American Journal of Human Genetics. 92 (4): 489–503. doi:10.1016 / j.ajhg.2013.01.002. PMC 3617380. PMID 23540573.
- ^ Faber K, Glatting KH, Mueller PJ, Risch A, Hotz-Wagenblatt A (2011). „Predikce celoplošného predikce SNP modifikujících sestřih v lidských genech pomocí nového analytického kanálu zvaného AASsites“. BMC bioinformatika. 12 Suppl 4 (Suppl 4): S2. doi:10.1186 / 1471-2105-12-s4-s2. PMC 3194194. PMID 21992029.
- ^ Kumar V, Westra HJ, Karjalainen J, Zhernakova DV, Esko T, Hrdlickova B, Almeida R, Zhernakova A, Reinmaa E, Võsa U, Hofker MH, Fehrmann RS, Fu J, Withoff S, Metspalu A, Franke L, Wijmenga C (2013). „Genetická variace spojená s lidským onemocněním má dopad na velkou intergenní nekódující expresi RNA“. Genetika PLOS. 9 (1): e1003201. doi:10.1371 / journal.pgen.1003201. PMC 3547830. PMID 23341781.
- ^ M. J. Li, J. Wang, „Aktuální trend anotace variací jednotlivých nukleotidů u lidí - případová studie o SNVrap“, Elsevier, 2014, s. 1–9
- ^ J. Wu, R. Jiang, „Predikce škodlivého nesynonymního jedno-nukleotidového polymorfismu pro lidské nemoci“, The Scientific World Journal, 2013, 10 stran
- ^ Sim NL, Kumar P, Hu J, Henikoff S, Schneider G, Ng PC (červenec 2012). „Webový server SIFT: předpovídání účinků substitucí aminokyselin na proteiny“. Výzkum nukleových kyselin. 40 (Problém s webovým serverem): W452–7. doi:10.1093 / nar / gks539. PMC 3394338. PMID 22689647.
- ^ Adzhubei IA, Schmidt S, Peshkin L, Ramensky VE, Gerasimova A, Bork P, Kondrashov AS, Sunyaev SR (duben 2010). „Metoda a server pro předpovídání škodlivých mutací missense“. Přírodní metody. 7 (4): 248–9. doi:10.1038 / nmeth0410-248. PMC 2855889. PMID 20354512.
- ^ Schwarz JM, Rödelsperger C, Schuelke M, Seelow D (srpen 2010). „MutationTaster vyhodnocuje potenciál změn sekvence způsobujících onemocnění“. Přírodní metody. 7 (8): 575–6. doi:10.1038 / nmeth0810-575. PMID 20676075. S2CID 26892938.
- ^ A b C Zhang P, Bigio B, Rapaport F, Zhang S, Casanova J, Abel L, Boisson B, Itan Y, Stegle O (2018). „PopViz: webový server pro vizualizaci menších frekvencí alel a skóre predikce poškození lidských genetických variací“. Bioinformatika. 34 (24): 4307–4309. doi:10.1093 / bioinformatika / bty536. PMC 6289133. PMID 30535305.
- ^ M. J. Li, J. Wang, „Aktuální trend anotace variací jednotlivých nukleotidů u lidí - případová studie o SNVrap“, Elsevier, 2014, s. 1–9
- ^ Ofoegbu TC, David A, Kelley LA, Mezulis S, Islam SA, Mersmann SF, Stromich L, Vakser IA, Houlston RS, Sternberg MJ (2019). „PhyreRisk: Dynamická webová aplikace k překlenutí genomiky, proteomiky a 3D strukturálních dat, která bude sloužit jako vodítko při interpretaci lidských genetických variant“. J Mol Biol. 431 (13): 2460–2466. doi:10.1016 / j.jmb.2019.04.043. PMC 6597944. PMID 31075275.
- ^ Ittisoponpisan S, Islam SA, Khanna T, Alhuzimi E, David A, Sternberg MJ (2019). „Mohou předpokládané 3D struktury proteinů poskytnout spolehlivé poznatky o tom, zda jsou varianty Missense spojeny s nemocí?“. J Mol Biol. 431 (11): 2197–2212. doi:10.1016 / j.jmb.2019.04.009. PMC 6544567. PMID 30995449.
- ^ Cingolani P, Platts A, Wang L, Coon M, Nguyen T, Wang L, Land SJ, Lu X, Ruden DM (2012). „Program pro anotování a předpovídání účinků jednonukleotidových polymorfismů, SnpEff: SNP v genomu kmene Drosophila melanogaster w1118; iso-2; iso-3“. Létat. 6 (2): 80–92. doi:10,4161 / létat.19695. PMC 3679285. PMID 22728672.
- ^ McLaren W, Gil L, Hunt SE, Riat HS, Ritchie GR, Thormann A, Flicek P, Cunningham F (červen 2016). „Ensemble Variant Effect Predictor“. Genome Biology. 17 (1): 122. doi:10.1186 / s13059-016-0974-4. PMC 4893825. PMID 27268795.
- ^ Wang K, Li M, Hakonarson H (září 2010). „ANNOVAR: funkční anotace genetických variant z vysoce výkonných sekvenčních dat“. Výzkum nukleových kyselin. 38 (16): e164. doi:10.1093 / nar / gkq603. PMC 2938201. PMID 20601685.
- ^ Jäger M, Wang K, Bauer S, Smedley D, Krawitz P, Robinson PN (květen 2014). "Jannovar: java knihovna pro anotaci exome". Lidská mutace. 35 (5): 548–55. doi:10,1002 / humu.22531. PMID 24677618.
- ^ Capriotti E, Calabrese R, Casadio R (listopad 2006). „Predikce vzpoury lidských genetických chorob souvisejících s jednobodovými mutacemi proteinů s podporou vektorových strojů a evolučních informací“ (PDF). Bioinformatika. 22 (22): 2729–34. doi:10.1093 / bioinformatika / btl423. PMID 16895930.
- ^ Adzhubei I, Jordan DM, Sunyaev SR (leden 2013). „Predikce funkčního účinku lidských mutací missense pomocí PolyPhen-2“. Současné protokoly v lidské genetice. Kapitola 7: 7.20.1–7.20.41. doi:10.1002 / 0471142905.hg0720s76. PMC 4480630. PMID 23315928.
- ^ Schwarz JM, Rödelsperger C, Schuelke M, Seelow D (srpen 2010). „MutationTaster vyhodnocuje potenciál změn sekvence způsobujících onemocnění“. Přírodní metody. 7 (8): 575–6. doi:10.1038 / nmeth0810-575. PMID 20676075. S2CID 26892938.
- ^ Yates CM, Filippis I, Kelley LA, Sternberg MJ (červenec 2014). „SuSPect: vylepšená predikce fenotypu varianty jedné aminokyseliny (SAV) pomocí síťových funkcí“. Journal of Molecular Biology. 426 (14): 2692–701. doi:10.1016 / j.jmb.2014.04.026. PMC 4087249. PMID 24810707.
- ^ Lee PH, Shatkay H (leden 2008). „F-SNP: výpočetně predikované funkční SNP pro asociační studie nemocí“. Výzkum nukleových kyselin. 36 (Problém s databází): D820–4. doi:10.1093 / nar / gkm 904. PMC 2238878. PMID 17986460.
- ^ Makarov V, O'Grady T, Cai G, Lihm J, Buxbaum JD, Yoon S (březen 2012). „AnnTools: komplexní a univerzální anotační sada nástrojů pro genomové varianty“. Bioinformatika. 28 (5): 724–5. doi:10.1093 / bioinformatika / bts032. PMC 3289923. PMID 22257670.
- ^ Shen TH, Carlson CS, Tarczy-Hornoch P (srpen 2009). „SNPit: federovaný systém integrace dat pro účely funkční anotace SNP“. Počítačové metody a programy v biomedicíně. 95 (2): 181–9. doi:10.1016 / j.cmpb.2009.02.010. PMC 2680224. PMID 19327864.
- ^ Gamazon ER, Zhang W, Konkashbaev A, Duan S, Kistner EO, Nicolae DL, Dolan ME, Cox NJ (leden 2010). „SKENOVAT: SNP a anotace čísla kopie“. Bioinformatika. 26 (2): 259–62. doi:10.1093 / bioinformatika / btp644. PMC 2852202. PMID 19933162.
- ^ Bromberg Y, Rost B (2007). „SNAP: predikce vlivu nesynonymních polymorfismů na funkci“. Výzkum nukleových kyselin. 35 (11): 3823–35. doi:10,1093 / nar / gkm238. PMC 1920242. PMID 17526529.
- ^ Calabrese R, Capriotti E, Fariselli P, Martelli PL, Casadio R (srpen 2009). „Funkční anotace zlepšují prediktivní skóre mutací proteinů souvisejících s lidskými chorobami“ (PDF). Lidská mutace. 30 (8): 1237–44. doi:10,1002 / humu.21047. PMID 19514061.
- ^ Karchin R, Diekhans M, Kelly L, Thomas DJ, Pieper U, Eswar N, Haussler D, Sali A (červen 2005). „LS-SNP: rozsáhlá anotace kódování nesynonymních SNP na základě více informačních zdrojů“. Bioinformatika. 21 (12): 2814–20. doi:10.1093 / bioinformatika / bti442. PMID 15827081.
- ^ Asmann YW, Middha S, Hossain A, Baheti S, Li Y, Chai HS, Sun Z, Duffy PH, Hadad AA, Nair A, Liu X, Zhang Y, Klee EW, Kalari KR, Kocher JP (leden 2012). „TREAT: bioinformatický nástroj pro anotace variant a vizualizace v cílených a exome sekvenčních datech“. Bioinformatika. 28 (2): 277–8. doi:10.1093 / bioinformatika / btr612. PMC 3259432. PMID 22088845.
- ^ Doran AG, Creevey CJ (únor 2013). „Snpdat: snadná a rychlá anotace výsledků projektů de novo snp discovery pro modelové a nemodelové organismy“. BMC bioinformatika. 14: 45. doi:10.1186/1471-2105-14-45. PMC 3574845. PMID 23390980.
- ^ Grant JR, Arantes AS, Liao X, Stothard P (srpen 2011). „Hloubková anotace SNP vyplývající z resekvenování projektů pomocí NGS-SNP“. Bioinformatika. 27 (16): 2300–1. doi:10.1093 / bioinformatika / btr372. PMC 3150039. PMID 21697123.
- ^ Ge D, Ruzzo EK, Shianna KV, He M, Pelak K, Heinzen EL, Need AC, Cirulli ET, Maia JM, Dickson SP, Zhu M, Singh A, Allen AS, Goldstein DB (červenec 2011). „SVA: software pro anotování a vizualizaci sekvenovaných lidských genomů“. Bioinformatika. 27 (14): 1998–2000. doi:10.1093 / bioinformatika / btr317. PMC 3129530. PMID 21624899.
- ^ Medina I, De Maria A, Bleda M, Salavert F, Alonso R, Gonzalez CY, Dopazo J (červenec 2012). „VARIANT: Příkazový řádek, webová služba a webové rozhraní pro rychlou a přesnou funkční charakterizaci variant nalezených sekvenováním nové generace“. Výzkum nukleových kyselin. 40 (Problém s webovým serverem): W54–8. doi:10.1093 / nar / gks572. PMC 3394276. PMID 22693211.
- ^ Ng P. C .; Henikoff S. (2003). „SIFT: předpovídání změn aminokyselin, které ovlivňují funkci proteinů“. Výzkum nukleových kyselin. 31 (13): 3812–3814. doi:10.1093 / nar / gkg509. PMC 168916. PMID 12824425.
- ^ Nawar Malhis; Steven J. M. Jones; Jörg Gsponer (2019). „Vylepšená opatření pro evoluční ochranu využívající vzdálenosti taxonomie“. Příroda komunikace. 10 (1): 1556. Bibcode:2019NatCo..10.1556M. doi:10.1038 / s41467-019-09583-2. PMC 6450959. PMID 30952844.
- ^ Nawar Malhis; Matthew Jacobson; Steven J. M. Jones; Jörg Gsponer (2020). „LIST-S2: Třídění škodlivých mutací missense u druhů podle taxonomie“. Výzkum nukleových kyselin. 48 (W1): W154 – W161. doi:10.1093 / nar / gkaa288. PMC 7319545. PMID 32352516.
- ^ Yuan HY, Chiou JJ, Tseng WH, Liu CH, Liu CK, Lin YJ, Wang HH, Yao A, Chen YT, Hsu CN (červenec 2006). „FASTSNP: vždy aktuální a rozšiřitelná služba pro analýzu a stanovení priorit SNP“. Výzkum nukleových kyselin. 34 (Problém s webovým serverem): W635–41. doi:10.1093 / nar / gkl236. PMC 1538865. PMID 16845089.
- ^ Mi H, Guo N, Kejariwal A, Thomas PD (leden 2007). „PANTHER verze 6: data o proteinové sekvenci a vývoji funkce s rozšířeným zastoupením biologických drah“. Výzkum nukleových kyselin. 35 (Problém s databází): D247–52. doi:10.1093 / nar / gkl869. PMC 1716723. PMID 17130144.
- ^ Capriotti E, Altman RB, Bromberg Y (2013). „Kolektivní úsudek předpovídá varianty jednotlivých nukleotidů spojené s onemocněním“. BMC Genomics. 14 Suppl 3: S2. doi:10.1186 / 1471-2164-14-S3-S2. PMC 3839641. PMID 23819846.
- ^ Wang K, Li M, Hakonarson H (září 2010). „ANNOVAR: funkční anotace genetických variant z vysoce výkonných sekvenčních dat“. Výzkum nukleových kyselin. 38 (16): e164. doi:10.1093 / nar / gkq603. PMC 2938201. PMID 20601685.
- ^ „charite / jannovar“. GitHub. Citováno 2016-09-25.
- ^ Cingolani P, Platts A, Wang L, Coon M, Nguyen T, Wang L, Land SJ, Lu X, Ruden DM (2012). „Program pro anotování a předpovídání účinků jednonukleotidových polymorfismů, SnpEff: SNP v genomu kmene Drosophila melanogaster w1118; iso-2; iso-3“. Létat. 6 (2): 80–92. doi:10,4161 / létat.19695. PMC 3679285. PMID 22728672.
- ^ McLaren W, Gil L, Hunt SE, Riat HS, Ritchie GR, Thormann A, Flicek P, Cunningham F (červen 2016). „Ensemble Variant Effect Predictor“. Genome Biology. 17 (1): 122. doi:10.1186 / s13059-016-0974-4. PMC 4893825. PMID 27268795.
- ^ Makarov V, O'Grady T, Cai G, Lihm J, Buxbaum JD, Yoon S (březen 2012). „AnnTools: komplexní a všestranný anotační nástroj pro genomové varianty“. Bioinformatika. 28 (5): 724–5. doi:10.1093 / bioinformatika / bts032. PMC 3289923. PMID 22257670.
- ^ "Vstupní soubor seznamu variací pro anotaci". SeattleSeq Anotace 151.
- ^ Medina I, De Maria A, Bleda M, Salavert F, Alonso R, Gonzalez CY, Dopazo J (červenec 2012). „VARIANT: Příkazový řádek, webová služba a webové rozhraní pro rychlou a přesnou funkční charakterizaci variant nalezených sekvenováním nové generace“. Výzkum nukleových kyselin. 40 (Problém s webovým serverem): W54–8. doi:10.1093 / nar / gks572. PMC 3394276. PMID 22693211.
- ^ Pabinger S, Dander A, Fischer M, Snajder R, Sperk M, Efremova M, Krabichler B, Speicher MR, Zschocke J, Trajanoski Z (březen 2014). „Průzkum nástrojů pro variantní analýzu dat sekvenování genomu nové generace“. Briefings in Bioinformatics. 15 (2): 256–78. doi:10.1093 / bib / bbs086. PMC 3956068. PMID 23341494.
- ^ Lee, Phil H .; Lee, Christian; Li, Xihao; Wee, Brian; Dwivedi, Tušar; Daly, Mark (leden 2018). „Principy a metody upřednostňování nekódujících regulačních variant in-silico“. Genetika člověka. 137 (1): 15–30. doi:10.1007 / s00439-017-1861-0. PMC 5892192. PMID 29288389.
- ^ Li, Xihao; Li, Zilin; Zhou, Hufeng; Gaynor, Sheila M .; Liu, Yaowu; Chen, Han; Sun, Ryan; Dey, Rounak; Arnett, Donna K .; Aslibekyan, Stella; Ballantyne, Christie M .; Bielak, Lawrence F .; Blangero, John; Boerwinkle, Eric; Bowden, Donald W .; Broome, Jai G; Conomos, Matthew P; Correa, Adolfo; Cupples, L. Adrienne; Curran, Joanne E .; Freedman, Barry I .; Guo, Xiuqing; Hindy, George; Irvin, Marguerite R .; Kardia, Sharon L. R .; Kathiresan, Sekar; Khan, Alyna T .; Kooperberg, Charles L .; Laurie, Cathy C .; Liu, X. Shirley; Mahaney, Michael C .; Manichaiku, Ani W .; Martin, Lisa W .; Mathias, Rasika A .; McGarvey, Stephen T .; Mitchell, Braxton D .; Montasser, květen E .; Moore, Jill E .; Morrison3, Alanna C .; O’Connell, Jeffrey R .; Palmer, Nicholette D .; Pampana, Akhil; Peralta, Juan M .; Peyser, Patricia A .; Psaty, Bruce M .; Redline, Susan; Rice, Kenneth M .; Rich, Stephen S .; Smith, Jennifer A .; Tiwari, Hemant K .; Tsai, Michael Y .; Vasan, Ramachandran S .; Wang, Fei Fei; Weeks, Daniel E .; Weng, Zhiping; Wilson, James G .; Yanek, Lisa R .; Konsorcium NHLBI Trans-Omics for Precision Medicine (TOPMed); Pracovní skupina TOPMed Lipids; Neale, Benjamin M .; Sunyaev, Shamil R .; Abecasis, Gonçalo R .; Rotter, Jerome I .; Willer, Cristen J .; Peloso, Gina M .; Natarajan, Pradeep; Lin, Xihong (září 2020). "Dynamické začlenění více in silico funkčních anotací umožňuje vzácnou variantní asociační analýzu velkých sekvenčních studií celého genomu v měřítku". Genetika přírody. 52 (9): 969–983. doi:10.1038 / s41588-020-0676-4. ISSN 1061-4036. PMC 7483769. PMID 32839606.