Varianta sekvence amplikonu - Amplicon sequence variant

Varianta sekvence amplikonu (ASV) je termín používaný k označení singlu DNA sekvence získané z vysoké propustnosti markerový gen analýza. Tato načítání amplikonů jsou vytvářena po odstranění chybných sekvencí generovaných během PCR a sekvenování. To umožňuje ASV rozlišit variaci sekvence jedinou změnou nukleotidů. ASV se používají ke klasifikaci skupin druhů na základě sekvencí DNA, hledání biologických a environmentálních variací a ke stanovení ekologických vzorců. Po mnoho let byla standardní jednotka pro analýzu markerového genu operativní taxonomické jednotky (OTU), které jsou generovány klastrovými sekvencemi na základě sdíleného prahu podobnosti. Tyto tradiční jednotky byly vytvořeny konstrukcí molekulárních taxonomických jednotek buď shlukováním na základě podobností mezi sekvenčními čteními (de-novo OTU) nebo seskupením referenčních databází k definování a označení OTU (uzavřené reference OTU). Místo použití přesných variant sekvencí (změny jednotlivých nukleotidů) se OTU vyznačují méně pevným prahem odlišnosti, který je nejčastěji 3%. To znamená, že tyto jednotky musí sdílet 97% sekvence DNA. Metody ASV na druhé straně jsou schopny řešit rozdíly v sekvenci jen o jednu změnu nukleotidů, což umožňuje této metodě vyhnout se operativním klastrovacím jednotkám založeným na podobnosti dohromady. Proto ASV poskytují přesnější měření variace sekvence, protože tato metoda používá rozdíly DNA namísto rozdílů OTU vytvořených uživatelem. ASV se také označují jako varianty přesné sekvence (ESV), OTU s nulovým poloměrem (zOTU), sub-OTU (sOTU), haplotypy nebo oligotypy.[1] [2]

Porovnává se ASV a OTU. Tato tabulka poskytuje zaškrtnutí, zda je tato metoda analýzy marker-gen přesná, sledovatelná, reprodukovatelná nebo komplexní.
Tento graf ukazuje skutečnou sekvenci, která byla sekvenována více než stokrát. Černé tečky se nazývají cloud chyb, přičemž osa Y je počet typů, které se v této sadě objevila konkrétní chyba. Červená svislá čára představuje hranici 3%, to znamená, že vše napravo od této čáry je nová biologie a vše vlevo je chyba. To ukazuje chyby nebo novou biologii, které mohou při používání OTU chybět, protože OTU je zahrnou do prahové hodnoty 3% odlišnosti.
Jedná se o stejnou skutečnou sekvenci, která byla sekvenována více než stokrát jako výše uvedený graf. Černé tečky se nazývají cloud chyb, přičemž osa Y je počet typů, které se v této sadě objevila konkrétní chyba. Tento diagram nyní ukazuje, jak ASV zabraňují zahrnutí těchto chyb spojených s OTU do datové sady, protože ASV omezují chyby na to, že jsou pod černou zakřivenou čarou a nová biologie je tečkami nad zakřivenou černou čarou. To znamená, že ASV jsou přesnější při měření rozdílů mezi sekvencemi.
To vizuálně ukazuje, jak OTU zachycují chybná čtení amplikonů vytvořená z PCR a sekvenování. Když jsou tyto sekvence amplifikovány do seskupených jednotek, tyto chyby jsou vyzvednuty a umístěny do seskupených jednotek. OTU proto vyzvedávají širší soubor datových bodů a mají potenciál náhodně seskupit dvě odlišné sekvence DNA do stejné jednotky, jak je patrné pouze ze dvou barev nebo sekvencí DNA, které jsou zachyceny do OTU místo čtyř barev (sekvence DNA).
To vizuálně ukazuje, jak ASV odstraňují a opravují chyby z PCR ve srovnání s výše uvedeným diagramem OTU. ASV jsou schopny vytvářet skupiny pro všechny čtyři pozorované barvy nebo sekvence DNA. To umožňuje ASV být přesnější při hledání variací sekvence

Výhody OTU

Ačkoli ASV umožňují přesnější a přesnější měření pro změnu sekvence, OTU jsou stále přijatelným a cenným přístupem. Ve výzkumné studii provedené Glassmanem a Martinym dokázali tito vědci prokázat platnost OTU při použití na studie analýzy rozmanitosti v širokém měřítku. Došli k závěru, že OTU a ASV poskytly podobné ekologické výsledky, přičemž ASV umožnily mírně silnější detekci rozmanitosti hub a bakterií. Tato studie odhalila, že ačkoli ASV nyní umožní přesnější měření diverzifikace druhů, vědci by neměli zpochybňovat platnost dobře sestavených výzkumných studií, kde byly OTU použity k prokázání diverzifikace v širokém měřítku. [3]

Výhody ASV

Zavedení metod ASV podnítilo debatu mezi vědci o jejich užitečnosti. Někteří argumentovali, že ASV by měly nahradit OTU v analýze markerového genu. Argumenty ve prospěch ASV se zaměřují na přesnost, ovladatelnost, reprodukovatelnost a komplexnost, kterou mohou ASV poskytnout analýze markerového genu. Užitečnost jemnějšího rozlišení sekvence (přesnosti) a výhoda možnosti snadného porovnání sekvencí mezi různými studiemi (přenositelnost a reprodukovatelnost) činí z ASV lepší volbu pro analýzu sekvenčních rozdílů. Jednotky v OTU se mohou mezi výzkumníky, experimenty a databázemi měnit, protože se jedná o operační jednotky, a proto závisí na osobě, která vytvořila tento konkrétní práh podobnosti. Zatímco ASV jsou přesnou variací nukleotidové sekvence, takže změny pozorované mezi minulými experimenty lze snadněji vysledovat k biologickým rozdílům namísto rozdílů v shlucích jednotek. To znamená, že vědci jsou schopni pracovat sami se sebou před dvěma lety, protože ASV nevyužívají shluky předpojatých databází nebo výzkumníků, místo toho jsou ASV detekovatelné biologické variace poskytující konzistentní značení napříč všemi datovými soubory. Tabulky ASV také poskytují přesnější a komplexnější variaci sekvence ve srovnání s databázemi OTU, protože operační jednotky se mezi experimentem a výzkumníkem liší. Jelikož se jedná o přesné variace sekvence, jsou ASV komplexnější a přesnější ve srovnání s provozními jednotkami vytvořenými každou databází. Ačkoli byla prokázána platnost OTU, ASV jsou přesnější, opakovaně použitelné, komplexní a reprodukovatelné pro sekvenování markerových genů. [4] [5]

ASV metody

Populární metody řešení ASV včetně DADA2,[6] Deblur,[7] MED,[8] a UNOISE.[9] Tyto metody fungují široce tím, že generují chybový model přizpůsobený jednotlivému běhu sekvenování a využívají algoritmy, které používají model k rozlišení mezi skutečnými biologickými sekvencemi a těmi, které jsou generovány chybou.

Reference

  1. ^ Porter, Teresita M .; Hajibabaei, Mehrdad (2018). „Škálování: Průvodce vysoce výkonnými genomickými přístupy k analýze biologické rozmanitosti“. Molekulární ekologie. 27 (2): 313–338. doi:10.1111 / mec.14478. ISSN  1365-294X. PMID  29292539.
  2. ^ Callahan, Benjamin J .; McMurdie, Paul J .; Holmes, Susan P. (prosinec 2017). „Přesné varianty sekvencí by měly nahradit funkční taxonomické jednotky v analýze dat marker-gen“. Časopis ISME. 11 (12): 2639–2643. doi:10.1038 / ismej.2017.119. ISSN  1751-7370.
  3. ^ Glassman, Sydney I .; Martiny, Jennifer B.H. (29. srpna 2018). „Širokoúhlé ekologické vzory jsou robustní vůči použití přesných variant sekvencí oproti provozním taxonomickým jednotkám“. mSphere. 3 (4). doi:10,1128 / mSphere.00148-18. ISSN  2379-5042.
  4. ^ Callahan, Benjamin J; McMurdie, Paul J; Holmes, Susan P (2017-07-21). „Přesné varianty sekvencí by měly nahradit funkční taxonomické jednotky v analýze dat markerového genu“. Časopis ISME. 11 (12): 2639–2643. doi:10.1038 / ismej.2017.119. PMC  5702726.
  5. ^ Callahan, Benjamin J .; McMurdie, Paul J .; Holmes, Susan P. (prosinec 2017). „Přesné varianty sekvencí by měly nahradit funkční taxonomické jednotky v analýze dat marker-gen“. Časopis ISME. 11 (12): 2639–2643. doi:10.1038 / ismej.2017.119. ISSN  1751-7370.
  6. ^ Callahan, Benjamin J; McMurdie, Paul J; Rosen, Michael J; Han, Andrew W; Johnson, Amy J; Holmes, Susan P (06.08.2015). "DADA2: Odvození vzorku s vysokým rozlišením z dat amplikonu". doi:10.1101/024034. Citovat deník vyžaduje | deník = (Pomoc)
  7. ^ Amir, Amnon; McDonald, Daniel; Navas-Molina, Jose A .; Kopylova, Evguenia; Morton, James T .; Zech Xu, Zhenjiang; Kightley, Eric P .; Thompson, Luke R .; Hyde, Embriette R. (2017-04-25). Gilbert, Jack A. (ed.). „Deblur rychle řeší vzory sekvencí komunit s jedním nukleotidem“. mSystémy. 2 (2). doi:10,1 128 / mSystems.00191-16. ISSN  2379-5077. PMC  5340863. PMID  28289731.
  8. ^ Eren, A Murat; Morrison, Hilary G; Lescault, Pamela J; Reveillaud, Julie; Vineis, Joseph H; Sogin, Mitchell L (2014-10-17). „Minimální entropický rozklad: Nesledovaný oligotyp pro citlivé dělení sekvencí genu s vysokou propustností markeru“. Časopis ISME. 9 (4): 968–979. doi:10.1038 / ismej.2014.195. ISSN  1751-7362. PMC  4817710. PMID  25325381.
  9. ^ Edgar, Robert C (2016-10-15). „UNOISE2: vylepšená oprava chyb pro sekvenování amplikonů Illumina 16S a ITS“. doi:10.1101/081257. Citovat deník vyžaduje | deník = (Pomoc)