Návrh nukleové kyseliny - Nucleic acid design

Návrh nukleové kyseliny je proces generování sady nukleová kyselina základní sekvence, které se budou sdružovat do požadované konformace. Design nukleových kyselin je ústředním bodem v oblastech DNA nanotechnologie a Výpočet DNA.[2] Je to nutné, protože existuje mnoho možných sekvence řetězců nukleových kyselin, které se složí do daného sekundární struktura, ale mnoho z těchto sekvencí bude mít nežádoucí další interakce, kterým je třeba se vyhnout. Kromě toho existuje mnoho terciární struktura úvahy, které ovlivňují výběr sekundární struktury pro daný návrh.[3][4]
Návrh nukleových kyselin má podobné cíle proteinový design: v obou je sekvence monomerů racionálně navrženo upřednostňovat požadovanou skládanou nebo přidruženou strukturu a znevýhodňovat alternativní struktury. Výhodou designu nukleových kyselin je však to, že je výpočetně mnohem jednodušším problémem, protože jednoduchost Watson-Cricka párování bází pravidla vedou k jednoduchosti heuristický metody, které poskytují experimentálně robustní vzory. Výpočtové modely pro skládání bílkovin vyžadovat terciární struktura informace, zatímco návrh nukleové kyseliny může fungovat převážně na úrovni sekundární struktura. Struktury nukleových kyselin jsou však ve své funkčnosti méně univerzální než proteiny.[2][5]
Návrh nukleové kyseliny lze považovat za inverzní k predikce struktury nukleových kyselin. Při predikci struktury je struktura určena ze známé sekvence, zatímco v designu nukleových kyselin je generována sekvence, která vytvoří požadovanou strukturu.[2]
Základní koncepty

The struktura nukleových kyselin se skládá ze sekvence nukleotidy. Existují čtyři typy nukleotidů, které se liší podle toho ze čtyř nukleové báze obsahují: v DNA jsou adenin (A), cytosin (C), guanin (G) a tymin (T). Nukleové kyseliny mají tu vlastnost, že se dvě molekuly budou navzájem vázat za vzniku a dvojitá spirála pouze pokud jsou tyto dvě sekvence komplementární, to znamená, že mohou tvořit odpovídající sekvence základní páry. Sekvence v nukleových kyselinách tedy určuje vzor vazby a tím i celkovou strukturu.[5]
Návrh nukleové kyseliny je proces, při kterém se vzhledem k požadované cílové struktuře nebo funkčnosti generují sekvence pro řetězce nukleové kyseliny, které se samy sestaví do této cílové struktury. Návrh nukleových kyselin zahrnuje všechny úrovně struktura nukleové kyseliny:
- Primární struktura —Surová posloupnost nukleové báze každého z komponentních řetězců nukleové kyseliny;
- Sekundární struktura —Soubor interakcí mezi bázemi, tj. Které části kterých pramenů jsou navzájem spojeny; a
- Terciární struktura —Na umístění atomů v trojrozměrném prostoru, s přihlédnutím k geometrickým a sterický omezení.
Jednou z největších obav při návrhu nukleových kyselin je zajištění toho, aby cílová struktura měla nejnižší volnou energii (tj. Nejvíce) termodynamicky příznivé), zatímco nesprávně tvarované struktury mají vyšší hodnoty volné energie, a jsou tedy nepříznivé.[2]Těchto cílů lze dosáhnout pomocí řady přístupů, včetně heuristický termodynamické a geometrické. Téměř všem úkolům při navrhování nukleových kyselin pomáhají počítače a pro mnoho z těchto úkolů je k dispozici řada softwarových balíčků.
Při návrhu nukleových kyselin je třeba vzít v úvahu, že požadované hybridizace by měly mít teploty tání v úzkém rozmezí a jakékoli rušivé interakce by měly mít velmi nízké teploty tání (tj. Měly by být velmi slabé).[5] Existuje také kontrast mezi „pozitivním designem“ optimalizujícím afinitu, snahou minimalizovat energii požadované struktury v absolutním smyslu a „negativním designem“ optimalizujícím specificitu, který zohledňuje energii cílové struktury ve srovnání s energií nežádoucího struktur. Algoritmy, které implementují oba druhy designu, mají obvykle lepší výkon než algoritmy, které zohledňují pouze jeden typ.[2]
Přístupy
Heuristické metody
Heuristický metody používají jednoduchá kritéria, která lze rychle vyhodnotit k posouzení vhodnosti různých sekvencí pro danou sekundární strukturu. Mají tu výhodu, že jsou výpočetně mnohem levnější než minimalizace energie Algoritmy potřebné pro termodynamické nebo geometrické modelování a snadnější implementace, ale za cenu, že budou méně přísné než tyto modely.
Minimalizace symetrie sekvence je nejstarší přístup k návrhu nukleových kyselin a byl poprvé použit k návrhu nepohyblivých verzí rozvětvených struktur DNA. Minimalizace symetrie sekvence rozděluje sekvenci nukleových kyselin na překrývající se subsekvence pevné délky, nazývané délka kritéria. Každý ze 4N možné posloupnosti délky N se mohou objevit v posloupnosti pouze jednou. Tím je zajištěno, že nemůže dojít k žádným nežádoucím hybridizacím, které mají délku větší nebo rovnou délce kritéria.[2][3]
Souvisejícím heuristickým přístupem je vzít v úvahu „nesouladnou vzdálenost“, což znamená počet pozic v určitém rámci, kde základny nejsou komplementární. Větší nesouladová vzdálenost snižuje pravděpodobnost, že může dojít k silné rušivé interakci.[5] To souvisí s konceptem Hammingova vzdálenost v teorie informace. Dalším souvisejícím, ale více zapojeným přístupem je použití metod z teorie kódování na konstruovat sekvence nukleové kyseliny s požadovanými vlastnostmi.
Termodynamické modely
Informace o sekundární struktura komplexu nukleové kyseliny spolu s jeho sekvencí lze použít k předpovědi termodynamické vlastnosti komplexu.
Pokud se v konstrukci nukleových kyselin používají termodynamické modely, obvykle existují dvě úvahy: požadované hybridizace by měly mít teploty tání v úzkém rozmezí a jakékoli rušivé interakce by měly mít velmi nízké teploty tání (tj. Měly by být velmi slabé). The Gibbsova volná energie dokonale sladěného duplexu nukleové kyseliny lze předpovědět pomocí a model nejbližšího souseda. Tento model bere v úvahu pouze interakce mezi nukleotidem a jeho nejbližšími sousedy na řetězci nukleové kyseliny, a to součtem volné energie každého z překrývajících se dvou nukleotidových dílčích slov duplexu. To se potom koriguje pro samo-komplementární monomery a pro Obsah GC. Jakmile je známa volná energie, teplota tání duplexu lze určit. Samotný obsah GC lze také použít k odhadu volné energie a teploty tání duplexu nukleové kyseliny. To je méně přesné, ale také výpočetně méně nákladné.[5]
Software pro termodynamické modelování nukleových kyselin zahrnuje Balení,[6][7]mfold / UNAFold,[8] a Vídeň.[9]
Příbuzný přístup, inverzní predikce sekundární struktury, používá stochastický místní vyhledávání, které zlepšuje sekvenci nukleových kyselin spuštěním a predikce struktury algoritmus a modifikace sekvence k eliminaci nežádoucích funkcí.[5]
Geometrické modely

K předpovědi se používají geometrické modely nukleových kyselin terciární struktura. To je důležité, protože navržené komplexy nukleových kyselin obvykle obsahují více spojovacích bodů, což systému zavádí geometrická omezení. Tato omezení vycházejí ze základního struktura nukleových kyselin, hlavně že dvojitá spirála tvořený duplexy nukleových kyselin má stálou helicitu asi 10,4 základní páry za kolo a je relativně tuhý. Kvůli těmto omezením jsou komplexy nukleových kyselin citlivé na relativní orientaci hlavní a vedlejší drážky na spojovacích bodech. Geometrické modelování dokáže detekovat kmen vyplývající z vychýlení ve struktuře, které pak může návrhář opravit.[4][11]
Geometrické modely nukleových kyselin pro DNA nanotechnologie obecně používají redukovaná zastoupení nukleové kyseliny, protože simulace každého atomu by byla pro takové velké systémy výpočetně velmi nákladná. Uvádí se, že modely se třemi pseudoatomy na pár bází, představující dva hlavní řetězce cukrů a osu šroubovice, mají dostatečnou úroveň detailů k předpovědi experimentálních výsledků.[11] Používají se však také modely s pěti pseudoatomy na pár bází, výslovně zahrnující fosfáty páteře.[12]
Software pro geometrické modelování nukleových kyselin zahrnuje GIDEON,[11]Tiamat,[13]Nanoengineer-1,a UNIQUIMER 3D.[14]Geometrické zájmy jsou zvláště zajímavé při navrhování DNA origami, protože sekvence je předurčena volbou řetězce lešení. Byl vytvořen software speciálně pro design DNA origami, včetně caDNAno[15]a SARSE.[16]
Aplikace
Návrh nukleové kyseliny se používá v DNA nanotechnologie navrhnout prameny, které se samy sestaví do požadované cílové struktury. Patří mezi ně příklady jako DNA stroje, periodické dvourozměrné a trojrozměrné mřížky, mnohostěny a DNA origami.[2] Může být také použit k vytvoření sad řetězců nukleových kyselin, které jsou „ortogonální“ nebo navzájem neinteragují, aby se minimalizovaly nebo eliminovaly rušivé interakce. To je užitečné v Výpočet DNA, jakož i pro aplikace molekulárního čárového kódu v chemická biologie a biotechnologie.[5]
Viz také
Reference
- ^ Mao, Chengde (prosinec 2004). „Vznik složitosti: poučení z DNA“. PLOS Biology. 2 (12): 2036–2038. doi:10.1371 / journal.pbio.0020431. ISSN 1544-9173. PMC 535573. PMID 15597116.
- ^ A b C d E F G Dirks, Robert M .; Lin, Milo; Winfree, Erik; Pierce, Niles A. (2004). „Paradigmata pro výpočetní návrh nukleových kyselin“. Výzkum nukleových kyselin. 32 (4): 1392–1403. doi:10.1093 / nar / gkh291. PMC 390280. PMID 14990744.
- ^ A b Seeman, N (1982). "Spoje a mřížky nukleových kyselin". Journal of Theoretical Biology. 99 (2): 237–47. doi:10.1016/0022-5193(82)90002-9. PMID 6188926.
- ^ A b Sherman, W; Seeman, N (2006). "Návrh minimálně namáhaných nanotrubiček s nukleovými kyselinami". Biofyzikální deník. 90 (12): 4546–57. Bibcode:2006BpJ .... 90,4546S. doi:10.1529 / biophysj.105.080390. PMC 1471877. PMID 16581842.
- ^ A b C d E F G Brenneman, Arwen; Condon, Anne (2002). "Pramenný design pro biomolekulární výpočet". Teoretická informatika. 287: 39–58. doi:10.1016 / S0304-3975 (02) 00135-4.
- ^ Dirks, Robert M .; Bois, Justin S .; Schaeffer, Joseph M .; Winfree, Erik; Pierce, Niles A. (2007). "Termodynamická analýza vzájemně působících pramenů nukleových kyselin". Recenze SIAM. 49 (1): 65–88. Bibcode:2007SIAMR..49 ... 65D. CiteSeerX 10.1.1.523.4764. doi:10.1137/060651100.
- ^ Zadeh, Joseph N .; Wolfe, Brian R .; Pierce, Niles A. (2011). „Návrh sekvence nukleové kyseliny prostřednictvím efektivní optimalizace vady souboru“ (PDF). Journal of Computational Chemistry. 32 (3): 439–452. doi:10.1002 / jcc.21633. PMID 20717905.
- ^ Zuker, M. (2003). „Mfold webový server pro skládání nukleových kyselin a predikci hybridizace“. Výzkum nukleových kyselin. 31 (13): 3406–15. doi:10,1093 / nar / gkg595. PMC 169194. PMID 12824337.
- ^ Gruber AR, Lorenz R, Bernhart SH, Neuböck R, Hofacker IL (2008). „Vídeňská RNA websuite“. Nucleic Acids Res. 36 (Problém s webovým serverem): W70–4. doi:10.1093 / nar / gkn188. PMC 2447809. PMID 18424795.
- ^ Goodman, R.P .; Schaap, I.A.T .; Tardin, C.F .; Erben, C.M .; Berry, R.M .; Schmidt, C.F .; Turberfield, A.J. (9. prosince 2005). "Rychlé chirální sestavení tuhých stavebních bloků DNA pro molekulární nanofabrikaci". Věda. 310 (5754): 1661–1665. Bibcode:2005Sci ... 310.1661G. doi:10.1126 / science.1120367. ISSN 0036-8075. PMID 16339440. S2CID 13678773.
- ^ A b C Birac, Jeffrey J .; Sherman, William B .; Kopatsch, Jens; Constantinou, Pamela E .; Seeman, Nadrian C. (2006). „Architecture with GIDEON, a program for design in structures DNA nanotechnology“. Journal of Molecular Graphics and Modeling. 25 (4): 470–80. doi:10.1016 / j.jmgm.2006.03.005. PMC 3465968. PMID 16630733.
- ^ „Popisy modelů PAM3 a PAM5“. Wiki dokumentace Nanoengineer-1. Nanorex. Citováno 2010-04-15.
- ^ Williams, Sean; Lund, Kyle; Lin, Chenxiang; Wonka, Peter; Lindsay, Stuart; Yan, Hao (2009). „Tiamat: Trojrozměrný editační nástroj pro složité struktury DNA“. Výpočet DNA. Přednášky z informatiky. 5347. Springer Berlin / Heidelberg. str. 90–101. doi:10.1007/978-3-642-03076-5_8. ISBN 978-3-642-03075-8. ISSN 0302-9743.
- ^ Zhu, J .; Wei, B .; Yuan, Y .; Mi, Y. (2009). „UNIQUIMER 3D, softwarový systém pro konstrukci, analýzu a hodnocení strukturní DNA nanotechnologie“. Výzkum nukleových kyselin. 37 (7): 2164–75. doi:10.1093 / nar / gkp005. PMC 2673411. PMID 19228709.
- ^ Douglas, S. M .; Marblestone, A. H .; Teerapittayanon, S .; Vazquez, A .; Church, G. M .; Shih, W. M. (2009). „Rychlé prototypování 3D tvarů DNA-origami pomocí caDNAno“. Výzkum nukleových kyselin. 37 (15): 5001–6. doi:10.1093 / nar / gkp436. PMC 2731887. PMID 19531737.
- ^ Andersen, Ebbe S .; Dong, Mingdong; Nielsen, Morten M .; Jahn, Kasper; Lind-Thomsen, Allan; Mamdouh, Wael; Gothelf, Kurt V .; Besenbacher, Flemming; Kjems, JøRgen (2008). „DNA Origami Design of Dolphin-Shaped Structures with Flexible Tails“. ACS Nano. 2 (6): 1213–8. doi:10.1021 / nn800215j. PMID 19206339.
Další čtení
- Brenneman, Arwen; Condon, Anne (2002). "Pramenný design pro biomolekulární výpočet". Teoretická informatika. 287: 39–58. doi:10.1016 / S0304-3975 (02) 00135-4.—Přehled přístupů k návrhu primární struktury nukleové kyseliny.
- Dirks, Robert M.; Lin, Milo; Winfree, Erik; Pierce, Niles A. (2004). „Paradigmata pro výpočetní návrh nukleových kyselin“. Výzkum nukleových kyselin. 32 (4): 1392–1403. doi:10.1093 / nar / gkh291. PMC 390280. PMID 14990744.—Srovnání a vyhodnocení řady heuristických a termodynamických metod pro návrh nukleových kyselin.
- Seeman, N (1982). "Spoje a mřížky nukleové kyseliny". Journal of Theoretical Biology. 99 (2): 237–47. doi:10.1016/0022-5193(82)90002-9. PMID 6188926.—Jeden z prvních článků o designu nukleových kyselin, který popisuje použití minimalizace sekvenční symetrie pro konstrukci nehybných větvených spojů.
- Andersen, Ebbe Lenost (2010). "Predikce a návrh struktur DNA a RNA". Nová biotechnologie. 27 (3): 184–193. doi:10.1016 / j.nbt.2010.02.012. PMID 20193785.—Reklama srovnávající možnosti dostupného softwaru pro návrh nukleových kyselin.