Kódovací oblast - Coding region

The oblast kódování a gen, také známý jako CDS (z sekvence kódování), je část genu DNA nebo RNA které kódy pro protein.^[1] Studium délky, složení, regulace, sestřihu, struktur a funkcí kódujících oblastí ve srovnání s nekódujícími oblastmi v různých druzích a časových obdobích může poskytnout významné množství důležitých informací týkajících se genové organizace a vývoje prokaryoty a eukaryoty.^[2] To může dále pomoci při mapování lidský genom a vývoj genové terapie.^[3]

Definice

Ačkoli tento termín je také někdy používán zaměnitelně s exon, není to úplně stejná věc: exon se skládá z kódující oblasti a 3 'a 5' nepřeložené regiony RNA, a proto by exon byl částečně tvořen kódujícími oblastmi. 3 'a 5' nepřeložené regiony RNA, které nekódují bílkoviny, se nazývají nekódování regionech a nejsou na této stránce diskutovány.^[4]

Mezi kódujícími regiony a exomes a mezi těmito pojmy existuje jasný rozdíl. Zatímco exome Termín "označuje všechny exony v genomu" označuje kódující oblast singulární část DNA nebo RNA, která specificky kóduje určitý druh proteinu.

Dějiny

V roce 1978 Walter Gilbert zveřejnil dokument „Proč geny v kusech“, který nejprve začal zkoumat myšlenku, že gen je mozaika - každá je plná nukleová kyselina vlákno není kódováno nepřetržitě, ale je přerušeno „tichými“ nekódujícími oblastmi. To byl první náznak, že je třeba rozlišovat mezi částmi genomu, které kódují protein, nyní nazývané kódující oblasti, a těmi, které tak nečiní.^[5]

Složení

Typy bodových mutací: přechody (modré) jsou zvýšené ve srovnání s přechody (červené) v kódovacích oblastech bohatých na GC.^[6]

Důkazy naznačují, že existuje obecná vzájemná závislost mezi vzory základního složení a dostupností kódovací oblasti.^[7] Předpokládá se, že kódující oblast obsahuje vyšší Obsah GC než nekódující oblasti. Existuje další výzkum, který zjistil, že čím delší je kódující řetězec, tím vyšší je obsah GC. Krátké kódující řetězce jsou poměrně stále GC-chudé, podobné nízkému obsahu GC v základním složení translační stop kodony jako TAG, TAA a TGA.^[8]

Poměrem jsou také oblasti bohaté na GC bodová mutace typ je mírně pozměněn: je jich více přechody, což jsou změny od purinu k purinu nebo pyrimidinu k pyrimidinu ve srovnání s transversions, což jsou změny z purinu na pyrimidin nebo pyrimidinu na purin. Je méně pravděpodobné, že přechody změní kódovanou aminokyselinu a zůstanou a tichá mutace (zvláště pokud se vyskytnou ve třetím nukleotid kodonu), který je pro organismus obvykle prospěšný během translace a tvorby proteinu.^[9]

To naznačuje, že základní kódující oblasti (bohaté na geny) mají vyšší obsah GC a jsou stabilnější a odolnější vůči mutace ve srovnání s vedlejšími a neesenciálními oblastmi (genově chudé).^[10] Stále však není jasné, zda k tomu došlo neutrální a náhodnou mutací nebo vzorem výběr.^[11] Diskutuje se také o tom, zda jsou použité metody, jako jsou genová okna, ke zjištění vztahu mezi obsahem GC a kódující oblastí přesné a nezaujaté.^[12]

Struktura a funkce

Transkripce: RNA polymeráza (RNAP) používá templátové DNA vlákno a začíná kódovat na promotorové sekvenci (zelená) a končí na terminátorové sekvenci (červená), aby zahrnovala celou kódující oblast do produktové mRNA (zelenomodrá). [Pochybuji, že konec 5 'a 3' je na tomto obrázku zobrazen nesprávně]

v DNA, kódující oblast je ohraničena sekvence promotoru na 5 'konci pramen šablony a ukončovací sekvence na 3 'konci. V době transkripce, RNA polymeráza (RNAP) váže se na promotorovou sekvenci a pohybuje se podél vlákna šablony do kódující oblasti. RNAP poté přidá RNA nukleotidy komplementární k kódující oblasti za účelem vytvoření mRNA, střídání uracil namísto tymin.^[13] To pokračuje, dokud RNAP nedosáhne ukončovací sekvence.^[13]

Po přepisu a zrání se zralá mRNA formoval zahrnuje několik částí důležitých pro jeho případný překlad do protein. Kódující oblast v mRNA je ohraničena 5 'nepřekládaná oblast (5'-UTR) a 3 'nepřekládaná oblast (3'-UTR),^[1] the 5 'čepice, a Poly-A ocas. V době překlad, ribozom usnadňuje připevnění tRNA do kódující oblasti 3 nukleotidy najednou (kodony ).^[14] TRNA přenášejí své asociované aminokyseliny k rostoucímu polypeptid řetězce, případně tvořící protein definovaný v počáteční oblasti kódující DNA.

Kódující oblast (zelenomodrá) je lemována nepřekládanými oblastmi, 5 'čepičkou a poly (A) ocasem, které společně tvoří zralá mRNA.^[15]

Nařízení

Kódující oblast může být modifikována za účelem regulace genové exprese.

Alkylace je jednou z forem regulace kódující oblasti.^[16] Gen, který by byl transkribován, může být umlčen cílením na konkrétní sekvenci. Báze v tomto pořadí by byly blokovány pomocí alkylové skupiny, které vytvářejí umlčení účinek.^[17]

Zatímco regulace genové exprese řídí nadbytek RNA nebo proteinu vytvořeného v buňce, regulaci těchto mechanismů lze řídit pomocí a regulační sekvence nalezen před otevřený čtecí rámec začíná ve vlákně DNA. The regulační sekvence potom určí umístění a čas, kdy dojde k expresi pro oblast kódující protein.^[18]

Sestřih RNA nakonec určuje, která část sekvence se přeloží a vyjádří, a tento proces zahrnuje vyřezávání intronů a sestavování exonů. Kde RNA spliceosome škrty se však řídí uznáním spojovací weby, zejména 5 'spojovací místo, které je jedním ze substrátů pro první krok spojování.^[19] Kódující oblasti jsou uvnitř exonů, které se kovalentně spojí dohromady a vytvoří zralá poselská RNA.

Mutace

Mutace v kódující oblasti může mít velmi různorodé účinky na fenotyp organismu. Zatímco některé mutace v této oblasti DNA / RNA mohou vést k výhodným změnám, jiné mohou být škodlivé a někdy dokonce smrtelné pro přežití organismu. Naproti tomu změny v kódující oblasti nemusí vždy vést k detekovatelným změnám fenotypu.

Typy mutací

Příklady různých forem bodové mutace které mohou existovat v kódujících oblastech. Tyto změny mohou nebo nemusí mít fenotypové změny, v závislosti na tom, zda během translace kódují různé aminokyseliny.^[20]

V kódujících oblastech mohou nastat různé formy mutací. Jedna forma je tiché mutace, ve kterém změna nukleotidů nevede k žádné změně aminokyseliny po transkripci a translaci.^[21] Existují také nesmyslné mutace, kde bázové změny v kódující oblasti kódují předčasný stop kodon, produkující kratší finální protein. Bodové mutace, nebo jsou nazývány změny jednoho páru bází v kódující oblasti, která kóduje různé aminokyseliny během translace missense mutace. Mezi další typy mutací patří mutace posunu snímků jako vložení nebo vypuštění.^[21]

Formace

Některé formy mutací jsou dědičný (zárodečné mutace ), nebo předán z rodiče na jeho potomka.^[22] Takové mutované kódující oblasti jsou přítomny ve všech buňkách v organismu. Získávají se další formy mutací (somatické mutace ) během života organismů a nemusí být konstantní buňka-buňka.^[22] Tyto změny mohou být způsobeny mutageny, karcinogeny nebo jiné látky na ochranu životního prostředí (např. UV ). Získané mutace mohou být také výsledkem chyb kopírování během replikace DNA a nejsou předávány potomkům. Změny v kódovací oblasti mohou být také de novo (Nový); předpokládá se, že k těmto změnám dojde krátce poté oplodnění, což má za následek mutaci přítomnou v DNA potomka, přičemž chybí v spermatu i vajíčku.^[22]

Prevence

Existuje několik mechanismů transkripce a translace, které zabraňují letalitě v důsledku škodlivých mutací v kódující oblasti. Mezi tato opatření patří korektura některými DNA polymerázy během replikace, oprava nesouladu po replikaci,^[23] aKolísavá hypotéza "který popisuje zvrhlost třetí báze v mRNA kodonu.^[24]

Omezené oblasti kódování (CCR)

I když je dobře známo, že genom jednoho jedince může mít značné rozdíly ve srovnání s genomem jiného, nedávný výzkum zjistil, že některé kódující oblasti jsou mezi jedinci stejného druhu vysoce omezené nebo rezistentní vůči mutacím. To je podobné konceptu mezidruhového omezení v konzervované sekvence. Vědci označili tyto vysoce omezené sekvence omezené kódující oblasti (CCR) a také zjistili, že tyto oblasti mohou být zapojeny do vysoce čistící výběr. V průměru je přibližně 1 mutace měnící protein každých 7 kódujících bází, ale některé CCR mohou mít sekvenci více než 100 bází bez pozorovacích mutací měnících proteiny, některé dokonce bez synonymních mutací.^[25] Tyto vzorce omezení mezi genomy mohou poskytnout vodítka ke zdrojům vzácných vývojové nemoci nebo potenciálně dokonce embryonální letalita. Klinicky ověřené varianty a de novo mutace v CCR byly dříve spojeny s poruchami, jako je dětská epileptická encefalopatie, vývojové zpoždění a závažné srdeční choroby.^[25]

Detekce sekvence kódování

Při identifikaci otevřené čtecí rámce v DNA sekvenci je přímočará, identifikace kódujících sekvencí není, protože buňka převádí na proteiny pouze podmnožinu všech otevřených čtecích rámců.^[26] V současné době predikce CDS využívá vzorkování a sekvenování mRNA z buněk, i když stále existuje problém s určením, které části dané mRNA jsou skutečně přeloženy na protein. Predikce CDS je podmnožinou genová předpověď, druhý také zahrnuje predikci sekvencí DNA, které kódují nejen protein, ale také další funkční prvky, jako jsou geny RNA a regulační sekvence.

V obou prokaryoty a eukaryoty, gen se překrývá se vyskytuje relativně často u DNA i RNA virů jako evoluční výhoda pro zmenšení velikosti genomu při zachování schopnosti produkovat různé proteiny z dostupných kódujících oblastí.^[27]^[28] U DNA i RNA párové zarovnání dokáže detekovat překrývající se kódovací oblasti, včetně krátkých otevřené čtecí rámce u virů, ale vyžadovalo by známé kódující vlákno, aby bylo možné porovnat potenciální překrývající se kódující vlákno s.^[29] Alternativní metoda používající sekvence jednoho genomu by pro provedení srovnání nevyžadovala více sekvencí genomu, ale vyžadovala by alespoň 50 překrývajících se nukleotidů, aby byla citlivá.^[30]

Viz také

Kódovací řetězec Vlákno DNA, které kóduje protein
Exon Celá část řetězce, která je přepsána
Zralá mRNA Část transkripčního produktu mRNA, která je přeložena
Genová struktura Další prvky, které tvoří gen
Nekódující DNA Části genomů, které nekódují geny kódující proteiny
Nekódující RNA Molekuly, které nekódují proteiny, takže nemají CDS

Reference

^ ^A ^b Twyman, Richard (1. srpna 2003). "Genová struktura". Wellcome Trust. Archivovány od originál dne 28. března 2007. Citováno 6. dubna 2003.
^ Höglund M, Säll T, Röhme D (únor 1990). Msgstr "O původu kódujících sekvencí z náhodných otevřených čtecích rámců". Journal of Molecular Evolution. 30 (2): 104–108. Bibcode:1990JMolE..30..104H. doi:10.1007 / bf02099936. ISSN 0022-2844. S2CID 5978109.
^ Sakharkar MK, Chow VT, Kangueane P (2004). "Distribuce exonů a intronů v lidském genomu". In Silico Biology. 4 (4): 387–93. PMID 15217358.
^ Parnell, Laurence D. (01.01.2012). „Pokroky v technologiích a designu studia“. In Bouchard, C .; Ordovas, J. M. (eds.). Nedávné pokroky v Nutrigenetice a Nutrigenomics. Pokrok v molekulární biologii a translační vědě. Nedávné pokroky v Nutrigenetice a Nutrigenomics. 108. Akademický tisk. str. 17–50. doi:10.1016 / B978-0-12-398397-8.00002-2. ISBN 9780123983978. PMID 22656372. Citováno 2019-11-07.
^ Gilbert W (únor 1978). „Proč geny na kousky?“. Příroda. 271 (5645): 501. Bibcode:1978Natur.271..501G. doi:10.1038 / 271501a0. PMID 622185. S2CID 4216649.
^ (n.d.). Citováno z https://www.differenceb Between.com/wp-content/uploads/2017/03/Difference-B Between-Transition-and-Transversion-3.png
^ Lercher MJ, Urrutia AO, Pavlícek A, Hurst LD (říjen 2003). „Sjednocení mozaikových struktur v lidském genomu“. Lidská molekulární genetika. 12 (19): 2411–5. doi:10,1093 / hmg / ddg251. PMID 12915446.
^ Oliver JL, Marín A (září 1996). Msgstr "Vztah mezi obsahem GC a délkou kódovací sekvence". Journal of Molecular Evolution. 43 (3): 216–23. Bibcode:1996JMolE..43..216O. doi:10.1007 / pl00006080. PMID 8703087.
^ "ROSALIND | Glosář | Oblast kódování genů". rosalind.info. Citováno 2019-10-31.
^ Vinogradov AE (duben 2003). „Šroubovice DNA: důležitost bohatství na GC“. Výzkum nukleových kyselin. 31 (7): 1838–44. doi:10.1093 / nar / g 296. PMC 152811. PMID 12654999.
^ Bohlin J, Eldholm V, Pettersson JH, Brynildsrud O, Snipen L (únor 2017). „Nukleotidové složení mikrobiálních genomů naznačuje rozdílné vzorce selekce na základních a doplňkových genomech“. BMC Genomics. 18 (1): 151. doi:10.1186 / s12864-017-3543-7. PMC 5303225. PMID 28187704.
^ Sémon M, Mouchiroud D, Duret L (únor 2005). „Vztah mezi genovou expresí a obsahem GC u savců: statistická významnost a biologická relevance“. Lidská molekulární genetika. 14 (3): 421–7. doi:10,1093 / hmg / ddi038. PMID 15590696.
^ ^A ^b Přehled transkripce. (n.d.). Citováno z https://www.khanacademy.org/science/biology/gene-expression-central-dogma/transcription-of-dna-into-rna/a/overview-of-transcription.
^ Clancy, Suzanne (2008). „Translation: DNA to mRNA to Protein“. Scitable: By Nature Education.
^ Plociam (08.08.2005), Anglicky: The structure of a mature eukaryotic mRNA. Plně zpracovaná mRNA zahrnuje 5 'čepičku, 5' UTR, kódující oblast, 3 'UTR a poly (A) ocas., vyvoláno 2019-11-19
^ Shinohara K, Sasaki S, Minoshima M, Bando T, Sugiyama H (2006-02-13). „Alkylace templátového řetězce kódující oblasti způsobuje účinné umlčení genu“. Výzkum nukleových kyselin. 34 (4): 1189–95. doi:10.1093 / nar / gkl005. PMC 1383623. PMID 16500890.
^ „Termín pro genovou DNA pro alkylaci genů (GO: 0006305)“. www.informatics.jax.org. Citováno 2019-10-30.
^ Shafee T, Lowe R (2017). "Eukaryotická a prokaryotická genová struktura". WikiJournal of Medicine. 4 (1). doi:10.15347 / wjm / 2017.002.
^ Konarska MM (1998). "Rozpoznání 5 'spojovacího místa spliceosomem". Acta Biochimica Polonica. 45 (4): 869–81. doi:10.18388 / abp.1998_4346. PMID 10397335.
^ Jonsta247 (10.05.2013), Angličtina: Příklad tiché mutace, vyvoláno 2019-11-19
^ ^A ^b Yang, J. (2016, 23. března). Co jsou genetické mutace? Citováno z https://www.singerinstruments.com/resource/what-are-genetic-mutation/.
^ ^A ^b ^C Co je genová mutace a jak k mutacím dochází? - Genetics Home Reference - NIH. (n.d.). Citováno z https://ghr.nlm.nih.gov/primer/mutationsanddisorders/genemutation.
^ Korektury a opravy DNA. (n.d.). Citováno z https://www.khanacademy.org/science/high-school-biology/hs-molecular-genetics/hs-discovery-and-structure-of-dna/a/dna-proofreading-and-repair.
^ Peretó J. (2011) Wobble Hypothesis (Genetics). In: Gargaud M. a kol. (eds) Encyclopedia of Astrobiology. Springer, Berlín, Heidelberg
^ ^A ^b Havrilla, J. M., Pedersen, B. S., Layer, R. M. a Quinlan, A. R. (2018). Mapa omezených kódujících oblastí v lidském genomu. Genetika přírody, 88–95. doi: 10,1101 / 220814
^ Furuno M, Kasukawa T, Saito R, Adachi J, Suzuki H, Baldarelli R a kol. (Červen 2003). "Anotace CDS v plné délce cDNA sekvence". Výzkum genomu. Cold Spring Harbor Laboratory Press. 13 (6B): 1478–1487. doi:10,1101 / gr. 1060303. PMC 403693. PMID 12819146.
^ Rogozin IB, Spiridonov AN, Sorokin AV, Wolf YI, Jordan IK, Tatusov RL, Koonin EV (květen 2002). „Purifikace a směrová selekce v překrývajících se prokaryotických genech“. Trendy v genetice. 18 (5): 228–32. doi:10.1016 / S0168-9525 (02) 02649-5. PMID 12047938.
^ Chirico N, Vianelli A, Belshaw R (prosinec 2010). „Proč se geny překrývají ve virech“. Řízení. Biologické vědy. 277 (1701): 3809–17. doi:10.1098 / rspb.2010.1052. PMC 2992710. PMID 20610432.
^ Firth AE, Brown CM (únor 2005). "Detekce překrývajících se kódovacích sekvencí s párovým zarovnáním". Bioinformatika. 21 (3): 282–92. doi:10.1093 / bioinformatika / bti007. PMID 15347574.
^ Schlub TE, Buchmann JP, Holmes EC (říjen 2018). Malik H (ed.). „Jednoduchá metoda k detekci překrývajících se genů virů pomocí sekvencí jednoho genomu“. Molekulární biologie a evoluce. 35 (10): 2572–2581. doi:10.1093 / molbev / msy155. PMC 6188560. PMID 30099499.

[:12-1] A ^b Twyman, Richard (1. srpna 2003). "Genová struktura". Wellcome Trust. Archivovány od originál dne 28. března 2007. Citováno 6. dubna 2003.

[2] Höglund M, Säll T, Röhme D (únor 1990). Msgstr "O původu kódujících sekvencí z náhodných otevřených čtecích rámců". Journal of Molecular Evolution. 30 (2): 104–108. Bibcode:1990JMolE..30..104H. doi:10.1007 / bf02099936. ISSN 0022-2844. S2CID 5978109.

[3] Sakharkar MK, Chow VT, Kangueane P (2004). "Distribuce exonů a intronů v lidském genomu". In Silico Biology. 4 (4): 387–93. PMID 15217358.

[4] Parnell, Laurence D. (01.01.2012). „Pokroky v technologiích a designu studia“. In Bouchard, C .; Ordovas, J. M. (eds.). Nedávné pokroky v Nutrigenetice a Nutrigenomics. Pokrok v molekulární biologii a translační vědě. Nedávné pokroky v Nutrigenetice a Nutrigenomics. 108. Akademický tisk. str. 17–50. doi:10.1016 / B978-0-12-398397-8.00002-2. ISBN 9780123983978. PMID 22656372. Citováno 2019-11-07.

[5] Gilbert W (únor 1978). „Proč geny na kousky?“. Příroda. 271 (5645): 501. Bibcode:1978Natur.271..501G. doi:10.1038 / 271501a0. PMID 622185. S2CID 4216649.

[6] (n.d.). Citováno z https://www.differenceb Between.com/wp-content/uploads/2017/03/Difference-B Between-Transition-and-Transversion-3.png

[7] Lercher MJ, Urrutia AO, Pavlícek A, Hurst LD (říjen 2003). „Sjednocení mozaikových struktur v lidském genomu“. Lidská molekulární genetika. 12 (19): 2411–5. doi:10,1093 / hmg / ddg251. PMID 12915446.

[8] Oliver JL, Marín A (září 1996). Msgstr "Vztah mezi obsahem GC a délkou kódovací sekvence". Journal of Molecular Evolution. 43 (3): 216–23. Bibcode:1996JMolE..43..216O. doi:10.1007 / pl00006080. PMID 8703087.

[9] "ROSALIND | Glosář | Oblast kódování genů". rosalind.info. Citováno 2019-10-31.

[10] Vinogradov AE (duben 2003). „Šroubovice DNA: důležitost bohatství na GC“. Výzkum nukleových kyselin. 31 (7): 1838–44. doi:10.1093 / nar / g 296. PMC 152811. PMID 12654999.

[11] Bohlin J, Eldholm V, Pettersson JH, Brynildsrud O, Snipen L (únor 2017). „Nukleotidové složení mikrobiálních genomů naznačuje rozdílné vzorce selekce na základních a doplňkových genomech“. BMC Genomics. 18 (1): 151. doi:10.1186 / s12864-017-3543-7. PMC 5303225. PMID 28187704.

[12] Sémon M, Mouchiroud D, Duret L (únor 2005). „Vztah mezi genovou expresí a obsahem GC u savců: statistická významnost a biologická relevance“. Lidská molekulární genetika. 14 (3): 421–7. doi:10,1093 / hmg / ddi038. PMID 15590696.

[:2-13] A ^b Přehled transkripce. (n.d.). Citováno z https://www.khanacademy.org/science/biology/gene-expression-central-dogma/transcription-of-dna-into-rna/a/overview-of-transcription.

[14] Clancy, Suzanne (2008). „Translation: DNA to mRNA to Protein“. Scitable: By Nature Education.

[15] Plociam (08.08.2005), Anglicky: The structure of a mature eukaryotic mRNA. Plně zpracovaná mRNA zahrnuje 5 'čepičku, 5' UTR, kódující oblast, 3 'UTR a poly (A) ocas., vyvoláno 2019-11-19

[16] Shinohara K, Sasaki S, Minoshima M, Bando T, Sugiyama H (2006-02-13). „Alkylace templátového řetězce kódující oblasti způsobuje účinné umlčení genu“. Výzkum nukleových kyselin. 34 (4): 1189–95. doi:10.1093 / nar / gkl005. PMC 1383623. PMID 16500890.

[17] „Termín pro genovou DNA pro alkylaci genů (GO: 0006305)“. www.informatics.jax.org. Citováno 2019-10-30.

[18] Shafee T, Lowe R (2017). "Eukaryotická a prokaryotická genová struktura". WikiJournal of Medicine. 4 (1). doi:10.15347 / wjm / 2017.002.

[19] Konarska MM (1998). "Rozpoznání 5 'spojovacího místa spliceosomem". Acta Biochimica Polonica. 45 (4): 869–81. doi:10.18388 / abp.1998_4346. PMID 10397335.

[20] Jonsta247 (10.05.2013), Angličtina: Příklad tiché mutace, vyvoláno 2019-11-19

[:3-21] A ^b Yang, J. (2016, 23. března). Co jsou genetické mutace? Citováno z https://www.singerinstruments.com/resource/what-are-genetic-mutation/.

[:4-22] A ^b ^C Co je genová mutace a jak k mutacím dochází? - Genetics Home Reference - NIH. (n.d.). Citováno z https://ghr.nlm.nih.gov/primer/mutationsanddisorders/genemutation.

[23] Korektury a opravy DNA. (n.d.). Citováno z https://www.khanacademy.org/science/high-school-biology/hs-molecular-genetics/hs-discovery-and-structure-of-dna/a/dna-proofreading-and-repair.

[24] Peretó J. (2011) Wobble Hypothesis (Genetics). In: Gargaud M. a kol. (eds) Encyclopedia of Astrobiology. Springer, Berlín, Heidelberg

[:0-25] A ^b Havrilla, J. M., Pedersen, B. S., Layer, R. M. a Quinlan, A. R. (2018). Mapa omezených kódujících oblastí v lidském genomu. Genetika přírody, 88–95. doi: 10,1101 / 220814

[26] Furuno M, Kasukawa T, Saito R, Adachi J, Suzuki H, Baldarelli R a kol. (Červen 2003). "Anotace CDS v plné délce cDNA sekvence". Výzkum genomu. Cold Spring Harbor Laboratory Press. 13 (6B): 1478–1487. doi:10,1101 / gr. 1060303. PMC 403693. PMID 12819146.

[27] Rogozin IB, Spiridonov AN, Sorokin AV, Wolf YI, Jordan IK, Tatusov RL, Koonin EV (květen 2002). „Purifikace a směrová selekce v překrývajících se prokaryotických genech“. Trendy v genetice. 18 (5): 228–32. doi:10.1016 / S0168-9525 (02) 02649-5. PMID 12047938.

[28] Chirico N, Vianelli A, Belshaw R (prosinec 2010). „Proč se geny překrývají ve virech“. Řízení. Biologické vědy. 277 (1701): 3809–17. doi:10.1098 / rspb.2010.1052. PMC 2992710. PMID 20610432.

[29] Firth AE, Brown CM (únor 2005). "Detekce překrývajících se kódovacích sekvencí s párovým zarovnáním". Bioinformatika. 21 (3): 282–92. doi:10.1093 / bioinformatika / bti007. PMID 15347574.

[30] Schlub TE, Buchmann JP, Holmes EC (říjen 2018). Malik H (ed.). „Jednoduchá metoda k detekci překrývajících se genů virů pomocí sekvencí jednoho genomu“. Molekulární biologie a evoluce. 35 (10): 2572–2581. doi:10.1093 / molbev / msy155. PMC 6188560. PMID 30099499.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]