Překrývající se gen - Overlapping gene
An překrývající se gen (nebo OLG)[1] je gen jehož vyjádřitelný nukleotidová sekvence částečně se překrývá s expresivní nukleotidovou sekvencí jiného genu.[2] Tímto způsobem může nukleotidová sekvence přispívat k funkci jednoho nebo více genové produkty. Přetisk Výraz "překrytí" označuje typ překrytí, ve kterém je celá nebo část sekvence jednoho genu čtena střídavě čtecí rámec z jiného genu současně místo. Předpokládá se přetisk jako mechanismus pro de novo vznik nových genů ze stávajících sekvencí, ať už starších genů, nebo dříve nekódování oblasti genomu.[3] Přetištěné geny jsou obzvláště společné rysy genomický organizace virů, pravděpodobně výrazně zvýší počet potenciálních exprimovatelných genů z malé sady virové genetické informace.
Klasifikace

Geny se mohou překrývat různými způsoby a lze je klasifikovat podle jejich vzájemných poloh.[2][5][6][7][8]
- Jednosměrný nebo tandem překrytí: 3' konec jednoho genu se překrývá s 5' konec jiného genu na stejném řetězci. Toto uspořádání může být symbolizováno notací → →, kde šipky označují čtecí rámec od začátku do konce.
- Konvergentní nebo konec překrytí: 3' konce obou genů se překrývají na protilehlých vláknech. To lze zapsat jako → ←.
- Odlišné nebo zadní část překrytí: 5' konce obou genů se překrývají na protilehlých vláknech. To lze zapsat jako ← →.
Překrývající se geny lze také klasifikovat podle fáze, které popisují jejich příbuzného čtecí rámce:[2][5][6][7][8]
- Překrývání ve fázi nastane, když sdílené sekvence používají stejný čtecí rámec. Toto se také nazývá „fáze 0“. Jednosměrné geny s překrytím fáze 0 nejsou považovány za odlišné geny, ale spíše za alternativní startovací stránky stejného genu.
- Překrývání mimo fázi nastane, když sdílené sekvence používají různé čtecí rámce. K tomu může dojít ve „fázi 1“ nebo „fázi 2“ v závislosti na tom, zda jsou čtecí rámce posunuty o 1 nebo 2 nukleotidy. Protože a kodon je dlouhý tři nukleotidy, posunutím tří nukleotidů je rámec ve fázi 0.
Vývoj
Překrývající se geny jsou zvláště běžné v rychle se vyvíjejících genomech, jako jsou například genomy viry, bakterie, a mitochondrie. Mohou pocházet třemi způsoby:[9]
- Rozšířením existujícího otevřený čtecí rámec (ORF) po proudu do souvislého genu v důsledku ztráty a stop kodon;
- Rozšířením stávajícího ORF proti proudu do souvislého genu v důsledku ztráty iniciační kodon;
- Generováním nového ORF v rámci existujícího kvůli a bodová mutace.
Může poskytnout použití stejné nukleotidové sekvence pro kódování více genů evoluční výhoda díky snížení v genom velikosti a vzhledem k příležitosti pro transkripční a překladový společná regulace překrývajících se genů.[6][10][11][12] Překrývání genů zavádí nová evoluční omezení sekvencí oblastí překrytí.[8][13]
Počátky nových genů

V roce 1977 Pierre-Paul Grassé navrhl, že jeden z genů v páru mohl vzniknout de novo mutacemi k zavedení nových ORF do alternativních čtecích rámců; popsal mechanismus jako přetisk.[15]:231 Později to bylo doloženo Susumu Ohno, kteří identifikovali kandidátský gen, který mohl vzniknout tímto mechanismem.[16] Některé geny de novo vznikající tímto způsobem se nemusí překrývat, ale subfunkcionalizovat Následující genová duplikace[3], což přispívá k prevalenci osiřelé geny. Který člen překrývajícího se páru genů je mladší, lze identifikovat bioinformaticky buď omezenější fylogenetické distribuce, nebo méně optimalizovaná využití kodonů.[14][17][18] Mladší členové páru mají tendenci mít vyšší vnitřní strukturální porucha než starší členové, ale starší členové jsou také více neuspořádaní než jiné proteiny, pravděpodobně jako způsob zmírnění zvýšených evolučních omezení způsobených překrýváním.[17] Překrývání pravděpodobně vznikají u proteinů, které již mají vysokou poruchu.[17]
Taxonomické rozdělení

Překrývající se geny se vyskytují u všech oblasti života, i když s různými frekvencemi. Jsou obzvláště běžné v virový genomy.
Viry

Existence překrývajících se genů byla poprvé identifikována u virů; první genom DNA, který kdy byl sekvenován, bakteriofág 17X174, obsahovalo několik příkladů.[19] Dalším příkladem OLG je objev v říjnu 2020 ORF3d gen nalezený v Virus covid19 genom to může mít vliv na Pandemie SARS-CoV-2.[1][21] Překrývající se geny jsou zvláště běžné u virový genomy.[14] Některé studie připisují toto pozorování selektivní tlak směrem k malým velikostem genomu zprostředkovaným fyzickými omezeními zabalení genomu do a virová kapsida, zejména jeden z icosahedral geometrie.[22] Jiné studie však tento závěr zpochybňují a tvrdí, že distribuce přesahů ve virových genomech pravděpodobněji odráží přetisk jako evoluční původ překrývajících se virových genů.[23] Přetisk je běžným zdrojem de novo geny ve virech.[18]
Studie přetištěných virových genů naznačují, že jejich proteinové produkty mají tendenci být doplňkovými proteiny, kterými nejsou nezbytný k šíření virů, ale přispívají k patogenita. Přetištěné proteiny mají často neobvyklé aminokyselina distribuce a vysoké úrovně vnitřní porucha.[24] V některých případech mají přetištěné proteiny dobře definované, ale nové trojrozměrné struktury;[25] jedním příkladem je Potlačení potlačování RNA p19 nalezen v Tombusviry, který má jak román proteinový záhyb a nový způsob vazby v rozpoznávání siRNA.[18][20][26]
Prokaryotes
Odhady překrývání genů v roce 2006 bakteriální genomy obvykle zjistí, že přibližně jedna třetina bakteriálních genů se překrývá, i když obvykle jen o pár párů bází.[6][27][28] Většina studií překrývání v bakteriálních genomech nalézá důkazy, že překrývání plní funkci genová regulace umožňující překrývající se geny transkripčně a překladově společně regulované.[6][12] V prokaryotických genomech jsou nejběžnější jednosměrné přesahy, pravděpodobně kvůli tendenci sousedních prokaryotických genů sdílet orientaci.[6][8][5] Mezi jednosměrnými překryvy se častěji čte dlouhé překrytí s offsetem jednoho nukleotidu v čtecím rámci (tj. Fáze 1) a krátké překrývání se častěji čte ve fázi 2.[28][29] Dlouhá přesahy větší než 60 základní páry jsou častější pro konvergentní geny; předpokládané dlouhé překryvy však mají velmi vysokou míru chybná poznámka.[30] Robustně ověřené příklady dlouhých přesahů v bakteriálních genomech jsou vzácné; v dobře studoval modelový organismus Escherichia coli, pouze čtyři páry genů jsou dobře validovány jako ty, které mají dlouhé, přetištěné přesahy.[31]
Eukaryoty
Ve srovnání s prokaryotickými genomy jsou eukaryotické genomy často špatně anotovány, a proto je identifikace skutečných přesahů relativně náročná.[18] Byly však zdokumentovány příklady validovaných přesahů genů u různých eukaryotických organismů, včetně savců, jako jsou myši a lidé.[32][33][34][35] Eukaryota se liší od prokaryot v distribuci typů překrývání: zatímco jednosměrné (tj. Stejné vlákno) přesahy jsou nejběžnější u prokaryot, protilehlé nebo antiparalelní vláknové přesahy jsou častější u eukaryot. Mezi přesahy protilehlých řetězců je nejběžnější konvergentní orientace.[33] Většina studií překrytí eukaryotických genů zjistila, že překrývající se geny podléhají genomové reorganizaci iu blízce příbuzných druhů, a proto přítomnost překrytí není vždy dobře zachována.[34][36] Překrývání se staršími nebo méně taxonomicky omezenými geny je také běžným rysem genů, které pravděpodobně vznikly de novo v dané eukaryotické linii.[34][37][38]
Reference
- ^ A b Nelson, Chase W; et al. (1. října 2020). „Dynamicky se rozvíjející nový překrývající se gen jako faktor pandemie SARS-CoV-2“. eLife. 9. doi:10,7554 / eLife.59633. PMC 7655111. PMID 33001029. Citováno 11. listopadu 2020.
- ^ A b C Y. Fukuda, M. Tomita a T. Washio (1999). "Srovnávací studie překrývajících se genů v genomech Mycoplasma genitalium a Mycoplasma pneumoniae". Nucleic Acids Res. 27 (8): 1847–1853. doi:10.1093 / nar / 27.8.1847. PMC 148392. PMID 10101192.
- ^ A b Keese, PK; Gibbs, A (15. října 1992). „Počátky genů:„ velký třesk “nebo kontinuální tvorba?“. Sborník Národní akademie věd Spojených států amerických. 89 (20): 9489–93. Bibcode:1992PNAS ... 89,9489 tis. doi:10.1073 / pnas.89.20.9489. PMC 50157. PMID 1329098.
- ^ Anderson S, Bankier AT, Barrell BG, de Bruijn MH, Coulson AR, Drouin J, Eperon IC, Nierlich DP, Roe BA, Sanger F, Schreier PH, Smith AJ, Staden R, Young IG (duben 1981). "Pořadí a organizace lidského mitochondriálního genomu". Příroda. 290 (5806): 457–465. Bibcode:1981 Natur.290..457A. doi:10.1038 / 290457a0. PMID 7219534. S2CID 4355527.
- ^ A b C Fukuda, Yoko; Nakayama, Yoichi; Tomita, Masaru (prosinec 2003). "O dynamice překrývajících se genů v bakteriálních genomech". Gen. 323: 181–187. doi:10.1016 / j.gene.2003.09.021. PMID 14659892.
- ^ A b C d E F Johnson Z, Chisholm S (2004). „Vlastnosti překrývajících se genů jsou zachovány napříč mikrobiálními genomy“. Genome Res. 14 (11): 2268–72. doi:10,1101 / gr. 2433104. PMC 525685. PMID 15520290.
- ^ A b Normark S .; Bergstrom S .; Edlund T .; Grundstrom T .; Jaurin B .; Lindberg F.P .; Olsson O. (1983). "Překrývající se geny". Výroční přehled genetiky. 17: 499–525. doi:10.1146 / annurev.ge.17.120183.002435. PMID 6198955.
- ^ A b C d Rogozin, Igor B .; Spiridonov, Alexey N .; Sorokin, Alexander V .; Vlk, Jurij I.; Jordan, I.King; Tatusov, Roman L .; Koonin, Eugene V. (květen 2002). "Čištění a směrová selekce v překrývajících se prokaryotických genech". Trendy v genetice. 18 (5): 228–232. doi:10.1016 / S0168-9525 (02) 02649-5. PMID 12047938.
- ^ Krakauer, David C. (červen 2000). "Stabilita a vývoj překrývajících se genů". Vývoj. 54 (3): 731–739. doi:10.1111 / j.0014-3820.2000.tb00075.x. PMID 10937248. S2CID 8818055.
- ^ Delaye, Luis; DeLuna, Alexander; Lazcano, Antonio; Becerra, Arturo (2008). „Původ nového genu přetiskem v Escherichia coli“. BMC Evoluční biologie. 8 (1): 31. doi:10.1186/1471-2148-8-31. PMC 2268670. PMID 18226237.
- ^ Saha, Deeya; Podder, Soumita; Panda, Arup; Ghosh, Tapash Chandra (květen 2016). "Překrývající se geny: Významný genomický korelační poměr prokaryotického růstu". Gen. 582 (2): 143–147. doi:10.1016 / j.gene.2016.02.00.002. PMID 26853049.
- ^ A b Luo, Yingqin; Battistuzzi, Fabia; Lin, Kui; Gibas, Cynthia (29. listopadu 2013). „Evoluční dynamika překrývajících se genů u Salmonella“. PLOS ONE. 8 (11): e81016. doi:10.1371 / journal.pone.0081016. PMC 3843671. PMID 24312259.
- ^ Wei, X .; Zhang, J. (31. prosince 2014). „Jednoduchá metoda pro odhad síly přirozeného výběru u překrývajících se genů“. Biologie genomu a evoluce. 7 (1): 381–390. doi:10.1093 / gbe / evu294. PMC 4316641. PMID 25552532.
- ^ A b C Pavesi, Angelo; Magiorkinis, Gkikas; Karlin, David G .; Wilke, Claus O. (15. srpna 2013). „Virové proteiny vzniklé de novo přetiskem lze identifikovat podle použití kodonu: aplikace do„ genové školky “deltaretrovirů“. PLOS výpočetní biologie. 9 (8): e1003162. doi:10.1371 / journal.pcbi.1003162. PMC 3744397. PMID 23966842.
- ^ Grassé, Pierre-Paul (1977). Evoluce živých organismů: Důkazy pro novou teorii transformace. Akademický tisk. ISBN 9781483274096.
- ^ Ohno, S (duben 1984). „Zrození jedinečného enzymu z alternativního čtecího rámce již existující interně se opakující kódovací sekvence“. Sborník Národní akademie věd Spojených států amerických. 81 (8): 2421–5. Bibcode:1984PNAS ... 81.2421O. doi:10.1073 / pnas.81.8.2421. PMC 345072. PMID 6585807.
- ^ A b C Willis, Sara; Masel, Joanna (19. července 2018). „Narození genů přispívá ke strukturálním poruchám kódovaným překrývajícími se geny“. Genetika. 210 (1): 303–313. doi:10.1534 / genetika.118.301249. PMC 6116962. PMID 30026186.
- ^ A b C d Sabath, N .; Wagner, A .; Karlin, D. (19. července 2012). „Vývoj virových proteinů vznikl de novo přetiskem“. Molekulární biologie a evoluce. 29 (12): 3767–3780. doi:10,1093 / molbev / mss179. PMC 3494269. PMID 22821011.
- ^ A b Sanger, F .; Air, G. M .; Barrell, B. G .; Brown, N.L .; Coulson, A. R .; Fiddes, J. C .; Hutchison, C. A .; Slocombe, P. M .; Smith, M. (1977). "Nukleotidová sekvence bakteriofága ΦX174 DNA". Příroda. 265 (5596): 687–95. Bibcode:1977Natur.265..687S. doi:10.1038 / 265687a0. PMID 870828. S2CID 4206886.
- ^ A b Ye, Keqiong; Malinina, Lucy; Patel, Dinshaw J. (3. prosince 2003). "Rozpoznání malé interferující RNA virovým supresorem umlčení RNA". Příroda. 426 (6968): 874–878. Bibcode:2003 Natur.426..874Y. doi:10.1038 / nature02213. PMC 4694583. PMID 14661029.
- ^ Dockrill, Peter (11. listopadu 2020). „Vědci právě našli záhadně skrytý„ gen v genu “v SARS-CoV-2“. ScienceAlert. Citováno 11. listopadu 2020.
- ^ Chirico, N .; Vianelli, A .; Belshaw, R. (7. července 2010). „Proč se geny překrývají ve virech“. Sborník Královské společnosti B: Biologické vědy. 277 (1701): 3809–3817. doi:10.1098 / rspb.2010.1052. PMC 2992710. PMID 20610432.
- ^ Brandes, Nadav; Linial, Michal (21. května 2016). „Překrývání genů a omezení velikosti ve virovém světě“. Biology Direct. 11 (1): 26. doi:10.1186 / s13062-016-0128-3. PMC 4875738. PMID 27209091.
- ^ Rancurel, C .; Khosravi, M .; Dunker, A. K .; Romero, P. R .; Karlin, D. (29. července 2009). „Překrývající se geny produkují proteiny s neobvyklými vlastnostmi sekvence a nabízejí pohled na tvorbu proteinů de Novo“. Journal of Virology. 83 (20): 10719–10736. doi:10.1128 / JVI.00595-09. PMC 2753099. PMID 19640978.
- ^ Abroi, Aare (1. prosince 2015). "Pohled na vztah virosféra - hostitel založený na proteinové doméně". Biochimie. 119: 231–243. doi:10.1016 / j.biochi.2015.08.008. PMID 26296474.
- ^ Vargason, Jeffrey M; Szittya, György; Burgyán, József; Hall, Traci M. Tanaka (prosinec 2003). "Selektivní rozpoznávání velikosti siRNA pomocí potlačovače utlumení RNA". Buňka. 115 (7): 799–811. doi:10.1016 / S0092-8674 (03) 00984-X. PMID 14697199. S2CID 12993441.
- ^ Huvet, Maxime; Stumpf, Michael PH (1. ledna 2014). „Překrývající se geny: okno evoluční schopnosti genů“. BMC Genomics. 15 (1): 721. doi:10.1186/1471-2164-15-721. ISSN 1471-2164. PMC 4161906. PMID 25159814.
- ^ A b Cock, Peter J. A .; Whitworth, David E. (19. března 2007). „Evoluce přesahů genů: relativní zkreslení čtecího rámce v genech prokaryotických dvousložkových systémů“. Journal of Molecular Evolution. 64 (4): 457–462. doi:10.1007 / s00239-006-0180-1. PMID 17479344. S2CID 21612308.
- ^ Fonseca, M. M .; Harris, D. J .; Posada, D. (5. listopadu 2013). "Původ a délka distribuce jednosměrných prokaryotických překrývajících se genů". G3: Geny, genomy, genetika. 4 (1): 19–27. doi:10,1534 / g3,113,005652. PMC 3887535. PMID 24192837.
- ^ Pallejà, Albert; Harrington, Eoghan D; Bork, Peer (2008). „Překrývání velkých genů v prokaryotických genomech: výsledek funkčních omezení nebo nesprávných předpovědí?“. BMC Genomics. 9 (1): 335. doi:10.1186/1471-2164-9-335. PMC 2478687. PMID 18627618.
- ^ Fellner, Lea; Simon, Svenja; Scherling, Christian; Witting, Michael; Schober, Steffen; Polte, Christine; Schmitt-Kopplin, Philippe; Keim, Daniel A .; Scherer, Siegfried; Neuhaus, Klaus (18. prosince 2015). „Důkazy o nedávném původu bakteriálního proteinu kódujícího překrývající se sirotčí gen evolučním přetiskem“. BMC Evoluční biologie. 15 (1): 283. doi:10.1186 / s12862-015-0558-z. PMC 4683798. PMID 26677845.
- ^ McLysaght, Aoife; Guerzoni, Daniele (31. srpna 2015). „Nové geny z nekódující sekvence: role genů kódujících proteiny de novo v eukaryotické evoluční inovaci“. Filozofické transakce Královské společnosti B: Biologické vědy. 370 (1678): 20140332. doi:10.1098 / rstb.2014.0332. PMC 4571571. PMID 26323763.
- ^ A b C. Sanna, W. Li a L. Zhang (2008). „Překrývající se geny v lidských a myších genomech“. BMC Genomics. 9 (169): 169. doi:10.1186/1471-2164-9-169. PMC 2335118. PMID 18410680.
- ^ A b C Makałowska, Izabela; Lin, Chiao-Feng; Hernandez, Krisitina (2007). „Narození a smrt přesahů genů u obratlovců“. BMC Evoluční biologie. 7 (1): 193. doi:10.1186/1471-2148-7-193. PMC 2151771. PMID 17939861.
- ^ Veeramachaneni, V. (1. února 2004). „Savčí překrývající se geny: srovnávací perspektiva“. Výzkum genomu. 14 (2): 280–286. doi:10,1101 / gr. 1590904. PMC 327103. PMID 14762064.
- ^ Behura, Susanta K; Severson, David W (2013). „Překrývající se geny Aedes aegypti: evoluční důsledky srovnání s ortology Anopheles gambiae a jiného hmyzu“. BMC Evoluční biologie. 13 (1): 124. doi:10.1186/1471-2148-13-124. PMC 3689595. PMID 23777277.
- ^ Murphy, Daniel N .; McLysaght, Aoife; Carmel, Liran (21. listopadu 2012). „De Novo původ proteinů kódujících geny u myší hlodavců“. PLOS ONE. 7 (11): e48650. Bibcode:2012PLoSO ... 748650M. doi:10.1371 / journal.pone.0048650. PMC 3504067. PMID 23185269.
- ^ Knowles, D. G .; McLysaght, A. (2. září 2009). „Nedávný de novo původ genů kódujících lidské proteiny“. Výzkum genomu. 19 (10): 1752–1759. doi:10.1101 / gr.095026.109. PMC 2765279. PMID 19726446.