Narození genu de novo - De novo gene birth


De novo genové narození je proces, kterým nové geny se vyvíjejí ze sekvencí DNA, které byly předky negenické.[3] De novo geny představují podmnožinu nových genů a mohou kódovat proteiny nebo místo toho působit jako geny RNA.[4] Procesy, které řídí de novo genové narození nejsou dobře známy, ačkoli existuje několik modelů, které popisují možné mechanismy, kterými de novo může dojít k narození genu.
Ačkoli de novo genové zrození mohlo nastat kdykoli v evoluční historii organismu, ve starověku de novo události genového narození je obtížné odhalit. Většina studií z de novo Dosavadní geny se tak zaměřily na mladé geny, obvykle taxonomicky omezené geny (TRG), které jsou přítomny v jediném druhu nebo linii, včetně tzv. osiřelé geny, definované jako geny, které postrádají jakýkoli identifikovatelný homolog. Je však důležité si uvědomit, že ne všechny geny pro vzácná onemocnění vznikají de novo, a místo toho se mohou objevit prostřednictvím docela dobře charakterizovaných mechanismů, jako je genová duplikace (včetně retropozice) nebo horizontální přenos genů následuje divergence sekvence nebo genové štěpení / fúze.[5][6]
Ačkoli de novo narození genu bylo kdysi považováno za vysoce nepravděpodobný výskyt,[7] nyní bylo popsáno několik jednoznačných příkladů,[8] a někteří vědci o tom spekulují de novo genové zrození by mohlo hrát hlavní roli v evolučních inovacích.[9][10]
Dějiny
Již ve 30. letech J. B. S. Haldane a další navrhli, že kopie existujících genů mohou vést k novým genům s novými funkcemi.[6] V roce 1970 Susumu Ohno zveřejnil klíčový text Evoluce Genová duplikace.[11] Po nějakou dobu následoval konsenzuální názor, že prakticky všechny geny byly odvozeny z genů předků,[12] s François Jacob skvěle poznamenal v eseji z roku 1977, že „pravděpodobnost, že se objeví funkční protein de novo náhodným spojením aminokyselin je prakticky nulová. “[7]
Ve stejném roce však Pierre-Paul Grassé vytvořil termín „přetisk“, aby popsal vznik genů prostřednictvím vyjádření alternativních otevřené čtecí rámce (ORF) překrývající již existující geny.[13] Tyto nové ORF mohou být mimo rámec nebo antisense k již existujícímu genu. Mohou být také v rámci existujícího ORF, vytvářející zkrácenou verzi původního genu, nebo představovat 3 'rozšíření existujícího ORF do blízkého ORF. První dva typy přetisku lze považovat za konkrétní podtyp de novo genové narození; ačkoli se překrývá s dříve kódující oblastí genomu, primární aminokyselinová sekvence nového proteinu je zcela nová a je odvozena z rámce, který předtím neobsahoval gen. První příklady tohoto jevu v bakteriofágy byly hlášeny v sérii studií od roku 1976 do roku 1978,[14][15][16] a od té doby bylo identifikováno mnoho dalších příkladů u virů, bakterií a několika eukaryotických druhů.[17][18][19][20][21][22]
Fenomén exonizace také představuje zvláštní případ de novo genové zrození, při kterém například často se opakující intronové sekvence získávají místa sestřihu mutací, což vede k de novo exony. Toto bylo poprvé popsáno v roce 1994 v kontextu Alu sekvence nalezené v kódujících oblastech mRNA primátů.[23] Zajímavé je, že takové de novo exony se často vyskytují v menších variantách sestřihu, což může umožnit evoluční „testování“ nových sekvencí při zachování funkce hlavní varianty sestřihu.[24]
Někteří si přesto mysleli, že většina nebo všechny eukaryotické proteiny byly konstruovány z omezené zásoby exonů „spouštěcího typu“.[25] Na základě v té době dostupných sekvenčních dat odhadl přehled z roku 1991 počet jedinečných eukaryotických exonů předků na <60 000,[25] zatímco v roce 1992 byl publikován článek odhadující, že drtivá většina proteinů nepatří k více než 1000 rodinám.[26] Přibližně ve stejné době však došlo k sekvenci chromozomu III začínajících kvasinek Saccharomyces cerevisiae byl vydán,[27] představující první sekvenci celého chromozomu z jakéhokoli eukaryotického organismu. Sekvenování celého kvasinkového jaderného genomu bylo poté dokončeno počátkem roku 1996 prostřednictvím masivního společného mezinárodního úsilí.[28] Ve své recenzi projektu kvasinkového genomu Bernard Dujon poznamenal, že neočekávané množství genů bez jakýchkoli známých homologů bylo možná nejpozoruhodnějším nálezem celého projektu.[28]
V letech 2006 a 2007 poskytla řada studií pravděpodobně první zdokumentované příklady de novo genové narození, které nezahrnovalo přetisk.[29][30][31] Analýza transkriptomů doplňkové žlázy Drosophila yakuba a Drosophila erecta nejprve identifikoval 20 domnělých genů omezených na počet řádků, u nichž se zdálo nepravděpodobné, že by byly výsledkem duplikace genů.[31] Levine a kolegové poté potvrdili de novo vznik pěti kandidátských genů specifických pro Drosophila melanogaster a / nebo blízce příbuzní Drosophila simulans důsledným potrubím, které kombinovalo bioinformatické a experimentální techniky.[30] Tyto geny byly identifikovány kombinací VÝBUCH přístupy založené na vyhledávání a syntéze (viz níže), které prokázaly nepřítomnost genů u blízce příbuzných druhů.[30]
Navzdory jejich nedávnému vývoji se všech pět genů jeví jako fixní D. melanogastera přítomnost paralogních nekódujících sekvencí, které chybí u blízkých příbuzných, naznačuje, že čtyři z pěti genů mohly vzniknout nedávnou intrachromozomální duplikací.[30] Je zajímavé, že všech pět bylo přednostně vyjádřeno ve varlatech mužských mušek[30] (viz. níže). Tři geny, pro které existují úplné ORF v obou D. melanogaster a D. simulans prokázaly rychlý vývoj a pozitivní výběr.[30] To je v souladu s nedávným výskytem těchto genů, protože je typické, že mladé nové geny procházejí adaptivní evolucí,[32][33][34] ale také ztěžuje úplnou jistotu, že kandidáti kódují skutečně funkční produkty. Následná studie používající metody podobné Levine et al. a vyjádřená značka sekvence knihovna odvozená z D. yakuba varlata identifikovala sedm genů odvozených od šesti jedinečných de novo události genového narození v D. yakuba a / nebo blízcí příbuzní D. erecta.[29]
Tři z těchto genů jsou extrémně krátké (<90 bp), což naznačuje, že se může jednat o RNA geny,[29] ačkoli bylo také zdokumentováno několik příkladů velmi krátkých funkčních peptidů.[35][36][37][38] Přibližně ve stejné době jako tyto studie v Drosophila Bylo publikováno homologické vyhledávání genomů ze všech domén života, včetně 18 fungálních genomů, identifikovaných 132 proteinů specifických pro houby, z nichž 99 bylo jedinečných pro S. cerevisiae.[39]
Od těchto počátečních studií mnoho skupin identifikovalo konkrétní případy de novo události genového narození v různých organismech.[40] The BSC4 gen v S. cerevisiae, identifikovaný v roce 2008, vykazuje důkazy purifikační selekce, je exprimován jak na úrovni mRNA, tak na úrovni proteinu, a když je odstraněn, je synteticky letální s dalšími dvěma kvasinkovými geny, které všechny naznačují funkční roli pro BSC4 genový produkt.[41] Historicky jeden argument proti pojmu rozšířený de novo narození genu je vyvinutá složitost skládání proteinů. Zajímavé je, že se později ukázalo, že Bsc4 přijímá částečně složený stav, který kombinuje vlastnosti nativního a nepřirozeného skládání proteinu.[42] Dalším dobře charakterizovaným příkladem v kvasnicích je MDF1, který potlačuje účinnost páření a podporuje vegetativní růst a je složitě regulován konzervovaným antisense ORF.[43][44] V rostlinách první de novo Funkčně charakterizovaný gen byl QQS, an Arabidopsis thaliana gen identifikovaný v roce 2009, který reguluje metabolismus uhlíku a dusíku.[45] První funkčně charakterizovaný de novo gen identifikovaný u myší, nekódující gen RNA, byl také popsán v roce 2009.[46] U primátů odhadovala informativní analýza z roku 2008, že bylo vytvořeno 15/270 osiřelých genů primátů de novo.[47] Zpráva z roku 2009 identifikovala první tři de novo lidské geny, z nichž jeden je terapeutickým cílem při chronické lymfocytární leukémii.[48] Od této doby řada studií na úrovni genomu identifikovala velké množství osiřelých genů v mnoha organismech, i když do jaké míry vznikly de novoa míra, do jaké je lze považovat za funkční, zůstávají diskutovány.
Identifikace
Identifikace de novo vznikající sekvence
K systematické identifikaci nových genů existují dva hlavní přístupy: genomická fylostratigrafie[49] a synteny metody založené na metodách.[50] Oba přístupy jsou široce používány, jednotlivě nebo doplňkově.
Genomická fylostratigrafie
Genomická fylostratigrafie zahrnuje zkoumání každého genu v ohniskových druzích a odvození přítomnosti nebo nepřítomnosti homologů předků pomocí použití VÝBUCH algoritmy zarovnání sekvence[51] nebo související nástroje. Každému genu v ohniskových druzích lze přiřadit „věk“ (neboli „úroveň ochrany“ nebo „genomové phylostratum“), který je založen na předem stanovené fylogenezi, přičemž věk odpovídá nejvíce vzdáleně příbuzným druhům, ve kterých je detekován homolog.[49] Pokud gen postrádá detekovatelný homolog mimo svůj vlastní genom nebo blízké příbuzné, říká se, že jde o nový, taxonomicky omezený nebo osiřelý gen, i když takové označení samozřejmě závisí na skupině druhů, které jsou vyhledávány.
Fylogenetické stromy jsou omezeny množinou blízce příbuzných genomů, které jsou k dispozici, a výsledky jsou závislé na kritériích vyhledávání BLAST.[52] Protože je založen na podobnosti sekvencí, je pro fylostratigrafii často obtížné určit, zda se objevil nový gen de novo nebo se odchýlil od genu předků k nepoznání, například po události duplikace. Na to poukázala studie, která simulovala vývoj genů stejného věku a zjistila, že vzdálené ortology mohou být pro nejrychleji se vyvíjející geny nezjistitelné.[53] Při účtování změn v rychlosti evoluce k částem mladých genů, které získávají vybrané funkce, byl při přiřazování věků genů v simulovaných datech mnohem přesnější fylostratigrafický přístup.[54] Následující dvojice studií využívajících simulovanou evoluci zjistila, že fylostratigrafie nedokázala detekovat ortolog u nejvzdálenějších druhů u 13,9% D. melanogaster geny a 11,4% S. cerevisiae geny.[55][56] Podobně byl v simulovaných datech zjištěn falešný vztah mezi věkem genu a jeho pravděpodobností, že bude zapojen do procesu onemocnění.[56] Opětovná analýza studií, která používala fylostratigrafii u kvasinek, ovocných mušek a lidí, však zjistila, že i když se vezme v úvahu taková chybovost a vyloučí se z analýz obtížně stratifikovatelné geny, kvalitativní závěry nebyly u všech tří studií ovlivněny.[57] Dopad fylostratigrafického zkreslení na studie zkoumající různé rysy de novo genů (viz níže) zůstává diskutován.
Chcete-li zvýšit detekovatelnost předků homologů, citlivá sekvenční vyhledávání podobnosti, jako např CS-BLAST a Skrytý Markovův model (HMM) vyhledávání na základě, lze také použít samostatně nebo v kombinaci s analýzou fylostratigrafie na bázi BLAST k identifikaci de novo geny. Technika PSI-BLAST[58] je zvláště užitečný pro detekci starověkých homologů. Srovnávací studie zjistila, že některé z těchto „profilových“ analýz byly přesnější než běžné párové nástroje.[59] Dopad falešně pozitivních výsledků, když jsou geny nesprávně odvozeny tak, že mají rodový homolog, když jsou ve skutečnosti nové, na naše chápání de novo genové narození ještě nebylo konkrétně hodnoceno.
Je důležité oddělit technické obtíže spojené s detekcí nejstaršího předka genu a odhady toho, jak starý je gen (konečný cíl fylostratigrafie), od problémů spojených s odvozením mechanismů, kterými se gen vyvinul.[52] Všichni se mohli vyvinout mladé i rodové geny de novo, nebo prostřednictvím jiných mechanismů. Současný zvolený přístup k určení, zda se gen objevil de novo je synteny a lze jej obecně aplikovat pouze na mladé geny.[60]
Synteny založené přístupy
Přístupy založené na analýze syntetických sekvencí v outgroups - blocích sekvence, ve kterých bylo zachováno pořadí a relativní umístění znaků - umožňují identifikaci negenických předků kandidátů de novo geny.[10][52] Syntenická zarovnání jsou ukotvena krátkými konzervovanými „značkami“. Geny jsou nejběžnějším markerem při definování syntenických bloků, i když se také používají k-mery a exony.[61][50] Za předpokladu, že lze získat vysoce kvalitní syntenické vyrovnání, potvrzení, že syntenické oblasti chybí kódovací potenciál u outgroup druhů, umožňuje de novo původu s větší jistotou.[52] Nejsilnější možný důkaz pro de novo vznikem je odvození specifické mutace (mutací), která vytvořila kódovací potenciál, obvykle prostřednictvím analýzy mikrosyntenických oblastí blízce příbuzných druhů.
Jednou výzvou při aplikaci metod založených na syntéze je skutečnost, že syntézu lze obtížně detekovat v delších časových lhůtách. Za tímto účelem byly vyzkoušeny různé techniky, jako je použití exonů seskupených bez ohledu na jejich konkrétní pořadí k definování syntenických bloků[50] nebo algoritmy, které používají dobře konzervované genomové oblasti k rozšíření mikrosyntenických bloků.[62] Existují také potíže spojené s aplikací přístupů založených na syntéze na genomové sestavy, které jsou fragmentované[63] nebo v liniích s vysokou mírou chromozomálních přesmyků, jak je to u hmyzu běžné.[64] Přestože přístupy založené na syntenii mají v přírodě obvykle nižší propustnost, nyní se aplikují na průzkumy genomu de novo geny[47][48][65][66][67][68][69][70] a představují slibnou oblast vývoje algoritmů pro datování genového narození. Někteří použili přístupy založené na syntéze v kombinaci s vyhledáváním podobnosti ve snaze vyvinout standardizované a přísné kanály[60] které lze použít na jakoukoli skupinu genomů ve snaze řešit nesrovnalosti v různých seznamech de novo generované geny (viz níže).
Stanovení stavu
I když byl evoluční původ určité sekvence výpočetně důsledně stanoven, je důležité si uvědomit, že neexistuje shoda ohledně toho, co představuje skutečnou de novo událost genového narození. Jedním z důvodů je nedostatečná shoda v tom, zda celá nově genová sekvence musí být genového původu či nikoli. S ohledem na kódování proteinů de novo genů, bylo navrženo, aby de novo geny byly rozděleny do podtypů odpovídajících podílu příslušného ORF, který byl odvozen z dříve nekódující sekvence.[52] Dále pro de novo Pokud dojde k narození genu, příslušná sekvence se nemusela jen objevit de novo ale ve skutečnosti to musí být gen. V souladu s tím objev de novo genové narození také vedlo k pochybnostem o tom, co tvoří gen, přičemž některé modely zaváděly přísnou dichotomii mezi genovými a negenickými sekvencemi a jiné navrhly plynulejší kontinuum (viz níže). Všechny definice genů jsou spojeny s pojmem funkce, protože se obecně shoduje, že pravý gen by měl kódovat funkční produkt, ať už je to RNA nebo protein. Existují však různé pohledy na to, co představuje funkci, částečně v závislosti na tom, zda je daná sekvence hodnocena pomocí genetických, biochemických nebo evolučních přístupů.[52][71][72][73]
Obecně se uznává, že skutečný de novo gen je exprimován alespoň v některých souvislostech,[5] umožňující provozování výběru a mnoho studií používá při definování jako výraz kritéria zařazení výraz de novo geny. Exprese sekvencí na úrovni mRNA může být potvrzena individuálně běžnými technikami, jako je kvantitativní PCR, nebo globálně prostřednictvím modernějších technik, jako je Sekvenování RNA (RNA-seq). Podobně lze expresi na úrovni proteinu určit s vysokou spolehlivostí pro jednotlivé proteiny pomocí technik, jako je hmotnostní spektrometrie nebo western blot, zatímco profilování ribozomu (Ribo-seq) poskytuje globální průzkum překladu v daném vzorku. V ideálním případě potvrdit, že dotyčný gen vznikl de novo, byla by také prokázána nedostatečná exprese syntenické oblasti outgroup druhů.[74]
Potvrzení genové exprese je pouze jedním přístupem k odvození funkce. Genetické přístupy, kdy se člověk snaží detekovat specifický fenotyp nebo změnu kondice po narušení určité sekvence, jsou některými považovány za zlatý standard;[72] pro rozsáhlé analýzy celých genomů však získání takových důkazů často není možné. K potvrzení biologického účinku u konkrétního druhu lze použít i jiné experimentální přístupy, včetně screeningu protein-protein a / nebo genetických interakcí. de novo ORF. Jak se více dozvíte o konkrétním místě, lze k disekci jeho specifické buněčné role použít standardní techniky molekulární biologie.
Alternativně lze použít evoluční přístupy k odvození existence molekulární funkce z výpočetně odvozených podpisů výběru. V případě TRG je jedním společným podpisem výběru poměr nesynonymních a synonymních substitucí (poměr dN / dS ), počítáno z různých druhů ze stejného taxonu. Neutrální očekávání pro tento poměr je 1; většina proteinů kódujících geny má poměr pod 1, což naznačuje selektivní omezení, ačkoli gen se silnou směrovou selekcí může mít poměr nad 1. Poměr pod 1 je tedy považován za důkaz selekce proti ztrátě funkce.[71] Podobně v případě druhově specifických genů lze data polymorfismu použít k výpočtu poměru pN / pS z různých kmenů nebo populací fokálních druhů. Vzhledem k tomu, že mladí, druhově specifičtí de novo geny podle definice postrádají hlubokou konzervaci, detekce statisticky významných odchylek od 1 může být obtížná bez nerealisticky velkého počtu sekvenovaných kmenů / populací. Příklad toho lze vidět v Mus musculus, kde tři velmi mladí de novo geny postrádají podpisy selekce navzdory dobře prokázaným fyziologickým rolím.[75] Z tohoto důvodu se přístupy pN / pS často používají u skupin kandidátských genů, což vědcům umožňuje odvodit, že alespoň některé z nich jsou evolučně konzervovány, aniž by bylo možné určit, které z nich. Místo toho byly použity jiné podpisy selekce, jako je stupeň divergence nukleotidů v syntetických oblastech, zachování hranic ORF nebo pro geny kódující proteiny skóre kódování založené na frekvencích nukleotidových hexamerů.[76]
Přes tyto a další výzvy při identifikaci de novo události genového narození, nyní existuje spousta důkazů, které naznačují, že tento jev je nejen možný, ale došlo k němu v každé dosud systematicky zkoumané linii.[40]
Prevalence
Odhady čísel
Odhady týkající se četnosti de novo narození genu a počet de novo geny v různých liniích se velmi liší a jsou velmi závislé na metodologii. Studie mohou identifikovat de novo samotné geny metodou fylostratigrafie / BLAST, nebo mohou využívat kombinaci výpočetních technik (viz výše) a mohou nebo nemusí hodnotit experimentální důkazy pro expresi a / nebo biologickou roli.[10] Analýzy v měřítku genomu mohou dále zohlednit všechny nebo většinu ORF v genomu,[77] nebo mohou místo toho omezit jejich analýzu na dříve anotované geny.
The D. melanogaster linie je názorným příkladem těchto odlišných přístupů. Časný průzkum využívající kombinaci vyhledávání BLAST prováděných na sekvencích cDNA spolu s manuálními vyhledáváními a syntetickými informacemi identifikoval 72 nových genů specifických pro D. melanogaster a 59 nových genů specifických pro tři ze čtyř druhů v D. melanogaster druhový komplex. Tato zpráva zjistila, že pouze 2/72 (~ 2,8%) z D. melanogaster- byly odvozeny specifické nové geny a 7/59 (~ 11,9%) nových genů specifických pro druhový komplex de novo,[69] se zbytkem vznikne duplikací / retropozicí. Podobně analýza 195 mladých (<35 milionů let) D. melanogaster geny identifikované ze syntenických srovnání zjistily, že jich vzniklo pouze 16 de novo.[67] Naproti tomu se analýza zaměřila na transkriptomické údaje ze šesti varlat D. melanogaster kmeny identifikovaly 106 pevných a 142 segregujících de novo geny.[68] U mnoha z nich byly identifikovány rodové ORF, ale nebyly vyjádřeny. Zvýraznění rozdílů mezi mezidruhovými a vnitrodruhovými srovnáními, studie v přírodních podmínkách Saccharomyces paradoxus populace zjistily, že počet de novo polypeptidů identifikovaných více než zdvojnásobil při zvažování vnitrodruhové rozmanitosti.[78] U primátů jedna raná studie identifikovala 270 osiřelých genů (jedinečných pro člověka, šimpanze a makaky), z nichž 15 mělo původ de novo,[47] zatímco pozdější zpráva identifikovala 60 de novo samotné geny u lidí, které jsou podporovány transkripčními a proteomickými důkazy.[70] Studie na jiných liniích / organismech také dospěly k různým závěrům, pokud jde o počet genů de novo přítomných v každém organismu, jakož i specifické sady identifikovaných genů. Ukázka těchto rozsáhlých studií je popsána v následující tabulce.
Opětovná analýza tří takových studií u myší, které identifikovaly mezi 69 a 773 kandidáty de novo geny tvrdily, že různé odhady zahrnovaly mnoho genů, které ve skutečnosti nebyly de novo geny.[79] Mnoho kandidátů bylo vyloučeno na základě toho, že již nebyli anotováni v hlavních databázích. Na zbývající geny byl aplikován konzervativní přístup, který vylučoval kandidáty s paralogy, vzdáleně příbuznými homology nebo konzervovanými doménami, nebo kterým chyběly informace o syntetické sekvenci u nehlodavců. Tento přístup ověřil ~ 40% kandidátů de novo genů, což má za následek horní odhad pouze 11,6 de novo geny vytvořené (a zachované) za milion let, rychlost ~ 5-10krát pomalejší než to, co bylo odhadnuto pro nové geny vytvořené duplikací.[79] Je pozoruhodné, že i po použití tohoto přísného potrubí bylo 152 ověřeno de novo geny, které zůstaly stále, představují významnou část myšího genomu, který pravděpodobně vznikl de novo. Obecně však zůstává diskutováno, zda duplikace a divergence nebo de novo genové narození představují dominantní mechanismus pro vznik nových genů,[67][69][77][80][81][82] částečně kvůli tomu, že de novo geny se pravděpodobně objeví a budou ztraceny častěji než jiné mladé geny (viz níže).
Dynamika
Je důležité rozlišovat mezi četností de novo narození genu a počet de novo geny v dané linii. Li de novo genové zrození je časté, dalo by se očekávat, že genomy budou mít tendenci růst v jejich genovém obsahu v průběhu času; obsah genů v genomech je však obvykle relativně stabilní.[10] To znamená, že častý proces genové smrti musí být v rovnováze de novo genové narození, a opravdu de novo geny se vyznačují rychlým obratem ve srovnání se zavedenými geny. Na podporu této představy se nedávno objevila Drosophila geny jsou mnohem pravděpodobněji ztraceny, především prostřednictvím pseudogenizace, přičemž nejmladší sirotci jsou ztraceni nejvyšší rychlostí;[83] a to navzdory skutečnosti, že některé Drosophila Bylo prokázáno, že geny pro vzácná onemocnění se rychle stávají nezbytnými.[67] Podobný trend častého úbytku u mladých genových rodin byl pozorován u hlístic Pristionchus.[84] Podobně analýza pěti savčích transkriptomů zjistila, že většina ORF u myší byla buď velmi stará nebo druhově specifická, což znamená časté narození a smrt de novo přepisy.[81] V divokých populacích S. paradoxus se objevují de novo ORF a jsou ztraceny podobným tempem.[78] Přesto zůstává pozitivní korelace mezi počtem druhově specifických genů v genomu a evoluční vzdáleností od jeho posledního předka.[85] Kromě narození a smrti de novo geny na úrovni ORF, mutační a další procesy také podrobují genomy neustálému „transkripčnímu obratu“. Jedna studie na myších zjistila, že zatímco všechny oblasti genomu předků byly v určitém okamžiku transkribovány alespoň u jednoho potomka, část genomu pod aktivní transkripcí u daného kmene nebo poddruhu podléhá rychlé změně.[86] Transkripční obrat nekódujících RNA genů je zvláště rychlý ve srovnání s transkripcí kódujících genů.[87]
Funkce
Nedávno se objevil de novo geny se liší od zavedených genů mnoha způsoby. U široké škály druhů se uvádí, že mladé a / nebo taxonomicky omezené geny nebo ORF mají kratší délku než zavedené geny, vyvíjejí se rychleji a jsou méně exprimovány.[47][77][83][84][88][89][90][91][92][93][94][95] Ačkoli se očekává, že se tyto trendy vyskytnou také v důsledku zkreslení detekce homologie (viz část Genomická fylostratigrafie výše), opětovná analýza několika studií, která snížila toto zkreslení odstraněním genů, jejichž stáří je obtížnější určit, zjistila, že kvalitativní závěry dosažené v těchto studie nebyly ovlivněny.[57] Navíc tendence mladých genů mít méně hydrofobních aminokyselin,[96] a mít je více seskupené blízko sebe podél primární sekvence,[97] byly statisticky kontrolovány z hlediska evoluční rychlosti a délky, a proto nejsou způsobeny zkreslením detekce homologie.
Bylo také zjištěno, že exprese mladých genů je více tkáňově nebo stavově specifičtější než u zavedených genů.[29][31][47][68][70][77][93][98][99][100] Zejména relativně vysoký výraz de novo geny byly pozorovány v mužských reprodukčních tkáních v Drosophila, myši a lidé (viz níže) a u lidí obecně v mozkové kůře nebo v mozku.[70][101] U zvířat s adaptivním imunitním systémem může být vyšší exprese v mozku a varlatech alespoň částečně funkcí imunitně privilegované povahy těchto tkání. Analýza u myší zjistila specifickou expresi intergenních transkriptů v brzlíku a slezině (kromě mozku a varlat) a bylo navrženo, aby u obratlovců de novo transkripty musí být nejprve exprimovány v těchto tkáních, než mohou být exprimovány v tkáních podléhajících dohledu imunitními buňkami.[100] Starší geny mají větší regulaci transkripčních faktorů, což svědčí o jejich integraci do větších molekulárních sítí. Podobně pravděpodobnost fyzických interakcí, stejně jako pravděpodobnost a síla genetických interakcí, koreluje s věkem ORF stanoveným fylostratigrafií.[102]
Funkce závislé na počtu řádků
Vlastnosti de novo geny mohou záviset na druhu nebo linii, která je zkoumána. To se zdá být částečně výsledkem skutečnosti, že se jejich genomy liší Obsah GC a mladé geny mají větší podobnost s negenickými sekvencemi z genomu, ve kterém vznikly, než u zavedených genů.[103] Vlastnosti, jako je procento transmembránových zbytků a relativní frekvence různých předpovězených sekundární strukturální prvky vykazují silnou závislost GC na osiřelých genech, zatímco ve starodávnějších genech jsou tyto vlastnosti ovlivňovány obsahem GC jen slabě.[103]
Vztah mezi věkem genu a množstvím predikované vnitřní strukturální poruchy (ISD) v kódovaných proteinech byl předmětem značné debaty. Tvrdilo se, že ISD je také rysem závislým na počtu řádků, jehož příkladem je skutečnost, že v organismech s relativně vysokým obsahem GC, od D. melanogaster na parazita Leishmania major, mladé geny mají vysoké ISD,[104][105] zatímco v genomu s nízkým GC, jako jsou začínající kvasinky, několik studií ukázalo, že mladé geny mají nízkou ISD.[77][88][95][103] Studie, která vylučovala mladé geny s pochybným důkazem funkčnosti, definovaným v binárních termínech jako selekční pro retenci genů, však zjistila, že zbývající mladé geny kvasinek mají vysokou ISD, což naznačuje, že výsledek kvasinek může být způsoben kontaminací sady mladých genů s ORF, které nesplňují tuto definici, a proto mají větší pravděpodobnost vlastnosti, které odrážejí obsah GC a další negenické rysy genomu.[96] Kromě nejmladších sirotků tato studie zjistila, že ISD má tendenci klesat se zvyšujícím se věkem genů a že je to primárně způsobeno spíše složením aminokyselin než obsahem GC per se.[96] V kratších časových měřítcích zaměření na de novo geny, které mají největší validaci, naznačuje, že mladší geny jsou více neuspořádané Lachancea, ale méně neuspořádané Saccharomyces.[95]
Úloha epigenetických modifikací
Zkouška de novo geny v A. thaliana zjistili, že jsou oba hypermethylovaní a obecně vyčerpaní histon modifikace.[66] V souladu s buď proto-genovým modelem, nebo kontaminací jinými než geny (viz níže), úrovně methylace de novo geny byly mezi zavedenými geny a intergenickými oblastmi. Metylační vzorce těchto de novo geny jsou stabilně dědičné a úrovně methylace byly nejvyšší a nejpodobnější zavedeným genům v r de novo geny s ověřenou schopností kódovat proteiny.[66] V patogenní houbě Magnaporthe oryzaeméně konzervované geny mívají metylační vzorce spojené s nízkou úrovní transkripce.[106] Studie na kvasnicích to také zjistila de novo geny jsou obohaceny v rekombinačních hotspotech, které bývají regiony bez nukleosomů.[95]
v Pristionchus pacificus, osiřelé geny s potvrzenou expresí zobrazují stavy chromatinu, které se liší od stavů podobně exprimovaných zavedených genů.[94] Počáteční místa pro osiřelé geny mají epigenetické podpisy, které jsou charakteristické pro zesilovače, na rozdíl od konzervovaných genů, které vykazují klasické promotory.[94] Mnoho nevyjádřených osiřelých genů je zdobeno represivními histonovými modifikacemi, zatímco nedostatek těchto modifikací usnadňuje transkripci exprimované podskupiny sirotků, což podporuje představu, že otevřený chromatin podporuje tvorbu nových genů.[94]
Modely a mechanismy
Několik teoretických modelů a možných mechanismů de novo genové narození byly popsány. Modely se obecně vzájemně nevylučují a je možné, že může vzniknout více mechanismů de novo geny.[52]
Pořadí událostí
ORF první vs. transkripce první
Pro narození a de novo Aby došlo k genům kódujícím protein, musí být negenická sekvence transkribována a získána ORF, než dojde k translaci. Tyto události se teoreticky mohou vyskytovat v jakémkoli pořadí a existují důkazy podporující jak model „ORF first“, tak model „transkripce first“.[5] Analýza de novo geny, které se segregují D. melanogaster s ohledem na jejich expresi bylo zjištěno, že sekvence, které jsou transkribovány, mají podobný kódovací potenciál jako ortologické sekvence z linií, které nemají důkaz transkripce,[68] podporující představu, že před vyjádřením existuje alespoň mnoho ORF. Nemrznoucí glykoproteinový gen AFGP, který se objevil de novo v arktických treskách poskytuje definitivnější příklad, ve kterém de novo Ukázalo se, že výskyt ORF předchází vzniku promotorové oblasti.[107] Kromě toho je v eukaryotických genomech početně negenických ORF dostatečně dlouhých na kódování funkčních peptidů početné a očekává se, že se vyskytnou náhodou vysokou frekvencí.[68][77] Současně je transkripce eukaryotických genomů mnohem rozsáhlejší, než se dříve myslelo, a existují také zdokumentované příklady genomových oblastí, které byly transkribovány před objevením ORF, který se stal de novo gen.[108] Podíl de novo genes that are protein-coding is unknown, but the appearance of “transcription first” has led some to posit that protein-coding de novo genes may first exist as RNA gene intermediates. The case of bifunctional RNAs, which are both translated and function as RNA genes, shows that such a mechanism is plausible.[109]
The two events may occur simultaneously when chromosomal rearrangement is the event that precipates gene birth.[110]
“Out of Testis” hypothesis
An early case study of de novo gene birth, which identified five de novo genes in D. melanogaster, noted preferential expression of these genes in the testes,[30] and several additional de novo genes were identified using transcriptomic data derived from the testes and male accessory glands of D. yakuba a D. erecta[29][31] (viz výše). This was in keeping with the rapid evolution of genes related to reproduction that has been observed across a range of lineages,[111][112][113] suggesting that sexual selection may play a key role in adaptive evolution and de novo gene birth. A subsequent large-scale analysis of six D. melanogaster strains identified 248 testis-expressed de novo genes, of which ~57% were not fixed.[68] It has been suggested that the large number of de novo genes with male-specific expression identified in Drosophila is likely due to the fact that such genes are preferentially retained relative to other de novo genes, for reasons that are not entirely clear.[83] Interestingly, two putative de novo genes in Drosophila (Goddard a Saturn) were shown to be required for normal male fertility.[114]
In humans, a study that identified 60 human-specific de novo genes found that their average expression, as measured by RNA-seq, was highest in the testes.[70] Another study looking at mammalian-specific genes more generally also found enriched expression in the testes.[115] Transcription in mammalian testes is thought to be particularly promiscuous, due in part to elevated expression of the transcription machinery[116][117] and an open chromatin environment.[118] Along with the immune-privileged nature of the testes (see above), this promiscuous transcription is thought to create the ideal conditions for the expression of non-genic sequences required for de novo gene birth. Testes-specific expression seems to be a general feature of all novel genes, as an analysis of Drosophila and vertebrate species found that young genes showed testes-biased expression regardless of their mechanism of origination.[98]
Pervasive expression
With the development and wide use of technologies such as RNA-seq and Ribo-seq, eukaryotic genomes are now known to be pervasively transcribed[119][120][121][122] and translated.[123] Many ORFs that are either unannotated, or annotated as long non-coding RNAs (lncRNAs), are translated at some level, under at least some condition, or in a particular tissue.[77][123][124][125][126][127] Though infrequent, these translation events expose non-genic sequence to selection. This pervasive expression forms the basis for several models describing de novo gene birth.
Most non-genic ORFs that are translated appear to be evolving neutrally.[78][77][124] The preadaptation and proto-gene models both predict, however, that expression of non-genic ORFs will occasionally provide an adaptive advantage to the cell. Differential translation of proto-genes in stress conditions, as well as an enrichment near proto-genes of binding sites for transkripční faktory involved in regulating stress response,[77] support the adaptive potential of proto-genes. Furthermore, it is known that novel, functional proteins can be experimentally evolved from random amino acid sequences.[128] Random sequences are generally well tolerated in vivo; many readily form secondary structures, and even highly disordered proteins may take on important biological roles.[129][130][131] The pervasive nature of translation suggests that new proto-genes emerge frequently, usually returning to the non-genic state. In wild S. paradoxus populations, some ORFs with exaggerated gene-like features are found among the pool of translated intergenic polypeptides.[78] It is not clear whether such ORFs are preferentially retained.
It has been speculated that the epigenetic landscape of de novo genes in the early stages of formation may be particularly variable between and among populations, resulting in variable levels of gene expression and thereby allowing young genes to explore the “expression landscape.”[132] The QQS gen v A. thaliana is one example of this phenomenon; its expression is negatively regulated by DNA methylation that, while heritable for several generations, varies widely in its levels both among natural accessions and within wild populations.[132] Epigenetics are also largely responsible for the permissive transcriptional environment in the testes, particularly through the incorporation into nucleosomes of non-canonical histone variants that are replaced by histone-like protaminy during spermatogenesis.[133]
Preadaptation model
The preadaptation model of de novo gene birth uses mathematical modeling to show that when sequences that are normally hidden are exposed to weak or shielded selection, the resulting pool of “cryptic” sequences (i.e. proto-genes) can be purged of “self-evidently deleterious” variants, such as those prone to lead to protein aggregation, and thus enriched in potential adaptations relative to a completely non-expressed and unpurged set of sequences.[134] This revealing and purging of cryptic deleterious non-genic sequences is a byproduct of pervasive transcription and translation of intergenic sequences, and is expected to facilitate the birth of functional de novo protein-coding genes.[126] This is because by eliminating the most deleterious variants, what is left is, by a process of elimination, more likely to be adaptive than expected from random sequences.
The mathematics of the preadaptation model assume that the distribution of fitness effects is bimodal, with new sequences of mutations tending to break something or tinker, but rarely in between.[134][135] From this it is derived that populations may either evolve local solutions, in which selection operates on each individual locus and a relatively high error rate is maintained, or the global solution of a low error rate which permits the accumulation of deleterious cryptic sequences.[134] De novo gene birth is thought to be favored in populations that evolve local solutions, as the relatively high error rate will result in a pool of cryptic variation that is “preadapted” through the purging of deleterious sequences. Local solutions are more likely in populations with a high efektivní velikost populace.
Proto-gene model
This proto-gene model agrees with the preadaptation model about the importance of pervasive expression, and refers to the set of pervasively expressed sequences that do not meet all definitions of a gene as “proto-genes”.[77] Where it differs is that it that envisages a more gradual process under selection from non-genic to genic state, rejecting binary classification, with proto-genes expected to exhibit features intermediate between genes and non-genes.
Testable differences between models
Using the evolutionary definition of function (i.e. that a gene is by definition under purifying selection against loss), the preadaptation model assumes that “gene birth is a sudden transition to functionality”[96] that occurs as soon as an ORF acquires a net beneficial effect. In order to avoid being deleterious, newborn genes are expected to display exaggerated versions of genic features associated with the avoidance of harm. This is in contrast to the proto-gene model, which expects newborn genes to have features intermediate between old genes and non-genes.[96]
Several features of ORFs correlate with ORF age as determined by phylostratigraphic analysis (see above), with young ORFs having properties intermediate between old ORFs and non-genes; this has been taken as evidence in favor of the proto-gene model, in which proto-gene state is a continuum .[77] This evidence has been criticized, because the same apparent trends are also expected under a model in which identity as a gene is a binary. Under this model, when each age group contains a different ratio of genes vs. non-genes, Simpsonův paradox can generate correlations in the wrong direction.[96]
More specifically, in support of the preadaptation model, an analysis of ISD in mice and yeast found that young genes have higher ISD than old genes, while random non-genic sequences tend to show the lowest levels of ISD.[96] Although the observed trend may have partly resulted from a subset of young genes derived by overprinting,[79] higher ISD in young genes is also seen among overlapping viral gene pairs.[136] Reaching consensus over ISD values of the very youngest genes is made difficult by different annotation standards,[81][97] as well as by disagreement over whether genes represent a binary or a continuous category.[77][96] When proto-genes with less evidence for a selected function are excluded from the data in which a continuum was seen,[77] the slope of the ISD trend is reversed.[96] However, there remains uncertainty about whether the observed trends hold consistently over shorter timescales.[81][97] With respect to other predicted structural features such as β-strand content and aggregation propensity, the peptides encoded by proto-genes are similar to non-genic sequences and categorically distinct from canonical genes.[102]
Grow slow and moult model
The “grow slow and moult” model describes a potential mechanism of de novo gene birth, particular to protein-coding genes. In this scenario, existing protein-coding ORFs expand at their ends, especially their 3’ ends, leading to the creation of novel N- and C-terminal domains.[137][138][139][140][141] Novel C-terminal domains may first evolve under weak selection via occasional expression through read-through translation, as in the preadaptation model, only later becoming constitutively expressed through a mutation that disrupts the stop codon.[134][138] Genes experiencing high translational readthrough tend to have intrinsically disordered C-termini.[142] Furthermore, existing genes are often close to repetitive sequences that encode disordered domains. These novel, disordered domains may initially confer some non-specific binding capability that becomes gradually refined by selection. Sequences encoding these novel domains may occasionally separate from their parent ORF, leading or contributing to the creation of a de novo gen.[138] Interestingly, an analysis of 32 insect genomes found that novel domains (i.e. those unique to insects) tend to evolve fairly neutrally, with only a few sites under positive selection, while their host proteins remain under purifying selection, suggesting that new functional domains emerge gradually and somewhat stochastically.[143]
Lidské zdraví
In addition to its significance for the field of evolutionary biology, de novo gene birth has implications for human health. It has been speculated that novel genes, including de novo genes, may play an outsized role in species-specific traits;[6][10][40][144] however, many species-specific genes lack functional annotation.[115] Nevertheless, there is evidence to suggest that human-specific de novo genes are involved in disease processes such as cancer. NYCM, a de novo gene unique to humans and chimpanzees, regulates the pathogenesis of neuroblastomas in mouse models,[145] and the primate-specific PART1, an lncRNA gene, has been identified as both a tumor suppressor and an oncogene in different contexts.[47][146][147] Several other human- or primate-specific de novo genes, including PBOV1,[148] GR6,[149][150] MYEOV,[151] ELFN1-AS1,[152] a CLLU1,[48] are also linked to cancer. Some have even suggested considering tumor-specifically expressed, evolutionary novel genes as their own class of genetic elements, noting that many such genes are under positive selection and may be neofunctionalized in the context of tumors.[152]
The specific expression of many de novo genes in the human brain[70] also raises the intriguing possibility that de novo genes influence human cognitive traits. Jeden takový příklad je FLJ33706, a de novo gene that was identified in GWAS and linkage analyses for nicotine addiction and shows elevated expression in the brains of Alzheimer’s patients.[153] Generally speaking, expression of young, primate-specific genes is enriched in the fetal human brain relative to the expression of similarly young genes in the mouse brain.[154] Most of these young genes, several of which originated de novo, are expressed in the neocortex, which is thought to be responsible for many aspects of human-specific cognition. Many of these young genes show signatures of positive selection, and functional annotations indicate that they are involved in diverse molecular processes, but are enriched for transcription factors.[154]
In addition to their roles in cancer processes, de novo originated human genes have been implicated in the maintenance of pluripotency[155] and in immune function.[47][115][156] The preferential expression of de novo genes in the testes (see above) is also suggestive of a role in reproduction. Given that the function of many de novo human genes remains uncharacterized, it seems likely that an appreciation of their contribution to human health and development will continue to grow.
Organism/Lineage | Homology Detection Method(s) | Evidence of Expression? | Evidence of Selection? | Evidence of Physiological Role? | # Orphan/De Novo Geny | Poznámky | Čj. |
---|---|---|---|---|---|---|---|
Členovci | BLASTP for all 30 species against each other, TBLASTN for Formicidae only, searched by synteny for unannotated orthologs in Formicidae pouze | ESTs, RNA-seq; RT-PCR on select candidates | 37 Formicidae-restricted orthologs appear under positive selection (M1a to M2a and M7 to M8 models using likelihood ratio tests); as a group, Formicidae-restricted orthologs have a significantly higher KA/ K.s rate than non-restricted orthologs | Prediction of signal peptides and subcellular localization for subset of orphans | ~65,000 orphan genes across 30 species | Abundance of orphan genes dependent on time since emergence from common ancestor; >40% of orphans from intergenic matches indicating possible de novo původ | [85] |
Arabidopsis thaliana | BLASTP against 62 species, PSI-BLAST against NCBI nonredundant protein database, TBLASTN against PlantGDB-assembled unique transcripts database; searched syntenic region of two closely related species | Transcriptomic and translatomic data from multiple sources | Allele frequencies of de novo genes correlated with their DNA methylation levels | Žádný | 782 de novo geny | Also assessed DNA methylation and histone modifications | [66] |
Bombyx mori | BLASTP against four lepidopterani, TBLASTN against lepidopteran EST sequences, BLASTP against NCBI nonredundant protein database | Microarray, RT-PCR | Žádný | RNAi on five de novo genes produced no visible phenotypes | 738 orphan genes | Five orphans identified as de novo geny | [92] |
Brassicaceae | BLASTP against NCBI nonredundant protein database, TBLASTN against NCBI nucleotide database, TBLASTN against NCBI EST database, PSI-BLAST against NCBI nonredundant protein database, InterProScan[157] | Microarray | Žádný | TRGs enriched for expression changes in response to abiotic stresses compared to other genes | 1761 nuclear TRGs; 28 mitochondrial TRGs | ~2% of TRGs thought to be de novo geny | [93] |
Drosophila melanogaster | BLASTN of query cDNAs against D. melanogaster, D. simulans a D. yakuba genomes; also performed check of syntenic region in sister species | cDNA/ expressed sequence tags (ESTs) | K.A/ K.s ratios calculated between retained new genes and their parental genes are significantly >1, indicating most new genes are functionally constrained | List includes several genes with characterized molecular roles | 72 orphan genes; 2 de novo geny | Gene duplication dominant mechanism for new genes; 7/59 orphans specific to D. melanogaster species complex identified as de novo | [69] |
Drosophila melanogaster | Presence or absence of orthologs in other Drosophila species inferred by synteny based on UCSC genome alignments and FlyBase protein-based synteny; TBLASTN against Drosophila podskupina | Indirect (RNAi) | Youngest essential genes show signatures of positive selection (α=0.25 as a group) | Knockdown with constitutive RNAi lethal for 59 TRGs | 195 “young” (>35myo) TRGs; 16 de novo geny | Gene duplication dominant mechanism for new genes | [67] |
Drosophila melanogaster | RNA-seq in D. melanogaster and close relatives; syntenic alignments with D. simulans a D. yakuba; BLASTP against NCBI nonredundant protein database | RNA-seq | Nucleotide diversity lower in non-expressing relatives; Hudson-Kreitman-Aguade-like statistic lower in fixed de novo genes than in intergenic regions | Structural features of de novo genes (e.g. enrichment of long ORFs) suggestive of function | 106 fixed and 142 segregating de novo geny | Specifically expressed in testes | [68] |
Homo sapiens | BLASTP against other primates; BLAT against chimpanzee and orangutan genomes, manual check of syntenic regions in chimpanzee and orangutan | RNA-seq | Substitution rate provides some evidence for weak selection; 59/60 de novo genes are fixed | Žádný | 60 de novo geny | Enabling mutations identified; highest expression seen in brain and testes | [70] |
Homo sapiens | BLASTP against chimpanzee, BLAT and Search of syntenic region in chimpanzee, manual check of syntenic regions in chimpanzee and macaque | EST/cDNA | No evidence of selective constraint seen by nucleotide divergence | One of the genes identified has a known role in leukemia | 3 de novo geny | Estimated that human genome contains ~ 18 human-specific de novo geny | [48] |
Lachancea a Saccharomyces | BLASTP of all focal species against each other, BLASTP against NCBI nonredundant protein database, PSI-BLAST against NCBI nonredundant protein database, HMM Profile-Profile of TRG families against each other; families then merged and searched against four profile databases | Mass Spectrometry (MS) | K.A/ K.s ratios across Saccharomyces indicate that candidates are under weak selection that increases with gene age; v Lachancea species with multiple strains, pN/pS ratios are lower for de novo candidates than for "spurious TRGs" | Žádný | 288 candidate de novo TRGs in Saccharomyces, 415 in Lachancea | MS evidence of translation for 25 candidates | [95] |
Mus musculus a Rattus norvegicus | BLASTP of rat and mouse against each other, BLASTP against Ensembl compara database; searched syntenic regions in rat and mouse | UniGene Database | Subset of genes shows low nucleotide diversity and high ORF conservation across 17 strains | Two mouse genes cause morbidity when knocked out | 69 de novo genes in mouse and 6 "de novo" genes in rat | Enabling mutations identified for 9 mouse genes | [158] |
Mus musculus | BLASTP against NCBI nonredundant protein database | Microarray | Žádný | Žádný | 781 orphan genes | Age-dependent features of genes compatible with de novo emergence of many orphans | [80] |
Oryza | Protein-to-protein and nucleotide-to-nucleotide BLAT against eight Oryza species and two outgroup species; searched syntenic regions of these species for coding potential | RNA-seq (all de novo TRGs); Ribosome Profiling and targeted MS (some de novo TRGs) | 22 de novo candidates appear under negative selection, and six under positive selection, as measured by KA/ K.s hodnotit | Vyjádření de novo TRGs is tissue-specific | 175 de novo TRGs | ~57% of de novo genes have translational evidence; transcription predates coding potential in most cases | [159] |
Primáti | BLASTP against 15 eukaryotes, BLASTN against human genome, analysis of syntenic regions | ESTs | K.A/ K.s ratios for TRGs below one but higher than established genes; coding scores consistent with translated proteins | Several genes have well-characterized cellular roles | 270 TRGs | ~5.5% of TRGs estimated to have originated de novo | [47] |
Pristionchus pacificus | BLASTP and tBLASTN, syntenic analysis | RNA-sekv | 2 cases complete de novo gene origination | 27 other high-confidence orphans whose methods of origin included annotation artifacts, chimeric origin, alternative reading frame usage, and gene splitting with subsequent gain of de novo exons | [160] | ||
Rodentia | BLASTP against NCBI nonredundant protein database | Žádný | Mouse genes share 50% identity with rat ortholog | Žádný | 84 TRGs | Species-specific genes excluded from analysis; results robust to evolutionary rate | [96] |
Saccharomyces cerevisiae | BLASTP and PSI-BLAST against 18 fungal species, HMMER and HHpred against several databases, TBLASTN against three close relatives | Žádný | Žádný | Majority of orphans have characterized fitness effects | 188 orphan genes | Ages of genes determined at level of individual residues | [88] |
Saccharomyces cerevisiae | BLASTP, TBLASTX, and TBLASTN against 14 other yeast species, BLASTP against NCBI nonredundant protein database | Ribosome Profiling | All 25 de novo genes, 115 proto-genes under purifying selection (pN/pS < 1) | Žádný | 25 de novo genes; 1,891 “proto-genes” | De novo gene birth more common than new genes from duplication; proto-genes are unique to Saccharomyces (Sensu stricto ) yeasts | [77] |
Saccharomyces cerevisiae | BLASTN, TBLASTX, against nt/nr, manual inspection of syntenic alignment | transcripts believed to be non-coding, manual inspection of ribosome profiling traces | Žádný | Žádný | 1 de novo candidate gene, 217 ribosome-associated transcripts | Kandidát de novo gene is polymorphic. Ribosomal profiling data is the same as in [77] | [126] |
Saccharomyces sensu strictu | BLASTP against NCBI nonredundant protein database, TBLASTN against ten outgroup species; BLASTP and phmmer against 20 yeast species reannotated using syntenic alignments | Transcript isoform sequencing (TIF-seq), Ribosome Profiling | Most genes weakly constrained but a subset under strong selection, according to Neutrality Index, Direction of Selection, KA/ K.s, and McDonald-Kreitman tests | Subcellular localization demonstrated for five genes | ~13,000 de novo geny | >65% of de novo genes are isoforms of ancient genes; >97% from TIF-seq dataset | [65] |
Note: For purposes of this table, genes are defined as orphan genes (when species-specific) or TRGs (when limited to a closely related group of species) when the mechanism of origination has not been investigated, and as de novo genes when de novo origination has been inferred, irrespective of method of inference. Označení de novo genes as “candidates” or “proto-genes” reflects the language used by the authors of the respective studies.
Viz také
Reference
Tento článek byl upraven z následujícího zdroje pod a CC BY 4.0 licence (2019 ) (zprávy recenzenta ): "De novo gene birth", Genetika PLOS, 15 (5): e1008160, 23 May 2019, doi:10.1371/JOURNAL.PGEN.1008160, ISSN 1553-7390, PMC 6542195, PMID 31120894, Wikidata Q86320144
- ^ Long M, Betrán E, Thornton K, Wang W (November 2003). "The origin of new genes: glimpses from the young and old". Genetika hodnocení přírody. 4 (11): 865–75. doi:10.1038/nrg1204. PMID 14634634. S2CID 33999892.
- ^ Wang W, Yu H, Long M (May 2004). "Duplication-degeneration as a mechanism of gene fission and the origin of new genes in Drosophila species". Genetika přírody. 36 (5): 523–7. doi:10.1038/ng1338. PMID 15064762.
- ^ Levy, Adam (16 October 2019). "How evolution builds genes from scratch - Scientists long assumed that new genes appear when evolution tinkers with old ones. It turns out that natural selection is much more creative". Příroda. 574 (7778): 314–316. doi:10.1038/d41586-019-03061-x. PMID 31619796.
- ^ Schmitz JF, Bornberg-Bauer E (2017). "de novo from previously non-coding DNA". F1000Výzkum. 6: 57. doi:10.12688/f1000research.10079.1. PMC 5247788. PMID 28163910.
- ^ A b C Schlötterer C (April 2015). "Genes from scratch--the evolutionary fate of de novo genes". Trendy v genetice. 31 (4): 215–9. doi:10.1016/j.tig.2015.02.007. PMC 4383367. PMID 25773713.
- ^ A b C Kaessmann H (October 2010). "Origins, evolution, and phenotypic impact of new genes". Výzkum genomu. 20 (10): 1313–26. doi:10.1101/gr.101386.109. PMC 2945180. PMID 20651121.
- ^ A b Jacob F (June 1977). "Evolution and tinkering". Věda. 196 (4295): 1161–6. Bibcode:1977Sci...196.1161J. doi:10.1126/science.860134. PMID 860134. S2CID 29756896.
- ^ Carvunis, Anne-Ruxandra; Oss, Stephen Branden Van (2019-05-23). "De novo gene birth". Genetika PLOS. 15 (5): e1008160. doi:10.1371/journal.pgen.1008160. ISSN 1553-7404. PMC 6542195. PMID 31120894.
- ^ Khalturin K, Hemmrich G, Fraune S, Augustin R, Bosch TC (September 2009). "More than just orphans: are taxonomically-restricted genes important in evolution?". Trendy v genetice. 25 (9): 404–13. doi:10.1016/j.tig.2009.07.006. PMID 19716618.
- ^ A b C d E Tautz D, Domazet-Lošo T (August 2011). "The evolutionary origin of orphan genes". Genetika hodnocení přírody. 12 (10): 692–702. doi:10.1038/nrg3053. PMID 21878963. S2CID 31738556.
- ^ Ohno S (1970) Evolution by Gene Duplication Allen & Unwin; Springer-Verlag
- ^ Tautz D (2014). "The discovery of de novo gene evolution". Perspektivy v biologii a medicíně. 57 (1): 149–61. doi:10.1353/pbm.2014.0006. hdl:11858/00-001M-0000-0024-3416-1. PMID 25345708. S2CID 29552265.
- ^ Grassé P-P (1977) Evolution of living organisms : evidence for a new theory of transformation Akademický tisk
- ^ Barrell BG, Air GM, Hutchison CA (November 1976). "Overlapping genes in bacteriophage phiX174". Příroda. 264 (5581): 34–41. Bibcode:1976Natur.264...34B. doi:10.1038/264034a0. PMID 1004533. S2CID 4264796.
- ^ Shaw DC, Walker JE, Northrop FD, Barrell BG, Godson GN, Fiddes JC (April 1978). "Gene K, a new overlapping gene in bacteriophage G4". Příroda. 272 (5653): 510–5. Bibcode:1978Natur.272..510S. doi:10.1038/272510a0. PMID 692656. S2CID 4218777.
- ^ Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, et al. (Únor 1977). "Nucleotide sequence of bacteriophage phi X174 DNA". Příroda. 265 (5596): 687–95. Bibcode:1977Natur.265..687S. doi:10.1038/265687a0. PMID 870828. S2CID 4206886.
- ^ Keese PK, Gibbs A (October 1992). "Origins of genes: "big bang" or continuous creation?". Sborník Národní akademie věd Spojených států amerických. 89 (20): 9489–93. Bibcode:1992PNAS...89.9489K. doi:10.1073/pnas.89.20.9489. PMC 50157. PMID 1329098.
- ^ Ohno S (April 1984). "Birth of a unique enzyme from an alternative reading frame of the preexisted, internally repetitious coding sequence". Sborník Národní akademie věd Spojených států amerických. 81 (8): 2421–5. Bibcode:1984PNAS...81.2421O. doi:10.1073/pnas.81.8.2421. PMC 345072. PMID 6585807.
- ^ Sabath N, Wagner A, Karlin D (December 2012). "Evolution of viral proteins originated de novo by overprinting". Molekulární biologie a evoluce. 29 (12): 3767–80. doi:10.1093/molbev/mss179. PMC 3494269. PMID 22821011.
- ^ Makałowska I, Lin CF, Hernandez K (October 2007). "Birth and death of gene overlaps in vertebrates". BMC Evoluční biologie. 7: 193. doi:10.1186/1471-2148-7-193. PMC 2151771. PMID 17939861.
- ^ Samandi S, Roy AV, Delcourt V, Lucier JF, Gagnon J, Beaudoin MC, et al. (Říjen 2017). "Deep transcriptome annotation enables the discovery and functional characterization of cryptic small proteins". eLife. 6. doi:10.7554/eLife.27860. PMC 5703645. PMID 29083303.
- ^ Khan, YA; Jungreis, I; Wright, JC; Mudge, JM; Choudhary, JS; Firth, AE; Kellis, M (6 March 2020). "Evidence for a novel overlapping coding sequence in POLG initiated at a CUG start codon". BMC Genetics. 21 (1): 25. doi:10.1186/s12863-020-0828-7. PMC 7059407. PMID 32138667.
- ^ Makałowski W, Mitchell GA, Labuda D (June 1994). "Alu sequences in the coding regions of mRNA: a source of protein variability". Trendy v genetice. 10 (6): 188–93. doi:10.1016/0168-9525(94)90254-2. PMID 8073532.
- ^ Sorek R (October 2007). "The birth of new exons: mechanisms and evolutionary consequences". RNA. 13 (10): 1603–8. doi:10.1261/rna.682507. PMC 1986822. PMID 17709368.
- ^ A b Dorit RL, Gilbert W (December 1991). "The limited universe of exons". Aktuální názor na genetiku a vývoj. 1 (4): 464–9. doi:10.1016/S0959-437X(05)80193-5. PMID 1822278.
- ^ Chothia C (June 1992). "Proteins. One thousand families for the molecular biologist". Příroda. 357 (6379): 543–4. Bibcode:1992Natur.357..543C. doi:10.1038/357543a0. PMID 1608464. S2CID 4355476.
- ^ Oliver SG, van der Aart QJ, Agostoni-Carbone ML, Aigle M, Alberghina L, Alexandraki D, et al. (Květen 1992). "The complete DNA sequence of yeast chromosome III". Příroda. 357 (6373): 38–46. Bibcode:1992Natur.357...38O. doi:10.1038/357038a0. PMID 1574125. S2CID 4271784.
- ^ A b Dujon B (July 1996). "The yeast genome project: what did we learn?". Trendy v genetice. 12 (7): 263–70. doi:10.1016/0168-9525(96)10027-5. PMID 8763498.
- ^ A b C d E Begun DJ, Lindfors HA, Kern AD, Jones CD (June 2007). "Evidence for de novo evolution of testis-expressed genes in the Drosophila yakuba/Drosophila erecta clade ". Genetika. 176 (2): 1131–7. doi:10.1534/genetics.106.069245. PMC 1894579. PMID 17435230.
- ^ A b C d E F G Levine MT, Jones CD, Kern AD, Lindfors HA, Begun DJ (June 2006). "Novel genes derived from noncoding DNA in Drosophila melanogaster are frequently X-linked and exhibit testis-biased expression". Sborník Národní akademie věd Spojených států amerických. 103 (26): 9935–9. Bibcode:2006PNAS..103,9935L. doi:10.1073 / pnas.0509809103. PMC 1502557. PMID 16777968.
- ^ A b C d Begun DJ, Lindfors HA, Thompson ME, Holloway AK (March 2006). "Recently evolved genes identified from Drosophila yakuba a D. erecta accessory gland expressed sequence tags". Genetika. 172 (3): 1675–81. doi:10.1534/genetics.105.050336. PMC 1456303. PMID 16361246.
- ^ Betrán E, Long M (July 2003). "Dntf-2r, a young Drosophila retroposed gene with specific male expression under positive Darwinian selection". Genetika. 164 (3): 977–88. PMC 1462638. PMID 12871908.
- ^ Jones CD, Begun DJ (August 2005). "Parallel evolution of chimeric fusion genes". Sborník Národní akademie věd Spojených států amerických. 102 (32): 11373–8. Bibcode:2005PNAS..10211373J. doi:10.1073/pnas.0503528102. PMC 1183565. PMID 16076957.
- ^ Long M, Langley CH (duben 1993). "Přirozený výběr a původ jingwei, chiméricky zpracovaného funkčního genu v Drosophila". Věda. 260 (5104): 91–5. Bibcode:1993Sci ... 260 ... 91L. doi:10.1126 / science.7682012. PMID 7682012.
- ^ Galindo MI, Pueyo JI, Fouix S, Bishop SA, Couso JP (May 2007). "Peptides encoded by short ORFs control development and define a new eukaryotic gene family". PLOS Biology. 5 (5): e106. doi:10.1371/journal.pbio.0050106. PMC 1852585. PMID 17439302.
- ^ Hsu PY, Benfey PN (May 2018). "Small but Mighty: Functional Peptides Encoded by Small ORFs in Plants". Proteomika. 18 (10): e1700038. doi:10.1002/pmic.201700038. PMID 28759167.
- ^ Nelson BR, Makarewich CA, Anderson DM, Winders BR, Troupes CD, Wu F, Reese AL, McAnally JR, Chen X, Kavalali ET, Cannon SC, Houser SR, Bassel-Duby R, Olson EN (January 2016). "A peptide encoded by a transcript annotated as long noncoding RNA enhances SERCA activity in muscle". Věda. 351 (6270): 271–5. Bibcode:2016Sci...351..271N. doi:10.1126/science.aad4076. PMC 4892890. PMID 26816378.
- ^ Andrews SJ, Rothnagel JA (March 2014). "Emerging evidence for functional peptides encoded by short open reading frames". Genetika hodnocení přírody. 15 (3): 193–204. doi:10.1038/nrg3520. PMID 24514441.
- ^ Nishida H (November 2006). "Detection and characterization of fungal-specific proteins in Saccharomyces cerevisiae". Bioscience, Biotechnology, and Biochemistry. 70 (11): 2646–52. doi:10.1271/bbb.60251. PMID 17090923. S2CID 11035512.
- ^ A b C McLysaght A, Guerzoni D (September 2015). „Nové geny z nekódující sekvence: role genů kódujících proteiny de novo v eukaryotické evoluční inovaci“. Filozofické transakce Královské společnosti v Londýně. Série B, Biologické vědy. 370 (1678): 20140332. doi:10.1098 / rstb.2014.0332. PMC 4571571. PMID 26323763.
- ^ Cai J, Zhao R, Jiang H, Wang W (May 2008). "De novo origination of a new protein-coding gene in Saccharomyces cerevisiae". Genetika. 179 (1): 487–96. doi:10.1534 / genetika.107.084491. PMC 2390625. PMID 18493065.
- ^ Bungard D, Copple JS, Yan J, Chhun JJ, Kumirov VK, Foy SG, et al. (Listopad 2017). "Foldability of a Natural De Novo Evolved Protein". Struktura. 25 (11): 1687–1696.e4. doi:10.1016/j.str.2017.09.006. PMC 5677532. PMID 29033289.
- ^ Li D, Dong Y, Jiang Y, Jiang H, Cai J, Wang W (April 2010). "A de novo originated gene depresses budding yeast mating pathway and is repressed by the protein encoded by its antisense strand". Cell Research. 20 (4): 408–20. doi:10.1038/cr.2010.31. PMID 20195295.
- ^ Li D, Yan Z, Lu L, Jiang H, Wang W (December 2014). "Pleiotropy of the de novo-originated gene MDF1". Vědecké zprávy. 4: 7280. Bibcode:2014NatSR...4E7280L. doi:10.1038/srep07280. PMC 4250933. PMID 25452167.
- ^ Li L, Foster CM, Gan Q, Nettleton D, James MG, Myers AM, et al. (Květen 2009). "Identification of the novel protein QQS as a component of the starch metabolic network in Arabidopsis leaves". The Plant Journal. 58 (3): 485–98. doi:10.1111/j.1365-313X.2009.03793.x. PMID 19154206.
- ^ Heinen TJ, Staubach F, Häming D, Tautz D (September 2009). "Emergence of a new gene from an intergenic region". Aktuální biologie. 19 (18): 1527–31. doi:10.1016/j.cub.2009.07.049. PMID 19733073. S2CID 12446879.
- ^ A b C d E F G h Toll-Riera M, Bosch N, Bellora N, Castelo R, Armengol L, Estivill X, et al. (Březen 2009). "Origin of primate orphan genes: a comparative genomics approach". Molekulární biologie a evoluce. 26 (3): 603–12. doi:10.1093/molbev/msn281. PMID 19064677.
- ^ A b C d Knowles DG, McLysaght A (October 2009). „Nedávný původ genů kódujících lidské proteiny de novo“. Výzkum genomu. 19 (10): 1752–9. doi:10.1101 / gr.095026.109. PMC 2765279. PMID 19726446.
- ^ A b Domazet-Loso T, Brajković J, Tautz D (November 2007). "A phylostratigraphy approach to uncover the genomic history of major adaptations in metazoan lineages". Trendy v genetice. 23 (11): 533–9. doi:10.1016/j.tig.2007.08.014. PMID 18029048.
- ^ A b C Gehrmann T, Reinders MJ (November 2015). "Proteny: discovering and visualizing statistically significant syntenic clusters at the proteome level". Bioinformatika. 31 (21): 3437–44. doi:10.1093/bioinformatics/btv389. PMC 4612220. PMID 26116928.
- ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (říjen 1990). Msgstr "Základní vyhledávací nástroj pro místní zarovnání". Journal of Molecular Biology. 215 (3): 403–10. doi:10.1016 / S0022-2836 (05) 80360-2. PMID 2231712.
- ^ A b C d E F G McLysaght A, Hurst LD (September 2016). "Open questions in the study of de novo genes: what, how and why". Genetika hodnocení přírody. 17 (9): 567–78. doi:10.1038/nrg.2016.78. PMID 27452112. S2CID 6033249.
- ^ Elhaik E, Sabath N, Graur D (January 2006). "The "inverse relationship between evolutionary rate and age of mammalian genes" is an artifact of increased genetic distance with rate of evolution and time of divergence". Molekulární biologie a evoluce. 23 (1): 1–3. doi:10.1093/molbev/msj006. PMID 16151190.
- ^ Albà MM, Castresana J (April 2007). "On homology searches by protein Blast and the characterization of the age of genes". BMC Evoluční biologie. 7: 53. doi:10.1186/1471-2148-7-53. PMC 1855329. PMID 17408474.
- ^ Moyers BA, Zhang J (May 2016). "Evaluating Phylostratigraphic Evidence for Widespread De Novo Gene Birth in Genome Evolution". Molekulární biologie a evoluce. 33 (5): 1245–56. doi:10.1093/molbev/msw008. PMC 5010002. PMID 26758516.
- ^ A b Moyers BA, Zhang J (January 2015). "Phylostratigraphic bias creates spurious patterns of genome evolution". Molekulární biologie a evoluce. 32 (1): 258–67. doi:10.1093/molbev/msu286. PMC 4271527. PMID 25312911.
- ^ A b Domazet-Lošo T, Carvunis AR, Albà MM, Šestak MS, Bakaric R, Neme R, et al. (Duben 2017). "No Evidence for Phylostratigraphic Bias Impacting Inferences on Patterns of Gene Emergence and Evolution". Molekulární biologie a evoluce. 34 (4): 843–856. doi:10.1093/molbev/msw284. PMC 5400388. PMID 28087778.
- ^ Altschul SF, Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ (September 1997). "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs". Výzkum nukleových kyselin. 25 (17): 3389–402. doi:10.1093/nar/25.17.3389. PMC 146917. PMID 9254694.
- ^ Saripella GV, Sonnhammer EL, Forslund K (September 2016). "Benchmarking the next generation of homology inference tools". Bioinformatika. 32 (17): 2636–41. doi:10.1093/bioinformatics/btw305. PMC 5013910. PMID 27256311.
- ^ A b Vakirlis N, McLysaght A (2019). "Computational Prediction of De Novo Emerged Protein-Coding Genes". Computational Methods in Protein Evolution. Metody v molekulární biologii. 1851. str. 63–81. doi:10.1007/978-1-4939-8736-8_4. ISBN 978-1-4939-8735-1. PMID 30298392.
- ^ Ghiurcuta CG, Moret BM (June 2014). "Evaluating synteny for improved comparative studies". Bioinformatika. 30 (12): i9-18. doi:10.1093/bioinformatics/btu259. PMC 4058928. PMID 24932010.
- ^ Jean G, Nikolski M (2011). "SyDiG: uncovering Synteny in Distant Genomes" (PDF). International Journal of Bioinformatics Research and Applications. 7 (1): 43–62. doi:10.1504/IJBRA.2011.039169. PMID 21441096.
- ^ Liu D, Hunt M, Tsai IJ (January 2018). "Inferring synteny between genome assemblies: a systematic evaluation". BMC bioinformatika. 19 (1): 26. doi:10.1186/s12859-018-2026-4. PMC 5791376. PMID 29382321.
- ^ Ranz JM, Casals F, Ruiz A (February 2001). "How malleable is the eukaryotic genome? Extreme rate of chromosomal rearrangement in the genus Drosophila". Výzkum genomu. 11 (2): 230–9. doi:10.1101/gr.162901. PMC 311025. PMID 11157786.
- ^ A b Lu TC, Leu JY, Lin WC (November 2017). "A Comprehensive Analysis of Transcript-Supported De Novo Genes in Saccharomyces sensu stricto Yeasts". Molekulární biologie a evoluce. 34 (11): 2823–2838. doi:10.1093/molbev/msx210. PMC 5850716. PMID 28981695.
- ^ A b C d Li ZW, Chen X, Wu Q, Hagmann J, Han TS, Zou YP, Ge S, Guo YL (August 2016). "On the Origin of De Novo Genes in Arabidopsis thaliana Populations". Biologie genomu a evoluce. 8 (7): 2190–202. doi:10.1093/gbe/evw164. PMC 4987118. PMID 27401176.
- ^ A b C d E Chen S, Zhang YE, Long M (December 2010). "New genes in Drosophila quickly become essential". Věda. 330 (6011): 1682–5. Bibcode:2010Sci...330.1682C. doi:10.1126/science.1196380. PMC 7211344. PMID 21164016. S2CID 7899890.
- ^ A b C d E F G Zhao L, Saelao P, Jones CD, Begun DJ (February 2014). "Origin and spread of de novo genes in Drosophila melanogaster populations". Věda. 343 (6172): 769–72. Bibcode:2014Sci...343..769Z. doi:10.1126/science.1248286. PMC 4391638. PMID 24457212.
- ^ A b C d Zhou Q, Zhang G, Zhang Y, Xu S, Zhao R, Zhan Z, et al. (Září 2008). „O původu nových genů v Drosophile“. Výzkum genomu. 18 (9): 1446–55. doi:10.1101 / gr.076588.108. PMC 2527705. PMID 18550802.
- ^ A b C d E F G Wu DD, Irwin DM, Zhang YP (November 2011). "De novo origin of human protein-coding genes". Genetika PLOS. 7 (11): e1002379. doi:10.1371/journal.pgen.1002379. PMC 3213175. PMID 22102831.
- ^ A b Doolittle WF, Brunet TD, Linquist S, Gregory TR (May 2014). "Distinguishing between "function" and "effect" in genome biology". Biologie genomu a evoluce. 6 (5): 1234–7. doi:10.1093/gbe/evu098. PMC 4041003. PMID 24814287.
- ^ A b Kellis M, Wold B, Snyder MP, Bernstein BE, Kundaje A, Marinov GK, et al. (Duben 2014). "Defining functional DNA elements in the human genome". Sborník Národní akademie věd Spojených států amerických. 111 (17): 6131–8. Bibcode:2014PNAS..111.6131K. doi:10.1073/pnas.1318948111. PMC 4035993. PMID 24753594.
- ^ Keeling, DM; Garza, P; Nartey, CM; Carvunis, AR (1 November 2019). "The meanings of 'function' in biology and the problematic case of de novo gene emergence". eLife. 8. doi:10.7554/eLife.47014. PMC 6824840. PMID 31674305.
- ^ Andersson DI, Jerlström-Hultqvist J, Näsvall J (June 2015). "Evolution of new functions de novo and from preexisting genes". Perspektivy Cold Spring Harbor v biologii. 7 (6): a017996. doi:10.1101/cshperspect.a017996. PMC 4448608. PMID 26032716.
- ^ Xie C, Bekpen C, Künzel S, Keshavarz M, Krebs-Wheaton R, Skrabar N, et al. (January 2019). „Studium úsvitu vývoje genů de novo u myší odhaluje rychlou integraci nových genů do funkčních sítí“. bioRxiv. bioRxiv 10.1101/510214. doi:10.1101/510214.
- ^ Ruiz-Orera J, Hernandez-Rodriguez J, Chiva C, Sabidó E, Kondova I, Bontrop R a kol. (Prosinec 2015). „Počátky genů de Novo u člověka a šimpanze“. Genetika PLOS. 11 (12): e1005721. arXiv:1507.07744. Bibcode:2015arXiv150707744R. doi:10.1371 / journal.pgen.1005721. PMC 4697840. PMID 26720152.
- ^ A b C d E F G h i j k l m n Ó Carvunis AR, Rolland T, Wapinski I, Calderwood MA, Yildirim MA, Simonis N a kol. (Červenec 2012). „Protogeny a zrození genů de novo“. Příroda. 487 (7407): 370–4. Bibcode:2012Natur.487..370C. doi:10.1038 / příroda11184. PMC 3401362. PMID 22722833.
- ^ A b C d Durand, É; Gagnon-Arsenault, I; Hallin, J; Hatin, já; Dubé, AK; Nielly-Thibault, L; Namy, O; Landry, ČR (červen 2019). „Obrat transkriptů asociovaných s ribozomy z de novo ORF produkuje genové charakteristiky dostupné pro výskyt de novo genů v populacích divokých kvasinek“. Výzkum genomu. 29 (6): 932–943. doi:10,1101 / gr.239822.118. PMC 6581059. PMID 31152050.
- ^ A b C Casola C (2018). „Od de novo po„ de nono “: většina nových genů kódujících proteiny identifikovaných pomocí fylostratigrafie představují staré geny nebo nedávné duplikáty.“. bioRxiv. bioRxiv 10.1101/287193. doi:10.1101/287193.
- ^ A b Neme R, Tautz D (únor 2013). „Fylogenetické vzorce vzniku nových genů podporují model časté evoluce de novo“. BMC Genomics. 14: 117. doi:10.1186/1471-2164-14-117. PMC 3616865. PMID 23433480.
- ^ A b C d Schmitz JF, Ullrich KK, Bornberg-Bauer E (říjen 2018). „Počáteční geny de novo se mohou vyvinout ze zmrazených nehod, které unikly rychlému obratu přepisu“. Ekologie a evoluce přírody. 2 (10): 1626–1632. doi:10.1038 / s41559-018-0639-7. PMID 30201962. S2CID 52181376.
- ^ Vakirlis, N; Carvunis, AR; McLysaght, A (18. února 2020). „Analýzy založené na syntéze naznačují, že divergence sekvencí není hlavním zdrojem osiřelých genů“. eLife. 9. doi:10,7554 / eLife.53500. PMC 7028367. PMID 32066524.
- ^ A b C Palmieri N, Kosiol C, Schlötterer C (únor 2014). „Životní cyklus genů pro vzácná onemocnění Drosophila“. eLife. 3: e01311. arXiv:1401.4956. Bibcode:2014arXiv1401.4956P. doi:10,7554 / eLife.01311. PMC 3927632. PMID 24554240.
- ^ A b Prabh N, Roeseler W, Witte H, Eberhardt G, Sommer RJ, Rödelsperger C (listopad 2018). "Hlístice Pristionchus". Výzkum genomu. 28 (11): 1664–1674. doi:10,1101 / gr.234971.118. PMC 6211646. PMID 30232197.
- ^ A b Wissler L, Gadau J, Simola DF, Helmkampf M, Bornberg-Bauer E (2013). "Mechanismy a dynamika vzniku osiřelých genů v genomech hmyzu". Biologie genomu a evoluce. 5 (2): 439–55. doi:10.1093 / gbe / evt009. PMC 3590893. PMID 23348040.
- ^ Neme R, Tautz D (únor 2016). „Rychlý obrat transkripce genomu v průběhu evolučního času vystavuje celou nekódující DNA vzniku genu de novo“. eLife. 5: e09977. doi:10,7554 / eLife.09977. PMC 4829534. PMID 26836309.
- ^ Kutter C, Watt S, Stefflova K, Wilson MD, Goncalves A, Ponting CP, Odom DT, Marques AC (2012). „Rychlý obrat dlouhých nekódujících RNA a vývoj genové exprese“. Genetika PLOS. 8 (7): e1002841. doi:10.1371 / journal.pgen.1002841. PMC 3406015. PMID 22844254.
- ^ A b C Ekman D, Elofsson A (únor 2010). „Identifikace a kvantifikace sekvencí osiřelých proteinů v houbách“. Journal of Molecular Biology. 396 (2): 396–405. doi:10.1016 / j.jmb.2009.11.053. PMID 19944701.
- ^ Domazet-Loso T, Tautz D (říjen 2003). „Evoluční analýza osiřelých genů v Drosophile“. Výzkum genomu. 13 (10): 2213–9. doi:10,1101 / gr. 1311003. PMC 403679. PMID 14525923.
- ^ Guo WJ, Li P, Ling J, Ye SP (2007). „Významné srovnávací charakteristiky mezi geny pro vzácná onemocnění a pro jiná onemocnění v genomu rýže (Oryza sativa L.)“. Srovnávací a funkční genomika. 2007: 21676. doi:10.1155/2007/21676. PMC 2216055. PMID 18273382.
- ^ Wolf YI, PS Novichkov, Karev GP, Koonin EV, Lipman DJ (květen 2009). „Univerzální distribuce evolučních rychlostí genů a odlišné charakteristiky eukaryotických genů různého zjevného věku“. Sborník Národní akademie věd Spojených států amerických. 106 (18): 7273–80. doi:10.1073 / pnas.0901808106. PMC 2666616. PMID 19351897.
- ^ A b Sun W, Zhao XW, Zhang Z (září 2015). „Identifikace a vývoj osiřelých genů v bource morušového, Bombyx mori“. FEBS Dopisy. 589 (19 Pt B): 2731–8. doi:10.1016 / j.febslet.2015.08.008. PMID 26296317.
- ^ A b C Donoghue MT, Keshavaiah C, Swamidatta SH, Spillane C (únor 2011). "Evoluční původ genů specifických pro Brassicaceae v Arabidopsis thaliana". BMC Evoluční biologie. 11: 47. doi:10.1186/1471-2148-11-47. PMC 3049755. PMID 21332978.
- ^ A b C d Werner MS, Sieriebriennikov B, Prabh N, Loschko T, Lanz C, Sommer RJ (listopad 2018). „Mladé geny mají odlišnou genovou strukturu, epigenetické profily a transkripční regulaci“. Výzkum genomu. 28 (11): 1675–1687. doi:10,1101 / gr. 234872.118. PMC 6211652. PMID 30232198.
- ^ A b C d E Vakirlis N, Hebert AS, Opulente DA, Achaz G, Hittinger CT, Fischer G, Coon JJ, Lafontaine I (březen 2018). „Molekulární portrét genů de Novo v kvasnicích“. Molekulární biologie a evoluce. 35 (3): 631–645. doi:10,1093 / molbev / msx315. PMC 5850487. PMID 29220506.
- ^ A b C d E F G h i j Wilson BA, Foy SG, Neme R, Masel J (červen 2017). „Mladé geny jsou vysoce neuspořádané, jak předpovídá předeadaptační hypotéza z roku 2006 de novo genové narození ". Ekologie a evoluce přírody. 1 (6): 0146–146. doi:10.1038 / s41559-017-0146. PMC 5476217. PMID 28642936.
- ^ A b C Foy SG, Wilson BA, Bertram J, Cordes MH, Masel J (duben 2019). „Posun ve strategii zabránění agregaci označuje dlouhodobý směr k vývoji proteinů“. Genetika. 211 (4): 1345–1355. doi:10.1534 / genetika.118.301719. PMC 6456324. PMID 30692195.
- ^ A b Zhang, JY; Zhou, Q (1. ledna 2019). „O regulačním vývoji nových genů v průběhu jejich životní historie“. Molekulární biologie a evoluce. 36 (1): 15–27. doi:10.1093 / molbev / msy206. PMID 30395322. S2CID 53216993.
- ^ Wu B, Knudson A (červenec 2018). „De Novo původ proteinů kódujících proteiny v kvasnicích“. mBio. 9 (4). doi:10,1 128 / mBio.01024-18. PMC 6069113. PMID 30065088.
- ^ A b Bekpen C, Xie C, Tautz D (srpen 2018). „Řešení adaptivního imunitního systému během de novo evoluce genů z intergenních sekvencí“. BMC Evoluční biologie. 18 (1): 121. doi:10.1186 / s12862-018-1232-z. PMC 6091031. PMID 30075701.
- ^ Pertea M, Shumate A, Pertea G, Varabyou A, Chang YC, Madugundu A a kol. (2018). „Tisíce rozsáhlých experimentů se sekvenováním RNA poskytují komplexní nový seznam lidských genů a odhalují rozsáhlý transkripční šum“. bioRxiv. bioRxiv 10.1101/332825. doi:10.1101/332825.
- ^ A b Abrusán G (prosinec 2013). „Integrace nových genů do celulárních sítí a jejich strukturální zrání“. Genetika. 195 (4): 1407–17. doi:10.1534 / genetika.113.152256. PMC 3832282. PMID 24056411.
- ^ A b C Basile W, Sachenkova O, Light S, Elofsson A (březen 2017). „Vysoký obsah GC způsobuje, že jsou osiřelé proteiny skutečně narušeny“. PLOS výpočetní biologie. 13 (3): e1005375. Bibcode:2017PLSCB..13E5375B. doi:10.1371 / journal.pcbi.1005375. PMC 5389847. PMID 28355220.
- ^ Bitard-Feildel T, Heberlein M, Bornberg-Bauer E, Callebaut I (prosinec 2015). „Detekce osiřelých domén v Drosophile pomocí“ hydrofobní shlukové analýzy"". Biochimie. 119: 244–53. doi:10.1016 / j.biochi.2015.02.019. PMID 25736992.
- ^ Mukherjee S, Panda A, Ghosh TC (červen 2015). „Objasňující evoluční rysy a funkční důsledky osiřelých genů u Leishmania major“. Infekce, genetika a evoluce. 32: 330–7. doi:10.1016 / j.meegid.2015.03.031. PMID 25843649.
- ^ Jeon J, Choi J, Lee GW, Park SY, Huh A, Dean RA a kol. (Únor 2015). „Profilování methylace DNA v celém genomu poskytuje poznatky o epigenetické regulaci vývoje hub v rostlině patogenní houby, Magnaporthe oryzae“. Vědecké zprávy. 5: 8567. Bibcode:2015NatSR ... 5E8567J. doi:10.1038 / srep08567. PMC 4338423. PMID 25708804.
- ^ Zhuang X, Yang C, Murphy KR, Cheng CC (únor 2019). "Molekulární mechanismus a historie nesmyslu vnímat vývoj nemrznoucího glykoproteinového genu v severních gadidech". Sborník Národní akademie věd Spojených států amerických. 116 (10): 4400–4405. doi:10.1073 / pnas.1817138116. PMC 6410882. PMID 30765531.
- ^ Reinhardt JA, Wanjiru BM, Brant AT, Saelao P, Begun DJ, Jones CD (2013). „De novo ORF v Drosophile jsou důležité pro tělesnou zdatnost a rychle se vyvinuly z dříve nekódujících sekvencí“. Genetika PLOS. 9 (10): e1003860. doi:10.1371 / journal.pgen.1003860. PMC 3798262. PMID 24146629.
- ^ Dinger ME, Pang KC, Mercer TR, Mattick JS (listopad 2008). „Diferenciace proteinové a nekódující RNA: výzvy a nejednoznačnosti“. PLOS výpočetní biologie. 4 (11): e1000176. Bibcode:2008PLSCB ... 4E0176D. doi:10.1371 / journal.pcbi.1000176. PMC 2518207. PMID 19043537.
- ^ Stewart, Nicholas B .; Rogers, Rebekah L .; Malik, Harmit S. (23. září 2019). „Chromozomální přesmyky jako zdroj tvorby nových genů v Drosophila yakuba“. Genetika PLOS. 15 (9): e1008314. doi:10.1371 / journal.pgen.1008314. PMC 6776367. PMID 31545792.
- ^ Swanson WJ, Vacquier VD (únor 2002). "Rychlý vývoj reprodukčních proteinů". Genetika hodnocení přírody. 3 (2): 137–44. doi:10.1038 / nrg733. PMID 11836507. S2CID 25696990.
- ^ Bustamante CD, Fledel-Alon A, Williamson S, Nielsen R, Hubisz MT, Glanowski S, Tanenbaum DM, White TJ, Sninsky JJ, Hernandez RD, Civello D, Adams MD, Cargill M, Clark AG (říjen 2005). "Přirozený výběr genů kódujících proteiny v lidském genomu". Příroda. 437 (7062): 1153–7. Bibcode:2005 Natur.437.1153B. doi:10.1038 / nature04240. PMID 16237444. S2CID 4423768.
- ^ Clark NL, Aagaard JE, Swanson WJ (leden 2006). "Vývoj reprodukčních bílkovin ze zvířat a rostlin". Reprodukce. 131 (1): 11–22. doi:10.1530 / rep. 1.00357. PMID 16388004.
- ^ Gubala AM, Schmitz JF, Kearns MJ, Vinh TT, Bornberg-Bauer E, Wolfner MF, Findlay GD (květen 2017). „Goddardovy a saturnské geny jsou nezbytné pro mužskou plodnost drosophily a mohou vzniknout de novo“. Molekulární biologie a evoluce. 34 (5): 1066–1082. doi:10.1093 / molbev / msx057. PMC 5400382. PMID 28104747.
- ^ A b C Luis Villanueva-Cañas J, Ruiz-Orera J, Agea MI, Gallo M, Andreu D, Albà MM (červenec 2017). „Nové geny a funkční inovace u savců“. Biologie genomu a evoluce. 9 (7): 1886–1900. doi:10.1093 / gbe / evx136. PMC 5554394. PMID 28854603.
- ^ Schmidt EE (červenec 1996). "Transkripční promiskuita ve varlatech". Aktuální biologie. 6 (7): 768–9. doi:10.1016 / S0960-9822 (02) 00589-4. PMID 8805310. S2CID 14318566.
- ^ White-Cooper H, Davidson I (červenec 2011). „Unikátní aspekty regulace transkripce v mužských zárodečných buňkách“. Perspektivy Cold Spring Harbor v biologii. 3 (7): a002626. doi:10.1101 / cshperspect.a002626. PMC 3119912. PMID 21555408.
- ^ Kleene KC (srpen 2001). „Možná meiotická funkce zvláštních vzorů genové exprese v spermatogenních buňkách savců“. Mechanismy rozvoje. 106 (1–2): 3–23. doi:10.1016 / S0925-4773 (01) 00413-0. PMID 11472831. S2CID 949694.
- ^ David L, Huber W, Granovskaia M, Toedling J, Palm CJ, Bofkin L, Jones T, Davis RW, Steinmetz LM (duben 2006). „Mapa transkripce s vysokým rozlišením v genomu kvasinek“. Sborník Národní akademie věd Spojených států amerických. 103 (14): 5320–5. Bibcode:2006PNAS..103,5320D. doi:10.1073 / pnas.0601091103. PMC 1414796. PMID 16569694.
- ^ Tisseur M, Kwapisz M, Morillon A (listopad 2011). "Všudypřítomný přepis - lekce z kvasinek". Biochimie. 93 (11): 1889–96. doi:10.1016 / j.biochi.2011.07.001. PMID 21771634.
- ^ Nagalakshmi U, Wang Z, Waern K, Shou C, Raha D, Gerstein M, Snyder M (červen 2008). „Transkripční krajina kvasinkového genomu definovaná sekvenováním RNA“. Věda. 320 (5881): 1344–9. Bibcode:2008Sci ... 320.1344N. doi:10.1126 / science.1158441. PMC 2951732. PMID 18451266.
- ^ Clark MB, Amaral PP, Schlesinger FJ, Dinger ME, Taft RJ, Rinn JL, Ponting CP, Stadler PF, Morris KV, Morillon A, Rozowsky JS, Gerstein MB, Wahlestedt C, Hayashizaki Y, Carninci P, Gingeras TR, Mattick JS (Červenec 2011). „Realita všudypřítomné transkripce“. PLOS Biology. 9 (7): e1000625, diskuse e1001102. doi:10.1371 / journal.pbio.1000625. PMC 3134446. PMID 21765801.
- ^ A b Ingolia NT, Brar GA, Stern-Ginossar N, Harris MS, Talhouarne GJ, Jackson SE a kol. (Září 2014). „Ribosomové profilování odhaluje všudypřítomný překlad mimo anotované geny kódující proteiny“. Zprávy buněk. 8 (5): 1365–79. doi:10.1016 / j.celrep.2014.07.045. PMC 4216110. PMID 25159147.
- ^ A b Ruiz-Orera J, Verdaguer-Grau P, Villanueva-Cañas JL, Messeguer X, Albà MM (květen 2018). „Překlad neutrálně se vyvíjejících peptidů poskytuje základ pro vývoj genů de novo“. Ekologie a evoluce přírody. 2 (5): 890–896. doi:10.1038 / s41559-018-0506-6. hdl:10230/36048. PMID 29556078. S2CID 4959952.
- ^ Ruiz-Orera J, Messeguer X, Subirana JA, Alba MM (září 2014). „Dlouhé nekódující RNA jako zdroj nových peptidů“. eLife. 3: e03523. arXiv:1405.4174. Bibcode:2014arXiv1405.4174R. doi:10,7554 / eLife.03523. PMC 4359382. PMID 25233276.
- ^ A b C Wilson BA, Masel J (2011). „Předpokládané nekódující přepisy ukazují rozsáhlou souvislost s ribozomy“. Biologie genomu a evoluce. 3: 1245–52. doi:10.1093 / gbe / evr099. PMC 3209793. PMID 21948395.
- ^ Chen, J; Brunner, AD; Cogan, JZ; Nuñez, JK; Fields, AP; Adamson, B; Itzhak, DN; Li, JY; Mann, M; Leonetti, MD; Weissman, JS (6. března 2020). "Všudypřítomný funkční překlad nekanonických lidských otevřených čtecích rámců". Věda. 367 (6482): 1140–1146. Bibcode:2020Sci ... 367.1140C. doi:10.1126 / science.aay0262. PMC 7289059. PMID 32139545.
- ^ Keefe AD, Szostak JW (duben 2001). "Funkční proteiny z knihovny náhodných sekvencí". Příroda. 410 (6829): 715–8. Bibcode:2001 Natur.410..715K. doi:10.1038/35070613. PMC 4476321. PMID 11287961.
- ^ Tretyachenko V, Vymětal J, Bednárová L, Kopecký V, Hofbauerová K, Jindrová H a kol. (Listopad 2017). „Náhodné proteinové sekvence mohou tvořit definované sekundární struktury a jsou dobře tolerovány in vivo“. Vědecké zprávy. 7 (1): 15449. Bibcode:2017NatSR ... 715449T. doi:10.1038 / s41598-017-15635-8. PMC 5684393. PMID 29133927.
- ^ Wright PE, Dyson HJ (leden 2015). „Jiskrově neuspořádané proteiny v buněčné signalizaci a regulaci“. Nature Reviews Molecular Cell Biology. 16 (1): 18–29. doi:10.1038 / nrm3920. PMC 4405151. PMID 25531225.
- ^ Neme R, Amador C, Yildirim B, McConnell E, Tautz D (červen 2017). „Náhodné sekvence jsou bohatým zdrojem bioaktivních RNA nebo peptidů“. Ekologie a evoluce přírody. 1 (6): 0217. doi:10.1038 / s41559-017-0127. PMC 5447804. PMID 28580432.
- ^ A b Silveira AB, Trontin C, Cortijo S, Barau J, Del Bem LE, Loudet O a kol. (Duben 2013). „Rozsáhlá přirozená epigenetická variace u genu vzniklého de novo“. Genetika PLOS. 9 (4): e1003437. doi:10.1371 / journal.pgen.1003437. PMC 3623765. PMID 23593031.
- ^ Kimmins S, Sassone-Corsi P (březen 2005). "Remodelace chromatinu a epigenetické vlastnosti zárodečných buněk". Příroda. 434 (7033): 583–9. Bibcode:2005 Natur.434..583K. doi:10.1038 / nature03368. PMID 15800613. S2CID 4373304.
- ^ A b C d Rajon E, Masel J (leden 2011). „Vývoj rychlosti molekulárních chyb a důsledky pro vyvíjitelnost“. Sborník Národní akademie věd Spojených států amerických. 108 (3): 1082–7. Bibcode:2011PNAS..108.1082R. doi:10.1073 / pnas.1012918108. PMC 3024668. PMID 21199946.
- ^ Masel, Joanna (březen 2006). „Kryptická genetická variace je obohacena o potenciální adaptace“. Genetika. 172 (3): 1985–1991. doi:10.1534 / genetika.105.051649. PMC 1456269. PMID 16387877.
- ^ Willis S, Masel J (září 2018). „Narození genů přispívá ke strukturálním poruchám kódovaným překrývajícími se geny“. Genetika. 210 (1): 303–313. doi:10.1534 / genetika.118.301249. PMC 6116962. PMID 30026186.
- ^ Giacomelli, Michael G .; Hancock, Adam S .; Masel, Joanna (únor 2007). „Konverze 3 ′ UTR do kódovacích oblastí“. Molekulární biologie a evoluce. 24 (2): 457–464. doi:10.1093 / molbev / msl172. PMC 1808353. PMID 17099057.
- ^ A b C Bornberg-Bauer E, Schmitz J, Heberlein M (říjen 2015). „Vznik proteinů de novo z„ temné genomové hmoty “pomocí„ roste pomalu a líná'". Transakce s biochemickou společností. 43 (5): 867–73. doi:10.1042 / BST20150089. PMID 26517896.
- ^ Wilder, Jason A .; Hewett, Elizabeth K .; Gansner, Meredith E. (prosinec 2009). „Molekulární evoluce GYPC: důkazy o nedávných strukturálních inovacích a pozitivním výběru u lidí“. Molekulární biologie a evoluce. 26 (12): 2679–2687. doi:10,1093 / molbev / msp183. PMC 2775107. PMID 19679754.
- ^ Vakhrusheva, Anna A .; Kazanov, Marat D .; Mironov, Andrey A .; Bazykin, Georgii A. (17. listopadu 2010). "Vývoj prokaryotických genů posunem stop kodonů". Journal of Molecular Evolution. 72 (2): 138–146. doi:10.1007 / s00239-010-9408-1. PMID 21082168. S2CID 812377.
- ^ Andreatta, Matthew E .; Levine, Joshua A .; Foy, Scott G .; Guzman, Lynette D .; Kosinski, Luke J .; Cordes, Matthew H.J .; Masel, Joanna (červen 2015). „Nedávný původ de novo z bílkovin C-Termini“. Biologie genomu a evoluce. 7 (6): 1686–1701. doi:10.1093 / gbe / evv098. PMC 4494051. PMID 26002864.
- ^ Kleppe AS, Bornberg-Bauer E (listopad 2018). „Robustnost s vnitřně narušenými C-konci a translační přečtením“. Výzkum nukleových kyselin. 46 (19): 10184–10194. doi:10.1093 / nar / gky778. PMC 6365619. PMID 30247639.
- ^ Klasberg S, Bitard-Feildel T, Callebaut I, Bornberg-Bauer E (červenec 2018). "Počátky a strukturní vlastnosti nových a de novo proteinových domén během vývoje hmyzu". FEBS Journal. 285 (14): 2605–2625. doi:10.1111 / febs.14504. PMID 29802682.
- ^ Chen S, Krinsky BH, Long M (září 2013). „Nové geny jako hybné síly fenotypové evoluce“. Genetika hodnocení přírody. 14 (9): 645–60. doi:10.1038 / nrg3521. PMC 4236023. PMID 23949544.
- ^ Suenaga Y, Islam SM, Alagu J, Kaneko Y, Kato M, Tanaka Y a kol. (Leden 2014). „NCYM, Cis-antisense gen MYCN, kóduje de novo vyvinutý protein, který inhibuje GSK3β, což vede ke stabilizaci MYCN v lidských neuroblastomech“. Genetika PLOS. 10 (1): e1003996. doi:10.1371 / journal.pgen.1003996. PMC 3879166. PMID 24391509.
- ^ Lin B, White JT, Ferguson C, Bumgarner R, Friedman C, Trask B a kol. (Únor 2000). „ČÁST-1: nový gen specifický pro lidskou prostatu, regulovaný androgeny, který se mapuje na chromozom 5q12“. Výzkum rakoviny. 60 (4): 858–63. PMID 10706094.
- ^ Kang M, Ren M, Li Y, Fu Y, Deng M, Li C (červenec 2018). „Přenos lncRNA PART1 zprostředkovaný exozomy indukuje rezistenci gefitinibu v karcinomu dlaždicových buněk jícnu prostřednictvím fungování jako konkurenční endogenní RNA“. Journal of Experimental & Clinical Cancer Research. 37 (1): 171. doi:10.1186 / s13046-018-0845-9. PMC 6063009. PMID 30049286.
- ^ Samusik N, Krukovskaya L, Meln I, Shilov E, Kozlov AP (2013). „PBOV1 je lidský de novo gen s nádorově specifickou expresí, který je spojen s pozitivním klinickým výsledkem rakoviny“. PLOS ONE. 8 (2): e56162. Bibcode:2013PLoSO ... 856162S. doi:10.1371 / journal.pone.0056162. PMC 3572036. PMID 23418531.
- ^ Guerzoni D, McLysaght A (duben 2016). „Geny De Novo vznikají pomalu, ale rovnoměrně podél primátové linie a byly podrobeny neúplnému třídění linie“. Biologie genomu a evoluce. 8 (4): 1222–32. doi:10.1093 / gbe / evw074. PMC 4860702. PMID 27056411.
- ^ Pekarsky Y, Rynditch A, Wieser R, Fonatsch C, Gardiner K (září 1997). "Aktivace nového genu v 3q21 a identifikace transkriptů intergenní fúze s ekotropním virovým inzertním místem I u leukémie". Výzkum rakoviny. 57 (18): 3914–9. PMID 9307271.
- ^ Papamichos SI, Margaritis D, Kotsianidis I (2015). „Adaptivní evoluce spojená s expretací retrotransposonu umožňující generování kódujícího genu specifického pro lidský protein, který podporuje šíření a metastázování rakovinných buněk jak u hematologických malignit, tak u pevných nádorů: mimořádný případ genu MYEOV“. Scientifica. 2015: 984706. doi:10.1155/2015/984706. PMC 4629056. PMID 26568894.
- ^ A b Kozlov AP (2016). "Exprese evolučně nových genů v nádorech". Infekční látky a rakovina. 11: 34. doi:10.1186 / s13027-016-0077-6. PMC 4949931. PMID 27437030.
- ^ Li CY, Zhang Y, Wang Z, Zhang Y, Cao C, Zhang PW a kol. (Březen 2010). „Gen specifický pro lidský de novo protein kódující asociovaný s lidskými mozkovými funkcemi“. PLOS výpočetní biologie. 6 (3): e1000734. Bibcode:2010PLSCB ... 6E0734L. doi:10.1371 / journal.pcbi.1000734. PMC 2845654. PMID 20376170.
- ^ A b Zhang YE, Landback P, Vibranovski MD, Long M (říjen 2011). „Zrychlený nábor nových genů pro vývoj mozku do lidského genomu“. PLOS Biology. 9 (10): e1001179. doi:10.1371 / journal.pbio.1001179. PMC 3196496. PMID 22028629.
- ^ Wang J, Xie G, Singh M, Ghanbarian AT, Raskó T, Szvetnik A a kol. (Prosinec 2014). „Primární specifická endogenní retrovirem řízená transkripce definuje naivní kmenové buňky“ (PDF). Příroda. 516 (7531): 405–9. Bibcode:2014 Natur.516..405W. doi:10.1038 / příroda13804. PMID 25317556. S2CID 205240839.
- ^ Dolstra H, Fredrix H, Maas F, Coulie PG, Brasseur F, Mensink E a kol. (Leden 1999). „Lidský minoritní histokompatibilní antigen specifický pro akutní lymfoblastickou leukémii B buněk“. The Journal of Experimental Medicine. 189 (2): 301–8. doi:10.1084 / jem.189.2.301. PMC 2192993. PMID 9892612.
- ^ Hunter S, Apweiler R, Attwood TK, Bairoch A, Bateman A, Binns D a kol. (Leden 2009). „InterPro: integrující databáze podpisů proteinů“. Výzkum nukleových kyselin. 37 (Problém s databází): D211-5. doi:10.1093 / nar / gkn785. PMC 2686546. PMID 18940856.
- ^ Murphy DN, McLysaght A (2012). „De novo původ genů kódujících proteiny u myší hlodavců“. PLOS ONE. 7 (11): e48650. Bibcode:2012PLoSO ... 748650M. doi:10.1371 / journal.pone.0048650. PMC 3504067. PMID 23185269.
- ^ Zhang L, Ren Y, Yang T, Li G, Chen J, Gschwend AR a kol. (Duben 2019). „Rychlý vývoj rozmanitosti proteinů vznikem de novo v Oryze“. Ekologie a evoluce přírody. 3 (4): 679–690. doi:10.1038 / s41559-019-0822-5. PMID 30858588. S2CID 73728579.
- ^ Prabh, Neel; Rödelsperger, Christian (červenec 2019). „Divergence a smíšený původ přispívají ke vzniku sirotčích genů u hlístic. G3: Geny, genomy, genetika. 9 (7): 2277–2286. doi:10,1534 / g3,119,400326. PMC 6643871. PMID 31088903.