Otevřete čtecí rámec - Open reading frame

v molekulární genetika, an otevřený čtecí rámec (ORF) je součástí a čtecí rámec která má schopnost být přeloženo. ORF je nepřetržitý úsek kodony která začíná a spustit kodon (obvykle AUG) a končí v a stop kodon (obvykle UAA, UAG nebo UGA).[1] ATG kodon (AUG ve smyslu RNA ) v rámci ORF (nemusí to být nutně první) může označovat, kde začíná překlad. The ukončení transkripce web se nachází za ORF, za překlad stop kodon. Pokud by transkripce skončila před stop kodonem, během translace by se vytvořil nekompletní protein.[2] v eukaryotický geny s více exony, introny jsou odstraněny a exony jsou po transkripci spojeny dohromady, čímž se získá finální mRNA pro překlad bílkovin. V kontextu nález genů, start-stop definice ORF proto platí pouze pro sestřihané mRNA, nikoli pro genomovou DNA, protože introny mohou obsahovat stop kodony a / nebo způsobit posuny mezi čtecími rámci. Alternativní definice říká, že ORF je sekvence, která má délku dělitelnou třemi a je omezena stop kodony[3][4]. Tato obecnější definice může být také užitečná v kontextu transkriptomika a / nebo metagenomika, kde počáteční a / nebo stop kodon nemusí být v získaných sekvencích přítomen. Takový ORF odpovídá spíše částem genu než úplnému genu.
Biologický význam
Jedno běžné použití otevřených čtecích rámců (ORF) je jedním důkazem, který vám pomůže genová predikce. K počáteční identifikaci kandidáta se často spolu s dalšími důkazy používají dlouhé ORF kódování bílkovin regiony nebo funkční RNA -kódující oblasti v a DNA sekvence.[5] Přítomnost ORF nutně neznamená, že oblast je vždy přeloženo. Například v náhodně generované sekvenci DNA se stejným procentem každého z nich nukleotid, a stop-kodon lze očekávat jednou za 21 let kodony.[5] Jednoduchý genová predikce algoritmus pro prokaryoty může hledat spustit kodon následuje otevřený čtecí rámec, který je dostatečně dlouhý na kódování typického proteinu, kde využití kodonů této oblasti odpovídá frekvenční charakteristice pro kódující oblasti daného organismu.[5] Někteří autoři proto tvrdí, že ORF by měl mít minimální délku, např. 100 kodonů[6] nebo 150 kodonů.[5] Samotný dlouhý otevřený čtecí rámec sám o sobě není přesvědčivým důkazem přítomnosti a gen.[5] Na druhou stranu bylo prokázáno, že některé krátké ORF (sORF), které postrádají klasické znaky proteinů kódujících geny (jak z ncRNA, tak mRNA), mohou produkovat funkční peptidy.[7] Je známo, že 5'NTR asi 50% savčích mRNA obsahuje jeden nebo několik sORF.[8] 64–75% experimentálně nalezených iniciačních míst translace sORF je zachováno v genomech člověka a myši a může naznačovat, že tyto prvky mají funkci.[9] Avšak sORF lze často nalézt pouze v menších formách mRNA a selekce se vyhýbají; vysoká konzervativnost iniciačních míst může být spojena s jejich umístěním uvnitř promotorů příslušných genů. Taková situace je charakteristická pro SLAMF1 gen, například.[10]
Překlad šesti snímků
Protože DNA je interpretována ve skupinách tří nukleotidů (kodonů), řetězec DNA má tři odlišné čtecí rámce.[11] Dvojitá šroubovice molekuly DNA má dvě antiparalelní řetězce; přičemž dva řetězce mají každý tři čtecí rámce, existuje šest možných překladů rámců.[11]

Vyhledávací nástroje ORF
Vyhledávač ORF
Vyhledávač ORF (Open Reading Frame Finder)[12] je grafický analytický nástroj, který najde všechny otevřené čtecí rámce volitelné minimální velikosti v sekvenci uživatele nebo v sekvenci již v databázi. Tento nástroj identifikuje všechny otevřené čtecí rámce pomocí standardních nebo alternativních genetických kódů. Odvozená aminokyselinová sekvence může být uložena v různých formátech a vyhledána v databázi sekvencí pomocí VÝBUCH serveru. Vyhledávač ORF by měl být nápomocen při přípravě úplného a přesného odeslání sekvence. Je také dodáván se softwarem pro sekvenční zadávání sekvencí (sekvenční analyzátor).
Vyšetřovatel ORF
Vyšetřovatel ORF[13] je program, který poskytuje nejen informace o kódujících a nekódujících sekvencích, ale také může provádět párové globální srovnání různých sekvencí genových / DNA oblastí. Nástroj efektivně vyhledává ORF pro odpovídající aminokyselinové sekvence a převádí je na jejich jednopísmenný aminokyselinový kód a poskytuje jejich umístění v sekvenci. Díky párovému globálnímu zarovnání mezi sekvencemi je vhodné detekovat různé mutace, včetně polymorfismus jednoho nukleotidu. Algoritmy Needleman – Wunsch se používají pro srovnání genů. Vyšetřovatel ORF je zapsán v přenosné verzi Perl programovací jazyk, a je proto k dispozici uživatelům všech běžných operačních systémů.
ORF Predictor
OrfPredictor[14] je webový server navržený pro identifikaci oblastí kódujících proteiny v sekvencích odvozených od exprimované sekvenční značky (EST). U dotazovacích sekvencí s přístupem v BLASTX program předpovídá kódovací oblasti na základě překladových čtecích rámců identifikovaných v zarovnání BLASTX, jinak předpovídá nejpravděpodobnější kódovací oblast na základě vnitřních signálů dotazovacích sekvencí. Výstupem jsou predikované peptidové sekvence ve formátu FASTA a řádek definice, který zahrnuje ID dotazu, rámec pro čtení překladu a polohy nukleotidů, kde kódující oblast začíná a končí. OrfPredictor usnadňuje anotaci sekvencí odvozených z EST, zejména u velkých projektů EST.
ORF Predictor používá kombinaci dvou různých výše uvedených definic ORF. Hledá úseky počínaje počátečním kodonem a končící stop kodonem. Jako další kritérium hledá stop kodon v 5 ' nepřeložená oblast (UTR).
ORFik
ORFik je balíček R v Bioconductor pro hledání otevřených čtecích rámců a používání sekvenčních technologií nové generace k ospravedlnění ORF.[15]
Viz také
- Kódovací oblast
- Předpokládaný gen
- Sequerome - A nástroj pro sekvenční profilování který spojuje každý VÝBUCH záznam do NCBI ORF umožňující úplnou analýzu ORF zprávy BLAST.
Reference
- ^ "Otevřít čtecí rámec". Americká národní lékařská knihovna. 19. 10. 2015. Citováno 2015-10-22.
- ^ Slonczewski, Joan; John Watkins Foster (2009). Mikrobiologie: vyvíjející se věda. New York: W.W. Norton & Co. ISBN 978-0-393-97857-5. OCLC 185042615.
- ^ Claverie, J.-M. (1997) Výpočtové metody pro identifikaci genů v genomových sekvencích obratlovců. Hučení. Mol. Genet. 6, 1735–1744.
- ^ P. Sieber, M. Platzer, S. Schuster (2018) Znovu se vrátila definice otevřeného čtecího rámce. Trendy Genet. 34, 167-170.
- ^ A b C d E Deonier, Richard; Simon Tavaré; Michael Waterman (2005). Výpočetní analýza genomu: úvod. Springer-Verlag. str. 25. ISBN 978-0-387-98785-9.
- ^ Claverie, J.-M., Poirot, O., Lopez, F. (1997) Obtížnost identifikace genů v anonymních sekvencích obratlovců. Comput. Chem. 21 203-214
- ^ Zanet, J .; Benrabah, E .; Li, T .; Pelissier-Monier, A .; Chanut-Delalande, H .; Ronsin, B .; Bellen, H. J .; Payre, F .; Plaza, S. (2015). "Pri sORF peptidy indukují selektivní zpracování proteinu zprostředkovaného proteázem". Věda. 349 (6254): 1356–1358. doi:10.1126 / science.aac5677. ISSN 0036-8075. PMID 26383956. S2CID 206639549.
- ^ Wethmar, Klaus; Barbosa-Silva, Adriano; Andrade-Navarro, Miguel A .; Leutz, Achim (01.01.2014). „uORFdb - komplexní databáze literatury o eukaryotické biologii uORF“. Výzkum nukleových kyselin. 42 (D1): D60 – D67. doi:10.1093 / nar / gkt952. ISSN 0305-1048. PMC 3964959. PMID 24163100.
- ^ Lee, Sooncheol; Liu, Botao; Lee, Soohyun; Huang, Sheng-Xiong; Shen, Ben; Qian, Shu-Bing (11.9.2012). „Globální mapování iniciačních míst translace v savčích buňkách při rozlišení jednoho nukleotidu“. Sborník Národní akademie věd. 109 (37): E2424 – E2432. doi:10.1073 / pnas.1207846109. ISSN 0027-8424. PMC 3443142. PMID 22927429.
- ^ Schwartz, Anton M .; Putlyaeva, Lidia V .; Covich, Milica; Klepíková, Anna V .; Akulich, Kseniya A .; Vorontsov, Ilya E .; Korneev, Kirill V .; Dmitriev, Sergey E .; Polanovský, Oleg L. (01.10.2016). „Časný B-buněčný faktor 1 (EBF1) je rozhodující pro transkripční kontrolu genu SLAMF1 v lidských B buňkách“. Biochimica et Biophysica Acta (BBA) - regulační mechanismy genů. 1859 (10): 1259–1268. doi:10.1016 / j.bbagrm.2016.07.004. PMID 27424222.
- ^ A b Pearson, William R .; Wood, Todd; Zhang, Zheng; Miller, Webb (1997-11-15). „Srovnání sekvencí DNA s sekvencemi proteinů“. Genomika. 46 (1): 24–36. doi:10.1006 / geno.1997.4995. ISSN 0888-7543. PMID 9403055. S2CID 6413018.
- ^ „ORFfinder“. www.ncbi.nlm.nih.gov.
- ^ Dwivedi, Vivek Dhar; Mishra, Sarad Kumar (2012). „ORF Investigator: Nový nástroj pro hledání ORF kombinující Pairwise Global Gene Alignment“. Research Journal of recent Sciences. 1 (11): 32–35.
- ^ „OrfPredictor“. bioinformatika.ysu.edu.
- ^ „ORFik - Otevřít čtecí rámce v genomice“. bioconductor.org.
externí odkazy
- Překlad a otevřené rámce pro čtení
- hORFeome V5.1 - Webový interaktivní nástroj pro kolekci CCSB Human ORFeome Collection
- Značka ORF - Bezplatný, rychlý a multiplatformní desktopový nástroj GUI pro předpovídání a analýzu ORF
- StarORF - Multiplatformní, java založený nástroj GUI pro předpovídání a analýzu ORF a získání sekvence reverzního komplementu
- ORFPřediktor - Webový server určený pro predikci ORF a překlad dávky sekvencí EST nebo cDNA