C1orf131 - C1orf131

C1orf131
Identifikátory
AliasyC1orf131, otevřený čtecí rámec chromozomu 1 131
Externí IDMGI: 1913773 HomoloGene: 11982 Genové karty: C1orf131
Umístění genu (člověk)
Chromozom 1 (lidský)
Chr.Chromozom 1 (lidský)[1]
Chromozom 1 (lidský)
Genomické umístění pro C1orf131
Genomické umístění pro C1orf131
Kapela1q42.2Start231,223,763 bp[1]
Konec231,241,187 bp[1]
Ortology
DruhČlověkMyš
Entrez
Ensembl
UniProt
RefSeq (mRNA)

NM_152379
NM_001300830

NM_025615

RefSeq (protein)

NP_001287759
NP_689592

NP_079891

Místo (UCSC)Chr 1: 231,22 - 231,24 Mbn / a
PubMed Vyhledávání[2][3]
Wikidata
Zobrazit / upravit člověkaZobrazit / upravit myš

Necharakterizovaný protein C1orf131 je protein že u lidí je kódován gen C1orf131. První ortolog tohoto proteinu byl objeven u lidí.[4][5] Následně byly pomocí algoritmů a bioinformatiky objeveny homology C1orf131 u mnoha druhů a ve výsledku se většina proteinů z této rodiny proteinů jmenuje Uncharacterized protein C1orf131 homolog.


Gen

U lidí C1orf131 se nachází na záporném řetězci chromozom 1 a na cytogenetickém pásmu 1q42.2 spolu s 193 dalšími geny.[6] Pozoruhodně gen před C1orf131 je GNPAT a gen po proudu od C1orf131 je TRIM67. Když je tento gen přepsán u lidí, C1orf131 nejčastěji tvoří mRNA o délce 1458 párů bází, která se skládá ze sedmi exonů. U lidí existuje nejméně devět dalších alternativních forem sestřihu, které produkují proteiny. Jejich velikost se pohybuje od 129 párů bází (2 exony) do 1458 párů bází (7 exonů).[7]

Protein

V proteinové rodině C1orf131 jsou proteiny dlouhé mezi 93 a 450 aminokyselinami; většina však má tendenci být mezi 160 - 295 aminokyselinami. Mají molekulovou hmotnost mezi 10,6 a 49,0 kDa, s většinou mezi 18,6 a 32,7 kDa. Mají izoelektrický bod mezi 9,6 a 11,2.[8] Bylo identifikováno více než 30 ortologů od savců, ptáků a ještěrek, které mají poly (A) RNA vazebné místo.[9] Všechny ortology v této proteinové rodině mají a doména neznámé funkce DUF4602.[9][10] Bylo prokázáno, že lidský protein je fosforylován i acetylován.[11][12][13][14][15][16] Tyto proteiny jsou lysiny bohaté, nabité aminokyseliny (DEHK.R ) a bazicky nabité aminokyseliny (HK.R ).[17] Sekundární struktura těchto proteinů primárně sestává z alfa šroubovic a cívek s malým procentem beta řetězců.[18] Bylo prokázáno, že C1orf131 interaguje s ubikvitin[19] prostřednictvím zachycení afinity následované hmotnostní spektrometrie a APLIKACE (prekurzorový protein amyloid beta (A4))[20] prostřednictvím rekonstituovaného komplexu.

Grafický přehled lidského proteinu C1orf131 s DUF4602 zobrazený zeleně, fosforylace v červených bodech a acetylace v šedém bodě.

DUF4602

DUF4602 (PF15375) je obecně 120+ aminokyselin dlouhý.[21] Typicky existuje pouze jeden gen, který obsahuje tuto doménu DUF; doména DUF však byla identifikována ve dvou různých proteinech u několika druhů. v Trichuris suis DUF4602 se nachází jak v hypotetickém proteinu M5114_09117, tak v tRNA pseudouridinsyntáze D, a v Echinocuccus granulosus DUF4602 byl nalezen v hypotetickém proteinu EGR 05135 a exprimoval konzervovaný protein. DUF4602 byl nalezen primárně v eukaryotech; ve viru však byl identifikován DUF4602 DRHN1, Bacillus sp. UNC41MFS5, Enterococcus faecalis, a Enterococcus faecalis 13-SD-W-01. V ortologech C1orf131 jsou domény DUF typicky umístěny uprostřed genu směrem k straně C-konce ve větších proteinech (250+ zbytků) a v menších ortologech (160-250 zbytků) je doména DUF umístěna poblíž N-konce . Také ve větších ortologech existují oblasti s nízkou složitostí, které by mohly naznačovat, že tyto proteiny jsou vnitřně neuspořádané proteiny.

Evoluční historie

Tato genová rodina existuje pouze u eukaryot. Neexistují žádné paralogy tohoto genu; existuje však několik pseudogeny z C1orf131. Dosud byly nalezeny pouze u orangutanů, lemurů myší a lenoch.[10] Když je tato genová rodina srovnávána s cytochromem C, pomalu se vyvíjejícím genem,[22] a fibrinogenový gama řetězec, rychle se vyvíjející gen[23] je prokázáno, že se vyvíjí rychleji než fibrinogen.

Graf divergence tohoto genu ve srovnání s fibrinogenem a cytochromem C.

Reference

  1. ^ A b C GRCh38: Vydání souboru 89: ENSG00000143633 - Ensembl, Květen 2017
  2. ^ „Human PubMed Reference:“. Národní centrum pro biotechnologické informace, Americká národní lékařská knihovna.
  3. ^ „Myš PubMed Reference:“. Národní centrum pro biotechnologické informace, Americká národní lékařská knihovna.
  4. ^ Gerhard DS, Wagner L a kol. (Říjen 2004). „Stav, kvalita a rozšíření projektu cDNA NIH v plné délce: Mammalian Gene Collection (MGC)“. Výzkum genomu. 14 (10b): 212–2127. doi:10,1101 / gr. 2596504. PMC  528928. PMID  15489334.
  5. ^ Ota, T .; Suzuki, Y .; et al. (21. prosince 2004). „Kompletní sekvenování a charakterizace 21 243 lidských cDNA plné délky“. Genetika přírody. 36 (1): 40–45. doi:10.1038 / ng1285. PMID  14702039.
  6. ^ „Procházejte klony Homo sapiens ORF cDNA podle chromozomu 1, mapa 1q42, strana 1“.
  7. ^ „AceView: Gene: C1orf131, komplexní anotace genů člověka, myši a červa s mRNA nebo ESTsAceView“.
  8. ^ Kozlowski, LP (2016). „IPC - Isoelectric Point Calculator“. Biology Direct. 11 (1): 55. doi:10.1186 / s13062-016-0159-9. PMC  5075173. PMID  27769290. Archivovány od originál dne 29. 04. 2013. Citováno 2015-05-08.
  9. ^ A b „Uniprot Gene: C1orf131“. Citováno 7. května 2015.
  10. ^ A b „BLAT“. Citováno 7. května 2015.
  11. ^ Olsen JV, Vermeulen M, Santamaria A, Kumar C, Miller ML, Jensen LJ, Gnad F, Cox J, Jensen TS, Nigg EA, Brunak S, Mann M (leden 2010). „Kvantitativní fosfoproteomika odhaluje rozsáhlé úplné obsazení místa fosforylace během mitózy“. Vědecká signalizace. 3 (104): ra3. doi:10.1126 / scisignal.2000475. PMID  20068231.
  12. ^ Wang B, Malik R, Nigg EA, Körner R (prosinec 2008). „Hodnocení nízkošpecifické proteázové elastázy pro rozsáhlou analýzu fosfoproteomu“. Analytická chemie. 80 (24): 9526–9533. doi:10.1126 / scisignal.2000475. PMID  20068231. Citováno 26. dubna 2015.
  13. ^ Matsuoka S, Ballif BA, Smogorzewska A, McDonald ER 3., Hurov KE, Luo J, Bakalarski CE, Zhao Z, Solimini N, Lerenthal Y, Shiloh Y, Gygi SP, Elledge SJ (květen 2007). „Analýza substrátu ATM a ATR odhaluje rozsáhlé proteinové sítě reagující na poškození DNA“. Věda. 316 (5828): 1160–1166. Bibcode:2007Sci ... 316.1160M. doi:10.1126 / science.1140321. PMID  17525332.
  14. ^ Kim D, Hahn Y (9. července 2011). „Identifikace nových míst modifikace fosforylace v lidských proteinech, které vznikly po divergenci člověka – šimpanze“. Bioinformatika. 27 (18): 2494–501. doi:10.1093 / bioinformatika / btr426. PMID  21775310. Citováno 26. dubna 2015.
  15. ^ Dephoure N, Zhou C, Villén J, Beausoleil SA, Bakalarski CE, Elledge SJ, Gygi SP (srpen 2008). „Kvantitativní atlas mitotické fosforylace“. Sborník Národní akademie věd Spojených států amerických. 105 (31): 10762–10767. Bibcode:2008PNAS..10510762D. doi:10.1073 / pnas.0805139105. PMC  2504835. PMID  18669648.
  16. ^ Choudhary C, Kumar C, Gnad F, Nielsen ML, Rehman M, Walther TC, Olsen JV, Mann M (srpen 2010). „Lysinová acetylace je zaměřena na proteinové komplexy a reguluje hlavní buněčné funkce“. Věda. 325 (5942): 834–40. Bibcode:2009Sci ... 325..834C. doi:10.1126 / science.1175371. PMID  19608861.
  17. ^ Brendel V, Bucher P, Nourbakhsh IR, Blaisdell BE, Karlin S (březen 1992). "Metody a algoritmy pro statistickou analýzu proteinových sekvencí". Sborník Národní akademie věd Spojených států amerických. 89 (6): 2002–2006. Bibcode:1992PNAS ... 89.2002B. doi:10.1073 / pnas.89.6.2002. PMC  48584. PMID  1549558.
  18. ^ Garnier J, Gibrat JF, Robson B (1996). Metoda predikce sekundární struktury GOR verze IV. Metody v enzymologii. 266. str. 540–553. doi:10.1016 / S0076-6879 (96) 66034-0. ISBN  9780121821678. PMID  8743705.
  19. ^ Stes E, Laga M, Walton A, Samyn N, Timmerman E, De Smet I, Goormachtig S, Gevaert K (červen 2014). „Protokol COFRADIC ke studiu ubikvitinace proteinů“. J Proteome Res (3. vyd.). 13 (6): 3107–3113. doi:10.1021 / pr4012443. PMID  24816145.
  20. ^ Olah J, Vincze O, Virok D, Simon D, Bozso Z, Tokesi N, Horvath I, Hlavanda E, Kovacs J, Magyar A, Szucs M, Orosz F, Penke B, Ovadi J (září 2011). „Interakce patologických charakteristických proteinů: tubulinová polymerace podporující protein / p25, beta-amyloid a alfa-synuklein“. J. Biol. Chem. (39. vydání). 286 (39): 34088–34100. doi:10.1074 / jbc.m111.243907. PMC  3190826. PMID  21832049.
  21. ^ „Rodina: DUF4602“. Citováno 8. května 2015.
  22. ^ Dickerson, R. (1971). "Struktura cytochromu c a rychlosti molekulární evoluce". Journal of Molecular Evolution (1. vyd.). 1 (1): 26–45. Bibcode:1971JMolE ... 1 ... 26D. doi:10.1007 / bf01659392. PMID  4377446.
  23. ^ Prychitko TM, Moore WS (2000). "Srovnávací vývoj genu pro mitochondriální cytochrom b a jaderného beta-fibrinogenu intron 7 u datlů". Mol Biol Evol. 17 (7): 1101–11. doi:10.1093 / oxfordjournals.molbev.a026391. PMID  10889223. Citováno 8. května 2015.