MGC50722 - MGC50722

MGC50722, také známý jako necharakterizovaný protein LOC399693, je protein, který je u lidí kódován MGC50722 gen (Savčí genový projekt sběru genů 50722[1]). Toto 965 aminokyselina lidský protein má a molekulární váha 104 495 kDa a jedna doména neznámé funkce (DUF390).[2] Tento rychle se vyvíjející gen, který je obecně zachován u savců, vykazuje relativně nízkou expresi ve většině lidských tkání, s výjimkou varle.[3][4]

Gen

Celý lidský gen má délku 40 364 párů bází, zatímco nezpracovaný mRNA je 25 960 párů bází dlouhý. Po sestřihu introny 10. den exon Gen má konečnou délku mRNA 3 596 párů bází, která kóduje 965 aminokyselin.[2][5][6]

Místo

Člověk MGC50722 se nachází na záporném řetězci chromozom 9 v oblasti q34 lidského genomu (NCBI Gene ID: 399693). Nejcharakterističtějším genem v této oblasti lidského genomu je GPSM1, který kóduje protein signálního modulátoru 1 G-proteinu.[7]

Homologie a evoluce

Divergence lidského genu MGC50722 je znázorněna proti Fibrinogen a Cytochrom C. divergence. Každý datový bod v grafu představuje jiný druh a tento druh homologního genu, jak je identifikován prostřednictvím VÝBUCH. BLAST vyhledávání byla prováděna s použitím lidského genu MGC50722, fibrinogenu a cytochromu C a procentuální identity byly vyneseny do grafu proti skutečné odchylce od člověka pro tento druh homologního genu.

Paralogy

Bylo zjištěno, že protein 350 související s centrosomem (CEP350 ) byl jediným možným paralogem k proteinu MGC50722 u lidí. CEP350 je protein o délce 3117 aminokyselin a na svém N-konci odpovídá proteinu MGC50722. To znamená, že vzdálenost paralogů je velmi vzdálená MGC50722 rozdělen od CEP350.

Ortology

Soutěžní ortology pro protein MGC50722 se nacházejí pouze v savci, kde se nejvíce ochrany nachází v rámci N-konec a DUF390.

Vzdálené homology

Nejvzdálenější detekovatelný homolog je u chrupavčitých ryb (462,5 MYA).

Homologní domény

Doména neznámé funkce 390 (pfam04094: DUF390) je součástí rodiny proteinů, které byly identifikovány pouze v genomu rýže. Ačkoli funkce této domény není známa, může se jednat o nějaký druh transponovatelného prvku.[8]

Protein

Primární sekvence a izoformy

Lidský protein MGC50722 je 104 495 kDa s an izoelektrický bod ze dne 10.24. Smíšený nabitý klastr aminokyselin je přítomen mezi pozicemi 146 a 182, což se zdá být konzervováno u primátů, ale není přítomno u jiných savců. U člověka se také nachází 6 předpovězených izoforem.[2]

Signály lokalizace subcellualaru

Servery PSORTII předpovědět 5 jaderných lokalizačních signálů v lidském proteinu MGC50722. Když byly ortologové sekvence lidského proteinu spuštěny přes PSORT II, ​​predikovaná nukleární subcelulární lokalizace byla konsenzuální predikcí.

Předpokládané nukleární lokalizační signály v lidském proteinu MGC50722
Typ signáluResidue SpanSekvence aminokyselin
pat446-49RPRK
pat4148-151KPKR
pat743-49PQQRPRK
pat7149-155PKRVKSS
pat7302-308PSKRRLQ

Posttranslační úpravy

Lidský protein MGC50722 ortholog u myší, protein 4932418E24Rik, experimentálně určil fosforylační místa na S588, S591 a S670 ve varlatech (pTestis ID: PT-MM-02686 ).[9][10][11] Predikční servery na EXPASY také předpovídat více fosforylačních míst (Server NetPhos 2.0 ), místo N-terminální acetylace (Server NetAcet 1.0 ), glykační místa (Server NetGlycate 1.0 ) a O-glykosylační místo GalNAc (Server NetOGlyc 4.0 ) v konzervovaných zbytcích v lidském proteinu MGC50722.

Sekundární struktura

Predikční modely charakterizovaly protein MGC50722 jako většinou neuspořádaný, ale dvě oblasti stočených cívek.

Vnitřní struktura a vlastnosti bílkovin

VlastnostiResidue Span
Region s nízkou složitostí[6]11-26
DUF390[8][12]405-690
Region s nízkou složitostí[6]410-423
Region s nízkou složitostí[6]546-556
Coiled-Coil[6]546-566
Region s nízkou složitostí[6]606-621
Coiled-Coil[6]720-753
Region s nízkou složitostí[6]771-791
Region s nízkou složitostí[6]871-884
Sekvence primárních aminokyselin proteinu MGC50722 a její vnitřní vlastnosti / struktury.

Potenciální funkce

Funkce proteinu MGC50722 není známa. Vzhledem k tomu, že je přednostně exprimován ve varlatech a zdá se, že je subcelulárně lokalizován v jádru, může hrát důležitou roli v gametových buňkách.

Interagující proteiny

Vzhledem k nedávné identifikaci tohoto genu a jeho proteinu byly vytvořeny interakční databáze (MÁTA, TĚTIVA, IntAct, a BioGRID ) nezjistily žádné interakce. Více dat by rozšířilo charakterizaci MGC50722.

Výraz

Úroveň exprese lidského MGC50722 se zdá být nízká / chybí u většiny typů buněk, přičemž nejvyšší a nejhojnější exprese je prokázána ve varlatech (ID profilů GEO: 48997768 a 49895282 ).[13] Studie rakoviny plic také ukázala, že MGC50722 byl exprimován v CD4 + T-buňkách vzorků normální lidské tkáně.[14]

Promotér

Úvodní stránka transkripce pro MGC50722 sladí nejlépe s SPZ1, SORY, SP1F a RYCHLE[15] vazebná místa transkripčního faktoru.

Klinický význam

Významným profilem GEO týkajícím se MGC50722 byla studie provedená na mužské plodnosti u lidí, která se zabývala teratozoospermií onemocnění (ID profilu GEO: 38113951 ).[13] Teratozoospermie je stav, kdy se během vývoje zralých spermií mění morfologie, což vede v některých případech k mužské neplodnosti.[16] Genová exprese ukazuje, že u normálních lidských subjektů je exprimován MGC50722, zatímco u subjektů s teratozoospermií hladiny exprese významně klesají nebo jsou vypnuty.

Reference

  1. ^ Strausberg RL, Feingold EA, Grouse LH, Derge JG, Klausner RD, Collins FS, Wagner L, Shenmen CM, Schuler GD, Altschul SF, Zeeberg B, Buetow KH, Schaefer CF, Bhat NK, Hopkins RF, Jordan H, Moore T , Max SI, Wang J, Hsieh F, Diatchenko L, Marusina K, Farmer AA, Rubin GM, Hong L, Stapleton M, Soares MB, Bonaldo MF, Casavant TL, Scheetz TE, Brownstein MJ, Usdin TB, Toshiyuki S, Carninci P, Prange C, Raha SS, Loquellano NA, Peters GJ, Abramson RD, Mullahy SJ, Bosak SA, McEwan PJ, McKernan KJ, Malek JA, Gunaratne PH, Richards S, Worley KC, Hale S, Garcia AM, Gay LJ, Hulyk SW, Villalon DK, Muzny DM, Sodergren EJ, Lu X, Gibbs RA, Fahey J, Helton E, Ketteman M, Madan A, Rodrigues S, Sanchez A, Whiting M, Madan A, Young AC, Shevchenko Y, Bouffard GG Blakesley RW, Touchman JW, Green ED, Dickson MC, Rodriguez AC, Grimwood J, Schmutz J, Myers RM, Butterfield YS, Krzywinski MI, Skalska U, Smailus DE, Schnerch A, Schein JE, Jones SJ, Marra MA (prosinec 2002). „Generování a počáteční analýza více než 15 000 lidských a myších cDNA sekvencí plné délky“. Sborník Národní akademie věd Spojených států amerických. 99 (26): 16899–16903. doi:10.1073 / pnas.242603899. PMC  139241. PMID  12477932.
  2. ^ A b C "Homo sapiens necharakterizovaný protein LOC399693". Protein NCBI.
  3. ^ „Bezcharakterní MGC50722 (MGC50722)“. NCBI UniGene.
  4. ^ Tang; et al. (2007). „Vlastnosti 292 genů specifických pro varlata u člověka“. Biologický a farmaceutický bulletin. 30 (5): 865–872. doi:10,1248 / bpb.30,865. PMID  17473427.
  5. ^ „Homo sapiens uncharacterized MGC50722 (MGC50722), transkript varianta 1, mRNA“. NCBI nukleotid. 2018-09-24.
  6. ^ A b C d E F G h i „Přepis: MGC50722-001 ENST00000569961 Souhrn bílkovin“. Ensembl.
  7. ^ "MGC50722 necharakterizovaný MGC50722 [Homo sapiens (člověk)]" ". NCBI Gene. Března 2015.
  8. ^ A b „Rodina konzervovaných proteinových domén DUF390“.
  9. ^ Qi L, Liu Z, Wang J, Cui Y, Guo Y, Zhou T, Zhou Z, Guo X, Xue Y, Sha J (prosinec 2014). „Systematická analýza sítí fosfoproteomů a kináz-substrátů v myších varlat“. Molekulární a buněčná proteomika. 13 (12): 3626–38. doi:10,1074 / mcp.M114.039073. PMC  4256510. PMID  25293948.
  10. ^ "4932418E24Rik".
  11. ^ Diez-Roux G, Banfi S, Sultan M, Geffers L, Anand S, Rozado D, Magen A, Canidio E, Pagani M, Peluso I, Lin-Marq N, Koch M, Bilio M, Cantiello I, Verde R, De Masi C, Bianchi SA, Cicchini J, Perroud E, Mehmeti S, Dagand E, Schrinner S, Nürnberger A, Schmidt K, Metz K, Zwingmann C, Brieske N, Springer C, Hernandez AM, Herzog S, Grabbe F, Sieverding C , Fischer B, Schrader K, Brockmeyer M, Dettmer S, Helbig C, Alunni V, Battaini MA, Mura C, Henrichsen CN, Garcia-Lopez R, Echevarria D, Puelles E, Garcia-Calero E, Kruse S, Uhr M, Kauck C, Feng G, Milyaev N, Ong CK, Kumar L, Lam M, Semple CA, Gyenesei A, Mundlos S, Radelof U, Lehrach H, Sarmientos P, Reymond A, Davidson DR, Dollé P, Antonarakis SE, Yaspo ML , Martinez S, Baldock RA, Eichele G, Ballabio A (2011). „Anatomický atlas transkriptomu v myším embryu s vysokým rozlišením“. PLOS Biology. 9 (1): e1000582. doi:10.1371 / journal.pbio.1000582. PMC  3022534. PMID  21267068.
  12. ^ "MGC50722 necharakterizovaný MGC50722 [Homo sapiens (člověk)]" ". NCBI Gene.
  13. ^ A b Barrett T, Wilhite SE, Ledoux P, Evangelista C, Kim IF, Tomashevsky M, Marshall KA, Phillippy KH, Sherman PM, Holko M, Yefanov A, Lee H, Zhang N, Robertson CL, Serova N, Davis S, Soboleva A (Leden 2013). „NCBI GEO: archiv pro funkční soubory genomických dat - aktualizace“. Výzkum nukleových kyselin. 41 (Problém s databází): D991 – D995. doi:10.1093 / nar / gks1193. PMC  3531084. PMID  23193258.
  14. ^ Ahn, Jung-Mo; et al. (Listopad 2013). „Proteogenomická analýza genů kódovaných lidským chromozomem 9 z lidských vzorků a plicních tkání“. Journal of Proteome Research. 13 (1): 137–146. doi:10.1021 / pr400792p. PMC  3918476. PMID  24274035.
  15. ^ Yeo CY, Chen X, Whitman M (září 1999). „Role FAST-1 a Smads v transkripční regulaci aktivinem během rané embryogeneze Xenopus“. The Journal of Biological Chemistry. 274 (37): 26584–90. doi:10.1074 / jbc.274.37.26584. PMID  10473623.
  16. ^ Machev N, Gosset P, Viville S (2005). "Abnormality chromozomů ve spermatu od neplodných mužů s normálními somatickými karyotypy: teratozoospermie". Cytogenetický a genomový výzkum. 111 (3–4): 352–357. doi:10.1159/000086910. PMID  16192715. S2CID  36272097.

Doporučené čtení