CCDC47 - CCDC47

CCDC47
Identifikátory
AliasyCCDC47, MSTP041, GK001, doména coiled-coil obsahující 47, THNS
Externí IDOMIM: 618260 MGI: 1914413 HomoloGene: 41351 Genové karty: CCDC47
Umístění genu (člověk)
Chromozom 17 (lidský)
Chr.Chromozom 17 (lidský)[1]
Chromozom 17 (lidský)
Genomické umístění pro CCDC47
Genomické umístění pro CCDC47
Kapela17q23.3Start63,745,255 bp[1]
Konec63,776,351 bp[1]
Ortology
DruhČlověkMyš
Entrez
Ensembl
UniProt
RefSeq (mRNA)

NM_020198

NM_026009

RefSeq (protein)

NP_064583

NP_080285

Místo (UCSC)Chr 17: 63,75 - 63,78 Mbn / a
PubMed Vyhledávání[2][3]
Wikidata
Zobrazit / upravit člověkaZobrazit / upravit myš

Coiled-coil doména 47 (CCDC47) je gen lokalizovaný na lidský chromozom 17, konkrétně lokus 17q23.3, který kóduje protein CCDC47. Gen má několik aliasů včetně GK001 a MSTP041. Samotný protein obsahuje coiled-coil domény, nadrodinu SEEEED, doménu neznámé funkce (DUF1682) a transmembránovou doménu. Funkce proteinu není známa, ale bylo navrženo, aby se CCDC47 účastnil homeostázy vápenatých iontů a reakce na přetížení endoplazmatického retikula.[4]

Gen

Samotný gen CCDC47 se nachází na minusovém řetězci lidský chromozom 17 a obsahuje 13 exon spojovací místa a 14 odlišných introny. Po odstranění exonů má gen délku 3445 párů bází. Žádný důkaz pro mikro RNA nebo pseudogeny byly nalezeny. Gen nemá různé izoformy, existuje pouze varianta přepisu 1X.

Genomická poloha CCDC47 v 17q23.3[5]

Protein

Struktura

Protein kódovaný CCDC47 má délku 483 aminokyselin a obsahuje obě a signální peptid a transmembránová doména. Je bohatý na negativně nabité aminokyseliny, jako je kyselina asparagová a kyselina glutamová což mu dává kyselost izoelektrický bod 4,56.[6] Protein je také bohatý na methionin. Celkově váží 55,9 kDal, což je konzervováno různými ortology. CCDC47 také obsahuje nadrodinu a doménu SEEEED neznámé funkce 1682 (DUF1682). Nadčeleď SEEEED je krátká oblast s nízkou složitostí, která se skládá hlavně z serinu. Rodina běžně leží na komplexu klatrinového adaptéru 3 podjednotkových proteinů beta-1.[7] Přesná funkce DUF 1682 je nejasná, ale jeden člen rodiny byl popsán jako protein specifický pro adipocyty.[8]

PHYRE byl schopen s 76,1% spolehlivostí předpovědět strukturu C-konce CCDC47 z aminokyselin 396-473. Tato struktura alfa šroubovice je znázorněna výše.

Předpovídají se dva disulfidové vazby ve struktuře CCDC47 u cysteinů 209 až 214, respektive cysteinů 215 až 283.[9] C-koncová část proteinu je vysoce nabitá a její sekundární struktura Předpokládá se, že je to alfa šroubovice kraj.[10] Tato oblast také obsahuje navinuté cívkové domény, které jsou strukturálními motivy, ve kterých jsou 2-7 alfa helixy navinuty dohromady a jsou následně zapojeny do biologické exprese. Tyto domény typicky sledují vzorec HxxHCxC, kde H je hydrofobní aminokyselina, C je nabitá aminokyselina a x je jakákoli aminokyselina.[11] Mnoho aminokyselinových sekvencí sledujících tento vzor je vidět v C-koncové oblasti CCDC47, kde je znázorněna nejvyšší konzervace prostřednictvím ortologů.

Proteinový konstrukt CCDC47, včetně signálního peptidu, nadrodiny SEEEED, transmembránové domény a DUF1682.

Regulace a překlad

CCDC47 je regulován promotorem GXP43413.[12] Promotor má délku 819 párů bází a je vysoce konzervovaný u savců. Konzervovaná vazebná místa u savců, která jsou umístěna na tomto promotoru, zahrnují nukleární respirační faktor 1 (NFR1), cAMP-responzivní element vázající protein (CREB), rodinu PAR b ZIP a transkripční faktor Sp4. NRF1 kóduje protein, který homodimerizuje a aktivuje expresi klíčových metabolických genů. CREB se váže na prvky reakce cAMP, čímž zvyšuje nebo snižuje transkripci downstream genů[13] zatímco rodina PAR b ZIP je zapojena do regulace cirkadiánní rytmy.[14]S ohledem na mRNA, překlad začíná na základním páru 337 a končí v 1728. Existuje silná stonková smyčka nachází se v 5 'UTR oblasti od základen 289-318, která je pravděpodobně zapojena do regulace mRNA díky své těsné blízkosti spustit kodon.[15]

Buněčná distribuce

Předpokládá se, že finální protein je přeložen z endoplazmatického retikula do cytoplazmy buňky. Protein je ukotven v membráně ER v transmembránové doméně umístěné od aminokyseliny 137 do 165.[16] Část proteinu, která sahá do cytosol se předpokládá, že bude vysoce fosforylovaný protože fosforylační místa proteinu jsou konzervována do ortologů kostnatých ryb.[17] Výzkum ukázal, že CCDC47 je vyjádřen v reakci na přetížení ER, což činí tuto těsnou blízkost ER důležitou.[18]

Posttranslační úpravy

Kromě vysoké úrovně fosforylace vidět v CCDC47, tři místa sulfinace jsou předpovídána a konzervována u savců, plazů a ptáků, ale ne u ryb, obojživelníků nebo bezobratlých.[19] Pět potenciálu sumoylace stránky jsou také vidět a konzervovány zpět k kostnatým rybám.[20] Tady není žádný glykosylace proteinu, protože se nepředpokládá, že se rozšíří do extracelulární části buňky.

Výraz

Microarray byly analyzovány vzorce tkáňové exprese z GEO a ukázalo se, že CCDC47 se jeví jako všudypřítomně exprimovaný v mírných hladinách v mnoha různých lidských tkáních.[21] Přestože je protein všudypřítomně exprimován, nejvyšší úrovně exprese lze pozorovat v neuronálních tkáních, jako je vynikající cervikální ganglion, mozková amygdala a ciliární ganglion. Zvýšený výraz je také vidět v Štítná žláza a CD34 + buňky.

Homologie

CCDC47 není známo paralogy prostřednictvím textových dotazů, BLAST a BLAT. Gen má mnoho ortology sahající zpět k bezobratlým živočichům, jako jsou C. elegans a je vysoce konzervativní u savců s procentem identity vyšším než 95%. CCDC47 byl sekvenován v široké taxonomii organismů včetně savců, ptáků, plazů, obojživelníků, kostnatých ryb a bezobratlých. Procentní identita lidského CCDC47 se specifickým ortologem klesá podle očekávání s přibývajícími roky divergence. Homologické geny CCDC47 jsou také přítomny v komářích, houbách, arabidopsis a asijské rýži. Tyto homology obsahují stejný DUF1682, který se nachází v CCDC47.

Ortology CCDC47
Rod

Druh

Společný název organismuOdchylka od

Lidé (MYA)[22]

Protein NCBI

Přístupové číslo

Identita sekvence

lidem[23]

Délka sekvence

(AA)

Mus musculusMyš92.3NP_080285.297.90%483
Myotis davidiiMyš ušatý94.2XP_006776781.197.50%483
Elephantulus edwardiiSloní rejska98.7XP_006886355.195.00%483
Alligator mississippiensisAmerický aligátor296XP_006271625.191.00%482
Falco cherrugSaker Falcon296XP_005439470.190.10%482
Ophiophagus hannahKrál kobra296ETE7395578.90%516
Xenopus laevis Africká drápá žába371.2NP_001087058.178.70%489
Danio rerioZebra ryby400.1NP_001004551.176.20%486
Latimeria chalumnaeCoelacanth414.9XP_00599466.383.50%478
Saccoglossus kowalevskiiŽaludový červ661.2XP_00682210850.50%496
Pediculus humanus corporisVši lidské tělo782.7XP_00242435946.10%447
Acyrthosiphon pisonMšice782.7NP_00116214743.50%449
Caenorhabditis elegansŠkrkavka937.5NP_497788.135.10%442

Reference

  1. ^ A b C GRCh38: Vydání souboru 89: ENSG00000108588 - Ensembl, Květen 2017
  2. ^ „Human PubMed Reference:“. Národní centrum pro biotechnologické informace, Americká národní lékařská knihovna.
  3. ^ „Myš PubMed Reference:“. Národní centrum pro biotechnologické informace, Americká národní lékařská knihovna.
  4. ^ "AceView". NCBI. Citováno 1. března 2014.[trvalý mrtvý odkaz ]
  5. ^ "Doména CCDC47 coiled-coil obsahující 47". NCBI. Citováno 3. března 2014.
  6. ^ „SAPS Anaysis“. SDSC Workbench. Citováno 14. dubna 2014.
  7. ^ "NCBI BLAST". Národní centrum pro biotechnologické informace. Citováno 7. března 2014.[trvalý mrtvý odkaz ]
  8. ^ „Genecards“. Kompendium lidských genů. Citováno 7. března 2014.
  9. ^ "Sulfinátor". EXPASY. Citováno 7. dubna 2014.
  10. ^ „Software pro rozpoznávání proteinů PHYRE 2“. Citováno 14. dubna 2014.
  11. ^ Mason JM, Arndt KM (2004). "Spirálové domény cívky: stabilita, specificita a biologické důsledky". ChemBioChem. 5 (2): 170–6. doi:10.1002 / cbic.200300781. PMID  14760737. S2CID  39252601.
  12. ^ „El Dorado“. Genomatix. Citováno 3. dubna 2014.[trvalý mrtvý odkaz ]
  13. ^ "Protein One". Faktory přepisu. Archivovány od originál dne 06.06.2014. Citováno 29. března 2014.
  14. ^ „Protein Spotlight, The PAR b ZIP Family“. Citováno 28. března 2014.
  15. ^ „Webový server mfold“. Citováno 3. dubna 2014.
  16. ^ "Filtrační server DAS-TM". EXPASY. Citováno 17. dubna 2014.
  17. ^ „NetPhos Server 2.0“. EXPASY. Citováno 20. dubna 2014.
  18. ^ Viguerie, Nathalie; Picard, Flora; Hul, Gabby; Roussel, Balbine; Barbe, Pierre; Iacovoni, Jason S .; Valle, Carine; Langin, Dominique; Šariš, Wim H. M. (2012). "Několik účinků krátkodobé léčby dexamethasonem v lidském kosterním svalu a tukové tkáni". Fyziologická genomika. 44 (2): 141–151. doi:10.1152 / physiolgenomics.00032.2011. ISSN  1094-8341. PMID  22108209.
  19. ^ "Sulfinátor". EXPASY. Citováno 20. dubna 2014.
  20. ^ „SumoPLOT“. EXPASY. Citováno 20. dubna 2014.[trvalý mrtvý odkaz ]
  21. ^ „Profily GEO“. NCBI. Citováno 20. března 2014.
  22. ^ „Time Tree: The Timescale of Life“. Citováno 13. března 2014.
  23. ^ "VÝBUCH". NCBI. Citováno 13. března 2014.

externí odkazy