Tetratrikopeptidový opakovací protein 39B - Tetratricopeptide repeat protein 39B - Wikipedia

TTC39B
Identifikátory
AliasyTTC39B, C9orf52, tetratrikopeptidová repetiční doména 39B
Externí IDOMIM: 613574 MGI: 1917113 HomoloGene: 25228 Genové karty: TTC39B
Umístění genu (člověk)
Chromozom 9 (lidský)
Chr.Chromozom 9 (lidský)[1]
Chromozom 9 (lidský)
Genomické umístění pro TTC39B
Genomické umístění pro TTC39B
Kapela9p22.3Start15,163,622 bp[1]
Konec15,307,360 bp[1]
Ortology
DruhČlověkMyš
Entrez
Ensembl
UniProt
RefSeq (mRNA)

NM_001168339
NM_001168340
NM_001168341
NM_001168342
NM_152574

NM_025782
NM_027238

RefSeq (protein)

NP_001161811
NP_001161812
NP_001161813
NP_001161814
NP_689787

NP_081514

Místo (UCSC)Chr 9: 15,16 - 15,31 MbChr 4: 83,22 - 83,32 Mb
PubMed Vyhledávání[3][4]
Wikidata
Zobrazit / upravit člověkaZobrazit / upravit myš

Tetratrikopeptidový opakovací protein 39B je protein že u lidí je kódován TTC39B gen. TTC39B je také známý jako C9orf52 nebo FLJ33868. Hlavním rysem tetratrikopeptidové repetice 39B je doména neznámé funkce 3808 (DUF3808), která pokrývá většinu proteinu.

Gen

Umístění genu TTC39B na chromozomu 9

Gen pro TTC39B je umístěn na krátkém rameni devátého chromozomu v 9p22.3. Genomová DNA je 136 517 bází dlouhá, skládá se z 39 introny a 20 exony a je na minusovém řetězci. MRNA má délku 3 276 bází. TTC39B je obklopen LOC100419056, chloridovým kanálem, citlivým na napětí 3 pseudogen.[5]

Funkce

Očekává se, že TTC39B bude mít molekulární vazebnou funkci i roli v regulaci lipidů; the fenotyp stejně jako funkce in vivo není známo.[6]

Homologie a evoluce

Paralogy

Jsou známy dva paralogy pro TTC39B: TTC39A a TTC39C. TTC39A má dvě izoformy sestřihu a TTC39C má tři izoformy sestřihu.

TTC39A byl testován na asociaci s nemocemi jako novotvary prsu a předpokládá se, že bude mít molekulární vazebnou funkci a bude lokalizován v různých kompartmentech (extracelulární prostor, membrána, jádro ).[7]

Očekává se, že TTC39C bude lokalizován v cytoplazma. Ne fenotyp byl objeven a gen in vivo funkce není známa.[8]

Ortology

Rod a druhBěžné jménoRNA procento identityDivergence
Pan paniscusBonobo99%6.3 MYA
Pan troglodytyŠimpanz99%6.3 MYA
Gorila gorila gorilaGorila99%8,8 MYA
Nomascus leucogenysGibbon98%20,4 MYA
Papio anubisPavián97%29,0 MYA
Pongo abeliiOrangutan97%15,7 MYA
Callithrix jacchusKočkodan96%42,6 MYA
Saimiri boliviensis boliviensisVeverka opice94%42,6 MYA
Canis lupus familiarisPes91%94,2 MYA
Otolemur garnettiiBushbaby90%74,0 MYA
Felis catusKočka89%94,2 MYA
Bos taurusKráva88%94,2 MYA
Cricetulus griseusKřeček87%92,3 MYA
Ovis ariesOvce85%94,2 MYA
Rattus norvegicusKrysa85%92,3 MYA

Vzdálené homology

Rod a druhBěžné jménoRNA procento identityDivergence
Sarcophilus harrisiiTasmánský čert78%162,6 MYA
Gallus gallusKuře75%296,0 MYA
Taeniopygia guttataZebra pěnkava75%296,0 MYA
Anolis carolinensisJeštěrka75%296,0 MYA
Xenopus laevisŽába74%371,2 MYA

Fylogeneze

TTC39B je v lidském organismu konzervován platyhelminthes a není konzervován v kvasinkách a houbách.

Nezakořeněný fylogenický strom TTC39B Zavřete ortology
Nezakořeněný fylogenický strom vzdálených homologů TTC39B

Protein

Gen TTC39B má pět různých variant transkriptů, z nichž každá kóduje jiný protein. Tento článek se zaměřuje na tetratrikopeptidový opakující se protein 39B izoforma 1, nejdelší ze všech proteinů. Po překladu je protein TTC39B složen ze 682 aminokyselin a má molekulovou hmotnost 76 955,64 kDa. The izoelektrický bod bílkoviny je 7,16 pH.[9]

Zachování

Zavřít ortology:

Rod a druhBěžné jménoIdentita procento bílkovinDivergence
Pan troglodytyŠimpanz99%6.3 MYA
Pan paniscusBonobo99%6.3 MYA
Nomascus leucogenysGibbon98%20,4 MYA
Papio anubisPavián98%29,0 MYA
Callithrix jacchusKočkodan97%42,6 MYA
Saimiri boliviensis boliviensisVeverka opice96%42,6 MYA
Heterocephalus glaberNahý krysa92%92,3 MYA
Canis lupus familiarisPes91%94,2 MYA
Cricetulus griseusKřeček90%92,3 MYA
Ovis ariesOvce89%94,2 MYA
Cavia porcellusmorče86%92,3 MYA

Vzdálené ortology:

Rod a druhBěžné jménoIdentita procento bílkovinDivergence
Sarcophilus harrisiiTasmánský čert73%162,6 MYA
Taeniopygia guttataZebra pěnkava72%296,0 MYA
Pteropus alectoNetopýr55%94,2 MYA
Bos taurusKráva54%94,2 MYA
Rattus norvegicusKrysa54%92,3 MYA
Gallus gallusKuře54%296,0 MYA
Danio rerioZebrafish54%400,1 MYA
Crassostrea gigasÚstřice50%782,7 MYA
Camponotus floridanusMravenec43%782,7 MYA
Nasonia vitripennisVosa42%782,7 MYA
Ciona intestinalisUrochordata40%722,5 MYA
Clonorchis sinensisJaterní náhoda35%792,4 MYA

Domény a motivy

Doména domény neznámé funkce 3808 (DUF3808) je konzervována z hub na člověka a v současné době má neznámou funkci. Nachází se od aminokyseliny 142 do 568 (délka 427 aminokyselin). Proteiny této rodiny také obsahují doménu TPR_2 C-konec, který má také neznámou funkci.[10]

Další konzervovanou doménou v proteinu TTC39B je tetratrikopeptidová repetice TPR_12. Nachází se od aminokyseliny 600 do 658 (délka 59 aminokyselin).[11] TPR domény se nacházejí v mnoha proteinech, které usnadňují specifické interakce s partnerským proteinem. Trojrozměrná strukturální data ukázala, že oblast TPR tvoří dvě antiparalelní alfa-šroubovice. TPR motivy, které jsou uspořádány jeden před druhým, vytvářejí pravostrannou spirálovou strukturu s amfipatický kanál, který by mohl pojmout komplementární oblast cílového proteinu. Většina proteinů obsahujících TPR je spojena s multiproteinovými komplexy a existují rozsáhlé důkazy naznačující, že TPR motivy jsou důležité pro fungování komplexů chaperon, buněčný cyklus, transkripce a transport proteinu.[12] V proteinu TTC39B se nacházejí dvě další domény TPR: TPR1, který zahrnuje aminokyseliny 393 až 426 (34 aminokyselin) a TPR2, který zahrnuje aminokyseliny 626 až 659 (také 34 aminokyselin).[13]

TTC39B obsahuje tři transmembránové oblasti, všechny umístěné v oblasti DUF3808.[14] Protože existují tři transmembránové oblasti, N-konec a C-konec proteinu bude na opačných stranách plazmatické membrány.

Posttranslační úpravy

Fosforylace Stránky:[15]

AminokyselinaPozice
Serine (S)28, 32, 42, 51, 61, 62, 72, 91, 93, 94, 96, 101, 102, 107, 120, 123, 124, 125, 126, 127, 134, 148, 165, 173, 194, 215, 217, 218, 221, 224, 229, 270, 279, 305, 313, 329, 344, 347, 350, 365, 393, 421, 454, 461, 464, 477, 500, 509, 524, 526, 548, 551, 557, 573, 578, 580, 614, 634, 638, 660, 663, 680, 681
Threonin (T)89, 100, 110, 121, 128, 152, 174, 183, 202, 211, 250, 269, 356, 362, 370, 467, 487, 493, 512, 563, 628, 651
Tyrosin (Y)167, 172, 206, 210, 239, 271, 274, 295, 363, 398, 434, 451, 452, 453, 468, 523, 542, 608, 620, 623, 636, 656, 659

Pravděpodobnost Sumoylace Weby[16] (tučně):

Ne.PoziceSkupinaSkóre
1619ESEKL LK.YD HYLVP0.91
2262NMINF IK.GG LKIRT0.77
3302EFEGG VK.LG SGAFN0.76
4133STKVD LK.SG LEECA0.73

Existuje jeden možný N-glykosylace místo na aminokyselině 391, protože však protein TTC39B neobsahuje signální peptid, je nepravděpodobné, že k této glykosylaci skutečně dojde.

Sekundární struktura

Podle analýzy struktury sekundárního proteinu je TTC39B s největší pravděpodobností exprimován v endoplazmatické retikulum, mitochondrie, a Golgiho aparát.[14]

Terciární a kvartérní struktura

Protein TTC39B se složí do alfa-alfa superšroubovice. 40% jeho struktury odpovídá d1w3ba, superhelikální doméně o-vázané GlcNAc transferázy. O-GlcNAc spojuje metabolický stav s regulací široké škály buněčných signálních drah tím, že funguje jako senzor živin.[17]


Výraz

Úvodní stránka promotéra a transkripce

The promotér pro TTC39B začíná na základním páru 15 307 109 a končí na základním páru 15 307 858. Má délku 750 párů bází. The místo zahájení transkripce pro TTC39B proteinová izoforma 1 je lokalizována od párů bází 15 307 340 až 15 307 389 a má délku 50 bp.

Profil výrazu

TTC39B je dobře exprimován ve svalech, vnitřních orgánech, sekrečních orgánech, reprodukčních orgánech, imunitním systému a nervovém systému.[6] TTC39B je exprimován v mnoha tkáních: varle, plíce, ostrůvky langerhans, slinivka břišní, ledviny, sdružené zárodečná buňka nádory, karcinom prsu, atd.[6]


Varianty přepisu

Existuje pět různých variant transkriptu pro gen TTC39B. Isoform 1 je nejdelší přepis a kóduje nejdelší izoformu. Isoform 2 používá alternativní místo sestřihu v rámci v centrální kódující oblasti ve srovnání s variantou 1, což má za následek kratší protein. Isoforma 3 a 4 mají více rozdílů v centrální kódovací oblasti, ale udržují čtecí rámec ve srovnání s izoformou 1. Isoform 5 se liší v 5 'UTR a má více rozdílů v kódovací oblasti ve srovnání s variantou 1. Tyto rozdíly způsobují iniciaci translace v downstream v rámci SRPEN a vede k tomu, že izoforma 5 má kratší N-konec ve srovnání s izoformou 1.[18]

Interagující proteiny

Vazebné transkripční faktory

Stránky vázající transkripční faktory:[19]

Matrix FamilyPodrobné informace o rodiněZNaPramenPodobnostPořadí (CAPITALS: základní sekvence)
V $ PLAGPleomorfní adenom gen5173(+)1.000taGGGGgaagtagaggagttcca
V $ TALEPŘÍBĚH homeodomain třída rozpoznávající TG motivy157173(+)1.000ggtggtgtGTCAgaggc
V $ ZF02C2H2 zinkový prst transkripční faktory 2294316(-)1.000cagcgCCCCacctggggtccgtg
V $ MIZ1Moje C - interakční protein Zn prstu 1417427(-)1.000cacgcCCTCtg
O $ TF2BRNA polymeráza II transkripční faktor II B517523(-)1.000ccgCGCC

Buněčné proteiny

TTC39B interaguje s ubikvitin C. (UBC), prekurzor polyubiquitinu. Konjugace ubikvitinu monomery nebo polymery vede k různým účinkům v buňce. Ubikvitinace byl spojen s degradace bílkovin, Oprava DNA, buněčný cyklus nařízení, kináza modifikace, endocytóza a regulace dalších signálních drah buněk.[20]

Klinický význam

Sdružení nemocí

Na lokusu na chromozomu 9p22 bylo zjištěno, že je spojen s lipoprotein s vysokou hustotou (HDL-C), TTC39B byl jediný z několika genů v lokusu, který měl eQTL v játrech, alela spojená se sníženou expresí koreluje se zvýšeným HDL-C. Vyřazení myšího ortologu TTC39B pomocí virového vektoru (50% vyřazení) vedlo k významně vyšším hladinám HDL-C v plazmě po 4 dnech a 7 dnech. Data naznačují, že TTC39B jako kauzální geny pro regulaci lipidů.[21]

Reference

  1. ^ A b C GRCh38: Vydání souboru 89: ENSG00000155158 - Ensembl, Květen 2017
  2. ^ A b C GRCm38: Vydání souboru 89: ENSMUSG00000038172 - Ensembl, Květen 2017
  3. ^ „Human PubMed Reference:“. Národní centrum pro biotechnologické informace, Americká národní lékařská knihovna.
  4. ^ „Myš PubMed Reference:“. Národní centrum pro biotechnologické informace, Americká národní lékařská knihovna.
  5. ^ „LOC100419056 chloridový kanál, napěťově citlivý 3 pseudogen“. NCBI. Citováno 13. května 2013.
  6. ^ A b C „TTC39B, komplexní anotace lidských, myších a červových genů s mRNA nebo ESTsAceView“. AceView. Citováno 13. května 2013.
  7. ^ „TTC39A, komplexní anotace lidských, myších a červových genů s mRNA nebo ESTsAceView“. AceView. Citováno 13. května 2013.
  8. ^ „TTC39C, komplexní anotace lidských, myších a červových genů s mRNA nebo ESTsAceView“. AceView. Citováno 13. května 2013.
  9. ^ https://www.ncbi.nlm.nih.gov/protein/NP_689787.2
  10. ^ „NCBI“. Citováno 9. května 2013.
  11. ^ „NCBI“. Citováno 9. května 2013.
  12. ^ Blatch GL, Lässle M (listopad 1999). „Tetratrikopeptidová repetice: strukturální motiv zprostředkující interakce protein-protein“. BioEssays. 21 (11): 932–9. doi:10.1002 / (SICI) 1521-1878 (199911) 21:11 <932 :: AID-BIES5> 3.0.CO; 2-N. PMID  10517866.
  13. ^ „NP_689787.2: genový produkt TTC39B [Homo sapiens]“. NCBI. Citováno 13. května 2013.
  14. ^ A b „Biology Workbench“. SDSC Biology Workbench. Citováno 13. května 2013.
  15. ^ „Server NetPhos 2.0“. Centrum pro analýzu biologické sekvence. Citováno 13. května 2013.
  16. ^ „SUMOsp 2.0 - SUMOylation predikce webu“. Pracovní skupina CUCKOO. Citováno 13. května 2013.
  17. ^ Lazarus MB, Nam Y, Jiang J, Sliz P, Walker S (leden 2011). "Struktura lidské O-GlcNAc transferázy a její komplex s peptidovým substrátem". Příroda. 469 (7331): 564–7. Bibcode:2011Natur.469..564L. doi:10.1038 / nature09638. PMC  3064491. PMID  21240259.
  18. ^ "TTC39B tetratrikopeptidová repetiční doména 39B [Homo sapiens (člověk)]" ". NCBI. Citováno 13. května 2013.
  19. ^ "GEMS Launcher: Matlnspector: Hledat vazebná místa pro transkripční faktory". Softwarová sada Genomatix. Citováno 13. května 2013.
  20. ^ „UBC Gene - GeneCards“. Genové karty. Citováno 13. května 2013.
  21. ^ Teslovich TM, Musunuru K, Smith AV a kol. (Srpen 2010). „Biologický, klinický a populační význam 95 lokusů pro lipidy v krvi“. Příroda. 466 (7307): 707–13. Bibcode:2010Natur.466..707T. doi:10.1038 / nature09270. PMC  3039276. PMID  20686565.