Coiled-Coil doména obsahující 142 - Coiled-Coil Domain Containing 142
The doména coiled-coil obsahující 142 (CCDC142) je gen, který u lidí kóduje protein CCDC142. Gen CCDC142 je umístěn na chromozomu 2 (na 2p13), zabírá 4339 párů bází a obsahuje 9 exonů. Gen kóduje doménu coiled-coil obsahující protein 142 (CCDC142), jehož funkce ještě není dobře známa.[1][2] Existují dvě známé izoformy CCDC142.[1] CCDC142 proteiny produkované z těchto transkriptů mají velikost od 743 do 665 aminokyselin a obsahují signály naznačující pohyb proteinů mezi cytosol a jádro.[3] Homologní Geny CCDC142 se nacházejí u mnoha zvířat včetně obratlovců a bezobratlých ale ne houba, rostliny, protistů, archea nebo bakterie.[1] I když funkce tohoto proteinu není dobře známa, obsahuje doménu coiled-coil a a RINT1 _TIP1 motiv umístěný uvnitř doména coiled-coil.[3][4]
Místo
![](http://upload.wikimedia.org/wikipedia/commons/thumb/6/69/CCDC142_Locus.png/496px-CCDC142_Locus.png)
CCDC142 se nachází na - vlákně chromozomu 2 (2p13.1), s genomovou sekvencí překlenující báze 74 472 832 až 74 483 230.[1] Kódující oblast je dlouhá 8292 párů bází a kóduje dvě proteinové izoformy o délce 743 až 665 aminokyselin.[1] Na telomerické straně následuje CCDC142 MOGY a MRPL53 geny. Na centromerické straně je následován C31, LBX2, LBX2-AS1 a PCGF1 geny.[1]
mRNA
v Homo sapiensgen CCDC142 kóduje dvě alternativně sestříhané izoformy mRNA, nazývané izoforma 1 a izoforma 2.[3] Obě tyto izoformy mají 9 exonů. Isoform 1 je delší ze dvou, je 4339 bp dlouhý, zatímco izoforma 2 je dlouhý 2253 bp.[3] Hlavní rozdíl mezi izoformami, že isoforma 2 má kratší exon 9 a 3 ' UTR.[3] Isoform 1 je nejdelší variantou genu a proteinu a je předmětem tohoto článku.[1]
Zachování
Paralogy
CCDC142 nemá žádné paralogy Homo sapiens.
Ortology
Níže je uvedena tabulka různých ortology CCDC142, jehož identita proteinové sekvence byla srovnávána s Homo sapiens aminokyselinová sekvence proteinu. CCDC142 má více než 73% podobnost aminokyselin v savci, ale v jiných je méně konzervativní obratlovců a v bezobratlých.[5]
Rod a druh | Běžné jméno | Datum odchylky od lidské linie (MYA) | % identity |
Homo sapiens | Člověk | 0 | 100 |
Pan troglodyty | Šimpanz | 6.6 | 96 |
Gorila gorila gorila | Gorila | 8.9 | 98 |
Jaculus jaculus | Malá egyptská jerboa | 90.9 | 73 |
Bos mutus | Jak | 97.5 | 74 |
Eptesicus fuscus | Velký hnědý netopýr | 97.5 | 74 |
Python bivittatus | Barmský krajta | 320.5 | 36 |
Gallus gallus | Kuře | 320.5 | 35 |
Haliaeetus leucocephalus | Orel bělohlavý | 320.5 | 33 |
Anolis carolinensis | Carolina Anole (ještěrka) | 320.5 | 33 |
Calidris pugnax | Ruff (pták) | 320.5 | 32 |
Xenopus tropicalis | Západní drápá žába | 355.7 | 33 |
Callorhinchus milii | Australský ghostshark | 429.6 | 36 |
Lepisosteus oculatus | Skvrnitý gar | 429.6 | 34 |
Esox lucius | Štika severní | 429.6 | 33 |
Danio rerio | Zebrafish | 429.6 | 33 |
Lingula anatina | Orel mořský | 847 | 29 |
Crassostrea gigas | Pacifická ústřice | 847 | 29 |
Octopus bimaculoides | Kalifornská chobotnice se dvěma místy | 847 | 27 |
Drosophila melanogaster | Ovocný let | 847 | 23 |
Fylogeneze
CCDC142 je úzce příbuzný u savců, měkkýši a obojživelníci, plazi a ptactvo a v Ryba.[5] Gen CCDC142 sahá až do minulosti Drosophila melanogaster, které se oddělily od lidské linie před 847 miliony let. CCDC142 mutoval rychleji než oba Cytochrom C. (vysoce konzervovaný protein) a Fibrinogen A (rychle mutující protein). To naznačuje, že CCDC142 je rychle mutující gen s rostoucí rychlostí mutace (tj. Evoluce) v průběhu času.
![](http://upload.wikimedia.org/wikipedia/commons/thumb/c/c1/CCDC142mutation.png/834px-CCDC142mutation.png)
Protein
![](http://upload.wikimedia.org/wikipedia/commons/thumb/9/92/CCDC142domains3.png/619px-CCDC142domains3.png)
Primární struktura, varianty a izoformy
Hlavní izoforma proteinu CCDC142 má délku 743 aminokyselin a druhá izoforma je dlouhá 665 aminokyselin. Rozdíl v délce je zcela tvořen aminokyselinami chybějícími na C-konci izoformy 2.[1]
Domény a motivy
![](http://upload.wikimedia.org/wikipedia/commons/thumb/3/30/CCDC142Conceptualtranslation2.png/335px-CCDC142Conceptualtranslation2.png)
![](http://upload.wikimedia.org/wikipedia/commons/thumb/e/e5/Ccdc142_Conceptual_translation_legend2.png/335px-Ccdc142_Conceptual_translation_legend2.png)
Předpovězeno doména coiled-coil CCDC142 pochází z aminokyselin 308–719.[2] A RINT1 Motiv _TIP1 je také přítomen z aminokyselin 490–621. RINT1_TIP1 je rodina, která zahrnuje RINT-1 (protein zapojený do kontroly kontrolního bodu indukovaného zářením) a TIP-1 (kvasinkový protein, který je zapojen do Golgiho transport ).[4] Dalších ~ 250 aminokyselin nalezených ve vzdálených ortologních proteinech CCDC142 se nenachází v Homo sapiens genom blízký gen CCDC142.
Posttranslační úpravy
Předpokládá se, že CCDC142 bude mít 6 fosforylace weby, 4 methylace weby, 1 palmitoylace web, 1 sumoylace web a 1 slabý Signál pro lokalizaci jader.[6][7][8][9][10] Tyto úpravy ukazují, že CCDC142 je lokalizován na jádro a cytosol. Anotace těchto stránek v proteinu najdete v Konceptuálním překladu.
Predikce struktury
Sekundární struktura CCDC142 obsahuje pouze α-šroubovice jak předpovídají programy Quick2D a Phyre2.[11][12] Předpokládá se, že CCDC142 obsahuje osm konzervovaných α-šroubovice, přičemž šest je umístěno v oblasti stočené cívky proteinu.[11][12] Předpovězeno terciární struktura CCDC142 obsahuje velkou doménu coiled-coil z aminokyselin 308–719.[2][13]
![](http://upload.wikimedia.org/wikipedia/commons/thumb/4/40/CCDC142ITASSERPREDICTION.gif/423px-CCDC142ITASSERPREDICTION.gif)
Výraz
Organizátoři a regulační faktory
Oblast promotoru pro CCDC142 byla identifikována pomocí programu El Dorado na adrese Genomatix, pokrývá báze 74482896–74483908 v chromozomu 2.[14] Tato oblast 1013 bp zabírá 1071–58 bp před startovacím kodonem CCDC142.[14] V promotoru je oblast, která váže velké množství Krueppelovy transkripční faktory a BED proteiny se zinkovým prstem.[14] Tento region nemá jedno-nukleotidové polymorfismy (SNP) v něm umístěné.[15] Mnoho transkripčních faktorů, které se vážou na promotorovou oblast CCDC142, má funkce zabývající se potlačením nádoru, neurogeneze, Poškození DNA a fotorecepce.[14] Tato promotorová oblast také obsahuje a savčí box typu LTR TATA typu C který se překrývá s počátečním místem transkripce genu.[14]
Proteiny vázající RNA
Řada možných proteinů vázajících RNA se váže na 3 'i 5' nepřeložené regiony (UTR) mRNA CCDC142. The PABPC1 a RBMX vazebná místa pro proteiny se vyskytují ve 3 frekvenci UTR s vysokou frekvencí, a to 49, respektive 21.[16]
Výraz
- Allenův výraz lidského mozku CCDC142
Boční pohled
Červená = nízký výraz11Čelní pohled
Zelená = vysoký výraz11
Nahoře jsou Atlas lidského mozku Allen údaje o výrazu na CCDC142, přičemž červená označuje nižší výraz a zelená označuje vyšší výraz.[17] V Homo sapiens mozku, bylo zjištěno, že CCDC142 je v mozková kůra, thalamus a hypotalamus. CCDC142 je také vysoce vyjádřen v substantia nigra, pons, klaustrum, a mesencephalon.[17] Existuje také relativně vyšší exprese CCDC142 v ústa a brzlík.[18]
- Data výrazů NCBI GEO
Experiment vyřazení 2/3 MEKK13
Experiment poškození myokardu13
Experiment s nadměrnou expresí SNAI13
Výše uvedená experimentální data exprese ukazují mnoho možných nálezů pro CCDC142.[19] Nadměrná exprese SNAI1, a protein zinkového prstu, souvisí s redukcí exprese CCDC142 v Homo sapiens.[20] A Mus musculus knockout MEKK 2/3, které pomáhají regulovat pomocná T buňka diferenciace také vykazovala sníženou expresi CCDC142.[21] Další Mus musculus experiment se zaměřením na kardiomyopatie u myší vykazovaly nižší hladiny CCDC142 u myší s poškozeným buňky myokardu.[20]
Funkce a biochemie
Složení
CCDC142 má ve srovnání s jinými relativně typickou distribuci aminokyselin Homo sapiens bílkoviny.[5] Některé rozdíly jsou však zaznamenány v ortologech.[5] Leucin je přítomen ve velkém množství ve srovnání s jinými bílkovinami (na více než 15% bílkovin) a asparagin je přítomen v malém množství ve srovnání s jinými proteiny (na méně než 0,7% proteinu).[5]
Coiled-coil doména a RINT1_TP1 motiv CCDC142 obsahují vyšší množství leucinu vzhledem ke zbytku proteinu (na více než 16,6% oblasti), vyšší množství glutamin (na více než 8,4% regionu) a podobně nízké množství asparaginu (na méně než 0,7% regionu).[5]
Interagující proteiny
U CCDC142 nebyly nalezeny žádné proteinové interakce.
Klinický význam
Patologie a nemoci
Zisk počtu kopií v lokusech CCDC142, včetně dalších 25 genů, ukázal fenotyp vývojového zpoždění a významné vývojové nebo morfologické fenotypy.[22] Jeden výsledek se ztrátou počtu kopií v lokusech CCDC142, včetně dalších 29 genů, ukázal fenotypy malého vzrůstu, abnormálního tvaru obličeje, opožděného vývoje řeči a jazyka, překrývající se špičky, zpomalení nitroděložního růstu, patent ductus arteriosus a zpožděný hrubý vývoj motoru.[22] Účinek CCDC142 však mohl být u těchto fenotypů zmaten, protože v mnoha dalších genomových sekcích byly také abnormality.
Mutace
V genu CCDC142 se nachází řada SNP. Některé z nich v promotér region a 5 ’UTR jsou v kotevních sekvencích pro transkripční faktory a ovlivní vazbu transkripčních faktorů, pokud jsou změněny.
V kódující sekvenci proteinu je mnoho SNP, které mění aminokyselinové složení CCDC142. Jeden SNP s vysokou mírou prevalence v populaci (1,8%) je pozoruhodný svou změnou v chemii, s tyrosin k asparaginovému posunu na aminokyselině 548.[15]
Ve velkém je také řada SNP 3 ‘UTR genu, přičemž mnoho z nich se váže na oblasti obsahující struktury kmenových smyček v mRNA. SNP s mírou prevalence 7,7% (guanin na adenosin na bp4285) je v 3 'UTR, ale není umístěn v konzervované oblasti smyčky kmene.[15]
Tyto SNP byly anotovány v Konceptuálním překladu umístěném v části Protein výše.
Zarovnání více sekvencí
- Vzdálené ortologové vícenásobné sekvenční zarovnání CCDC142
Fialová = Podobná chemie aminokyselin
Modrá = stejná aminokyselina
Ve vícenásobném zarovnání sekvence výše (vytvořeno pomocí CLUSTALW a programy TEXSHADE na SDSC Biology Workbench), organismy jsou označeny prvním písmenem svého rodu a prvními dvěma písmeny svého druhu. Celý protein CCDC142 je u savců vysoce konzervovaný.[5] Regiony obsahující Homo sapiens doména coiled-coil a oblast motivu RINT1_TIP1 jsou vysoce konzervované ve vzdálených homologech.[5] 12 z 15 aminokyselin, které se shodují napříč všemi organismy v této oblasti, je nepolárních.[5] Konzervovaná oblast 1 obsahuje převážně nepolární aminokyseliny.[5] Konzervovaná oblast 2 obsahuje převážně nepolární a bazické aminokyseliny. Konzervovaná oblast 3 obsahuje polární i nepolární aminokyseliny.[5] Konzervovaná oblast 5 obsahuje převážně nepolární a bazické aminokyseliny.[5]
Další informace o transkripčním faktoru
![](http://upload.wikimedia.org/wikipedia/commons/thumb/8/84/Final_Transcription_Factor_Annotation_of_CCDC142.png/350px-Final_Transcription_Factor_Annotation_of_CCDC142.png)
![](http://upload.wikimedia.org/wikipedia/commons/thumb/f/f4/Final_Transcription_Factor_Annotation_Legend_of_CCDC142.png/350px-Final_Transcription_Factor_Annotation_Legend_of_CCDC142.png)
Reference
- ^ A b C d E F G h i „CCDC142 doména coiled-coil obsahující 142 [Homo sapiens (člověk)] - gen - NCBI“. www.ncbi.nlm.nih.gov. Citováno 2016-05-01.
- ^ A b C "protein obsahující doménu coiled-coil 142 [Homo sapiens] - Protein - NCBI". www.ncbi.nlm.nih.gov. Citováno 2016-05-01.
- ^ A b C d E „CCDC142 - protein obsahující doménu coiled-coil 142 - Homo sapiens (člověk) - gen a protein CCDC142“. www.uniprot.org. Citováno 2016-05-01.
- ^ A b „Výsledek hledání motivu SSDB: hsa: 84865“. www.kegg.jp. Citováno 2016-05-01.
- ^ A b C d E F G h i j k l „SDSC Biology Workbench“.
- ^ „Server NetPhos 2.0“. www.cbs.dtu.dk. Citováno 2016-05-01.
- ^ „Memo: Předpověď methylace proteinů“. www.bioinfo.tsinghua.edu.cn. Archivovány od originál dne 2016-03-14. Citováno 2016-05-01.
- ^ "::: NBA-Palm - Predikce palmitoylačního webu implementovaného v naivním Bayesovském algoritmu :::". www.bioinfo.tsinghua.edu.cn. Archivovány od originál dne 2016-06-09. Citováno 2016-05-01.
- ^ "Program analýzy SUMOplot ™ | Naléhavé". www.abgent.com. Citováno 2016-05-01.
- ^ „NLS_Mapper“. nls-mapper.iab.keio.ac.jp. Citováno 2016-05-01.
- ^ A b Kelley, Lawrence. „Server pro rozpoznávání skládání proteinů PHYRE2“. www.sbg.bio.ic.ac.uk. Citováno 2016-05-01.
- ^ A b Remmert, Michael. „Quick2D“. toolkit.tuebingen.mpg.de. Citováno 2016-05-01.
- ^ A b C „Server I-TASSER pro predikci struktury a funkce proteinů“. zhanglab.ccmb.med.umich.edu. Citováno 2016-05-01.
- ^ A b C d E „Genomatix - analýza dat NGS a personalizovaná medicína“. www.genomatix.de. Citováno 2016-05-01.
- ^ A b C snpdev. „SNP linked to Gene (genID: 84865) Via Contig Annotation“. www.ncbi.nlm.nih.gov. Citováno 2016-05-01.
- ^ „RBPDB: Databáze RNA-vazebných specificit“. rbpdb.ccbr.utoronto.ca. Citováno 2016-05-01.
- ^ A b "Microarray Data :: Allen Brain Atlas: Human Brain". human.brain-map.org. Citováno 2016-05-01.
- ^ „Profil EST - Hs.430199“. www.ncbi.nlm.nih.gov. Citováno 2016-05-01.
- ^ geo. „Home - GEO - NCBI“. www.ncbi.nlm.nih.gov. Citováno 2016-05-01.
- ^ A b „GDS3596 / 1451178_at“. www.ncbi.nlm.nih.gov. Citováno 2016-05-01.
- ^ „GDS4795 / ILMN_3023885“. www.ncbi.nlm.nih.gov. Citováno 2016-05-01.
- ^ A b ClinVar. „Nebyly nalezeny žádné položky - ClinVar - NCBI“. www.ncbi.nlm.nih.gov. Citováno 2016-05-05.