Fam158a - Fam158a
EMC9 | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikátory | |||||||||||||||||||||||||
Aliasy | EMC9, C14orf122, FAM158A, CGI-112, Fam158a, ER membránový proteinový komplex podjednotka 9 | ||||||||||||||||||||||||
Externí ID | MGI: 1934682 HomoloGene: 41095 Genové karty: EMC9 | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortology | |||||||||||||||||||||||||
Druh | Člověk | Myš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (mRNA) | |||||||||||||||||||||||||
RefSeq (protein) | |||||||||||||||||||||||||
Místo (UCSC) | Chr 14: 24,14 - 24,14 Mb | Chr 14: 55,58 - 55,59 Mb | |||||||||||||||||||||||
PubMed Vyhledávání | [3] | [4] | |||||||||||||||||||||||
Wikidata | |||||||||||||||||||||||||
|
UPF0172 protein FAM158A, také známý jako c14orf122 nebo CGI112, je protein že u lidí je kódován FAM158A gen umístěný na chromozom 14q 11.2.[5][6]
Lidská FAM158A a její paralogy u jiných druhů jsou součástí necharakterizované proteinové rodiny UPF0172, která je podskupinou proteázy JAB1 / Mov34 / MPN / PAD-1 ubikvitinu rodina bílkovin. Nadčeleď MPN přispívá k ubikvitinace a de-ubikvitinační aktivita v buňce. Podmnožina UPF0172 již nemá funkční ubikvitinační doménu a funkce není charakterizovaná.[7]
Gen
Fam158a je umístěn mezi PSME1 (antisense) a PSME2 (smysl).[8] RNF31 je proti proudu a antisense vůči Fam158a. DCAF11 a FITM1 jsou oba proti směru PSME1 antisense k Fam158a. PSME1 je podjednotka regulátoru 11S, který je součástí imunoproteasom zodpovědný za štěpení MHC třída I peptidy.[9] PSME2 je další podjednotka regulátoru 11S[10] RNF31 kóduje protein, který obsahuje prstencový motiv nacházející se v několika proteinech, které zprostředkovávají interakce protein-DNA a protein-protein.[11] FITM1 je protein zapojený do ukládání tuku.[12] DCAF11 je protein, o kterém je známo, že interaguje s COP9, a má několik alternativních transkriptů.[13]
Koncepční překlad Fam158a s poznámkami o předpokládaných fosforylačních místech, hranicích exonu a konzervovaných oblastech
Fam158a chromozomální umístění a sousední geny
vazebná místa transkripčního faktoru v promotoru Fam158a
Promotér
Pořadatel je konzervován již v minulosti Danio rerio. Softberry's FGenesH předpovídá dva upstream promotory, a TATA Box 461 bp upstream od počátečního místa a další necharakterizovaný promotor 83bp upstream.[Citace je zapotřebí ] Genomatix ElDorado předpovídá několik transkripční faktor vazebná místa v promotorové oblasti.[Citace je zapotřebí ][14] zjistil, že výraz Fam158a se zvyšuje v GATA3 mutanty, a jak je vidět v tabulce, promotorová oblast Fam158a obsahuje vazebné místo Gata. Další studie ukazuje, že FAM158A reaguje Beta-katenin vyčerpání.[15] Ačkoli v promotoru nejsou známa žádná vazebná místa pro beta-katenin, existuje a NeuroD web a NeuroD reaguje na beta-katenin.
Homologie




Paralogy
název | Druh | Obecný název druhu | NCBI přístupové číslo | délka | Identita proteinu |
---|---|---|---|---|---|
Fam158a | Homo sapiens | Člověk | NP_057133.2 | 208aa | 100% |
Cox4NB | Homo sapiens | Člověk | O43402.1 | 210aa | 41.6% |
The paralog na FAM158A je běžně známý jako Cox4NB a nachází se na 16q24.[16] Také se označuje jako Cox4AL, Noc4 a Fam158b. Paralog se částečně překrývá COX4I1 a má dva izoformy. Isoforma 1 je úplná izoforma s 210 aminokyselinami, zatímco izoforma 2 je 126 aminokyselin.[17] Stejně jako Fam158a je Cox4NB v eukaryotech vysoce konzervovaný, od savců až po ryby. V současné době není známá funkce Cox4NB. U většiny ryb a dále vzadu je jediný homolog, předchůdce Cox4NB a Fam158a.
Homology
Druh | Obecný název druhu | NCBI přístupové číslo (mRNA / protein) | Délka (bp / aa) | Identita proteinu | Identita mRNA | Poznámky |
---|---|---|---|---|---|---|
Homo sapiens | Člověk | NM_16049.3 / NP_057133.2 | 896 bp / 208aa | 100% | 100% | |
Pan troglodyty | Šimpanz | XM_001167788.2 / XP_001167788.1 | 842 bp / 208aa | 99.5% | 98.7% | Identita založená na zarovnání SDSC [18] |
Mus musculus | Myš | NM_033146.1 / NP_149158.1 | 805 bp / 206aa | 90.4% | 77.7% | |
Xenopus (Silurona) tropicalis | Western Clawed Frog | XM_002939019.1 / XP_002939065.1 | 1182bp / 205aa | 49.8% | 40.4% | |
'Xenopus laevis | Africká drápá žába | NM_001096278.1 / NP_001089747.1 | 750 bp / 206aa | 49.8% | 51.9% | mRNA chybí 5 'UTR |
Danio rerio | Zebrafish | NM_200126.1 / NP_956420.1 | 962 bp / 205aa | 51.4% | 46.3% | |
Bombus impatiens | Východní čmelák | XM_003489887.1 / XP_003489935.1 | 846 bp / 207aa | 35.8% | 41.1% | mRNA chybí 5 'UTR |
Volvox carteri f. nagariensis | Zelené řasy | XM_002953071.1 / XP_002953117.1 | 1677 bp / 222aa | 29.3% | 34.8% | |
Salicornia bigelovii | Trpasličí slané | DQ444286.1 / ABD97881.1 | 870 bp / 198aa | 31.3% | 47.5% | |
Arabidopsis thaliana | Thale řeřicha | NM_124976.3 / NP_568832.1 | 1039 bp / 208aa | 29.1% | 44.7% | |
Physcomitrella patens patens | Mech | XM_001763974 / XP_001764026.1 | 609 bp / 202aa | 30.9% | 49.2% | mRNA chybí 5 'UTR |
Serpula lacrymans S7.3 | Basidiomycetes typ droždí - žádný obecný název | GL945481.1 / EGN98368.1 | 203aa | 30.3% | sekvence brokovnice mRNA, žádné informace o mRNA | |
Capsaspora owczarzaki | A protist - žádné běžné jméno | GG697244.1 / EFW44366.1 | 202aa | 31.2% | sekvence brokovnice mRNA, žádné informace o mRNA | |
Plasmodium knowlesi kmen H | Plasmodium, malárie způsobující, žádné běžné jméno | XM_002259366.1 / XP_002259402.1 | 609 bp / 202aa | 24.7% | 45.9% | mRNA chybí 5 'UTR |
Jak je uvedeno v porovnání, protein je chemicky vysoce konzervovaný, i když přesná sekvence se liší. Existuje také několik oblastí vysoké ochrany (zvýrazněné červenými rámečky). Stupeň zachování sleduje očekávaný evoluční vzorec. Graf to ukazuje vynesením podobnosti proteinů každého druhu s lidským proteinem v závislosti na čase, kdy druh sdílel společného předka. Bez kořenů fylogenetický strom také ukazuje tento vztah.
Protein
Fam158a má izoelektrický bod 5,5[19] a molekulová hmotnost 23 kilodaltonů.[20] Fam158a nemá žádné předpovídané signální peptidy nebo transmembránový regionech. Existuje několik předpovězených fosforylačních míst.[21][22] označené v koncepčním překladu i v předpokládané sekundární struktuře.[23] Neexistují žádné oblasti významně odlišné od jiných lidských proteinů, pokud jde o složení, oblasti polarity nebo oblasti hydrofobicity. iPsortII předpovídá žádné signální peptidy a lokalizuje Fam158a do cytoplazma -[24] I-Tasser[25] předpovídá několik struktur pro Fam158a a zobrazí se nejlepší předpověď. Švýcarský model[26] předpovídá dvě potenciální proteinové struktury, jak je vidět na obrázcích. První struktura předpovídá proteinové formy a dimer bílkovin, druhý jako a monomer. Rual a kol.[27] zjistil, že Fam158a interaguje s proteinem zvaným TTC35. Funkce TTC35 není známa, ale je také známo, že interaguje s Cox4NB a Ubikvitin C..
Predikované proteinové struktury využívající SwissModel
Předpovězená struktura Fam158a z I Tasseru
Funkce
Fam158a je téměř všudypřítomně exprimován v celém lidském těle.[28] Homolog u myší také ukazuje expresi v celém těle.[29] Několik mikročipů demonstruje variabilní expresi Fam158a v reakci na jiné faktory a na různé typy rakoviny. Žádná z těchto informací neposkytuje žádnou indikaci specifické funkce, ale široká exprese genu a jeho vysoká ochrana naznačuje, že Fam158a hraje důležitou roli v buněčné funkci.
Klinický význam
Existuje několik nemocí spojených s delecemi 14q11.2, ale žádné z nich nebylo spojeno konkrétně s Fam158a. T-lymfocytární Leukémie s nebo bez ataxie telangiektázie byl spojován s inverzemi a tandemovými translokacemi 14q11 a 14q32 a dalších chromozomů.[30] Taky, syndactyly typ 2 byl izolován na 14q11.2-12.[31] Tato forma syndaktylie je kromě jiných fúzí a malformací charakterizována fúzí třetí a čtvrté číslice ruky a čtvrté a páté číslice nohy.
Reference
- ^ A b C ENSG00000285377 GRCh38: Vydání souboru 89: ENSG00000100908, ENSG00000285377 - Ensembl, Květen 2017
- ^ A b C GRCm38: Vydání Ensembl 89: ENSMUSG00000022217 - Ensembl, Květen 2017
- ^ „Human PubMed Reference:“. Národní centrum pro biotechnologické informace, Americká národní lékařská knihovna.
- ^ „Myš PubMed Reference:“. Národní centrum pro biotechnologické informace, Americká národní lékařská knihovna.
- ^ GeneCard pro fam158a
- ^ HomoloGene: 41095
- ^ „NCBI CDD cd08060“. Databáze chráněných domén. Národní centrum pro biotechnologické informace.Marchler-Bauer A, Anderson JB, Chitsaz F, Derbyshire MK, DeWeese-Scott C, Fong JH, Geer LY, Geer RC, Gonzales NR, Gwadz M, He S, Hurwitz DI, Jackson JD, Ke Z, Lanczycki CJ, Liebert CA, Liu C, Lu F, Lu S, Marchler GH, Mullokandov M, Song JS, Tasneem A, Thanki N, Yamashita RA, Zhang D, Zhang N, Bryant SH (leden 2009). "CDD: specifická funkční anotace s databází chráněných domén". Nucleic Acids Res. 37 (Problém s databází): D205–10. doi:10.1093 / nar / gkn845. PMC 2686570. PMID 18984618.
- ^ EntrezGene 51016
- ^ EntrezGene 5720
- ^ EntrezGene 5721
- ^ EntrezGene 55072
- ^ EntrezGene 161247
- ^ EntrezGene 80344
- ^ Usary J, Llaca V, Karaca G, Presswala S, Karaca M, He X, Langerød A, Kåresen R, Oh DS, Dressler LG, Lønning PE, Strausberg RL, Chanock S, Børresen-Dale AL, Perou CM (říjen 2004) . "Mutace GATA3 v lidských nádorech prsu". Onkogen. 23 (46): 7669–78. doi:10.1038 / sj.onc.1207966. PMID 15361840.
- ^ Dutta-Simmons J, Zhang Y, Gorgun G, Gatt M, Mani M, Hideshima T, Takada K, Carlson NE, Carrasco DE, Tai YT, Raje N, Letai AG, Anderson KC, Carrasco DR (září 2009). „Aurora kináza A je terčem Wnt / beta-kateninu zapojeného do progrese onemocnění mnohočetným myelomem“. Krev. 114 (13): 2699–708. doi:10.1182 / krev-2008-12-194290. PMID 19652203.
- ^ Bachman NJ, Wu W, Schmidt TR, Grossman LI, Lomax MI (květen 1999). „5 'oblast genu COX4 obsahuje nový překrývající se gen, NOC4“ (PDF). Mamm. Genom. 10 (5): 506–12. doi:10,1007 / s003359901031. PMID 10337626.
- ^ NCBI. „Homo sapiens COX4 Neighbor (COX4NB), transkript varianta 1, mRNA - nukleotid“. Referenční sekvence NCBI: NM_006067.4. Národní centrum pro biotechnologické informace.
- ^ Thompson JD, Higgins DG, Gibson TJ (listopad 1994). „CLUSTAL W: zlepšuje citlivost postupného vícenásobného seřazení sekvencí pomocí vážení sekvencí, penalizací mezer pro konkrétní pozici a volby matice hmotnosti“. Nucleic Acids Res. 22 (22): 4673–80. doi:10.1093 / nar / 22.22.4673. PMC 308517. PMID 7984417.
- ^ Toldo L, Kindler B. „EMBL WWW Gateway to Isoelectric Point Service“. EMBL Heidelberg.
- ^ Brendel V, Bucher P, Nourbakhsh IR, Blaisdell BE, Karlin S (březen 1992). "Metody a algoritmy pro statistickou analýzu proteinových sekvencí". Proc. Natl. Acad. Sci. USA. 89 (6): 2002–6. doi:10.1073 / pnas.89.6.2002. PMC 48584. PMID 1549558.
- ^ Blom N, Gammeltoft S, Brunak S (prosinec 1999). "Posloupnost a struktura založená na predikci míst fosforylace eukaryotických proteinů". J. Mol. Biol. 294 (5): 1351–62. doi:10.1006 / jmbi.1999.3310. PMID 10600390.
- ^ Blom N, Sicheritz-Pontén T, Gupta R, Gammeltoft S, Brunak S (červen 2004). „Predikce posttranslační glykosylace a fosforylace proteinů ze sekvence aminokyselin“. Proteomika. 4 (6): 1633–49. doi:10.1002 / pmic.200300771. PMID 15174133.
- ^ Qian N, Sejnowski TJ (srpen 1988). "Predikce sekundární struktury globulárních proteinů pomocí modelů neuronových sítí". J. Mol. Biol. 202 (4): 865–84. doi:10.1016/0022-2836(88)90564-5. PMID 3172241.
Společná predikce - Predikce vytvořená programem, který přiřazuje strukturu pomocí postupu „vítěz bere vše“ pro každou predikci aminokyselin pomocí jiných metod
- ^ Bannai H, Tamada Y, Maruyama O, Nakai K, Miyano S (únor 2002). "Rozsáhlá detekce funkcí signálů pro třídění N-terminálních proteinů". Bioinformatika. 18 (2): 298–305. doi:10.1093 / bioinformatika / 18.2.298. PMID 11847077.
- ^ Ambrish Roy, Alper Kucukural, Yang Zhang. I-TASSER: jednotná platforma pro automatickou predikci struktury a funkce proteinů. Nature Protocols, sv. 5, 725-738 (2010)
- ^ Arnold K, Bordoli L, Kopp J, Schwede T (leden 2006). „Pracovní prostor SWISS-MODEL: webové prostředí pro modelování homologie proteinové struktury“. Bioinformatika. 22 (2): 195–201. doi:10.1093 / bioinformatika / bti770. PMID 16301204.
- ^ Rual JF, Venkatesan K, Hao T, Hirozane-Kishikawa T, Dricot A, Li N, Berriz GF, Gibbons FD, Dreze M, Ayivi-Guedehoussou N, Klitgord N, Simon C, Boxem M, Milstein S, Rosenberg J, Goldberg DS, Zhang LV, Wong SL, Franklin G, Li S, Albala JS, Lim J, Fraughton C, Llamosas E, Cevik S, Bex C, Lamesch P, Sikorski RS, Vandenhaute J, Zoghbi HY, Smolyar A, Bosak S, Sequerra R, Doucette-Stamm L, Cusick ME, Hill DE, Roth FP, Vidal M (říjen 2005). „Směrem k mapě lidské interakční sítě protein-protein v měřítku proteomu“. Příroda. 437 (7062): 1173–8. doi:10.1038 / nature04209. PMID 16189514.
- ^ „Profil EST - Hs.271614“. Prohlížeč profilů EST. Národní centrum pro biotechnologické informace (NCBI).
- ^ „ID sady GENEPAINT: EH1992“. GenePaint.org.
digitální atlas vzorců genové exprese u myši
- ^ Brito-Babapulle V, Catovsky D (srpen 1991). „Inverze a tandemové translokace zahrnující chromozom 14q11 a 14q32 u T-prolymfocytové leukémie a T-buněčných leukémií u pacientů s ataxií telangiektázií“. Genetika rakoviny. Cytogenet. 55 (1): 1–9. doi:10.1016 / 0165-4608 (91) 90228-M. PMID 1913594.
- ^ Malik S, Abbasi AA, Ansar M, Ahmad W, Koch MC, Grzeschik KH (červen 2006). „Genetická heterogenita synpolydaktylie: nový lokus SPD3 se mapuje na chromozom 14q11.2-q12“. Clin. Genet. 69 (6): 518–24. doi:10.1111 / j.1399-0004.2006.00620.x. PMID 16712704.