LRRC40 - LRRC40 - Wikipedia

LRRC40
Identifikátory
AliasyLRRC40, dJ677H15.1, opakování bohaté na leucin obsahující 40
Externí IDMGI: 1914394 HomoloGene: 9825 Genové karty: LRRC40
Umístění genu (člověk)
Chromozom 1 (lidský)
Chr.Chromozom 1 (lidský)[1]
Chromozom 1 (lidský)
Genomické umístění pro LRRC40
Genomické umístění pro LRRC40
Kapela1p31.1Start70,144,805 bp[1]
Konec70,205,579 bp[1]
Ortology
DruhČlověkMyš
Entrez
Ensembl
UniProt
RefSeq (mRNA)

NM_017768

NM_001289524
NM_001289525
NM_024194
NM_001359763

RefSeq (protein)

NP_060238

NP_001276453
NP_001276454
NP_077156
NP_001346692

Místo (UCSC)Chr 1: 70,14 - 70,21 MbChr 3: 158,04 - 158,07 Mb
PubMed Vyhledávání[3][4]
Wikidata
Zobrazit / upravit člověkaZobrazit / upravit myš

Opakování bohaté na leucin obsahující 40 (LRRC40) je a protein že u lidí je kódován LRRC40 gen.[5]

Distribuce druhů

LRRC40 je ve všech zachován ortology. Celá bílkovina je u savců vysoce konzervovaná, zatímco u zbytků ortologů je konzervace vysoká u opakování bohatých na leucin.[6] Ortology byly nalezeny až do šarlatové mořské sasanky a homology byly nalezeny v bakterie a Archaea použitím VÝBUCH.[7] Následující tabulka poskytuje informace o homologech LRRC40.

Rod druhObecný název organismuDivergence od lidí (MYA) [8]NCBI mRNA přistoupeníSekvenční podobnost [7]Délka bílkovinSpolečný název genu
Homo sapiens[9]Lidé--NM_017768100%602LRRC40
Pan troglodyty[10]Obyčejný šimpanz6.4XM_51348399%602Hypotetický protein
Pongo abelii [11]Orangutan15.8NM_00113118099%602LRRC40
Macaca fascicularis [12]Makak dlouhoocasý30.2AB17921999%602Plný LRRC40
Callithrix jacchus [13]Společný kosman43.9XM_002750952.199%602Předpokládané: LRRC40
Sus scrofa [14]Divočák92.5XM_00312792896%602Předpokládá se: protein podobný LRRC40
Mus musculus [15]Myš94.1NM_02419492%602LRRC40
Monodelphis domestica [16]Vačice160.2XM_00137941786%598Hypotetický protein
Gallus gallus [17]Kuře274.8NM_00103129585%603LRRC40
Taeniopygia guttata [18]Zebra pěnkava274.8XM_00218836785%605Předpokládané: LRRC40
Xenopus (Silurana) tropicalis [19]Západní drápá žába389.7NM_00101131080%605LRRC40
Danio rerio [20]Zebrafish444.3NM_19986283%601LRRC40
Salmo salar [21]Losos444.3BT04362182%600LRRC40
Nematostella vectensis [22]Scarlet sea anemone830.3XM_00164023066%602Předpokládaný protein
Culex quinquefasciatus [23]Jižní dům komár838.3XM_001842697.158%612LRRC40

Gen

LRRC40 je umístěn na negativním řetězci DNA (viz Smysl (molekulární biologie) ) z chromozom 1 od 70 611 483 do 70 671 223.[24] Gen produkuje 2958 základní pár mRNA. Předpokládá se 15 exony v lidském genu [9] se čtyřmi dalšími spojovacími vzory předpovězenými na GeneCards alternativní spojovací databází.[25]

Genové sousedství

LRRC40 sousedí po proudu od LRRC7 (70 225 258 - 70 587 570) na pozitivním řetězci DNA a proti proudu do SRSF11 (70 687 320 - 70 716 488) na pozitivním řetězci DNA.

Genový výraz

LRRC40 je vyjádřen mezi 50. a 100. percentilem téměř v každé tkáni v těle.[26]

Exprese LRRC40 v 79 lidských tkáních.[26]

Protein

I když přesná funkce proteinu LRRC40 ještě není známa, předpokládá se, že se účastní interakcí protein-protein, protože je členem bohaté na leucin rodina proteinů, o nichž je známo, že se na nich podílejí interakce protein-protein.[27]

Vlastnosti

LRRC40 je 602 aminokyselinový protein s a molekulární váha 68,254 kDa a an izoelektrický bod 6,04.[28] Očekává se, že LRRC40 bude lokalizován do jádro [29] a nemá žádné transmembránové domény, které by jej ukotvily k jaderná membrána. LRRC40 má mnoho předpovídaných fosforylace stránky. Z 19 předpovězených fosfoserin jsou v ortologech konzervovány pouze dva.[30] Tyto dvě stránky jsou S38 a S391.

Struktura bílkovin

The sekundární struktura proteinu má vzor v leucinových repetičních oblastech. Každé opakování leucinů má a β-list a α-šroubovice. Obrázek vpravo ukazuje konkrétní strukturu proteinu podobnou podkově s mnoha opakováními bohatými na leucin. V závislosti na oblasti, kde se nacházejí LRR, se mohou jiné proteiny vázat v křivce podkovy nebo se připojit k vnějšku proteinu.

Struktura proteinu Inla S192n G194S bez jeho vazebného partnera, sHEC1. Vazebné místo bylo ponecháno prázdné, aby se ukázaly vrcholy opakování bohatého na leucin (žlutě), které prokazují vlastnosti LRR vázat se na protein.[31]

Interakce proteinů

Podle Genecards má LRRC40 756 možných proteinové interakce.[25] Tyto interakce jsou založeny na výsledcích v databázi molekulárních interakcí, která poskytla dvě možné proteinové interakce. Dva proteiny jsou popsány v tabulce níže.

ZkratkaNázev proteinuPřistoupení proteinu NCBIMobilní umístěníFunkce
CDC5LCyklus buněčného dělení 5-jako proteinNP_001244jádroregulace transkripce a zpracování mRNA [32]
SNW1Protein interagující s lyžemiNP_036377.1jádroZpracování mRNA [33]

Reference

  1. ^ A b C GRCh38: Vydání souboru 89: ENSG00000066557 - Ensembl, Květen 2017
  2. ^ A b C GRCm38: Vydání souboru 89: ENSMUSG00000063052 - Ensembl, Květen 2017
  3. ^ „Human PubMed Reference:“. Národní centrum pro biotechnologické informace, Americká národní lékařská knihovna.
  4. ^ „Myš PubMed Reference:“. Národní centrum pro biotechnologické informace, Americká národní lékařská knihovna.
  5. ^ „Entrezův gen: opakování bohaté na leucin obsahující 40“.
  6. ^ Chenna R, Sugawara H, Koike T, Lopez R, Gibson TJ, Higgins DG, Thompson JD (červenec 2003). „Zarovnání více sekvencí s řadou programů Clustal“. Nucleic Acids Res. 31 (13): 3497–500. doi:10.1093 / nar / gkg500. PMC  168907. PMID  12824352.
  7. ^ A b "NCBI BLAST".
  8. ^ "Time Tree".
  9. ^ A b „NCBI Nucleotide: NM_017768.4“.
  10. ^ „NCBI Nucleotide: XP_513483“.
  11. ^ „Nukleotid NCBI: NM_001131180“.
  12. ^ „NCBI Nucleotide: AB179219“.
  13. ^ „Nukleotid NCBI: XM_002750952.1“.
  14. ^ „Nukleotid NCBI: XM_003127928“.
  15. ^ „Nukleotid NCBI: NM_024194“.
  16. ^ „Nukleotid NCBI: XM_001379417“.
  17. ^ „Nukleotid NCBI: NM_001031295“.
  18. ^ „Nukleotid NCBI: XM_002188367“.
  19. ^ „Nukleotid NCBI: NM_001011310“.
  20. ^ „Nukleotid NCBI: NM_199862“.
  21. ^ „Nukleotid NCBI: BT043621“.
  22. ^ „Nukleotid NCBI: XM_001640230“.
  23. ^ „Nukleotid NCBI: XM_001842697.1“.
  24. ^ „NCBI Gene: 55631“.
  25. ^ A b „GeneCards: LRRC40“.
  26. ^ A b „Profily GEO: LRRC40 GDS596“.
  27. ^ Kobe B, Kajava AV (prosinec 2001). "Opakování bohaté na leucin jako motiv rozpoznávání bílkovin". Curr. Opin. Struct. Biol. 11 (6): 725–32. doi:10.1016 / S0959-440X (01) 00266-4. PMID  11751054.
  28. ^ „ExPASy: Compute PI / Mw“. Archivovány od originál dne 23. 7. 2003.
  29. ^ „PSORTII: Nástroj pro lokalizaci proteinů“.[trvalý mrtvý odkaz ]
  30. ^ „Server NetPhos 2.0: Predikce fosforylace“.
  31. ^ „NCBI MMDB: Inla S192n G194S“.
  32. ^ „MINT: CDC5L“. Archivovány od originál dne 18. 2. 2013.
  33. ^ „MINT: SNW1“. Archivovány od originál dne 18. 2. 2013.