MAP11 - MAP11 - Wikipedia
MAP11 | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Identifikátory | |||||||||||||||||||||||||
Aliasy | MAP11, otevřený čtecí rámec 43 chromozomu 7, C7orf43, protein spojený s mikrotubuly 11, MCPH25, TRAPPC14 | ||||||||||||||||||||||||
Externí ID | OMIM: 618350 MGI: 2385896 HomoloGene: 10106 Genové karty: MAP11 | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
Ortology | |||||||||||||||||||||||||
Druh | Člověk | Myš | |||||||||||||||||||||||
Entrez | |||||||||||||||||||||||||
Ensembl | |||||||||||||||||||||||||
UniProt | |||||||||||||||||||||||||
RefSeq (mRNA) | |||||||||||||||||||||||||
RefSeq (protein) | |||||||||||||||||||||||||
Místo (UCSC) | Chr 7: 100,15 - 100,16 Mb | Chr 5: 138,26 - 138,26 Mb | |||||||||||||||||||||||
PubMed Vyhledávání | [3] | [4] | |||||||||||||||||||||||
Wikidata | |||||||||||||||||||||||||
|
MAP11 (Protein 11 spojený s mikrotubuly) je a protein že u člověka je kódován gen MAP11. Dříve to bylo označováno obecným názvem C7orf43.[5] C7orf43 nemá žádný jiný lidský alias, ale v myši lze najít jako BC037034.[6]
Gene Locus
U lidí MAP11 se nachází v dlouhé rameno člověka chromozom 7 (7q22.1) a je na negativní (antisense) vlákno.[5] Geny umístěné kolem C7orf43 zahrnout GAL3ST4, LAMTOR4, GPC2.[5] U lidí C7orf43 má 9 zjištěných společných jedno-nukleotidové polymorfismy (SNP), které jsou všechny umístěny v nekódujících oblastech, a tak neovlivňují aminokyselinovou sekvenci.[7]

mRNA
Varianty spoje

MAP11 kóduje 2 izoformy, nejdelší je izoforma 1 C7orf43, která je dlouhá 2585 párů bází a má 11 exony a 10 introny.[5] Izoforma 1 C7orf43 kóduje protein, který je 580 aminokyseliny dlouhý a má pouze jedno polyadenylační místo.[5] Izoforma 2 C7orf43 má délku 2085 párů bází a kóduje protein 311 aminokyselin. Několikrát byly hlášeny dvě další izoformy kódující proteiny se 199 a 206 aminokyselinami.[8]
Tkáňový výraz
MAP11 má rozšířenou střední expresi s variabilitou mezi tkáněmi u lidí i napříč savčí druh.[9][10] Ukázalo se, že myší ortolog C7orf43 je všudypřítomně exprimován v mozek,[11] stejně jako v embryonálních myších centrální nervový systém.[12]
Předpisy
MAP11 má jednu promotorovou oblast před svým transkripčním místem, jak předpovídá Genomatix. Tento promotor je dlouhý 657 párů bází a je umístěn v poloze 99756182 až 99756838 v negativním řetězci chromozomu 7.[13] Je jich několik transkripční faktor vazebná místa umístěná v tomto promotoru, včetně vazebných míst pro zinkové prsty a Kruppelovy transkripční faktory.[14] Prvních 20 transkripčních vazebných míst podle předpovědi ElDorado z Genomatix je uvedeno v následující tabulce.
Podrobné informace o rodině | Podrobné informace o matici | Počáteční pozice | Koncová pozice | Poloha kotvy | Pramen | Skóre podobnosti matice | Sekvence |
---|---|---|---|---|---|---|---|
Gen Brachyury, vývojový faktor mezodermu | Transkripční faktor T-boxu TBX20 | 617 | 645 | 631 | + | 1 | agcagccggAGGTgtcgggaccctctgga |
C2H2 transkripční faktory se zinkovým prstem 2 | Protein 300 se zinkovým prstem obsahujícím KRAB | 596 | 618 | 607 | + | 1 | ccggccgCCCCagccgggcgcag |
Faktory vidlicové hlavy | Alternativní sestřihová varianta FOXP1, aktivovaná v ESC | 37 | 53 | 45 | - | 1 | aaaaaaaAACAaccctt |
Gen pleomorfního adenomu | Gen pleomorfního adenomu 1 | 411 | 433 | 422 | - | 1 | gaGGGGgcggggtcccgctgctc |
Gen pleomorfního adenomu | Gen pleomorfního adenomu 1 | 464 | 486 | 475 | - | 1 | gaGGGGgcgtggccgccgaggcc |
RNA polymeráza II transkripční faktor II B | Rozpoznávací prvek transkripčního faktoru II B (TFIIB) | 197 | 203 | 200 | + | 1 | ccgCGCC |
Proteiny apoptózy indukované TGF-beta | Jaderný protein bohatý na cystein-serin 1 (AXUD1, AXIN1 up-regulovaný 1) | 73 | 79 | 76 | - | 1 | AGAGtga |
Faktory GC-Box SP1 / GC | Stimulující protein 1, všudypřítomný transkripční faktor se zinkovým prstem | 418 | 434 | 426 | - | 0.998 | ggaggGGGCggggtccc |
Lidské a myší faktory ETS1 | Ets varianta 3 | 486 | 506 | 496 | - | 0.996 | gagaaacaGGAAgcggaaggg |
Krueppel jako transkripční faktory | Střevou obohacený faktor podobný Krueppel / KLF4 | 469 | 485 | 477 | - | 0.994 | agggggcGTGGccgccg |
Faktory transkripce homeodomény oboustranným zinkovým prstem | AREB6 (vazebný faktor regulačního prvku Atp1a1 6) | 495 | 507 | 501 | + | 0.994 | ttcctGTTTctct |
Faktor transkripce zinkovým prstem RU49, proliferace zinkových prstů 1 - Zipro1 | Faktor transkripce zinkovým prstem RU49 (proliferace zinkových prstů 1 - Zipro 1). RU49 vykazuje silnou preferenci vazby k tandemovým opakováním minimálního konsensuálního vazebného místa RU49. | 522 | 528 | 525 | + | 0.994 | cAGTAcc |
Krueppel jako transkripční faktory | Protein vázající základní promotor (CPBP) se 3 zinkovými prsty typu Krueppel (KLF6, ZF9) | 418 | 434 | 426 | - | 0.992 | ggagGGGGcggggtccc |
C2H2 transkripční faktory se zinkovým prstem 7 | Protein se zinkovým prstem 263, ZKSCAN12 (protein se zinkovým prstem s doménami KRAB a SCAN 12) | 425 | 439 | 432 | + | 0.99 | cgccccCTCCtccac |
C2H2 transkripční faktory se zinkovým prstem 6 | Zinkový prst a doména BTB obsahující 7, protoonkogen FBI-1, Pokémon (preference sekundární vazby DNA) | 252 | 264 | 258 | - | 0.989 | caaGACCaccctg |
Krueppel jako transkripční faktory | Kruppelův faktor 7 (všudypřítomný, UKLF) | 416 | 432 | 424 | - | 0.989 | agggGGCGgggtcccgc |
Faktory GC-Box SP1 / GC | Transkripční faktor Sp4 | 471 | 487 | 479 | - | 0.986 | ggagggGGCGtggccgc |
Krueppel jako transkripční faktory | Faktor obohacený o střeva obohacený Krueppelem | 137 | 153 | 145 | + | 0.986 | gggctcAAAGgatcctc |
Krueppel jako transkripční faktory | Krueppelův faktor 2 (plíce) (LKLF) | 641 | 657 | 649 | - | 0.986 | cgctaGGGTgggtccag |
Lidské a myší faktory ETS1 | Ets varianta 1 | 6 | 26 | 16 | - | 0.984 | ttctcccaGGAAgattctcca |
Protein
Složení a domény
Lidský protein MAP11 má izoelektrický bod z 8.94. MAP11 má také glycin - bohatá oblast zahrnující aminokyseliny 54 až 134.[15] Analýza pomocí nástroje SAPS z SDSC Biology Workbench ukázala, že tato oblast bohatá na glycin není konzervována, pokud jde o specifické polohy glycinových zbytků, ale je dobře zachována v celkovém obsahu glycinu u savců a plazi, i když ne v kostnaté ryby.[16][17] C7orf43 je většinou nenabitý a tato neutrální distribuce náboje je u savců a plazů zachována, ale kostnaté ryby mají alespoň jeden shluk záporných nábojů [16][17]Předpokládá se, že C7orf43 nemá žádné signální peptid ve svých prvních 70 aminokyselinových zbytcích. Předpokládá se však, že má vakuolární zaměřovací motiv vycházející ze zbytku 258 v lidském proteinu.[18] Ukázalo se, že tento vakuolární cílený motiv je zachován u savců, plazů, ptáků, obojživelníci a kostnaté ryby.
Evoluční historie
Protein MAP11 nemá žádné paralogy u lidí. C7orf43 ortology lze nalézt jako vysoce konzervované u savců, plazů a několika druhů kostnaté ryby. C7orf43 je také zachován u ptáků, ačkoli některým druhům ptáků chybí části N-konec.[19] Žádné ortology C7orf43 nelze najít mimo zvíře království.[19] V následující tabulce jsou uvedeny reprezentativní ortology C7orf43 napříč několika třídami zvířat.
Přísné ortology
Ne. | Druh | Běžné jméno | Datum odchylky (MYA) | Přístupové číslo | E-hodnota | Délka (aa) | Identita (%) | Podobnost (%) |
---|---|---|---|---|---|---|---|---|
1 | Homo sapiens | Člověk | - | NP_060745.3 | 0.0 | 580 | 100 | 100 |
2 | Pan troglodyty | Společný šimpanz | 6.3 | XP_009452032 | 0.0 | 580 | 99 | 100 |
3 | Macaca mulatta | Makak | 29.0 | XP_001102238 | 0.0 | 580 | 99 | 99 |
4 | Cavia porcellus | morče | 92.3 | XP_003470051 | 0.0 | 580 | 98 | 98 |
5 | Sus scrofa | Divočák | 94.2 | XP_003124386 | 0.0 | 580 | 98 | 99 |
6 | Odobenus rosmarus divergens | Mrož | 94.2 | XP_004399075 | 0.0 | 580 | 98 | 98 |
7 | Tursiops se zkrátí | Společný delfín skákavý | 94.2 | XP_004315199 | 0.0 | 582 | 92 | 93 |
8 | Echinops telfairi | Tenrec malého ježka | 98.7 | XP_004705644 | 0.0 | 581 | 95 | 97 |
9 | Dasypus novemcinctus | Pásovec devítipásý | 104.2 | XP_004457234 | 0.0 | 580 | 97 | 98 |
10 | Monodelphis domestica | Šedý vačice s krátkým ocasem | 162.6 | XP_001367097 | 0.0 | 568 | 89 | 92 |
11 | Chrysemys picta bellii | Malovaná želva | 296.0 | XP_008175974 | 0.0 | 572 | 76 | 83 |
12 | Alligator mississippiensis | Americký aligátor | 296.0 | XP_006266384 | 0.0 | 582 | 75 | 82 |
13 | Pelodiscus sinensis | Čínská softshellová želva | 296.0 | XP_006127325 | 0.0 | 569 | 73 | 81 |
14 | Xenopus tropicalis | Západní drápá žába | 371.2 | NP_001121523 | 0.0 | 580 | 64 | 74 |
15 | Oncorhynchus mykiss | pstruh duhový | 400.1 | CDQ84878 | 0.0 | 581 | 64 | 75 |
16 | Danio rerio | Zebrafish | 400.1 | XP_001339329 | 0.0 | 595 | 63 | 74 |
17 | Oryzias latipes | Japonská rýžová ryba | 400.1 | XP_004076807 | 0.0 | 609 | 62 | 70 |
18 | Takifugu rubripes | Pufferfish | 400.1 | XP_003970822 | 0.0 | 618 | 61 | 71 |
Vzdálené ortology
Ne. | Druh | Běžné jméno | Datum odchylky (MYA) | Přístupové číslo | E-hodnota | Délka (aa) | Identita (%) | Podobnost (%) |
---|---|---|---|---|---|---|---|---|
1 | Nipponia Nippon | Chocholatý ibis | 296.0 | XP_009472339 | 0.0 | 503 | 80 | 88 |
2 | Charadrius hlučný | Zabiják | 296.0 | XP_009892747 | 0.0 | 456 | 82 | 90 |
3 | Pseudopodoces humilis | Pozemní sýkorka | 296.0 | XP_005533426 | 0.0 | 600 | 66 | 76 |
4 | Latimeria chalumnae | Coelacanth západoindického oceánu | 414.9 | XP_006011612 | 3E-177 | 429 | 65 | 75 |
5 | Branchiostoma floridae | Florida kopí | 713.2 | XP_002592972 | 9E-67 | 557 | 32 | 46 |
6 | Strongylocentrotus purpuratus | Fialový mořský ježek | 742.9 | XP_003727419 | 3E-46 | 725 | 35 | 51 |
7 | Aplysia californica | Kalifornský mořský slimák | 782.7 | XP_005113015 | 4E-21 | 692 | 25 | 39 |
8 | Nematostella vectensis | Hvězdicová sasanka | 855.3 | XP_001632706 | 4E-19 | 494 | 24 | 39 |
9 | Trichoplax adhaerens | - | - | XP_002108809 | 5E-15 | 645 | 24 | 41 |
Posttranslační úpravy
C7orf43 má tři fosforylovaný weby, Ser 517, Thr 541 a, Ser 546.[15] Všechna tři místa jsou relativně dobře zachována u savců, plazů, ptáků, obojživelníků a kostnatých ryb. Protein se nepředpokládá N-myristoylace, protože neobsahuje N-koncový glycin.[20] Předpokládá se však, že C7orf43 bude mít jednu N-acetylaci na serinovém zbytku na N-konci.[21]
Sekundární struktura
The sekundární struktura C7orf43 je ještě třeba určit. Předpokládá se však, že C7orf43 nemá žádné transmembránová doména a nakonec být vylučován z buňky.[22][23] Většinou předpovídala analýza pomocí nástroje PELE od SDSC Biology Workbench beta listy a náhodné cívky které jsou konzervovány skrz přísné ortology.[17] Podobně konzervované alfa šroubovice byly předpovězeny motivy, jeden blízko N-konce a jeden blízko C-konce.
Klinický význam
I když se žádné studie nezaměřily na charakterizaci C7orf43, několik rozsáhlých projekcí odhalilo informace týkající se funkce C7orf43. Studie s využitím VLAJKA afinitní čištění hmotnostní spektrometrie (AP-MS) k profilování proteinových interakcí v Hrochová signální dráha identifikoval C7orf43 jako jeden z interagujících proteinů.[24] Bylo zjištěno, že C7orf43 interaguje s protein podobný angiomotinu 2 (AMOTL2), také známý jako Leman Coiled-Coil Protein (LCCP), regulátor hipo signalizace.[24][25] AMOTL2 je také známo, že je inhibitorem Wnt signalizace, cesta se známými asociacemi k rakovina a být faktorem pro angiogeneze, proces nezbytný pro udržení nádoru a metastázy.[25]
Několik studií spojovalo C7orf43 s karcinomovými událostmi. Další studie také spojily C7orf43 s karcinomovými příhodami. Ve velkém měřítku kvasnicový dvouhybrid experiment identifikoval C7orf43, se kterým bude komunikovat transmembránový protein 50A (TMEM50A), také známý jako gen 9 rakoviny děložního čípku nebo protein malé membrány 1 (SMP1).[26][27][28] Přesná funkce TMEM50A není známa, ale je spojována s rakovinou děložního čípku.
C7orf43 byl také identifikován jako cílový gen transkripční faktor AP-2 gama (TFAP2C).[29] Ukázalo se, že TFAP2C se podílí na vývoji, diferenciaci a onkogenezi prsních tkání. Konkrétně má TFAP2C roli v karcinom prsu prostřednictvím svého regulačního účinku do ESR1 a ERBB2, oba které jsou receptory, jejichž aberace byly spojeny s karcinomy prsu.[29][30] Bylo také prokázáno, že TFAP2C má onkogenní roli tím, že podporuje buněčnou proliferaci a růst nádoru neuroblastom.[31][32]
Díky svému umístění v q rameni chromozomu 7 byla C7orf43 spojována s různými nemocemi. Bylo popsáno několik onemocnění, které mají delece v rameni q chromozomu 7, mezi nimi jsou myeloidní poruchy, včetně akutní myeloidní leukémie a myelodysplasie.[33]
Reference
- ^ A b C GRCh38: Vydání souboru 89: ENSG00000146826 - Ensembl, Květen 2017
- ^ A b C GRCm38: Vydání souboru 89: ENSMUSG00000036948 - Ensembl, Květen 2017
- ^ „Human PubMed Reference:“. Národní centrum pro biotechnologické informace, Americká národní lékařská knihovna.
- ^ „Myš PubMed Reference:“. Národní centrum pro biotechnologické informace, Americká národní lékařská knihovna.
- ^ A b C d E "C7orf43 chromozom 7, otevřený čtecí rámec 43 [Homo sapiens (člověk)]" ". NCBI Gene. Citováno 9. května 2015.
- ^ "BC037034 cDNA sekvence BC037034 [Mus musculus (domácí myš)]" ". NCBI Gene. Citováno 9. května 2015.
- ^ „Prohlížeč genomu UC7C C7orf43“. UCSC Genome Browser. Citováno 1. května 2015.
- ^ „Q8WVR3 -CG043_HUMAN“. UniProt. Citováno 8. května 2015.
- ^ „C7orf43-Large-scale analysis of the human transcriptome (HG-U133A)“. Profily NCBI GEO. Citováno 2. dubna 2015.
- ^ "C7orf43-Více normálních tkání". Profily NCBI GEO. Citováno 2. dubna 2015.
- ^ „BC037034-sagittal“. Atlas mozku Allen. Citováno 2. dubna 2015.
- ^ „Výraz BC037034“. GenePaint. Citováno 2. dubna 2015.
- ^ „Promotér C7orf43 GXP_116482“. Genomatix. Citováno 5. dubna 2015.
- ^ „Vazebná místa promotoru C7orf43“. Genomatix. Citováno 5. dubna 2015.
- ^ A b "Necharakterizovaný protein C7orf43 [Homo sapiens]". Protein NCBI. Citováno 8. května 2015.
- ^ A b Brendel, V .; Bucher, P .; Nourbakhsh, I.R .; Blaisdell, B.E. & Karlin, S. "Metody a algoritmy pro statistickou analýzu proteinových sekvencí". SAPS (statistická analýza PS). Proc. Natl. Acad. Sci. USA PMID 1549558. Citováno 2015-04-26.
- ^ A b C „SDSC Biology Workbench“. Ústav bioinženýrství. Kalifornská univerzita Sand Diego. Citováno 1. května 2015.
- ^ Nakai, K; Horton, P (leden 1999). „PSORT: program pro detekci třídicích signálů v proteinech a předpovídání jejich subcelulární lokalizace“. Trendy v biochemických vědách. 24 (1): 34–6. doi:10.1016 / s0968-0004 (98) 01336-x. PMID 10087920.
- ^ A b „BLAST: Základní vyhledávací nástroj pro místní zarovnání“. Databáze chráněných domén. Národní centrum pro biotechnologické informace. Citováno 2015-03-01.
- ^ "Myristoylator". Portál zdrojů o bioinformatice ExPASy. Citováno 9. května 2015.
- ^ „Server NetAcet 1.0“. CBS. Citováno 9. května 2015.
- ^ "Transmembránová topologie". Fobius. Stockholmské bioinformatické centrum. Citováno 1. května 2015.
- ^ „SOSUI“. Klasifikace a predikce sekundární struktury membránových proteinů. Skupina Mitaku.
- ^ A b Couzens, A. L .; Knight, J. D. R .; Kean, M. J .; Teo, G .; Weiss, A .; Dunham, W. H .; Lin, Z.-Y .; Bagshaw, R. D .; Sicheri, F .; Pawson, T .; Wrana, J. L .; Choi, H .; Gingras, A.-C. (19. listopadu 2013). „Síť proteinových interakcí savčí dráhy hrocha odhaluje mechanismy interakcí kináza-fosfatáza“. Vědecká signalizace. 6 (302): rs15. doi:10.1126 / scisignal.2004712. PMID 24255178. S2CID 206672249.
- ^ A b „Q9Y2J4 - AMOL2_HUMAN“. UniProt. Citováno 30. dubna 2015.
- ^ Stelzl, Ulrich; Červ, Uwe; Lalowski, Maciej; Haenig, Christian; Brembeck, Felix H .; Goehler, Heike; Stroedicke, Martin; Zenkner, Martina; Schoenherr, Anke; Koeppen, Susanne; Timm, Jan; Mintzlaff, Sascha; Abraham, Claudia; Bock, Nicole; Kietzmann, Silvia; Goedde, Astrid; Toksöz, Engin; Droege, Anja; Krobitsch, Sylvia; Korn, Bernhard; Birchmeier, Walter; Lehrach, Hans; Wanker, Erich E. (září 2005). „Síť interakce mezi lidskými proteiny a proteiny: zdroj pro anotování proteinu“. Buňka. 122 (6): 957–968. doi:10.1016 / j.cell.2005.08.029. hdl:11858 / 00-001M-0000-0010-8592-0. PMID 16169070. S2CID 8235923.
- ^ „Q7RU07 - Q7RU07_HUMAN“. UniProt. Citováno 8. května 2015.
- ^ "Transmembránový protein TMEM50A 50A [Homo sapiens (člověk)]" ". NCBI Gene. Citováno 9. května 2015.
- ^ A b Woodfield, George W .; Chen, Yizhen; Bair, Thomas B .; Domann, Frederick E .; Weigel, Ronald J. (říjen 2010). "Identifikace primárních genových cílů TFAP2C v buňkách karcinomu prsu reagujících na hormony". Geny, chromozomy a rakovina. 49 (10): 948–962. doi:10,1002 / gcc.20807. PMC 2928401. PMID 20629094.
- ^ Ailan, He; Xiangwen, Xiao; Daolong, Ren; Lu, Gan; Xiaofeng, Ding; Xi, Qiao; Xingwang, Hu; Rushi, Liu; Jian, Zhang; Shuanglin, Xiang (2009). "Identifikace cílových genů aktivačního proteinu transkripčního faktoru 2 gama v buňkách rakoviny prsu". Rakovina BMC. 9 (1): 279. doi:10.1186/1471-2407-9-279. PMC 3224728. PMID 19671168.
- ^ Gao, Shun-Li; Wang, Li-Zhong; Liu, Hai-Ying; Liu, Dan-Li; Xie, Li-Ming; Zhang, Zhi-Wei (15. června 2014). „miR-200a inhibuje proliferaci nádorů cílením AP-2γ v buňkách neuroblastomu“. Asian Pacific Journal of Cancer Prevention. 15 (11): 4671–4676. doi:10.7314 / APJCP.2014.15.11.4671. PMID 24969902.
- ^ Begon, D. Y. (25. dubna 2005). „Yin Yang 1 spolupracuje s aktivátorovým proteinem 2 na stimulaci genové exprese ERBB2 v buňkách rakoviny prsu“. Journal of Biological Chemistry. 280 (26): 24428–24434. doi:10,1074 / jbc.M503790200. PMID 15870067.
- ^ Březinová, Jana; Zemanová, Zuzana; Ransdorfová, Šárka; Pavlištová, Lenka; Babická, Libuše; Houšková, Lucie; Melicherčíková, Jela; Šišková, Magda; Čermák, Jaroslav; Michalová, Kyra (únor 2007). „Strukturální aberace chromozomu 7 odhalené kombinací molekulárních cytogenetických technik u myeloidních malignit“. Genetika a cytogenetika rakoviny. 173 (1): 10–16. doi:10.1016 / j.cancergency do 2006.09.003. PMID 17284364.
externí odkazy
- Člověk C7orf43 umístění genomu a C7orf43 stránka s podrobnostmi o genu v UCSC Genome Browser.
Další čtení
- Hartley JL, Temple GF, Brasch MA (2001). „Klonování DNA pomocí in vitro místně specifické rekombinace“. Genome Res. 10 (11): 1788–95. doi:10,1101 / gr. 143000. PMC 310948. PMID 11076863.
- Wiemann S, Weil B, Wellenreuther R a kol. (2001). „Směrem ke katalogu lidských genů a proteinů: sekvenování a analýza 500 nových kompletních proteinů kódujících lidské cDNA“. Genome Res. 11 (3): 422–35. doi:10,1101 / gr. GR1547R. PMC 311072. PMID 11230166.
- Simpson JC, Wellenreuther R, Poustka A a kol. (2001). „Systematická subcelulární lokalizace nových proteinů identifikovaných sekvenováním cDNA ve velkém měřítku“. EMBO Rep. 1 (3): 287–92. doi:10.1093 / embo-reports / kvd058. PMC 1083732. PMID 11256614.
- Scherer SW, Cheung J, MacDonald JR a kol. (2003). „Lidský chromozom 7: sekvence DNA a biologie“. Věda. 300 (5620): 767–72. doi:10.1126 / science.1083423. PMC 2882961. PMID 12690205.
- Ota T, Suzuki Y, Nishikawa T a kol. (2004). „Kompletní sekvenování a charakterizace 21 243 lidských cDNA plné délky“. Nat. Genet. 36 (1): 40–5. doi:10.1038 / ng1285. PMID 14702039.
- Gerhard DS, Wagner L, Feingold EA a kol. (2004). „Stav, kvalita a rozšíření projektu cDNA NIH v plné délce: Mammalian Gene Collection (MGC)“. Genome Res. 14 (10B): 2121–7. doi:10,1101 / gr. 2596504. PMC 528928. PMID 15489334.
- Wiemann S, Arlt D, Huber W a kol. (2004). „Od ORFeome k biologii: funkční plynovod genomiky“. Genome Res. 14 (10B): 2136–44. doi:10,1101 / gr. 2576704. PMC 528930. PMID 15489336.
- Mehrle A, Rosenfelder H, Schupp I a kol. (2006). „Databáze LIFEdb v roce 2006“. Nucleic Acids Res. 34 (Problém s databází): D415–8. doi:10.1093 / nar / gkj139. PMC 1347501. PMID 16381901.