Projekt genomu - Genome project

Po vytištění vyplní sekvence lidského genomu přibližně 100 obrovských knih blízkého tisku

Projekty genomu jsou vědecký snahy, jejichž cílem je nakonec určit úplnost genom posloupnost organismus (ať je to zvíře, a rostlina, a houba, a bakterie, an archaean, a protist nebo a virus ) a anotovat kódování proteinů geny a další důležité funkce kódované genomem.[1] Sekvence genomu organismu zahrnuje kolektivní DNA sekvence každého z nich chromozóm v organismu. Pro bakterie obsahující jeden chromozom, genomový projekt bude mít za cíl zmapovat sekvenci tohoto chromozomu. Pro lidský druh, jehož genom zahrnuje 22 párů autosomy a 2 pohlavní chromozomy, kompletní sekvence genomu bude zahrnovat 46 samostatných sekvencí chromozomu.

The Projekt lidského genomu byl mezníkovým genomovým projektem, který již má zásadní dopad na výzkum napříč vědami o živé přírodě, s potenciálem podnítit řadu lékařských a komerčních rozvojů.[2]

Sestavení genomu

Sestavení genomu odkazuje na proces, při kterém se využívá velké množství krátkých DNA sekvence a dát je dohromady, aby vytvořily reprezentaci originálu chromozomy ze kterého pochází DNA. V sekvenování brokovnice projekt, veškerá DNA ze zdroje (obvykle jediného organismus, cokoli od a bakterie do a savec ) se nejprve rozbije na miliony malých kousků. Tyto kousky jsou pak „čteny“ automatizovanými sekvenčními stroji, které dokáží přečíst až 1000 nukleotidy nebo základny najednou. (Čtyři základny jsou adenin, guanin, cytosin, a tymin, představovaný jako AGCT.) Sestavení genomu algoritmus funguje tak, že vezme všechny části a srovná je k sobě a detekuje všechna místa, kde jsou dvě z krátkých sekvencí, nebo čte, překrytí. Tato překrývající se čtení lze sloučit a proces pokračuje.

Sestavení genomu je velmi obtížné výpočetní obtížnější, protože mnoho genomů obsahuje velké množství identických sekvencí, známých jako opakování. Tyto opakování mohou být dlouhé tisíce nukleotidů a některé se vyskytují na tisících různých míst, zejména ve velkých genomech rostliny a zvířata.

Výsledná (koncept) genomová sekvence je produkována kombinací sekvenovaných informací kontigy a poté pomocí informací o propojení vytvořit lešení. Lešení jsou umístěna podél fyzická mapa chromozomů vytváří „zlatou cestu“.

Montážní software

Původně většina rozsáhlých center pro sekvenování DNA vyvinula vlastní software pro sestavování sekvencí, které produkovaly. To se však změnilo, jak se software stal složitějším a jak se zvýšil počet sekvenčních center. Příklad takového assembler Balíček analýzy krátkých oligonukleotidů vyvinutý uživatelem BGI pro sestavení genomů lidské velikosti de novo, vyrovnání, SNP detekce, resekvenování, indel nález a analýza strukturních variací.[3][4][5]

Anotace genomu

Od 80. let molekulární biologie a bioinformatika vytvořili potřebu Anotace DNA. Anotace DNA nebo anomace genomu je proces identifikace připojení biologické informace sekvence , a zejména při identifikaci umístění genů a určování toho, co tyto geny dělají.

Čas dokončení

Když sekvenování genom, obvykle existují oblasti, které se obtížně sekvenují (často oblasti s vysokou opakující se DNA ). Tudíž „dokončené“ sekvence genomu jsou zřídka kdy úplné a termíny jako „pracovní koncept“ nebo „v podstatě kompletní“ byly použity k přesnějšímu popisu stavu takových genomových projektů. I když každý základní pár sekvence genomu byla stanovena, stále je pravděpodobné, že budou přítomny chyby, protože sekvenování DNA není zcela přesný proces. Lze také tvrdit, že kompletní genomový projekt by měl zahrnovat sekvence mitochondrie a (pro rostliny) chloroplasty jako tyto organely mít své vlastní genomy.

Často se uvádí, že cílem sekvenování genomu je získat informace o kompletní sadě geny v konkrétní genomové sekvenci. Podíl genomu, který kóduje geny, může být velmi malý (zejména v eukaryoty jako lidé, kde kódující DNA může představovat pouze několik procent z celé sekvence). Není však vždy možné (nebo žádoucí) pouze posloupnost kódující oblasti odděleně. Jak vědci chápou více o roli tohoto nekódující DNA (často označované jako zbytečná DNA ), bude stále důležitější mít kompletní genomovou sekvenci jako pozadí pro pochopení genetiky a biologie daného organismu.

V mnoha ohledech se genomové projekty neomezují pouze na určení sekvence DNA organismu. Tyto projekty mohou také zahrnovat genová predikce zjistit, kde jsou geny v genomu a co tyto geny dělají. Mohou také existovat související projekty se sekvencí EST nebo mRNA pomoci zjistit, kde ve skutečnosti geny jsou.

Historické a technologické perspektivy

Historicky, při sekvenování eukaryotických genomů (jako je červ Caenorhabditis elegans ) to bylo společné pro první mapa genom, aby poskytl řadu orientačních bodů napříč genomem. Spíše než sekvenci chromozomu najednou by se sekvenoval kousek po kousku (s předchozí znalostí přibližně místa, kde se tento kousek nachází na větším chromozomu). Změny v technologii a zejména vylepšení výpočetní síly počítačů znamenají, že nyní mohou být genomy „brokovnice sekvenována „najednou (tento přístup má určité výhrady ve srovnání s tradičním přístupem).

Vylepšení v Sekvenování DNA Tato technologie znamená, že náklady na sekvenování nové genomové sekvence neustále klesají (pokud jde o cenu za základní pár ) a novější technologie také znamenala, že genomy lze sekvenovat mnohem rychleji.

Když výzkumné agentury rozhodnou, jaké nové genomy se mají sekvenovat, důraz se klade na druhy, které mají buď velký význam modelový organismus nebo mají význam pro lidské zdraví (např. patogenní bakterie nebo vektory nemoci, jako je komáři ) nebo druhy, které mají komerční význam (např. hospodářská zvířata a plodiny). Sekundární důraz je kladen na druhy, jejichž genomy pomohou zodpovědět důležité otázky v molekulární evoluci (např obyčejný šimpanz ).

V budoucnu je pravděpodobné, že sekvence genomu bude ještě levnější a rychlejší. To umožní stanovení úplných genomových sekvencí od mnoha různých jedinců stejného druhu. U lidí nám to umožní lépe porozumět aspektům lidská genetická rozmanitost.

Příklady

L1 Dominette 01449, Hereford, který slouží jako předmět Projekt bovinního genomu

Mnoho organismů má projekty genomu, které byly buď dokončeny, nebo budou dokončeny brzy, včetně:

Viz také

Reference

  1. ^ Pevsner, Jonathan (2009). Bioinformatika a funkční genomika (2. vyd.). Hoboken, NJ: Wiley-Blackwell. ISBN  9780470085851.
  2. ^ „Potenciální výhody výzkumu projektu lidského genomu“. Ministerstvo energetiky Informace o projektu lidského genomu. 2009-10-09. Archivovány od originál dne 08.07.2013. Citováno 2010-06-18.
  3. ^ Li R, Zhu H, Ruan J, Qian W, Fang X, Shi Z, Li Y, Li S, Shan G, Kristiansen K, Li S, Yang H, Wang J, Wang J (únor 2010). „Sestavování lidských genomů de novo s masivně paralelním sekvenováním krátkého čtení“. Výzkum genomu. 20 (2): 265–272. doi:10.1101 / gr.097261.109. ISSN  1549-5469. PMC  2813482. PMID  20019144.
  4. ^ A b Rasmussen M, Li Y, Lindgreen S, Pedersen JS, Albrechtsen A, Moltke I, Metspalu M, Metspalu E, Kivisild T, Gupta R, Bertalan M, Nielsen K, Gilbert MT, Wang Y, Raghavan M, Campos PF, Kamp HM , Wilson AS, Gledhill A, Tridico S, Bunce M, Lorenzen ED, Binladen J, Guo X, Zhao J, Zhang X, Zhang H, Li Z, Chen M, Orlando L, Kristiansen K, Bak M, Tommerup N, Bendixen C, Pierre TL, Grønnow B, Meldgaard M, Andreasen C, Fedorova SA, Osipova LP, Higham TF, Ramsey CB, Hansen TV, Nielsen FC, Crawford MH, Brunak S, Sicheritz-Pontén T, Villems R, Nielsen R, Krogh A, Wang J, Willerslev E (2010-02-11). "Sekvence starověkého lidského genomu vyhynulého Palaeo-Eskimo". Příroda. 463 (7282): 757–762. doi:10.1038 / nature08835. ISSN  1476-4687. PMC  3951495. PMID  20148029.
  5. ^ Wang J, Wang W, Li R, Li Y, Tian G, Goodman L, Fan W, Zhang J, Li J, Zhang J, Guo Y, Feng B, Li H, Lu Y, Fang X, Liang H, Du Z , Li D, Zhao Y, Hu Y, Yang Z, Zheng H, Hellmann I, Inouye M, Pool J, Yi X, Zhao J, Duan J, Zhou Y, Qin J, Ma L, Li G, Yang Z, Zhang G, Yang B, Yu C, Liang F, Li W, Li S, Li D, Ni P, Ruan J, Li Q, Zhu H, Liu D, Lu Z, Li N, Guo G, Zhang J, Ye J, Fang L, Hao Q, Chen Q, Liang Y, Su Y, San A, Ping C, Yang S, Chen F, Li L, Zhou K, Zheng H, Ren Y, Yang L, Gao Y, Yang G, Li Z , Feng X, Kristiansen K, Wong GK, Nielsen R, Durbin R, Bolund L, Zhang X, Li S, Yang H, Wang J (2008-11-06). „Sekvence diploidního genomu asijského jedince“. Příroda. 456 (7218): 60–65. doi:10.1038 / nature07484. ISSN  0028-0836. PMC  2716080. PMID  18987735.
  6. ^ Ghosh, Pallab. „Sekvence genomu mamuta dokončena“. BBC novinky.
  7. ^ Yates, Diana (2009-04-23). "Co dělá z krávy krávu? Sekvence genomu osvětluje vývoj přežvýkavců" (Tisková zpráva). EurekAlert!. Citováno 2012-12-22.
  8. ^ Elsik, C. G .; Elsik, R.L .; Tellam, K. C .; Worley, R. A .; Gibbs, D. M .; Muzny, G. M .; Weinstock, D. L .; Adelson, E. E.; Eichler, L .; Elnitski, R .; Guigó, D. L .; Hamernik, S. M .; Kappes, H. A .; Lewin, D. J .; Lynn, F. W .; Nicholas, A .; Reymond, M .; Rijnkels, L. C .; Skow, E. M .; Zdobnov, L .; Schook, J .; Womack, T .; Alioto, S.E .; Antonarakis, A .; Astashyn, C. E .; Chapple, H.C .; Chen, J .; Chrast, F .; Câmara, O .; et al. (2009). „Sekvence genomu skotu taurinu: okno do biologie a evoluce přežvýkavců“. Věda. 324 (5926): 522–528. doi:10.1126 / science.1169588. PMC  2943200. PMID  19390049.
  9. ^ „Release 2007: Horse Genome Assembled“. Národní institut pro výzkum lidského genomu (NHGRI). Citováno 19. dubna 2018.

externí odkazy