Sekvenční prostor (evoluce) - Sequence space (evolution)


v evoluční biologie, sekvenční prostor je způsob reprezentace všech možných sekvencí (pro a protein, gen nebo genom ).[1][2] Sekvenční prostor má jednu dimenzi na aminokyselina nebo nukleotid v pořadí vedoucí k vysoce dimenzionální prostory.[3][4]
Většina sekvencí v sekvenčním prostoru nemá žádnou funkci a ponechává relativně malé oblasti, které jsou osídleny přirozeně se vyskytujícími geny.[5] Každá proteinová sekvence sousedí se všemi ostatními sekvencemi, kterých lze dosáhnout pomocí jediné mutace. Odhaduje se, že celý prostor funkční sekvence proteinů byl prozkoumán životem na Zemi.[6] Evoluci lze vizualizovat jako proces vzorkování blízkých sekvencí v sekvenčním prostoru a přesunutí do kteréhokoli s vylepšeným zdatnost přes aktuální.
Zastoupení
Sekvenční prostor je obvykle rozložen jako mřížka. Pro protein sekvenční prostory, každý zbytek v proteinu je reprezentován a dimenze s 20 možnými pozicemi podél této osy odpovídající možným aminokyselinám.[3][4] Existuje tedy 400 možných dipeptidy uspořádány v prostoru 20x20, ale to se rozšíří na 10130 protože i malý protein o 100 aminokyselinách se uspořádá v prostoru se 100 rozměry. Ačkoli takovou ohromující multidimenzionálnost nelze vizualizovat ani schematicky znázornit, poskytuje užitečný abstraktní model k přemýšlení o rozsahu proteinů a vývoj z jedné sekvence do druhé.
Tyto vysoce vícerozměrné prostory lze komprimovat do 2 nebo 3 dimenzí pomocí analýza hlavních komponent. Fitness krajina je jednoduše sekvenční prostor s extra vertikální osou fitness přidanou pro každou sekvenci.[7]
Funkční sekvence v sekvenčním prostoru
Navzdory rozmanitosti proteinových superrodin je sekvenční prostor extrémně řídce osídlen funkčními proteiny. Většina náhodných proteinových sekvencí nemá žádný záhyb ani funkci.[8] Enzymové superrodiny proto existují jako drobné shluky aktivních proteinů v obrovském prázdném prostoru nefunkční sekvence.[9][10]
Hustota funkčních proteinů v sekvenčním prostoru a blízkost různých funkcí k sobě navzájem jsou klíčovým determinantem v porozumění vyvíjitelnost.[11] Stupeň vzájemného prostupu dvou neutrální sítě různých činnosti v pořadí prostor určí, jak snadné je vyvinout se z jedné činnosti do druhé. Čím více se překrývají různé aktivity v sekvenčním prostoru, tím více kryptická variace pro promiskuitní činnost bude.[12]
Prostor sekvence proteinů byl porovnán s Babelská knihovna, teoretická knihovna obsahující všechny možné knihy o délce 410 stran.[13][14] V Babelská knihovna, najít jakoukoli knihu, která dávala smysl, bylo nemožné kvůli naprostému počtu a nedostatku řádu. Totéž by platilo pro proteinové sekvence, kdyby to nebylo pro přirozený výběr, který vybral pouze proteinové sekvence, které dávají smysl. Kromě toho je každá proteinová sekvence obklopena sadou sousedů (bodových mutantů), kteří pravděpodobně mají alespoň nějakou funkci.
Na druhou stranu účinná „abeceda“ prostoru sekvence může být ve skutečnosti docela malá, což snižuje užitečný počet aminokyselin z 20 na mnohem nižší počet. Například v extrémně zjednodušeném zobrazení lze všechny aminokyseliny rozdělit do dvou tříd (hydrofobní / polární) podle hydrofobicita a přesto umožnit zobrazení mnoha běžných struktur. Časný život na Zemi může mít pouze čtyři nebo pět typů aminokyselin, se kterými lze pracovat,[15] a výzkumy ukázaly, že funkční proteiny lze vytvořit z proteinů divokého typu podobným postupem redukce abecedy.[16][17] Snížené abecedy jsou také užitečné v bioinformatika, protože poskytují snadný způsob analýzy podobnosti proteinů.[18][19]
Průzkum prostřednictvím řízené evoluce a racionálního designu

Hlavní zaměření v oblasti proteinové inženýrství je na tvorbě DNA knihovny že vzorek oblasti sekvenčního prostoru, často s cílem najít mutanty proteinů se zlepšenými funkcemi ve srovnání s divoký typ. Tyto knihovny jsou vytvořeny buď pomocí sekvence divokého typu jako šablony a použitím jedné nebo více mutageneze techniky pro jeho různé varianty, nebo vytvořením proteinů od nuly pomocí umělá genová syntéza. Tyto knihovny tedy jsou promítané nebo vybrané a ty s vylepšenými fenotypy se používají pro další kolo mutageneze.
Viz také
Reference
- ^ DePristo, Mark A .; Weinreich, Daniel M .; Hartl, Daniel L. (2. srpna 2005). „Missense meandrování v sekvenčním prostoru: biofyzikální pohled na vývoj bílkovin“. Genetika hodnocení přírody. 6 (9): 678–687. doi:10.1038 / nrg1672. PMID 16074985. S2CID 13236893.
- ^ Maynard Smith, John (7. února 1970). "Přirozený výběr a koncepce proteinového prostoru". Příroda. 225 (5232): 563–564. Bibcode:1970 Natur.225..563M. doi:10.1038 / 225563a0. PMID 5411867. S2CID 204994726.
- ^ A b Bornberg-Bauer, E .; Chan, H. S. (14. září 1999). „Modelování evolučních krajin: Mutační stabilita, topologie a superfunnel v sekvenčním prostoru“. Sborník Národní akademie věd. 96 (19): 10689–10694. Bibcode:1999PNAS ... 9610689B. doi:10.1073 / pnas.96.19.10689. PMC 17944. PMID 10485887.
- ^ A b Cordes, MH; Davidson, AR; Sauer, RT (únor 1996). "Sekvenční prostor, skládání a proteinový design". Aktuální názor na strukturní biologii. 6 (1): 3–10. doi:10.1016 / S0959-440X (96) 80088-1. PMID 8696970.
- ^ Hermes, JD; Blacklow, SC; Knowles, JR (leden 1990). „Hledání prostoru sekvence definitivně náhodnou mutagenezí: zlepšení katalytické účinnosti enzymu“. Sborník Národní akademie věd Spojených států amerických. 87 (2): 696–700. Bibcode:1990PNAS ... 87..696H. doi:10.1073 / pnas.87.2.696. PMC 53332. PMID 1967829.
- ^ http://rsif.royalsocietypublishing.org/content/5/25/953
- ^ Romero, PA; Arnold, FH (prosinec 2009). „Zkoumání krajiny proteinových fitness pomocí řízené evoluce“. Nature Reviews Molecular Cell Biology. 10 (12): 866–76. doi:10.1038 / nrm2805. PMC 2997618. PMID 19935669.
- ^ Keefe, AD; Szostak, JW (5. dubna 2001). "Funkční proteiny z knihovny náhodných sekvencí". Příroda. 410 (6829): 715–8. Bibcode:2001 Natur.410..715K. doi:10.1038/35070613. PMC 4476321. PMID 11287961.
- ^ Stemmer, Willem P. C. (červen 1995). Msgstr "Hledání sekvenčního prostoru". Bio / technologie. 13 (6): 549–553. doi:10.1038 / nbt0695-549. S2CID 20117819.
- ^ Bornberg-Bauer, E (listopad 1997). „Jak jsou modelové proteinové struktury distribuovány v sekvenčním prostoru?. Biofyzikální deník. 73 (5): 2393–403. Bibcode:1997BpJ .... 73,2393B. doi:10.1016 / S0006-3495 (97) 78268-7. PMC 1181141. PMID 9370433.
- ^ Bornberg-Bauer, E; Huylmans, AK; Sikosek, T (červen 2010). „Jak vznikají nové bílkoviny?“. Aktuální názor na strukturní biologii. 20 (3): 390–6. doi:10.1016 / j.sbi.2010.02.005. PMID 20347587.
- ^ Wagner, Andreas (14.07.2011). Počátky evolučních inovací: teorie transformačních změn v živých systémech. Oxford [atd.]: Oxford University Press. ISBN 978-0199692590.
- ^ Arnold, FH (2000). „The Library of Maynard-Smith: My Search for Meaning in the protein vesmír“. Pokroky v chemii proteinů. 55: ix – xi. doi:10.1016 / s0065-3233 (01) 55000-7. PMID 11050930.
- ^ Ostermeier, M (březen 2007). „Kromě katalogizace Babylonské knihovny“. Chemie a biologie. 14 (3): 237–8. doi:10.1016 / j.chembiol.2007.03.002. PMID 17379136.
- ^ Dryden, DT; Thomson, AR; White, JH (6. srpna 2008). „Kolik prostoru proteinové sekvence prozkoumal život na Zemi?“. Journal of the Royal Society, Interface. 5 (25): 953–6. doi:10.1098 / rsif.2008.0085. PMC 2459213. PMID 18426772.
- ^ Akanuma, S .; Kigawa, T .; Yokoyama, S. (2. října 2002). „Kombinatorická mutageneze k omezení použití aminokyselin v enzymu na sníženou množinu“. Sborník Národní akademie věd. 99 (21): 13549–13553. Bibcode:2002PNAS ... 9913549A. doi:10.1073 / pnas.222243999. PMC 129711. PMID 12361984.
- ^ Fujishima, Kosuke; Wang, Kendrick M .; Palmer, Jesse A .; Abe, Nozomi; Nakahigashi, Kenji; Endy, Drew; Rothschild, Lynn J. (29. ledna 2018). „Rekonstrukce biosyntézy cysteinu pomocí vytvořených enzymů bez cysteinu“. Vědecké zprávy. 8 (1): 1776. Bibcode:2018NatSR ... 8.1776F. doi:10.1038 / s41598-018-19920-r. PMC 5788988. PMID 29379050.
- ^ Bacardit, Jaume; Stout, Michael; Hirst, Jonathan D; Valencia, Alfonso; Smith, Robert E; Krasnogor, Natalio (6. ledna 2009). „Automatizovaná redukce abecedy pro datové sady proteinů“. BMC bioinformatika. 10 (1): 6. doi:10.1186/1471-2105-10-6. PMC 2646702. PMID 19126227.
- ^ Solis, Armando D. (30. července 2019). „Redukovaná abeceda prebiotických aminokyselin optimálně kóduje konformační prostor různých existujících záhybů proteinů“. BMC Evoluční biologie. 19 (1): 158. doi:10.1186 / s12862-019-1464-6. PMC 6668081. PMID 31362700.