Pravidla Chargaffs - Chargaffs rules - Wikipedia
Chargaffova pravidla uveďte to DNA jakýkoli druh jakéhokoli organismu by měl mít stechiometrický poměr 1: 1 (pravidlo párů bází) o pyrimidin a purin základny a konkrétněji to množství guanin by se měl rovnat cytosin a částka adenin by se měl rovnat tymin. Tento vzorec se nachází v obou řetězcích DNA. Objevil je rakouský chemik Erwin Chargaff,[1][2] na konci 40. let.
Definice
První pravidlo parity
První pravidlo tvrdí, že dvouvláknové DNA molekula, globálně má procentuální rovnost párů bází:% A =% T a% G =% C. Základem je důsledné ověření pravidla Watson-Crickovy páry v modelu dvojité šroubovice DNA.
Pravidlo druhé parity
Druhé pravidlo platí, že% A ≈% T i% G ≈% C platí pro každý ze dvou řetězců DNA.[3] Toto popisuje pouze globální rys základního složení v jediném řetězci DNA.[4]
Výzkum
Druhé pravidlo parity bylo objeveno v roce 1968.[3] Uvádí, že v jednořetězcové DNA je počet adeninových jednotek přibližně rovná se tyminu (% A ≈ % T) a počet jednotek cytosinu je přibližně rovná se guaninu (% C ≈ %G).
První empirické zobecnění Chargaffova druhého pravidla parity, nazývaného princip symetrie, navrhl Vinayakumar V. Prabhu [5] v roce 1993. Tento princip uvádí, že pro jakýkoli daný oligonukleotid je jeho frekvence přibližně stejná jako frekvence jeho komplementárního reverzního oligonukleotidu. Teoretické zobecnění[6] byl matematicky odvozen od Michel E. B. Yamagishi a Roberto H. Herai v roce 2011.[7]
V roce 2006 se ukázalo, že toto pravidlo platí pro čtyři[2] z pěti typů dvouvláknových genomů; konkrétně se vztahuje na eukaryotický chromozomy, bakteriální chromozomy, dvouvláknové DNA virové genomy a archaeal chromozomy.[8] To se nevztahuje na organelární genomy (mitochondrie a plastidy ) menší než ~ 20–30 kbp, nevztahuje se ani na jednořetězcové DNA (virové) genomy nebo na jakýkoli typ genomu RNA genom. Základ tohoto pravidla je stále předmětem šetření, i když velikost genomu může hrát určitou roli.
Samotné pravidlo má důsledky. Ve většině bakteriálních genomů (které kódují obvykle 80–90%) jsou geny uspořádány takovým způsobem, že přibližně 50% kódující sekvence leží na kterémkoli řetězci. Wacław Szybalski, v 60. letech, ukázal, že v bakteriofág kódovací sekvence puriny (A a G) překročit pyrimidiny (C a T).[9] Toto pravidlo bylo od té doby potvrzeno u jiných organismů a pravděpodobně by se nyní mělo nazývat „Szybalského pravidlo Ačkoli pravidlo Szybalskiho obecně platí, je známo, že existují výjimky.[10][11][12] Biologický základ pro Szybalskiho vládu, stejně jako Chargaff, zatím není znám.
Kombinovaný účinek Chargaffova druhého pravidla a Szybalského pravidla lze pozorovat v bakteriálních genomech, kde kódující sekvence nejsou rovnoměrně distribuovány. The genetický kód má 64 kodony z toho 3 fungují jako ukončovací kodony: je jich pouze 20 aminokyseliny normálně přítomný v bílkovinách. (Existují dvě neobvyklé aminokyseliny -selenocystein a pyrrolysin —Nalezeno v omezeném počtu proteinů a kódováno stop kodony —TGA, respektive TAG.) Neshoda mezi počtem kodonů a aminokyselinami umožňuje několika kodonům kódovat jednu aminokyselinu - takové kodony se normálně liší pouze v poloze třetí kodonové báze.
Vícerozměrná statistická analýza použití kodonů v genomech s nestejným množstvím kódujících sekvencí na dvou řetězcích ukázala, že použití kodonů ve třetí poloze závisí na řetězci, na kterém je gen umístěn. To se zdá být pravděpodobně výsledkem pravidel Szybalskiho a Chargaffa. Kvůli asymetrii v použití pyrimidinu a purinu v kódujících sekvencích bude mít vlákno s větším obsahem kódování tendenci mít větší počet purinových bází (Szybalskiho pravidlo). Protože počet purinových bází se bude při velmi dobré aproximaci rovnat počtu jejich komplementárních pyrimidinů ve stejném řetězci a protože kódující sekvence zabírají 80-90% řetězce, zdá se, že existuje (1) selektivní tlak na třetí bázi minimalizovat počet purinových bází ve vlákně s větším obsahem kódování; a (2) že tento tlak je úměrný nesouladu v délce kódujících sekvencí mezi dvěma řetězci.
Původ odchylky od Chargaffova pravidla v organelách byl považován za důsledek mechanismu replikace.[13] Během replikace se řetězce DNA oddělují. V jednořetězcové DNA, cytosin spontánně pomalu deaminuje na adenosin (C až A transverze ). Čím déle jsou prameny odděleny, tím větší je množství deaminace. Z důvodů, které dosud nejsou jasné, mají vlákna tendenci existovat déle v jediné formě v mitochondriích než v chromozomální DNA. Tento proces má tendenci poskytovat jedno vlákno, které je obohaceno guanin (G) a tymin (T) se svým doplňkem obohaceným o cytosin (C) a adenosin (A) a tento proces mohl vést k odchylkám zjištěným v mitochondriích.[Citace je zapotřebí ][pochybný ]
Chargaffovo druhé pravidlo se zdá být důsledkem složitějšího pravidla parity: v jednom řetězci DNA je jakýkoli oligonukleotid přítomen ve stejném počtu jako jeho reverzní komplementární nukleotid. Kvůli výpočetním požadavkům to nebylo ověřeno ve všech genomech pro všechny oligonukleotidy. Bylo ověřeno pro tripletové oligonukleotidy pro velkou sadu dat.[14] Albrecht-Buehler navrhl, že toto pravidlo je důsledkem genomů vyvíjejících se procesem inverze a transpozice.[14] Nezdá se, že by tento proces působil na mitochondriální genomy. Zdá se, že Chargaffovo druhé paritní pravidlo je rozšířeno z úrovně nukleotidů na populace kodonových tripletů, v případě celé jednovláknové DNA lidského genomu.[15] Jakési „pravidlo parity druhého Chargaffova parity na úrovni kodonu“ je navrženo následovně:
První kodon | Druhý kodon | Navrhovaný vztah | Detaily |
---|---|---|---|
Twx (1. základní pozice je T) | yzA (3. základní pozice je A) | % Twx % yzA | Twx a yzA jsou zrcadlové kodony, např. TCG a CGA |
Cwx (1. základní pozice je C) | yzG (3. základní pozice je G) | % Cwx % yzG | Cwx a yzG jsou zrcadlové kodony, např. CTA a ŠTÍTEK |
wTx (2. základní pozice je T) | yAz (2. základní pozice je A) | % wTx % yAz | wTx a yAz jsou zrcadlové kodony, např. CTG a CAG |
wCx (2. základní pozice je C) | yGz (2. základní pozice je G) | % wCx % yGz | wCx a yGz jsou zrcadlové kodony, např. TCT a AGA |
wxT (3. základní pozice je T) | Ayz (1. základní pozice je A) | % wxT % Ayz | wxT a Ayz jsou zrcadlové kodony, např. CTT a AAG |
wxC (3. základní pozice je C) | Gyz (1. základní pozice je G) | % wxC % Gyz | wxC a Gyz jsou zrcadlové kodony, např. GGC a GCC |
Příklady - výpočet celého lidského genomu pomocí prvního čtecího rámce kodonů poskytuje: 36530115 TTT a 36381293 AAA (poměr% = 1,00409). 2087242 TCG a 2085226 CGA (poměr% = 1 00096) atd.
V roce 2020 se ukázalo, že fyzikální vlastnosti dsDNA (dvouvláknová DNA) a tendence k maximální entropii všech fyzických systémů jsou příčinou Chargaffova druhého pravidla parity.[16] Symetrie a vzorce přítomné v sekvencích dsDNA mohou vycházet spíše z fyzikálních zvláštností molekuly dsDNA a z principu maximální entropie než z biologického nebo environmentálního evolučního tlaku.
Procento bází v DNA
Následující tabulka je reprezentativním vzorkem dat Erwina Chargaffa z roku 1952, uvádí základní složení DNA z různých organismů a podporuje obě Chargaffova pravidla.[17] Organismus, jako je φX174, s významnou variací od A / T a G / C rovnou jedné, svědčí o jednořetězcové DNA.
Organismus | Taxon | %A | %G | %C | % T | NA | G / C. | % GC | %NA |
---|---|---|---|---|---|---|---|---|---|
Kukuřice | Zea | 26.8 | 22.8 | 23.2 | 27.2 | 0.99 | 0.98 | 46.1 | 54.0 |
Chobotnice | Chobotnice | 33.2 | 17.6 | 17.6 | 31.6 | 1.05 | 1.00 | 35.2 | 64.8 |
Kuře | Gallus | 28.0 | 22.0 | 21.6 | 28.4 | 0.99 | 1.02 | 43.7 | 56.4 |
Krysa | Ratus | 28.6 | 21.4 | 20.5 | 28.4 | 1.01 | 1.00 | 42.9 | 57.0 |
Člověk | Homo | 29.3 | 20.7 | 20.0 | 30.0 | 0.98 | 1.04 | 40.7 | 59.3 |
Saranče | Orthoptera | 29.3 | 20.5 | 20.7 | 29.3 | 1.00 | 0.99 | 41.2 | 58.6 |
Mořský ježek | Echinoidea | 32.8 | 17.7 | 17.3 | 32.1 | 1.02 | 1.02 | 35.0 | 64.9 |
Pšenice | Triticum | 27.3 | 22.7 | 22.8 | 27.1 | 1.01 | 1.00 | 45.5 | 54.4 |
Droždí | Saccharomyces | 31.3 | 18.7 | 17.1 | 32.9 | 0.95 | 1.09 | 35.8 | 64.4 |
E-coli | Escherichia | 24.7 | 26.0 | 25.7 | 23.6 | 1.05 | 1.01 | 51.7 | 48.3 |
φX174 | PhiX174 | 24.0 | 23.3 | 21.5 | 31.2 | 0.77 | 1.08 | 44.8 | 55.2 |
Viz také
Reference
- ^ Elson D, Chargaff E (1952). „K obsahu deoxyribonukleové kyseliny v gametách mořského ježka“. Experientia. 8 (4): 143–145. doi:10.1007 / BF02170221. PMID 14945441. S2CID 36803326.
- ^ A b Chargaff E, Lipshitz R, Green C (1952). "Složení deoxypentózových nukleových kyselin čtyř rodů mořského ježka". J Biol Chem. 195 (1): 155–160. PMID 14938364. S2CID 11358561.
- ^ A b Rudner, R; Karkas, JD; Chargaff, E (1968). "Oddělení B. Subtilis DNA do komplementárních řetězců. 3. Přímá analýza ". Sborník Národní akademie věd Spojených států amerických. 60 (3): 921–2. Bibcode:1968PNAS ... 60..921R. doi:10.1073 / pnas.60.3.921. PMC 225140. PMID 4970114.
- ^ Zhang CT, Zhang R, Ou HY (2003). „Databáze křivky Z: grafické znázornění sekvencí genomu“. Bioinformatika. 19 (5): 593–599. doi:10.1093 / bioinformatika / btg041. PMID 12651717.
- ^ Prabhu VV (1993). "Pozorování symetrie v dlouhých nukleotidových sekvencích". Výzkum nukleových kyselin. 21 (12): 2797–2800. doi:10.1093 / nar / 21.12.2797. PMID 8332488.
- ^ Yamagishi MEB (2017). Matematická gramatika biologie. SpringerBriefs v matematice. Springer. arXiv:1112.1528. doi:10.1007/978-3-319-62689-5. ISBN 978-3-319-62688-8. S2CID 16742066.
- ^ Yamagishi MEB, Herai RH (2011). Chargaffova „Gramatika biologie“: Nová pravidla podobná fraktálu. SpringerBriefs v matematice. arXiv:1112.1528. doi:10.1007/978-3-319-62689-5. ISBN 978-3-319-62688-8. S2CID 16742066.CS1 maint: používá parametr autoři (odkaz)
- ^ Mitchell D, Bridge R (2006). "Zkouška druhého pravidla Chargaffa". Biochem Biophys Res Commun. 340 (1): 90–94. doi:10.1016 / j.bbrc.2005.11.160. PMID 16364245.
- ^ Szybalski W, Kubinski H, Sheldrick O (1966). "Pyrimidinové klastry na transkripčním řetězci DNA a jejich možná role při zahájení syntézy RNA". Cold Spring Harb Symp Quant Biol. 31: 123–127. doi:10.1101 / SQB.1966.031.01.019. PMID 4966069.
- ^ Cristillo AD (1998). Charakterizace G0 / G1 přepínacích genů v kultivovaných T lymfocytech. Disertační práce. Kingston, Ontario, Kanada: Queen's University.
- ^ Bell SJ, Forsdyke DR (1999). "Odchylky od druhého pravidla parity Chargaffa korelují se směrem transkripce". J Theor Biol. 197 (1): 63–76. doi:10.1006 / jtbi.1998.0858. PMID 10036208.
- ^ Lao PJ, Forsdyke DR (2000). „Termofilní bakterie přísně dodržují pravidlo směru transkripce Szybalského a zdvořile purinují RNA s adeninem i guaninem“. Výzkum genomu. 10 (2): 228–236. doi:10.1101 / gr.10.2.228. PMC 310832. PMID 10673280.
- ^ Nikolaou C, Almirantis Y (2006). „Odchylky od Chargaffova druhého pravidla parity v organelární DNA. Pohledy na vývoj organelárních genomů“. Gen. 381: 34–41. doi:10.1016 / j.gene.2006.06.010. PMID 16893615.
- ^ A b Albrecht-Buehler G (2006). „Asymptoticky zvyšující shodu genomů s Chargaffovými pravidly druhé parity prostřednictvím inverzí a obrácených transpozic“. Proc Natl Acad Sci USA. 103 (47): 17828–17833. Bibcode:2006PNAS..10317828A. doi:10.1073 / pnas.0605553103. PMC 1635160. PMID 17093051.
- ^ Perez, J.-C. (Září 2010). „Populace kodonů v DNA jednořetězcového celého lidského genomu jsou fraktální a jemně vyladěné pomocí Zlatého poměru 1,618“. Interdisciplinární vědy: Výpočetní biologie. 2 (3): 228–240. doi:10.1007 / s12539-010-0022-0. PMID 20658335. S2CID 54565279.
- ^ Piero Farisell, Cristian Taccioli, Luca Pagani a Amos Maritan (duben 2020). „Symetrie sekvencí DNA z náhodnosti: původ Chargaffova druhého paritního pravidla“. Briefings in Bioinformatics (bbaa04): 1–10. doi:10.1093 / bib / bbaa041. PMID 32266404.CS1 maint: více jmen: seznam autorů (odkaz)
- ^ Bansal M (2003). „Struktura DNA: Revize dvojité šroubovice Watson-Crick“ (PDF). Současná věda. 85 (11): 1556–1563. Archivovány od originál (PDF) dne 26. 7. 2014. Citováno 2013-07-26.
Další čtení
- Szybalski W, Kubinski H, Sheldrick P (1966). "Pyrimidinové klastry na transkripčních řetězcích DNA a jejich možná role při zahájení syntézy RNA". Cold Spring Harbor Symposia o kvantitativní biologii. 31: 123–127. doi:10.1101 / SQB.1966.031.01.019. PMID 4966069.
- Lobry JR (1996). „Asymetrické substituční vzorce ve dvou řetězcích DNA bakterií“. Mol. Biol. Evol. 13 (5): 660–665. doi:10.1093 / oxfordjournals.molbev.a025626. PMID 8676740.
- Lafay B, Lloyd AT, McLean MJ, Devine KM, Sharp PM, Wolfe KH (1999). "Složení proteinu a použití kodonů ve spirochaetech: druhově specifické a DNA specifické řetězce mutačních předsudků". Nucleic Acids Res. 27 (7): 1642–1649. doi:10.1093 / nar / 27.7.1642. PMC 148367. PMID 10075995.
- McLean MJ, Wolfe KH, Devine KM (1998). "Základní složení zkosení, orientace replikace a orientace genu ve 12 prokaryotických genomech". J Mol Evol. 47 (6): 691–696. Bibcode:1998JMolE..47..691M. CiteSeerX 10.1.1.28.9035. doi:10.1007 / PL00006428. PMID 9847411. S2CID 12917481.
- McInerney JO (1998). „Replikační a transkripční selekce na použití kodonů v Borrelia burgdorferi“. Proc Natl Acad Sci USA. 95 (18): 10698–10703. Bibcode:1998PNAS ... 9510698M. doi:10.1073 / pnas.95.18.10698. PMC 27958. PMID 9724767.
externí odkazy
- Databáze CBS Genome Atlas - obsahuje stovky příkladů základních zkosení a měl problémy.[1]
- Databáze křivek Z genomů - trojrozměrný nástroj pro vizualizaci a analýzu genomů.[2]
- ^ Hallin PF, David Ussery D (2004). „Databáze CBS Genome Atlas: Dynamické úložiště pro bioinformatické výsledky a sekvenční data“. Bioinformatika. 20 (18): 3682–3686. doi:10.1093 / bioinformatika / bth423. PMID 15256401.
- ^ Zhang CT, Zhang R, Ou HY (2003). „Databáze křivky Z: grafické znázornění sekvencí genomu“. Bioinformatika. 19 (5): 593–599. doi:10.1093 / bioinformatika / btg041. PMID 12651717.