Statistická vazebná analýza - Statistical coupling analysis
Statistická vazebná analýza nebo SCA je technika používaná v bioinformatika měřit kovariace mezi páry aminokyseliny v proteinu vícenásobné zarovnání sekvence (MSA). Přesněji řečeno, kvantifikuje, kolik distribuce aminokyselin v určité poloze i změny po narušení distribuce aminokyselin v jiné poloze j. Výsledný statistická vazebná energie označuje stupeň evoluční závislosti mezi zbytky, přičemž vyšší vazebná energie odpovídá zvýšené závislosti.[1]
Definice statistické vazebné energie
Statistická vazebná energie měří, jak narušení distribuce aminokyselin v jednom místě v MSA ovlivňuje distribuci aminokyselin v jiném místě. Zvažte například zarovnání více sekvencí s weby (nebo sloupci) A přes z, kde každé místo má určitou distribuci aminokyselin. Na pozici i, 60% sekvencí má a valin a zbývajících 40% sekvencí má a leucin, v poloze j distribuce je 40% isoleucin, 40% histidin a 20% methionin, k má průměrnou distribuci (20 aminokyselin je přítomno na zhruba stejných frekvencích jako všechny proteiny) a l má 80% histidinu, 20% valinu. Od pozic i, j a l mají distribuci aminokyselin odlišnou od průměrné distribuce pozorované u všech proteinů, říká se, že mají určitý stupeň zachování.
Ve statistické vazebné analýze je zachování (ΔGstat) na každém místě (i) je definován jako: .[2]
Tady, PiX popisuje pravděpodobnost nalezení aminokyseliny X v poloze i, a je definována funkcí v binomická forma jak následuje:
kde N je 100, nX je procento sekvencí se zbytkem X (např. methionin) v poloze ia strX odpovídá přibližné distribuci aminokyseliny X ve všech pozicích mezi všemi sekvenovanými proteiny. Součet probíhá přes všech 20 aminokyselin. Po ΔGistat je vypočítána konzervace polohy i v subalignmentu produkovaném po narušení distribuce aminokyselin při j (ΔGi | δjstat) je vzat. Statistická vazebná energie, označená ΔΔGjá, jstat, je prostě rozdíl mezi těmito dvěma hodnotami. To je:
Statistická vazebná energie se často systematicky počítá mezi pevnou, narušenou polohou a všemi ostatními polohami v MSA. Pokračováním příkladu MSA ze začátku sekce zvažte odchylku v poloze j kde se distribuce aminoskupin změní ze 40% I, 40% H, 20% M na 100% I.Pokud se v následném podřazení změní distribuce na i od 60% V, 40% L do 90% V, 10% L, ale nemění distribuci v poloze l, pak by existovalo určité množství statistické vazebné energie mezi i a j ale žádný mezi l a j.
Aplikace
Ranganathan a Lockless původně vyvinuli SCA, aby zkoumali termodynamickou (energetickou) vazbu párů zbytků v proteinech.[3] Za použití Doména PDZ rodiny, byli schopni identifikovat malou síť zbytků, které byly energeticky spojeny se zbytkem vazebného místa. Síť se skládala z obou zbytků prostorově blízkých vazebnému místu v terciárním záhybu, nazývaných kontaktní páry, a vzdálenějších zbytků, které se účastní energetických interakcí na delší vzdálenosti. Pozdější aplikace SCA ze strany Ranganathan skupina na GPCR, serinová proteáza a hemoglobin rodiny také vykazovaly energetické spojení v řídkých sítích zbytků, které spolupracují alosterická komunikace.[4]
Statistická vazebná analýza byla také použita jako základ pro výpočetní proteinový design. V roce 2005 Socolich et al.[5] použil SCA pro WW doména vytvářet umělé proteiny s podobnými termodynamická stabilita a struktura k přirozeným WW doménám. Skutečnost, že 12 ze 43 navržených proteinů se stejným profilem SCA jako přirozené WW domény správně složené, poskytla silný důkaz, že pro specifikaci složení proteinu je zapotřebí jen málo informací - pouze informace o vazbě. Tato podpora hypotézy SCA byla přesvědčivější vzhledem k tomu, že a) úspěšně složené proteiny měly průměr pouze 36% sekvenční identita do přirozených záhybů WW ab) žádný z umělých proteinů navržených bez informací o vazbě nebyl správně složen. Doprovodná studie ukázala, že umělé WW domény byly funkčně podobné přirozeným WW doménám v afinita a specificita vazby na ligand.[6]
v de novo predikce proteinové struktury, bylo prokázáno, že v kombinaci s jednoduchou metrickou vzdáleností mezi zbytkem a zbytkem může skóre založené na SCA poměrně přesně rozlišit záhyby nativních a nepůvodních proteinů.[7]
Viz také
externí odkazy
- Co je to WW doména?
- Ranganathan přednáška o statistické analýze vazby (včetně zvuku)
- Skládání proteinů - o krok blíž? - Shrnutí designu umělých, ale funkčních WW domén založených na SCA v laboratoři Ranganathan.
Reference
- ^ „Doplňkový materiál pro„ Evolučně konzervované sítě reziduí zprostředkovávají alosterickou komunikaci v proteinech.'".
- ^ Dekker; Fodor, A; Aldrich, RW; Yellen, G; et al. (2004). "Metoda založená na poruchách pro výpočet explicitní pravděpodobnosti evoluční společné variance ve více sekvenčních zarovnáních". Bioinformatika. 20 (10): 1565–1572. doi:10.1093 / bioinformatika / bth128. PMID 14962924.
- ^ Lockless SW, Ranaganathan R (1999). „Evolučně konzervované cesty energetické konektivity v proteinových rodinách“. Věda. 286 (5438): 295–299. doi:10.1126 / science.286.5438.295. PMID 10514373.
- ^ Suel; Lockless, SW; Wall, MA; Ranganathan, R; et al. (2003). „Evolučně konzervované sítě reziduí zprostředkovávají alosterickou komunikaci v proteinech“. Přírodní strukturní biologie. 10 (1): 59–69. doi:10.1038 / nsb881. PMID 12483203. S2CID 67749580.
- ^ Socolich; Lockless, SW; Russ, WP; Lee, H; Gardner, KH; Ranganathan, R; et al. (2005). Msgstr "Evoluční informace pro specifikaci složení proteinu". Příroda. 437 (7058): 512–518. doi:10.1038 / nature03991. PMID 16177782. S2CID 4363255.
- ^ Russ; Lowery, DM; Mishra, P; Yaffe, MB; Ranganathan, R; et al. (2005). "Přirozená funkce v umělých WW doménách". Příroda. 437 (7058): 579–583. doi:10.1038 / nature03990. PMID 16177795. S2CID 4424336.
- ^ Bartlett GJ, Taylor WR (2008). „Použití skóre odvozených ze statistické vazebné analýzy k rozlišení správných a nesprávných záhybů v predikci struktury proteinu de-novo“. Proteiny. 71 (1): 950–959. doi:10,1002 / prot.21779. PMID 18004776. Archivovány od originál dne 2012-12-17.