Metoda Chou – Fasman - Chou–Fasman method

The Metoda Chou – Fasman je empirická technika pro předpověď z terciární struktury v bílkoviny, původně vyvinutý v 70. letech Peterem Y. Chou a Geraldem D. Fasmanem.[1][2][3] Metoda je založena na analýze relativních frekvencí každého z nich aminokyselina v alfa helixy, beta listy, a zatáčky na základě známých proteinové struktury vyřešen s Rentgenová krystalografie. Z těchto frekvencí byla odvozena sada parametrů pravděpodobnosti pro vzhled každé aminokyseliny v každém typu sekundární struktury a tyto parametry jsou použity k předpovědi pravděpodobnost že daná sekvence aminokyselin by vytvořila spirálu, řetězec beta nebo obrat v proteinu. Metoda je maximálně asi 50–60% přesná při identifikaci správných sekundárních struktur,[4] což je výrazně méně přesné než moderní strojové učení –Technické techniky.[5]

Sklony k aminokyselinám

Původní parametry Chou – Fasmana nalezly mezi jednotlivými aminokyselinami silné tendence upřednostňovat jeden typ sekundární struktury před ostatními. Alanin, glutamát, leucin, a methionin byly identifikovány jako formovače šroubovice, zatímco prolin a glycin, kvůli jejich jedinečným konformačním vlastnostem peptidové vazby, běžně končí šroubovice. Originální parametry Chou – Fasman[6] byly odvozeny z velmi malého a nereprezentativního vzorku proteinových struktur kvůli malému počtu takových struktur, které byly známy v době jejich původní práce. Od té doby se ukázalo, že tyto původní parametry jsou nespolehlivé[7] a byly aktualizovány z aktuální datové sady spolu s úpravami počátečního algoritmu.[8]

Chou – Fasmanova metoda bere v úvahu pouze pravděpodobnost, že se každá jednotlivá aminokyselina objeví ve šroubovici, řetězci nebo zatáčce. Na rozdíl od složitějších Metoda GOR, neodráží podmíněné pravděpodobnosti, že aminokyselina vytvoří určitou sekundární strukturu, protože její sousedé již tuto strukturu vlastní. Tento nedostatek kooperativity zvyšuje jeho výpočetní účinnost, ale snižuje jeho přesnost, protože sklony jednotlivých aminokyselin často nejsou dostatečně silné, aby poskytly definitivní předpověď.[5]

Algoritmus

Metoda Chou – Fasmana předpovídá spirály a vlákna podobným způsobem, nejprve lineárně prohledá sekvenci „nukleační“ oblasti s vysokou pravděpodobností šroubovice nebo vlákna a poté oblast rozšiřuje, dokud následující okno se čtyřmi zbytky nenese pravděpodobnost menší než 1. Jak bylo původně popsáno, čtyři ze šesti sousedících aminokyselin byly dostatečné k nukleaci helixu a tři ze všech pěti sousedících byly dostatečné pro list. Prahové hodnoty pravděpodobnosti pro nukleace šroubovice a řetězce jsou konstantní, ale ne nutně stejné; původně byla jako mezní hodnota šroubovice nastavena hodnota 1,03 a pro mezní hodnotu vlákna 1,00.

Obraty se také vyhodnocují ve čtyřzbytkových oknech, ale počítají se pomocí vícestupňového postupu, protože mnoho oblastí obratů obsahuje aminokyseliny, které by se také mohly objevit v oblastech šroubovice nebo listu. Otočení čtyř zbytků mají také své vlastní charakteristické aminokyseliny; prolin a glycin jsou střídavé. Otočení se předpovídá, pouze pokud je pravděpodobnost otočení větší než pravděpodobnost šroubovice nebo listu a hodnota pravděpodobnosti na základě pozic konkrétních aminokyselin v pořadí překračuje předem stanovenou prahovou hodnotu. Pravděpodobnost obratu p (t) se stanoví jako:

kde j je poloha aminokyseliny v okně se čtyřmi zbytky. Pokud p (t) překročí libovolnou mezní hodnotu (původně 7,5e – 3), průměr z hodnot p (j) překročí 1 a p (t) překročí pravděpodobnosti alfa šroubovice a beta listu pro toto okno, pak a obrat je předpovídán. Pokud jsou splněny první dvě podmínky, ale pravděpodobnost beta listu p (b) přesáhne p (t), pak se místo toho předpovídá list.

Viz také

Reference

  1. ^ Chou PY, Fasman GD (1974). "Predikce konformace proteinu". Biochemie. 13 (2): 222–245. doi:10.1021 / bi00699a002. PMID  4358940.
  2. ^ Chou PY, Fasman GD (1978). "Empirické předpovědi konformace proteinu". Annu Rev Biochem. 47: 251–276. doi:10.1146 / annurev.bi.47.070178.001343. PMID  354496.
  3. ^ Chou PY, Fasman GD (1978). "Predikce sekundární struktury proteinů z jejich aminokyselinové sekvence". Pokroky v enzymologii a souvisejících oblastech molekulární biologie. Adv Enzymol Relat Areas Mol Biol. Pokroky v enzymologii a souvisejících oblastech molekulární biologie. 47. str.45–148. doi:10.1002 / 9780470122921.ch2. ISBN  9780470122921. PMID  364941.
  4. ^ Kabsch W, Sander C (1983). "Jak dobré jsou předpovědi sekundární struktury bílkovin?". FEBS Lett. 155 (2): 179–82. doi:10.1016/0014-5793(82)80597-8. PMID  6852232. S2CID  41477827.
  5. ^ A b Mount DM (2004). Bioinformatika: sekvence a analýza genomu (2. vyd.). Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press. ISBN  978-0-87969-712-9.
  6. ^ Chou PY, Fasman GD (1974). "Konformační parametry pro aminokyseliny ve šroubovicových, beta-listových a náhodných cívkových oblastech vypočítané z proteinů". Biochemie. 13 (2): 211–222. doi:10.1021 / bi00699a001. PMID  4358939.
  7. ^ Kyngas J, Valjakka J (1998). „Nespolehlivost parametrů Chou – Fasmana při predikci sekundární struktury proteinu“. Protein Eng. 11 (5): 345–348. doi:10.1093 / protein / 11.5.345. PMID  9681866.
  8. ^ Chen H, Gu F, Huang Z (2006). „Vylepšená metoda Chou – Fasman pro predikci sekundární struktury proteinů“. BMC bioinformatika. 7 (Suppl 4): S14. doi:10.1186 / 1471-2105-7-S4-S14. PMC  1780123. PMID  17217506.

externí odkazy