Proteinová doména - Protein domain

A proteinová doména je konzervativní část dané proteinové sekvence a terciární struktura to může rozvíjet se, fungují a existují nezávisle na zbytku proteinového řetězce. Každá doména tvoří kompaktní trojrozměrnou strukturu a často může být samostatně stabilní a složený. Mnoho proteinů se skládá z několika strukturálních domén. Jedna doména se může objevit v různých proteinech. Molekulární evoluce používá domény jako stavební kameny a ty lze při vytváření rekombinovat v různých uspořádáních bílkoviny s různými funkcemi. Obecně se délky domén liší od přibližně 50 aminokyseliny až 250 aminokyselin na délku.[1] Nejkratší domény, jako např zinkové prsty, jsou stabilizovány kovovými ionty nebo disulfidové můstky. Domény často tvoří funkční jednotky, jako je vazba vápníku Ruční doména EF z klimodulin. Protože jsou nezávisle stabilní, lze domény „vyměnit“ za genetické inženýrství mezi jedním a druhým proteinem chimérické proteiny.
Pozadí
Koncept doména byl poprvé navržen v roce 1973 Wetlauferem po rentgenových krystalografických studiích slepice lysozym[2] a papain[3]a omezenými proteolytickými studiemi imunoglobuliny.[4][5] Wetlaufer definoval domény jako stabilní jednotky proteinová struktura který by se mohl skládat samostatně. V minulosti byly domény popsány jako jednotky:
Každá definice je platná a bude se často překrývat, tj. Kompaktní strukturní doména, která se nachází mezi různými proteiny, se pravděpodobně v jejím strukturním prostředí bude skládat nezávisle. Příroda často spojuje několik domén a vytváří multidoménové a multifunkční proteiny s obrovským množstvím možností.[9] Ve vícedoménovém proteinu může každá doména plnit svou vlastní funkci nezávisle nebo ve shodě se svými sousedy. Domény mohou sloužit buď jako moduly pro vytváření velkých sestav, jako jsou virové částice nebo svalová vlákna, nebo mohou poskytovat specifická katalytická nebo vazebná místa, která se nacházejí v enzymech nebo regulačních proteinech.
Příklad: Pyruvátkináza
Vhodným příkladem je pyruvátkináza (viz první obrázek), glykolytický enzym, který hraje důležitou roli při regulaci toku z fruktóza-1,6-bifosfátu do pyruvátu. Obsahuje doménu vázající nukleotidy all-β (modře), doménu vázající α / β-substrát (šedě) a α / β-regulační doménu (olivově zelená),[10] spojeno několika polypeptidovými linkery.[11] Každá doména v tomto proteinu se vyskytuje v různých sadách proteinových rodin.[12]
Centrální doména vázající substrát α / β-barel je jednou z nejběžnějších enzym záhyby. Je to vidět v mnoha různých rodinách enzymů katalyzujících zcela nesouvisející reakce.[13] Α / β-hlaveň se běžně nazývá Hlaveň TIM pojmenoval podle triose fosfát izomerázy, která byla první takovou strukturou, která se měla vyřešit.[14] V současné době je v databázi domén CATH rozdělen do 26 homologních rodin.[15] Hlaveň TIM je vytvořena ze sekvence β-α-β motivů uzavřených vodíkovou vazbou prvního a posledního řetězce dohromady, čímž se vytvoří osmvláknová hlaveň. Diskutuje se o evolučním původu této domény. Jedna studie naznačuje, že jediný enzym předků se mohl rozejít do několika rodin,[16] zatímco jiný naznačuje, že stabilní struktura TIM-barel se vyvinula konvergentní evolucí.[17]
TIM-hlaveň v pyruvátkináze je „diskontinuální“, což znamená, že k vytvoření domény je zapotřebí více než jeden segment polypeptidu. Je pravděpodobné, že to bude výsledek inzerce jedné domény do druhé během vývoje proteinu. Ze známých struktur bylo prokázáno, že přibližně čtvrtina strukturních domén je přerušovaných.[18][19] Vložená regulační doména β-barelu je „kontinuální“, tvořená jediným úsekem polypeptidu.
Jednotky proteinové struktury
The primární struktura (řetězec aminokyselin) a protein nakonec zakóduje jeho jedinečně složenou trojrozměrnou (3D) konformaci.[20] Nejdůležitějším faktorem, který řídí skládání proteinu do 3D struktury, je distribuce polárních a nepolárních postranních řetězců.[21] Skládání je poháněno pohřbením hydrofobních postranních řetězců do vnitřku molekuly, aby se zabránilo kontaktu s vodným prostředím. Obecně mají proteiny hydrofobní jádro zbytky obklopen skořápkou hydrofilních zbytků. Jelikož samotné peptidové vazby jsou polární, jsou v hydrofobním prostředí neutralizovány vzájemnou vodíkovou vazbou. Tak vznikají oblasti polypeptidu, které tvoří pravidelné 3D strukturní vzorce zvané sekundární struktura. Existují dva hlavní typy sekundární struktury: α-šroubovice a β-listy.
Bylo zjištěno, že některé jednoduché kombinace prvků sekundární struktury se často vyskytují v proteinová struktura a jsou označovány jako supersekundární struktura nebo motivy. Například motiv β-vlásenky se skládá ze dvou sousedních antiparalelních β-vláken spojených malou smyčkou. Je přítomen ve většině antiparalelních β struktur jak jako izolovaný pás, tak jako součást složitějších β-listů. Další běžnou super-sekundární strukturou je motiv β-α-β, který se často používá k propojení dvou paralelních β-řetězců. Centrální α-šroubovice spojuje C-konce prvního vlákna s N-konci druhého vlákna, balí své postranní řetězce proti β-listu, a proto chrání hydrofobní zbytky β-řetězců z povrchu.
Kovalentní asociace dvou domén představuje funkční a strukturální výhodu, protože dochází ke zvýšení stability ve srovnání se stejnými strukturami, které nejsou kovalentně spojeny.[22] Dalšími výhodami jsou ochrana meziproduktů v mezidoménových enzymatických rozštěpech, které mohou být jinak nestabilní ve vodném prostředí, a pevný stechiometrický poměr enzymatické aktivity nezbytný pro postupnou sadu reakcí.[23]
Strukturální zarovnání je důležitým nástrojem pro určování domén.
Terciární struktura
Několik motivů se spojí a vytvoří kompaktní, místní, polonezávislé jednotky zvané domény.[6]Celková 3D struktura polypeptidového řetězce se označuje jako proteinová terciární struktura. Domény jsou základní jednotky terciární struktury, přičemž každá doména obsahuje individuální hydrofobní jádro postavené ze sekundárních strukturních jednotek spojených smyčkovými oblastmi. Balení polypeptidu je obvykle mnohem těsnější ve vnitřku než vnějšku domény a vytváří pevné jádro a tekutý povrch.[24] Zbytky jádra jsou často konzervovány v proteinové rodině, zatímco zbytky ve smyčkách jsou méně konzervované, pokud nejsou zapojeny do funkce proteinu. Terciární strukturu bílkovin lze rozdělit do čtyř hlavních třídy na základě sekundárního strukturálního obsahu domény.[25]
- All-α domény mají doménové jádro postavené výhradně z α-helixů. Této třídě dominují malé záhyby, z nichž mnohé tvoří jednoduchý balíček se spirálami běžícími nahoru a dolů.
- All-β domény mají jádro složené z antiparalelních β-listů, obvykle dva listy zabalené proti sobě. V uspořádání pramenů lze identifikovat různé vzory, které často vedou k identifikaci opakujících se motivů, například motiv řeckého klíče.[26]
- Domény α + β jsou směsí motivů all-α a all-p. Zařazení proteinů do této třídy je obtížné kvůli překrývání s ostatními třemi třídami, a proto se v KOCOUR databáze domén.[15]
- a / β domény jsou vyrobeny z kombinace β-α-β motivů, které převážně tvoří paralelní β-list obklopený amfipatickými a-šroubovicemi. Sekundární struktury jsou uspořádány ve vrstvách nebo sudech.
Omezení velikosti
Domény mají omezení velikosti.[27] Velikost jednotlivých strukturálních domén se pohybuje od 36 zbytků v E-selektinu po 692 zbytků v lipoxygenáze-1,[18] ale většina, 90%, má méně než 200 zbytků[28] s průměrem přibližně 100 zbytků.[29] Velmi krátké domény, méně než 40 zbytků, jsou často stabilizovány ionty kovů nebo disulfidovými vazbami. Větší domény, více než 300 zbytků, budou pravděpodobně sestávat z více hydrofobních jader.[30]
Kvartérní struktura
Mnoho proteinů má a kvartérní struktura, který se skládá z několika polypeptidových řetězců, které se sdružují do oligomerní molekuly. Každý polypeptidový řetězec v takovém proteinu se nazývá podjednotka. Hemoglobin se například skládá ze dvou α a dvou β podjednotek. Každý ze čtyř řetězců má all-α globinový záhyb s kapsou hemu.
Výměna domén je mechanismus pro vytváření oligomerních sestav.[31] Při výměně domény je sekundární nebo terciární prvek monomerního proteinu nahrazen stejným prvkem jiného proteinu. Výměna domén se může pohybovat od sekundárních strukturních prvků po celé strukturální domény. Představuje také model evoluce pro funkční adaptaci pomocí oligomerizace, např. oligomerní enzymy, které mají své aktivní místo na rozhraní podjednotky.[32]
Domény jako evoluční moduly
Příroda je dráteník a ne vynálezce,[33] nové sekvence jsou adaptovány z již existujících sekvencí, spíše než vynalezeny. Domény jsou běžným materiálem používaným přírodou ke generování nových sekvencí; mohou být považovány za geneticky mobilní jednotky, označované jako „moduly“. C a N konce domén jsou často blízko sebe v prostoru, což jim umožňuje během procesu evoluce snadno být „zasunuty do“ rodičovských struktur. Mnoho doménových rodin se nachází ve všech třech formách života, Archaea, Bakterie a Eukarya.[34] Proteinové moduly jsou podmnožinou proteinových domén, které se nacházejí v celé řadě různých proteinů se zvláště univerzální strukturou. Příklady lze nalézt mezi extracelulárními proteiny spojenými se srážením, fibrinolýzou, komplementem, extracelulární matricí, molekulami adheze na buněčný povrch a receptory cytokinů.[35] Čtyři konkrétní příklady rozšířených proteinových modulů jsou následující domény: SH2, imunoglobulin, fibronektin typu 3 a kringle.[36]
Molekulární evoluce vede k rodinám příbuzných proteinů s podobnou sekvencí a strukturou. Sekvenční podobnosti však mohou být extrémně nízké mezi proteiny, které sdílejí stejnou strukturu. Proteinové struktury mohou být podobné, protože proteiny se lišily od společného předka. Alternativně mohou být některé záhyby výhodnější než jiné, protože představují stabilní uspořádání sekundárních struktur a některé proteiny se mohou v průběhu evoluce sbližovat do těchto záhybů. V současné době je asi 110 000 experimentálně určených 3D proteinových struktur uložených uvnitř Proteinová datová banka (PDB).[37] Tato sada však obsahuje mnoho identických nebo velmi podobných struktur. Všechny proteiny by měly být zařazeny do strukturních rodin, aby bylo možné porozumět jejich evolučním vztahům. Strukturálních srovnání lze nejlépe dosáhnout na úrovni domény. Z tohoto důvodu bylo vyvinuto mnoho algoritmů pro automatické přiřazování domén v proteinech se známou 3D strukturou; viz 'Definice domény ze strukturních souřadnic '.
Databáze domén CATH klasifikuje domény do přibližně 800 skupin rodin; deset z těchto záhybů je vysoce osídlených a označuje se jako „super-záhyby“. Super-záhyby jsou definovány jako záhyby, pro které existují alespoň tři struktury bez významné podobnosti sekvence.[38] Nejlidnatější je super-fold α / β-barel, jak bylo popsáno výše.
Vícedoménové proteiny
Většina proteinů, dvě třetiny v jednobuněčných organismech a více než 80% v metazoa, jsou proteiny více domén.[39] Jiné studie však dospěly k závěru, že 40% prokaryotických proteinů se skládá z více domén, zatímco eukaryoty mají přibližně 65% proteinů s více doménami.[40]
Mnoho domén v eukaryotických multidoménových proteinech lze nalézt jako nezávislé proteiny u prokaryot,[41] což naznačuje, že domény v proteinech více domén kdysi existovaly jako nezávislé proteiny. Například obratlovci mají multienzymový polypeptid obsahující GAR syntetáza, AIR syntetáza a GAR transformyláza domény (GARs-AIRs-GARt; GAR: glycinamid ribonukleotid syntetáza / transferáza; AIR: aminoimidazol ribonukleotid syntetáza). U hmyzu se polypeptid jeví jako GARs- (AIRs) 2-GARt, v kvasinkách je GARs-AIR kódován odděleně od GARt a v bakteriích je každá doména kódována samostatně.[42]
Původ
Vícedoménové proteiny se pravděpodobně vyvinuly ze selektivního tlaku během vývoj vytvářet nové funkce. Různé proteiny se lišily od běžných předků různými kombinacemi a asociacemi domén. Modulární jednotky se často pohybují kolem, uvnitř a mezi biologickými systémy prostřednictvím mechanismů genetického míchání:
- transpozice mobilních prvků včetně horizontálních přenosů (mezi druhy);[45]
- hrubá přeskupení, jako jsou inverze, translokace, delece a duplikace;
- homologní rekombinace;
- sklouznutí DNA polymeráza během replikace.
Druhy organizace

Nejjednodušší multidoménová organizace pozorovaná v proteinech je organizace jedné domény opakovaná v tandemu.[46] Domény mohou vzájemně interagovat (interakce doména-doména ) nebo zůstanou izolované, jako korálky na provázku. Obří 30 000 zbytkových svalových bílkovin titin obsahuje asi 120 domén typu fibronektin-III a Ig.[47] V serinových proteázách vedla událost duplikace genů k vytvoření enzymu se dvěma doménami β-barelu.[48] Opakování se lišily tak široce, že mezi nimi není zjevná podobnost sekvence. Aktivní místo je umístěno v rozštěpu mezi dvěma doménami p-barelu, ve kterém jsou z každé domény přidávány funkčně důležité zbytky. Geneticky upravené mutanty chymotrypsin serinová proteáza Bylo prokázáno, že mají určitou aktivitu proteinázy, přestože jejich zbytky aktivního místa byly zrušeny, a proto se předpokládá, že událost duplikace zvýšila aktivitu enzymu.[48]
Moduly často zobrazují různé vztahy připojení, jak ukazuje kinesiny a Přepravníky ABC. Kinezinová motorická doména může být na obou koncích polypeptidového řetězce, který zahrnuje oblast coiled-coil a nákladovou doménu.[49] Transportéry ABC jsou postaveny až se čtyřmi doménami skládajícími se ze dvou nesouvisejících modulů, kazety vázající ATP a integrovaného membránového modulu, uspořádaných v různých kombinacích.
Domény se nejen rekombinují, ale existuje mnoho příkladů, kdy byla doména vložena do jiné. Sekvence nebo strukturní podobnosti s jinými doménami ukazují, že homology vložených a nadřazených domén mohou existovat nezávisle. Příkladem je „prst“ vložený do „dlaňové“ domény v polymerázách rodiny Pol I.[50] Protože doménu lze vložit do jiné, ve vícedoménovém proteinu by měla být vždy alespoň jedna spojitá doména. To je hlavní rozdíl mezi definicemi strukturálních domén a evolučních / funkčních domén. Evoluční doména bude omezena na jedno nebo dvě spojení mezi doménami, zatímco strukturální domény mohou mít neomezené spojení v rámci daného kritéria existence společného jádra. Několik strukturálních domén lze přiřadit k evoluční doméně.
Superdoména se skládá ze dvou nebo více konzervovaných domén nominálně nezávislého původu, ale následně zděděných jako jedna strukturální / funkční jednotka.[51] Tato kombinovaná superdoména se může vyskytovat v různých proteinech, které nesouvisí pouze s genovou duplikací. Příkladem superdomény je protein tyrosin fosfatáza –Doména C2 spárovat PTEN, tensin, auxilin a membránový protein TPTE2. Tato superdoména se nachází v bílkovinách u zvířat, rostlin a hub. Klíčovým rysem PTP-C2 superdomény je zachování aminokyselinových zbytků v rozhraní domény.
Domény jsou autonomní skládací jednotky
Skládací
Skládání proteinů - nevyřešený problém : Od semestrální práce Anfinsen na začátku 60. let[20] cíl zcela porozumět mechanismu, kterým se polypeptid rychle vloží do své stabilní nativní konformace, zůstává nepolapitelný. Mnoho experimentálních studií skládání přispělo k našemu porozumění, ale principy, které řídí skládání proteinů, jsou stále založeny na těch, které byly objeveny v prvních studiích skládání. Anfinsen ukázal, že nativní stav proteinu je termodynamicky stabilní, konformace je na globálním minimu jeho volné energie.
Skládání je cílené hledání konformačního prostoru umožňujícího složení proteinu v biologicky proveditelném časovém měřítku. The Levinthal paradox uvádí, že pokud by průměrná velikost proteinu odebrala vzorky všech možných konformací, než by našla tu s nejnižší energií, celý proces by trval miliardy let.[52] Proteiny se obvykle skládají během 0,1 a 1 000 sekund. Proces skládání proteinu proto musí být nějakým způsobem směrován specifickou cestou skládání. Předci, kteří řídí toto hledání, budou pravděpodobně kombinací místních a globálních vlivů, jejichž účinky se projevují v různých fázích reakce.[53]
Pokrok v experimentálních a teoretických studiích ukázal, že skládání lze vnímat z hlediska energetické krajiny,[54][55] kde kinetika skládání je považována za progresivní organizaci souboru částečně složených struktur, kterými protein prochází na své cestě do skládané struktury. To bylo popsáno v pojmech a skládací nálevka, ve kterém má nepřeložený protein velký počet konformačních stavů k dispozici a pro složený protein je k dispozici méně stavů. Nálevka naznačuje, že při skládání proteinů dochází ke snižování energie a ztrátě entropie se zvyšující se tvorbou terciární struktury. Místní drsnost trychtýře odráží kinetické pasti, což odpovídá hromadění špatně složených meziproduktů. Skládací řetěz postupuje směrem k nižším volným energiím uvnitř řetězce zvýšením své kompaktnosti. Konformační možnosti řetězce se nakonec stále více zužovaly směrem k jedné přirozené struktuře.
Výhoda domén při skládání proteinů
Organizace velkých proteinů strukturálními doménami představuje výhodu pro skládání proteinů, přičemž každá doména je schopna se individuálně skládat, což urychluje proces skládání a snižuje potenciálně velkou kombinaci interakcí zbytků. Dále, vzhledem k pozorované náhodné distribuci hydrofobních zbytků v proteinech,[56] tvorba domény se zdá být optimálním řešením pro velký protein, aby pohřbil své hydrofobní zbytky při zachování hydrofilních zbytků na povrchu.[57][58]
Role interdoménových interakcí při skládání proteinů a v energetice stabilizace nativní struktury se však pravděpodobně u každého proteinu liší. V T4 lysozymu je vliv jedné domény na druhou tak silný, že celá molekula je rezistentní na proteolytické štěpení. V tomto případě je skládání postupným procesem, kdy se vyžaduje C-koncová doména, aby se složila nezávisle v počátečním kroku, a druhá doména vyžaduje přítomnost složené C-terminální domény pro skládání a stabilizaci.[59]
Bylo zjištěno, že skládání izolované domény může probíhat stejnou rychlostí nebo někdy rychleji než v integrované doméně,[60] což naznačuje, že během skládání může dojít k nepříznivým interakcím se zbytkem proteinu. Několik argumentů naznačuje, že nejpomalejším krokem skládání velkých proteinů je párování složených domén.[30] Je to buď proto, že domény nejsou složeny úplně správně, nebo proto, že malé úpravy potřebné pro jejich interakci jsou energeticky nepříznivé,[61] například odstranění vody z rozhraní domény.
Domény a flexibilita proteinů
Dynamika proteinových domén hraje klíčovou roli v mnoha procesech molekulárního rozpoznávání a signalizace. Proteinové domény spojené s vnitřně narušenými flexibilní linker domén, vyvolat dalekonosný allostery přes dynamika proteinové domény Výsledné dynamické režimy nelze obecně předpovědět ze statických struktur celého proteinu nebo jednotlivých domén. Lze je však odvodit porovnáním různých struktur proteinu (jako v Databáze molekulárních pohybů ). Mohou být také navrženy vzorkováním v rozsáhlých trajektoriích molekulární dynamiky[62] a analýza hlavních komponent,[63] nebo je lze přímo pozorovat pomocí spekter[64][65]měřeno neutronová spinová ozvěna spektroskopie.
Definice domény ze strukturních souřadnic
Význam domén jako strukturálních stavebních bloků a prvků evoluce přinesl mnoho automatizovaných metod pro jejich identifikaci a klasifikaci v proteinech známé struktury. Automatické postupy pro spolehlivé přiřazení domény jsou nezbytné pro generování doménových databází, zejména proto, že se zvyšuje počet známých proteinových struktur. Ačkoli hranice domény lze určit vizuální kontrolou, konstrukce automatizované metody není přímá. Problémy nastávají, když se potýkají s doménami, které jsou diskontinuální nebo vysoce asociované.[66] Skutečnost, že neexistuje žádná standardní definice toho, co ve skutečnosti doména znamená, znamená, že se přiřazování domén enormně lišilo, přičemž každý výzkumník používal jedinečnou sadu kritérií.[67]
Strukturální doména je kompaktní globulární substruktura s více interakcemi v ní než se zbytkem proteinu.[68]Strukturální doménu lze tedy určit dvěma vizuálními charakteristikami: její kompaktností a mírou izolace.[69] Měření lokální kompaktnosti v proteinech byla použita v mnoha časných metodách přiřazování domén[70][71][72][73] a v několika novějších metodách.[28][74][75][76][77]
Metody
Jeden z prvních algoritmů[70] použitý a Mapa vzdáleností Cα-Cα společně s a hierarchické shlukování rutina, která považovala proteiny za několik malých segmentů o délce 10 zbytků. Počáteční segmenty byly seskupeny jeden po druhém na základě mezisegmentových vzdáleností; segmenty s nejkratšími vzdálenostmi byly seskupeny a poté považovány za jednotlivé segmenty. Postupné shlukování nakonec zahrnovalo plný protein. Jít[73] také využil skutečnosti, že mezidoménové vzdálenosti jsou obvykle větší než mezidoménové vzdálenosti; vše možné Vzdálenosti Cα-Cα byly reprezentovány jako diagonální grafy, ve kterých byly odlišné vzory pro šroubovice, prodloužená vlákna a kombinace sekundárních struktur.
Metoda Sowdhaminiho a Blundella seskupuje sekundární struktury v proteinu na základě jejich vzdáleností Cα-Cα a identifikuje domény ze vzoru v jejich dendrogramy.[66] Protože tento postup nepovažuje protein za spojitý řetězec aminokyselin, nejsou při léčbě diskontinuálních domén žádné problémy. Specifické uzly v těchto dendrogramech jsou identifikovány jako terciární strukturní klastry proteinu, zahrnují jak super-sekundární struktury, tak domény. Algoritmus DOMAK se používá k vytvoření databáze domény 3Dee.[75] Vypočítá „hodnotu rozdělení“ z počtu každého typu kontaktu, když je protein libovolně rozdělen na dvě části. Tato hodnota rozdělení je velká, když jsou dvě části struktury odlišné.
Metoda Wodak a Janin[78] byl založen na vypočítaných plochách rozhraní mezi dvěma segmenty řetězce opakovaně štěpenými v různých pozicích zbytků. Plochy rozhraní byly vypočítány porovnáním povrchových ploch štěpených segmentů s plochami nativní struktury. Potenciální hranice domény lze identifikovat na webu, kde byla oblast rozhraní minimálně. Jiné metody používají pro výpočet kompaktnosti míry dostupnosti rozpouštědla.[28][79][80]
Algoritmus PUU[19] obsahuje harmonický model používaný k aproximaci mezidoménové dynamiky. Základní fyzikální koncepce spočívá v tom, že v každé doméně dojde k mnoha rigidním interakcím a mezi doménami dojde k uvolněným interakcím. Tento algoritmus se používá k definování domén v FSSP databáze domén.[74]
Swindells (1995) vyvinul metodu DETECTIVE pro identifikaci domén v proteinových strukturách založenou na myšlence, že domény mají hydrofobní interiér. Bylo zjištěno, že k nedostatkům dochází, když hydrofobní jádra z různých domén pokračují přes oblast rozhraní.
RigidFinder je nová metoda pro identifikaci proteinově rigidních bloků (domén a smyček) ze dvou různých konformací. Tuhé bloky jsou definovány jako bloky, kde jsou zachovány všechny vzdálenosti mezi zbytky napříč konformacemi.
Metoda RIBFIND vyvinutý Panduranganem a Topfem identifikuje tuhá těla v proteinových strukturách provedením prostorového shlukování sekundární konstrukční prvky v bílkovinách.[81] Tuhá tělesa RIBFIND byla použita k pružnému přizpůsobení proteinových struktur kryoelektronová mikroskopie mapy hustoty.[82]
Obecná metoda k identifikaci dynamické domény, tj. proteinové regiony, které se v průběhu strukturálních výkyvů chovají přibližně jako rigidní jednotky, zavedli Potestio et al.[62] a mimo jiné bylo také použito k porovnání konzistence subdivizí domén založených na dynamice se standardními strukturovanými. Metoda, pojmenovaná PiSQRD, je veřejně dostupný ve formě webového serveru.[83] Druhá možnost umožňuje uživatelům optimálně rozdělit jednořetězcové nebo multimerní proteiny na kvazi-rigidní domény[62][83] na základě kolektivních způsobů fluktuace systému. Ve výchozím nastavení se thelatter počítá prostřednictvím elastického modelu sítě;[84]alternativně může uživatel načíst předem vypočítané základní dynamické prostory.
Ukázkové domény
- Pásovec se opakuje : pojmenovaný po β-kateninovém proteinu Armadillo ovocné mušky Drosophila.
- Základní doména leucinového zipu (doména bZIP ): nachází se v mnoha vazbách na DNA eukaryotický bílkoviny. Jedna část domény obsahuje oblast, která zprostředkovává sekvenčně specifické vazebné vlastnosti DNA, a leucinový zip, který je vyžadován pro dimerizace dvou oblastí vázajících DNA. Oblast vázající DNA obsahuje řadu bazických aminokyselin, jako jsou arginin a lysin
- Cadherin se opakuje : Kadheriny fungují jako Ca2+-závislá buňka-buňka přilnavost bílkoviny. Kadherinové domény jsou extracelulární oblasti, které zprostředkovávají homofilní vazbu mezi buňkami mezi kadheriny na povrchu sousedních buněk.
- Doména efektoru smrti (DED): umožňuje vazbu protein-protein pomocí homotypických interakcí (DED-DED). Caspase proteázy spoušť apoptóza prostřednictvím proteolytických kaskád. Pro-kaspáza-8 a pro-kaspáza-9 se vážou na specifické molekuly adaptéru prostřednictvím DED domén, což vede k autoaktivaci kaspáz.
- EF ruka : a helix-turn-helix strukturální motiv nalezené v každém strukturální doména z signální protein klimodulin a ve svalové bílkovině troponin-C.
- Imunoglobulinové podobné domény: nacházejí se v proteinech nadrodina imunoglobulinů (IgSF).[85] Obsahují asi 70–110 aminokyseliny a jsou rozděleny do různých kategorií (IgV, IgC1, IgC2 a IgI) podle jejich velikosti a funkce. Mají charakteristický záhyb, ve kterém dva beta listy tvoří „sendvič“, který je stabilizován interakcemi mezi konzervovanými cysteiny a další účtovány aminokyseliny. Jsou důležité pro interakce protein-protein v procesech buněčná adheze, aktivace buněk a molekulární rozpoznávání. Tyto domény se běžně vyskytují v molekulách s rolemi v imunitní systém.
- Fosfotyrosinová vazebná doména (PTB): Domény PTB se obvykle vážou na fosforylované tyrosinové zbytky. Často se nacházejí v proteinech signální transdukce. Specifičnost vazby na doménu PTB je určena zbytky na aminoterminální straně fosfotyrosinu. Příklady: domény PTB obou SHC a IRS-1 vázat na a NPXpY sekvence. Proteiny obsahující PTB, jako jsou SHC a IRS-1, jsou důležité inzulín reakce lidských buněk.
- Pleckstrinova homologická doména (PH): PH domény se vážou fosfoinositidy s vysokou afinitou. Specifičnost pro PtdIns (3) P, PtdIns (4) P, PtdIns (3,4) P2, PtdIns (4,5) P2, a PtdIns (3,4,5) P3 byly všechny pozorovány. Vzhledem k tomu, že fosfoinositidy jsou izolovány na různé buněčné membrány (kvůli jejich dlouhému lipofilnímu ocasu), PH domény obvykle způsobují nábor dotyčného proteinu na membránu, kde protein může vykonávat určitou funkci v buněčné signalizaci, reorganizaci cytoskeletu nebo přenosu membrány .
- Src homologie 2 doména (SH2): Domény SH2 se často nacházejí v proteinech signální transdukce. Domény SH2 zajišťují vazbu na fosforylovaný tyrosin (pTyr). Pojmenováno po doméně vázající fosfotyrosin viru src onkogen, což je samo o sobě a tyrosinkináza. Viz také: SH3 doména.
- Doména vázající DNA se zinkovým prstem (ZnF_GATA): Proteiny obsahující doménu ZnF_GATA jsou obvykle transkripční faktory které se obvykle váží na sekvenci DNA [AT] GATA [AG] z promotéři.
Domény neznámé funkce
Velká část domén má neznámou funkci. Adoména neznámé funkce (DUF) je proteinová doména, která nemá charakterizovanou funkci. Tyto rodiny byly shromážděny společně vDatabáze Pfam pomocí předpony DUF následované číslem, přičemž příklady jsou DUF2992 a DUF1220. V databázi Pfam nyní existuje více než 3 000 rodin DUF, což představuje více než 20% známých rodin.[86] Překvapivě se počet DUF v Pfamu zvýšil z 20% (v roce 2010) na 22% (v roce 2019), zejména kvůli rostoucímu počtu nových sekvence genomu. Vydání Pfam 32.0 (2019) obsahovalo 3 961 DUF.[87]
Viz také
- Vazba domény
- Krátký lineární motiv
- Pfam: databáze proteinových domén
- Protein
- Strukturní biologie
- Strukturální klasifikace proteinů (SCOP)
- KOCOUR
Reference
Tento článek včlení text a obrázky z disertační práce George, R. A. (2002) „Predicting Structural Domains in Proteins“, University College London, k nimž přispěl jeho autor.
- ^ Xu D, Nussinov R (1. února 1998). "Výhodná velikost domény v proteinech". Skládací a design. 3 (1): 11–7. doi:10.1016 / S1359-0278 (98) 00004-2. PMID 9502316.
- ^ Phillips DC (listopad 1966). „Trojrozměrná struktura molekuly enzymu“. Scientific American. 215 (5): 78–90. Bibcode:1966SciAm.215e..78P. doi:10.1038 / scientificamerican1166-78. PMID 5978599. S2CID 39959172.
- ^ Drenth J, Jansonius JN, Koekoek R, Swen HM, Wolthers BG (červen 1968). "Struktura papainu". Příroda. 218 (5145): 929–32. Bibcode:1968 Natur.218..929D. doi:10.1038 / 218929a0. PMID 5681232. S2CID 4169127.
- ^ Porter RR (květen 1973). "Strukturální studie imunoglobulinů". Věda. 180 (4087): 713–6. Bibcode:1973Sci ... 180..713P. doi:10.1126 / science.180.4087.713. PMID 4122075.
- ^ Edelman GM (květen 1973). "Struktura protilátek a molekulární imunologie". Věda. 180 (4088): 830–40. Bibcode:1973Sci ... 180..830E. doi:10.1126 / science.180.4088.830. PMID 4540988.
- ^ A b Richardson JS (1981). "Anatomie a taxonomie proteinové struktury". Pokroky v chemii proteinů. 34: 167–339. doi:10.1016 / S0065-3233 (08) 60520-3. ISBN 9780120342341. PMID 7020376.
- ^ Bork P (červenec 1991). "Zamíchané domény v extracelulárních proteinech". FEBS Dopisy. 286 (1–2): 47–54. doi:10.1016 / 0014-5793 (91) 80937-X. PMID 1864378. S2CID 22126481.
- ^ Wetlaufer DB (březen 1973). „Nukleace, rychlé skládání a globulární intrařetězcové oblasti v proteinech“. Sborník Národní akademie věd Spojených států amerických. 70 (3): 697–701. Bibcode:1973PNAS ... 70..697W. doi:10.1073 / pnas.70.3.697. PMC 433338. PMID 4351801.
- ^ Chothia C. (Červen 1992). "Proteiny. Tisíc rodin pro molekulárního biologa". Příroda. 357 (6379): 543–4. Bibcode:1992 Natur.357..543C. doi:10.1038 / 357543a0. PMID 1608464. S2CID 4355476.
- ^ Bakszt R, Wernimont A, Allali-Hassani A, Mok MW, Hills T, Hui R, Pizarro JC (září 2010). "Krystalová struktura toxoplasmy gondii pyruvátkinázy 1". PLOS ONE. 5 (9): e12736. Bibcode:2010PLoSO ... 512736B. doi:10.1371 / journal.pone.0012736. PMC 2939071. PMID 20856875.
- ^ George RA, Heringa J (listopad 2002). „Analýza linkerů proteinových domén: jejich klasifikace a role při skládání proteinů“. Proteinové inženýrství. 15 (11): 871–9. doi:10.1093 / protein / 15.11.871. PMID 12538906.
- ^ „Proteinové domény, přiřazení domény, identifikace a klasifikace podle databází CATH a SCOP“. proteinstructures.com. Citováno 14. října 2018.
- ^ Hegyi H, Gerstein M (duben 1999). "Vztah mezi strukturou a funkcí proteinu: komplexní průzkum s aplikací na genom kvasinek". Journal of Molecular Biology. 288 (1): 147–64. CiteSeerX 10.1.1.217.9806. doi:10.1006 / jmbi.1999.2661. PMID 10329133.
- ^ Banner DW, Bloomer AC, Petsko GA, Phillips DC, Pogson CI, Wilson IA a kol. (Červen 1975). "Struktura triose fosfát-izomerázy triových svalů byla stanovena krystalograficky při rozlišení 2,5 angstromu za použití dat aminokyselinové sekvence". Příroda. 255 (5510): 609–14. Bibcode:1975 Natur.255..609B. doi:10.1038 / 255609a0. PMID 1134550. S2CID 4195346.
- ^ A b Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM (srpen 1997). "CATH - hierarchická klasifikace struktur proteinových domén". Struktura. 5 (8): 1093–108. doi:10.1016 / S0969-2126 (97) 00260-8. PMID 9309224.
- ^ Copley RR, Bork P (listopad 2000). „Homologie mezi (betaalfa) (8) sudy: důsledky pro vývoj metabolických cest“. Journal of Molecular Biology. 303 (4): 627–41. doi:10.1006 / jmbi.2000.4152. PMID 11054297.
- ^ Lesk AM, Brändén CI, Chothia C (1989). „Strukturální principy proteinů alfa / beta barelu: obal vnitřku listu“. Proteiny. 5 (2): 139–48. doi:10,1002 / prot.340050208. PMID 2664768. S2CID 15340449.
- ^ A b Jones S, Stewart M, Michie A, Swindells MB, Orengo C, Thornton JM (únor 1998). „Přiřazení domény pro proteinové struktury pomocí konsensuálního přístupu: charakterizace a analýza“. Věda o bílkovinách. 7 (2): 233–42. doi:10.1002 / pro.5560070202. PMC 2143930. PMID 9521098.
- ^ A b Holm L, Sander C (červenec 1994). "Analyzátor pro skládací jednotky proteinů". Proteiny. 19 (3): 256–68. doi:10,1002 / prot. 340190309. PMID 7937738. S2CID 525264.
- ^ A b Anfinsen CB, Haber E, Sela M, White FH (září 1961). „Kinetika tvorby nativní ribonukleázy během oxidace redukovaného polypeptidového řetězce“. Sborník Národní akademie věd Spojených států amerických. 47 (9): 1309–14. Bibcode:1961PNAS ... 47.1309A. doi:10.1073 / pnas.47.9.1309. PMC 223141. PMID 13683522.
- ^ Cordes MH, Davidson AR, Sauer RT (únor 1996). "Sekvenční prostor, skládání a proteinový design". Aktuální názor na strukturní biologii. 6 (1): 3–10. doi:10.1016 / S0959-440X (96) 80088-1. PMID 8696970.
- ^ Ghélis C, Yon JM (červenec 1979). "[Conformational coupling between structural units. A decisive step in the functional structure formation]". Comptes Rendus des Séances de l'Académie des Sciences, Série D. 289 (2): 197–9. PMID 117925.
- ^ Ostermeier M, Benkovic SJ (2000). "Evolution of protein function by domain swapping". Evolutionary Protein Design. Adv Protein Chem. Pokroky v chemii proteinů. 55. pp. 29–77. doi:10.1016/s0065-3233(01)55002-0. ISBN 9780120342556. PMID 11050932.
- ^ Zhou Y, Vitkup D, Karplus M (January 1999). "Native proteins are surface-molten solids: application of the Lindemann criterion for the solid versus liquid state". Journal of Molecular Biology. 285 (4): 1371–5. doi:10.1006/jmbi.1998.2374. PMID 9917381. S2CID 8702994.
- ^ Levitt M, Chothia C (June 1976). "Structural patterns in globular proteins". Příroda. 261 (5561): 552–8. Bibcode:1976Natur.261..552L. doi:10.1038/261552a0. PMID 934293. S2CID 4154884.
- ^ Hutchinson EG, Thornton JM (April 1993). "The Greek key motif: extraction, classification and analysis". Proteinové inženýrství. 6 (3): 233–45. doi:10.1093/protein/6.3.233. PMID 8506258.
- ^ Savageau MA (March 1986). "Proteins of Escherichia coli come in sizes that are multiples of 14 kDa: domain concepts and evolutionary implications". Sborník Národní akademie věd Spojených států amerických. 83 (5): 1198–202. Bibcode:1986PNAS...83.1198S. doi:10.1073/pnas.83.5.1198. PMC 323042. PMID 3513170.
- ^ A b C Islam SA, Luo J, Sternberg MJ (June 1995). "Identification and analysis of domains in proteins". Proteinové inženýrství. 8 (6): 513–25. doi:10.1093/protein/8.6.513. PMID 8532675.
- ^ Wheelan SJ, Marchler-Bauer A, Bryant SH (July 2000). "Domain size distributions can predict domain boundaries". Bioinformatika. 16 (7): 613–8. doi:10.1093/bioinformatics/16.7.613. PMID 11038331.
- ^ A b Garel, J. (1992). "Folding of large proteins: Multidomain and multisubunit proteins". In Creighton, T. (ed.). Skládání bílkovin (První vydání). New York: W.H. Freeman a společnost. pp. 405–454. ISBN 978-0-7167-7027-5.
- ^ Bennett MJ, Schlunegger MP, Eisenberg D (December 1995). "3D domain swapping: a mechanism for oligomer assembly". Věda o bílkovinách. 4 (12): 2455–68. doi:10.1002/pro.5560041202. PMC 2143041. PMID 8580836.
- ^ Heringa J, Taylor WR (June 1997). "Three-dimensional domain duplication, swapping and stealing". Aktuální názor na strukturní biologii. 7 (3): 416–21. doi:10.1016/S0959-440X(97)80060-7. PMID 9204285.
- ^ Jacob F (June 1977). "Evolution and tinkering". Věda. 196 (4295): 1161–6. Bibcode:1977Sci...196.1161J. doi:10.1126/science.860134. PMID 860134. S2CID 29756896.
- ^ Ren S, Yang G, He Y, Wang Y, Li Y, Chen Z (říjen 2008). „Vzor zachování krátkých lineárních motivů je vysoce korelován s funkcí interagujících proteinových domén.“. BMC Genomics. 9: 452. doi:10.1186/1471-2164-9-452. PMC 2576256. PMID 18828911.
- ^ Campbell ID, Downing AK (May 1994). "Building protein structure and function from modular units". Trendy v biotechnologii. 12 (5): 168–72. doi:10.1016/0167-7799(94)90078-7. PMID 7764899.
- ^ Bruce, Alberts (18 November 2014). Molekulární biologie buňky (Šesté vydání). New York, NY. ISBN 9780815344322. OCLC 887605755.
- ^ wwPDB.org. "wwPDB: Worldwide Protein Data Bank". www.pdb.org. Archivovány od originál dne 7. dubna 2015. Citováno 25. července 2007.
- ^ Orengo CA, Jones DT, Thornton JM (December 1994). "Protein superfamilies and domain superfolds". Příroda. 372 (6507): 631–4. Bibcode:1994Natur.372..631O. doi:10.1038 / 372631a0. PMID 7990952. S2CID 4330359.
- ^ Apic G, Gough J, Teichmann SA (July 2001). "Domain combinations in archaeal, eubacterial and eukaryotic proteomes". Journal of Molecular Biology. 310 (2): 311–25. doi:10.1006/jmbi.2001.4776. PMID 11428892. S2CID 11894663.
- ^ Ekman D, Björklund AK, Frey-Skött J, Elofsson A (April 2005). "Multi-domain proteins in the three kingdoms of life: orphan domains and other unassigned regions". Journal of Molecular Biology. 348 (1): 231–43. doi:10.1016/j.jmb.2005.02.007. PMID 15808866.
- ^ Davidson JN, Chen KC, Jamison RS, Musmanno LA, Kern CB (March 1993). "The evolutionary history of the first three enzymes in pyrimidine biosynthesis". BioEssays. 15 (3): 157–64. doi:10.1002/bies.950150303. PMID 8098212. S2CID 24897614.
- ^ Henikoff S, Greene EA, Pietrokovski S, Bork P, Attwood TK, Hood L (October 1997). "Gene families: the taxonomy of protein paralogs and chimeras". Věda. 278 (5338): 609–14. Bibcode:1997Sci...278..609H. CiteSeerX 10.1.1.562.2262. doi:10.1126/science.278.5338.609. PMID 9381171.
- ^ Walker WP, Aradhya S, Hu CL, Shen S, Zhang W, Azarani A, et al. (Prosinec 2007). "Genetic analysis of attractin homologs". Genesis. 45 (12): 744–56. doi:10.1002/dvg.20351. PMID 18064672.
- ^ "SMART: Main page". smart.embl.de. Citováno 1. ledna 2017.
- ^ Bork P, Doolittle RF (October 1992). "Proposed acquisition of an animal protein domain by bacteria". Sborník Národní akademie věd Spojených států amerických. 89 (19): 8990–4. Bibcode:1992PNAS...89.8990B. doi:10.1073/pnas.89.19.8990. PMC 50050. PMID 1409594.
- ^ Heringa J (June 1998). "Detection of internal repeats: how common are they?". Aktuální názor na strukturní biologii. 8 (3): 338–45. doi:10.1016/S0959-440X(98)80068-7. PMID 9666330.
- ^ Politou AS, Gautel M, Improta S, Vangelista L, Pastore A (February 1996). "The elastic I-band region of titin is assembled in a "modular" fashion by weakly interacting Ig-like domains". Journal of Molecular Biology. 255 (4): 604–16. doi:10.1006/jmbi.1996.0050. PMID 8568900.
- ^ A b McLachlan AD (February 1979). "Gene duplications in the structural evolution of chymotrypsin". Journal of Molecular Biology. 128 (1): 49–79. doi:10.1016/0022-2836(79)90308-5. PMID 430571.
- ^ Moore JD, Endow SA (March 1996). "Kinesin proteins: a phylum of motors for microtubule-based motility". BioEssays. 18 (3): 207–19. doi:10.1002/bies.950180308. PMID 8867735. S2CID 46012215.
- ^ Russell RB (December 1994). "Domain insertion". Proteinové inženýrství. 7 (12): 1407–10. doi:10.1093/protein/7.12.1407. PMID 7716150.
- ^ Haynie DT, Xue B (May 2015). "Superdomains in the protein structure hierarchy: The case of PTP-C2". Věda o bílkovinách. 24 (5): 874–82. doi:10.1002/pro.2664. PMC 4420535. PMID 25694109.
- ^ Levinthal C (1968). "Are there pathways for protein folding?" (PDF). J Chim Phys. 65: 44–45. Bibcode:1968JCP....65...44L. doi:10.1051/jcp/1968650044. Archivovány od originál (PDF) dne 2. září 2009.
- ^ Dill KA (June 1999). "Polymer principles and protein folding". Věda o bílkovinách. 8 (6): 1166–80. doi:10.1110/ps.8.6.1166. PMC 2144345. PMID 10386867.
- ^ Leopold PE, Montal M, Onuchic JN (September 1992). "Protein folding funnels: a kinetic approach to the sequence-structure relationship". Sborník Národní akademie věd Spojených států amerických. 89 (18): 8721–5. Bibcode:1992PNAS...89.8721L. doi:10.1073/pnas.89.18.8721. PMC 49992. PMID 1528885.
- ^ Dill KA, Chan HS (January 1997). "From Levinthal to pathways to funnels". Přírodní strukturní biologie. 4 (1): 10–9. doi:10.1038/nsb0197-10. PMID 8989315. S2CID 11557990.
- ^ White SH, Jacobs RE (April 1990). "Statistical distribution of hydrophobic residues along the length of protein chains. Implications for protein folding and evolution". Biofyzikální deník. 57 (4): 911–21. Bibcode:1990BpJ....57..911W. doi:10.1016/S0006-3495(90)82611-4. PMC 1280792. PMID 2188687.
- ^ George RA, Heringa J (February 2002). "SnapDRAGON: a method to delineate protein structural domains from sequence data". Journal of Molecular Biology. 316 (3): 839–51. CiteSeerX 10.1.1.329.2921. doi:10.1006/jmbi.2001.5387. PMID 11866536.
- ^ George RA, Lin K, Heringa J (July 2005). "Scooby-domain: prediction of globular domains in protein sequence". Výzkum nukleových kyselin. 33 (Web Server issue): W160-3. doi:10.1093/nar/gki381. PMC 1160142. PMID 15980446.
- ^ Desmadril M, Yon JM (July 1981). "Existence of intermediates in the refolding of T4 lysozyme at pH 7.4". Sdělení o biochemickém a biofyzikálním výzkumu. 101 (2): 563–9. doi:10.1016/0006-291X(81)91296-1. PMID 7306096.
- ^ Teale JM, Benjamin DC (July 1977). "Antibody as immunological probe for studying refolding of bovine serum albumin. Refolding within each domain". The Journal of Biological Chemistry. 252 (13): 4521–6. PMID 873903.
- ^ Creighton, T. E. (1983). Proteins: Structures and molecular properties. Freeman, New York. Druhé vydání.
- ^ A b C Potestio R, Pontiggia F, Micheletti C (June 2009). „Hrubozrnný popis vnitřní dynamiky bílkovin: optimální strategie pro rozklad bílkovin v tuhých podjednotkách“. Biofyzikální deník. 96 (12): 4993–5002. Bibcode:2009BpJ .... 96,4993P. doi:10.1016 / j.bpj.2009.03.051. PMC 2712024. PMID 19527659.
- ^ Baron R, Vellore NA (July 2012). „LSD1 / CoREST je alosterická svorka v nanoměřítku regulovaná molekulárním rozpoznáváním H3-histon-ocas“. Sborník Národní akademie věd Spojených států amerických. 109 (31): 12509–14. Bibcode:2012PNAS..10912509B. doi:10.1073 / pnas.1207892109. PMC 3411975. PMID 22802671.
- ^ Farago B, Li J, Cornilescu G, Callaway DJ, Bu Z (listopad 2010). "Aktivace alosterické proteinové domény v nanoměřítku odhalena neutronovou spinovou echovou spektroskopií". Biofyzikální deník. 99 (10): 3473–82. Bibcode:2010BpJ .... 99,3473F. doi:10.1016 / j.bpj.2010.09.058. PMC 2980739. PMID 21081097.
- ^ Bu Z, Biehl R, Monkenbusch M, Richter D, Callaway DJ (December 2005). "Pohyb vázané proteinové domény v Taq polymeráze odhalen neutronovou spin-echo spektroskopií". Sborník Národní akademie věd Spojených států amerických. 102 (49): 17646–51. Bibcode:2005PNAS..10217646B. doi:10.1073 / pnas.0503388102. PMC 1345721. PMID 16306270.
- ^ A b Sowdhamini R, Blundell TL (March 1995). "An automatic method involving cluster analysis of secondary structures for the identification of domains in proteins". Věda o bílkovinách. 4 (3): 506–20. doi:10.1002/pro.5560040317. PMC 2143076. PMID 7795532.
- ^ Swindells MB (January 1995). "A procedure for detecting structural domains in proteins". Věda o bílkovinách. 4 (1): 103–12. doi:10.1002/pro.5560040113. PMC 2142966. PMID 7773168.
- ^ Janin J, Wodak SJ (1983). "Strukturální domény v proteinech a jejich role v dynamice proteinové funkce". Pokrok v biofyzice a molekulární biologii. 42 (1): 21–78. doi:10.1016/0079-6107(83)90003-2. PMID 6353481.
- ^ Tsai CJ, Nussinov R (January 1997). "Hydrophobic folding units derived from dissimilar monomer structures and their interactions". Věda o bílkovinách. 6 (1): 24–42. doi:10.1002/pro.5560060104. PMC 2143523. PMID 9007974.
- ^ A b Crippen GM (December 1978). "The tree structural organization of proteins". Journal of Molecular Biology. 126 (3): 315–32. doi:10.1016/0022-2836(78)90043-8. PMID 745231.
- ^ Rossmann MG, Moras D, Olsen KW (July 1974). "Chemical and biological evolution of nucleotide-binding protein". Příroda. 250 (463): 194–9. Bibcode:1974Natur.250..194R. doi:10.1038/250194a0. PMID 4368490. S2CID 4273028.
- ^ Rose GD (November 1979). "Hierarchic organization of domains in globular proteins". Journal of Molecular Biology. 134 (3): 447–70. doi:10.1016/0022-2836(79)90363-2. PMID 537072.
- ^ A b Go N, Taketomi H (February 1978). "Respective roles of short- and long-range interactions in protein folding". Sborník Národní akademie věd Spojených států amerických. 75 (2): 559–63. Bibcode:1978PNAS...75..559G. doi:10.1073/pnas.75.2.559. PMC 411294. PMID 273218.
- ^ A b Holm L, Sander C (January 1997). "Dali/FSSP classification of three-dimensional protein folds". Výzkum nukleových kyselin. 25 (1): 231–4. doi:10.1093/nar/25.1.231. PMC 146389. PMID 9016542.
- ^ A b Siddiqui AS, Barton GJ (May 1995). "Continuous and discontinuous domains: an algorithm for the automatic generation of reliable protein domain definitions". Věda o bílkovinách. 4 (5): 872–84. doi:10.1002/pro.5560040507. PMC 2143117. PMID 7663343.
- ^ Zehfus MH (June 1997). "Identification of compact, hydrophobically stabilized domains and modules containing multiple peptide chains". Věda o bílkovinách. 6 (6): 1210–9. doi:10.1002/pro.5560060609. PMC 2143719. PMID 9194181.
- ^ Taylor WR (March 1999). "Protein structural domain identification". Proteinové inženýrství. 12 (3): 203–16. doi:10.1093/protein/12.3.203. PMID 10235621.
- ^ Wodak SJ, Janin J (November 1981). "Location of structural domains in protein". Biochemie. 20 (23): 6544–52. doi:10.1021/bi00526a005. PMID 7306523.
- ^ Rashin, 1985
- ^ Zehfus MH, Rose GD (September 1986). "Compact units in proteins". Biochemie. 25 (19): 5759–65. doi:10.1021/bi00367a062. PMID 3778881.
- ^ Pandurangan AP, Topf M (September 2012). "RIBFIND: a web server for identifying rigid bodies in protein structures and to aid flexible fitting into cryo EM maps" (PDF). Bioinformatika. 28 (18): 2391–3. doi:10.1093/bioinformatics/bts446. PMID 22796953.
- ^ Pandurangan AP, Topf M (February 2012). "Finding rigid bodies in protein structures: Application to flexible fitting into cryoEM maps". Journal of Structural Biology. 177 (2): 520–31. doi:10.1016/j.jsb.2011.10.011. PMID 22079400.
- ^ A b Aleksiev T, Potestio R, Pontiggia F, Cozzini S, Micheletti C (October 2009). "PiSQRD: a web server for decomposing proteins into quasi-rigid dynamical domains". Bioinformatika. 25 (20): 2743–4. doi:10.1093/bioinformatics/btp512. PMID 19696046. S2CID 28106759.
- ^ Micheletti, C., Carloni, P. and Maritan, A. Accurate and efficient description of protein vibrational dynamics: comparing molecular dynamics and gaussian models, Proteins, 55, 635, 2004.
- ^ Barclay AN (srpen 2003). „Membránové proteiny s doménami podobnými imunoglobulinům - hlavní nadrodina interakčních molekul“. Semináře z imunologie. 15 (4): 215–23. doi:10.1016 / S1044-5323 (03) 00047-2. PMID 14690046.
- ^ Bateman A, Coggill P, Finn RD (October 2010). "DUFs: families in search of function". Acta Crystallographica. Sekce F, Strukturní biologie a krystalizační komunikace. 66 (Pt 10): 1148–52. doi:10.1107/S1744309110001685. PMC 2954198. PMID 20944204.
- ^ El-Gebali S, Mistry J, Bateman A, Eddy SR, Luciani A, Potter SC, et al. (Leden 2019). "The Pfam protein families database in 2019". Výzkum nukleových kyselin. 47 (D1): D427–D432. doi:10.1093/nar/gky995. PMC 6324024. PMID 30357350.
Klíčové dokumenty
- Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, et al. (Leden 2000). "The Protein Data Bank". Výzkum nukleových kyselin. 28 (1): 235–42. doi:10.1093/nar/28.1.235. PMC 102472. PMID 10592235.
- Tooze J, Brändén C (1999). Introduction to protein structure. New York: Garland Pub. ISBN 978-0-8153-2305-1.
- Das S, Smith TF (2000). "Identifying nature's protein Lego set". Pokroky v chemii proteinů. 54: 159–83. doi:10.1016/S0065-3233(00)54006-6. ISBN 978-0-12-034254-9. PMID 10829228.
- Dietmann S, Park J, Notredame C, Heger A, Lappe M, Holm L (January 2001). "A fully automatic evolutionary classification of protein folds: Dali Domain Dictionary version 3". Výzkum nukleových kyselin. 29 (1): 55–7. doi:10.1093/nar/29.1.55. PMC 29815. PMID 11125048.
- Dyson HJ, Sayre JR, Merutka G, Shin HC, Lerner RA, Wright PE (August 1992). "Folding of peptide fragments comprising the complete sequence of proteins. Models for initiation of protein folding. II. Plastocyanin". Journal of Molecular Biology. 226 (3): 819–35. doi:10.1016/0022-2836(92)90634-V. PMID 1507228.
- Fersht AR (Únor 1997). "Nucleation mechanisms in protein folding". Aktuální názor na strukturní biologii. 7 (1): 3–9. doi:10.1016/S0959-440X(97)80002-4. PMID 9032066.
- George DG, Hunt LT, Barker WC (1996). "PIR-International Protein Sequence Database". Metody v enzymologii. 266: 41–59. doi:10.1016/S0076-6879(96)66005-4. ISBN 978-0-12-182167-8. PMC 145575. PMID 8743676.
- Go M (May 1981). "Correlation of DNA exonic regions with protein structural units in haemoglobin". Příroda. 291 (5810): 90–2. Bibcode:1981Natur.291...90G. doi:10.1038/291090a0. PMID 7231530. S2CID 4313732.
- Hadley C, Jones DT (September 1999). "A systematic comparison of protein structure classifications: SCOP, CATH and FSSP". Struktura. 7 (9): 1099–112. doi:10.1016/S0969-2126(99)80177-4. PMID 10508779.
- Hayward S (September 1999). "Strukturální principy řídící doménové pohyby v proteinech". Proteiny. 36 (4): 425–35. doi:10.1002 / (SICI) 1097-0134 (19990901) 36: 4 <425 :: AID-PROT6> 3.0.CO; 2-S. PMID 10450084.
- Heringa J, Argos P (July 1991). "Side-chain clusters in protein structures and their role in protein folding". Journal of Molecular Biology. 220 (1): 151–71. doi:10.1016/0022-2836(91)90388-M. PMID 2067014.
- Honig B (October 1999). "Protein folding: from the levinthal paradox to structure prediction". Journal of Molecular Biology. 293 (2): 283–93. CiteSeerX 10.1.1.332.955. doi:10.1006/jmbi.1999.3006. PMID 10550209.
- Kim PS, Baldwin RL (1990). "Intermediates in the folding reactions of small proteins". Roční přehled biochemie. 59 (1): 631–60. doi:10.1146/annurev.bi.59.070190.003215. PMID 2197986.
- Murvai J, Vlahovicek K, Barta E, Cataletto B, Pongor S (January 2000). "The SBASE protein domain library, release 7.0: a collection of annotated protein sequence segments". Výzkum nukleových kyselin. 28 (1): 260–2. doi:10.1093/nar/28.1.260. PMC 102474. PMID 10592241.
- Murzin AG, Brenner SE, Hubbard T, Chothia C (Duben 1995). "SCOP: a structural classification of proteins database for the investigation of sequences and structures" (PDF). Journal of Molecular Biology. 247 (4): 536–40. doi:10.1016/S0022-2836(05)80134-2. PMID 7723011. Archivovány od originál (PDF) dne 26. dubna 2012.
- Janin J, Chothia C (1985). "Domains in proteins: definitions, location, and structural principles". Metody v enzymologii. 115: 420–30. doi:10.1016/0076-6879(85)15030-5. ISBN 978-0-12-182015-2. PMID 4079796.
- Schultz J, Copley RR, Doerks T, Ponting CP, Bork P (January 2000). "SMART: a web-based tool for the study of genetically mobile domains". Výzkum nukleových kyselin. 28 (1): 231–4. doi:10.1093/nar/28.1.231. PMC 102444. PMID 10592234.
- Siddiqui AS, Dengler U, Barton GJ (February 2001). "3Dee: a database of protein structural domains". Bioinformatika. 17 (2): 200–1. doi:10.1093/bioinformatics/17.2.200. PMID 11238081.
- Srinivasarao GY, Yeh LS, Marzec CR, Orcutt BC, Barker WC, Pfeiffer F (January 1999). "Database of protein sequence alignments: PIR-ALN". Výzkum nukleových kyselin. 27 (1): 284–5. doi:10.1093/nar/27.1.284. PMC 148157. PMID 9847202.
- Tatusov RL, Natale DA, Garkavtsev IV, Tatusova TA, Shankavaram UT, Rao BS, et al. (Leden 2001). "The COG database: new developments in phylogenetic classification of proteins from complete genomes". Výzkum nukleových kyselin. 29 (1): 22–8. doi:10.1093/nar/29.1.22. PMC 29819. PMID 11125040.
- Taylor WR, Orengo CA (July 1989). Msgstr "Zarovnání struktury proteinů". Journal of Molecular Biology. 208 (1): 1–22. doi:10.1016/0022-2836(89)90084-3. PMID 2769748.
- Yang AS, Honig B (September 1995). "Free energy determinants of secondary structure formation: I. alpha-Helices". Journal of Molecular Biology. 252 (3): 351–65. doi:10.1006/jmbi.1995.0502. PMID 7563056.
- Yang AS, Honig B (September 1995). "Free energy determinants of secondary structure formation: II. Antiparallel beta-sheets". Journal of Molecular Biology. 252 (3): 366–76. doi:10.1006/jmbi.1995.0503. PMID 7563057.
- Gough J, Chothia C (Leden 2002). "SUPERFAMILY: HMMs representing all proteins of known structure. SCOP sequence searches, alignments and genome assignments". Výzkum nukleových kyselin. 30 (1): 268–72. doi:10.1093/nar/30.1.268. PMC 99153. PMID 11752312.
externí odkazy
Structural domain databases
- Conserved Domains at the National Center for Biotechnology website
- 3Dee
- KOCOUR
- DALI
- Definition and assignment of structural domains in proteins na Wayback Machine (archived 2006-09-11)
- PFAM clan browser
Sequence domain databases
- InterPro
- Pfam na Knihovna Kongresu Web Archives (archived 2011-05-06)
- STRÁNKA
- ProDom[trvalý mrtvý odkaz ]
- CHYTRÝ
- NCBI Conserved Domain Database
- SUPERFAMILY Library of HMMs representing superfamilies and database of (superfamily and family) annotations for all completely sequenced organisms
Functional domain databases
- dcGO A comprehensive database of domain-centric ontologies on functions, phenotypes and diseases.