Doména neznámé funkce - Domain of unknown function
A doména neznámé funkce (DUF) je a proteinová doména která nemá charakterizovanou funkci. Tyto rodiny byly shromážděny společně v Pfam databáze používající předponu DUF následovanou číslem, přičemž příklady jsou DUF2992 a DUF1220. Od roku 2019 je v databázi Pfam téměř 4 000 rodin DUF, což představuje více než 22% známých rodin. Některé DUF nejsou pojmenovány pomocí nomenklatury kvůli oblíbenému použití, ale přesto jsou DUF.[1]
Označení DUF je předběžné a takové rodiny mají tendenci být po identifikaci funkce přejmenovány na konkrétnější název (nebo sloučeny do existující domény).[2][3]
Dějiny
Schéma pojmenování DUF zavedl Chris Ponting přidáním DUF1 a DUF2 do SMART databáze.[4] Bylo zjištěno, že tyto dvě domény jsou široce distribuovány v bakteriálních signálních proteinech. Následně byly identifikovány funkce těchto domén a od té doby byly přejmenovány na Doména GGDEF a EAL doména resp.[2]
Charakterizace
Strukturální genomika Programy se pokusily porozumět funkci DUF pomocí stanovení struktury. Struktury více než 250 rodin DUF byly vyřešeny. Tato práce (2009) ukázala, že asi dvě třetiny rodin DUF měly strukturu podobnou dříve řešené, a proto by mohly být odlišnými členy existujících proteinových superrodin, zatímco přibližně jedna třetina měla nový proteinový záhyb.[5]
Některé rodiny DUF sdílejí vzdálenou sekvenční homologii s doménami, které mají charakteristickou funkci. K propojení těchto vztahů lze použít výpočetní práci. Práce z roku 2015 dokázala přiřadit 20% DUF charakterizovaným strukturálním superrodinám.[6] Pfam také průběžně provádí (ručně ověřené) přiřazení v položkách „klanových“ nadrodin.[1]
Četnost a zachování
Více než 20% všech proteinových domén bylo v roce 2013 označeno jako DUF. V bakteriích se nachází přibližně 2 700 DUF, ve srovnání s pouhými 1 500 u eukaryot. Více než 800 DUF je sdíleno mezi bakteriemi a eukaryoty a asi 300 z nich je také přítomno v archaeách. U zvířat se dokonce vyskytuje celkem 2 786 bakteriálních domén Pfam, včetně 320 DUF.[7]
Role v biologii
Mnoho DUF je vysoce konzervovaných, což naznačuje důležitou roli v biologii. Mnoho takových DUF však není nezbytných, a proto jejich biologická role často zůstává neznámá. Například DUF143 je přítomen ve většině bakterie a eukaryotický genomy.[8] Když však byl odstraněn v Escherichia coli není to zřejmé fenotyp byl zjištěn. Později se ukázalo, že proteiny, které obsahují DUF143, jsou ribozomální faktory tlumení, které blokují sestavení dvou ribozomálních podjednotek.[8] I když tato funkce není nezbytná, pomáhá buňkám přizpůsobit se podmínkám s nízkým obsahem živin vypnutím biosyntézy bílkovin. Výsledkem je, že tyto proteiny a DUF se stávají relevantní, pouze když buňky hladoví.[8] Předpokládá se tedy, že mnoho DUF (nebo proteinů neznámé funkce, PUF) je vyžadováno pouze za určitých podmínek.
Základní DUF
Goodacre a kol. identifikoval 238 DUF ve 355 esenciálních proteinech (v 16 modelových bakteriálních druzích), z nichž většina představuje proteiny s jednou doménou, čímž jasně stanovil biologickou esenciálnost DUF. Tyto DUF se nazývají „základní DUF“ nebo eDUF.[7]
externí odkazy
Reference
- ^ A b El-Gebali S, Mistry J, Bateman A, Eddy SR, Luciani A, Potter SC, Qureshi M, Richardson LJ, Salazar GA, Smart A, Sonnhammer EL, Hirsh L, Paladin L, Piovesan D, Tosatto SC, Finn RD ( Ledna 2019). „Databáze proteinových rodin Pfam v roce 2019“. Výzkum nukleových kyselin. 47 (D1): D427 – D432. doi:10.1093 / nar / gky995. PMC 6324024. PMID 30357350.
- ^ A b Bateman A, Coggill P, Finn RD (říjen 2010). "DUF: rodiny při hledání funkce". Acta Crystallographica. Sekce F, Strukturní biologie a krystalizační komunikace. 66 (Pt 10): 1148–52. doi:10.1107 / S1744309110001685. PMC 2954198. PMID 20944204.
- ^ Punta M, Coggill PC, Eberhardt RY, Mistry J, Tate J, Boursnell C, Pang N, Forslund K, Ceric G, Clements J, Heger A, Holm L, Sonnhammer EL, Eddy SR, Bateman A, Finn RD (leden 2012 ). „Databáze proteinových rodin Pfam“. Výzkum nukleových kyselin. 40 (Problém s databází): D290-301. doi:10.1093 / nar / gkr1065. PMC 3245129. PMID 22127870.
- ^ Schultz J, Milpetz F, Bork P, Ponting CP (květen 1998). „SMART, jednoduchý nástroj pro výzkum modulární architektury: identifikace signálních domén“. Sborník Národní akademie věd Spojených států amerických. 95 (11): 5857–64. Bibcode:1998PNAS ... 95.5857S. doi:10.1073 / pnas.95.11.5857. PMC 34487. PMID 9600884.
- ^ Jaroszewski L, Li Z, Krishna SS, Bakolitsa C, Wooley J, Deacon AM, Wilson IA, Godzik A (září 2009). „Průzkum nezmapovaných oblastí proteinového vesmíru“. PLOS Biology. 7 (9): e1000205. doi:10.1371 / journal.pbio.1000205. PMC 2744874. PMID 19787035.
- ^ Mudgal R, Sandhya S, Chandra N, Srinivasan N (červenec 2015). „De-DUFing the DUFs: Dešifrování vzdálených evolučních vztahů domén neznámé funkce pomocí citlivých metod detekce homologie“. Biology Direct. 10 (1): 38. doi:10.1186 / s13062-015-0069-2. PMC 4520260. PMID 26228684.
- ^ A b C Goodacre NF, Gerloff DL, Uetz P (prosinec 2013). „Proteinové domény s neznámou funkcí jsou v bakteriích nezbytné“. mBio. 5 (1): e00744-13. doi:10,1 128 / mBio.00744-13. PMC 3884060. PMID 24381303.
- ^ A b C Häuser R, Pech M, Kijek J, Yamamoto H, Titz B, Naeve F, Tovchigrechko A, Yamamoto K, Szaflarski W, Takeuchi N, Stellberger T, Diefenbacher ME, Nierhaus KH, Uetz P (2012). Hughes D (ed.). „Proteiny RsfA (YbeB) jsou konzervativní faktory umlčování ribozomů“. Genetika PLOS. 8 (7): e1002815. doi:10.1371 / journal.pgen.1002815. PMC 3400551. PMID 22829778.