Proteogenomika - Proteogenomics - Wikipedia
![](http://upload.wikimedia.org/wikipedia/commons/thumb/3/3a/Proteogenomics_Image_2.png/220px-Proteogenomics_Image_2.png)
Proteogenomika je oblast biologického výzkumu, která využívá kombinaci proteomika, genomika, a transkriptomika na pomoc při objevování a identifikaci peptidy. Proteogenomika se používá k identifikaci nových peptidů srovnáním MS / MS spektra proti proteinové databázi, která byla odvozena z genomové a transkriptomické informace. Proteogenomika často odkazuje na studie, které využívají proteomické informace, často odvozené z hmotnostní spektrometrie, zlepšit gen anotace.[1] Genomika se zabývá genetickým kódem celých organismů, zatímco transkriptomika se zabývá studiem sekvenování RNA a transkriptů. Proteomika využívá tandemová hmotnostní spektrometrie a kapalinová chromatografie identifikovat a studovat funkce proteinů. Proteomika se používá k objevení všech proteinů exprimovaných v organismu, známých jako jeho proteom.[2] Problém proteomiky spočívá v tom, že se spoléhá na předpoklad, že současné genové modely jsou správné a že správné proteinové sekvence lze nalézt pomocí databáze referenčních proteinových sekvencí; není tomu však vždy tak, protože některé peptidy nelze v databázi najít. Kromě toho mohou nové mutace proteinových sekvencí nastat. tyto problémy lze vyřešit použitím proteomických, genomických a transkriptomických dat. Využití proteomiky a genomiky vedlo k proteogenomice, která se stala vlastní oblastí v roce 2004.[1][3][4].
Více nedávno, společné profilování povrchových proteinů a transkriptů mRNA z jednotlivých buněk metodami, jako je CITE-sekv byla označována jako jednobuněčná proteogenomika[5][6], i když cíle těchto studií nesouvisí s identifikací peptidů.
Metodologie
![](http://upload.wikimedia.org/wikipedia/commons/thumb/c/cd/How_proteins_are_made_NSF.jpg/350px-How_proteins_are_made_NSF.jpg)
Hlavní myšlenkou proteogenomického přístupu je identifikovat peptidy porovnáním dat MS / MS s databázemi proteinů, které obsahují předpokládané proteinové sekvence. Databáze proteinů je generována různými způsoby využitím genomických a transkriptomických dat. Níže uvádíme některé ze způsobů, jakými se generují proteinové databáze:
Překlad šesti snímků
Překlady se šesti snímky lze použít ke generování databáze, která předpovídá proteinové sekvence. Omezení této metody spočívá v tom, že databáze budou velmi velké kvůli počtu generovaných sekvencí, z nichž některé v přírodě neexistují.[1]
Predikce genu Ab initio
V této metodě je proteinová báze generována algoritmy pro predikci genů, které umožňují identifikaci proteinu kódující oblasti. Vzhledem k tomu, že databáze mohou být velmi velké, je databáze podobná databázi generované překladem do šesti snímků.[1]
Data vyjádřená sekvenční značkou
Překlady se šesti snímky mohou využívat vyjádřená značka sekvence (EST) ke generování proteinových databází. Data EST poskytují informace o přepisu, které mohou pomoci při vytváření databáze. Databáze může být velmi velká a má tu nevýhodu, že obsahuje více kopií dané sekvence; tento problém však lze obejít kompresí proteinové sekvence generované výpočetními strategiemi.[1]
Jiné metody
Proteinové databáze lze také vytvořit pomocí RNA sekvenční data, komentované transkripty RNA a varianty proteinových sekvencí. Existují také další specializovanější databáze proteinů, které lze vytvořit pro vhodnou identifikaci požadovaného peptidu.[1]
Další metodou identifikace proteinů prostřednictvím proteogenomiky je komparativní proteogenomika. Srovnávací proteogenomika porovnává proteomická data z několika příbuzných druhů současně a využívá homologii mezi jejich proteiny ke zlepšení anotací s vyšší statistickou spolehlivostí.[7][8]
Aplikace
Proteogenomiku lze aplikovat různými způsoby. Jednou z aplikací je zlepšení anotací genů v různých organismech. Anotace genu zahrnuje objevování genů a jejich funkcí.[9] Proteogenomika se stala obzvláště užitečnou při objevování a zdokonalování anotací genů v prokaryotických organismech. Například různé mikroorganismy mají své genomické anotace studovány prostřednictvím proteogenomického přístupu, včetně Escherichia coli, Mycobacterium a více druhů Shewanella bakterie.[10]
Kromě zlepšení genových anotací mohou proteogenomické studie také poskytnout cenné informace o přítomnosti naprogramovaných posuny rámů, N-terminál methionin vyříznutí, signální peptidy, proteolýza a další posttranslační úpravy.[3][7] Proteogenomika má potenciální aplikace v medicíně, zejména v onkologie výzkum. Rakovina se vyskytuje geneticky mutace jako methylace, přemístění, a somatický mutace. Výzkum ukázal, že jak genomové, tak proteomické informace jsou potřebné k pochopení molekulárních variací, které vedou k rakovině.[2][11] Proteogenomika tomu napomohla identifikací proteinových sekvencí, které mohou mít při rakovině funkční role.[12] Konkrétním příkladem toho byla studie zahrnující rakovinu tlustého střeva, která vedla k objevení potenciálních cílů pro léčbu rakoviny.[2] Proteogenomika také vedla k personalizovaným imunoterapiím zaměřeným na rakovinu, kde se předpovídají protilátkové epitopy pro rakovinové antigeny pomocí proteogenomiky k výrobě léků, které působí na specifický nádor pacienta.[13] Kromě léčby může proteogenonomika poskytnout vhled do diagnostiky rakoviny. Ve studiích zahrnujících rakovinu tlustého střeva a konečníku byla k identifikaci somatických mutací použita proteogenomika. Identifikace somatických mutací u pacientů by mohla být použita k diagnostice rakoviny u pacientů. Kromě přímých aplikací při léčbě a diagnostice rakoviny lze ke studiu proteinů, které vedou k rezistenci, použít proteogenomický přístup chemoterapie.[11]
Výzvy
Proteogenomika může nabídnout metody identifikace peptidů, aniž by měla nevýhodu neúplných nebo nepřesných databází proteinů, kterým čelí proteomika; s proteogenomickým přístupem však vznikají problémy.[1] Jednou z největších výzev proteogenomiky je naprostá velikost generovaných databází proteinů. statisticky je pravděpodobné, že velká proteinová databáze bude mít za následek nesprávné přiřazení dat z proteinové databáze k datům MS / MS, tento problém může bránit identifikaci nových peptidů. Falešné pozitivy jsou také problémem proteogenomických přístupů. k falešným pozitivům může dojít v důsledku extrémně velkých databází proteinů, kde chybně shodná data vedou k nesprávné identifikaci. Dalším problémem je nesprávné přiřazení MS / MS spekter k datům proteinové sekvence, která odpovídá podobnému peptidu místo skutečného peptidu. Existují případy, kdy jsou přijímána data peptidu umístěného na více genových místech, což může vést k datům, která lze interpretovat různými způsoby. Navzdory těmto výzvám existují způsoby, jak omezit mnoho chyb, ke kterým dochází. Například při práci s velmi velkou proteinovou databází je možné porovnat identifikované nové peptidové sekvence se všemi sekvencemi v databázi a poté porovnat posttranslační modifikace. Dále lze určit, zda tyto dvě sekvence představují stejný peptid nebo zda se jedná o dva různé peptidy.[1]
Reference
- ^ A b C d E F G h Nesvizhskii, Alexey I (1. listopadu 2014). „Proteogenomika: koncepty, aplikace a výpočetní strategie“. Přírodní metody. 11 (11): 1114–1125. doi:10.1038 / nmeth.3144. PMC 4392723. PMID 25357241.
- ^ A b C Sajjad, Wasim; Rafiq, Muhammad; Ali, Barkat; Hayat, Muhammad; Zada, Sahib; Sajjad, Wasim; Kumar, Tanweer (červenec 2016). „Proteogenomika: nová vznikající technologie“. HAYATI Journal of Biosciences. 23 (3): 97–100. doi:10.1016 / j.hjb.2016.11.002.
- ^ A b Gupta N., Tanner S., Jaitly N., Adkins J.N., Lipton M., Edwards R., Romine M., Osterman A., Bafna V., Smith R.D. a kol. Analýza celého proteomu posttranslačních modifikací: Aplikace hmotnostní spektrometrie pro proteogenomickou anotaci. Genome Res. 2007; 17: 1362–1377.
- ^ . Ansong C., Purvine S. O., Adkins J. N., Lipton M. S., Smith R. D. (2008) Proteogenomika: potřeby a role, které musí být vyplněny proteomikou v anotaci genomu. Stručný. Funct. Genomics Proteomics 7, 50–62.
- ^ „TotalSeq eBook“. BioLegend. Citováno 23. listopadu 2020.
- ^ „Proteona uvolňuje ESCAPE ™ RNA sekvenování pro měření proteinu a RNA v jednotlivých buňkách se zaměřením na klinické otázky“. Proteona. Citováno 23. listopadu 2020.
- ^ A b Gupta N., Benhamida J., Bhargava V., Goodman D., Kain E., Kerman I., Nguyen N., Ollikainen N., Rodriguez J., Wang J. a kol. Srovnávací proteogenomika: Kombinace hmotnostní spektrometrie a srovnávací genomiky k analýze více genomů. Genome Res. 2008; 18: 1133–1142.
- ^ Gallien S., Perrodou E., Carapito C., Deshayes C., Reyrat JM, Van Dorsselaer A., Poch O., Schaeffer C., Lecompte O. (2009) Ortho-proteogenomika: vyšetřování více proteomů pomocí ortologie a nový Protokol založený na MS. Genome Res 19, 128–135.
- ^ Ansong, C .; Purvine, S.O .; Adkins, J. N .; Lipton, M. S .; Smith, R. D. (7. března 2008). „Proteogenomika: potřeby a role, které je třeba doplnit proteomikou v anotaci genomu“. Briefings in Functional Genomics and Proteomics. 7 (1): 50–62. doi:10.1093 / bfgp / eln010. PMID 18334489.
- ^ Kuchařová, Veronika; Wiker, Harald G. (prosinec 2014). „Proteogenomika v mikrobiologii: Správné odbočení na křižovatce genomiky a proteomiky“. Proteomika. 14 (23–24): 2360–2675. doi:10.1002 / pmic.201400168. hdl:1956/9547. PMID 25263021.
- ^ A b Shukla, Hem D .; Mahmood, Javed; Vujaskovic, Zeljko (prosinec 2015). „Integrovaný proteogenomický přístup pro včasnou diagnostiku a prognózu rakoviny“. Dopisy o rakovině. 369 (1): 28–36. doi:10.1016 / j.canlet.2015.08.003. PMID 26276717.
- ^ Chambers, Matthew C .; Jagtap, Pratik D .; Johnson, James E .; McGowan, Thomas; Kumar, Praveen; Onsongo, Getiria; Guerrero, Candace R .; Barsnes, Harald; Vaudel, Marc (01.11.2017). „Přístupný zdroj proteogenomiky a informatiky pro výzkumníky rakoviny“. Výzkum rakoviny. 77 (21): e43 – e46. doi:10.1158 / 0008-5472.can-17-0331. PMC 5675041. PMID 29092937.
- ^ Creech, Amanda L .; Ting, Ying S .; Goulding, Scott P .; Sauld, John FK; Barthelme, Dominik; Rooney, Michael S .; Addona, Terri A .; Abelin, Jennifer G. (2018). „Role hmotnostní spektrometrie a proteogenomiky při vývoji predikce HLA epitopu“. Proteomika. 18 (12): n / a. doi:10.1002 / pmic.201700259. ISSN 1615-9861. PMC 6033110. PMID 29314742.