Datový formát hmotnostní spektrometrie - Mass spectrometry data format
Hmotnostní spektrometrie je vědecká technika pro měření poměru hmoty k náboji iontů. To je často spojeno s chromatografickými technikami, jako je plyn- nebo kapalinová chromatografie a našel široké přijetí v oblastech analytická chemie a biochemie kde jej lze použít k identifikaci a charakterizaci malé molekuly a bílkoviny (proteomika ). Velký objem dat produkovaných v typickém experimentu s hmotnostní spektrometrií vyžaduje, aby pro ukládání a zpracování dat byly použity počítače. V průběhu let vyvinuli různí výrobci hmotnostních spektrometrů různé vlastní datové formáty pro manipulaci s takovými daty, což akademickým vědcům ztěžuje přímou manipulaci s jejich daty. K řešení tohoto omezení několik otevřeno, XML - datové formáty založené na datech byly nedávno vyvinuty Transproteomický plynovod na Ústav pro systémovou biologii usnadnit manipulaci s daty a inovace ve veřejném sektoru. Tyto formáty dat jsou popsány zde.
Otevřené formáty
JCAMP-DX
Tento formát byl jedním z prvních pokusů o poskytnutí standardizovaného formátu souborů pro výměnu dat v hmotnostní spektrometrii. JCAMP -DX byl původně vyvinut pro infračervenou spektrometrii. JCAMP-DX je ASCII založený formát, a proto není příliš kompaktní, i když obsahuje standardy pro kompresi souborů. JCAMP byl oficiálně vydán v roce 1988.[1] JCAMP byl shledán nepraktickým pro dnešní velké datové sady MS, ale stále se používá pro výměnu mírného počtu spekter. IUPAC[2] je v současné době odpovědný a nejnovější protokol je z roku 2005.[3]
ANDI-MS nebo netCDF
Formát pro výměnu analytických dat pro hmotnostní spektrometrii je formát pro výměnu dat. Mnoho softwarových balíků hmotnostní spektrometrie umí číst nebo zapisovat soubory ANDI. ANDI je specifikováno v normě ASTM E1947.[4] ANDI je založeno na netCDF což je knihovna softwarových nástrojů pro zápis a čtení datových souborů. ANDI byl původně vyvinut pro data chromatografie-MS, a proto nebyl použit v proteomika zlatá horečka, kde nové formáty založené na XML byly vyvinuty.
mzData
mzData byl prvním pokusem Iniciativa pro standardy proteomiky (PSI) z Organizace lidských proteinů (HUPO) k vytvoření standardizovaného formátu pro údaje hmotnostní spektrometrie.[5] Tento formát je nyní zastaralý a nahrazen mzML.[6]
mzXML
mzXML je XML (eXtensible Markup Language) založený společný formát souborů pro proteomika hmotnostní spektrometrická data.[7][8] Tento formát byl vyvinut v Seattle Proteome Center / Institute for Systems Biology, zatímco HUPO-PSI se pokoušel specifikovat standardizovaný formát mzData, a stále se používá v proteomické komunitě.
mzML
Jelikož dva formáty (mzData a mzXML) pro reprezentaci stejné informace jsou nežádoucím stavem, vyvinulo HUPO-PSI, SPC / ISB a prodejci přístrojů společné úsilí o vytvoření jednotného standardu zapůjčujícího nejlepší aspekty mzData i mzXML a zamýšlel je nahradit. Původně se jmenoval dataXML a byl oficiálně oznámen jako mzML.[9] První specifikace byla zveřejněna v červnu 2008.[10] Tento formát byl oficiálně vydán v roce 2008 Americká společnost pro hmotnostní spektrometrii Setkání a od té doby je relativně stabilní s velmi málo aktualizacemi. 1. června 2009 byl vydán mzML 1.1.0. Od roku 2013 nejsou plánovány žádné další změny.
Proprietární formáty
Níže je tabulka různých přípon formátů souborů.
Společnost Rozšíření Typ souboru Agilent
Bruker.D (složka) Datový formát Agilent MassHunter, Agilent ChemStation nebo Bruker BAF / YEP / TDF Agilent / Bruker .ANO formát dat přístroje Bruker .BAF formát dat přístroje Bruker .FID formát dat přístroje Bruker .TDF datový formát nástroje timsTOF ABI / Sciex .WIFF formát dat přístroje ABI / Sciex .t2d Formát souboru 4700 a 4800 Waters .PKL Formát seznamu vrcholů MassLynx Termo
PerkinElmer.DRSNÝ* Thermo Xcalibur
PerkinElmer TurboMassMicromass ** / Waters .RAW * (složka) Waters MassLynx Chromtech
Finnigan ***
VG.DAT Formát souboru Finnigan ITDS; Datový formát přístroje MAT95
MassLab datový formátFinnigan *** .SLEČNA Datový formát přístroje ITS40 Shimadzu .QGD Formát GCMSSolution Shimadzu .qgd formát dat přístroje Shimadzu .lcd Datový formát přístroje QQQ / QTOF Shimadzu .spc formát dat knihovny Bruker / Varian .SMS formát dat přístroje Bruker / Varian .XMS formát dat přístroje ION-TOF .itm nezpracovaná data měření ION-TOF .ita analytická data Fyzická elektronika / ULVAC-PHI .drsný* nezpracovaná data měření Fyzická elektronika / ULVAC-PHI .tdc údaje o spektru
(*) Upozorňujeme, že formáty RAW jednotlivých prodejců nejsou zaměnitelné; software z jednoho nedokáže zpracovat soubory RAW z jiného.
(**) Mikromas získal Waters v roce 1997
(***) Finnigan je divize společnosti Thermo
Software
Diváci
Existuje několik prohlížečů mzXML, mzML a mzData: MZmine,[11] PEAKS,[12] Insilicos,[13] MS-Spectre,[14] TOPPView (mzXML, mzML a mzData),[15] Prohlížeč Spectra,[16] Viz MS,[17] msInspect,[18] jmzML[19] a maskot Distiller.[20]
K dispozici je prohlížeč obrázků ITA.[21] Obrázky ITA a ITM lze analyzovat pomocí pythonové knihovny python.[22]
Převaděče
Známé převaděče pro mzData na mzXML:
- Hermes: Převaděč Java „mzData, mzXML, mzML“ do všech směrů: veřejně dostupný, běží s grafickým uživatelským rozhraním, Ústav biologie molekulárních systémů, ETH Curych[23][24]
- FileConverter: Nástroj příkazového řádku, který převádí do / z různých formátů hmotnostní spektrometrie,[25] část TOPP[26]
Známé převaděče pro mzXML:
- Ústav pro biologii systémů vede seznam zpracovatelů[27]
Známé převaděče pro mzML:
- msConvert:[28][29] Nástroj příkazového řádku převádějící do / z různých formátů hmotnostní spektrometrie. Pro uživatele systému Windows je k dispozici také grafické uživatelské rozhraní.
- Přepsat:[30] Převodník příkazového řádku Institutu pro systémovou biologii pro soubory Thermo RAW, součást TransProteomicPipeline.[31] Poslední aktualizace tohoto nástroje byla provedena v září 2009. Uživatelé jsou nyní přesměrováni vývojovým týmem TPP, aby používali software msConvert (viz výše).
- FileConverter: Nástroj příkazového řádku, který převádí do / z různých formátů hmotnostní spektrometrie,[25] část TOPP[26]
Převaděče pro proprietární formáty:
- msConvert:[28][29] Nástroj příkazového řádku převádějící do / z různých formátů hmotnostní spektrometrie včetně několika proprietárních formátů. Pro uživatele systému Windows je k dispozici také grafické uživatelské rozhraní.
- CompassXport, Bruker bezplatný nástroj generující mzXML (a nyní mzData)[Citace je zapotřebí ] soubory pro mnoho z jejich nativních formátů souborů (.baf).
- MASSTransit, software pro změnu dat mezi proprietárními formáty Palisade Corporation a distribuuje Scientific Instrument Services, Inc.[32] a PerkinElmer[33]
- Aston,[34] nativní podpora několika formátů souborů Agilent Chemstation, Agilent Masshunter a Thermo Isodat
- unfinnigan,[35] nativní podpora formátů souborů Finnigan (* .RAW)
- OpenChrom, software s otevřeným zdrojovým kódem s podporou převodu různých nativních formátů souborů
Aktuálně dostupné převaděče jsou:
Viz také
Reference
- ^ R.S. McDonald a P.A. Wilks; "JCAMP-DX: Standardní formulář pro výměnu infračerveného spektra v počítačem čitelné formě"; Applied Spectroscopy, sv. 42, č. 1, leden 1988, str. 151-162.
- ^ Podvýbor IUPAC CPEP pro standardy elektronických dat
- ^ JCAMP-DX V.6.00 pro CHROMATOGRAFICKÉ A HROMADNÉ SPEKTROMETRICKÉ HYPHENATOVANÉ METODY (Technická poznámka IUPAC 2005); J. Hau, P. Lampen, R.J. Lancashire, R.S. McDonald, P.S. McIntyre, D.N. Rutledge, W. Schrader, A.N. Davies
- ^ ASTM E1947 - 98 (2009) Standard Specification for Analytical Data Interchange Protocol for Chromatographic Data
- ^ Orchard S, Montechi-Palazzi L, Deutsch EW, Binz PA, Jones AR, Paton N, Pizarro A, Creasy DM, Wojcik J, Hermjakob H (2007). „Pět let pokroku ve Standardizaci údajů o proteomice 4. (th) Annual Spring Workshop of the HUPO-Proteomics Standards Initiative 23. – 25. Dubna 2007 Ecole Nationale Supérieure (ENS), Lyon, Francie“. Proteomika. 7 (19): 3436–40. doi:10.1002 / pmic.200700658. PMID 17907277. S2CID 22837325.
- ^ „mzData“. HUPO-PSI. Citováno 19. dubna 2013.
- ^ Pedrioli PG, Eng JK, Hubley R, Vogelzang M, Deutsch EW, Raught B, Pratt B, Nilsson E, Angeletti RH, Apweiler R, Cheung K, Costello CE, Hermjakob H, Huang S, Julian RK, Kapp E, McComb ME , Oliver SG, Omenn G, Paton NW, Simpson R, Smith R, Taylor CF, Zhu W, Aebersold R (2004). "Běžná otevřená reprezentace dat hmotnostní spektrometrie a jejich aplikace na proteomický výzkum". Nat. Biotechnol. 22 (11): 1459–66. doi:10.1038 / nbt1031. PMID 15529173. S2CID 25734712.
- ^ Lin SM, Zhu L, Winter AQ, Sasinowski M, Kibbe WA (2005). "K čemu je mzXML dobrý?". Odborná recenze proteomiky. 2 (6): 839–45. doi:10.1586/14789450.2.6.839. PMID 16307524. S2CID 24914725.
- ^ „mzML“. Iniciativa pro standardy HUPO-Proteomics. Citováno 19. dubna 2013.
- ^ Deutsch EW (2008). "mzML: Jediný sjednocující datový formát pro výstup hmotnostního spektrometru". Proteomika. 8 (14): 2776–7. doi:10.1002 / pmic.200890049. PMID 18655045. S2CID 28297899.
- ^ „Web MZmine“.
- ^ „BSI: Web PEAKS“. Bioinfor.com. Citováno 29. listopadu 2011.
- ^ „Web Insilicos“. Archivovány od originál dne 20. prosince 2014. Citováno 28. března 2020.
- ^ „Web MS-Spectre“. Ms-spectre.sourceforge.net. Citováno 29. listopadu 2011.
- ^ „Web OpenMS a TOPP“. Open-ms.sourceforge.net. Citováno 29. listopadu 2011.
- ^ „Prohlížeč open source vyvinutý v rámci akademických projektů“. Staff.icar.cnr.it. Citováno 29. listopadu 2011.
- ^ „Prohlížeč open source vyvinutý Mattem Chambersem ve Vanderbiltu“. Proteowizard.sourceforge.net. Citováno 29. listopadu 2011.
- ^ „Prohlížeč open source vyvinutý v Cancer Center Freda Hutchinsona“. Proteomics.fhcrc.org. Citováno 29. listopadu 2011.
- ^ „jmzML“. Citováno 29. listopadu 2011.
- ^ Matrix Science Limited. „Komerční software s režimem bezplatného prohlížeče pro mzXML a mnoho proprietárních formátů“. Matrixscience.com. Citováno 29. listopadu 2011.
- ^ „ITAviewer online“.
„ITAviewer source“. - ^ „web pySPM“.
- ^ Hermes Archivováno 3. Března 2016 v Wayback Machine
- ^ „Web Hermes“. Icecoffee.ch. Citováno 29. listopadu 2011.
- ^ A b "FileConverter". Open-ms.sourceforge.net. Citováno 29. listopadu 2011.
- ^ A b TOPP Archivováno 15. Dubna 2008 v Wayback Machine
- ^ „mzXML“. Citováno 30. června 2008.
- ^ A b "msconvert". ProteoWizard. Citováno 20. dubna 2013.
- ^ A b "ProteoWizard". Citováno 20. dubna 2013.
- ^ „ReAdW“. Tools.proteomecenter.org. Citováno 29. listopadu 2011.
- ^ „TransProteomicPipeline“. Tools.proteomecenter.org. 25. května 2011. Citováno 29. listopadu 2011.
- ^ [1] Archivováno 9. Května 2008 v Wayback Machine
- ^ „Plynová chromatografie (GC)“. PerkinElmer. Citováno 29. listopadu 2011.
- ^ aston - Open source software pro chromatografii a hmotnostní spektrometrii - Google Project Hosting
- ^ unfinnigan - Bezbolestná extrakce hmotnostních spekter z "surových" souborů Thermo - Hosting projektu Google
- ^ wiff2dta ve sourceforge