Cíl (projekt) - Target (project)

cílová
UmístěníUniversity of Groningen, Nizozemsko
ZaloženoLeden 2009
FinancováníFinancováno Evropský fond pro regionální rozvoj & partneři
webová stránkakoberec.nl/cílová

cílová je název společného výzkumného projektu velká data zpracování a správa v severním Nizozemsku.[1] Jedná se o spolupráci veřejného a soukromého sektoru zahájenou v roce 2009 a podporovanou vládními dotacemi.[2] Provozuje ho konsorcium deseti akademických a počítačových partnerů v koordinaci s University of Groningen a zkoumá správu dat vědeckých projektů v oblasti astronomie, biologických věd, umělé inteligence a lékařské diagnostiky.

Na projektu Target spolupracují různé divize University of Groningen zdravotní středisko, IBM, Věštec, ASTRON a nizozemské IT firmy Elkoog /Heeii a Nspyre.

Počítačové centrum Target je hostitelem Centra pro informační technologie, výpočetního centra University of Groningen, a skládá se z více než 10 petabajtů úložiště[3][4] na základě IBM je GPFS technologie skladování,[5] A vysoce výkonné výpočty shluk a seskupení mřížky, která je součástí Evropská síťová infrastruktura.

Datové centrum Target je hostitelem Centra informačních technologií Donalda Smitsa, které se nachází v University of Groningen, Nizozemí

Dějiny

Projekt byl zahájen s cílem přenést odborné znalosti astronomů v masivním zpracování dat do dalších oblastí vědy. Target staví na distribuovaném výpočetním prostředí zvaném Astro-WISE.[6][7] Samotný Astro-WISE vznikl jako iniciativa pracovní skupiny OPTICON Wide Field Imaging Working Group, která byla zřízena za účelem zvážení standardizovaného evropského systému průzkumu s cílem usnadnit výzkum, redukci dat a těžbu dat pomocí dat z nové generace širokoúhlých kamer [8] Projekt Target byl zahájen v roce 2009 po obdržení 32 milionů eur[9] financování na období pěti let od Evropský fond pro regionální rozvoj, nizozemské ministerstvo hospodářství (projekt „Pieken in de Delta“) a provincie Groningen a Drenthe. Projekt probíhá pod záštitou Aliance provincií Severní Nizozemsko (SNN) a obce Groningen.

Technologické poznatky

Na začátku projektu bylo jedním cílem vyvinout jednotný integrovaný systém zpracování, který se skládá ze souborového systému s více petabajty měřítka[10] a několik různých typů klastrů mřížky a výpočtu.[11] Během prvních let vyšlo najevo, že požadavky na různé e-věda disciplíny jsou různé. V některých oblastech, stejně jako v, probíhá obrovské úsilí o streamování dat Lofar. V astronomii může počet datových objektů běžet v miliardách s omezeným počtem datových sloupců.[12] v genomika, počet řádků je malý, ale počet sloupců může být obrovský, v řádu stovek tisíc. Jiné oblasti, jako je vizuální vyhledávání textu ve vyhledávači Monk pro historické rukopisy, jsou na mezilehlé pozici se stovkami milionů řádků a tisíci dimenzí. Genomické aplikace navíc často vyžadují přísnou kontrolu přístupu,[13] zatímco jiné disciplíny nemají problémy s ochranou soukromí. V důsledku toho různé dílčí projekty v rámci Target přijaly pragmatický přístup k tomu, které aspekty technologie WISE a komponenty hardwarové infrastruktury Target byly použitelné pro jejich obor.

Projekty

Target se účastní řady datově náročných vědeckých projektů v astronomii, Velká data vizualizace (spolupráce s centrem eScience v Amsterdamu),[14] ručně psané rozpoznávání textu algoritmy, lékařský výzkum zdravého stárnutí, vývoj diagnostických nástrojů pro Parkinsonovu chorobu a další.

LOFAR Dlouhodobý archiv

Target vyvinul a udržuje LOFAR Dlouhodobý archiv.

Hodně z údajů z LOFAR dalekohled je uložen, zpřístupněn a archivován v dlouhodobém archivu LOFAR, který navrhl ASTRON a cíl.[15][16][17] Data budou hostována v datovém centru Target a několika dalších evropských centrech.

Mnich

Screenshot ze stránky z archivu kabinetu nizozemské královny (KdK), na které Monk našel slovo Groningen.

Monk je systém vyvinutý prof. Schomaker a jeho skupina v Institutu umělé inteligence (ALICE) při University of Groningen. Využívá algoritmy rozpoznávání vzorů a strojového učení pro rozpoznávání ručně psaného textu v různých existujících archivech.[18][19][20] V současné době je do mnicha pohlceno několik knih z nizozemského národního archivu a více než 70 mezinárodních historických sbírek, od západních, středověkých až po ručně psané čínské rukopisy. Systémy používají nepřetržité (24/7) strojové učení přes internet, což přináší zásadní výsledky.[vágní ][21] Systém MONK využívá výpočetní a úložný prostředek Target. Nedávno se stala součástí spolupráce, kterou vedl prof. Popovic z Katedry teologie a religionistiky na Vysoké škole ekonomické v Praze University of Groningen kteří se pokusí určit autory populárních kombinací datování uhlíku, paleografie a technik rozpoznávání textu / obrázků Svitky od Mrtvého moře rukopisy.[22]

LifeLines

LifeLines je dlouhodobý lékařský výzkumný projekt, který provozuje University Medical Center Groningen (UMCG). Řada údajů o genotypu a fenotypu bude shromážděna od 165 000 lidí jednou za pět let po celkovou dobu třiceti let. Shromážděná data použijí vědci a lékaři k získání přehledu o procesech souvisejících se stárnutím a pochopení toho, proč se zhoršování zdraví související s věkem tak výrazně liší.[23] Target poskytuje LifeLines infrastrukturu pro ukládání, přístup a zpracování dat. Data z LifeLines, stejně jako SURFsara a cílová infrastruktura byly použity v projektu nizozemského genomu, provozovaného konsorciem EU UMCG, LUMC, Erasmus MC, UMCU, Svobodná univerzita v Amsterdamu. Výsledky projektu využívajícího sekvenování celého genomu k odvození struktury populace a demografické historie holandské populace byly zveřejněny v červnu v Genetika přírody časopis.[24][25]

OKRUHY

Vedl Dr. K Leenders, profesor neurologie na UMCG GLIMPS je výzkumný projekt, jehož cílem je najít rychlejší a spolehlivější diagnostické nástroje pro Parkinsonovu chorobu.[26] GLIMPS zkoumá možnosti použití složitých algoritmů založených na obrazech a PET skenů pro včasnou detekci Parkinsonovy choroby.[Citace je zapotřebí ] Aby bylo možné otestovat účinnost těchto algoritmů, společnost GLIMPS staví rozsáhlou databázi PET skenů dodávaných četnými nemocnicemi v Nizozemsku. Target je zodpovědný za budování a údržbu databáze GLIMPS a také za zajištění hladkého chodu algoritmů založených na obrazech na jejích výpočetních zařízeních.

Ostatní

Target se navíc podílí na správě dat pro další astronomické projekty, jako je astronomický průzkum KiDs / VIKING[27][28] pomocí OmegaCAM,[29][30] the ESO MÚZA[31] nástroj (namontovaný na Velmi velký dalekohled ) a MICADO (k připevnění na E-ELT ). Kromě toho přijal datacentrický přístup ke správě dat vyzvaný společností Target ESA Euklidova mise.[32] Spin-off společnost Target Holding B.V. projektu rovněž spravuje řadu komerčních projektů se soukromými podniky na severu Nizozemska.[33]

Součástí působnosti projektu je také veřejný dosah a vzdělávání a společnost Target uspořádala mnoho veřejných akcí.[34] 3D divadlo Infoversum[35][36] je spin-off projektu Target a poskytuje zařízení pro vizualizaci a vysvětlení vědeckých údajů pro velké skupiny.

Reference

  1. ^ „Nederlands project kan 1,5 petabytes verwerken en opslaan“ [Nizozemský projekt dokáže zpracovat a ušetřit 1,5 petabajtu]. nu.nl (v holandštině). 2. září 2010.
  2. ^ Edelman, Pieter (2. června 2009). „Miljoenensubsidie ​​voor Noord-Nederlands dataminingprogramma“ [Miliony dotací pro dataminingový program pro Severní Nizozemsko]. Bity a čipy.
  3. ^ Witold, Kepinski (19. listopadu 2010). „Gronings ICT-project klaar voor petabytes data“ [Groningen ICT projekt připraven na petabajty dat]. Vypočitatelný (v holandštině).
  4. ^ Huisman, Zander (27. května 2011). „Aprycus breidt capaciteit Target-project uit“ [Aprycus zvyšuje kapacitu projektu Target]. Vypočitatelný (v holandštině).
  5. ^ Případové studie IBM, představení příběhů klientů IBM. „University of Groningen otevírá novou cestu ve vědeckém výzkumu“. www-03.ibm.com/software/businesscasestudies/us/en/corp?OpenDocument&Site=corp&cty=en_us.
  6. ^ Begeman, Kor; A.N. Belikov; D.R. Boxhoorn; EA Valentijn (leden 2013). „Informační systém Astro-WISE zaměřený na data“. Experimentální astronomie. 35 (1–2): 1. arXiv:1208.0447. Bibcode:2013ExA .... 35 ... 1B. doi:10.1007 / s10686-012-9311-4.
  7. ^ Mwebaze, Johnson (2012). Extrémní datová linie v ad-hoc zpracování astronomických dat (PhD). University of Groningen. ISBN  9789036757591.
  8. ^ Gilmore, Gerald (leden 2001). „OPTICON: EC optická infračervená koordinační síť pro astronomii“. Organizace a strategie v astronomii. Knihovna astrofyziky a vesmíru. 2: 83–102. arXiv:astro-ph / 0105562. doi:10.1007/978-94-010-0666-8_6. ISBN  978-0-7923-7172-4.
  9. ^ Edelman, Peter (20. července 2009). „Miljoenensubsidie ​​voor Noord Nederland Dataminingprogram“ [Miliony dotací na severo-nizozemský dataminingový program]. Bity a čipy (v holandštině). p. 45.
  10. ^ Jain, R; Sarkar, P .; Subhraveti, D. (2013), „GPFS-SNC: Souborový systém podnikového klastru pro velká data“, IBM Journal of Research and Development, 57 (3/4): 5:1, 5:10, doi:10.1147 / JRD.2013.2243531
  11. ^ Begeman, Kor; Begeman, K. G .; Belikov, A. N .; Boxhoorn, D. R .; Dijkstra, F .; Valentijn, E. A .; Vriend, W. J .; Zhao, Z. (2010), „Merging grid technologies“, Journal of Grid Computing, 8 (2): 199–221, doi:10.1007 / s10723-010-9147-r
  12. ^ Luri, X .; Palmer, M .; Arenou, F .; Masana, E .; De Bruijne, J .; Antiche, E .; Babusiaux, C .; Borrachero, R .; Sartoretti, P .; Julbe, F .; Isasi, Y .; Martinez, O .; Robin, A. C .; Reylé, C .; Jordi, C .; Carrasco, J. M. (2014). "Přehled a hvězdné statistiky očekávaného." Gaia Katalog za použití Gaia Objekt Generátor". Astronomie a astrofyzika. 566: A119. arXiv:1404.5861. Bibcode:2014A & A ... 566A.119L. doi:10.1051/0004-6361/201423636.
  13. ^ Malin, B .; Loukides, G .; Benitez, K .; Clayton, E. W. (2011). „Identifikovatelnost v biobankách: modely, opatření a strategie zmírňování“. Genetika člověka. 130 (3): 383–392. doi:10.1007 / s00439-011-1042-5. PMC  3621020. PMID  21739176.
  14. ^ „Projekty centra eScience“. esciencecenter.nl.
  15. ^ Belikov, A.N; Begeman, K .; Boxhoorn, D.R .; Dijkstra, F .; Holties, H .; Meyer-Zhao, Z .; Renting, G.A .; Valentijn, E.A.; Vriend, W-J. (2011). "Informační systém LOFAR". Proc. Of ADASS XXI, ASP Conf. Série. arXiv:1111.6443. Bibcode:2012ASPC..461..693B.
  16. ^ Begeman, K .; Boxhoorn, D .; Dijkstra, F .; Holties, H.A .; Vriend, W.-J (2011). "Cíl dlouhodobého archivu LOFAR: architektura a implementace". Počítačové systémy budoucí generace. 27 (3): 319–328. doi:10.1016 / j.future.2010.08.010.
  17. ^ Holties, HA; van Diepen, G .; et al. (2012). „Analýza dat v dlouhodobém archivu LOFAR“. Série konferencí ASP. 461, Astronomical Data Analysis Software and Systems XXI: 536.
  18. ^ van der Zant, T; Schomaker, L.R.B .; Zinger, S .; van Schie, H. (2009). "Kde jsou vyhledávače pro ručně psané dokumenty?". Interdisciplinární vědecké recenze. 34 (2–3): 224–235. doi:10.1179 / 174327909X441126.
  19. ^ van der Zant, T; Schomaker, L.R.B .; Valentijn, E .; B.A. Yanikoglu; K. Berkner (28. ledna 2008). Yanikoglu, Berrin A; Berkner, Kathrin (eds.). Msgstr "Velké paralelní zpracování dokumentu a obrazu". Sborník z rozpoznávání a získávání dokumentů XV, IS & T / SPIE Mezinárodní sympozium o elektronickém zobrazování. Rozpoznávání a načítání dokumentů XV. 6815: 68150N. doi:10.1117/12.765482.
  20. ^ Schomaker, L.R.B .; B.A. Yanikoglu; K. Berkner (28. ledna 2008). "Word mining in a sparly-labeled handwritten collection". Sborník z rozpoznávání a získávání dokumentů XV, IS & T / SPIE Mezinárodní sympozium o elektronickém zobrazování: 6815–6823.van der Zant, T; Schomaker, L.R.B .; Haak, K. (2008). "Ručně psané slovo s využitím biologicky inspirovaných funkcí". Transakce IEEE na analýze vzorů a strojové inteligenci. 30 (11): 1945–1957. doi:10.1109 / tpami.2008.144. PMID  18787243.
  21. ^ van Oosten, J.-P .; Schomaker, L.R.B. (2014). „Oddělitelnost versus prototypnost při ručně psaném načítání slov a obrázků“ (PDF). Rozpoznávání vzorů. 47 (3): 1031–1038. doi:10.1016 / j.patcog.2013.09.006. hdl:11370 / ca3dd93d-fbd9-4ae3-bfac-90bb148ea1dd.
  22. ^ Novinky RUG. „Prestižní počáteční grant ERC pro Mladena Popoviće“. Rijksuniversiteit Groningen. Citováno 19. ledna 2015.
  23. ^ Stolk, Ronald P; Rosmalen JG; Postma DS; de Boer RA; Navis G; Desky JP; Ormel J; Wolffenbuttel BH (leden 2008). „Univerzální rizikové faktory pro multifaktoriální nemoci: LifeLines: třígenerační populační studie“. European Journal of Epidemiology. 23 (1): 67–74. doi:10.1007 / s10654-007-9204-4. PMID  18075776.
  24. ^ Francioli, Laurent; Menelaou, Androniki; et al. (29. června 2014). „Variace sekvence celého genomu, struktura populace a demografická historie holandské populace“. Genetika přírody. 46 (8): 818–825. doi:10.1038 / ng.3021. PMID  24974849.
  25. ^ van Wijngaarden, Arend (30. června 2014). "Genoom Nederlandse volk ontrafeld". Dagblad van het Noorden.
  26. ^ Teune, Laura Klaaske (2013). Metabolické vzorce glukózy u neurodegenerativních onemocnění mozku. Disertační práce.
  27. ^ Jong, J.T .; J.T. de Jong; G.A.V. Kleijn; K.H. Kuijken; E.A. Valentijn (2013). „Kilometrový průzkum“. Experimentální astronomie. 35 (1–2): 25–44. arXiv:1206.1254. Bibcode:2013ExA .... 35 ... 25D. doi:10.1007 / s10686-012-9306-1.
  28. ^ Nizozemsko, Výzkumná škola pro astronomii (NOVA). „Výroční zpráva NOVA 2011–2011–2012“ (PDF). nova-astronomie. NOVA.
  29. ^ Schilling, Govert (8. června 2011). „Direct Success Met Supercamera“ [Okamžitý úspěch se super kamerou]. De Volkskrant (v holandštině).
  30. ^ „Superscherpe hemelfotos vanaf Chileense berg“ [Super ostré fotografie nebes z chilské hory]. NRC Handelsblad (v holandštině). 9. června 2011.
  31. ^ Weilbacher, Peter; Peter M. Weilbacher; Ole Streicher; Tanya Urrutia; Aurélien Jarno; Arlette Pécontal-Rousset; Roland Bacon; Petra Böhm (září 2012). Radziwill, Nicole M; Chiozzi, Gianluca (eds.). "Návrh a možnosti softwaru a potrubí pro redukci dat MUSE". Proc. SPIE. Software a cyberinfrastruktura pro astronomii II. 8451: 84510B. doi:10.1117/12.925114.
  32. ^ Pasian, Fabio; Fabio Pasian; John Hoar; Marc Sauvage; Christophe Dabin; Maurice Poncet; Oriana Mansutti (září 2012). Radziwill, Nicole M; Chiozzi, Gianluca (eds.). „Vědecký pozemní segment pro misi ESA Euclid“. Proc. SPIE. Software a cyberinfrastruktura pro astronomii II. 8451: 845104. doi:10.1117/12.926026.
  33. ^ Huisman, Zander (31. ledna 2013). „Target-project levert vier nieuwe bedrijven op“ [Cílový projekt přináší čtyři nové společnosti]. Vypočitatelný (v holandštině).
  34. ^ Wind, Maike (12. května 2014). „Rapportage Big Data: De man met één were en vijf kinderen“ [Big Data Report: Muž s jednou nohou a pěti dětmi]. Dagblad van het Noorden (v holandštině). p. 2.
  35. ^ Wind, Maike (19. června 2014). „Theater Infoversum open voor publiek“ [Divadlo Infoversum se otevírá veřejnosti]. Groninger Gezinsbode (v holandštině). p. 19.
  36. ^ „Infoversum“. De Telegraaf (v holandštině). 4. července 2014.