NEC SX-Aurora TSUBASA - NEC SX-Aurora TSUBASA

The NEC SX-Aurora TSUBASA je vektorový procesor z Architektura NEC SX rodina.[1][2] Na rozdíl od předchozích superpočítačů SX je SX-Aurora TSUBASA poskytována jako karta PCIe, kterou NEC označuje jako „Vector Engine“ (VE).[2] Osm karet VE lze vložit do vektorového hostitele (VH), který je obvykle a x86-64 server s operačním systémem Linux.[2] Produkt byl oznámen v tiskové zprávě 25. října 2017 a společnost NEC jej začala prodávat v únoru 2018.[3] Produkt je nástupcem SX-ACE.
Hardware
SX-Aurora TSUBASA je jeho nástupcem NEC SX série a SUPER-UX, což jsou vektorové počítačové systémy, na nichž Earth Simulator superpočítač je založen. Jeho hardware se skládá z x86 Linux hostitelé s vektorovými motory (VE) připojenými přes PCI Express Propojení (PCIe).[4]
Velká šířka pásma paměti (0,75–1,2 TB / s) pochází z osmi jader a šesti HBM2 paměťové moduly na křemíkovém interposeru implementované ve tvaru karty PCIe.[5] Funkčnost operačního systému pro VE je přenesena na VH a zpracována hlavně démony uživatelského prostoru se spuštěním VEOS.[6]
V závislosti na frekvenci hodin (1,4 nebo 1,6 GHz), každý VE procesor má osm jader a špičkový výkon 2,15 nebo 2,45TFLOPS ve dvojité přesnosti. Procesor má jako první na světě implementaci šesti modulů HBM2 na interpolátoru Silicon s celkem 24 nebo 48 GB paměti s velkou šířkou pásma. Je integrován do podoby standardní karty PCIe s plnou délkou, plnou výškou a dvojnásobnou šířkou, která je hostována serverem x86_64, vektorovým hostitelem (VH). Server může hostovat až osm VE, klastry VH se mohou škálovat na libovolný počet uzlů.[1][7][2]
Vydání produktu
Verze 2 Vector Engine[8]
SKU | 20A | 20B |
---|---|---|
Rychlost hodin (v Ghz) | 1.6 | 1.6 |
Počet jader | 10 | 8 |
Špičkový výkon jádra (GFLOPS s dvojitou přesností) | 307 | 307 |
Špičkový výkon jádra (GFLOPS s jednou přesností) | 614 | 614 |
Špičkový výkon CPU (TFLOPS s dvojitou přesností) | 3.07 | 2.45 |
Špičkový výkon CPU (jednoduchá přesnost TFLOPS) | 6.14 | 4.91 |
Šířka pásma paměti (TB / s) | 1.53 | 1.53 |
Kapacita paměti (GB) | 48 | 48 |
Verze 1 Vector Engine
Verze 1.0 Vector Engine byla vyrobena v 16 nm FinFET proces (od TSMC ) a vydané ve třech SKU (následující verze na konci přidávají E):[9]
SKU | 10A | 10B | 10C | 10AE | 10BE | 10CE |
---|---|---|---|---|---|---|
Rychlost hodin (v Ghz) | 1.6 | 1.4 | 1.4 | 1.584 | 1.408 | 1.400 |
Počet jader | 8 | 8 | 8 | 8 | 8 | 8 |
Špičkový výkon jádra (GFLOPS s dvojitou přesností) | 307.2 | 268.8 | 268.8 | 304 | 270 | 268 |
Špičkový výkon jádra (GFLOPS s jednou přesností) | 537 | 608 | 540 | 537 | ||
Špičkový výkon CPU (TFLOPS s dvojitou přesností) | 2.45 | 2.15 | 2.15 | 2.43 | 2.16 | 2.15 |
Špičkový výkon CPU (jednoduchá přesnost TFLOPS) | 4.9 | 4.3 | 4.3 | 4.86 | 4.32 | 4.30 |
Šířka pásma paměti (TB / s) | 1.2 | 1.2 | 0.75 | 1.35 | 1.35 | 1.00 |
Kapacita paměti (GB) | 48 | 48 | 24 | 48 | 48 | 24 |
Funkční jednotky
Každé z osmi jader SX-Aurora má 64 logických vektorových registrů.[10] Ty mají 256 x 64 bitů délky implementované jako kombinace potrubí a 32násobných paralelních jednotek SIMD. Registry jsou připojeny ke třem FMA s plovoucí desetinnou čárkou, násobení a přidávání jednotek, které mohou běžet paralelně, stejně jako ke dvěma aritmetickým logickým jednotkám ALU zpracovávajícím operace s pevnou řádovou čárkou a potrubí dělení a odmocniny.[10] Vzhledem k pouze jednotkám FMA a jejich 32násobnému paralelismu SIMD je vektorové jádro schopné 192 operací s dvojitou přesností na cyklus.[10] V „zabalených“ vektorových operacích, kde jsou dvě jednoduché hodnoty přesnosti načteny do prostoru jednoho slotu s dvojitou přesností ve vektorových registrech, přináší vektorová jednotka dvakrát tolik operací za taktovací cyklus ve srovnání s dvojnásobnou přesností.
Jednotka skalárního zpracování (SPU) zpracovává ne-vektorové instrukce na každém z jader.
Paměť a mezipaměti
Paměť procesoru SX-Aurora TSUBASA se skládá ze šesti HBM2 paměťové moduly s velkou šířkou pásma druhé generace implementované ve stejném balíčku jako CPU pomocí technologie Chip-on-Wafer-on-Substrate. V závislosti na modelu procesoru jsou moduly HBM2 buď 4 nebo 8 die 3D modulů, každý s kapacitou 4 nebo 8 GB. CPU SX-Aurora tedy mají buď 24GB nebo 48GB HBM2 paměť. Modely implementované s velkými moduly HBM2 mají šířku pásma paměti 1,2 TB / s.[11]
Jádra vektorového motoru sdílejí 16 MB „Last-Level-Cache“ (LLC), mezipaměť pro zpětný zápis přímo připojenou k vektorovým registrům a mezipaměť L2 SPU. Velikost řádku mezipaměti LLC je 128 bajtů. Prioritu uchovávání dat v LLC lze do určité míry řídit pomocí softwaru, což umožňuje programátorovi určit, které z proměnných nebo polí by měly být zachovány v mezipaměti, což je funkce srovnatelná s funkcí Advanced Data Buffer (ADB) NEC SX-ACE.
Platformy
NEC v současné době prodává vektorový engine SX-Aurora TSUBASA integrovaný do čtyř platforem:[12][9]
- A111-1: tower PC s jednou kartou VE typu 10B
- A101-1: tower PC s jednou kartou VE typu 10CE
- A311-4: duální soketový 1U 19palcový škálovatelný server Xeon s možností montáže do racku vybavený až čtyřmi kartami VE typu BE
- A311-8: duální soketový 4U 19palcový škálovatelný server Xeon pro montáž do racku s až osmi VE kartami typu BE
- A511-64: 19palcový stojan vybavený 64 VE typu AE. Toto je jediná konfigurace, která se výslovně prodává jako superpočítač.
V rámci uzlu VH mohou VE mezi sebou komunikovat prostřednictvím PCIe. Velké paralelní systémy postavené na SX-Aurora používají Infiniband v nastavení PeerDirect jako propojené.
Společnost NEC také prodávala vektorový engine SX-Aurora TSUBASA integrovaný do pěti platforem:
- A100-1: tower PC s jednou kartou VE typu 10C.
- A300-2: serverový server Skylake s možností připojení do jedné zásuvky s výškou 1U vybavený až dvěma kartami VE typu 10B nebo 10C.
- A300-4: server Skylake s možností montáže do racku se dvěma zásuvkami 1U vybavený až čtyřmi kartami VE typu 10B nebo 10C.
- A300-8: duální soketový server Skylake s možností připojení do racku 4U s až osmi kartami VE typu 10B nebo 10C.
- A500-64: stojan vybavený buď procesory řady Intel Xeon Silver 4100 nebo Intel Xeon Gold 6100 a 32, 48 nebo 64 VE typu 10A nebo 10B.[13]
Všechny typy jsou chlazeny výhradně vzduchem, s výjimkou řady A500, která rovněž využívá vodní chlazení.
Software
Operační systém
Operační systém vektorového motoru (VE) se nazývá „VEOS“ a byl zcela přenesen do hostitelského systému, vektorového hostitele (VH).[14] VEOS se skládá z modulů jádra a démonů uživatelského prostoru, které:
- spravovat procesy VE a jejich plánování na VE
- spravovat adresní prostory virtuální paměti procesů VE
- zpracovávat převody mezi pamětí VH a VE pomocí motorů VE DMA
- zpracovávat přerušení a výjimky z procesů VE, stejně jako jejich systémová volání.[15]
VEOS podporuje multitasking na VE a téměř všechna volání systému Linux jsou podporována ve VE libc.[16] Vykládání služeb operačního systému do VH přesouvá jitter OS od VE na úkor zvýšených latencí.[17] Všechny balíky související s operačním systémem VE jsou licencovány pod licencí GNU General Public License a byly zveřejněny na github
Zdá se, že NEC později opustil VEOS ve prospěch Red Hat Enterprise Linux nebo CentOS.
Vývoj softwaru
Software Development Kit je k dispozici od NEC pro vývojáře a zákazníky. Obsahuje proprietární produkty a musí být zakoupen od NEC. Sada SDK obsahuje:
- Překladače C, C ++ a Fortran, které podporují automatickou vektorizaci a automatickou paralelizaci i OpenMP.[18]
- Nástroje pro optimalizaci výkonu: ftraceviewer a veperf.[19]
- Optimalizované číselné knihovny pro VE: BLAS, SBLAS, LAPACK, SCALAPACK, ASL, Heterosolver.[20]
NEC MPI je také patentovanou implementací a odpovídá specifikaci standardu MPI-3.1.[21]
Lze vytvořit hybridní programy, které používají VE jako akcelerátor pro určité funkce hostitelského jádra pomocí VE vykládání C-API.[22] Vykládání VE je do určité míry srovnatelné s OpenCL a CUDA, ale poskytuje jednodušší API a umožňuje vývoj jader v normálním C, C ++ nebo Fortranu a použití téměř jakéhokoli syscall na VE.[Citace je zapotřebí ] Vazby Pythonu na VEO jsou k dispozici na github
Reference
- ^ A b „NEC SX-Aurora TSUBASA - vektorový motor“. www.nec.com. Citováno 2018-03-20.
- ^ A b C d Morgan, Timothy Prickett (27. října 2017). „Lze oživit vektorový superpočítač?“. Další platforma.
- ^ „NEC uvádí novou špičkovou produktovou řadu HPC, SX-Aurora TSUBASA“. NEC. Citováno 2018-03-21.
- ^ Imai, Teruyuki (2019), Gerofi, Balazs; Ishikawa, Yutaka; Riesen, Rolf; Wisniewski, Robert W. (eds.), „NEC Earth Simulator and the SX-Aurora TSUBASA“, Operační systémy pro superpočítače a vysoce výkonné počítače, High-Performance Computing Series, Singapore: Springer, 1, s. 139–160, doi:10.1007/978-981-13-6624-6_9, ISBN 978-981-13-6624-6
- ^ Morgan, Timothy Prickett (22. 11. 2017). „Deep Dive Into NEC's Aurora Vector Engine“. Další platforma. Citováno 2020-07-02.
- ^ Focht, Erich. „První kroky s vektorovým motorem SX-Aurora TSUBASA“. sx-aurora.github.io. Citováno 2020-07-02.
- ^ Brožura SX-Aurora TSUBASA
- ^ „Modely vektorových motorů NEC“. www.nec.com. Citováno 15. září 2020.
- ^ A b https://www.nec.com/en/global/solutions/hpc/sx/docs/SX-Aurora_eng_202002.pdf
- ^ A b C „Architektura NEC SX-Aurora TSUBASA“. www.nec.com. Citováno 2018-03-20.
- ^ „SX-Aurora - Microarchitectures - NEC - WikiChip“. en.wikichip.org. Citováno 2020-07-02.
- ^ https://www.nec.com/en/global/solutions/hpc/sx/index.html ?
- ^ „NEC SX-Aurora TSUBASA A500-64“. www.nec.com.
- ^ „NEC SX Aurora TSUBASA - dokumentace VSC 1.0 dokumentace“. vlaams-supercomputing-centrum-vscdocumentation.readthedocs-hosted.com. Citováno 2020-07-02.
- ^ „Pohled na nejnovější vektorový procesor NEC, SX-Aurora“. Pojistka WikiChip. 2018-12-09. Citováno 2020-08-27.
- ^ „Pohled na nejnovější vektorový procesor NEC, SX-Aurora“. Pojistka WikiChip. 2018-12-09. Citováno 2020-08-27.
- ^ „Pohled na nejnovější vektorový procesor NEC, SX-Aurora“. Pojistka WikiChip. 2018-12-09. Citováno 2020-08-27.
- ^ „NEC SX Aurora TSUBASA - dokumentace VSC 1.0 dokumentace“. vlaams-supercomputing-centrum-vscdocumentation.readthedocs-hosted.com. Citováno 2020-08-27.
- ^ „Dokumentace NEC SX-Aurora TSUBASA“.
- ^ „Vektorový systém NEC SX-Aurora TSUBASA“. Rechenzentrum der CAU. Citováno 2020-08-27.
- ^ „Uživatelská příručka NEC MPI“.
- ^ „SX-Aurora / veoffload“. GitHub. Citováno 2018-03-21.
externí odkazy
- Novinky a články, pro SX-Aurora Vector Engine.
- Fórum NEC Aurora
- Webové fórum NEC Aurora
- NEC Aurora VEOS
- Školení vektorizace NEC Aurora
- Sbírka nástrojů a projektů