Nvidia DGX - Nvidia DGX
Nvidia DGX je řada Nvidia vyráběné servery a pracovní stanice, které se specializují na používání GPGPU zrychlit hluboké učení aplikace.
DGX-1
Funkce serverů DGX-1 8 GPU založeno na Pascal nebo Volta dceřiné karty[1] s HBM 2 paměť, spojená pomocí NVLink síťová síť.[2]
Produktová řada je určena k překlenutí propasti mezi GPU a Urychlovače AI v tom, že zařízení má specifické funkce, které ho specializují na úlohy hlubokého učení.[3] Počáteční DGX-1 na bázi Pascalu dodal 170 teraflops z poloviční přesnost zpracovává se,[4] zatímco aktualizace založená na Voltě to zvýšila na 960 teraflops.[5]
DGX-2
Nástupcem Nvidia DGX-1 je Nvidia DGX-2, která využívá 16 32GB karet V100 (druhá generace) v jedné jednotce. To zvyšuje výkon až 2 Petaflops s 512 GB sdílené paměti pro řešení větších problémů a používá NVSwitch k urychlení interní komunikace.
Kromě toho existuje výkonnější verze DGX-2, DGX-2H s výrazným rozdílem v nahrazení Dual Intel Xeon Platinum 8168 @ 2,7 GHz s Dual Intel Xeon Platinum 8174 @ 3,1 GHz[6]
DGX A100
Dne 14. května 2020 byla ohlášena a vydána třetí generace serveru DGX, včetně 8 Ampér - urychlovače A100 na bázi.[7] Zahrnuto je také 15 TB PCIe gen 4 NVMe úložný prostor,[8] dva 64jádrové AMD Řím 7742 procesorů, 1 TB RAM a Mellanox - propojené HDR InfiniBand. Počáteční cena za DGX A100 byla 199 000 $.[7]
Urychlovače
Porovnání akcelerátorů použitých v DGX:[7]
Plynový pedál |
---|
A100 |
V100 |
P100 |
Architektura | FP32 CUDA jádra | Zvyšte hodiny | Paměťové hodiny | Šířka paměťové sběrnice | Šířka pásma paměti | VRAM | Single Precision | Double Precision | INT8 Tenzor | Tenzor FP16 | Tenzor FP32 | Propojit | GPU | Velikost matrice GPU | Počet tranzistorů | TDP | Výrobní proces |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ampér | 6912 | ~ 1410 MHz | 2,4 Gb / s HBM2 | 5120 bitů | 1,6 TB / s | 40 GB | 19,5 TFLOP | 9,7 TFLOP | 624 TFLOP | 312 TFLOP | 156 TFLOP | 600 GB / s | A100 | 826mm2 | 54,2B | 400 W. | TSMC 7N |
Volta | 5120 | 1530 MHz | 1,75 Gb / s HBM2 | 4096 bitů | 900 GB / s | 16 GB / 32 GB | 15,7 TFLOP | 7,8 TFLOP | N / A | 125 TFLOPů | N / A | 300 GB / s | GV100 | 815mm2 | 21.1B | 300 W / 350 W | TSMC 12nm FFN |
Pascal | 3584 | 1480 MHz | 1,4 Gb / s HBM2 | 4096 bitů | 720 GB / s | 16 GB | 10,6 TFLOP | 5.3 TFLOPy | N / A | N / A | N / A | 160 GB / s | GP100 | 610 mm2 | 15,3B | 300 W. | TSMC 16nm FinFET |
Viz také
Reference
- ^ „nvidia dgx-1“ (PDF).
- ^ "inside pascal".
Osm GPU hybridních krychlových síťových architektur s NVLink
- ^ „superpočítač pro hluboké učení“.
- ^ „Systém hlubokého učení DGX-1“ (PDF).
NVIDIA DGX-1 přináší 75x rychlejší trénink ... Poznámka: Caffe benchmark s AlexNet, trénující 1,28 miliony obrázků s 90 epochami
- ^ „Server DGX“. Server DGX. Nvidia. Citováno 7. září 2017.
- ^ https://docs.nvidia.com/dgx/pdf/dgx2-user-guide.pdf
- ^ A b C Ryan Smith (14. května 2020). „NVIDIA Ampere Unleashed: NVIDIA ohlašuje novou architekturu GPU, GPU A100 a akcelerátor“. AnandTech.
- ^ Tom Warren; James Vincent (14. května 2020). „První grafická karta Ampere společnosti Nvidia je navržena pro datová centra a AI, nikoli pro váš počítač“. The Verge.
![]() | Tento počítačový článek je pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |