Nvidia DGX - Nvidia DGX

Nvidia DGX je řada Nvidia vyráběné servery a pracovní stanice, které se specializují na používání GPGPU zrychlit hluboké učení aplikace.

DGX-1

Funkce serverů DGX-1 8 GPU založeno na Pascal nebo Volta dceřiné karty^[1] s HBM 2 paměť, spojená pomocí NVLink síťová síť.^[2]

Produktová řada je určena k překlenutí propasti mezi GPU a Urychlovače AI v tom, že zařízení má specifické funkce, které ho specializují na úlohy hlubokého učení.^[3] Počáteční DGX-1 na bázi Pascalu dodal 170 teraflops z poloviční přesnost zpracovává se,^[4] zatímco aktualizace založená na Voltě to zvýšila na 960 teraflops.^[5]

DGX-2

Nástupcem Nvidia DGX-1 je Nvidia DGX-2, která využívá 16 32GB karet V100 (druhá generace) v jedné jednotce. To zvyšuje výkon až 2 Petaflops s 512 GB sdílené paměti pro řešení větších problémů a používá NVSwitch k urychlení interní komunikace.

Kromě toho existuje výkonnější verze DGX-2, DGX-2H s výrazným rozdílem v nahrazení Dual Intel Xeon Platinum 8168 @ 2,7 GHz s Dual Intel Xeon Platinum 8174 @ 3,1 GHz^[6]

DGX A100

Dne 14. května 2020 byla ohlášena a vydána třetí generace serveru DGX, včetně 8 Ampér - urychlovače A100 na bázi.^[7] Zahrnuto je také 15 TB PCIe gen 4 NVMe úložný prostor,^[8] dva 64jádrové AMD Řím 7742 procesorů, 1 TB RAM a Mellanox - propojené HDR InfiniBand. Počáteční cena za DGX A100 byla 199 000 $.^[7]

Urychlovače

Porovnání akcelerátorů použitých v DGX:^[7]

Plynový pedál
A100
V100
P100

Architektura	FP32 CUDA jádra	Zvyšte hodiny	Paměťové hodiny	Šířka paměťové sběrnice	Šířka pásma paměti	VRAM	Single Precision	Double Precision	INT8 Tenzor	Tenzor FP16	Tenzor FP32	Propojit	GPU	Velikost matrice GPU	Počet tranzistorů	TDP	Výrobní proces
Ampér	6912	~ 1410 MHz	2,4 Gb / s HBM2	5120 bitů	1,6 TB / s	40 GB	19,5 TFLOP	9,7 TFLOP	624 TFLOP	312 TFLOP	156 TFLOP	600 GB / s	A100	826mm2	54,2B	400 W.	TSMC 7N
Volta	5120	1530 MHz	1,75 Gb / s HBM2	4096 bitů	900 GB / s	16 GB / 32 GB	15,7 TFLOP	7,8 TFLOP	N / A	125 TFLOPů	N / A	300 GB / s	GV100	815mm2	21.1B	300 W / 350 W	TSMC 12nm FFN
Pascal	3584	1480 MHz	1,4 Gb / s HBM2	4096 bitů	720 GB / s	16 GB	10,6 TFLOP	5.3 TFLOPy	N / A	N / A	N / A	160 GB / s	GP100	610 mm2	15,3B	300 W.	TSMC 16nm FinFET

Viz také

Hluboké učení Super vzorkování

Reference

^ „nvidia dgx-1“ (PDF).
^ "inside pascal". Osm GPU hybridních krychlových síťových architektur s NVLink
^ „superpočítač pro hluboké učení“.
^ „Systém hlubokého učení DGX-1“ (PDF). NVIDIA DGX-1 přináší 75x rychlejší trénink ... Poznámka: Caffe benchmark s AlexNet, trénující 1,28 miliony obrázků s 90 epochami
^ „Server DGX“. Server DGX. Nvidia. Citováno 7. září 2017.
^ https://docs.nvidia.com/dgx/pdf/dgx2-user-guide.pdf
^ ^A ^b ^C Ryan Smith (14. května 2020). „NVIDIA Ampere Unleashed: NVIDIA ohlašuje novou architekturu GPU, GPU A100 a akcelerátor“. AnandTech.
^ Tom Warren; James Vincent (14. května 2020). „První grafická karta Ampere společnosti Nvidia je navržena pro datová centra a AI, nikoli pro váš počítač“. The Verge.

Tento počítačový článek je pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to.

[1] „nvidia dgx-1“ (PDF).

[2] "inside pascal". Osm GPU hybridních krychlových síťových architektur s NVLink

[3] „superpočítač pro hluboké učení“.

[4] „Systém hlubokého učení DGX-1“ (PDF). NVIDIA DGX-1 přináší 75x rychlejší trénink ... Poznámka: Caffe benchmark s AlexNet, trénující 1,28 miliony obrázků s 90 epochami

[5] „Server DGX“. Server DGX. Nvidia. Citováno 7. září 2017.

[6] ttps://docs.nvidia.com/dgx/pdf/dgx2-user-guide.pdf

[anand-A100-7] A ^b ^C Ryan Smith (14. května 2020). „NVIDIA Ampere Unleashed: NVIDIA ohlašuje novou architekturu GPU, GPU A100 a akcelerátor“. AnandTech.

[verge-A100-8] Tom Warren; James Vincent (14. května 2020). „První grafická karta Ampere společnosti Nvidia je navržena pro datová centra a AI, nikoli pro váš počítač“. The Verge.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]