RCUDA - RCUDA

rCUDA
VývojářiUniversitat Politecnica de Valencia
Stabilní uvolnění
20.07 / 26. července 2020; Před 4 měsíci (2020-07-26)
Operační systémLinux
TypGPGPU
webová stránkarcuda.síť

rCUDA, což znamená Vzdálená CUDA, je typ middleware softwarový rámec pro dálkové ovládání GPU virtualizace. Plně kompatibilní s CUDA aplikační programovací rozhraní (API ), umožňuje přidělení jednoho nebo více GPU s podporou CUDA jedné aplikaci. Každý GPU může být součástí a shluk nebo běží uvnitř a virtuální stroj. Přístup je zaměřen na zlepšení výkonu v klastrech GPU, které postrádají plné využití. Virtualizace GPU snižuje počet GPU potřebných v klastru a vede k nižší konfiguraci nákladů - méně energie, pořizování a údržby.

Doporučená architektura distribuované akcelerace je a vysoce výkonné výpočty cluster s GPU připojenými pouze k několika uzlům clusteru. Když uzel bez lokálního GPU spustí aplikaci, která potřebuje prostředky GPU, vzdálené spuštění jádro je podporován datovými a kódovými přenosy mezi místní systémovou pamětí a vzdálenou pamětí GPU. rCUDA je navržen tak, aby tomu vyhověl klient-server architektura. Na jednom konci klienti využívají knihovnu wrapperů na vysoké úrovni CUDA Runtime API a na druhém konci je síťová služba naslouchání, která přijímá požadavky na TCP port. Několik uzlů se spuštěním různých aplikací s akcelerací GPU může současně využívat celou sadu akcelerátorů nainstalovaných v klastru. Klient předá požadavek jednomu ze serverů, který přistupuje k GPU nainstalovanému v daném počítači a provede v něm požadavek. Časový multiplex GPU, nebo jinými slovy sdílení toho lze dosáhnout vytvořením různých serverových procesů pro každý požadavek na spuštění vzdálené GPU.[1][2][3][4][5][6]

rCUDA v20.07

Middleware rCUDA umožňuje vzdálené souběžné používání zařízení kompatibilních s CUDA.

rCUDA pro komunikaci mezi klienty a servery využívá síť InfiniBand nebo API soketu. rCUDA může být užitečný ve třech různých prostředích:

  • Klastry. Snížení počtu GPU nainstalovaných ve vysoce výkonných klastrech. To vede k úsporám energie i dalším souvisejícím úsporám, jako jsou pořizovací náklady, údržba, prostor, chlazení atd.
  • Academia. V komoditních sítích nabízet přístup k několika vysoce výkonným grafickým procesorům současně mnoha studentům.
  • Virtuální stroje. Povolení přístupu k zařízením CUDA na fyzickém stroji.

Aktuální verze rCUDA (v20.07) podporuje CUDA verze 9.0, s vyloučením interoperability grafiky. Program rCUDA v20.07 je zaměřen na operační systém Linux (pro 64bitové architektury) na straně klienta i serveru.

Aplikace CUDA nepotřebují žádnou změnu ve svém zdrojovém kódu, aby mohly být spuštěny pomocí rCUDA.

Reference

  1. ^ J. Prades; F. Silla (prosinec 2019). "Migrace úloh GPU: případ rCUDA". Transaction on Parallel and Distributed Systems, vol 30, no. 12. Citovat deník vyžaduje | deník = (Pomoc)CS1 maint: umístění (odkaz)
  2. ^ J. Prades; C. Reaño; F. Silla (březen 2019). "O vlivu použití rCUDA k zajištění akcelerace CUDA na virtuální stroje Xen". Cluster Computing, roč. 22, č. 1. Citovat deník vyžaduje | deník = (Pomoc)CS1 maint: umístění (odkaz)
  3. ^ F. Silla; S. Iserte; C. Reaño; J. Prades (červenec 2017). „K výhodám vzdáleného virtualizačního mechanismu GPU: případ rCUDA“. Souběžnost a výpočet: Praxe a zkušenosti, sv. 29, č. 13. Citovat deník vyžaduje | deník = (Pomoc)CS1 maint: umístění (odkaz)
  4. ^ J. Prades; B. Varghese; C. Reaño; F. Silla (říjen 2017). „Virtuální GPU pro více nájemců pro optimalizaci výkonu aplikace finančních rizik“. Journal of Parallel and Distributed Computing, sv. 108. Citovat deník vyžaduje | deník = (Pomoc)CS1 maint: umístění (odkaz)
  5. ^ F. Pérez; C. Reaño; F. Silla (6. – 9. Června 2016). "Poskytování akcelerace CUDA virtuálním strojům KVM v klastrech InfiniBand s rCUDA". 16. mezinárodní konference IFIP o distribuovaných aplikacích a interoperabilních systémech (DAIS 2016), Heraklion, Kréta, Řecko. Citovat deník vyžaduje | deník = (Pomoc)CS1 maint: umístění (odkaz)
  6. ^ S. Iserte; J. Prades; C. Reaño; F. Silla (16. – 19. Května 2016). "Zvýšení výkonu datových center kombinací vzdálené virtualizace GPU se Slurm". 16. IEEE / ACM International Symposium on Cluster, Cloud and Grid Computing (CCGRID 2016), Cartagena, Colombia. Citovat deník vyžaduje | deník = (Pomoc)CS1 maint: umístění (odkaz)

externí odkazy