AMD FireStream - AMD FireStream
AMD FireStream byl AMD značka pro jejich Radeon - cílení na produktovou řadu zpracování proudu a / nebo GPGPU v superpočítače. Původně vyvinutý společností ATI Technologies okolo Radeon X1900 XTX v roce 2006 byla produktová řada dříve označována jako obě ATI FireSTREAM a Procesor AMD Stream.[1] AMD FireStream lze také použít jako plovoucí bod koprocesor pro odlehčení výpočtů CPU, které je součástí Torrenza iniciativa. Řada FireStream byla přerušena od roku 2012, kdy byly pracovní zátěže GPGPU zcela složeny do AMD FirePro čára.
Přehled
Řada FireStream je řada doplňků rozšiřující karty vydané od roku 2006 do roku 2010, založené na standardních grafických kartách Radeon, ale navrženo jako univerzální koprocesor, spíše než vykreslování a výstup 3D grafiky. Jako FireGL / FirePro linky, dostali více paměti a šířku pásma paměti, ale karty FireStream nemusí nutně mít video výstupní porty. Všechny podporují 32 bitů jednoduchá přesnost plovoucí bod a všechny kromě prvního vydání podporují 64bitové verze dvojnásobná přesnost. Linka byla spojena s novými API, aby poskytovala vyšší výkon než stávající OpenGL a Direct3D shader API mohou poskytovat, počínaje Blízko kovu, následován OpenCL a Stream Computing SDK a nakonec integrovány do APP SDK.
U vysoce paralelních matematických úloh s plovoucí desetinnou čárkou mohou karty zrychlit velké výpočty více než 10krát; Folding @ Home, nejdříve a jeden z nejviditelnějších uživatelů GPGPU, získal 20–40krát vyšší výkon procesoru.[2] Každý shader pixelů a vrcholů nebo sjednocený shader v novějších modelech může provádět libovolné výpočty s plovoucí desetinnou čárkou.
Dějiny
Po vydání Radeon R520 a GeForce G70 GPU jádra s programovatelné shadery, velká propustnost s plovoucí desetinnou čárkou přitáhla pozornost od akademických a komerčních skupin a experimentovala s využitím pak pro jiné než grafické práce. Zájem vedl ATI (a Nvidia ) vytvářet produkty GPGPU - schopné hromadně paralelně počítat matematické vzorce obecného účelu - zpracovávat těžké výpočty tradičně prováděné na CPU a specializovaná matematika s plovoucí desetinnou čárkou koprocesory. Předpokládalo se, že GPGPU mají okamžité zvýšení výkonu o faktor 10 nebo více ve srovnání se současným výpočtem vícejádrových procesorů pouze s CPU.
Vzhledem k tomu, že vývoj vysoce výkonného modelu X1900 XFX byl téměř dokončen, společnost ATI na něm založila svůj první design Stream procesoru a oznámila jej jako nadcházející ATI FireSTREAM společně s novým Blízko kovu API na SIGGRAPH 2006.[3] Samotné jádro se většinou nezměnilo, s výjimkou zdvojnásobení palubní paměti a šířky pásma, podobně jako u FireGL V7350; Většinu rozdílu tvoří nová podpora ovladačů a softwaru. Skládací @ home začal používat X1900 pro obecný výpočet pomocí předběžného vydání verze 6.5 ovladače ATI Catalyst a hlásil 20–40násobné zlepšení GPU oproti CPU.[2] První produkt byl vydán koncem roku 2006 a přejmenován na Procesor AMD Stream po fúzi s AMD.[4]
Značka se stala AMD FireStream s druhou generací streamových procesorů v roce 2007, založenou na čipu RV650 s novými jednotnými shadery a podporou dvojité přesnosti.[5] Asynchronní DMA také vylepšený výkon povolením většího fondu paměti bez pomoci procesoru. Jeden model byl propuštěn, 9170, za počáteční cenu 1999 $. Plány zahrnovaly vývoj streamovacího procesoru na Modul MXM do roku 2008, pro notebooky,[6] ale nikdy nebyl propuštěn.
Třetí generace rychle následovala v roce 2008 s dramatickým vylepšením výkonu jádra RV770; 9250 měl téměř dvojnásobný výkon než 9170 a stal se prvním single-chipem teraflop i přes pokles ceny pod 1000 $.[7] Rychlejší sourozenec, 9270, byl propuštěn krátce poté, za 1999 $.
V roce 2010 vyšla poslední generace FireStreams, karty 9350 a 9370, založené na čipu Cypress obsaženém v HD 5800. Tato generace oproti předchozímu zdvojnásobila výkon, na 2 teraflopy v 9350 a 2,6 teraflops v 9370 ,[8] a byl první postavený od základu pro OpenCL. Tato generace byla také jediná, která měla plně pasivní chlazení a aktivní chlazení nebylo k dispozici.
Generace Severního a Jižního ostrova byly přeskočeny a v roce 2012 společnost AMD oznámila, že nová řada FirePro W (pracovní stanice) a S (server) založená na nové Další grafické jádro architektura by nahradila karty FireStream.[9]
Modely
- Zahrnuje FireStream 9170 Direct3D 10.1, OpenGL 3.3 a APP Stream
- Zahrnuje FireStream 92x0 Direct3D 10.1, OpenGL 3.3 a OpenCL 1.0
- Zahrnuje FireStream 93x0 Direct3D 11, OpenGL 4.3 a OpenCL 1.2 s posledními aktualizacemi ovladačů
Modelka (Krycí jméno ) | Zahájení | Architektura (Fab ) | Autobus rozhraní | Streamujte procesory | Rychlost hodin | Paměť | Procesní výkon[A] (GFLOPS ) | TDP (Watty ) | |||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Jádro (MHz) | Paměť (MHz) | Velikost (MB ) | Typ | Šířka sběrnice (bit ) | Šířka pásma (GB / s) | Singl | Dvojnásobek | ||||||
Streamový procesor (R580) | 2006 | R500 80 nm | 240 | 600 | 1024 | GDDR3 | 256 | 83.2 | 375[10] | N / A | 165 | ||
FireStream 9170 (RV670)[11][12] | 8. listopadu 2007 | TeraScale 1 55 nm | PCIe 2.0 x16 | 320 | 800 | 800 | 2048 | GDDR3 | 256 | 51.2 | 512 | 102.4 | 105 |
FireStream 9250 (RV770)[13][14] | 16. června 2008 | TeraScale 1 55 nm | PCIe 2.0 x16 | 800 | 625 | 993 | 1024 | GDDR3 | 256 | 63.6 | 1000 | 200 | 150 |
FireStream 9270 (RV770)[15][16] | 13. listopadu 2008 | TeraScale 1 55 nm | PCIe 2.0 x16 | 800 | 750 | 850 | 2048 | GDDR5 | 256 | 108.8 | 1200 | 240 | 160 |
FireStream 9350 (Cypress XT)[17] | 23. června 2010 | TeraScale 2 40 nm | PCIe 2.1 x16 | 1440 | 700 | 1000 | 2048 | GDDR5 | 256 | 128 | 2016 | 403.2 | 150 |
FireStream 9370 (Cypress XT)[18] | 23. června 2010 | TeraScale 2 40 nm | PCIe 2.1 x16 | 1600 | 825 | 1150 | 4096 | GDDR5 | 256 | 147.2 | 2640 | 528 | 225 |
Software
AMD FireStream byl spuštěn s širokou škálou podpory softwarové platformy. Jedna z podpůrných firem byla PeakStream (získaný Google v červnu 2007), který jako první otevřel beta verze softwaru pro podporu CTM a AMD FireStream a také x86 a Buňka (Cell Broadband Engine) procesory. FireStream byl po spuštění softwaru PeakStream prohlašován za 20krát rychlejší v typických aplikacích než běžné CPU[Citace je zapotřebí ]. RapidMind také poskytl software pro zpracování proudu, který pracoval s ATI a NVIDIA, stejně jako s procesory Cell.[19]
Software Development Kit
Poté, co opustili své krátké trvání Blízko kovu API, AMD zaměřeno na OpenCL. AMD nejprve vydala svůj Stream Computing SDK (v1.0), v prosinci 2007 pod AMD EULA, na které se má běžet Windows XP.[19] SDK obsahuje „Brook +“, hardwarově optimalizovanou verzi AMD Potok jazyk vyvinutý Stanfordskou univerzitou, sám o sobě variantou jazyka ANSI C. (Jazyk C. ), otevřený zdroj a optimalizováno pro streamování. The Matematická knihovna AMD Core (ACML) a AMD Performance Library (APL) s optimalizacemi pro AMD FireStream a video knihovnu COBRA (dále přejmenovanou na „Accelerated Video Transcoding“ nebo AVT) pro překódování videa zahrnuto bude také zrychlení. Další důležitou součástí sady SDK, Compute Abstraction Layer (CAL), je vrstva pro vývoj softwaru zaměřená na nízkoúrovňový přístup přes hardwarové rozhraní CTM k architektuře GPU pro software pro ladění výkonu napsaný v různých úrovních programovací jazyky.
V srpnu 2011 společnost AMD vydala verzi 2.5 sady ATI APP Software Development Kit,[19] který zahrnuje podporu pro OpenCL 1.1, a paralelní výpočty jazyk vyvinutý Skupina Khronos. Koncept vypočítat shadery, oficiálně nazvaný DirectCompute, v Microsoft volá se nová generace API DirectX 11 je již součástí grafických ovladačů s podporou DirectX 11.
AMD APP SDK
Srovnávací hodnoty
Podle systému předvedeného AMD[20] se dvěma dvoujádrovými AMD Opteron běží na dvou procesorech Radeon R600 GPU Microsoft Windows XP Professional, 1 teraflop (TFLOP) lze dosáhnout výpočtem univerzálního vícenásobného přidání (MADD). Pro srovnání, procesor Intel Core 2 Quad Q9650 3,0 GHz v té době mohl dosáhnout 48 GFLOPS.[21]
Na ukázce antivirového skenování Kaspersky SafeStream, které bylo optimalizováno pro procesory AMD stream, bylo možné v roce 2007 skenovat 21krát rychleji s akcelerací založenou na R670 než s vyhledáváním běžícím zcela na Opteronu.[22]
Omezení
- Rekurzivní funkce nejsou podporovány v Brook +, protože všechna volání funkcí jsou podtrženo v době kompilace. Pomocí CAL jsou funkce (rekurzivní nebo jiné) podporovány do 32 úrovní.[23]
- Podporováno je pouze bilineární filtrování textur; mipmapováno textury a anizotropní filtrace nejsou podporovány.
- Funkce nemohou mít proměnný počet argumentů. Stejný problém nastává u rekurzivních funkcí.
- Převod čísel s plovoucí desetinnou čárkou na celá čísla na GPU se provádí jinak než na procesorech x86; není to úplně IEEE-754 v souladu.
- Provádění „globální synchronizace“ na GPU není příliš efektivní, což nutí GPU rozdělit jádro a proveďte synchronizaci na CPU. Vzhledem k proměnlivému počtu multiprocesorů a dalším faktorům nemusí být tento problém dokonalým řešením.
- Šířka pásma sběrnice a latence mezi CPU a GPU se mohou stát a úzké místo.
Viz také
- Zpracování streamu
- Heterogenní systémová architektura
- NVIDIA Tesla podobné řešení od Nvidia
- Intel Xeon Phi podobné řešení od společnosti Intel
- Otevřený výpočetní jazyk (OpenCL ) - průmyslový standard
- Vypočítat jednotnou architekturu zařízení (CUDA ) - proprietární řešení pouze pro Nvidia
- Seznam grafických jednotek AMD
Reference
- ^ Tisková zpráva AMD
- ^ A b Gasior, Geoff (16. října 2006). „Bližší pohled na Folding @ home na GPU“. Technická zpráva. Citováno 2016-05-26.
- ^ Prezentace ATI SIGGRAPH 2006 (PDF) (Zpráva). ATI Technologies.
- ^ Valich, Theo (16. listopadu 2006). „ATI FireSTREAM AMD Stream deska odhalena“. Tazatel. Citováno 2016-05-26.
- ^ „AMD dodává procesor prvního proudu s technologií Double Precision Floating Point Technology“. AMD. 8. listopadu 2007. Archivovány od originál dne 19. 6. 2017. Citováno 2016-05-26.
- ^ Prezentace AMD WW HPC 2007 (PDF) (Zpráva). str. 37.
- ^ „Procesor AMD Stream poprvé prolomil 1 bariéru Teraflop“. AMD. 16. června 2008. Archivováno od originál dne 19. 6. 2017. Citováno 2016-05-26.
- ^ „Nejnovější AMD FireStream (TM) výpočetní akcelerátory poskytují téměř dvojnásobný špičkový výkon a výkon na jednu Watt a výkon na Watt za poslední generaci“. AMD. 23. června 2010. Archivovány od originál dne 19. 6. 2017. Citováno 2016-05-26.
- ^ Smith, Ryan (14. srpna 2012). „Recenze AMD Firepro W9000 W8000, část 1“. Anandtech.com. Citováno 28. června 2016.
- ^ „Beyond3D - ATI R580: Radeon X1900 XTX & Crossfire“. www.beyond3d.com.
- ^ „AMD dodává procesor prvního proudu s technologií Double Precision Floating Point Technology“. AMD. 8. listopadu 2007. Citováno 2016-05-26.
- ^ „Specifikace AMD FireStream 9170“. TechPowerUp.
- ^ AMD FireStream 9250 - stránka produktu Archivováno 13. května 2010 v Wayback Machine
- ^ „Specifikace AMD FireStream 9250“. TechPowerUp.
- ^ AMD FireStream 9270 - Stránka produktu Archivováno 16. února 2010, v Wayback Machine
- ^ „Specifikace AMD FireStream 9270“. TechPowerUp.
- ^ „Specifikace AMD FireStream 9350“. TechPowerUp.
- ^ „Specifikace AMD FireStream 9370“. TechPowerUp.
- ^ A b C Stránka ke stažení AMD APP SDK Archivováno 03.09.2012 na Wayback Machine a Streamujte výpočetní sadu SDK EULA Archivováno 6. března 2009 v Wayback Machine, vyvoláno 29. prosince 2007
- ^ Zpráva HardOCP Archivováno 04.03.2016 na Wayback Machine, získaný 17. července 2007
- ^ Metriky dodržování exportu mikroprocesoru Intel
- ^ Valich, Theo (12. září 2007). „GPGPU drasticky urychluje antivirový software“. Tazatel. Citováno 2016-05-26.
- ^ AMD Intermediate Language Reference Guide, srpen 2008