Řada GeForce 400 - GeForce 400 series
Řada NVIDIA Geforce 400: GTX 480, GTX 470, GTX 460, GTS 450, GT 440, GT 430, GT 420 a GT 405. | |
Datum vydání | 12. dubna 2010 |
---|---|
Krycí jméno | GF10x |
Architektura | Fermi |
Modely | Řada GeForce
|
Tranzistory | 260 M 40 nm (GT218)
|
Karty | |
Vstupní úroveň | GT 420 GT 430 |
Střední kategorie | GT 440 GTS 450 GTX 465 |
High-end | GTX 460 GTX 470 |
Nadšenec | GTX 480 |
API Podpěra, podpora | |
Direct3D | Direct3D 12.0 (úroveň funkcí 11_0)[1] |
OpenCL | OpenCL 1.1 |
OpenGL | OpenGL 4.6 |
Dějiny | |
Předchůdce | Řada GeForce 300 |
Nástupce | Řada GeForce 500 |
Slouží jako úvod Fermi, Řada GeForce 400 je řada jednotky grafického zpracování vyvinutý uživatelem Nvidia. Jeho vydání bylo původně plánováno v listopadu 2009;[2] po zpožděních však byl vydán 26. března 2010 s dostupností po dubnu 2010.
Architektura
Nvidia popsal Fermi (mikroarchitektura) jako další hlavní krok v řadě GPU po Tesla (mikroarchitektura) používá se od G80. GF100, první produkt architektury Fermi, je velký: 512 stream procesory, v šestnácti skupinách po 32 a 3,0 miliardě tranzistorů, vyráběných společností TSMC v procesu 40 nm. Je to první podporovaný čip Nvidia OpenGL 4.0 a Direct3D 11. Nikdy nebyly prodány žádné produkty s plně povoleným GPU GF100. U GTX 480 byl deaktivován jeden streamovací multiprocesor. GTX 470 měl deaktivovány dva streamovací multiprocesory a jeden řadič paměti. GTX 465 měl deaktivováno pět streamovacích multiprocesorů a dva řadiče paměti. Karty Consumer GeForce byly dodávány s 256 MB připojenými ke každému z povolených řadičů paměti GDDR5, celkem tedy 1,5, 1,25 nebo 1,0 GB; Tesla C2050 měla 512 MB na každém ze šesti řadičů a Tesla C2070 měla 1024 MB na řadič. Obě karty Tesla měly čtrnáct aktivních skupin streamových procesorů.
Čipy nalezené ve vysokém výkonu Tesla paměť funkcí značky s volitelnou ECC a schopnost provádět jednu operaci s plovoucí desetinnou čárkou s dvojitou přesností na cyklus a jádro; spotřebitelské karty GeForce jsou uměle omezeny na jednu operaci DP za čtyři cykly. S těmito funkcemi v kombinaci s podporou pro Vizuální studio a C ++, Nvidia cílila na profesionální a komerční trhy, stejně jako na použití v vysoce výkonné výpočty.
Fermi je pojmenován po italském fyzikovi Enrico Fermi.
Současná omezení a kompromisy
Množství palubního SRAM na ALU se ve srovnání s předchozí generací G200 ve skutečnosti úměrně snížilo, a to navzdory nárůstu Mezipaměť L2 z 256 kB na 240 ALU na 768kB na 512 ALU, protože Fermi má pouze 32768 registrů na 32 ALU (vs. 16384 na 8 ALU), pouze 48kB sdílené paměti na 32 ALU (vs. 16kB na 8 ALU) a pouze 16kB mezipaměti na 32 ALU ( vs. 8kB konstantní mezipaměť na 8 ALU + 24kB mezipaměť textury za 24 ALU). Parametry, jako je počet registrů, najdete v srovnávací tabulce CUDA Compute Capability v referenční příručce.[3]
Dějiny
Dne 30. září 2009 vydala Nvidia bílou knihu popisující architekturu:[4] čip obsahuje 16 'streamovacích multiprocesorů', každý s 32 'CUDA jádry' schopnými jedné operace s jednou přesností na jeden cyklus nebo jedné operace s dvojitou přesností v každém druhém cyklu, 40bitový virtuální adresový prostor, který umožňuje mapování paměti hostitele do adresový prostor čipu, což znamená, že existuje pouze jeden druh ukazatele, který výrazně usnadňuje podporu C ++, a šířka 384 bitů GDDR5 paměťové rozhraní. Stejně jako u G80 a GT200, vlákna jsou naplánována v 'warps', sady 32 vláken, každý běžící na jednom jádru shaderu. Zatímco model GT200 měl 16 kB „sdílené paměti“ přidružené ke každému clusteru shaderů a vyžadoval čtení dat prostřednictvím texturovacích jednotek, pokud byla potřeba mezipaměť, GF100 má 64 KB paměti přidružené ke každému clusteru, což lze použít buď jako 48 kB mezipaměti plus 16 kB sdílené paměti nebo jako 16 kB mezipaměti plus 48 kB sdílené paměti spolu s 768 kB mezipaměti L2 sdílené všemi 16 klastry.
Bílá kniha popisuje čip mnohem více jako univerzální procesor pro pracovní zátěže zahrnující desítky tisíc vláken - připomínající Tera MTA architektura, i když bez podpory tohoto stroje pro velmi efektivní náhodný přístup do paměti - než jako grafický procesor.
produkty
- 1 SP - Shader Processors - Unified Shaders : Jednotky mapování textury : Vykreslení výstupních jednotek
- 2 Každý streamovací multiprocesor (SM) v GPU architektury GF100 obsahuje 32 SP a 4 SFU. Každý streamovací multiprocesor (SM) v GPU architektury GF104 / 106/108 obsahuje 48 SP a 8 SFU. Každý SP může splňovat 2 jednotlivé přesné fúzované násobení – přidání (FMA ) operací za cyklus. Každá SFU může plnit čtyři SF operace za cyklus. Jedna operace FMA se počítá pro dvě operace s plovoucí desetinnou čárkou. Teoretický špičkový výkon s jedinou přesností s počtem shaderů [n] a frekvence shaderu [F, GHz], lze odhadnout následujícím způsobem, FLOPSsp ≈ f × n × 2 (FMA). Celkový výkon zpracování: pro GF100 FLOPSsp ≈ f × m × (32 SP × 2 (FMA) + 4 × 4 SFU) a pro GF104 / 106/108 FLOPSsp ≈ f × m × (48 SP × 2 (FMA) + 4 × 8 SFU) nebo pro GF100 FLOPSsp ≈ f × n × 2,5 a pro GF104 / 106/108 FLOPSsp ≈ f × n × 8/3.[5]
SP - Shader Processor (Unified Shader, CUDA Core), SFU - jednotka speciálních funkcí, SM - streamovací multiprocesor.
- 3 Každý SM v GF100 obsahuje 4 jednotky filtrování textury pro každou jednotku adresy textury. Kompletní matrice GF100 obsahuje 64 jednotek adres textur a 256 jednotek filtrování textur[6] Každý SM v architektuře GF104 / 106/108 obsahuje 8 jednotek filtrování textury pro každou jednotku adresy textury. Kompletní matrice GF104 obsahuje 64 jednotek adresy textur a 512 jednotek filtrování textury, kompletní matrice GF106 obsahuje 32 jednotek adresy textury a 256 jednotek filtrování textury a kompletní matrice GF108 obsahuje 16 jednotek adresy textury a 128 jednotek filtrování textury.[7]
Všechny produkty jsou vyráběny procesem výroby 40 nm. Všechny produkty podporují Direct X 12.0, OpenGL 4.6 a OpenCL 1.1. Jedinou výjimkou je Geforce 405, který je založen na jádru GT218 podporujícím pouze DirectX 10.1, OpenGL 3.3 a žádnou podporu OpenCL
Modelka | Zahájení | Krycí jméno | Tranzistory (miliony) | Velikost matrice (mm2) | Autobus rozhraní | Počet SM | Základní konfigurace1,3 | Rychlost hodin | Naplňte | Konfigurace paměti | GFLOPS (FMA)2 | TDP (W) | Vyvolávací cena (USD) | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Jádro (MHz ) | Shader (MHz ) | Paměť (MHz ) | Pixel (GP / s) | Textura (GT / s) | Velikost (MB ) | Šířka pásma (GB / s) | Typ DRAM | Šířka sběrnice (bit ) | |||||||||||
GeForce 405 (OEM) | 16. září 2011 | GT218 | 260 | 57 | PCIe 2.0 x16 | 1 | 16:8:4 | 589 | 1402 | 1580 | 2.4 | 4.7 | 512 1024 | 12.6 | DDR3 | 64 | 44.9 | 25 | OEM |
GeForce GT 420 (OEM) | 3. září 2010 | GF108 | 585 | 116 | PCIe 2.0 x16 | 1 | 48:8:4 | 700 | 1400 | 1800 | 2.8 | 5.6 | 2048 | 28.8 | GDDR3 | 128 | 134.4 | 50 | OEM |
GeForce GT 430 (OEM) | 11. října 2010 | GF108 | 585 | 116 | PCIe 2.0 x16 | 2 | 96:16:4 | 700 | 1400 | 1600 1800 | 2.8 | 11.2 | 2048 | 25.6 28.8 | GDDR3 | 128 | 268.8 | 60 | OEM |
GeForce GT 430 | 11. října 2010 | GF108 | 585 | 116 | PCIe 2.0 x16 | 2 | 96:16:4 | 700 | 1400 | 1800 | 2.8 | 11.2 | 1024 | 28.8 | GDDR3 | 128 | 268.8 | 49 | $79 |
GeForce GT 440 | 1. února 2011 | GF108 | 585 | 116 | PCIe 2.0 x16 | 2 | 96:16:4 | 810 | 1620 | 1800 3200 | 3.24 | 13.2 | 512 1024 2048 | 28.8 51.2 | GDDR3 GDDR5 | 128 | 311 | 65 | $79 |
GeForce GT 440 (OEM) | 11. října 2010 | GF106 | 1170 | 238 | PCIe 2.0 x16 | 3 | 144:24:24 | 594 | 1189 | 1800 | 14.26 | 14.26 | 1536 3072 | 43.2 | GDDR3 | 192 | 342.4 | 56 | OEM |
GeForce GTS 450 (OEM) | 11. října 2010 | GF106 | 1170 | 238 | PCIe 2.0 x16 | 3 | 144:24:24 | 790 | 1580 | 1804 | 18.96 | 18.96 | 1024 1536 | 86 | GDDR5 | 192 | 455 | 106 | OEM |
GeForce GTS 450 | 13. září 2010 | GF106 | 1170 | 238 | PCIe 2.0 x16 | 4 | 192:32:16 | 783 | 1566 | 1804 | 12.53 | 25.06 | 512 1024 2048 | 57.73 | GDDR3 GDDR5 | 128 | 601.3 | 106 | $129 |
GeForce GTX 460 SE | 15. listopadu 2010 | GF104 | 1950 | 332 | PCIe 2.0 x16 | 6 | 288:48:32 | 650 | 1300 | 3400 | 20.8 | 31.2 | 1024 | 108.8 | GDDR5 | 256 | 748.8 | 150 | $160?-$180? |
GeForce GTX 460 (OEM) | 11. října 2010 | GF104 | 1950 | 332 | PCIe 2.0 x16 | 7 | 336:56:24 | 650 | 1300 | 3400 | 20.8 | 36.4 | 1024 | 108.8 | GDDR5 | 256 | 873.6 | 150 | OEM |
GeForce GTX 460 | 12. července 2010 | GF104 | 1950 | 332 | PCIe 2.0 x16 | 7 | 336:56:24 | 675 | 1350 | 3600 | 16.2 | 37.8 | 768 | 86.4 | GDDR5 | 192 | 907.2 | 150 | $199 |
336:56:32 | 21.6 | 1024 2048 | 115.2 | 256 | 160 | $229 | |||||||||||||
GeForce GTX 460 v2 | 24. září 2011 | GF114 | 1950 | 332 | PCIe 2.0 x16 | 7 | 336:56:24 | 778 | 1556 | 4008 | 18.67 | 43.57 | 1024 | 96.2 | GDDR5 | 192 | 1045.6 | 160 | $199 |
GeForce GTX 465 | 31. května 2010 | GF100 | 3200 | 529 | PCIe 2.0 x16 | 11 | 352:44:32 | 607 | 1215 | 3206 | 19.42 | 26.71 | 1024 | 102.6 | GDDR5 | 256 | 855.4 | 200 | $279 |
GeForce GTX 470 | 26. března 2010 | GF100 | 3200 | 529 | PCIe 2.0 x16 | 14 | 448:56:40 | 607 | 1215 | 3348 | 24.28 | 34 | 1280 | 133.9 | GDDR5 | 320 | 1088.6 | 215 | $349 |
GeForce GTX 480 | 26. března 2010 | GF100 | 3200 | 529 | PCIe 2.0 x16 | 15 | 480:60:48 | 700 | 1401 | 3696 | 33.60 | 42 | 1536 | 177.4 | GDDR5 | 384 | 1345 | 250 | $499 |
8. listopadu 2010 Nvidia vydala čip GF110 spolu s GTX580 (Náhrada 480). Jedná se o přepracovaný čip GF100, který spotřebuje podstatně méně energie. To umožnilo Nvidii povolit všech 16 SM (všech 16 jader), což u GF100 dříve nebylo možné „NVIDIA GeForce GTX 580“. Různé funkce architektury GF100 byly k dispozici pouze u dražších karet Quadro a Tesla.[8] U spotřebitelských produktů GeForce je výkon s dvojitou přesností čtvrtinový oproti výkonu „plné“ architektury Fermi. Kontrola chyb a oprava paměti (ECC) také nefunguje na spotřebitelských kartách.[9] Karty GF100 poskytují Compute Capability 2.0, zatímco karty GF104 / 106/108 poskytují Compute Capability 2.1.
Tabulka čipových sad
Podpora byla ukončena
Nvidia oznámila, že po vydání ovladačů 390 již nebude vydávat 32bitové ovladače pro 32bitové operační systémy.[10]
Nvidia v dubnu 2018 oznámila, že Fermi přejde do stavu podpory starších ovladačů a bude zachována až do ledna 2019.[11]
Viz také
- Řada GeForce 200
- Řada GeForce 500
- Řada GeForce 600
- Řada GeForce 700
- Řada GeForce 800M
- Řada GeForce 900
- Nvidia Quadro
- Nvidia Tesla
Poznámky
- David Kanter (30. září 2009). „Inside Fermi: Nvidia's HPC Push“. realworldtech.com. Citováno 16. prosince 2010.
Reference
- ^ Killian, Zak (3. července 2017). „Nvidia konečně umožňuje majitelům Fermi GPU užít si DirectX 12“. Technická zpráva. Citováno 4. července 2017.
- ^ „OFICIÁLNĚ: NVIDIA uvádí GT300 podle plánu na 4. čtvrtletí 2009, výnosy jsou v pořádku - světlá stránka novinek *“. Brightsideofnews.com. Citováno 20. září 2010.
- ^ Porovnávací tabulka výpočetních schopností v systému Windows „Strana 147-148, dodatek G.1, oficiální referenční příručka CUDA 3.1“ (PDF).. Strana 97 v příloze A uvádí starší GPU NVIDIA a ukazuje, že všechny řady G200 mají výpočetní schopnost 1.3, zatímco karty založené na Fermi mají výpočetní schopnost 2.x (strana 14, část 2.5).
- ^ http://www.nvidia.com/content/PDF/fermi_white_papers/NVIDIA_Fermi_Compute_Architecture_Whitepaper.pdf
- ^ siliconmadness.com (2010). „Nvidia oznamuje řadu Tesla 20“. Archivovány od originál 21. května 2010.
- ^ Pozdní měsíce GeForce GTX 480 a GTX 470: 6 měsíců NVIDIA, stálo to za to čekat?
- ^ NVIDIA GeForce GTX 460: 200 $ King
- ^ „Prohlášení společnosti NVIDIA na diskusním fóru General CUDA GPU Computing“.
- ^ „Webová stránka NVIDIA Tesla C2xxx“., z popisu lze odvodit, že na Teslase lze ECC zapínat a vypínat pomocí 1/8 existující palubní paměti, na rozdíl od standardních paměťových modulů ECC, které vyžadují 1/8 dalších paměťových čipů (tj. jeden další čip na desku plošných spojů každých 8).
- ^ http://nvidia.custhelp.com/app/answers/detail/a_id/4604/
- ^ http://nvidia.custhelp.com/app/answers/detail/a_id/4654
externí odkazy
- Nová generace Nvidia GeForce
- Fermi architektura
- Přehled GTX 400
- GeForce GTX 480
- GeForce GTX 470
- GeForce GTX 465
- GeForce GTX 460
- GeForce GTS 450
- GeForce GT 440
- GeForce GT 430
- GeForce GTX 485M
- GeForce GTX 480M
- GeForce GTX 470M
- GeForce GTX 460M
- GeForce GT 445M
- GeForce GT 435M
- GeForce GT 425M
- GeForce GT 420M
- GeForce GT 415M
- GeForce 410M
- GeForce 405
- Nvidia Nsight
- techPowerUp! Databáze GPU