Prvek zpracování energie - Power Processing Element
![]() | tento článek potřebuje další citace pro ověření.Duben 2020) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
NAPÁJENÍ, PowerPC, a Napájení ISA architektury |
---|
NXP (dříve Freescale a Motorola) |
IBM |
IBM / Nintendo |
jiný |
Související odkazy |
Zrušeno šedě, historický kurzívou |
Obecná informace | |
---|---|
Spuštěno | 2005 |
Přerušeno | Současnost, dárek |
Prodává | IBM, Sony, Microsoft |
Navrhl | IBM |
Společný výrobce | |
Výkon | |
Max. procesor rychlost hodin | 2,8 GHz až 3,2 GHz |
Mezipaměti | |
L1 mezipaměti | 32 KB instrukce + 32 KB data |
Architektura a klasifikace | |
aplikace | Herní konzole, HPC |
Min. velikost funkce | 90 nm až 45 nm |
Mikroarchitektura | PPU |
Sada instrukcí | PowerPC 2.02 |
Fyzické specifikace | |
Jádra |
|
GPU | Xenos, v XCGPU varianta. |
Produkty, modely, varianty | |
Varianty | Buňka BE, XCPU, XCGPU, PowerXCell 8i |
The Prvek zpracování energie (OOP) zahrnuje a Jednotka pro zpracování energie (PPU) a mezipaměť L2 512 kB. Ve většině případů se PPU používá v OOP. PPU je a 64-bit dvojitý závit v pořádku PowerPC 2.02 mikroprocesor jádro navrhl IBM pro použití především v herní konzole PlayStation 3 a Xbox 360, ale také našel aplikace ve vysoce výkonných počítačích v systému Windows superpočítače například nastavení záznamu IBM Roadrunner.
PPU se používá jako hlavní jádro CPU ve třech různých provedeních procesoru:
- The Cell Broadband Engine (Cell BE), který se používá hlavně v Sony je PlayStation 3 herní konzole. Používá OOP a je dodáván ve třech verzích, 90 nm, 65 nm a 45 nm.
- The PowerXCell 8i což je verze buňky BE s vylepšeným FPU a paměťovým subsystémem. Byl vyroben pouze jako jediná 65 nm verze.
- The XCPU který se používá v konfiguraci se třemi jádry a jednotnou mezipamětí L2 1 MB uvnitř Microsoftu Xbox 360. Dodává se ve třech verzích, 90 nm a 65 nm, a 45 nm XCGPU s integrovaným grafický procesor z ATI.
Hlavní rysy
- 64bitové jádro se dvěma vlákny
- 3,2 GHz typická taktovací frekvence
- 32 kB Mezipaměť instrukcí L1
- 32 kB Mezipaměť dat L1
- Sjednocená mezipaměť L2 512 kB, 8-way set asociativní ve variantě OOP.
- Kompatibilní s 64bitovým PowerPC ISA v.2.02 (POWER4 a PowerPC 970 )[1]
- AltiVec SIMD funkčnost
Exekuční jednotky
- Pobočková jednotka (BRU)
- Celočíselná jednotka s pevným bodem (FXU)
- Načíst a uložit jednotku (LSU)
- Jednotka s plovoucí desetinnou čárkou (FPU)
- Vector Media Extension Unit (VMX)
V pořádku
PPU je procesor v pořadí, ale má některé jedinečné vlastnosti, které mu umožňují dosáhnout některých výhod provádění mimo objednávku bez nákladného hardwaru pro opětovné objednání. Po dosažení chybějící mezipaměti L1 - může se provést za chybějící mezipamětí a zastaví se, pouze když je instrukce skutečně závislá na zatížení. Může odeslat až 8 pokynů pro načtení do mezipaměti L2 mimo pořadí. Má potrubí zpoždění instrukcí - boční cestu, která mu umožňuje provádět pokyny, které by za normálních okolností způsobily stánky potrubí bez zvednutí zbytku potrubí. Potrubí zpoždění instrukcí se používá pro načítání / ukládání mimo objednávku: chyby mezipaměti jsou tam umístěny, zatímco se pohybuje dále.
Potrubí PPE
PPE má 23 stupňů obecného potrubí s dalšími 11 možnými stupni pro mikrokód a dalšími 4 možnými stupni pro predikci větví. [2]
Multithreading
PPU běží dva hardwarová vlákna zároveň. The hlavní registry pro provádění kódu jsou duplikovány, stejně jako registry výjimek a zpracování přerušení a několik základních polí a front. Mohou generovat výjimky současně a provádět predikci větví na svých individuálních historii větví. Spouštěcí modul a mezipaměti však nejsou duplikovány - stále tedy jde pouze o jednojádrový design.[3]
Kapacita s plovoucí desetinnou čárkou
Své 64-bit dvojnásobná přesnost jednotka s plovoucí desetinnou čárkou a 128 bitů Jednotka VMX (pomocí AltiVec instrukční sada), může provádět teoretických 12 operací s plovoucí desetinnou čárkou na cyklus, protože její jednotka s plovoucí desetinnou čárkou může provádět násobné přidávání s plovoucí desetinnou čárkou a nesmí být menší než 64 bitů. To dává 3,2 miliardy hodinových cyklů × 12 = 38,4 miliard operací s plovoucí desetinnou čárkou / s.
PPU je vylepšena v PowerXCell 8i procesor schopný provádět operace s plovoucí desetinnou čárkou s dvojitou přesností v jednom cyklu, přizpůsobené pro vysoce výkonné výpočty v superpočítačích.
Jednotka VMX v XCPU v Xbox 360 je vylepšena o 128 registry a není zcela kompatibilní s běžným AltiVec.
Reference
- ^ Koranne, Sandeep (2009). Praktické programování na mobilním širokopásmovém modulu. Springer Science & Business Media. p. 17. ISBN 9781441903082.
- ^ Cell Broadband Engine Architecture a jeho první implementace
- ^ Kapitola 2 - The Power Processing Element (PPE)