HPC Challenge Benchmark - HPC Challenge Benchmark
Původní autoři | Inovativní výpočetní laboratoř, University of Tennessee |
---|---|
První vydání | 2003 |
Stabilní uvolnění | 1.5.0a |
Plošina | Cross-platform |
Licence | BSD |
webová stránka | http://icl.cs.utk.edu/hpcc/ |
HPC Challenge Benchmark kombinuje několik měřítka otestovat řadu nezávislých atributů výkonu vysokého výkonu počítač (HPC) systémy. Projekt byl spolufinancován organizací DARPA Vysoce produktivní výpočetní systémy program, Ministerstvo energetiky Spojených států a Národní vědecká nadace.[1]
Kontext
Výkon složitých aplikací v systémech HPC může záviset na různých nezávislých výkonnostních atributech hardwaru. HPC Challenge Benchmark je snaha o zlepšení viditelnosti v tomto multidimenzionálním prostoru spojením měření několika z těchto atributů do jednoho programu.
Ačkoli atributy výkonu, které vás zajímají, nejsou specifické pro žádnou konkrétní architekturu počítače, referenční implementace HPC Challenge Benchmark v C a MPI předpokládá, že testovaný systém je a shluk z sdílená paměť multiprocesor systémy propojené a síť. Kvůli tomuto předpokladu hierarchické struktury systému probíhá většina testů v několika různých režimech provozu. V návaznosti na notaci používanou srovnávacími zprávami výsledky označené „single“ znamenají, že test byl spuštěn na jednom náhodně vybraném procesoru v systému, výsledky označené „star“ znamenají, že na každém procesoru v systém a výsledky označené jako „globální“ znamenají, že všichni procesory pracovali v koordinaci na řešení jediného problému (s daty distribuovanými napříč uzly systému).
Součásti
Referenční úroveň v současné době sestává ze 7 testů (u každého jsou uvedeny režimy provozu):
- HPL[2] (Vysoký výkon LINPACK ) - měří výkon řešiče pro hustotu soustava lineárních rovnic (globální).
- DGEMM - měří výkon pro násobení matice-matice (single, star).
- PROUD[3] - trvalá opatření šířka pásma paměti do / z paměti (single, star).
- PTRANS - měří rychlost, jakou systém dokáže přemístit velké pole (globální).
- Náhodný přístup - měří rychlost 64bitových aktualizací náhodně vybraných prvků velké tabulky (single, star, global).
- FFT - provádí a Rychlá Fourierova transformace na velkém jednorozměrném vektoru pomocí zobecněného Cooley – Tukey algoritmus (single, star, global).
- Šířka a latence komunikace - měření výkonu zaměřené na MPI založené na b_eff[4] měřítko šířky pásma / latence.
Atributy výkonu
Na vysoké úrovni jsou testy určeny k pokrytí čtyř důležitých atributů výkonu: aritmetika s plovoucí desetinnou čárkou s dvojitou přesností (DGEMM a HPL), šířka pásma lokální paměti (STREAM), šířka pásma sítě pro „velké“ zprávy (PTRANS, RandomAccess , FFT, b_eff) a šířka pásma sítě pro „malé“ zprávy (RandomAccess, b_eff). Některé z kódů jsou složitější než jiné a mohou mít další citlivost na výkon. Například v některých systémech může být výkon HPL omezen šířkou pásma sítě a / nebo latencí sítě.
Soutěž
Roční Soutěž HPC Challenge Award na Konference o superpočítačích zaměřuje se na čtyři nejnáročnější měřítka v sadě:
- Globální HPL
- Globální Náhodný přístup (NEBO Srovnávací test náhodného přístupu BSS )
- EP STREAM (triáda) na systém
- Globální FFT
Existují dvě třídy ocenění:
- Třída 1: Nejlepší výkon na základně nebo optimalizovaný běh odeslaný na web HPC Challenge.[5]
- Třída 2: Nejelegantnější implementace čtyř nebo pěti výpočetních jader včetně tří nebo více benchmarků HPC Challenge.[6]
Viz také
Reference
- ^ „Superpočítač Cray X1 má nejvyšší vykázaná skóre v testech HPC Challenge Benchmark sponzorovaných vládou“. 14.06.2004. Archivovány od originál dne 2012-05-04. Citováno 2010-01-22.
- ^ „HPL - přenosná implementace vysoce výkonného standardu Linpack pro počítače s distribuovanou pamětí“. Inovativní výpočetní laboratoř, University of Tennessee v Knoxville. Citováno 2015-06-10.
- ^ „STREAM: Udržitelná šířka pásma paměti ve vysoce výkonných počítačích“. Citováno 2015-06-10.
- ^ „Efektivní měřítko šířky pásma (b_eff)“. High Performance Computing Center Stuttgart. Citováno 2015-06-10.
- ^ Benchmark je navržen tak, aby umožňoval nahrazení omezené sady funkcí více optimalizovanými verzemi při zachování „základního“ běhu. Další (ale stále omezené) úpravy jsou povoleny v kategorii „optimalizovaných“ běhů.
- ^ „Soutěž HPC Challenge Award“. Program DARPA HPCS. Citováno 2010-01-23.
externí odkazy
- Oficiální webové stránky HPC Challenge Benchmark
- Oficiální webové stránky soutěže HPC Challenge Award
- Srovnávací test náhodného přístupu BSS Vyhodnocení výkonu a optimalizace náhodného přístupu do paměti na vícejádrových procesorech s vysokou produktivitou (cena za nejlepší papír) na webu ACM / IEEE HiPC 2010