HPC Challenge Benchmark - HPC Challenge Benchmark

HPC Challenge Benchmark
Původní autoři	Inovativní výpočetní laboratoř, University of Tennessee
První vydání	2003
Stabilní uvolnění	1.5.0a
Plošina	Cross-platform
Licence	BSD
webová stránka	http://icl.cs.utk.edu/hpcc/

HPC Challenge Benchmark kombinuje několik měřítka otestovat řadu nezávislých atributů výkonu vysokého výkonu počítač (HPC) systémy. Projekt byl spolufinancován organizací DARPA Vysoce produktivní výpočetní systémy program, Ministerstvo energetiky Spojených států a Národní vědecká nadace.^[1]

Kontext

Výkon složitých aplikací v systémech HPC může záviset na různých nezávislých výkonnostních atributech hardwaru. HPC Challenge Benchmark je snaha o zlepšení viditelnosti v tomto multidimenzionálním prostoru spojením měření několika z těchto atributů do jednoho programu.

Ačkoli atributy výkonu, které vás zajímají, nejsou specifické pro žádnou konkrétní architekturu počítače, referenční implementace HPC Challenge Benchmark v C a MPI předpokládá, že testovaný systém je a shluk z sdílená paměť multiprocesor systémy propojené a síť. Kvůli tomuto předpokladu hierarchické struktury systému probíhá většina testů v několika různých režimech provozu. V návaznosti na notaci používanou srovnávacími zprávami výsledky označené „single“ znamenají, že test byl spuštěn na jednom náhodně vybraném procesoru v systému, výsledky označené „star“ znamenají, že na každém procesoru v systém a výsledky označené jako „globální“ znamenají, že všichni procesory pracovali v koordinaci na řešení jediného problému (s daty distribuovanými napříč uzly systému).

Součásti

Referenční úroveň v současné době sestává ze 7 testů (u každého jsou uvedeny režimy provozu):

HPL^[2] (Vysoký výkon LINPACK ) - měří výkon řešiče pro hustotu soustava lineárních rovnic (globální).
DGEMM - měří výkon pro násobení matice-matice (single, star).
PROUD^[3] - trvalá opatření šířka pásma paměti do / z paměti (single, star).
PTRANS - měří rychlost, jakou systém dokáže přemístit velké pole (globální).
Náhodný přístup - měří rychlost 64bitových aktualizací náhodně vybraných prvků velké tabulky (single, star, global).
FFT - provádí a Rychlá Fourierova transformace na velkém jednorozměrném vektoru pomocí zobecněného Cooley – Tukey algoritmus (single, star, global).
Šířka a latence komunikace - měření výkonu zaměřené na MPI založené na b_eff^[4] měřítko šířky pásma / latence.

Atributy výkonu

Na vysoké úrovni jsou testy určeny k pokrytí čtyř důležitých atributů výkonu: aritmetika s plovoucí desetinnou čárkou s dvojitou přesností (DGEMM a HPL), šířka pásma lokální paměti (STREAM), šířka pásma sítě pro „velké“ zprávy (PTRANS, RandomAccess , FFT, b_eff) a šířka pásma sítě pro „malé“ zprávy (RandomAccess, b_eff). Některé z kódů jsou složitější než jiné a mohou mít další citlivost na výkon. Například v některých systémech může být výkon HPL omezen šířkou pásma sítě a / nebo latencí sítě.

Soutěž

Roční Soutěž HPC Challenge Award na Konference o superpočítačích zaměřuje se na čtyři nejnáročnější měřítka v sadě:

Globální HPL
Globální Náhodný přístup (NEBO Srovnávací test náhodného přístupu BSS )
EP STREAM (triáda) na systém
Globální FFT

Existují dvě třídy ocenění:

Třída 1: Nejlepší výkon na základně nebo optimalizovaný běh odeslaný na web HPC Challenge.^[5]
Třída 2: Nejelegantnější implementace čtyř nebo pěti výpočetních jader včetně tří nebo více benchmarků HPC Challenge.^[6]

Viz také

Místo reference

Reference

^ „Superpočítač Cray X1 má nejvyšší vykázaná skóre v testech HPC Challenge Benchmark sponzorovaných vládou“. 14.06.2004. Archivovány od originál dne 2012-05-04. Citováno 2010-01-22.
^ „HPL - přenosná implementace vysoce výkonného standardu Linpack pro počítače s distribuovanou pamětí“. Inovativní výpočetní laboratoř, University of Tennessee v Knoxville. Citováno 2015-06-10.
^ „STREAM: Udržitelná šířka pásma paměti ve vysoce výkonných počítačích“. Citováno 2015-06-10.
^ „Efektivní měřítko šířky pásma (b_eff)“. High Performance Computing Center Stuttgart. Citováno 2015-06-10.
^ Benchmark je navržen tak, aby umožňoval nahrazení omezené sady funkcí více optimalizovanými verzemi při zachování „základního“ běhu. Další (ale stále omezené) úpravy jsou povoleny v kategorii „optimalizovaných“ běhů.
^ „Soutěž HPC Challenge Award“. Program DARPA HPCS. Citováno 2010-01-23.

externí odkazy

Oficiální webové stránky HPC Challenge Benchmark
Oficiální webové stránky soutěže HPC Challenge Award
Srovnávací test náhodného přístupu BSS Vyhodnocení výkonu a optimalizace náhodného přístupu do paměti na vícejádrových procesorech s vysokou produktivitou (cena za nejlepší papír) na webu ACM / IEEE HiPC 2010

[1] „Superpočítač Cray X1 má nejvyšší vykázaná skóre v testech HPC Challenge Benchmark sponzorovaných vládou“. 14.06.2004. Archivovány od originál dne 2012-05-04. Citováno 2010-01-22.

[2] „HPL - přenosná implementace vysoce výkonného standardu Linpack pro počítače s distribuovanou pamětí“. Inovativní výpočetní laboratoř, University of Tennessee v Knoxville. Citováno 2015-06-10.

[3] „STREAM: Udržitelná šířka pásma paměti ve vysoce výkonných počítačích“. Citováno 2015-06-10.

[4] „Efektivní měřítko šířky pásma (b_eff)“. High Performance Computing Center Stuttgart. Citováno 2015-06-10.

[5] Benchmark je navržen tak, aby umožňoval nahrazení omezené sady funkcí více optimalizovanými verzemi při zachování „základního“ běhu. Další (ale stále omezené) úpravy jsou povoleny v kategorii „optimalizovaných“ běhů.

[6] „Soutěž HPC Challenge Award“. Program DARPA HPCS. Citováno 2010-01-23.

[1]

[2]

[3]

[4]

[5]

[6]