Paralelní benchmarky NAS - NAS Parallel Benchmarks

Paralelní benchmarky NAS
Původní autořiNumerický program aerodynamické simulace NASA
VývojářiPokročilá superpočítačová divize NASA
První vydání1991 (1991)
Stabilní uvolnění
3.4
webová stránkanas.nasa.gov/Software/ NPB/

Paralelní benchmarky NAS (NPB) jsou souborem měřítka cílení hodnocení výkonu velmi paralelní superpočítače. Jsou vyvíjeny a udržovány NASA Advanced Supercomputing (NAS) Division (dříve Numerický aerodynamický simulační program NASA) založený na Výzkumné centrum NASA Ames. NAS získává výsledky výkonu pro NPB ze všech zdrojů.[1]

Dějiny

Motivace

Tradiční měřítka, která existovala před NPB, například Livermore smyčky, Benchmark LINPACK a Srovnávací program jádra NAS, se obvykle specializovali na vektorové počítače. Obecně trpěli nedostatky, včetně omezení ladění bránících paralelismu a nedostatečných velikostí problémů, které je činí nevhodnými pro vysoce paralelní systémy. Stejně nevhodné byly aplikační měřítka v plném rozsahu kvůli vysokým nákladům na portování a nedostupnosti nástrojů pro automatickou softwarovou paralelizaci.[2] Výsledkem je, že NPB byly vyvinuty v roce 1991[3] a vydána v roce 1992[4] řešit následný nedostatek referenčních hodnot platných pro vysoce paralelní stroje.

NPB 1

První specifikace NPB uznala, že by měřítka měla fungovat

  • nové algoritmické a softwarové metody s paralelním vědomím,
  • obecnost a neutrálnost architektury,
  • snadná ověřitelnost správnosti výsledků a údajů o výkonu,
  • schopnost pojmout nové systémy se zvýšeným výkonem,
  • a snadná distribuovatelnost.

Ve světle těchto pokynů bylo považováno za jediný životaschopný přístup k použití souboru referenčních hodnot „papír a tužka“, které specifikovaly soubor problémů pouze algoritmicky a za určitých nezbytných omezení ponechaly většinu podrobností implementace na uvážení implementátora.

NPB 1 definoval osm benchmarků, každý ve dvou velikostech problému dabovaný Třída A a Třída B. Ukázkové kódy napsané v Fortran 77 byly dodány. Použili malou velikost problému Třída S. a nebyly určeny pro srovnávací účely.[2]

NPB 2

Od svého vydání NPB 1 vykazoval dvě hlavní slabosti. Za prvé, díky své specifikaci „papír a tužka“ prodejci počítačů obvykle velmi vyladili své implementace tak, aby jejich výkon byl pro vědecké programátory obtížný. Zadruhé, mnoho z těchto implementací bylo vlastnických a nebylo veřejně dostupných, což účinně zakrývalo jejich optimalizační techniky. Zadruhé, problémové velikosti NPB 1 zaostávaly za vývojem superpočítačů, které se dále vyvíjely.[3]

NPB 2, vydané v roce 1996,[5][6] přišel s implementacemi zdrojového kódu pro pět z osmi benchmarků definovaných v NPB 1, aby doplnil, ale nenahradil NPB 1. Rozšířil benchmarky o aktuální velikost problému Třída C.. Rovněž změnila pravidla pro předkládání výsledků srovnávacích testů. Nová pravidla zahrnovala explicitní požadavky na výstupní soubory i upravené zdrojové soubory a vytváření skriptů, aby byla zajištěna veřejná dostupnost úprav a reprodukovatelnost výsledků.[3]

NPB 2.2 obsahoval implementace dalších dvou benchmarků.[5] NPB 2.3 z roku 1997 byla první úplnou implementací v roce 2006 MPI.[4] Dodává se se sériovými verzemi testovacích hodnot konzistentních s paralelními verzemi a definuje velikost problému Třída W pro systémy s malou pamětí.[7] NPB 2.4 z roku 2002 nabídl novou implementaci MPI a zavedl další stále větší velikost problému Třída D.[6] To také rozšířilo jeden benchmark o I / O -intenzivní podtypy.[4]

NPB 3

NPB 3 si zachoval implementaci MPI z NPB 2 a přišel ve více příchutích, a to OpenMP,[8] Jáva[9] a Vysoce výkonný Fortran.[10] Tyto nové paralelní implementace byly odvozeny od sériových kódů v NPB 2.3 s dalšími optimalizacemi.[7] NPB 3.1 a NPB 3.2 přidaly další tři měřítka,[11][12] které však nebyly k dispozici u všech implementací; NPB 3.3 představil a Třída E velikost problému.[7] Na základě jednozónové NPB 3 byla pod názvem uvolněna sada vícezónových měřítek využívajících hybridní programovací model MPI / OpenMP NPB - vícezónová (NPB-MZ) pro „testování účinnosti víceúrovňových a hybridních paradigmat a nástrojů paralelizace“.[1][13]

Referenční hodnoty

Od verze NPB 3.3 je definováno jedenáct referenčních hodnot, jak je shrnuto v následující tabulce.

MěřítkoNázev odvozen od[2]K dispozici odPopis[2]Poznámky
MGMultiGzbavitNPB 1[2]Přibližte řešení k trojrozměrnému diskrétní Poissonova rovnice pomocí V-cyklu multigridová metoda
CGConjugát GzářivýOdhadněte nejmenší vlastní číslo velké řídký symetrický pozitivně definitivní matice za použití inverzní iterace s metoda konjugovaného gradientu jako podprogram pro řešení soustavy lineárních rovnic
FTRychle Fnáš TransformŘešit trojrozměrný parciální diferenciální rovnice (PDE) pomocí rychlá Fourierova transformace (FFT)
JEnteger SortSeřadit malá celá čísla pomocí kbelík třídění[5]
EPEmbarrassingly PparalelněGenerovat nezávislé Gaussian náhodné variace za použití Marsaglia polární metoda
BTBzámek TridiagonalVyřešte syntetický systém nelineární PDE pomocí tří různých algoritmů zahrnujících blokovat tridiagonální, skalární pentadiagonální a symetrické postupná nadměrná relaxace (SSOR) jádra řešiče
  • Benchmark BT má subtypy náročné na I / O[4]
  • Všechny tři měřítka mají vícezónové verze[13]
SPScalar Pentadiagonální[6]
LULower-Upper symetrický Gauss-Seidel[6]
UAUstrukturovaný Akřestní[11]NPB 3.1[7]Řešit Tepelná rovnice s konvekcí a difúzí z pohybující se koule. Síť je adaptivní a přepočítává se při každém 5. kroku.
DCData Cube operátor[12]
DTData Trafinovaný[7]NPB 3.2[7]

Reference

  1. ^ A b „Změny paralelních referenčních hodnot NAS“. Pokročilá superpočítačová divize NASA. Citováno 2009-02-23.
  2. ^ A b C d E Baily, D .; Barszcz, E .; Barton, J .; Browning, D .; Carter, R .; Dagum, L .; Fatoohi, R .; Fineberg, S .; Frederickson, P .; Weeratunga, S. (březen 1994), „Paralelní benchmarky NAS“ (PDF), Technická zpráva NAS RNR-94-007, NASA Ames Research Center, Moffett Field, CA.
  3. ^ A b C Bailey, D .; Harris, T .; Saphir, W .; van der Wijngaart, R .; Woo, A .; Yarrow, M. (prosinec 1995), „NAS Parallel Benchmarks 2.0“ (PDF), Technická zpráva NAS NAS-95-020, NASA Ames Research Center, Moffett Field, CA.
  4. ^ A b C d Wong, P .; van der Wijngaart, R. (leden 2003), „NAS Parallel Benchmarks I / O verze 2.4“ (PDF), Technická zpráva NAS NAS-03-002, NASA Ames Research Center, Moffett Field, CA.
  5. ^ A b C Saphir, W .; van der Wijngaart, R .; Woo, A .; Yarrow, M., Nové implementace a výsledky pro NAS Parallel Benchmarky 2 (PDF), NASA Ames Research Center, Moffett Field, CA.
  6. ^ A b C d van der Wijngaart, R. (říjen 2002), „NAS Parallel Benchmarks verze 2.4“ (PDF), Technická zpráva NAS NAS-02-007, NASA Ames Research Center, Moffett Field, CA.
  7. ^ A b C d E F „Změny paralelních benchmarků NAS“. Pokročilá superpočítačová divize NASA. Citováno 2009-03-17.
  8. ^ Jin, H .; Frumkin, M .; Yan, J. (říjen 1999), „Implementace OpenMP NAS Parallel Benchmarky a její výkon“ (PDF), Technická zpráva NAS NAS-99-011, NASA Ames Research Center, Moffett Field, CA.
  9. ^ Frumkin, M .; Schultz, M .; Jin, H .; Yan, J., „Implementace NAS Parallel Benchmarks v Javě“ (PDF), Technická zpráva NAS NAS-02-009, NASA Ames Research Center, Moffett Field, CA.
  10. ^ Frumkin, M .; Jin, H .; Yan, J. (září 1998), „Implementace paralelních testů NAS ve vysoce výkonném Fortranu“ (PDF), Technická zpráva NAS NAS-98-009, NASA Ames Research Center, Moffett Field, CA.
  11. ^ A b Feng, H .; van der Wijngaart, F .; Biswas, R .; Mavriplis, C. (červenec 2004), „Nestrukturovaný adaptivní (UA) NAS Parallel Benchmark, verze 1.0“ (PDF), Technická zpráva NAS NAS-04-006, NASA Ames Research Center, Moffett Field, CA.
  12. ^ A b Frumkin, M .; Shabanov, L. (září 2004), „Srovnávání výkonu paměti s operátorem Data Cube“ (PDF), Technická zpráva NAS NAS-04-013, NASA Ames Research Center, Moffett Field, CA.
  13. ^ A b van der Wijngaart, R .; Jin, H. (červenec 2003), „Paralelní benchmarky NAS, vícezónové verze“ (PDF), Technická zpráva NAS NAS-03-010, NASA Ames Research Center, Moffett Field, CA.

externí odkazy