AoS a SoA - AoS and SoA
v výpočetní, Pole struktur (AoS), Struktura polí (SoA) a Pole struktur polí (AoSoA) odkazují na kontrastní způsoby uspořádání sekvence evidence v Paměť, s ohledem na prokládání, a zajímají se o SIMD a SIMT programování.
Struktura polí
Struktura poles (nebo SoA) je rozložení oddělující prvky a záznam (nebo "struktura" v Programovací jazyk C. ) do jednoho paralelní pole za pole.[1] Motivací je snazší manipulace s balíčky Pokyny SIMD ve většině architektury instrukční sady, protože singl SIMD registr lze načíst homogenní data, případně přenesený širokým interní datová cesta (např. 128 bitů ). Pokud je potřeba pouze konkrétní část záznamu, je třeba iterovat pouze tyto části, což umožňuje, aby se více dat vešlo na jeden řádek mezipaměti. Nevýhoda vyžaduje více způsoby mezipaměti při procházení dat a neefektivní indexované adresování (viz také: formát rovinného obrazu ).
Chcete-li například uložit N bodů do 3D prostoru pomocí struktury polí:
1 struktur pointlist3D {2 plovák X[N];3 plovák y[N];4 plovák z[N];5 };6 struktur pointlist3D bodů;7 plovák get_point_x(int i) { vrátit se bodů.X[i]; }
Pole struktur
Pole strukturys (nebo AoS) je opačné (a konvenčnější) rozložení, ve kterém jsou prokládána data pro různá pole. To je často intuitivnější a většina ho podporuje přímo programovací jazyky.
Chcete-li například uložit N bodů do 3D prostoru pomocí pole struktur:
1 struktur bod3D {2 plovák X;3 plovák y;4 plovák z;5 };6 struktur bod3D bodů[N];7 plovák get_point_x(int i) { vrátit se bodů[i].X; }
Pole struktur polí
Pole struktur poles (nebo AoSoA) je hybridní přístup mezi předchozími rozloženími, ve kterém jsou data pro různá pole prokládána pomocí dlaždic nebo bloků s velikostí rovnou velikosti vektoru SIMD. To je často méně intuitivní, ale lze dosáhnout propustnosti paměti přístupu SoA, přičemž je šetrnější k místu mezipaměti a architekturám portů zatížení moderních procesorů.[2]
Například pro uložení N bodů v 3D prostoru pomocí pole struktur struktur s šířkou registru SIMD 8:
1 struktur point3Dx8 {2 plovák X[8];3 plovák y[8];4 plovák z[8];5 };6 struktur point3Dx8 bodů[(N+7)/8];7 plovák get_point_x(int i) { vrátit se bodů[i/8].X[i%8]; }
Alternativy
Tato sekce případně obsahuje původní výzkum.Srpna 2019) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Je možné rozdělit určitou podmnožinu struktury (spíše než každé jednotlivé pole) na a paralelní pole -, a to se ve skutečnosti může zlepšit referenční lokalita pokud jsou v programu použity různé části polí v různých časech (viz datově orientovaný design ).
Nějaký SIMD architektury poskytují pokyny pro nakládku / skladování načíst homogenní data z formátu SoA. V některých se používá ještě další možnost Buňka libraries is to de-interleave data from the AoS format when loading sources into registers, and interleave when writing out results (facilitated by the superskalární problém z permutuje ). Nějaký vektorové matematické knihovny sladit plovoucí bod 4D vektory s registrem SIMD, aby využily přidruženou datovou cestu a instrukce, a přitom stále poskytovaly pohodlí programátora, i když to není měřítko na jednotky SIMD širší než čtyři pruhy.
4D vektory
AoS vs. SoA představuje volbu při zvažování 3D nebo 4D vektorových dat na strojích se čtyřproudovým hardwarem SIMD. SIMD ISA jsou obvykle navrženy pro homogenní data, některé však poskytují a Tečkovaný produkt návod[3] a další permuty, což usnadňuje manipulaci s kufříkem AoS. Ačkoli většina GPU hardware se přesunul z 4D instrukcí na skalární SIMT potrubí,[4] moderní výpočetní jádra používání SoA může stále poskytovat lepší výkon díky sloučení paměti.[5]
Softwarová podpora
Většina jazyků podporuje formát AoS přirozenější kombinací záznamů a různých polí abstraktní datové typy. Vlastnosti experimentu zaměřené na SIMD Programovací jazyk JAI je nedávný pokus o poskytnutí podpory SoA na jazykové úrovni.[6] Julie podporuje vícerozměrná pole s AoS nebo SoA (prostřednictvím balíčku). The Datadraw generátor kódu vytváří datové struktury SoA pro jazyk C. The X Makro k naplnění SoA v době kompilace lze použít techniku pro preprocesor C.
Reference
- ^ „Jak manipulovat se strukturou dat za účelem optimalizace využití paměti“. Intel. 09.02.2012. Citováno 2019-03-17.
- ^ "Transformace rozložení paměti". Intel. 2019-03-26. Citováno 2019-06-02.
- ^ „Intel SSE4 s plovoucí desetinnou čárkou. Intel. Archivovány od originál dne 2016-06-24. Citováno 2019-03-17.
- ^ „Modern GPU Architecture (See Scalar Unified Pipelines)“ (PDF). NVIDIA. Archivovány od originál (PDF) dne 2018-05-17. Citováno 2019-03-17.
- ^ Kim, Hyesoon (08.02.2010). „Strategie optimalizace CUDA“ (PDF). Designové herní konzole CS4803. Citováno 2019-03-17.
- ^ Blow, Jonathan (2015-01-21). „Data Oriented Demo: SoA, composition“. Citováno 2019-03-17. Demonstrace datově orientovaných a SoA funkcí v jazyce JAI, také s vysvětlením motivace.