Algoritmy škálování pixel-art - Pixel-art scaling algorithms

Algoritmy škálování pixel-art jsou grafické filtry, které se často používají v emulátory herních konzolí vylepšit ručně kreslené 2D pixel umění grafika. Změna měřítka pixelového umění je specializovaným dílčím oborem změna měřítka obrazu.

Tak jako pixelové umění grafika je obvykle velmi nízká rozlišení spoléhají na pečlivé umisťování jednotlivých pixelů, často s omezenou paletou barev. To má za následek grafiku, která se při definování složitých tvarů s velmi malým rozlišením, až po jednotlivé pixely, spoléhá na velké množství stylizovaných vizuálních podnětů, díky kterým je měřítko obrazu pixelového umění obzvláště obtížným problémem.

Řada specializovaných algoritmů[1] byly vyvinuty pro práci s pixelovou grafikou, protože tradiční algoritmy škálování neberou v úvahu takové vjemové narážky.

Protože typické použití této technologie zlepšuje vzhled čtvrtá generace a dříve videohry na arkádových a konzolových emulátorech je mnoho z nich navrženo tak, aby fungovalo v reálném čase pro dostatečně malé vstupní obrázky při 60 snímků za sekundu. Toto omezuje typ programování techniky, které lze použít pro tento druh zpracování v reálném čase. Mnoho pracuje pouze na konkrétních faktorech měřítka: 2 × je nejběžnější, přičemž jsou přítomny také 3 ×, 4 ×, 5 × a 6 ×.

Porovnání běžných algoritmů škálování pixel-art. Zobrazit rozdíly v plném rozlišení.

Algoritmy

SAA5050 'diagonální vyhlazování'

The Mullard SAA5050 Čip generátoru znaků teletextu (1980) použil algoritmus primitivního škálování pixelů ke generování znaků s vyšším rozlišením na obrazovce z reprezentace s nižším rozlišením z jeho vnitřní ROM. Každý tvar znaku byl interně definován na mřížce 5 × 9 pixelů, která byla poté interpolována vyhlazováním úhlopříček, čímž byl získán znak 10 × 18 pixelů, s charakteristicky hranatým tvarem, obklopený nahoře a vlevo dvěma pixely mezery . Algoritmus funguje pouze na monochromatických zdrojových datech a předpokládá, že zdrojové pixely budou logické pravdivé nebo nepravdivé v závislosti na tom, zda jsou „zapnuty“ nebo „vypnuty“. Předpokládá se, že pixely „mimo vzor mřížky“ jsou vypnuté.[2][3][4]

Algoritmus funguje následovně:

A B C -  1 2D E F - / 3 41 = B | (A & E &! B &! D) 2 = B | (C & E &! B &! F) 3 = E | (! A &! E & B & D) 4 = E | (! C &! E & B & F) 

Všimněte si, že tento algoritmus, podobně jako níže uvedený Eagleův algoritmus, má chybu: Pokud se objeví vzor 4 pixelů ve tvaru dutého kosočtverce, bude dutina expanzí vyhlazena. Interní znak ROM SAA5050 se opatrně vyhýbá tomu, aby tento vzor nikdy nepoužíval.

EPX / Scale2 × / AdvMAME2 ×

Eric's Pixel Expansion (EPX) je algoritmus vyvinutý společností Eric Johnston na LucasArts kolem roku 1992, kdy portoval SCUMM motorové hry od IBM PC (které běžely na 320 × 200 × 256 barev) až po rané barevné počítače Macintosh, které běžely na víceméně dvojnásobném rozlišení.[5]Algoritmus funguje následovně a rozšiřuje P na 4 nové pixely na základě okolí P:

Algoritmus EPX rozšiřuje pixel P na čtyři nové pixely.

 1 = P; 2 = P; 3 = P; 4 = P; IF C == A => 1 = A IF A == B => 2 = B IF D == C => 3 = C IF B == D => 4 = D IF A, B, C, D, tři nebo více identických: 1 = 2 = 3 = 4 = P

Pozdější implementace tohoto stejného algoritmu (jako AdvMAME2 × a Scale2 ×, vyvinuté kolem roku 2001) mají o něco efektivnější, ale funkčně identickou implementaci:

 1 = P; 2 = P; 3 = P; 4 = P; IF C == A AND C! = D AND A! = B => 1 = A IF A == B AND A! = C AND B! = D => 2 = B IF D == C AND D! = B AND C! = A => 3 = C IF B == D AND B! = A AND D! = C => 4 = D

AdvMAME2 × je k dispozici v DOSBox přes scaler = advmame2x dosbox.conf volba.

Algoritmus AdvMAME4 × / Scale4 × je pouze EPX aplikován dvakrát, aby se získalo 4 × rozlišení.

Scale3 × / AdvMAME3 × a ScaleFX

EPX lze použít k škálování bitmapových písem. Shora dolů: a) původní velikost písma; b) nejbližší soused 2 × změna měřítka; c) EPX 2 × škálování; d) nejbližší soused 3 × změna měřítka; e) 3 × škálování EPX.

Algoritmus AdvMAME3 × / Scale3 × (k dispozici v DOSBox přes scaler = advmame3x dosbox.conf option) lze považovat za zevšeobecnění EPX na případ 3 ×. Rohové pixely se počítají shodně s EPX.

AdvMAME3x / Scale3x změní měřítko pixelu E na 9 nových pixelů



K dispozici je také varianta vylepšená oproti Scale3 × s názvem ScaleFX, vyvinutá Sp00kyFox, a verze kombinovaná s Reverse-AA s názvem ScaleFX-Hybrid.[6][7]

Orel

Eagle funguje následovně: pro každý in pixel vygenerujeme 4 out pixely. Nejprve nastavte všechny 4 na barvu pixelu, který aktuálně měníme (jako nejbližší soused). Dále se podívejte na tři pixely nahoře vlevo a šikmo nahoře vlevo: pokud jsou všechny tři stejné barvy jako každý jiný, nastavte levý horní pixel našeho výstupního čtverce na tuto barvu přednostně barvě nejbližšího souseda. Fungujte podobně pro všechny čtyři pixely a poté přejděte na další.[8]

Předpokládejme vstupní matici 3 × 3 pixely, kde středem nejvíce pixelu je pixel, který má být změněn, a výstupní matici 2 × 2 pixely (tj. Zmenšený pixel)

první: | Pak. . . -  CC | S T U -  1 2. C. - / CC | V C W - / 3 4.. . | X Y Z | IF V == S == T => 1 = S | IF T == U == W => 2 = U | IF V == X == Y => 3 = X | IF W == Z == Y => 4 = Z

Pokud tedy máme jeden černý pixel na bílém pozadí, zmizí to. Toto je chyba v algoritmu Eagle, ale je řešena jinými algoritmy, jako jsou EPX, 2xSaI a HQ2x.

2 × SaI

2 × SaI, zkratka pro 2 × Scale and Interpolation engine, byl inspirován Eaglem. Byl navržen Derekem Liauwem Kie Fa, také známým jako Kreed, primárně pro použití v konzole a počítači emulátory, a to zůstalo docela populární v tomto výklenku. Mnoho z nejpopulárnějších emulátorů, včetně ZSNES a VisualBoyAdvance, nabídněte tento algoritmus škálování jako funkci. K dispozici je několik mírně odlišných verzí škálovacího algoritmu, které se často označují jako Super 2 × SaI a Super orel.

Matice okolních pixelů, kterou Super2xSaI používá k škálování jednoho pixelu.

Rodina 2xSaI pracuje na matici pixelů 4 × 4, kde je měřítko pixelu označeného níže:

I E F JG A B K -  W XH C D L - / Y ZM N O P

Pro 16bitové pixely používají pixelové masky, které se mění podle toho, zda je 16bitový formát pixelu 565 nebo 555. colorMask, lowPixelMask, qColorMask, qLowPixelMask, redBlueMask, a zelená maska jsou 16bitové masky. Dolních 8 bitů je identických v obou pixelových formátech.

Jsou popsány dvě interpolační funkce:

INTERPOLATE (uint32 A, UINT32 B) if (A == B) return A; návrat (((A & colorMask) >> 1) + ((B & colorMask) >> 1) + (A & B & lowPixelMask)); Q_INTERPOLATE (uint32 A, uint32 B, uint32 C, uint32 D) x = ( (A & qColorMask) >> 2) + ((B & qColorMask) >> 2) + ((C & qColorMask) >> 2) + ((D & qColorMask) >> 2); y = (A & qLowPixelMask) + (B & qLowPixelMask) + (C & qLowPixelMask) + (D & qLowPixelMask); y = (y >> 2) & qLowPixelMask; návrat x + y;

Algoritmus kontroluje A, B, C a D na diagonální shodu takové, že A == D a B! = C, nebo naopak, nebo pokud jsou obě úhlopříčky, nebo pokud neexistuje žádná úhlopříčka. V rámci nich kontroluje tři nebo čtyři identické pixely. Na základě těchto podmínek se algoritmus rozhodne, zda pro každý výstupní pixel použije jednu z A, B, C nebo D nebo interpolaci pouze mezi těmito čtyřmi. Libovolný scaler 2xSaI může zvětšit jakýkoli obrázek na jakékoli rozlišení a k interpolaci pixelů používá bilineární filtrování.

Od vydání Kreed[9] zdrojový kód pod GNU General Public License, je volně k dispozici všem, kteří si to přejí využít v projektu vydaném na základě této licence. Vývojáři, kteří by jej chtěli použít v projektu, který není GPL, by museli přepsat algoritmus bez použití jakéhokoli existujícího kódu společnosti Kreed.

Je k dispozici v DosBox přes scaler = 2xsai volba.

ústředínx rodina

Maxim Stepin 'hq2x, hq3x a hq4x jsou pro měřítkové faktory 2: 1, 3: 1 a 4: 1. Každý pracuje tak, že porovnává barevnou hodnotu každého pixelu s hodnotami svých osmi bezprostředních sousedů, označuje sousedy jako blízké nebo vzdálené a pomocí předgenerované vyhledávací tabulky vyhledá správný podíl hodnot vstupních pixelů pro každou ze 4, 9 nebo 16 odpovídajících výstupních pixelů. Rodina hq3x dokonale vyhladí jakoukoli diagonální čáru, jejíž sklon je ± 0,5, ± 1 nebo ± 2 a která není na vstupu vyhlazena; jeden s jakýmkoli jiným sklonem bude na výstupu střídat dva svahy. Rovněž vyhladí velmi těsné křivky. Na rozdíl od 2xSaI vyhlazuje výstup.[10]

ústředínx byl původně vytvořen pro emulátor Super Nintendo ZSNES. Autor bsnes vydala prostorově efektivní implementaci hq2x do veřejné sféry.[11] Přístav do shadery, který má srovnatelnou kvalitu jako dřívější verze xBR, je k dispozici.[12] Před portem byl shader s názvem "scalehq" často zaměňován za hqx.[13]

Rodina xBR

V této rodině je 6 filtrů: xBR , xBRZ, xBR-Hybrid, Super xBR, xBR + 3D a Super xBR + 3D.

xBR ("scale by rules"), vytvořený Hyllianem, funguje podobně jako HQx (na základě rozpoznávání vzorů) a vygeneruje stejný výsledek jako HQx, pokud bude uveden výše uvedený vzor.[14] Jde však dále než HQx pomocí dvoustupňové sady interpolace pravidla, která lépe zvládají složitější vzorce, jako např vyhlazený čáry a křivky. Škálované textury pozadí zachovávají ostré charakteristiky původního obrazu, místo aby byly rozmazané, jako to obvykle dělá HQx (v praxi často ScaleHQ). Nejnovější verze xBR jsou víceprůchodové a mohou lépe uchovat malé detaily. K dispozici je také verze xBR kombinovaná se shaderem Reverse-AA s názvem xBR-Hybrid.[15] xBR + 3D je verze s 3D maskou, která filtruje pouze 2D prvky.

xBRZ od Zenju je upravená verze xBR. Je implementován od nuly jako filtr založený na CPU v C ++ .[16] Používá stejnou základní myšlenku jako rozpoznávání a interpolace vzorů xBR, ale s jinou sadou pravidel navrženou tak, aby zachovala jemné detaily obrazu tak malé jako několik pixelů. Díky tomu je užitečné pro změnu měřítka detailů na tvářích, zejména v očích. xBRZ je optimalizován pro vícejádrové procesory a 64bitové architektury a vykazuje o 40–60% lepší výkon než HQx, i když běží pouze na jediném jádru CPU.[Citace je zapotřebí ] Podporuje škálování obrázků s alfa kanálem a škálování pomocí celočíselných faktorů od 2 × do 6 ×.

Super xBR[17][18] je algoritmus vyvinutý společností Hylian v roce 2015. Nelineárním způsobem využívá některé kombinace známých lineárních filtrů spolu s pravidly detekce hran xBR. Funguje ve dvou průchodech a může pouze zvětšit obraz o dva (nebo násobky dvou jeho opětovným použitím a má také filtr proti vyzvánění). Super xBR + 3D je verze s 3D maskou, která filtruje pouze 2D prvky. K dispozici je také verze Super xBR přepsaná v C / C ++.[19]

RotSprite

Vlevo: Originální obrazový obrázek v pixelech
Uprostřed: Obrázek otočený pomocí algoritmu rotace nejbližšího souseda
Vpravo: Obrázek se otáčí pomocí algoritmu RotSprite

RotSprite je algoritmus změny měřítka a rotace pro skřítky vyvinutý společností Xenowhirl. Produkuje mnohem méně artefaktů než algoritmy rotace nejbližšího souseda a podobně jako EPX nezavádí do obrazu nové barvy (na rozdíl od většiny interpolačních systémů).[20]

Algoritmus nejprve zmenší obraz na 8násobek své původní velikosti pomocí upraveného algoritmu Scale2 ×, který s podobnými pixely zachází jako se shodami. Potom (volitelně) vypočítá, jaké posunutí rotace se použije upřednostňováním vzorkovaných bodů, které nejsou hraničními pixely. Dále je otočený obraz vytvořen pomocí algoritmu změny měřítka a rotace nejbližšího souseda, který současně zmenší velký obrázek zpět na původní velikost a otočí obrázek. Nakonec jsou přehlížené podrobnosti jednoho pixelu (volitelně) obnoveny, pokud je odpovídající pixel ve zdrojovém obrázku jiný a cílový pixel má tři identické sousedy.[21]

Fast RotSprite

Fast RotSprite je algoritmus rychlé rotace pro pixelové umění vyvinutý Olegem Mekekechkem pro Pixel Studio aplikace. Je to založeno na RotSprite ale má lepší výkon s mírnou ztrátou kvality. Je schopen zpracovávat větší obrázky v reálném čase. Namísto 8 × upscale používá Fast RotSprite jeden 3 × upscale. Pak jednoduše otočí všechny pixely se zaoblenými souřadnicemi. Nakonec provede 3 × zmenšení měřítka bez zavedení nových barev. Jelikož jsou všechny operace v každém kroku nezávislé, lze je provádět paralelně a výrazně tak zvýšit výkon.

Kopf – Lischinski

Algoritmus Kopf – Lischinski je nový způsob, jak extrahovat rozlišení nezávislé vektorová grafika z pixelového umění popsaného v dokumentu „Depixelizing Pixel Art“ z roku 2011.[22] K dispozici je implementace Pythonu.[23]

Algoritmus byl přenesen na GPU a optimalizován pro vykreslování v reálném čase. The zdrojový kód je k dispozici pro tuto variantu.[24]

Edge-Directed Interpolation (EDI)

Edge-Interpolation (EDI) popisuje techniky upscalingu, které používají statistické vzorkování k zajištění kvality obrazu při jeho zvětšování.[25][26] Existovalo několik dřívějších metod, které zahrnovaly detekci hran pro generování směšovacích vah pro lineární interpolaci nebo klasifikaci pixelů podle jejich sousedních podmínek a použití různých jinak izotropních interpolačních schémat založených na klasifikaci. Jakýkoli daný přístup interpolace se scvrkává na vážené průměry sousedních pixelů. Cílem je najít optimální váhy. Bilineární interpolace nastaví všechny váhy na stejné. Metody interpolace vyšších řádů, jako je bikubická nebo sinusová interpolace, berou v úvahu větší počet sousedů než jen ty sousední.

NEDI

NEDI (New Edge-Directed Interpolation) počítá lokální kovariance v původním obrazu a používá je k přizpůsobení interpolace ve vysokém rozlišení. Jedná se o prototypový filtr této rodiny.[27]

EDIUpsizer

EDIUpsizer[28] je filtr převzorkování, který převádí obraz o faktor dva vodorovně i svisle pomocí NEDI (nová okrajová interpolace).[27] EDIUpsizer také používá několik úprav základního NEDI, aby zabránil mnoha artefaktům, které NEDI vytváří v podrobných oblastech. Patří mezi ně testování počtu podmínek a velikost adaptivního okna,[29] stejně jako omezení omezení. Všechny úpravy a omezení NEDI jsou volitelné (lze je zapnout a vypnout) a lze je konfigurovat uživatelem. Všimněte si, že tento filtr je poměrně pomalý

FastEDIUpsizer

FastEDIUpsizer je zeštíhlená verze EDIUpsizer, která je o něco více vyladěna na rychlost. Používá konstantní velikost okna 8 × 8, provádí pouze NEDI v rovině lumy a jako metodu záložní interpolace používá pouze bikubickou nebo bilineární interpolaci.

eedi3

Další interpolační filtr orientovaný na okraj. Funguje tak, že minimalizuje nákladovou funkci zahrnující každý pixel ve skenovací řádce. Je to pomalé.

EEDI2

EEDI2 změní velikost obrázku o 2 × ve svislém směru zkopírováním existujícího obrázku do 2⋅y (n) a interpolací chybějícího pole. Je určena pro interpolaci orientovanou na hranu pro odstraňování prokladu (tj. Není ve skutečnosti vytvořena pro změnu velikosti normálního obrazu, ale může to také udělat). EEDI2 lze použít s TDeint i TIVTC, další informace o tom najdete v diskusním odkazu.[30]

SuperRes

SuperRes[31] shadery používají jinou metodu škálování, kterou lze použít v kombinaci s NEDI (nebo jiným algoritmem škálování). Tato metoda je zde podrobně vysvětlena.[32] Zdá se, že tato metoda poskytuje lepší výsledky než pouhé použití NEDI a konkuruje výsledkům NNEDI3. Ty jsou nyní také k dispozici jako skript MPDN.

NNEDI

NNEDI je rodina uvnitř pole odstraňovače prokladu který lze také použít ke zvětšení obrázků o mocniny dvou. Když se používá jako odstraňovač prokladu, převezme rámec, vyhodí jedno pole a poté interpoluje chybějící pixely pouze pomocí informací z uchovaného pole. Dosud existují tři hlavní generace NNEDI.

NNEDI, původní verze, pracuje se vstupy YUY2 a YV12.[33] NNEDI2 přidal podporu RGB24 a speciální funkci nnedi2_rpow2 pro upscaling. NNEDI3 vylepšuje NNEDI2 pomocí prediktoru nervová síť. Jak velikost sítě, tak okolí, které zkoumá, lze vylepšit pro kompromis kvality a rychlosti:[34]

Toto je volba kvality vs rychlosti; rozdíly mezi množstvím neuronů pro konkrétní faktor změny velikosti jsou však obvykle malé, avšak rozdíl ve výkonu mezi počtem neuronů se zvětší, když velikost obrázku zvětšíte čtyřnásobně. Pokud plánujete pouze zdvojnásobení rozlišení, pak neuvidíte obrovské rozdíly mezi 16 a 256 neurony. Stále existuje znatelný rozdíl mezi nejvyšší a nejnižší možností, ale ne řádově odlišné.[35]

Reference

  1. ^ „Scalers pixelů“. Citováno 19. února 2016.
  2. ^ „Datový list Mullard SAA5050“ (PDF).
  3. ^ „Vyhlazování zdrojového kódu SAA5050 z projektu MAME“.
  4. ^ „Příspěvek na fóru zobrazující referenční testovací stránku teletextu na čipu SAA5050“.
  5. ^ Thomas, Kas (1999). „Fast Blit Strategies: A Mac Programmer's Guide“. MacTech.
  6. ^ libretro. "common-shaders / scalenx at master · libretro / common-shaders · GitHub". GitHub. Citováno 19. února 2016.
  7. ^ „ScaleNx - Odstranění artefaktů a vylepšení algoritmů [Archiv]“. Archivovány od originál dne 2016-05-27. Citováno 2016-05-27.
  8. ^ „Orel (nápad)“. Vše2. 2007-01-18.
  9. ^ „Domovská stránka Kreed: 2xSaI“. Citováno 25. dubna 2020.
  10. ^ Stepine, Maxime. „filtr zvětšení hq3x“. Archivovány od originál dne 2007-07-03. Citováno 2007-07-03.
  11. ^ Byuu. Oznámení o vydání Zpřístupněno 14. 8. 2011.
  12. ^ libretro. "common-shaders / hqx at master · libretro / common-shaders · GitHub". GitHub. Citováno 19. února 2016.
  13. ^ Hunter K. „Filthy Pants: A Computer Blog“. Citováno 19. února 2016.
  14. ^ "Výukový program pro algoritmus xBR". 2012-09-18. Citováno 19. února 2016.
  15. ^ libretro. "common-shaders / xbr at master · libretro / common-shaders · GitHub". GitHub. Citováno 19. února 2016.
  16. ^ zenju. „xBRZ“. SourceForge. Citováno 19. února 2016.
  17. ^ „Super-xBR.pdf“. Google dokumenty. Citováno 19. února 2016.
  18. ^ libretro. "common-shaders / xbr / shaders / super-xbr at master · libretro / common-shaders · GitHub". GitHub. Citováno 19. února 2016.
  19. ^ „Super-XBR portován na C / C ++ (pouze verze rychlého shaderu))“. 6. března 2016.
  20. ^ "RotSprite". Sonic Retro. Citováno 19. února 2016.
  21. ^ "Sprite Rotation Utility". Retro nástěnka Sonic and Sega. Citováno 19. února 2016.
  22. ^ Johannes Kopf a Dani Lischinski (2011). „Depixelizing pixel art“. Transakce ACM v grafice. SIGGRAPH. 30 (4): 99:1–99:8. doi:10.1145/2010324.1964994. Citováno 2016-05-22.
  23. ^ Vemula, Anirudh; Yeddu, Vamsidhar (29. dubna 2019). „Pixel-Art: Implementujeme slavný papír„ Depixelizing Pixel Art “od Kopfa a Lischinského.“.
  24. ^ Kreuzer, Felix; Kopf, Johannes; Wimmer, Michael (2015). „Depixelizing Pixel Art in Real-time“. Sborník 19. sympozia o interaktivní 3D grafice a hrách. ACM: 130. doi:10.1145/2699276.2721395. ISBN  9781450333924.
  25. ^ „Edge-Directed Interpolation“. chiranjivi.tripod.com. Citováno 2019-05-07.
  26. ^ "Shader implementace NEDI algoritmu - fórum Doom9". forum.doom9.org. Citováno 2019-05-07.
  27. ^ A b Li, Xin (2010-11-26). „Nová interpolace zaměřená na hrany“ (PDF). Archivovány od originál (PDF) dne 26. 11. 2010. Citováno 2019-05-07.
  28. ^ Avisynth filtry společnosti tritical
  29. ^ https://web.archive.org/web/20041221052401/http://www.cs.ucdavis.edu/~bai/ECS231/finaltzeng.pdf
  30. ^ „TDeint a TIVTC - strana 21 - fórum Doom9“. Citováno 19. února 2016.
  31. ^ "nnedi3 vs NeuronDoubler - fórum Doom9". Citováno 19. února 2016.
  32. ^ „Shader implementace NEDI algoritmu - Strana 6 - Fórum Doom9“. Citováno 19. února 2016.
  33. ^ „NNEDI - intra-field deinterlacing filter - Doom9's Forum“. Citováno 19. února 2016.
  34. ^ „Nnedi3“. AviSynth. Citováno 2019-05-07.
  35. ^ tritical (2019-04-30), nnedi3 - Readme.txt, vyvoláno 2019-05-07

Viz také

  • libretro - implementuje mnoho výše zmíněných algoritmů jako shadery