Fúze obrazu s více zaostřeními - Multi-focus image fusion

Přehled

V posledních letech se fúze obrazu používá v mnoha aplikacích, jako je dálkový průzkum Země, dohled, lékařská diagnostika a fotografování. Dvě hlavní aplikace fúze obrazu ve fotografii jsou fúze obrazů s více zaostřením a snímků s více expozicemi.[1][2] Hlavní myšlenkou fúze obrazu je shromažďování důležitých a podstatných informací ze vstupních obrazů do jednoho jediného obrazu, který v ideálním případě obsahuje všechny informace vstupních obrazů.[1][3][4][5] Historie výzkumu fúze obrazu zahrnuje více než 30 let a mnoho vědeckých prací.[2][6] Fúze obrazu má obecně dva aspekty: metody fúze obrazu a metriky objektivního hodnocení.[6]

Ukázka fúze obrazu s více zaostřeními

Multi-focus fúze obrazu je vícenásobná komprese obrazu technika využívající vstupní obrázky s různými hloubky zaostření vytvořit jeden výstupní obraz, který zachová všechny informace. v vizuální senzorové sítě (VSN), senzory jsou kamery, které zaznamenávají obrázky a videosekvence. V mnoha aplikacích VSN nemůže kamera poskytnout dokonalou ilustraci včetně všech detailů scény. Důvodem je omezená hloubka zaostření optického objektivu fotoaparátů. Proto je pouze objekt umístěný v ohniskové vzdálenosti fotoaparátu zaostřený a jasný a ostatní části obrazu jsou rozmazané. VSN zachycuje snímky s různou hloubkou ostrosti pomocí několika fotoaparátů. Vzhledem k velkému množství dat generovaných kamerami ve srovnání s jinými senzory, jako jsou senzory tlaku a teploty, a některými omezeními šířka pásma, spotřeba energie a doba zpracování, je nezbytné zpracovat obrazy místního vstupu, aby se snížilo množství přenášených dat.ref name = ": 2" />

V posledních letech bylo provedeno mnoho výzkumů fúze obrazů s více zaostřeními, které lze rozdělit do dvou kategorií: transformace a prostorová doména. Běžně používané transformace pro fúzi obrazu jsou Diskrétní kosinová transformace (DCT) a multi-scale transformace (MST).[2] [7] Nedávno, Hluboké učení (DL) se daří v několika aplikacích pro zpracování obrazu a počítačové vidění.[1][3][8]

Multi-Focus fúze obrazu v prostorové doméně

Huang a Jing přezkoumali a použili několik měření zaostření v prostorové doméně pro proces fúze obrazu s více fokusy, vhodný pro aplikace v reálném čase. Zmínili některá měření zaostření včetně rozptyl, energie z gradient obrazu (EOG), Tenenbaumův algoritmus (Tenengrad), energie Laplacian (EOL), sum-modified-Laplacian (SML) a prostorová frekvence (SF). Jejich experimenty ukázaly, že EOL poskytl lepší výsledky než jiné metody, jako je rozptyl a prostorová frekvence.[9][5]

Multi-Focus fúze obrazu v multi-scale transformaci a DCT doméně

Fúze obrazu založená na vícerozměrné transformaci je nejčastěji používanou a slibnou technikou. Laplacian pyramida transformace, přechodová pyramidová transformace, morfologická pyramidová transformace a první, diskrétní vlnková transformace, shift-invariantní vlnková transformace (SIDWT) a diskrétní kosinus harmonická vlnková transformace (DCHWT) je několik příkladů metod fúze obrazu založených na víceúrovňové transformaci.[2][5] [7] Tyto metody jsou složité a mají určitá omezení, např. doba zpracování a spotřeba energie. Například metody fúze obrazu s více fokusy založené na DWT vyžadují hodně konvoluce operace, takže jejich zpracování vyžaduje více času a energie. Proto většina metod transformace ve více měřítcích není vhodná pro aplikace v reálném čase.[7][5] Kromě toho tyto metody nejsou na okrajích příliš úspěšné, protože procesu waveletové transformace chybí okraje obrazu. Ve výstupním obrazu vytvářejí vyzváněcí artefakty a snižují jeho kvalitu. Kvůli výše uvedeným problémům v metodách víceúrovňové transformace se vědci zajímají o fúzi obrazu s více fokusy v doméně diskrétní kosinové transformace (DCT). Metody založené na DCT jsou účinnější, pokud jde o přenos a archivaci obrázků kódovaných ve standardu JPEG (Joint Photographic Experts Group) do horního uzlu agenta VSN. Systém JPEG se skládá z dvojice kodéru a dekodéru. V kodéru jsou obrázky rozděleny do nepřekrývajících se bloků 8 × 8 a pro každý z nich se počítají koeficienty DCT. Protože kvantování DCT koeficientů je ztrátový proces, mnoho DCT koeficientů s malou hodnotou je kvantováno na nulu, což odpovídá vysokým frekvencím. Algoritmy fúze obrazu založené na DCT fungují lépe, když jsou v komprimované doméně použity metody fúze obrazu s více fokusy.[7][5] Kromě toho musí být v prostorových metodách vstupní obrázky dekódovány a poté přeneseny do prostorové domény. Po implementaci operací fúze obrazu musí být výstupní fúzované obrázky znovu zakódovány. Metody založené na doméně DCT nevyžadují složité a časově náročné postupné dekódování a kódování. Proto metody fúze obrazu založené na doméně DCT pracují s mnohem méně energie a času na zpracování.[7][5] V poslední době bylo v oblasti DCT provedeno mnoho výzkumů. DCT + Variance, DCT + Corr_Eng, DCT + EOL a DCT + VOL jsou některé prominentní příklady metod založených na DCT [5][7].

Multi-Focus fúze obrazu pomocí Deep Learning

V dnešní době se hluboké učení využívá v aplikacích fúze obrazu, jako je fúze obrazu s více fokusy. Liu a kol. byli prvními vědci, kteří používali CNN pro fúzi obrazu s více fokusy. Použili siamskou architekturu pro srovnání soustředěných a neurčených oprav[4]. C. Du a kol. předložená metoda MSCNN, která získává počáteční segmentovanou rozhodovací mapu s segmentací obrazu mezi zaostřenými a nezaostřenými záplatami prostřednictvím neurální sítě s více měřítky konvoluce[10]. H. Tang a kol. představil pixelovou konvoluční neuronovou síť (p-CNN) pro klasifikaci zaostřených a neurčených oprav [11]. Všechny tyto metody vícenásobného zaostření obrazu založené na CNN vylepšily rozhodovací mapu. Nicméně jejich počáteční segmentované rozhodovací mapy mají spoustu slabostí a chyb. Proto spokojenost jejich konečné rozhodovací mapy fúze závisí na použití rozsáhlých algoritmů následného zpracování, jako je Consistency Verification (CV), morfologické operace, povodí, vodící filtry a odstranění malé oblasti na počáteční segmentované rozhodovací mapě. Spolu s metodami fúze obrazu s více fokusy na bázi CNN se při fúzi obrazu s více fokusy využívá také plně konvoluční síť (FCN).[8][12].

ECNN: Soubor CNN pro vícenásobné zaostření obrazu[1]

Schematický diagram generování tří datových sad podle navrhovaného krmení patchů, které se používá ve výcvikovém postupu ECNN [1]

Metody fúze obrazů založené na konvolučních neuronových sítích (CNN) v poslední době přitahují obrovskou pozornost. Výrazně vylepšili vytvořenou rozhodovací mapu ve srovnání s předchozími nejmodernějšími metodami, které byly provedeny v prostorových a transformačních doménách. Tyto metody však nedosáhly uspokojivé počáteční mapy rozhodování a pro dosažení uspokojivé mapy rozhodování je nutné podstoupit rozsáhlé algoritmy následného zpracování. V metodě ECNN je navržena nová metoda založená na CNN pomocí učení souboru. Je velmi rozumné používat různé modely a datové sady, nikoli jen jeden. Metody založené na učení se souborem mají v úmyslu usilovat o zvyšující se rozmanitost mezi modely a datovými soubory, aby se snížil problém nadměrného vybavení datové sady školení. Je zřejmé, že výsledky souboru CNN jsou lepší než jen jediné CNN. Navrhovaná metoda také zavádí nový jednoduchý typ datové sady obrazů s více fokusy. Jednoduše mění uspořádání patchů víceoborových datových sad, což je velmi užitečné pro získání lepší přesnosti. S tímto novým uspořádáním datových sad se z datové sady COCO generují tři různé datové sady, včetně původní a přechodu ve směrech vertikálních a horizontálních oprav. Proto navrhovaná metoda zavádí novou síť, že tři modely CNN, které byly trénovány na třech různých vytvořených datových sadách, aby vytvořily počáteční segmentovanou mapu rozhodování. Tyto myšlenky značně vylepšují počáteční segmentovanou rozhodovací mapu navrhované metody, která je podobná nebo dokonce lepší než jiná konečná rozhodovací mapa metod založených na CNN získaných po aplikaci mnoha algoritmů následného zpracování. V našich experimentech se používá mnoho skutečných testovacích obrazů s více zaostřením a výsledky se porovnávají s kvantitativními a kvalitativními kritérii. Získané experimentální výsledky naznačují, že navrhovaná síť založená na CNN je přesnější a má lepší rozhodovací mapu bez algoritmů post-processingu než jiné stávající nejmodernější metody fokusní fúze, které používaly mnoho algoritmů post-processingu.

Vývojový diagram navrhované metody ECNN pro získání počáteční segmentované rozhodovací mapy fúze obrazu s více fokusy [1]

Tato metoda zavádí novou síť pro dosažení čistší počáteční segmentované rozhodovací mapy ve srovnání s ostatními. Navrhovaná metoda zavádí novou architekturu, která využívá soubor tří konvolučních neuronových sítí (CNN) trénovaných na třech různých datových sadách. Navrhovaná metoda také připravuje nový jednoduchý typ obrazových datových sad s více zaostřením pro dosažení lepšího výkonu fúze než jiné populární datové sady s více zaostřováním. Tato myšlenka je velmi užitečná k dosažení lepší počáteční segmentované rozhodovací mapy, která je stejná nebo dokonce lepší než ostatní počáteční segmentovaná rozhodovací mapa pomocí rozsáhlých algoritmů následného zpracování. Zdrojový kód ECNN je k dispozici v http://amin-naji.com/publications/ a https://github.com/mostafaaminnaji/ECNN




Schéma navrhované architektury ECNN se všemi podrobnostmi o modelech CNN [1]


Reference

  1. ^ A b C d E F G Amin-Naji, Mostafa; Aghagolzadeh, Ali; Ezoji, Mehdi (2019). "Soubor CNN pro fúzi obrazu s více fokusy". Informační fúze. 51: 201–214. doi:10.1016 / j.inffus.2019.02.003. ISSN  1566-2535.
  2. ^ A b C d Li, Shutao; Kang, Xudong; Fang, Leyuan; Hu, Jianwen; Yin, Haitao (01.01.2017). „Fúze obrazu na úrovni pixelů: průzkum nejnovějšího stavu techniky“. Informační fúze. 33: 100–112. doi:10.1016 / j.inffus.2016.05.004. ISSN  1566-2535.
  3. ^ A b Amin-Naji, Mostafa; Aghagolzadeh, Ali; Ezoji, Mehdi (2019). "Tvrdé hlasování CNN pro fúzi obrazu s více zaostřením". Journal of Ambient Intelligence and Humanized Computing. 11 (4): 1749–1769. doi:10.1007 / s12652-019-01199-0. ISSN  1868-5145.
  4. ^ A b Liu, Yu; Chen, Xun; Peng, Hu; Wang, Zengfu (01.07.2017). "Multi-focus image fusion with a deep convolutional neuron network". Informační fúze. 36: 191–207. doi:10.1016 / j.inffus.2016.12.001. ISSN  1566-2535.
  5. ^ A b C d E F G Amin-Naji, Mostafa; Aghagolzadeh, Ali (2018). „Multi-Focus Image Fusion in DCT Domain using Variance and Energy of Laplacian and Correlation Coefficient for Visual Sensor Networks“. Journal of AI and Data Mining. 6 (2): 233–250. doi:10.22044 / jadm.2017.5169.1624. ISSN  2322-5211.
  6. ^ A b Liu, Yu; Chen, Xun; Wang, Zengfu; Wang, Z. Jane; Ward, Rabab K .; Wang, Xuesong (01.07.2018). „Hluboké učení pro fúzi obrazu na úrovni pixelů: Nedávné pokroky a vyhlídky do budoucna“. Informační fúze. 42: 158–173. doi:10.1016 / j.inffus.2017.10.007. ISSN  1566-2535.
  7. ^ A b C d E F Haghighat, Mohammad Bagher Akbari; Aghagolzadeh, Ali; Seyedarabi, Hadi (01.09.2011). "Vícefokusová fúze obrazu pro sítě vizuálních senzorů v doméně DCT". Počítače a elektrotechnika. Zvláštní vydání pro zpracování obrazu. 37 (5): 789–797. doi:10.1016 / j.compeleceng.2011.04.016. ISSN  0045-7906.
  8. ^ A b Amin-Naji, Mostafa; Aghagolzadeh, Ali; Ezoji, Mehdi (2018). Msgstr "Plně nvoluční sítě pro multicusovou fúzi obrazu". 9. mezinárodní telekomunikační sympozium 2018 (IST): 553–558. doi:10.1109 / ISTEL.2018.8660989. ISBN  978-1-5386-8274-6.
  9. ^ Huang, Wei; Jing, Zhongliang (01.03.2007). "Hodnocení měřících opatření při fúzi obrazu s více zaostřením". Písmena pro rozpoznávání vzorů. 28 (4): 493–500. doi:10.1016 / j.patrec.2006.09.005. ISSN  0167-8655.
  10. ^ Du, C .; Gao, S. (2017). „Vícefokusová fúze obrazu založená na segmentaci obrazu prostřednictvím vícerozměrné konvoluční neurální sítě“. Přístup IEEE. 5: 15750–15761. doi:10.1109 / ACCESS.2017.2735019.
  11. ^ Tang, Han; Xiao, Bin; Li, Weisheng; Wang, Guoyin (01.04.2018). "Pixel konvoluční neurální síť pro fúzi obrazu s více zaostřením". Informační vědy. 433-434: 125–141. doi:10.1016 / j.ins.2017.12.043. ISSN  0020-0255.
  12. ^ Guo, Xiaopeng; Nie, Rencan; Cao, Jinde; Zhou, Dongming; Qian, Wenhua (12.6.2018). "Plně konvoluční síťová multifokusová fúze obrazu". Neurální výpočet. 30 (7): 1775–1800. doi:10.1162 / neco_a_01098. ISSN  0899-7667. PMID  29894654.