Deep Image Prior - Deep Image Prior
![]() | Tento článek má několik problémů. Prosím pomozte vylepši to nebo diskutovat o těchto otázkách na internetu diskusní stránka. (Zjistěte, jak a kdy tyto zprávy ze šablony odebrat) (Zjistěte, jak a kdy odstranit tuto zprávu šablony)
|
Deep Image Prior je typ konvoluční neuronová síť slouží k vylepšení daného obrazu bez předchozích tréninkových dat, kromě samotného obrazu. Neuronová síť je náhodně inicializována a použita jako před řešením inverzní problémy jako redukce hluku, super rozlišení, a malování. Statistika obrazu je zachycena spíše strukturou generátoru konvolučních obrazů, než jakoukoli dříve naučenou schopností.
Metoda
Pozadí
Inverzní problémy jako redukce hluku, super rozlišení, a malování lze formulovat jako optimalizační úkol , kde je obrázek, poškozená reprezentace tohoto obrázku, je datový termín závislý na úkolu a R (x) je regulátor. To vytváří problém s minimalizací energie.
Hluboké neuronové sítě naučit se generátor / dekodér který mapuje náhodný vektor kódu na obrázek .
Metoda poškození obrazu použitá ke generování je vybrán pro konkrétní aplikaci.
Specifika
V tomto přístupu je prior je nahrazen implicitním priorem zachyceným neurální sítí (kde pro obrázky, které mohou být vytvořeny a hluboké neuronové sítě a v opačném případě). Tím se získá rovnice pro minimalizátor a výsledek procesu optimalizace .
Minimalizátor (obvykle a klesání ) začíná od náhodně inicializovaných parametrů a sestupuje do nejlepšího místního výsledku, čímž se získá restaurátorská funkce.
Overfitting
Parametr θ lze použít k obnovení jakéhokoli obrazu, včetně jeho šumu. Síť se však zdráhá zachytit šum, protože obsahuje vysokou impedanci, zatímco užitečný signál nabízí nízkou impedanci. Výsledkem je, že parametr θ se blíží dobře vypadajícímu místní optimum tak dlouho, dokud počet iterací v procesu optimalizace zůstane dostatečně nízký na to overfit data.
Aplikace
Odšumění
Princip odšumění je obnovit obrázek z hlučného pozorování , kde . Distribuce je někdy známý (např .: profilovací senzor a fotonový šum[1]) a mohou být volitelně začleněny do modelu, i když tento proces funguje dobře při slepém odšumění.
Kvadratická energetická funkce se používá jako datový termín, zapojením do rovnice pro přináší problém s optimalizací .
Super rozlišení
Super rozlišení se používá ke generování verze obrazu x s vyšším rozlišením. Datový termín je nastaven na kde d (·) je a operátor převzorkování jako Lanczos která decimuje obraz faktorem t.
Malování
Malování se používá k rekonstrukci chybějící oblasti v obraze . Tyto chybějící pixely jsou definovány jako binární maska . Datový termín je definován jako (kde je Produkt Hadamard ).
Rekonstrukce blesku bez blesku
Tento přístup lze rozšířit na více obrázků. Přímým příkladem, který autor zmínil, je rekonstrukce obrazu za účelem získání přirozeného světla a jasnosti z dvojice blesk-ne-blesk. Rekonstrukce videa je možná, ale vyžaduje zohlednění prostorových rozdílů optimalizací.
Implementace
- Přepsána referenční implementace Python 3.6 s PyTorch 0.4.0 Knihovna byla vydána autorem pod Apache 2.0 licence: deep-image-prior [2]
- A TensorFlow implementace na základě napsaná v Python 2 a propuštěn pod CC-SA 3.0 licence: deep-image-prior-tensorflow
- A Keras implementace na základě napsaná v Python 2 a propuštěn pod GPLv3: machine_learning_denoising
Reference
- ^ jo (11.12.2012). „profilovací senzor a fotonový šum .. a jak se ho zbavit“. darktable.
- ^ https://github.com/DmitryUlyanov/deep-image-prior
- Uljanov, Dmitrij; Vedaldi, Andrea; Lempitsky, Victor (30. listopadu 2017). "Priorita hlubokého obrazu". arXiv:1711.10925v2.