Diskrétní univerzální oddělovač - Discrete Universal Denoiser

v teorie informace a zpracování signálu, Diskrétní univerzální oddělovač (VOLE) je odšumění schéma pro obnovení sekvencí přes konečnou abecedu, které byly poškozeny a kanál bez paměti. DUDE navrhli v roce 2005 Tsachy Weissman, Erik Ordentlich, Gadiel Seroussi, Sergio Verdú a Marcelo J. Weinberger.^[1]

Přehled

Diskrétní univerzální oddělovač^[1] (DUDE) je a odšumění schéma, které odhaduje neznámý signál ${ displaystyle x ^ {n} = left (x_ {1} ldots x_ {n} right)}$ přes konečnou abecedu z hlučné verze ${ displaystyle z ^ {n} = left (z_ {1} ldots z_ {n} right)}$ Zatímco většina odšumění schémata ve zpracování signálu a statistika pojednává o literatuře signály nad nekonečnou abecedou (zejména signály se skutečnou hodnotou), DUDE řeší případ nekonečné abecedy. Hlučná verze ${ displaystyle z ^ {n}}$ Předpokládá se, že bude generován vysíláním ${ displaystyle x ^ {n}}$ prostřednictvím známého kanál bez paměti.

Pro pevné délka kontextu parametr ${ displaystyle k}$ , DUDE počítá výskyty všech řetězců délky ${ displaystyle 2k + 1}$ objevit se v ${ displaystyle z ^ {n}}$ . Odhadovaná hodnota ${ displaystyle { hat {x}} _ {i}}$ je určena na základě oboustranné délky ${ displaystyle k}$ kontext ${ displaystyle left (z_ {i-k}, ldots, z_ {i-1}, z_ {i + 1}, ldots, z_ {i + k} right)}$ z ${ displaystyle z_ {i}}$ , s přihlédnutím ke všem ostatním žetonům v ${ displaystyle z ^ {n}}$ se stejným kontextem, stejně jako se používá známá kanálová matice a funkce ztráty.

Myšlenku, která je základem DUDE, lze nejlépe ilustrovat, když ${ displaystyle x ^ {n}}$ je oblastizace náhodného vektoru ${ displaystyle X ^ {n}}$ . Pokud je podmíněné rozdělení ${ displaystyle X_ {i} | Z_ {i-k}, ldots, Z_ {i-1}, Z_ {i + 1}, ldots, Z_ {i + k}}$ , jmenovitě distribuce bezhlučného symbolu ${ displaystyle X_ {i}}$ podmíněno hlučným kontextem ${ displaystyle left (Z_ {i-k}, ldots, Z_ {i-1}, Z_ {i + 1}, ldots, Z_ {i + k} right)}$ byl k dispozici, optimální odhadovač ${ displaystyle { hat {X}} _ {i}}$ bude Bayesova odpověď na ${ displaystyle X_ {i} | Z_ {i-k}, ldots, Z_ {i-1}, Z_ {i + 1}, ldots, Z_ {i + k}}$ Naštěstí, pokud je kanálová matice známá a nedegenerovaná, lze toto podmíněné rozdělení vyjádřit pomocí podmíněného rozdělení ${ displaystyle Z_ {i} | Z_ {i-k}, ldots, Z_ {i-1}, Z_ {i + 1}, ldots, Z_ {i + k}}$ , konkrétně distribuce hlučného symbolu ${ displaystyle Z_ {i}}$ podmíněno jeho hlučným kontextem. Toto podmíněné rozdělení lze zase odhadnout z individuálně pozorovaného hlučného signálu ${ displaystyle Z ^ {n}}$ na základě Zákon velkých čísel, za předpokladu ${ displaystyle n}$ je „dostatečně velký“.

Použití schématu DUDE s délkou kontextu ${ displaystyle k}$ do sekvence délky ${ displaystyle n}$ přes konečnou abecedu ${ displaystyle { mathcal {Z}}}$ vyžaduje ${ displaystyle O (n)}$ operace a vesmír ${ displaystyle O left ( min (n, | { mathcal {Z}} | ^ {2k}) right)}$ .

Za určitých předpokladů je DUDE univerzální schéma ve smyslu asymptotického výkonu a také optimální denoiser, který má Oracle přístup k neznámé sekvenci. Přesněji řečeno, předpokládejme, že výkon odšumování je měřen pomocí daného jednoznakového kritéria věrnosti, a zvažte režim, kde délka sekvence ${ displaystyle n}$ má sklon k nekonečnu a délce kontextu ${ displaystyle k = k_ {n}}$ inklinuje k nekonečnu „ne příliš rychle“. Ve stochastickém prostředí, kde dvojnásobně nekonečná sekvence bezhlučná sekvence ${ displaystyle mathbf {x}}$ je realizace stacionárního procesu ${ displaystyle mathbf {X}}$ , DUDE asymptoticky provádí, v očekávání, stejně jako nejlepší denoiser, který má Oracle přístup k distribuci zdroje ${ displaystyle mathbf {X}}$ . V jednosekvenčním nebo „polostochastickém“ nastavení s a pevný dvojnásobně nekonečná sekvence ${ displaystyle mathbf {x}}$ , DUDE asymptoticky funguje stejně jako nejlepší „odposuvník“ s posuvným oknem, jmenovitě jakýkoli odrušovač, který určuje ${ displaystyle { hat {x}} _ {i}}$ z okna ${ displaystyle left (z_ {i-k}, ldots, z_ {i + k} right)}$ , který má Oracle přístup k ${ displaystyle mathbf {x}}$ .

Problém diskrétního odšumění

Popis blokového diagramu problému diskrétního odšumění

Nechat ${ displaystyle { mathcal {X}}}$ být konečnou abecedou pevné, ale neznámé původní „nehlučné“ sekvence ${ displaystyle x ^ {n} = left (x_ {1}, ldots, x_ {n} right) in { mathcal {X}} ^ {n}}$ . Sekvence se přivádí do a kanál bez paměti (DMC). DMC funguje na každém symbolu ${ displaystyle x_ {i}}$ nezávisle, produkující odpovídající náhodný symbol ${ displaystyle Z_ {i}}$ v omezené abecedě ${ displaystyle { mathcal {Z}}}$ . DMC je znám a označuje se jako ${ displaystyle { mathcal {X}}}$ -podle- ${ displaystyle { mathcal {Z}}}$ Markovova matice ${ displaystyle Pi}$ , jejichž záznamy jsou ${ displaystyle pi (x, z) = mathbb {P} doleva (Z = z , | , X = x doprava)}$ . Je vhodné psát ${ displaystyle pi _ {z}}$ pro ${ displaystyle z}$ -sloupec ${ displaystyle Pi}$ . DMC vytváří náhodnou hlučnou sekvenci ${ displaystyle Z ^ {n} = left (z_ {1}, ldots, z_ {n} right) in { mathcal {Z}} ^ {n}}$ . Konkrétní realizace tohoto náhodného vektoru bude označena ${ displaystyle z ^ {n}}$ Oddělovač je funkce ${ displaystyle { hat {X}} ^ {n}: { mathcal {Z}} ^ {n} do { mathcal {X}} ^ {n}}$ který se pokouší obnovit bezhlučnou sekvenci ${ displaystyle x ^ {n}}$ ze zkreslené verze ${ displaystyle z ^ {n}}$ . Specifická odškrtnutá sekvence je označena ${ displaystyle { hat {x}} ^ {n} = { hat {X}} ^ {n} left (z ^ {n} right) = left ({ hat {X}} _ { 1} (z ^ {n}), ldots, { hat {X}} _ {n} (z ^ {n}) right)}$ .Problém výběru oddělovače ${ displaystyle { hat {X}} ^ {n}}$ je známý jako odhad signálu, filtrování nebo vyhlazení. Pro porovnání kandidátních denoizérů jsme vybrali jednoznakové kritérium věrnosti ${ displaystyle Lambda: { mathcal {X}} krát { mathcal {X}} až [0, infty)}$ (například Hammingova ztráta) a definujte ztrátu symbolu oddělovače ${ displaystyle { hat {X}} ^ {n}}$ na ${ displaystyle (x ^ {n}, z ^ {n})}$ podle

 ${ displaystyle { begin {aligned} L _ {{ hat {X}} ^ {n}} left (x ^ {n}, z ^ {n} right) = { frac {1} {n} } sum _ {i = 1} ^ {n} Lambda left (x_ {i} ,, , { hat {X}} _ {i} (z ^ {n}) right) , . end {zarovnáno}}}$

Řazení prvků abecedy ${ displaystyle { mathcal {X}}}$ podle ${ displaystyle { mathcal {X}} = vlevo (a_ {1}, ldots, a_ {| { mathcal {X}} |} vpravo)}$ , kritérium věrnosti může být dáno a ${ displaystyle | { mathcal {X}} |}$ -podle- ${ displaystyle | { mathcal {X}} |}$ matice se sloupci formuláře

 ${ displaystyle { begin {aligned} lambda _ { hat {x}} = left ({ begin {pole} {c} Lambda (a_ {1}, { hat {x}}) vdots Lambda (a_ {| { mathcal {X}} |}, { hat {x}}) end {array}} right) ,. end {zarovnáno}}}$

Schéma DUDE

Krok 1: Výpočet empirického rozdělení v každém kontextu

DUDE opravuje symboly podle jejich kontextu. Délka kontextu ${ displaystyle k}$ použitý je tuningový parametr schématu. Pro ${ displaystyle k + 1 leq i leq n-k}$ , definujte levý kontext souboru ${ displaystyle i}$ -tý symbol v ${ displaystyle z ^ {n}}$ podle ${ displaystyle l ^ {k} (z ^ {n}, i) = left (z_ {i-k}, ldots, z_ {i-1} right)}$ a odpovídající pravý kontext jako ${ displaystyle r ^ {k} (z ^ {n}, i) = left (z_ {i + 1}, ldots, z_ {i + k} right)}$ . Dvoustranný kontext je kombinace ${ displaystyle (l ^ {k}, r ^ {k})}$ levého a pravého kontextu.

Prvním krokem schématu DUDE je výpočet empirického rozdělení symbolů v každém možném dvoustranném kontextu podél hlučné sekvence ${ displaystyle z ^ {n}}$ . Formálně daný dvoustranný kontext ${ displaystyle (l ^ {k}, r ^ {k}) in { mathcal {Z}} ^ {k} times { mathcal {Z}} ^ {k}}$ který se objeví jednou nebo vícekrát ${ displaystyle z ^ {n}}$ určuje empirické rozdělení pravděpodobnosti ${ displaystyle { mathcal {Z}}}$ , jehož hodnota u symbolu ${ displaystyle z}$ je

 ${ displaystyle { begin {zarovnaný} mu left (z ^ {n}, l ^ {k}, r ^ {k} right) [z] = { frac {{ Big |} left {k + 1 leq i leq nk , , | , , (z_ {ik}, ldots, z_ {i + k}) = l ^ {k} zr ^ {k} vpravo } { Big |}} {{ Big |} left {k + 1 leq i leq nk , , | , , l ^ {k} (z ^ {n}, i) = l ^ {k} { text {and}} r ^ {k} (z ^ {n}, i) = r ^ {k} right } { Big |}}} ,. end {zarovnáno} }}$

Tedy první krok schématu DUDE s délkou kontextu ${ displaystyle k}$ je skenovat vstupní šumovou sekvenci ${ displaystyle z ^ {n}}$ jednou a uložte délku ${ displaystyle | { mathcal {Z}} |}$ empirický distribuční vektor ${ displaystyle mu left (z ^ {n}, l ^ {k}, r ^ {k} right)}$ (nebo jeho nenormalizovaná verze, vektor počtu) pro každý dvoustranný kontext nalezený spolu ${ displaystyle z ^ {n}}$ . Protože jich je nanejvýš ${ displaystyle N_ {n, k} = min left (n, | { mathcal {Z}} | ^ {2k} right)}$ možné oboustranné kontexty ${ displaystyle z ^ {n}}$ , tento krok vyžaduje ${ displaystyle O (n)}$ operace a skladování ${ displaystyle O (N_ {n, k})}$ .

Krok 2: Výpočet Bayesovy odpovědi na každý kontext

Označte sloupec kritéria věrnosti jedním symbolem ${ displaystyle Lambda}$ , odpovídající symbolu ${ displaystyle { hat {x}} v { mathcal {X}}}$ tím, že ${ displaystyle lambda _ { hat {x}}}$ . Definujeme Bayesova odpověď na libovolný vektor ${ displaystyle mathbf {v}}$ délky ${ displaystyle | { mathcal {X}} |}$ s nezápornými položkami jako

 ${ displaystyle { begin {aligned} { hat {X}} _ {Bayes} ( mathbf {v}) = { text {argmin}} _ {{ hat {x}} in { mathcal { X}}} lambda _ { hat {x}} ^ { top} mathbf {v} ,. End {zarovnáno}}}$

Tato definice je motivována v Pozadí níže.

Druhým krokem schématu DUDE je výpočet pro každý oboustranný kontext ${ displaystyle (l ^ {k}, r ^ {k})}$ pozorováno v předchozím kroku ${ displaystyle z ^ {n}}$ a pro každý symbol ${ displaystyle z in { mathcal {Z}}}$ pozorované v každém kontextu (konkrétně jakékoli ${ displaystyle z}$ takhle ${ displaystyle l ^ {r} zr ^ {k}}$ je podřetězec z ${ displaystyle z ^ {n}}$ ) Bayesova reakce na vektor ${ displaystyle Pi ^ {- top} mu left (z ^ {n} ,, , l ^ {k} ,, , r ^ {k} right) odot pi _ { z}}$ , jmenovitě

 ${ displaystyle { begin {align}} g (l ^ {k}, z, r ^ {k}): = { hat {X}} _ {Bayes} left ( Pi ^ {- top} mu left (z ^ {n} ,, , l ^ {k} ,, , r ^ {k} right) odot pi _ {z} right) ,. end {zarovnáno }}}$

Všimněte si, že sekvence ${ displaystyle z ^ {n}}$ a délka kontextu ${ displaystyle k}$ jsou implicitní. Tady, ${ displaystyle pi _ {z}}$ je ${ displaystyle z}$ -sloupec ${ displaystyle Pi}$ a pro vektory ${ displaystyle mathbf {a}}$ a ${ displaystyle mathbf {b}}$ , ${ displaystyle mathbf {a} odot mathbf {b}}$ označuje jejich produkt Schur (entrywise), definovaný ${ displaystyle left ( mathbf {a} odot mathbf {b} right) _ {i} = a_ {i} b_ {i}}$ . Násobení matic je hodnoceno před produktem Schur, takže ${ displaystyle Pi ^ {- top} mu odot pi _ {z}}$ znamená ${ displaystyle ( Pi ^ {- top} mu) odot pi _ {z}}$ .

Tento vzorec předpokládal, že kanálová matice ${ displaystyle Pi}$ je čtverec ( ${ displaystyle | { mathcal {X}} | = | { mathcal {Z}} |}$ ) a invertibilní. Když ${ displaystyle | { mathcal {X}} | leq | { mathcal {Z}} |}$ a ${ displaystyle Pi}$ není invertibilní, za rozumného předpokladu, že má celou řadu, nahradíme ${ displaystyle ( Pi ^ { top}) ^ {- 1}}$ výše s Moore-Penroseovou pseudo-inverzí ${ displaystyle left ( Pi Pi ^ { top} right) ^ {- 1} Pi}$ a místo toho vypočítat

 ${ displaystyle { begin {align}} g (l ^ {k}, z, r ^ {k}): = { hat {X}} _ {Bayes} left (( Pi Pi ^ { top }) ^ {- 1} Pi mu left (z ^ {n}, l ^ {k}, r ^ {k} right) odot pi _ {z} right) ,. End {zarovnaný}}}$

Mezipamětí inverzní nebo pseudo-inverzní ${ displaystyle Pi ^ {- nahoru}}$ a hodnoty ${ displaystyle lambda _ { hat {x}} odot pi _ {z}}$ pro příslušné páry ${ displaystyle ({ hat {x}}, z) v { mathcal {X}} krát { mathcal {Z}}}$ , tento krok vyžaduje ${ displaystyle O (N_ {k, n})}$ operace a ${ displaystyle O (N_ {k, n})}$ úložný prostor.

Krok 3: Odhad každého symbolu podle Bayesovy odpovědi na jeho kontext

Třetím a posledním krokem schématu DUDE je skenování ${ displaystyle z ^ {n}}$ znovu a spočítejte skutečnou odšuměnou sekvenci ${ displaystyle { hat {X}} ^ {n} (z ^ {n}) = left ({ hat {X}} _ {1} (z ^ {n}), ldots, { hat {X}} _ {n} (z ^ {n}) vpravo)}$ . Symbol zamlčen zvolený k nahrazení ${ displaystyle z_ {i}}$ je Bayesova reakce na oboustranný kontext symbolu, konkrétně

 ${ displaystyle { begin {aligned} { hat {X}} _ {i} (z ^ {n}): = g left (l ^ {k} (z ^ {n}, i) ,, , z_ {i} ,, , r ^ {k} (z ^ {n}, i) right) ,. end {zarovnáno}}}$

Tento krok vyžaduje ${ displaystyle O (n)}$ operace a použila datovou strukturu vytvořenou v předchozím kroku.

Stručně řečeno, celý DUDE vyžaduje ${ displaystyle O (n)}$ operace a ${ displaystyle O (N_ {k, n})}$ úložný prostor.

Vlastnosti asymptotické optimality

DUDE je navržen tak, aby byl univerzálně optimální, a to optimální (je to v jistém smyslu, za určitých předpokladů) bez ohledu na původní sekvenci ${ displaystyle x ^ {n}}$ .

Nechat ${ displaystyle { hat {X}} _ {DUDE} ^ {n}: { mathcal {Z}} ^ {n} do { mathcal {X}} ^ {n}}$ označují sekvenci DUDE schémat, jak je popsáno výše, kde ${ displaystyle { hat {X}} _ {DUDE} ^ {n}}$ používá délku kontextu ${ displaystyle k_ {n}}$ to je implicitní v notaci. Vyžadujeme to jen ${ displaystyle lim _ {n to infty} k_ {n} = infty}$ a to ${ displaystyle k_ {n} | { mathcal {Z}} | ^ {2K_ {n}} = o left ({ frac {n} { log n}} right)}$ .

Pro stacionární zdroj

Označit podle ${ displaystyle { mathcal {D}} _ {n}}$ soubor všech ${ displaystyle n}$ - blokovací oddělovače, jmenovitě všechny mapy ${ displaystyle { hat {X}} ^ {n}: { mathcal {Z}} ^ {n} do { mathcal {X}} ^ {n}}$ .

Nechat ${ displaystyle mathbf {X}}$ být neznámým stacionárním zdrojem a ${ displaystyle mathbf {Z}}$ být distribuce odpovídající hlučné sekvence. Pak

 ${ displaystyle { begin {aligned} lim _ {n to infty} mathbf {E} left [L _ {{ hat {X}} _ {DUDE} ^ {n}} left (X ^ {n}, Z ^ {n} right) right] = lim _ {n to infty} min _ {{ hat {X}} ^ {n} in { mathcal {D}} _ {n}} mathbf {E} left [L _ {{ hat {X}} ^ {n}} left (X ^ {n}, Z ^ {n} right) right] ,, end {zarovnáno}}}$

a existují obě omezení. Pokud navíc zdroj ${ displaystyle mathbf {X}}$ je tedy ergodický

 ${ displaystyle { begin {aligned} limsup _ {n to infty} L _ {{ hat {X}} _ {DUDE} ^ {n}} left (X ^ {n}, Z ^ {n } right) = lim _ {n to infty} min _ {{ hat {X}} ^ {n} in { mathcal {D}} _ {n}} mathbf {E} left [L _ {{ hat {X}} ^ {n}} left (X ^ {n}, Z ^ {n} right) right] ,, , { text {téměř jistě}} ,. end {zarovnáno}}}$

Pro individuální sekvenci

Označit podle ${ displaystyle { mathcal {D}} _ {n, k}}$ soubor všech ${ displaystyle n}$ -blok ${ displaystyle k}$ - oddělovače posuvných oken řádu, konkrétně všechny mapy ${ displaystyle { hat {X}} ^ {n}: { mathcal {Z}} do { mathcal {X}}}$ formuláře ${ displaystyle { hat {X}} _ {i} (z ^ {n}) = f left (z_ {i-k}, ldots, z_ {i + k} right)}$ s ${ displaystyle f: { mathcal {Z}} ^ {2k + 1} do { mathcal {X}}}$ libovolný.

Nechat ${ displaystyle mathbf {x} v { mathcal {X}} ^ { infty}}$ být neznámým tichým sledem stacionárního zdroje a ${ displaystyle mathbf {Z}}$ být distribuce odpovídající hlučné sekvence. Pak

 ${ displaystyle { begin {aligned} lim _ {n to infty} left [L _ {{ hat {X}} _ {DUDE} ^ {n}} left (x ^ {n}, Z ^ {n} right) - min _ {{ hat {X}} ^ {n} in { mathcal {D}} _ {n, k}} L _ {{ hat {X}} ^ { n}} left (x ^ {n}, Z ^ {n} right) right] = 0 ,, , { text {téměř jistě}} ,. end {zarovnáno}}}$

Neasymptotický výkon

Nechat ${ displaystyle { hat {X}} _ {k} ^ {n}}$ označte DUDE na s délkou kontextu ${ displaystyle k}$ definováno dne ${ displaystyle n}$ -bloky. Pak existují explicitní konstanty ${ displaystyle A, C> 0}$ a ${ displaystyle B> 1}$ na kterých záleží ${ displaystyle left ( Pi, Lambda right)}$ sám, tak pro každého ${ displaystyle n, k}$ a jakékoli ${ displaystyle x ^ {n} in { mathcal {X}} ^ {n}}$ my máme

 ${ displaystyle { begin {aligned} { frac {A} { sqrt {n}}} B ^ {k} , leq mathbf {E} left [L _ {{ hat {X}} _ {k} ^ {n}} left (x ^ {n}, Z ^ {n} right) - min _ {{ hat {X}} ^ {n} in { mathcal {D}} _ {n, k}} L _ {{ hat {X}} ^ {n}} left (x ^ {n}, Z ^ {n} right) right] leq { sqrt {k}} { frac {C} { sqrt {n}}} | { mathcal {Z}} | ^ {k} ,, end {zarovnáno}}}$

kde ${ displaystyle Z ^ {n}}$ je hlučná sekvence odpovídající ${ displaystyle x ^ {n}}$ (jehož náhodnost je dána samotným kanálem)^[2].

Ve skutečnosti platí se stejnými konstantami ${ displaystyle A, B}$ jak je uvedeno výše pro žádný ${ displaystyle n}$ -denoizér bloku ${ displaystyle { hat {X}} ^ {n} v { mathcal {D}} ^ {n}}$ .^[1] Dolní mez důkaz vyžaduje, aby kanálová matice ${ displaystyle Pi}$ být čtvercový a dvojice ${ displaystyle left ( Pi, Lambda right)}$ splňuje určitý technický stav.

Pozadí

Abychom motivovali konkrétní definici DUDE pomocí Bayesovy odpovědi na konkrétní vektor, nyní najdeme optimální oddělovač v neuniverzálním případě, kde neznámá sekvence ${ displaystyle x ^ {n}}$ je realizace náhodného vektoru ${ displaystyle X ^ {n}}$ , jehož distribuce je známa.

Zvažte nejprve případ ${ displaystyle n = 1}$ . Od společné distribuce ${ displaystyle (X, Z)}$ je znám, vzhledem k pozorovanému hlučnému symbolu ${ displaystyle z}$ , neznámý symbol ${ displaystyle X v { mathcal {X}}}$ je distribuován podle známé distribuce ${ displaystyle mathbb {P} (X = x | Z = z)}$ . Objednáním prvků z ${ displaystyle { mathcal {X}}}$ , můžeme tuto podmíněnou distribuci popsat dne ${ displaystyle { mathcal {X}}}$ pomocí vektoru pravděpodobnosti ${ displaystyle mathbf {P} _ {X | z}}$ indexováno ${ displaystyle { mathcal {X}}}$ , jehož ${ displaystyle x}$ - vstup je ${ displaystyle mathbb {P} doleva (X = x | Z = z doprava)}$ . Zjevně očekávaná ztráta pro výběr odhadovaného symbolu ${ displaystyle { hat {x}}}$ je ${ displaystyle lambda _ { hat {x}} ^ { top} mathbf {P} _ {X | z}}$ .

Definujte Bayesova obálka vektoru pravděpodobnosti ${ displaystyle mathbf {v}}$ , popisující rozdělení pravděpodobnosti na ${ displaystyle { mathcal {X}}}$ , jako minimální očekávaná ztráta ${ displaystyle U ( mathbf {v}) = min _ {{ hat {x}} v { mathcal {X}}} mathbf {v} ^ { top} lambda _ { hat { X}}}$ a Bayesova odpověď na ${ displaystyle mathbf {v}}$ jako předpověď, která dosahuje tohoto minima, ${ displaystyle { hat {X}} _ {Bayes} ( mathbf {v}) = { text {argmin}} _ {{ hat {x}} v { mathcal {X}}} mathbf {v} ^ { top} lambda _ { hat {x}}}$ . Všimněte si, že Bayesova reakce má neměnný rozsah v tom smyslu ${ displaystyle { hat {X}} _ {Bayes} ( mathbf {v}) = { hat {X}} _ {Bayes} ( alpha mathbf {v})}$ pro ${ displaystyle alpha> 0}$ .

Pro případ ${ displaystyle n = 1}$ pak je optimální oddělovač ${ displaystyle { hat {X}} (z) = { hat {X}} _ {Bayes} left ( mathbf {P} _ {X | z} right)}$ . Tento optimální oddělovač lze vyjádřit pomocí okrajového rozdělení ${ displaystyle Z}$ sám, následovně. Když je matice kanálu ${ displaystyle Pi}$ je invertibilní, máme ${ displaystyle mathbf {P} _ {X | z} propto Pi ^ {- top} P_ {Z} odot pi _ {z}}$ kde ${ displaystyle pi _ {z}}$ je ${ displaystyle z}$ -tý sloupec ${ displaystyle Pi}$ . To znamená, že optimální denoiser je dán ekvivalentně ${ displaystyle { hat {X}} (z) = { hat {X}} _ {Bayes} left ( Pi ^ {- top} mathbf {P} _ {Z} odot pi _ {z} vpravo)}$ . Když ${ displaystyle | { mathcal {X}} | leq | { mathcal {Z}} |}$ a ${ displaystyle Pi}$ není invertibilní, za rozumného předpokladu, že má celou řadu, můžeme nahradit ${ displaystyle Pi ^ {- 1}}$ s jeho Moore-Penrose pseudo-inverzní a získat

 ${ displaystyle { hat {X}} (z) = { hat {X}} _ {Bayes} left (( Pi Pi ^ { top}) ^ {- 1} Pi mathbf {P } _ {Z} odot pi _ {z} vpravo) ,.}$

Nyní se mění na svévolné ${ displaystyle n}$ , optimální oddělovač ${ displaystyle { hat {X}} ^ {opt} (z ^ {n})}$ (s minimální očekávanou ztrátou) je tedy dána Bayesovou odpovědí na ${ displaystyle mathbf {P} _ {X_ {i} | z ^ {n}}}$

 ${ displaystyle { begin {aligned} { hat {X}} _ {i} ^ {opt} (z ^ {n}) = { hat {X}} _ {Bayes} mathbf {P} _ { X_ {i} | z ^ {n}} = { text {argmin}} _ {{ hat {x}} v { mathcal {X}}} lambda _ { hat {x}} ^ { top} mathbf {P} _ {X_ {i} | z ^ {n}} ,, end {zarovnáno}}}$

kde ${ displaystyle mathbf {P} _ {X_ {i} | z ^ {n}}}$ je vektor indexovaný pomocí ${ displaystyle { mathcal {X}}}$ , jehož ${ displaystyle x}$ - vstup je ${ displaystyle mathbb {P} vlevo (X_ {i} = x | Z ^ {n} = z ^ {n} vpravo)}$ . Vektor podmíněné pravděpodobnosti ${ displaystyle mathbf {P} _ {X_ {i} | z ^ {n}}}$ je těžké vypočítat. Derivace analogická případu ${ displaystyle n = 1}$ výše ukazuje, že optimální oddělovač připouští alternativní zastoupení, a to ${ displaystyle { hat {X}} _ {i} ^ {opt} (z ^ {n}) = { hat {X}} _ {Bayes} left ( Pi ^ {- top} mathbf {P} _ {Z_ {i}, z ^ {n zpětné lomítko i}} odot pi _ {z_ {i}} vpravo)}$ , kde ${ displaystyle z ^ {n zpětné lomítko i} = left (z_ {1}, ldots, z_ {i-1}, z_ {i + 1}, ldots, z_ {n} right) in { mathcal {Z}} ^ {n-1}}$ je daný vektor a ${ displaystyle mathbf {P} _ {Z_ {i}, z ^ {n zpětné lomítko i}}}$ je vektor pravděpodobnosti indexovaný pomocí ${ displaystyle { mathcal {Z}}}$ jehož ${ displaystyle z}$ - vstup je ${ displaystyle mathbb {P} left ((Z_ {1}, ldots, Z_ {n}) = (z_ {1}, ldots, z_ {i-1}, z, z_ {i + 1} , ldots, z_ {n}) right) ,.}$ Znovu, ${ displaystyle Pi ^ {- nahoru}}$ je nahrazen pseudo-inverzí if ${ displaystyle Pi}$ není čtvercový nebo invertibilní.

Při distribuci ${ displaystyle X}$ (a tedy z ${ displaystyle Z}$ ) není k dispozici, DUDE nahradí neznámý vektor ${ displaystyle mathbf {P} _ {Z_ {i}, z ^ {n zpětné lomítko i}}}$ s empirickým odhadem získaným podél hlučné sekvence ${ displaystyle z ^ {n}}$ sám, jmenovitě s ${ displaystyle mu left (Z_ {i}, l ^ {k} (Z ^ {n}, i), r ^ {k} (Z ^ {n}, i) right)}$ . To vede k výše uvedené definici DUDE.

Zatímco konvergenční argumenty za výše uvedenými vlastnostmi optimality jsou více jemné, poznamenáváme, že výše uvedené v kombinaci sBirkhoffova erodická věta, stačí dokázat, že pro stacionární ergodický zdroj je DUDE s kontextovou délkou ${ displaystyle k}$ je asymptoticky optimální vše ${ displaystyle k}$ -denoizéry posuvného okna.

Rozšíření

Zde popsaný základní DUDE předpokládá signál s jednorozměrnou indexovou sadou přes konečnou abecedu, známý kanál bez paměti a délku kontextu, která je předem stanovena. Uvolnění každého z těchto předpokladů bylo postupně zvažováno.^[3] Konkrétně:

Nekonečné abecedy^[4]^[5]^[6]^[7]
Kanály s pamětí^[8]^[9]
Neznámá matice kanálu^[10]^[11]
Variabilní kontext a adaptivní výběr délky kontextu^[12]^[13]^[14]^[15]
Dvourozměrné signály^[16]

Aplikace

Aplikace na potlačení obrazu

Rámec pro stupně šedi založený na DUDE potlačení obrazu^[6] dosahuje nejmodernějšího odšumění pro šumové kanály impulzního typu (např. „sůl a pepř“ nebo „M-ary symetrický“ šum) a dobrý výkon na Gaussově kanálu (srovnatelný s Nemístní prostředky schéma potlačení obrazu na tomto kanálu). Odlišná varianta DUDE použitelná pro obrázky ve stupních šedi je uvedena v.^[7]

Aplikace na dekódování kanálu nekomprimovaných zdrojů

DUDE vedl k univerzálním algoritmům pro dekódování kanálů nekomprimovaných zdrojů.^[17]

Reference

^ ^A ^b ^C T. Weissman, E. Ordentlich, G. Seroussi, S. Verdu 'a M. J. Weinberger. Univerzální diskrétní odšumění: Známý kanál. Transakce IEEE na informační teorii, 51 (1): 5–28, 2005.
^ K. Viswanathan a E. Ordentlich. Dolní limity diskrétního univerzálního odšumění. Transakce IEEE o teorii informací, 55 (3): 1374–1386, 2009.
^ Ordentlich, E .; Seroussi, G .; Verd´u; Weinberger, M. J .; Weissman, T. „Úvahy o DUDE“ (pdf). Citovat deník vyžaduje | deník = (Pomoc)
^ A. Dembo a T. Weissman. Univerzální odšumění pro kanál konečných vstupů-obecných výstupů. IEEE Trans. Inf. Theory, 51 (4): 1507–1517, duben 2005.
^ K. Sivaramakrishnan a T. Weissman. Univerzální odšumění diskrétních signálů spojité amplitudy. V Proc. 2006 IEEE Intl. Symp. na Inform. Theory, (ISIT’06), Seattle, WA, USA, červenec 2006.
^ ^A ^b G. Motta, E. Ordentlich, I. Ramírez, G. Seroussi a M. Weinberger, „TheDUDE framework for Continuous tone image denoising,“ IEEE Transactions onImage Processing, 20, No. 1, leden 2011.
^ ^A ^b K. Sivaramakrishnan a T. Weissman. Univerzální odšumění signálů spojité amplitudy s aplikacemi na obrazy. V Proc. Mezinárodní konference IEEE o zpracování obrazu, Atlanta, GA, USA, říjen 2006, str. 2609–2612
^ C. D. Giurcaneanu a B. Yu. Efektivní algoritmy pro diskrétní univerzální potlačení šumu pro kanály s pamětí. V Proc. 2005 IEEE Intl. Symp. na Inform. Theory, (ISIT’05), Adelaide, Austrálie, září 2005.
^ R. Zhang a T. Weissman. Diskrétní potlačení šumu pro kanály s pamětí. Communicationsin Information and Systems (CIS), 5 (2): 257–288, 2005.
^ G. M. Gemelos, S. Sigurjonsson, T. Weissman. Univerzální diskrétní odšumování nejistoty podkanálu minimax. IEEE Trans. Inf. Theory, 52: 3476–3497, 2006.
^ G. M. Gemelos, S. Sigurjonsson a T. Weissman. Algoritmy pro diskrétní potlačení nejistoty podkanálu. IEEE Trans. Signal Process., 54 (6): 2263–2276, červen 2006.
^ E. Ordentlich, M. J. Weinberger a T. Weissman. Vícesměrné kontextové sady s aplikacemi pro univerzální odšumění a kompresi. V Proc. 2005 IEEE Intl. Symp. onInform. Theory, (ISIT’05), Adelaide, Austrálie, září 2005.
^ J. Yu a S. Verd´u. Schémata pro obousměrné modelování diskrétních stacionárních zdrojů. IEEETrans. Informovat. Theory, 52 (11): 4789–4807, 2006.
^ S. Chen, S. N. Diggavi, S. Dusad a S. Muthukrishnan. Efektivní algoritmy shody řetězců pro kombinatorické univerzální odšumění. V Proc. konference IEEE Data Compression Conference (DCC), Snowbird, Utah, březen 2005.
^ G. Gimel’farb. Adaptivní kontext pro diskrétní univerzální oddělovač. V Proc. Strukturální, syntaktické a statistické rozpoznávání vzorů, společné mezinárodní semináře IAPR, SSPR 2004 a SPR 2004, Lisabon, Portugalsko, 18. – 20. Srpna, str. 477–485
^ E. Ordentlich, G. Seroussi, S. Verd´u, M. J. Weinberger a T. Weissman. Univerzální oddělovač diskrétních obrazů a jeho aplikace na binární obrazy. V Proc. IEEE International Conferenceon Image Processing, Barcelona, Katalánsko, Španělsko, září 2003.
^ E. Ordentlich, G. Seroussi, S. Verdú a K. Viswanathan, „UniversalAlgorithms for Channel Decoding of Uncompressed Sources“, IEEE Trans.Information Theory, sv. 54, č. 5, s. 2243–2262, květen 2008

[dude-orig-1] A ^b ^C T. Weissman, E. Ordentlich, G. Seroussi, S. Verdu 'a M. J. Weinberger. Univerzální diskrétní odšumění: Známý kanál. Transakce IEEE na informační teorii, 51 (1): 5–28, 2005.

[lower-2] K. Viswanathan a E. Ordentlich. Dolní limity diskrétního univerzálního odšumění. Transakce IEEE o teorii informací, 55 (3): 1374–1386, 2009.

[3] Ordentlich, E .; Seroussi, G .; Verd´u; Weinberger, M. J .; Weissman, T. „Úvahy o DUDE“ (pdf). Citovat deník vyžaduje | deník = (Pomoc)

[4] A. Dembo a T. Weissman. Univerzální odšumění pro kanál konečných vstupů-obecných výstupů. IEEE Trans. Inf. Theory, 51 (4): 1507–1517, duben 2005.

[5] K. Sivaramakrishnan a T. Weissman. Univerzální odšumění diskrétních signálů spojité amplitudy. V Proc. 2006 IEEE Intl. Symp. na Inform. Theory, (ISIT’06), Seattle, WA, USA, červenec 2006.

[cont-alphabet1-6] A ^b G. Motta, E. Ordentlich, I. Ramírez, G. Seroussi a M. Weinberger, „TheDUDE framework for Continuous tone image denoising,“ IEEE Transactions onImage Processing, 20, No. 1, leden 2011.

[cont-alphabet2-7] A ^b K. Sivaramakrishnan a T. Weissman. Univerzální odšumění signálů spojité amplitudy s aplikacemi na obrazy. V Proc. Mezinárodní konference IEEE o zpracování obrazu, Atlanta, GA, USA, říjen 2006, str. 2609–2612

[8] C. D. Giurcaneanu a B. Yu. Efektivní algoritmy pro diskrétní univerzální potlačení šumu pro kanály s pamětí. V Proc. 2005 IEEE Intl. Symp. na Inform. Theory, (ISIT’05), Adelaide, Austrálie, září 2005.

[9] R. Zhang a T. Weissman. Diskrétní potlačení šumu pro kanály s pamětí. Communicationsin Information and Systems (CIS), 5 (2): 257–288, 2005.

[10] G. M. Gemelos, S. Sigurjonsson, T. Weissman. Univerzální diskrétní odšumování nejistoty podkanálu minimax. IEEE Trans. Inf. Theory, 52: 3476–3497, 2006.

[11] G. M. Gemelos, S. Sigurjonsson a T. Weissman. Algoritmy pro diskrétní potlačení nejistoty podkanálu. IEEE Trans. Signal Process., 54 (6): 2263–2276, červen 2006.

[12] E. Ordentlich, M. J. Weinberger a T. Weissman. Vícesměrné kontextové sady s aplikacemi pro univerzální odšumění a kompresi. V Proc. 2005 IEEE Intl. Symp. onInform. Theory, (ISIT’05), Adelaide, Austrálie, září 2005.

[13] J. Yu a S. Verd´u. Schémata pro obousměrné modelování diskrétních stacionárních zdrojů. IEEETrans. Informovat. Theory, 52 (11): 4789–4807, 2006.

[14] S. Chen, S. N. Diggavi, S. Dusad a S. Muthukrishnan. Efektivní algoritmy shody řetězců pro kombinatorické univerzální odšumění. V Proc. konference IEEE Data Compression Conference (DCC), Snowbird, Utah, březen 2005.

[15] G. Gimel’farb. Adaptivní kontext pro diskrétní univerzální oddělovač. V Proc. Strukturální, syntaktické a statistické rozpoznávání vzorů, společné mezinárodní semináře IAPR, SSPR 2004 a SPR 2004, Lisabon, Portugalsko, 18. – 20. Srpna, str. 477–485

[2d-dude-16] E. Ordentlich, G. Seroussi, S. Verd´u, M. J. Weinberger a T. Weissman. Univerzální oddělovač diskrétních obrazů a jeho aplikace na binární obrazy. V Proc. IEEE International Conferenceon Image Processing, Barcelona, Katalánsko, Španělsko, září 2003.

[uncompressed-sources-17] E. Ordentlich, G. Seroussi, S. Verdú a K. Viswanathan, „UniversalAlgorithms for Channel Decoding of Uncompressed Sources“, IEEE Trans.Information Theory, sv. 54, č. 5, s. 2243–2262, květen 2008

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]