Gaborův filtr - Gabor filter
![]() | tento článek může být pro většinu čtenářů příliš technická na to, aby tomu rozuměli. Prosím pomozte to vylepšit na aby to bylo srozumitelné pro neodborníky, aniž by byly odstraněny technické podrobnosti. (Února 2017) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) |

v zpracování obrazu, a Gaborův filtr, pojmenoval podle Dennis Gabor, je lineární filtr používá textura analýza, což v podstatě znamená, že analyzuje, zda je v obraze nějaký konkrétní frekvenční obsah v konkrétních směrech v lokalizované oblasti kolem bodu nebo oblasti analýzy. Četnost a orientační reprezentace Gaborových filtrů tvrdí mnoho současných vědců o vidění, že jsou podobné těm z lidský vizuální systém.[1] Bylo zjištěno, že jsou zvláště vhodné pro reprezentaci textury a diskriminaci. V prostorové doméně je 2D Gaborův filtr a Gaussian funkce jádra modulován a sinusový rovinná vlna (vidět Gaborova transformace ).
Někteří autoři tvrdí, že jednoduché buňky v vizuální kůra z mozek savců lze modelovat pomocí funkcí Gabor.[2][3] Tím pádem, analýza obrazu Někteří si myslí, že s Gaborovými filtry jsou podobné vnímání v lidský vizuální systém.
Definice
![]() | Tato část je věcná přesnost je sporný.únor 2013) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Své impulsní odezva je definován a sinusový vlna (a rovinná vlna pro 2D Gaborovy filtry) vynásobené a Gaussova funkce.[4]Kvůli vlastnosti multiplikace-konvoluce (Konvoluční věta ), Fourierova transformace impulsní odezvy Gaborova filtru je konvoluce Fourierovy transformace harmonické funkce (sinusová funkce) a Fourierovy transformace Gaussovy funkce. Filtr má skutečnou a imaginární složku představující ortogonální Pokyny.[5] Tyto dvě složky mohou být formovány do a komplexní číslo nebo použít jednotlivě.
Komplex
Nemovitý
Imaginární
kde
a
V této rovnici představuje vlnovou délku sinusového faktoru, představuje orientaci normály na rovnoběžné pruhy a Gaborova funkce, je fázový posun, je sigma / směrodatná odchylka Gaussovy obálky a je prostorový poměr stran a určuje eliptičnost podpory funkce Gabor.
Waveletový prostor

Gaborovy filtry přímo souvisejí s Gaborovy vlnky, protože mohou být navrženy pro řadu dilatací a rotací. Obecně se však expanze u gaborských vlnek nepoužívá, protože to vyžaduje výpočet bi-ortogonálních vlnek, což může být časově velmi náročné. Proto se obvykle vytváří filtrační banka skládající se z Gaborových filtrů s různými měřítky a rotacemi. Filtry jsou spojeny se signálem, což má za následek takzvaný Gaborův prostor. Tento proces úzce souvisí s procesy v primárním vizuální kůra.[6]Jones a Palmer ukázali, že skutečná část komplexní Gaborovy funkce se dobře hodí k funkcím hmotnosti receptivního pole, které se nacházejí v jednoduchých buňkách v kočičí striate kůře.[7]
Extrakce funkcí z obrázků
Sada Gaborových filtrů s různými frekvencemi a orientacemi může být užitečná pro extrakci užitečných funkcí z obrázku.[8] V diskrétní doméně jsou dvourozměrné Gaborovy filtry dány vztahem,
kde B a C jsou normalizační faktory, které mají být stanoveny.
2-D Gaborovy filtry mají bohaté aplikace při zpracování obrazu, zejména v extrakce funkcí pro analýzu a segmentaci textury.[9] definuje hledanou frekvenci v textuře. Změnou , můžeme hledat texturu orientovanou určitým směrem. Změnou , změníme podporu základny nebo velikosti analyzované obrazové oblasti.
Aplikace 2-D Gaborových filtrů při zpracování obrazu
Při zpracování obrazu dokumentu jsou funkce Gabor ideální pro identifikaci skriptu slova ve vícejazyčném dokumentu.[10] Gaborovy filtry s různými frekvencemi as orientací v různých směrech byly použity k lokalizaci a extrakci pouze textových oblastí ze složitých obrazů dokumentů (šedé i barevné), protože text je bohatý na vysokofrekvenční složky, zatímco obrázky mají relativně hladkou povahu.[11][12][13] Rovněž byla použita pro rozpoznávání výrazu obličeje [14]Gaborovy filtry byly také široce používány v aplikacích pro analýzu vzorů. Například se používá ke studiu distribuce směrovosti uvnitř porézní houby trabekulární kost v páteř.[15] Gaborský prostor je velmi užitečný zpracování obrazu aplikace jako optické rozpoznávání znaků, rozpoznávání duhovky a rozpoznávání otisků prstů. Vztahy mezi aktivacemi pro konkrétní prostorové umístění jsou mezi objekty v obraze velmi charakteristické. Kromě toho lze z Gaborova prostoru extrahovat důležité aktivace za účelem vytvoření řídké reprezentace objektu.
Ukázkové implementace
(Kód pro extrakci funkce Gabor z obrázků ve Windows MATLAB najdete na http://www.mathworks.com/matlabcentral/fileexchange/44630.)
Toto je příklad implementace v Krajta:
import numpy tak jako npdef Gabor(sigma, theta, Lambda, psi, gama): "" "Extrakce funkce Gabor." "" sigma_x = sigma sigma_y = plovák(sigma) / gama # Ohraničující rámeček nstds = 3 # Počet směrodatných odchylek sigma xmax = max(břišní svaly(nstds * sigma_x * np.cos(theta)), břišní svaly(nstds * sigma_y * np.hřích(theta))) xmax = np.strop(max(1, xmax)) ymax = max(břišní svaly(nstds * sigma_x * np.hřích(theta)), břišní svaly(nstds * sigma_y * np.cos(theta))) ymax = np.strop(max(1, ymax)) xmin = -xmax ymin = -ymax (y, X) = np.mřížka(np.divný(ymin, ymax + 1), np.divný(xmin, xmax + 1)) # Rotace x_theta = X * np.cos(theta) + y * np.hřích(theta) y_theta = -X * np.hřích(theta) + y * np.cos(theta) gb = np.exp(-.5 * (x_theta ** 2 / sigma_x ** 2 + y_theta ** 2 / sigma_y ** 2)) * np.cos(2 * np.pi / Lambda * x_theta + psi) vrátit se gb
Implementace na obrázky najdete v části [1].
Toto je příklad implementace v MATLAB /Oktáva:
funkcegb=gabor_fn(sigma, theta, lambda, psi, gama)sigma_x = sigma;sigma_y = sigma / gama;% Ohraničující rámečeknstds = 3;xmax = max(břišní svaly(nstds * sigma_x * cos(theta)), břišní svaly(nstds * sigma_y * hřích(theta)));xmax = strop(max(1, xmax));ymax = max(břišní svaly(nstds * sigma_x * hřích(theta)), břišní svaly(nstds * sigma_y * cos(theta)));ymax = strop(max(1, ymax));xmin = -xmax; ymin = -ymax;[X,y] = mřížka(xmin:xmax, ymin:ymax);% Rotace x_theta = X * cos(theta) + y * hřích(theta);y_theta = -X * hřích(theta) + y * cos(theta);gb = exp(-.5*(x_theta.^2/sigma_x^2+y_theta.^2/sigma_y^2)).*cos(2*pi/lambda*x_theta+psi);
Toto je další příklad implementace v Haskell:
import Data (Komplex((:+)))Gabor λ θ ψ σ y X y = exp ( (-0.5) * ((X'^2 + y^2*y '^2) / (σ^2)) :+ 0) * exp ( 0 :+ (2*pi*X'/λ+ψ) ) kde X' = X * cos θ + y * hřích θ y ' = -X * hřích θ + y * cos θ
(Poznámka: a: + b
by měl být čten jako )
Viz také
Reference
- ^ Olshausen, B. A. & Field, D. J. (1996). "Vznik vlastností receptivního pole jednoduchých buněk učením řídkého kódu pro přirozené obrazy". Příroda. 381 (6583): 607–609. Bibcode:1996 Natur.381..607O. doi:10.1038 / 381607a0. PMID 8637596. S2CID 4358477.CS1 maint: více jmen: seznam autorů (odkaz)
- ^ Marčelja, S. (1980). "Matematický popis odpovědí jednoduchých kortikálních buněk". Journal of the Optical Society of America. 70 (11): 1297–1300. Bibcode:1980JOSA ... 70,1297M. doi:10.1364 / JOSA.70.001297. PMID 7463179.
- ^ Daugman, John G. (01.07.1985). "Vztah nejistoty pro rozlišení v prostoru, prostorové frekvenci a orientaci optimalizovaný dvourozměrnými vizuálními kortikálními filtry". Journal of the Optical Society of America A. 2 (7): 1160–9. Bibcode:1985JOSAA ... 2.1160D. CiteSeerX 10.1.1.465.8506. doi:10.1364 / JOSAA.2.001160. ISSN 1084-7529. PMID 4020513.
- ^ Fogel, I .; Sagi, D. (červen 1989). "Gaborovy filtry jako diskriminátor textury". Biologická kybernetika. 61 (2). CiteSeerX 10.1.1.367.2700. doi:10.1007 / BF00204594. ISSN 0340-1200. OCLC 895625214. S2CID 14952808.
- ^ 3D sledování a aproximace povrchu pomocí filtrů Gabor, Jesper Juul Henriksen, South Denmark University, 28. března 2007
- ^ Daugman, J.G. (1980), „Dvojrozměrná spektrální analýza profilů kortikálního receptivního pole“, Vision Res., 20 (10): 847–56, doi:10.1016/0042-6989(80)90065-6, PMID 7467139, S2CID 40518532
- ^ Jones, J.P .; Palmer, L.A. (1987). „Vyhodnocení modelu dvourozměrného Gaborova filtru jednoduchých receptivních polí v kočičí striate kůře“ (PDF). J. Neurophysiol. 58 (6): 1233–1258. doi:10.1152 / jn.1987.58.6.1233. PMID 3437332. S2CID 16809045.
- ^ Haghighat, M .; Zonouz, S .; Abdel-Mottaleb, M. (2013). "Identifikace pomocí šifrované biometrie". Počítačová analýza obrazů a vzorů. Přednášky z informatiky. 8048. p. 440. doi:10.1007/978-3-642-40246-3_55. ISBN 978-3-642-40245-6.
- ^ Ramakrishnan, A.G .; Kumar Raja, S .; Raghu Ram, H.V. (2002). „Neuronová síťová segmentace textur pomocí funkcí Gabor“ (PDF). Proceedings of the 12th IEEE Workshop on Neural Networks for Signal Processing. Martigny, Švýcarsko: IEEE: 365–374. doi:10.1109 / NNSP.2002.1030048. ISBN 978-0-7803-7616-8. OCLC 812617471. S2CID 10994982.
- ^ Pati, Peeta Basa; Ramakrishnan, A.G. (červenec 2008). Msgstr "Identifikace více skriptů na úrovni Wordu". Písmena pro rozpoznávání vzorů. 29 (9): 1218–1229. doi:10.1016 / j.patrec.2008.01.027. ISSN 0167-8655.
- ^ Raju S, S .; Pati, P.B .; Ramakrishnan, A.G. (2004). „Analýza energie bloku pomocí Gaborova filtru pro extrakci textu z obrázků digitálních dokumentů“ (PDF). First International Workshop on Document Image Analysis for Libraries, 2004. Proceedings. Palo Alto, CA, USA: IEEE: 233–243. doi:10.1109 / DIAL.2004.1263252. ISBN 978-0-7695-2088-9. LCCN 2003116308. OL 8067708M. S2CID 21856192.
- ^ Raju, S. Sabari; Pati, P. B .; Ramakrishnan, A. G. (2005). "Lokalizace textu a extrakce ze složitých barevných obrázků". Přednášky z informatiky. 3804: 486–493. doi:10.1007/11595755_59. ISBN 978-3-540-30750-1. ISSN 0302-9743. LCCN 2005936803. OL 9056158M.
- ^ S Sabari Raju, P B Pati a A G Ramakrishnan, „Lokalizace textu a extrakce ze složitých barevných obrázků“, Proc. První mezinárodní konference o pokroku ve vizuálních výpočtech (ISVC05), Nevada, USA, LNCS 3804, Springer Verlag, 5.-7. Prosince 2005, str. 486-493.
- ^ Lyons, M .; Akamatsu, S .; Kamachi, M .; Gyoba, J. (1998). Kódování mimiky pomocí Gaborových vlnek. 200–205. doi:10.1109 / AFGR.1998.670949. ISBN 0-8186-8344-9. OL 11390549M. S2CID 1586662.
- ^ Gdyczynski, C.M .; Manbachi, A .; et al. (2014). "Na základě odhadu distribuce směrovosti v pedikulární trabekulární kosti z mikro-CT snímků". Žurnál fyziologických měření. 35 (12): 2415–2428. Bibcode:2014PhyM ... 35.2415G. doi:10.1088/0967-3334/35/12/2415. PMID 25391037.
externí odkazy
- Kód MATLAB pro filtry Gabor a extrakci funkcí Gabor
- 3D Gabor předvedl s Mathematica
- pythonová implementace log-gaborů pro statické obrázky
- Gaborův filtr pro zpracování obrazu a počítačové vidění (demonstrace)
Další čtení
- Feichtinger, Hans G.; Strohmer, Thomas, eds. (1998). Gaborova analýza a algoritmy: teorie a aplikace. Boston: Birkhäuser. ISBN 0-8176-3959-4. LCCN 97032252. OCLC 37761814. OL 685385M.
- Gröchenig, Karlheinz (2001). Základy časově-frekvenční analýzy: s 15 čísly. Aplikovaná a numerická harmonická analýza. Boston: Birkhäuser. doi:10.1007/978-1-4612-0003-1. ISBN 0-8176-4022-3. LCCN 00044508. OCLC 44420790. OL 8074618M.
- Daugman, J.G. (1988). „Kompletní diskrétní 2-D Gaborovy transformace neurálními sítěmi pro analýzu a kompresi obrazu“ (PDF). Transakce IEEE na akustiku, řeč a zpracování signálu. 36 (7): 1169–1179. CiteSeerX 10.1.1.371.5847. doi:10.1109/29.1644. ISSN 0096-3518.
- „Online ukázka filtru Gabor“. Archivovány od originál dne 15. 6. 2009. Citováno 2009-05-25.
- Movellan, Javier R. "Výukový program pro Gaborovy filtry" (PDF). Archivovány od originál (PDF) dne 19. 4. 2009. Citováno 2008-05-14.
- Lagae, Ares; Lefebvre, Sylvain; Drettakis, George; Dutré, Philip (2009). „Procedurální hluk využívající řídké Gaborovy konvoluce“. Transakce ACM v grafice. 28 (3): 1. CiteSeerX 10.1.1.232.5566. doi:10.1145/1531326.1531360. Citováno 2009-09-12.
- Říditelné pyramidy:
- Stránka Eera Simoncelliho na Řiditelné pyramidy
- Manduchi, R .; Perona, P .; Shy, D. (duben 1998). "Efektivní deformovatelné banky filtrů" (PDF). Transakce IEEE při zpracování signálu. 46 (4): 1168–1173. Bibcode:1998ITSP ... 46.1168M. doi:10.1109/78.668570. ISSN 1053-587X. OCLC 926890247. (PDF ) (Kód )
- Fischer, Sylvain; Šroubek, Filip; Perrinet, Laurent; Redondo, Rafael; Cristóbal, Gabriel (2007). „Self-Invertible 2D Log-Gabor Wavelets“ (PDF). International Journal of Computer Vision. 75 (2): 231–246. CiteSeerX 10.1.1.329.6283. doi:10.1007 / s11263-006-0026-8. ISSN 0920-5691. S2CID 1452724.