Částečně založené modely - Part-based models

Částečně založené modely odkazuje na širokou třídu detekčních algoritmů používaných na obrázcích, ve kterých se různé části obrazu používají samostatně, aby se určilo, zda a kde předmět zájmu existuje. Mezi těmito metodami je velmi populární metoda model souhvězdí který odkazuje na ta schémata, která se snaží zjistit malý počet znaků a jejich relativní polohy, aby pak určily, zda je předmět zájmu přítomný či nikoli.

Tyto modely vycházejí z původní myšlenky Fischlera a Elschlagera[1] použití relativní polohy několika shod šablony a vyvíjet se ve složitosti v práci Perony a dalších.[2] Těmto modelům se budeme věnovat v sekci modely souhvězdí. Pro lepší představu o tom, co se rozumí konstelačním modelem, může být příklad názornější. Řekněme, že se o to snažíme detekovat tváře. Model souhvězdí by používal detektory menších částí, například detektory úst, nosu a očí, a na základě relativních poloh, ve kterých komponenty střílejí, by provedl posouzení, zda má obraz obličej.

Non-souhvězdí modely

Mnoho překrývajících se myšlenek je zahrnuto v modelech založených na titulní části i po vyloučení těchto modelů konstelační odrůdy. Sjednocujícím vláknem je použití malých dílů k vytvoření algoritmu, který dokáže detekovat / rozpoznat předmět (obličej, auto atd.) Časné snahy, jako například Yuille, Hallinan a Cohen[3] snažil se detekovat rysy obličeje a přizpůsobit jim deformovatelné šablony. Tyto šablony byly matematicky definované obrysy, které se snažily zachytit polohu a tvar prvku. Yuille, Hallinan a Cohenův algoritmus mají potíže najít globální minimum vhodné pro daný model, a tak se šablony občas neshodovaly.

Pozdější snahy, jako například Poggio a Brunelli[4] zaměřit se na vytváření specifických detektorů pro každou funkci. Používají po sobě jdoucí detektory k odhadu měřítka, polohy atd. A zužují vyhledávací pole, které má použít další detektor. Jde tedy o model založený na částečném použití, ale spíše se snaží rozpoznávat konkrétní tváře než detekovat přítomnost tváře. Činí tak pomocí každého detektoru k vytvoření 35 prvkového vektoru charakteristik dané tváře. Tyto charakteristiky pak mohou být porovnány k rozpoznání konkrétních tváří, ale ořezy lze také použít ke zjištění, zda je tvář vůbec přítomna.

Cootes, Lanitis a Taylor[5] stavět na této práci při konstrukci 100 prvkové reprezentace primárních rysů obličeje. Model je podrobnější a robustnější, ale vzhledem k další složitosti (100 prvků ve srovnání s 35) by se to dalo očekávat. Model v podstatě počítá odchylky od střední plochy z hlediska tvaru, orientace a úrovně šedé. Modelu odpovídá minimální minimalizace chybová funkce. Tyto tři třídy algoritmů přirozeně spadají do rozsahu shoda šablony[6]

Snad nejúspěšnější z nekonstelace je Leibe a Schiele.[7][8] Jejich algoritmus najde šablony spojené s pozitivními příklady a zaznamená jak šablonu (průměr prvku ve všech pozitivních příkladech, kde je přítomen), tak polohu středu položky (například tvář) vzhledem k šabloně. Algoritmus poté pořídí testovací obraz a spustí vyhledávač zajímavých bodů (doufejme, že jeden z měřítko neměnné odrůda). Tyto úrokové body se poté porovnají s každou šablonou a vypočítá se pravděpodobnost shody. Všechny šablony poté odevzdávají hlasy středu detekovaného objektu úměrně k pravděpodobnosti shody a pravděpodobnost, že šablona předpovídá střed. Všechny tyto hlasy jsou sečteny a pokud je jich dost, v dostatečném množství shluků, předpokládá se přítomnost dotyčného objektu (tj. Obličeje nebo automobilu).

Algoritmus je efektivní, protože ukládá mnohem menší konstelační tuhost, jak to dělá konstelační model. Je pravda, že model souhvězdí lze upravit tak, aby umožňoval okluze a další velké abnormality, ale tento model k němu přirozeně vyhovuje. Rovněž je třeba říci, že někdy je požadována přísnější struktura souhvězdí.

Viz také

Reference

  1. ^ Fischler, M. A.; Elschlager, R.A. (1973). "Reprezentace a shoda obrazových struktur". Transakce IEEE na počítačích: 67–92. doi:10.1109 / T-C.1973.223602.
  2. ^ Fergus, R .; Perona, P .; Zisserman, A. (2003). Rozpoznávání tříd objektů nekontrolovaným učením neměnného rozsahu. Konference IEEE Computer Society o počítačovém vidění a rozpoznávání vzorů. 2. s. II – 264. doi:10.1109 / CVPR.2003.1211479. ISBN  0-7695-1900-8.
  3. ^ Yuille, Alan L .; Hallinan, Peter W .; Cohen, David S. (1992). "Extrakce prvků z ploch pomocí deformovatelných šablon". International Journal of Computer Vision. 8 (2): 99. doi:10.1007 / BF00127169.
  4. ^ Brunelli, R .; Poggio, T. (1993). "Rozpoznávání tváře: Funkce versus šablony". Transakce IEEE na analýze vzorů a strojové inteligenci. 15 (10): 1042. doi:10.1109/34.254061.
  5. ^ Lanitis, A .; Taylor, C.J .; Cootes, T.F. (1995). Jednotný přístup ke kódování a interpretaci obrazů tváří. Mezinárodní konference IEEE o počítačovém vidění. str. 368. doi:10.1109 / ICCV.1995.466919. ISBN  0-8186-7042-8.
  6. ^ Brunelli, R. (2009). Techniky párování šablon v počítačovém vidění: teorie a praxe. Wiley. ISBN  978-0-470-51706-2.
  7. ^ Leibe, Bastian; Leonardis, Aleš; Schiele, Bernt (2007). "Robustní detekce objektů s prokládanou kategorizací a segmentací". International Journal of Computer Vision. 77 (1–3): 259–289. CiteSeerX  10.1.1.111.464. doi:10.1007 / s11263-007-0095-3.
  8. ^ Leibe, Bastian; Leonardis, Aleš; Schiele, Bernt (2006). "Implicitní tvarový model pro kombinovanou kategorizaci a segmentaci objektů". Směrem k rozpoznávání objektů na úrovni kategorie. Přednášky z informatiky. 4170. str. 508. CiteSeerX  10.1.1.5.6272. doi:10.1007/11957959_26. ISBN  978-3-540-68794-8.