Učení geometrických prvků - Geometric feature learning - Wikipedia

Učení geometrických prvků je technika kombinující strojové učení a počítačové vidění řešit vizuální úkoly. Hlavním cílem této metody je najít sadu reprezentativních znaků geometrické formy, která bude reprezentovat objekt, sbíráním geometrických prvků z obrázků a jejich učením pomocí efektivní strojové učení metody. Lidé řeší vizuální úkoly a mohou rychle reagovat na prostředí tím, že získávají vnímavé informace z toho, co vidí. Vědci simulují schopnost člověka rozpoznávat objekty k řešení problémů s počítačovým viděním. Například M. Mata a kol. (2002) ^[1] aplikované techniky učení funkcí na navigace mobilních robotů úkoly, aby se zabránilo překážkám. Oni použili genetické algoritmy pro funkce učení a rozpoznávání objektů (čísla). Metody učení geometrických prvků mohou nejen vyřešit problémy s rozpoznáváním, ale také předvídat následné akce analýzou sady sekvenčních vstupních senzorických obrazů, obvykle některých extrakčních vlastností obrazů. Prostřednictvím učení jsou uvedeny určité hypotézy o další akci a podle pravděpodobnosti každé hypotézy dejte nejpravděpodobnější akci. Tato technika je široce používána v oblasti umělá inteligence.

Úvod

Metody učení geometrických prvků extrahují z obrázků charakteristické geometrické prvky. Geometrické prvky jsou prvky objektů vytvořené sadou geometrických prvků, jako jsou body, čáry, křivky nebo povrchy. Těmito prvky mohou být rohové prvky, hranové prvky, objekty Blob, Ridges, struktura obrazu hlavních bodů atd., Které lze zjistit pomocí detekce funkcí metody.

Geometrické prvky

Primitivní funkce

Rohy: Rohy jsou velmi jednoduchá, ale významná vlastnost objektů. Obzvláště složité objekty mají obvykle navzájem různé rohové prvky. Rohy objektu lze extrahovat pomocí techniky, volání Detekce rohů. Cho a Dunn ^[2] použil jiný způsob, jak definovat roh podle vzdálenosti a úhlu mezi dvěma přímými segmenty. Jedná se o nový způsob definováním funkcí jako parametrizovaného složení několika komponent.
Hrany: Hrany jsou jednorozměrné strukturní prvky obrazu. Představují hranici různých oblastí obrazu. Obrys objektu lze snadno detekovat vyhledáním okraje pomocí techniky Detekce hrany.
Blobs: Blobs represent areas of images, which can be identified using detekce blob metoda.
Hřebeny: Z praktického hlediska lze hřeben považovat za jednorozměrnou křivku, která představuje osu symetrie. Metoda detekce hřebenů - viz detekce hřebene
hlavní body - viz Detektor kadence Kadir – Brady
textura obrazu

Složené vlastnosti^[3]

Geometrické složení

Prvek geometrické součásti je kombinací několika primitivních prvků a vždy se skládá z více než 2 primitivních prvků, jako jsou hrany, rohy nebo kuličky. Extrakci vektoru geometrických prvků v místě x lze vypočítat podle referenčního bodu, který je uveden níže:

{ displaystyle textstyle x_ {i} = x_ {i-1} + sigma _ {i-1} d_ {i} { begin {bmatrix} cos ( theta _ {i-1} + phi _ {i}) sin ( theta _ {i-1} + phi _ {i}) end {bmatrix}}}

{ displaystyle textstyle theta _ {i} = theta _ {i-1} + Delta theta _ {i}}

{ displaystyle textstyle sigma _ {i} = sigma _ {i-1} Delta sigma _ {i}}

x znamená umístění umístění funkcí, ${ displaystyle textstyle theta}$ znamená orientaci, ${ displaystyle textstyle sigma}$ znamená vnitřní měřítko.

Booleovské složení

Booleovský složený prvek se skládá ze dvou dílčích prvků, kterými mohou být primitivní prvky nebo složené prvky. Existují dva typy booleovských funkcí: konjunktivní funkce, jejíž hodnota je součinem dvou dílčích funkcí a disjunktivní funkce, jejichž hodnota je maximem dvou dílčích funkcí.

Prostor funkce

Prostor funkce byl nejprve považován v oblasti počítačového vidění Segenem.^[4] Použil víceúrovňový graf k reprezentaci geometrických vztahů místních prvků.

Algoritmy učení

Existuje mnoho učebních algoritmů, které lze použít k naučení se hledání charakteristické rysy objektů v obraze. Učení může být přírůstkové, což znamená, že třídy objektů lze přidat kdykoli.

Metody extrakce geometrických prvků

Algoritmus učení funkcí

1. Získejte nový tréninkový obrázek „I“.

2. Vyhodnoťte výsledek podle algoritmu rozpoznávání. Pokud je výsledek pravdivý, jsou rozpoznány nové třídy objektů.

algoritmus rozpoznávání

Klíčovým bodem algoritmu rozpoznávání je najít nejvýraznější vlastnosti mezi všemi vlastnostmi všech tříd. Takže pomocí níže uvedené rovnice maximalizujete funkci ${ displaystyle textstyle f_ {max}}$

{ displaystyle textstyle I_ {max} = { podmnožina {f} {max}} { podmnožina {C} {max}} I (C, F_ {f})}

{ displaystyle textstyle I (C, F_ {f}) = - { podmnožina {C} { sum}} { podmnožina {F_ {f}} { sum}} BEL (F_ {f}, C ) log { frac {BEL (C, F_ {f})} {BEL (F_ {f}) BEL (C)}}}

Změřte hodnotu prvku v obrazech, ${ displaystyle textstyle f_ {max}}$ a ${ displaystyle textstyle f_ {f_ {max}}}$ a lokalizujte funkci:

{ displaystyle textstyle f_ {f _ {(p)}} (I) = { podmnožina {x in I} {max}} f_ {f _ {(p)}} (x)}

Kde ${ displaystyle textstyle f_ {f _ {(p)}} (x)}$ je definován jako ${ displaystyle textstyle f_ {f _ {(p)}} (I) = max left {0, { frac {f (p) ^ {T}) f (x)} { left | f ( p) right | left | f (x) right |}} right }}$

hodnocení

Po rozpoznání funkcí by měly být výsledky vyhodnoceny, aby se zjistilo, zda lze třídy rozpoznat. Existuje pět hodnotících kategorií výsledků rozpoznávání: správné, špatné, nejednoznačné, zmatené a neznalé. Pokud je hodnocení správné, přidejte nový tréninkový obrázek a trénujte ho. Pokud rozpoznání selhalo, uzly prvků by měly maximalizovat jejich charakteristickou sílu, která je definována vzdáleností Kolmogorov-Smirno (KSD).

{ displaystyle textstyle KSD_ {a, b} (X) = { podmnožina { alpha} {max}} left | cdf ( alpha | a) -cdf ( alpha | b) vpravo |}

3. Algoritmus učení funkce mA Poté, co je funkce rozpoznána, měla by být použita Bayesovská síť rozpoznat obraz pomocí algoritmu učení funkcí k testování.

Hlavním účelem algoritmu učení funkcí je najít novou funkci z ukázkového obrázku a otestovat, zda jsou třídy rozpoznány či nikoli. Je třeba vzít v úvahu dva případy: Hledání nové funkce pravé třídy a nesprávné třídy z ukázkového obrázku. Pokud je detekována nová vlastnost true třídy a špatná třída není rozpoznána, je třída rozpoznána a algoritmus by měl být ukončen. Pokud není v ukázkovém obrazu detekována vlastnost true třídy a je detekována falešná třída, mělo by se zabránit rozpoznání falešné třídy a prvek by měl být odstraněn z Bayesovské sítě.
Využití Bayesovské sítě k realizaci testovacího procesu

Algoritmus učení funkcí založený na modelu PAC

Rámec učení

Pravděpodobně přibližně správný (PAC) model použil D. Roth (2002) k řešení problému počítačového vidění vyvinutím teorie distribuce bez učení založené na tomto modelu.^[5] Tato teorie se silně spoléhala na vývoj přístupu k efektivnímu učení funkcí. Cílem tohoto algoritmu je naučit se objekt představovaný některými geometrickými prvky v obraze. Vstup je a vektor funkcí a výstup je 1, což znamená úspěšně detekovat objekt nebo 0 jinak. Hlavním bodem tohoto vzdělávacího přístupu je sběr reprezentativních prvků, které mohou reprezentovat objekt pomocí funkce a testování rozpoznáním objektu z obrazu, aby bylo možné najít reprezentaci s vysokou pravděpodobností. Algoritmus učení si klade za cíl předpovědět, zda se koncept naučeného cíle ${ displaystyle textstyle f_ {T} (X)}$ is patří do třídy, kde X je prostor instance sestávající z parametrů a poté otestujte, zda je předpověď správná.

Rámec hodnocení

Po učení funkcí by měly existovat některé vyhodnocovací algoritmy pro vyhodnocení učebních algoritmů. D. Roth použil dva výukové algoritmy:

1.Sparse Network of Winnows (SNoW) systém

SNoW-Train
- Počáteční krok: inicializujte sadu funkcí ${ displaystyle textstyle F_ {t} = phi}$ který souvisí s cílem t pro všechny ${ displaystyle textstyle t v T}$ . T je sada cílů objektů, jejichž prvky jsou ${ displaystyle textstyle t_ {1}}$ na ${ displaystyle textstyle t_ {k}}$
- Pokud každý cílový objekt v sadě T patří do seznamu aktivních prvků, propojte prvek s cílem a současně nastavte počáteční váhu.
- Vyhodnoťte cíle: porovnejte cíle ${ displaystyle textstyle { podmnožina {i in e} { sum}} w_ {i} ^ {t}}$ s ${ displaystyle textstyle theta _ {t}}$ , kde ${ displaystyle textstyle w_ {i} ^ {t}}$ je váha v jedné poloze spojující prvky i s cílem t. theta_ {t} je prahová hodnota pro cíl, nikoli t.
- Aktualizujte váhu podle výsledku hodnocení. Existují dva případy: předpokládané pozitivní na negativním příkladu ( ${ displaystyle textstyle { podmnožina {i in e} { sum}} w_ {i} ^ {t}> theta _ {t}}$ a cíle nejsou v seznamu aktivních funkcí) a předpokládané negativní na pozitivním příkladu ( ${ displaystyle textstyle { podmnožina {i in e} { sum}} w_ {i} ^ {t} leq theta _ {t}}$ a cíle jsou v seznamu aktivních funkcí).
Hodnocení SNoW
- Vyhodnoťte každý cíl pomocí stejné funkce jako výše
- Predikce: Rozhodněte se vybrat dominantní aktivní cílový uzel.

2. podporovat vektorové stroje

Hlavním účelem SVM je najít a nadrovina k oddělení sady vzorků ${ displaystyle textstyle (x_ {i}, y_ {i})}$ kde ${ displaystyle textstyle x_ {i}}$ je vstupní vektor, který je výběrem funkcí ${ displaystyle textstyle x v R ^ {N}}$ a ${ displaystyle textový styl y_ {i}}$ je štítek ${ displaystyle textstyle x_ {i}}$ . Nadrovina má následující podobu: ${ displaystyle textstyle f (x) = sgn left ( sum _ {i = 1} ^ {l} y_ {i} alpha _ {i} cdot k (x, x_ {i}) + b right) = left {{ begin {matrix} 1, positive ; vstupy - 1, negativní ; vstupy end {matrix}} right.}$

${ displaystyle textstyle k (x, x_ {i}) = phi (x) cdot phi (x_ {i})}$ je funkce jádra

Oba algoritmy oddělují tréninková data hledáním lineární funkce.

Aplikace

Učení orientačních bodů pro topologickou navigaci^[6]
Simulace procesu detekce objektu chování lidského vidění^[7]
Učit se vlastní generované akci ^[8]
Sledování vozidla^[9]

Reference

^ M. Mata a J. M. Armingol a A. De La Escalera a M. A. Salichs, "Učení vizuálních orientačních bodů pro navigaci mobilních robotů ", Ve sborníku z 15. světového kongresu Mezinárodní federace automatického řízení, 2002
^ Cho, K. a Dunn, S.M "Učení tříd tvarů". Transakce IEEE na analýze vzorů a strojové inteligenci 16,9 (1994), 882-888
^ Justus H Piater, „Výuka vizuálních funkcí“ (1. ledna 2001). Elektronické disertační práce pro UMass Amherst. Papír AAI3000331.
^ Segen, J., Učení grafových modelů tvaru. Ve sborníku z 5. mezinárodní konference o strojovém učení (Ann Arbor, 12. – 14. Června 1988) J. Larid, ed., Morgan Kaufmann
^ D. Roth, M-H. Yang a N. Ahuja. Naučit se rozpoznávat trojrozměrné objekty. Neurální výpočet, 14(5): 1071–1104, 2002.
^ M. Mata, J. M. Armingol, Learning Visual Landmarks for Mobile Robot Navigation, Division of Systems Engineering and Automation, Madrid, Španělsko, 2002
^ I. A. Rybak, BMV: Behaviorální model vizuálního vnímání a rozpoznávání, Lidské vidění, vizuální zpracování a digitální displej IV
^ P. Fitzpatrick, G. Metta, L. Natale, S. Rao a G. Sandini, “Učení o objektech prostřednictvím akce - počáteční kroky k umělému poznání, “V IEEE Int. Conf on Robotics and Automation, 2003, str. 3140–3145.
^ J.M. Ferryman, A.D. Worrall a S.J. Maybank. Učení vylepšených 3D modelů pro sledování vozidel. V Proc. Britské konference strojového vidění, 1998

[1] M. Mata a J. M. Armingol a A. De La Escalera a M. A. Salichs, "Učení vizuálních orientačních bodů pro navigaci mobilních robotů ", Ve sborníku z 15. světového kongresu Mezinárodní federace automatického řízení, 2002

[2] Cho, K. a Dunn, S.M "Učení tříd tvarů". Transakce IEEE na analýze vzorů a strojové inteligenci 16,9 (1994), 882-888

[3] Justus H Piater, „Výuka vizuálních funkcí“ (1. ledna 2001). Elektronické disertační práce pro UMass Amherst. Papír AAI3000331.

[4] Segen, J., Učení grafových modelů tvaru. Ve sborníku z 5. mezinárodní konference o strojovém učení (Ann Arbor, 12. – 14. Června 1988) J. Larid, ed., Morgan Kaufmann

[5] D. Roth, M-H. Yang a N. Ahuja. Naučit se rozpoznávat trojrozměrné objekty. Neurální výpočet, 14(5): 1071–1104, 2002.

[6] M. Mata, J. M. Armingol, Learning Visual Landmarks for Mobile Robot Navigation, Division of Systems Engineering and Automation, Madrid, Španělsko, 2002

[7] I. A. Rybak, BMV: Behaviorální model vizuálního vnímání a rozpoznávání, Lidské vidění, vizuální zpracování a digitální displej IV

[8] P. Fitzpatrick, G. Metta, L. Natale, S. Rao a G. Sandini, “Učení o objektech prostřednictvím akce - počáteční kroky k umělému poznání, “V IEEE Int. Conf on Robotics and Automation, 2003, str. 3140–3145.

[9] J.M. Ferryman, A.D. Worrall a S.J. Maybank. Učení vylepšených 3D modelů pro sledování vozidel. V Proc. Britské konference strojového vidění, 1998

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]