Učení geometrických prvků - Geometric feature learning - Wikipedia
Učení geometrických prvků je technika kombinující strojové učení a počítačové vidění řešit vizuální úkoly. Hlavním cílem této metody je najít sadu reprezentativních znaků geometrické formy, která bude reprezentovat objekt, sbíráním geometrických prvků z obrázků a jejich učením pomocí efektivní strojové učení metody. Lidé řeší vizuální úkoly a mohou rychle reagovat na prostředí tím, že získávají vnímavé informace z toho, co vidí. Vědci simulují schopnost člověka rozpoznávat objekty k řešení problémů s počítačovým viděním. Například M. Mata a kol. (2002) [1] aplikované techniky učení funkcí na navigace mobilních robotů úkoly, aby se zabránilo překážkám. Oni použili genetické algoritmy pro funkce učení a rozpoznávání objektů (čísla). Metody učení geometrických prvků mohou nejen vyřešit problémy s rozpoznáváním, ale také předvídat následné akce analýzou sady sekvenčních vstupních senzorických obrazů, obvykle některých extrakčních vlastností obrazů. Prostřednictvím učení jsou uvedeny určité hypotézy o další akci a podle pravděpodobnosti každé hypotézy dejte nejpravděpodobnější akci. Tato technika je široce používána v oblasti umělá inteligence.
Úvod
Metody učení geometrických prvků extrahují z obrázků charakteristické geometrické prvky. Geometrické prvky jsou prvky objektů vytvořené sadou geometrických prvků, jako jsou body, čáry, křivky nebo povrchy. Těmito prvky mohou být rohové prvky, hranové prvky, objekty Blob, Ridges, struktura obrazu hlavních bodů atd., Které lze zjistit pomocí detekce funkcí metody.
Geometrické prvky
- Primitivní funkce
- Rohy: Rohy jsou velmi jednoduchá, ale významná vlastnost objektů. Obzvláště složité objekty mají obvykle navzájem různé rohové prvky. Rohy objektu lze extrahovat pomocí techniky, volání Detekce rohů. Cho a Dunn [2] použil jiný způsob, jak definovat roh podle vzdálenosti a úhlu mezi dvěma přímými segmenty. Jedná se o nový způsob definováním funkcí jako parametrizovaného složení několika komponent.
- Hrany: Hrany jsou jednorozměrné strukturní prvky obrazu. Představují hranici různých oblastí obrazu. Obrys objektu lze snadno detekovat vyhledáním okraje pomocí techniky Detekce hrany.
- Blobs: Blobs represent areas of images, which can be identified using detekce blob metoda.
- Hřebeny: Z praktického hlediska lze hřeben považovat za jednorozměrnou křivku, která představuje osu symetrie. Metoda detekce hřebenů - viz detekce hřebene
- hlavní body - viz Detektor kadence Kadir – Brady
- textura obrazu
- Složené vlastnosti[3]
- Geometrické složení
Prvek geometrické součásti je kombinací několika primitivních prvků a vždy se skládá z více než 2 primitivních prvků, jako jsou hrany, rohy nebo kuličky. Extrakci vektoru geometrických prvků v místě x lze vypočítat podle referenčního bodu, který je uveden níže:
x znamená umístění umístění funkcí, znamená orientaci, znamená vnitřní měřítko.
- Booleovské složení
Booleovský složený prvek se skládá ze dvou dílčích prvků, kterými mohou být primitivní prvky nebo složené prvky. Existují dva typy booleovských funkcí: konjunktivní funkce, jejíž hodnota je součinem dvou dílčích funkcí a disjunktivní funkce, jejichž hodnota je maximem dvou dílčích funkcí.
Prostor funkce
Prostor funkce byl nejprve považován v oblasti počítačového vidění Segenem.[4] Použil víceúrovňový graf k reprezentaci geometrických vztahů místních prvků.
Algoritmy učení
Existuje mnoho učebních algoritmů, které lze použít k naučení se hledání charakteristické rysy objektů v obraze. Učení může být přírůstkové, což znamená, že třídy objektů lze přidat kdykoli.
Metody extrakce geometrických prvků
- Detekce rohů
- Křivka
- Detekce hrany
- Extrakce globální struktury
- Histogramy prvků
- Detekce linky
- Označování připojených komponent
- Textura obrazu
- Odhad pohybu
Algoritmus učení funkcí
1. Získejte nový tréninkový obrázek „I“.
2. Vyhodnoťte výsledek podle algoritmu rozpoznávání. Pokud je výsledek pravdivý, jsou rozpoznány nové třídy objektů.
- algoritmus rozpoznávání
Klíčovým bodem algoritmu rozpoznávání je najít nejvýraznější vlastnosti mezi všemi vlastnostmi všech tříd. Takže pomocí níže uvedené rovnice maximalizujete funkci
Změřte hodnotu prvku v obrazech, a a lokalizujte funkci:
Kde je definován jako
- hodnocení
Po rozpoznání funkcí by měly být výsledky vyhodnoceny, aby se zjistilo, zda lze třídy rozpoznat. Existuje pět hodnotících kategorií výsledků rozpoznávání: správné, špatné, nejednoznačné, zmatené a neznalé. Pokud je hodnocení správné, přidejte nový tréninkový obrázek a trénujte ho. Pokud rozpoznání selhalo, uzly prvků by měly maximalizovat jejich charakteristickou sílu, která je definována vzdáleností Kolmogorov-Smirno (KSD).
3. Algoritmus učení funkce mA Poté, co je funkce rozpoznána, měla by být použita Bayesovská síť rozpoznat obraz pomocí algoritmu učení funkcí k testování.
- Hlavním účelem algoritmu učení funkcí je najít novou funkci z ukázkového obrázku a otestovat, zda jsou třídy rozpoznány či nikoli. Je třeba vzít v úvahu dva případy: Hledání nové funkce pravé třídy a nesprávné třídy z ukázkového obrázku. Pokud je detekována nová vlastnost true třídy a špatná třída není rozpoznána, je třída rozpoznána a algoritmus by měl být ukončen. Pokud není v ukázkovém obrazu detekována vlastnost true třídy a je detekována falešná třída, mělo by se zabránit rozpoznání falešné třídy a prvek by měl být odstraněn z Bayesovské sítě.
- Využití Bayesovské sítě k realizaci testovacího procesu
Algoritmus učení funkcí založený na modelu PAC
Rámec učení
Pravděpodobně přibližně správný (PAC) model použil D. Roth (2002) k řešení problému počítačového vidění vyvinutím teorie distribuce bez učení založené na tomto modelu.[5] Tato teorie se silně spoléhala na vývoj přístupu k efektivnímu učení funkcí. Cílem tohoto algoritmu je naučit se objekt představovaný některými geometrickými prvky v obraze. Vstup je a vektor funkcí a výstup je 1, což znamená úspěšně detekovat objekt nebo 0 jinak. Hlavním bodem tohoto vzdělávacího přístupu je sběr reprezentativních prvků, které mohou reprezentovat objekt pomocí funkce a testování rozpoznáním objektu z obrazu, aby bylo možné najít reprezentaci s vysokou pravděpodobností. Algoritmus učení si klade za cíl předpovědět, zda se koncept naučeného cíle is patří do třídy, kde X je prostor instance sestávající z parametrů a poté otestujte, zda je předpověď správná.
Rámec hodnocení
Po učení funkcí by měly existovat některé vyhodnocovací algoritmy pro vyhodnocení učebních algoritmů. D. Roth použil dva výukové algoritmy:
- 1.Sparse Network of Winnows (SNoW) systém
- SNoW-Train
- Počáteční krok: inicializujte sadu funkcí který souvisí s cílem t pro všechny . T je sada cílů objektů, jejichž prvky jsou na
- Pokud každý cílový objekt v sadě T patří do seznamu aktivních prvků, propojte prvek s cílem a současně nastavte počáteční váhu.
- Vyhodnoťte cíle: porovnejte cíle s , kde je váha v jedné poloze spojující prvky i s cílem t. theta_ {t} je prahová hodnota pro cíl, nikoli t.
- Aktualizujte váhu podle výsledku hodnocení. Existují dva případy: předpokládané pozitivní na negativním příkladu ( a cíle nejsou v seznamu aktivních funkcí) a předpokládané negativní na pozitivním příkladu ( a cíle jsou v seznamu aktivních funkcí).
- Hodnocení SNoW
- Vyhodnoťte každý cíl pomocí stejné funkce jako výše
- Predikce: Rozhodněte se vybrat dominantní aktivní cílový uzel.
Hlavním účelem SVM je najít a nadrovina k oddělení sady vzorků kde je vstupní vektor, který je výběrem funkcí a je štítek . Nadrovina má následující podobu:
je funkce jádra
Oba algoritmy oddělují tréninková data hledáním lineární funkce.
Aplikace
- Učení orientačních bodů pro topologickou navigaci[6]
- Simulace procesu detekce objektu chování lidského vidění[7]
- Učit se vlastní generované akci [8]
- Sledování vozidla[9]
Reference
- ^ M. Mata a J. M. Armingol a A. De La Escalera a M. A. Salichs, "Učení vizuálních orientačních bodů pro navigaci mobilních robotů ", Ve sborníku z 15. světového kongresu Mezinárodní federace automatického řízení, 2002
- ^ Cho, K. a Dunn, S.M "Učení tříd tvarů". Transakce IEEE na analýze vzorů a strojové inteligenci 16,9 (1994), 882-888
- ^ Justus H Piater, „Výuka vizuálních funkcí“ (1. ledna 2001). Elektronické disertační práce pro UMass Amherst. Papír AAI3000331.
- ^ Segen, J., Učení grafových modelů tvaru. Ve sborníku z 5. mezinárodní konference o strojovém učení (Ann Arbor, 12. – 14. Června 1988) J. Larid, ed., Morgan Kaufmann
- ^ D. Roth, M-H. Yang a N. Ahuja. Naučit se rozpoznávat trojrozměrné objekty. Neurální výpočet, 14(5): 1071–1104, 2002.
- ^ M. Mata, J. M. Armingol, Learning Visual Landmarks for Mobile Robot Navigation, Division of Systems Engineering and Automation, Madrid, Španělsko, 2002
- ^ I. A. Rybak, BMV: Behaviorální model vizuálního vnímání a rozpoznávání, Lidské vidění, vizuální zpracování a digitální displej IV
- ^ P. Fitzpatrick, G. Metta, L. Natale, S. Rao a G. Sandini, “Učení o objektech prostřednictvím akce - počáteční kroky k umělému poznání, “V IEEE Int. Conf on Robotics and Automation, 2003, str. 3140–3145.
- ^ J.M. Ferryman, A.D. Worrall a S.J. Maybank. Učení vylepšených 3D modelů pro sledování vozidel. V Proc. Britské konference strojového vidění, 1998