Detekce rohů - Corner detection

Detekce funkcí |
---|
Detekce hrany |
Detekce rohů |
Detekce blobů |
Detekce hřebene |
Hough transformace |
Tenzor struktury |
Detekce afinních invariantních funkcí |
Popis funkce |
Měřítko prostoru |
Detekce rohů je přístup používaný uvnitř počítačové vidění systémy pro extrakci určitých druhů funkce a odvodit obsah obrázku. Detekce rohů se často používá v detekce pohybu, registrace obrázku, sledování videa, obrazová mozaika, panorama šití, 3D rekonstrukce a rozpoznávání objektů. Detekce rohů se překrývá s tématem detekce zájmových bodů.
Formalizace
Roh lze definovat jako průsečík dvou hran. Roh lze také definovat jako bod, pro který existují dva dominantní a různé směry hran v místním sousedství bodu.
Zájmový bod je bod v obraze, který má dobře definovanou polohu a lze jej důkladně detekovat. To znamená, že zájmovým bodem může být roh, ale může to být také například izolovaný bod maximální nebo minimální lokální intenzity, konce čar nebo bod na křivce, kde je lokálně maximální zakřivení.
V praxi většina takzvaných metod detekce rohů detekuje zájmové body obecně a ve skutečnosti se výrazy „roh“ a „zájmový bod“ v literatuře používají víceméně zaměnitelně.[1] V důsledku toho, pokud mají být detekovány pouze rohy, je nutné provést lokální analýzu detekovaných bodů zájmu a určit, které z nich jsou skutečné rohy. Příklady detekce hran, které lze použít při následném zpracování k detekci rohů, jsou Operátor Kirsch a maskovací sada Frei-Chen.[2]
„Roh“, „zájmový bod“ a „rys“ jsou v literatuře zaměnitelně zaměňovány. Konkrétně jich je několik detektory blobů které lze označit jako „operátory zájmových bodů“, ale které se někdy chybně označují jako „detektory rohů“. Navíc existuje představa detekce hřebene zachytit přítomnost podlouhlých předmětů.
Rohové detektory nejsou obvykle příliš robustní a často vyžadují velké propouštění, aby se zabránilo efektu jednotlivých chyb v dominování úlohy rozpoznávání.
Jedním z určujících kvality detektoru rohů je jeho schopnost detekovat stejný roh v několika podobných obrazech za podmínek odlišného osvětlení, translace, rotace a dalších transformací.
Používá se jednoduchý přístup k detekci rohů na obrázcích korelace, ale toto je výpočetně velmi nákladné a neoptimální. Často používaný alternativní přístup je založen na metodě navržené Harrisem a Stephensem (níže), což je zase zdokonalení metody od Moravce.
Algoritmus detekce rohu Moravec
Toto je jeden z prvních algoritmů detekce rohů a definuje a roh být bodem s nízkou podobností sebe sama.[3] Algoritmus testuje každý pixel v obraze, aby zjistil, zda je přítomen roh, a to tak, že vezme v úvahu, jak podobný je patch vycentrovaný na pixelu blízkým, do značné míry překrývajícím se patche. Podobnost se měří pomocí součtu čtvercových rozdílů (SSD) mezi odpovídajícími pixely dvou oprav. Nižší číslo znamená větší podobnost.
Pokud je pixel v oblasti jednotné intenzity, budou blízké opravy vypadat podobně. Pokud je pixel na hraně, pak blízké záplaty ve směru kolmém na hranu budou vypadat úplně jinak, ale blízké záplaty ve směru rovnoběžném s hranou způsobí jen malou změnu. Pokud je pixel na prvku se změnami ve všech směrech, pak žádná z blízkých oprav nebude vypadat podobně.
Síla rohu je definována jako nejmenší SSD mezi patchem a jeho sousedy (horizontální, vertikální a na dvou úhlopříčkách). Důvodem je, že pokud je toto číslo vysoké, pak je variace podél všech směn buď stejná, nebo větší než ona, takže zachycení, že všechny blízké opravy vypadají jinak.
Pokud je číslo síly rohu vypočítáno pro všechna umístění, znamená to, že je lokálně maximální pro jedno umístění, znamená, že je v něm přítomna zájmová vlastnost.
Jak zdůraznil Moravec, jedním z hlavních problémů tohoto operátora je, že tomu tak není izotropní: Pokud je k dispozici hrana, která není ve směru sousedů (horizontální, vertikální nebo diagonální), bude nejmenší SSD velký a hrana bude nesprávně zvolena jako bod zájmu.[4]
Harris & Stephens / Shi – Tomasi algoritmy detekce rohů
Vidět Harrisův rohový detektor.
Harris a Stephens[5] vylepšil Moravecův rohový detektor tím, že místo použití posunutých záplat zvážil rozdíl skóre v rohu s ohledem na směr přímo. (Toto rohové skóre se často označuje jako autokorelace, protože tento výraz se používá v článku, ve kterém je tento detektor popsán. Matematika v článku však jasně naznačuje, že se používá součet čtvercových rozdílů.)
Bez ztráty obecnosti budeme předpokládat, že se použije 2-dimenzionální obraz ve stupních šedi. Nechť je tento obrázek dán . Zvažte převzetí obrazové záplaty přes oblast a posunutí o . Vážený součet čtvercových rozdílů (SSD) mezi těmito dvěma opravami, označené , darováno:
lze aproximovat pomocí a Taylor expanze. Nechat a být částečný deriváty z , takový, že
Tím se vytvoří aproximace
které lze zapsat v matici:
kde A je strukturní tenzor,
Slovy najdeme kovariance částečné derivace intenzity obrazu s respektem k a sekery.
Úhlové závorky označují průměrování (tj. Součet za ). označuje typ okna, které se posouvá přes obrázek. Pokud Boxový filtr je použita odpověď bude anizotropní, ale pokud a Gaussian se použije, pak bude odpověď izotropní.
Roh (nebo obecně zajímavý bod) se vyznačuje velkou variací ve všech směrech vektoru . Analýzou vlastních čísel , tuto charakteristiku lze vyjádřit následujícím způsobem: by měl mít dvě „velká“ vlastní čísla pro bod zájmu. Na základě velikostí vlastních čísel lze na základě tohoto argumentu učinit následující závěry:
- Li a pak tento pixel nemá žádné zajímavé vlastnosti.
- Li a má nějakou velkou kladnou hodnotu, pak je nalezena hrana.
- Li a mají velké kladné hodnoty, pak je nalezen roh.
Harris a Stephens poznamenávají, že přesný výpočet vlastních čísel je výpočetně nákladný, protože vyžaduje výpočet odmocnina a místo toho navrhnout následující funkci , kde je nastavitelný parametr citlivosti:
Proto algoritmus[6] nemusí skutečně vypočítat rozklad vlastních čísel matice a místo toho stačí vyhodnotit určující a stopa z najít rohy, nebo spíše zajímavé body obecně.
Shi-Tomasi[7] rohový detektor přímo počítá protože za určitých předpokladů jsou rohy pro sledování stabilnější. Všimněte si, že tato metoda se také někdy označuje jako rohový detektor Kanade – Tomasi.
Hodnota musí být stanoveno empiricky a v literatuře byly hodnoty v rozsahu 0,04–0,15 uváděny jako proveditelné.
Lze se vyhnout nastavení parametru pomocí Noble's[8] rohové opatření což činí harmonický průměr vlastních čísel:
být malou pozitivní konstantou.
Li lze interpretovat jako přesná matice pro rohovou pozici, kovarianční matice pro rohovou pozici je , tj.
Součet vlastních čísel , které lze v takovém případě vykládat jako a generalizovaná odchylka (nebo „celková nejistota“) polohy rohu, souvisí s Nobleovou mírou rohu následující rovnicí:
Förstnerův detektor rohů

V některých případech si můžete přát vypočítat polohu rohu s přesností subpixelů. K dosažení přibližného řešení je Förstner[9] Algoritmus řeší bod nejblíže ke všem tečným čarám rohu v daném okně a je řešením s nejméně čtverci. Algoritmus se spoléhá na skutečnost, že pro ideální roh se tečné čáry protínají v jednom bodě.
Rovnice tečny na pixel darováno:
kde je vektor přechodu obrázku na .
Bod nejblíže ke všem tečným čarám v okně je:
Vzdálenost od k dotyčnicím je vážena velikostí přechodu, což dává větší důležitost tečnám procházejícím pixely se silnými přechody.
Řešení pro :
jsou definovány jako:
Minimalizace této rovnice může být provedena diferenciací s ohledem na a nastavení rovné 0:
Všimněte si, že je strukturní tenzor. Aby rovnice měla řešení, musí být invertibilní, z čehož vyplývá, že musí být celé pořadí (pořadí 2). Tedy řešení
existuje pouze tam, kde v okně existuje skutečný roh .
Metodika provádění automatický výběr stupnice pro tuto metodu lokalizace rohu představil Lindeberg[10][11] minimalizací normalizovaného zbytku
přes váhy. Metoda tak má schopnost automaticky přizpůsobit úrovně měřítka pro výpočet gradientů obrazu podle úrovně šumu v obrazových datech výběrem hrubších úrovní měřítka pro hlučná obrazová data a jemnějších úrovní měřítka pro téměř ideální rohové struktury.
Poznámky:
- lze zobrazit jako reziduum ve výpočtu nejmenších čtverců: pokud , pak nedošlo k žádné chybě.
- tento algoritmus lze upravit tak, aby spočítal středy kruhových prvků změnou tečných čar na normální.
Víceúrovňový operátor Harris
Výpočet druhé momentové matice (někdy také označované jako strukturní tenzor ) v operátoru Harris vyžaduje výpočet obrazové deriváty v doméně obrazu, stejně jako součet nelineárních kombinací těchto derivátů přes místní sousedství. Protože výpočet derivací obvykle zahrnuje fázi vyhlazení rozsahu-prostoru, vyžaduje provozní definice Harrisova operátoru dva parametry měřítka: (i) a místní měřítko pro vyhlazení před výpočtem obrazové deriváty a (ii) an stupnice integrace pro akumulaci nelineárních operací s derivovanými operátory do integrovaného deskriptoru obrazu.
S označující původní intenzitu obrazu, let označit měřítko prostorové reprezentace z získané konvolucí s Gaussovým jádrem
s parametrem místního měřítka :
a nechte a označit částečné deriváty Dále zavést funkci Gaussova okna s parametrem stupnice integrace . Poté multi-scale sekundární matice [12][13][14] lze definovat jako
Poté můžeme vypočítat vlastní hodnoty podobným způsobem jako vlastní čísla a definovat víceúrovňová Harrisova rohová míra tak jako
- .
Pokud jde o výběr parametru místního měřítka a parametr měřítka integrace , tyto parametry měřítka jsou obvykle spojeny s parametrem měřítka relativní integrace takhle , kde se obvykle volí v intervalu .[12][13] Můžeme tedy vypočítat víceúrovňovou Harrisovu míru v jakémkoli měřítku in scale-space to obtain a multi-scale corner detector, which responds to corner structures of varying sizes in the image domain.
V praxi je tento víceúrovňový detektor rohů často doplněn a krok výběru měřítka, kde je stupnice normalizovaný laplaciánský operátor[11][12]
se počítá v každém měřítku v měřítkovém prostoru a rohové body přizpůsobené měřítku s automatickým výběrem měřítka („Harris-Laplaceův operátor“) se počítají z bodů, které jsou současně:[15]
- prostorová maxima víceúrovňové rohové míry
- lokální maxima nebo minima na stupnicích stupnice normalizovaného laplaciánského operátora[11] :
Přístup křivkou úrovně křivky
Dřívější přístup k detekci rohů je detekovat body, kde zakřivení úrovňových křivek a velikosti gradientu jsou zároveň vysoký.[16][17] Diferenciální způsob detekce takových bodů spočívá ve výpočtu zakřivení křivky úrovně se změněnou stupnicí (součin zakřivení křivky úrovně a velikosti gradientu zvýšeného na sílu tří)
a detekovat pozitivní maxima a negativní minima této diferenciální exprese v určitém měřítku v měřítko prostorové reprezentace původního obrázku.[10][11] Hlavním problémem při výpočtu entity zakřivení křivky úrovně se změněnou stupnicí v jediném měřítku však je, že může být citlivá na hluk a na volbu úrovně měřítka. Lepší metodou je výpočet - normalizované zakřivení křivky úrovně se změněnou stupnicí
s a zjistit podepsané extrémy v měřítku a prostoru tohoto výrazu, to jsou body a měřítka, která jsou kladnými maximy a zápornými minimy s ohledem na prostor i měřítko
v kombinaci s doplňkovým krokem lokalizace ke zvládnutí nárůstu chyby lokalizace u hrubších měřítek.[10][11][12] Tímto způsobem budou větší hodnoty měřítka spojeny se zaoblenými rohy velkého prostorového rozsahu, zatímco menší hodnoty měřítka budou spojeny s ostrými rohy s malým prostorovým rozsahem. Tento přístup je prvním rohovým detektorem s automatickým výběrem měřítka (před výše uvedeným „operátorem Harris-Laplaceovým“) a byl použit ke sledování rohů při velkém rozsahu změn v doméně obrazu[18] a pro přizpůsobení odezev rohů hranám pro výpočet vlastností strukturálního obrazu pro geon - rozpoznávání objektů na základě.[19]
Laplacian z Gaussian, rozdíly Gaussians a determinant hesenských úrokových bodů v měřítku a prostoru
LoG[11][12][15] je zkratka pro Laplacian z Gaussian, Pes[20] je zkratka pro rozdíl Gaussianů (DoG je přibližná hodnota LoG) a DoH je zkratka pro zkratku determinant pytloviny.[11] Všechny tyto úrokově invariantní zájmové body jsou extrahovány detekcí extrémů škálovaného prostoru měřítkových normalizovaných diferenciálních výrazů, tj. Bodů v měřítkovém prostoru, kde odpovídající škálované normalizované diferenciální výrazy předpokládají lokální extrémy s ohledem na prostor i měřítko[11]
kde označuje příslušnou stupnici normalizovanou diferenciální entitu (definovanou níže).
Tyto detektory jsou podrobněji popsány v detekce blob. Škálově normalizovaný laplacián gaussovských a rozdílových gaussovských znaků (Lindeberg 1994, 1998; Lowe 2004)[11][12][20]
nemusí nutně vytvářet vysoce selektivní funkce, protože tito operátoři mohou také vést k reakcím blízko okrajů. Chcete-li zlepšit schopnost detekce rohů u rozdílů Gaussianova detektoru, použijte detektor vlastností použitý v PROSÍT[20] systém proto používá další fázi následného zpracování, kde vlastní čísla z Hesián obrazu v detekční stupnici jsou zkoumány podobným způsobem jako v Harrisově operátoru. Pokud je poměr vlastních čísel příliš vysoký, pak je místní obraz považován za příliš podobný okraji, takže je funkce odmítnuta. Lze také definovat Lindebergův Laplacianův Gaussův detektor vlastností, který zahrnuje doplňkové prahové hodnoty na komplementárním diferenciálním invariantu k potlačení odpovědí blízko okrajů.[21]
Škálově normalizovaný determinant hesenského operátora (Lindeberg 1994, 1998)[11][12]
je na druhé straně vysoce selektivní pro dobře lokalizované obrazové funkce a reaguje pouze v případě, že existují výrazné variace úrovně šedé ve dvou směrech obrazu[11][14] a je v tomto a dalších ohledech detektorem zajímavějších bodů než Laplacian z Gaussian. Hessianův determinant je afinní kovariantní diferenciální výraz a má lepší vlastnosti výběru měřítka při afinních transformacích obrazu než laplaciánský operátor (Lindeberg 2013, 2015).[21][22] Experimentálně z toho vyplývá, že determinant hesenských zájmových bodů má lepší vlastnosti opakovatelnosti při lokální deformaci obrazu než laplaciánské zájmové body, což vede k lepšímu výkonu shody na základě obrazu, pokud jde o vyšší skóre účinnosti a nižší skóre s 1 přesností.[21]
Vlastnosti výběru měřítka, afinní transformační vlastnosti a experimentální vlastnosti těchto a dalších detektorů zájmových bodů v měřítku a prostoru jsou podrobně analyzovány v (Lindeberg 2013, 2015).[21][22]
Scale-space interest points based on the Lindeberg Hessian feature measures measures
Inspirováno strukturně podobnými vlastnostmi hesenské matice funkce a matice druhého momentu (tenzor struktury) , jak může např. se projeví podobnými transformačními vlastnostmi při deformacích afinního obrazu[13][21]
- ,
- ,
Lindeberg (2013, 2015)[21][22] navrhl definovat čtyři míry síly rysů z hesenské matice souvisejícími způsoby, protože operátoři Harris a Shi-and-Tomasi jsou definováni z tenzoru struktury (matice druhého momentu). Konkrétně definoval následující nepodepsaná a podepsaná měření síly hesenu :
- nepodepsaný hesenský znak míry síly I: