Harris detektor afinní oblasti - Harris affine region detector - Wikipedia

V polích počítačové vidění a analýza obrazu, Harris detektor afinní oblasti patří do kategorie detekce funkcí. Detekce funkcí je krok předzpracování několika algoritmů, které se spoléhají na identifikaci charakteristických bodů nebo úrokové body takže můžete vytvářet korespondence mezi obrázky, rozpoznávat textury, kategorizovat objekty nebo vytvářet panoramata.

Přehled

Harrisův afinitní detektor dokáže identifikovat podobné oblasti mezi obrazy, které spolu souvisejí afinní transformace a mají různé osvětlení. Tyto afinně invariantní detektory by měly být schopné identifikovat podobné oblasti na obrázcích pořízených z různých hledisek, které souvisejí s jednoduchou geometrickou transformací: změna měřítka, rotace a smyku. Tyto zjištěné oblasti byly nazývány oběma neměnný a kovariantní. Na jedné straně jsou detekovány regiony neměnný transformace obrazu, ale regionů kovariantně změnit s transformací obrazu.[1] Nezabývejte se příliš těmito dvěma konvencemi pojmenování; důležité je pochopit, že díky designu těchto zajímavých bodů budou kompatibilní s obrázky pořízenými z několika hledisek. Mezi další detektory, které jsou afinně invariantní, patří Hessenský detektor afinní oblasti, Maximálně stabilní extremální oblasti, Detektor kadence Kadir – Brady, okrajové regiony (EBR) a regiony založené na intenzitě extrémů (IBR).

Mikolajczyk a Schmid (2002) poprvé popsali Harrisův afinitní detektor tak, jak je dnes používán Detektor afinních neměnných úrokových bodů.[2] Dřívější práce v tomto směru zahrnují použití afinní tvarová adaptace Lindeberg a Garding pro výpočet afinních invariantních deskriptorů obrazu a tímto způsobem snižování vlivu perspektivních deformací obrazu,[3] použití afinních přizpůsobených funkčních bodů pro širokou základní liniovou shodu Baumberga[4] a první použití bodových neměnných rysových bodů od Lindeberga;[5][6][7] pro přehled teoretických poznatků. Harrisův afinitní detektor spoléhá na kombinaci rohových bodů detekovaných skrz Harrisova detekce rohů, víceúrovňová analýza Prostor v Gaussově měřítku a afinní normalizace pomocí iterace afinní tvarová adaptace algoritmus. Rekurzivní a iterativní algoritmus sleduje iterativní přístup k detekci těchto oblastí:

  1. Identifikujte počáteční body regionu pomocí invariantního měřítka Harris-Laplaceův detektor.
  2. Pro každý počáteční bod normalizujte oblast tak, aby byla afinní invariantní pomocí afinní tvarová adaptace.
  3. Iterativní odhad afinní oblasti: výběr správné integrační škály, diferenciační škály a prostorové lokalizace zájmových bodů.
  4. Aktualizujte afinní oblast pomocí těchto měřítek a prostorových lokalizací.
  5. Krok 3 opakujte, pokud není splněno kritérium zastavení.

Popis algoritmu

Harris – Laplaceův detektor (počáteční body regionu)

Harrisův afinitní detektor spoléhá do značné míry jak na Harrisovo opatření, tak na Gaussiana měřítko prostorové reprezentace. Následuje tedy krátká zkouška obou. Podrobnější derivace viz detekce rohů a Prostor v Gaussově měřítku nebo související dokumenty.[6][8]

Harris rohové opatření

Algoritmus Harrisova detektoru rohů se opírá o ústřední princip: v rohu se intenzita obrazu bude do značné míry měnit v několika směrech. To lze alternativně formulovat zkoumáním změn intenzity v důsledku posunů v místním okně. Kolem rohového bodu se intenzita obrazu velmi změní, když se okno posune v libovolném směru. V návaznosti na tuto intuici a chytrým rozkladem používá Harrisův detektor matice druhého momentu jako základ jeho rohových rozhodnutí. (Vidět detekce rohů pro úplnější odvození). Matice , byla také nazývána autokorelační matice a má hodnoty úzce související s deriváty intenzity obrazu.

kde a jsou příslušné deriváty (intenzity pixelů) v a směr v bodě (,); a jsou poziční parametry funkce vážení w. Off-diagonální položky jsou produktem a , zatímco diagonální položky jsou čtverce příslušných deriváty. Funkce vážení může být uniformní, ale je typičtěji izotropní, kruhový Gaussian,

který působí na průměr v místní oblasti a váží tyto hodnoty blízko středu ještě více.

Jak se ukázalo, toto matice popisuje tvar autokorelační míry jako důsledek posunů v umístění okna. Pokud tedy necháme a být vlastní čísla z , pak tyto hodnoty poskytnou kvantitativní popis toho, jak se mění autokorelační opatření v prostoru: jeho hlavní zakřivení. Jak zdůrazňují Harris a Stephens (1988), matice se středem v rohových bodech bude mít dvě velká pozitivní vlastní čísla.[8] Spíše než extrahování těchto vlastních čísel pomocí metod, jako je rozklad singulární hodnoty, se používá Harrisova míra založená na stopě a determinantu:

kde je konstanta. Rohové body mají velká kladná vlastní čísla a měly by tedy velkou Harrisovu míru. Rohové body jsou tedy identifikovány jako lokální maxima Harrisovy míry, která jsou nad stanovenou prahovou hodnotou.

kde jsou množinou všech rohových bodů, je Harrisovo měřítko vypočítané na , je sada 8 sousedů se středem na a je zadaná prahová hodnota.

8bodové okolí

Gaussův prostor

Gaussian měřítko prostorové reprezentace obrazu je sada obrazů, které jsou výsledkem konvoluce gaussovského jádra různých velikostí s původním obrazem. Obecně lze vyjádření formulovat jako:

kde je izotropní, kruhové Gaussovo jádro, jak je definováno výše. Konvoluce s Gaussovým jádrem vyhladí obraz pomocí okna o velikosti jádra. Větší měřítko, , odpovídá hladšímu výslednému obrazu. Mikolajczyk a Schmid (2001) poukazují na to, že derivace a další měření musí být normalizovány napříč měřítky.[9] Derivát řádu , , musí být normalizována faktorem následujícím způsobem:

Tyto deriváty nebo jakékoli libovolné měřítko lze přizpůsobit a měřítko prostorové reprezentace výpočtem tohoto opatření rekurzivně pomocí množiny měřítek, kde měřítko je . Vidět měřítko prostoru pro úplnější popis.

Kombinace Harrisova detektoru v Gaussově měřítku

The Harris-Laplace detektor kombinuje tradiční 2D Harrisův rohový detektor s myšlenkou Gaussiana měřítko prostorové reprezentace za účelem vytvoření detektoru neměnného rozsahu. Harrisovy rohové body jsou dobrým výchozím bodem, protože se ukázalo, že kromě identifikace zajímavých bodů obrazu mají i dobrou rotační a osvětlovací invariance.[10] Body však nejsou neměnné invariantní, a proto musí být matice druhého momentu upravena tak, aby odrážela vlastnost neměnného rozsahu. Označme, jako matice sekundárního momentu přizpůsobená měřítku použitá v detektoru Harris-Laplace.

[11]

kde je Gaussovo jádro rozsahu a . Podobně jako v Gaussově měřítku, je Gaussův vyhlazený obraz. The operátor označuje konvoluci. a jsou deriváty v příslušném směru aplikované na vyhlazený obraz a vypočítané pomocí Gaussova jádra s měřítkem . Pokud jde o náš gaussovský rámec prostorového měřítka, Parametr určuje aktuální měřítko, ve kterém jsou detekovány Harrisovy rohové body.

V návaznosti na tuto škálově přizpůsobenou matici sekundárních momentů, Harris-Laplace Detektor je dvojí proces: použití Harrisova rohového detektoru ve více měřítcích a automatická volba charakteristická stupnice.

Víceúrovňové Harrisovy rohové body

Algoritmus prohledává pevný počet předdefinovaných stupnic. Tato sada stupnic je definována jako:

Mikolajczyk a Schmid (2004) používají . Pro každou integrační stupnici , vybraný z této sady, je zvolena příslušná diferenciační škála jako konstantní faktor integrační škály: . Použili Mikolajczyk a Schmid (2004) .[11] Pomocí těchto měřítek jsou úrokové body detekovány pomocí Harrisova opatření na matice. The kukuřice jako typické Harrisovo opatření je definováno jako:

Stejně jako tradiční Harrisův detektor jsou rohové body lokálními maximy (v sousedství 8 bodů) kukuřice které jsou nad stanovenou prahovou hodnotou.

Identifikace charakteristické stupnice

Iterativní algoritmus založený na Lindebergovi (1998) prostorově lokalizuje rohové body a vybírá charakteristická stupnice.[6] Iterativní vyhledávání má tři klíčové kroky, které se provádějí pro každý bod které byly původně zjištěny v měřítku víceúrovňovým Harrisovým detektorem ( označuje opakování):

  • Vyberte měřítko který maximalizuje Laplacian-of-Gaussians (LoG) v předdefinovaném rozsahu sousedních měřítek. Sousední váhy jsou typicky vybrány z rozsahu, který je v a dva měřítko-prostor sousedství. To znamená, že pokud byly původní body detekovány pomocí měřítka mezi po sobě jdoucími váhami, a dva měřítko-prostor sousedství je rozsah . Zkoumané gaussovské stupnice jsou tedy: . Měření LoG je definováno jako:
kde a jsou druhými deriváty v příslušných směrech.[12] The faktor (jak je popsáno výše v Gaussově měřítku-prostoru) se používá k normalizaci LoG napříč škálami a k ​​tomu, aby byla tato měřítka srovnatelná, což činí maximum relevantní. Mikolajczyk a Schmid (2001) prokazují, že míra LoG dosahuje nejvyššího procenta správně detekovaných rohových bodů ve srovnání s jinými opatřeními pro výběr měřítka.[9] Stupnice, která maximalizuje toto opatření LoG v dva měřítko-prostor sousedství je považováno za charakteristická stupnice, , a použit v následných iteracích. Pokud nejsou nalezeny žádné extrémy nebo maxima LoG, je tento bod z budoucích vyhledávání zahozen.
  • Pomocí charakteristické stupnice jsou body prostorově lokalizovány. To znamená, že jde o to je vybrán tak, aby maximalizoval Harrisovu míru rohu (kukuřice jak je definováno výše) v místním sousedství 8 × 8.
  • Kritérium zastavení: a .

Pokud není splněno kritérium zastavení, algoritmus se opakuje od kroku 1 s použitím nového body a měřítko. Když je splněno kritérium zastavení, nalezené body představují ty, které maximalizují LoG napříč měřítky (výběr měřítka) a maximalizují Harrisovo měřítko rohu v místním sousedství (prostorový výběr).

Afinně invariantní body

Matematická teorie

Detekované body Harris-Laplaceovy jsou neměnné a jsou vhodné pro izotropní oblasti, které jsou viděny ze stejného úhlu pohledu. Aby byla invariantní vůči libovolným afinním transformacím (a hlediskům), musí být matematický rámec znovu navštíven. Matice druhého okamžiku je definován obecněji pro anizotropní oblasti:

kde a jsou kovarianční matice definující stupnice diferenciace a integrace gaussovských jader. I když to může vypadat výrazně odlišně od matice druhého momentu v Harris-Laplaceově detektoru; je ve skutečnosti identický. Čím dříve matice byla 2D-izotropní verze, ve které byly kovarianční matice a byly matice identity 2x2 vynásobené faktory a , resp. V nové formulaci lze uvažovat o gaussovských jádrech jako o vícerozměrné Gaussovy distribuce na rozdíl od jednotného gaussovského jádra. Jednotné gaussovské jádro lze považovat za izotropní kruhovou oblast. Podobně obecnější gaussovské jádro definuje elipsoid. Ve skutečnosti vlastní vektory a vlastní hodnoty kovarianční matice definují rotaci a velikost elipsoidu. Můžeme tedy snadno vidět, že tato reprezentace nám umožňuje zcela definovat libovolnou eliptickou afinní oblast, do které se chceme integrovat nebo odlišit.

Cílem afinního invariantního detektoru je identifikovat oblasti v obrazech, které souvisejí prostřednictvím afinních transformací. Považujeme tedy bod a transformovaný bod , kde A je afinní transformace. V případě obrázků obojí a žít v prostor. Matice sekundárních momentů jsou spojeny následujícím způsobem:[3]

kde a jsou kovarianční matice pro referenční rámec. Pokud budeme pokračovat v této formulaci a budeme ji prosazovat

kde a jsou skalární faktory, lze ukázat, že kovarianční matice pro související bod jsou podobně příbuzné:

Vyžadováním kovariančních matic pro splnění těchto podmínek vzniká několik pěkných vlastností. Jednou z těchto vlastností je, že druhá odmocnina matice druhého okamžiku, transformuje původní anizotropní oblast na izotropní oblasti, které souvisejí jednoduše prostřednictvím čisté rotační matice . Tyto nové izotropní oblasti lze považovat za normalizovaný referenční rámec. Následující rovnice formulují vztah mezi normalizovanými body a :

Rotační matici lze obnovit pomocí gradientních metod, jako jsou ty v PROSÍT deskriptor. Jak bylo diskutováno s Harrisovým detektorem, vlastní hodnoty a vlastní vektory matice druhého okamžiku, charakterizovat zakřivení a tvar intenzity pixelů. To znamená, že vlastní vektor spojený s největším vlastním číslem označuje směr největší změny a vlastní vektor spojený s nejmenším vlastním číslem definuje směr nejmenší změny. V 2D případě vlastní vektory a vlastní hodnoty definují elipsu. U izotropní oblasti by oblast měla mít kruhový tvar a ne eliptický. To je případ, kdy vlastní čísla mají stejnou velikost. Míra izotropie kolem místní oblasti je tedy definována takto:

kde označit vlastní čísla. Toto opatření má rozsah . Hodnota odpovídá dokonalé izotropii.

Iterativní algoritmus

Použitím tohoto matematického rámce algoritmus Harrisova afinního detektoru iterativně objevuje matici druhého okamžiku, která transformuje anizotropní oblast na normalizovanou oblast, ve které je izotropní míra dostatečně blízká jedné. Algoritmus to používá matice pro přizpůsobení tvaru, , k transformaci obrazu na normalizovaný referenční snímek. V tomto normalizovaném prostoru jsou parametry zájmových bodů (prostorové umístění, integrační měřítko a diferenciační měřítko) upřesněny pomocí metod podobných detektoru Harris-Laplace. Matice druhého momentu se počítá v tomto normalizovaném referenčním rámci a měla by mít izotropní míru blízkou jedné při konečné iteraci. V každém V této iteraci je každá oblast zájmu definována několika parametry, které musí algoritmus objevit: matice, poloha , stupnice integrace a diferenciační stupnice . Protože detektor počítá matici druhého okamžiku v transformované doméně, je vhodné označit tuto transformovanou pozici jako kde .

  1. Detektor inicializuje vyhledávací prostor body detekovanými detektorem Harris-Laplace.
    a , , a jsou ty z detektoru Harris-Laplace.
  2. Použijte předchozí iteraci matice pro přizpůsobení tvaru, generovat normalizovaný referenční rámec, . Pro první iteraci použijete .
  3. Vyberte stupnici integrace, pomocí metody podobné detektoru Harris-Laplace. Měřítko je vybráno jako měřítko, které maximalizuje Laplacian Gaussian (LoG). Vyhledávací prostor vah je ve dvou škálovacích prostorech předchozí iterační stupnice.
    Je důležité si uvědomit, že stupnice integrace v prostor se výrazně liší od nenormalizovaného prostoru. Proto je nutné hledat integrační měřítko na rozdíl od používání měřítka v nenormalizovaném prostoru.
  4. Vyberte stupnici diferenciace, . Aby se zmenšil prostor pro vyhledávání a stupně volnosti, je stupnice diferenciace považována za spojenou s stupnicí integrace prostřednictvím konstantního faktoru: . Ze zřejmých důvodů je konstantní faktor menší než jedna. Mikolajczyk a Schmid (2001) poznamenávají, že díky příliš malému faktoru bude vyhlazení (integrace) příliš významné ve srovnání s diferenciací a příliš velký faktor neumožní integraci průměrovat kovarianční matici.[9] Je běžné si vybrat . Z této sady zvolená stupnice maximalizuje izotropní míru .
    kde je matice druhého okamžiku vyhodnocená v normalizovaném referenčním rámci. Tato maximalizační procesy způsobí, že se vlastní čísla sbíhají na stejnou hodnotu.
  5. Prostorová lokalizace: Vyberte bod který maximalizuje Harrisovu míru rohu () v okolí 8 bodů kolem předchozího směřovat.
    kde je matice druhého momentu, jak je definováno výše. Okno je sada 8 nejbližších sousedů bodu předchozí iterace v normalizovaném referenčním rámci. Protože naše prostorová lokalizace byla provedena v -normalizovaný referenční snímek, nově zvolený bod musí být transformován zpět na původní referenční snímek. Toho je dosaženo transformací vektoru posunutí a jeho přidáním k předchozímu bodu:
  6. Jak bylo uvedeno výše, druhá odmocnina matice druhého momentu definuje transformační matici, která generuje normalizovaný referenční rámec. Tuto matici tedy musíme uložit: . Transformační matice je aktualizováno: . Abychom zajistili správné vzorkování obrazu a rozšiřovali jsme obraz ve směru nejmenší změny (nejmenší vlastní hodnota), opravíme maximální vlastní hodnotu: . Pomocí této metody aktualizace lze snadno vidět, že finále matice má následující podobu:
  7. Pokud kritérium zastavení není splněn, pokračujte další iterací v kroku 2. Protože algoritmus iterativně řeší pro matice, která transformuje anizotropní oblast na izotropní oblast, má smysl zastavit, když je izotropní míra, , je dostatečně blízko své maximální hodnotě 1. Dostatečně blízko z toho vyplývá následující stav zastavení:
    Mikolajczyk a Schmid (2004) měli dobrý úspěch .

Výpočet a implementace

Výpočtová složitost Harris-Affinova detektoru je rozdělena do dvou částí: detekce počátečního bodu a normalizace afinní oblasti. Algoritmus pro detekci počátečních bodů, Harris-Laplace, má složitost kde je počet pixelů v obrázku. Algoritmus normalizace afinní oblasti automaticky detekuje měřítko a odhaduje matice pro přizpůsobení tvaru, . Tento proces má složitost , kde je počet počátečních bodů, je velikost vyhledávacího prostoru pro automatický výběr měřítka a je počet iterací potřebných k výpočtu matice.[11]

Existují některé metody, které snižují složitost algoritmu na úkor přesnosti. Jednou z metod je eliminovat vyhledávání v kroku stupnice diferenciace. Spíše než zvolit faktor ze sady faktorů si zrychlený algoritmus vybere konstantní měřítko napříč iteracemi a body: . Ačkoli toto zmenšení prostoru pro vyhledávání může snížit složitost, tato změna může vážně ovlivnit konvergenci matice.

Analýza

Konvergence

Lze si představit, že tento algoritmus může identifikovat duplicitní zájmové body ve více měřítcích. Protože Harrisův afinitní algoritmus se dívá na každý počáteční bod daný Harris-Laplaceovým detektorem nezávisle, nedochází k diskriminaci mezi stejnými body. V praxi se ukázalo, že tyto body budou nakonec všechny konvergovat ke stejnému zájmovému bodu. Po dokončení identifikace všech bodů zájmu algoritmus zohlední duplikáty porovnáním prostorových souřadnic (), stupnice integrace , izotropní opatření a zkosit.[11] Pokud jsou tyto parametry zajímavých bodů podobné v rámci zadané prahové hodnoty, jsou označeny jako duplikáty. Algoritmus zahodí všechny tyto duplicitní body s výjimkou bodu zájmu, který je nejblíže průměru duplikátů. Typicky 30% Harrisových afinních bodů je dostatečně odlišných a odlišných, aby nebylo možné je zahodit.[11]

Mikolajczyk a Schmid (2004) ukázali, že počáteční body (40%) se často neshodují. Algoritmus detekuje tuto divergenci zastavením iteračního algoritmu, pokud je inverzní hodnota izotropní míry větší než zadaná prahová hodnota: . Mikolajczyk a Schmid (2004) používají . Z těch, které se sbíhaly, byl typický počet požadovaných iterací 10.[2]

Kvantitativní měřítko

Kvantitativní analýza detektorů afinních oblastí bere v úvahu jak přesnost umístění bodů, tak překrytí oblastí mezi dvěma obrazy. Mioklajcyzk a Schmid (2004) rozšiřují míra opakovatelnosti Schmid et al. (1998) jako poměr bodových korespondencí k minimálním detekovaným bodům dvou obrazů.[11][13]

kde jsou počet odpovídajících bodů na obrázcích a . a jsou počet detekovaných bodů na příslušných obrázcích. Protože každý obrázek představuje 3D prostor, může se stát, že jeden obrázek obsahuje objekty, které nejsou ve druhém obrázku, a jejichž zájmové body tedy nemají šanci na odpovídající. Aby byla míra opakovatelnosti platná, odstraňte tyto body a musíte brát v úvahu pouze body, které leží na obou obrázcích; a započítávejte pouze takové body . Pro dvojici dvou obrázků souvisejících prostřednictvím a homografie matice , dva body, a odpovídají, pokud:

Oblast překrytí dvou eliptických oblastí.
  1. Chyba v umístění pixelu je menší než 1,5 pixelu:
  2. The chyba překrytí ze dvou afinních bodů () musí být menší než zadaná prahová hodnota (obvykle 40%).[1] U afinních oblastí je tato chyba překrytí následující:

    kde a jsou obnovené eliptické oblasti, jejichž body splňují: . V zásadě toto opatření bere poměr oblastí: oblast překrytí (průsečík) a celková plocha (unie). Dokonalé překrytí by mělo poměr jedna a mělo by . Různá měřítka ovlivňují oblast překrytí, a proto je třeba je zohlednit normalizací oblasti každé oblasti zájmu. Regiony s chybou překrytí až 50% jsou životaschopné detektory, které mají být porovnány s dobrým deskriptorem.[1]

    Druhé opatření, a odpovídající skóre, více prakticky hodnotí schopnost detektoru identifikovat shodné body mezi obrázky. Mikolajczyk a Schmid (2005) používají a PROSÍT deskriptor k identifikaci shodných bodů. Kromě toho, že jsou dva nejbližší body v prostoru SIFT, musí mít také dostatečně malou chybu překrytí (jak je definováno v míře opakovatelnosti). The odpovídající skóre je poměr počtu shodných bodů a minima z celkového počtu detekovaných bodů v každém obrázku:

    ,[1]
    kde jsou počet shodných bodů a a jsou počet detekovaných oblastí v příslušných obrázcích.

Robustnost vůči afinním a dalším transformacím

Mikolajczyk a kol. (2005) provedli důkladnou analýzu několika nejmodernějších detektorů afinní oblasti: Harris affine, Hessian affine, MSER,[14] IBR a EBR[15] a výběžek[16] detektory.[1] Mikolajczyk a kol. analyzovali při hodnocení jak strukturované obrázky, tak i texturované obrázky. Linuxové binární soubory detektorů a jejich testovací obrázky jsou volně dostupné na jejich webová stránka. Stručné shrnutí výsledků Mikolajczyka a kol. (2005); vidět Srovnání detektorů afinních oblastí pro kvantitativnější analýzu.

  • Změna úhlu pohledu: Harrisův afinitní detektor má přiměřenou (průměrnou) robustnost vůči těmto typům změn. Detektor udržuje skóre opakovatelnosti nad 50% až do úhlu pohledu nad 40 stupňů. Detektor má tendenci detekovat vysoký počet opakovatelných a shodných oblastí i při velké změně pohledu.
  • Změna měřítka: Harrisův afinitní detektor zůstává při změnách měřítka velmi konzistentní. Ačkoli počet bodů při velkých změnách (nad 2,8) značně klesá, opakovatelnost (50-60%) a srovnávací skóre (25-30%) zůstávají velmi konstantní, zejména u texturovaných obrázků. To je v souladu s vysokým výkonem iteračního algoritmu automatického výběru měřítka.
  • Rozmazané obrázky: Harrisův afinní detektor zůstává při stabilizaci obrazu velmi stabilní. Protože detektor nespoléhá na segmentaci obrazu nebo hranice oblastí, opakovatelnost a shoda skóre zůstávají konstantní.
  • Artefakty JPEG: Harrisův afinitní detektor degraduje podobně jako jiné afinní detektory: opakovatelnost a srovnávací skóre výrazně klesají nad 80% komprese.
  • Změny osvětlení: Harrisův afinitní detektor, stejně jako ostatní afinní detektory, je velmi robustní vůči změnám osvětlení: opakovatelnost a shodné výsledky zůstávají při klesajícím světle konstantní. To by se dalo očekávat, protože detektory se velmi spoléhají na relativní intenzity (deriváty), nikoli na absolutní intenzity.

Obecné trendy

  • Harris afinní region body bývají malé a četné. Detektor Harris-Affine i Hessian-Affine důsledně identifikujte dvojnásobný počet opakovatelných bodů jako u jiných afinních detektorů: ~ 1000 oblastí pro obraz 800x640.[1] Je méně pravděpodobné, že malé regiony budou uzavřeny, ale mají menší šanci překrývat sousední regiony.
  • Harrisův afinitní detektor dobře reaguje na texturované scény, ve kterých je spousta rohových částí. U některých strukturovaných scén, jako jsou budovy, však detektor Harris-Affine funguje velmi dobře. Toto doplňuje MSER, který má tendenci dělat lépe s dobře strukturovanými (segmentovatelnými) scénami.
  • Overall the Harris affine detector performs very well, but still behind MSER and Hessian-Affine in all cases but blurred images.
  • Harris-Affine and Hessian-Affine detectors are less accurate than others: their repeatability score increases as the overlap threshold is increased.
  • The detected affine-invariant regions may still differ in their rotation and illumination. Any descriptor that uses these regions must account for the invariance when using the regions for matching or other comparisons.

Aplikace

Softwarové balíčky

  • Affine Covariant Funkce: K. Mikolajczyk maintains a web page that contains Linux binaries of the Harris-Affine detector in addition to other detectors and descriptors. K dispozici je také kód Matlab, který lze použít k ilustraci a výpočtu opakovatelnosti různých detektorů. K dispozici jsou také kód a obrázky pro duplikování výsledků nalezených v Mikolajczyk et al. (2005) papír.
  • lip-vireo - binary code for Linux, Windows and SunOS from VIREO research group. See more from the domovská stránka

externí odkazy

  • [1] - Prezentační snímky od Mikolajczyka a kol. na jejich papíře z roku 2005.
  • [2] - Cordelia Schmid's Computer Vision Lab
  • [3] - Kód, testovací obrázky, bibliografie funkcí Affine Covariant udržovaných Krystianem Mikolajczykem a Skupina vizuální geometrie ze skupiny Robotics na Oxfordské univerzitě.
  • [4] - Bibliografie detektorů prvků (a blobů) vedená USC Institute for Robotics and Intelligent Systems
  • [5] - Digital implementation of Laplacian of Gaussian

Viz také

Reference

  1. ^ A b C d E F K. Mikolajczyk, T. Tuytelaars, C. Schmid, A. Zisserman, J. Matas, F. Schaffalitzky, T. Kadir a L. Van Gool, Srovnání detektorů afinních oblastí. V IJCV 65 (1/2): 43-72, 2005
  2. ^ A b Mikolajcyk, K. and Schmid, C. 2002. An affine invariant interest point detector. v Sborník příspěvků z 8. mezinárodní konference o počítačovém vidění, Vancouver, Kanada.
  3. ^ A b T. Lindeberg a J. Garding (1997). "Shape-adapted smoothing in estimation of 3-{D} depth cues from affine distortions of local 2-{D} structure". Image and Vision Computing 15: pp 415—434.
  4. ^ A. Baumberg (2000). "Reliable feature matching across widely separated views". Proceedings of IEEE Conference on Computer Vision and Pattern Recognition: pages I:1774—1781.
  5. ^ Lindeberg, Tony, Scale-Space Theory in Computer Vision, Kluwer Academic Publishers, 1994, ISBN  0-7923-9418-6
  6. ^ A b C T. Lindeberg (1998). "Feature detection with automatic scale selection". International Journal of Computer Vision 30 (2): pp 77—116.
  7. ^ Lindeberg, T. (2008). "Scale-space". In Wah, Benjamin (ed.). Encyclopedia of Computer Science and Engineering. IV. John Wiley and Sons. 2495–2504. doi:10.1002 / 9780470050118.ecse609. ISBN  978-0470050118.
  8. ^ A b C. Harris and M. Stephens (1988). "A combined corner and edge detector". Proceedings of the 4th Alvey Vision Conference: pages 147—151. Archivováno 16. září 2007 v Wayback Machine
  9. ^ A b C K. Mikolajczyk and C. Schmid. Indexing based on scale invariant interest points. In Proceedings of the 8th International Conference on Computer Vision, Vancouver, Canada, pages 525-531, 2001.
  10. ^ Schmid, C., Mohr, R., and Bauckhage, C. 2000. Evaluation of interest point detectors. International Journal of Computer Vision, 37(2):151-172.
  11. ^ A b C d E F Mikolajczyk, K. and Schmid, C. 2004. Scale & affine invariant interest point detectors. International Journal on Computer Vision 60(1):63-86.
  12. ^ Spatial Filters: Laplacian/Laplacian of Gaussian
  13. ^ C. Schmid, R. Mohr, and C. Bauckhage. Comparing and evaluating interest points. v Mezinárodní konference o počítačovém vidění, pp. 230-135, 1998.
  14. ^ J. Matas, O. Chum, M. Urban a T. Pajdla, Robustní široké basové stereo z maximálně stabilních extrémních oblastí. V BMVC str. 384-393, 2002.
  15. ^ T. Tuytelaars and L. Van Gool, Matching widely separated views based on affine invariant regions. In IJCV 59 (1): 61-85, 2004.
  16. ^ T. Kadir, A. Zisserman a M. Brady, detektor afinního invariantního výběžku. V ECCV str. 404-416, 2004.
  17. ^ http://staff.science.uva.nl/~gevers/pub/overview.pdf
  18. ^ R. Datta, J. Li, and J. Z. Wang, “Content-based image retrieval - Approaches and trends of the new age,” In Proc. Int. Workshop on Multimedia Information Retrieval, pp. 253-262, 2005.IEEE Transactions on Multimedia, vol. 7, č. 1, pp. 127-142, 2005. Archivováno 2007-09-28 na Wayback Machine
  19. ^ J. Sivic and A. Zisserman. Video google: A text retrieval approach to object matching in videos. In Proceedings of the International Conference on Computer Vision, Nice, France, 2003.
  20. ^ J. Sivic and A. Zisserman. Video data mining using configurations of viewpoint invariant regions. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Washington DC, USA, pp. 488-495, 2004.
  21. ^ G. Dorko and C. Schmid. Selection of scale invariant neighborhoods for object class recognition. In Proceedings of International Conference on Computer Vision, Nice, France, pp. 634-640, 2003.
  22. ^ Beril Sirmacek and Cem Unsalan (January 2011). "A probabilistic framework to detect buildings in aerial and satellite images" (PDF). Transakce IEEE v oblasti geověd a dálkového průzkumu Země. 49 (1): 211–221. doi:10.1109/TGRS.2010.2053713. S2CID  10637950.