Základní matice - Essential matrix
![]() | tento článek může být pro většinu čtenářů příliš technická na to, aby je pochopili. Prosím pomozte to vylepšit na aby to bylo srozumitelné pro neodborníky, aniž by byly odstraněny technické podrobnosti. (Září 2010) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) |
v počítačové vidění, základní matice je matice, to souvisí odpovídající body v stereofonní obrazy za předpokladu, že kamery splňují model dírkové komory.
Funkce
Přesněji řečeno, pokud a jsou homogenní normalizováno souřadnice obrazu pak na obrázku 1 a 2
-li a odpovídají stejnému 3D bodu na scéně.
Výše uvedený vztah, který definuje základní matici, byl publikován v roce 1981 autorem H. Christopher Longuet-Higgins, představení konceptu komunitě počítačového vidění. Richard Hartley a Andrew Zisserman Kniha uvádí, že se v ní objevila analogická matice fotogrammetrie dlouho předtím. Dokument Longuet-Higgins obsahuje algoritmus pro odhad ze sady odpovídajících normalizovaných souřadnic obrazu a také algoritmu pro určení relativní polohy a orientace dvou kamer vzhledem k tomu, že je známo. Nakonec ukazuje, jak lze pomocí základní matice určit 3D souřadnice obrazových bodů.
Použití
Základní matici lze považovat za předchůdce základní matice. Obě matice lze použít pro stanovení omezení mezi odpovídajícími obrazovými body, ale základní matici lze použít pouze ve vztahu ke kalibrovaným kamerám, protože vnitřní parametry kamery musí být známy, aby se dosáhlo normalizace. Pokud jsou však kamery kalibrovány, může být základní matice užitečná pro určení relativní polohy a orientace mezi kamerami a 3D polohy odpovídajících obrazových bodů.
Odvození a definice
Tento původ vychází z článku Longuet-Higgins.
Dvě normalizované kamery promítají 3D svět do příslušných obrazových rovin. Nechte 3D souřadnice bodu P být a vzhledem k souřadnicovému systému každé kamery. Protože jsou kamery normalizovány, jsou odpovídající souřadnice obrazu
- a
Homogenní reprezentace dvou obrazových souřadnic je pak dána vztahem
- a
které lze také psát kompaktněji jako
- a
kde a jsou homogenní reprezentace souřadnic 2D obrazu a a jsou správné 3D souřadnice, ale ve dvou různých souřadnicových systémech.
Dalším důsledkem normalizovaných kamer je to, že jejich příslušné souřadnicové systémy jsou spojeny pomocí translace a rotace. To znamená, že dvě sady 3D souřadnic jsou příbuzné jako
kde je rotační matice a je trojrozměrný překladový vektor.
Základní matice je pak definována jako:
kde je maticová reprezentace křížového produktu s .
Chcete-li vidět, že tato definice základní matice popisuje omezení na násobení odpovídajících souřadnic obrazu zleva a zprava s 3D souřadnicemi bodu P ve dvou různých souřadnicových systémech:
- Vložte výše uvedené vztahy mezi a a definice ve smyslu a .
- od té doby je rotační matice.
- Vlastnosti maticová reprezentace křížového produktu.
Nakonec lze předpokládat, že obojí a jsou> 0, jinak nejsou viditelné v obou kamerách. To dává
což je omezení, které základní matice definuje mezi odpovídajícími obrazovými body.
Vlastnosti
Ne každý svévolně matice může být základní maticí pro některé stereokamery. Chcete-li vidět toto upozornění, že je definován jako maticový produkt jednoho rotační matice a jeden šikmo symetrická matice, oba . Symetrická matice zkosení musí mít dvě singulární hodnoty které jsou stejné a jiné, které jsou nulové. Násobení rotační matice nemění singulární hodnoty, což znamená, že také základní matice má dvě singulární hodnoty, které jsou stejné a jedna nulová. Vlastnosti zde popsané jsou někdy označovány jako vnitřní omezení základní matice.
Pokud základní matice je vynásoben nenulovým skalárem, výsledkem je opět základní matice, která definuje přesně stejné omezení jako dělá. Tohle znamená tamto může být viděn jako prvek a projektivní prostor, to znamená, že dvě takové matice jsou považovány za ekvivalentní, pokud je jedna nenulovou skalární multiplikací druhé. Jedná se o relevantní pozici, například pokud se odhaduje z obrazových dat. Je však také možné zaujmout stanovisko, že je definován jako
kde , a pak má dobře definované „měřítko“. Záleží na aplikaci, která pozice je relevantnější.
Omezení lze také vyjádřit jako
a
Zde je poslední rovnicí omezení matice, které lze považovat za 9 omezení, jedno pro každý prvek matice. Tato omezení se často používají k určení základní matice z pěti odpovídajících dvojic bodů.
Základní matice má pět nebo šest stupňů volnosti, v závislosti na tom, zda je či není považována za projektivní prvek. Rotační matice a překladový vektor mít každý tři stupně volnosti, celkem šest. Pokud je základní matice považována za projektivní prvek, je třeba odečíst jeden stupeň volnosti související se skalárním násobením, přičemž celkem zůstane pět stupňů volnosti.
Odhad
Vzhledem k sadě odpovídajících obrazových bodů je možné odhadnout základní matici, která splňuje definující epipolární omezení pro všechny body v sadě. Pokud však obrazové body podléhají šumu, což je běžný případ v jakékoli praktické situaci, není možné najít základní matici, která přesně splňuje všechna omezení.
V závislosti na tom, jak se měří chyba související s každým omezením, je možné určit nebo odhadnout základní matici, která optimálně splňuje omezení pro danou sadu odpovídajících obrazových bodů. Nejpřímějším přístupem je nastavení a celkem nejméně čtverců problém, běžně známý jako osmibodový algoritmus.
Extrakce rotace a překladu
Vzhledem k tomu, že základní pára byla určena pro pár stereokamery - například pomocí výše uvedené metody odhadu - lze tuto informaci použít k určení také rotace a překlad (až do měřítka) mezi souřadnicovými systémy obou kamer. V těchto derivacích je vnímán spíše jako projektivní prvek než s dobře určeným měřítkem.
Hledání jednoho řešení
Následující metoda pro určení a je založen na provedení a SVD z viz kniha Hartleyho a Zissermana. Je také možné určit a například bez SVD podle papíru Longuet-Higgins.
SVD z dává
kde a jsou kolmé matice a je diagonální matice s