Detekce popředí - Foreground detection
Detekce popředí je jedním z hlavních úkolů v oblasti počítačové vidění a zpracování obrazu jehož cílem je detekovat změny v obrazových sekvencích. Odečítání pozadí je jakákoli technika, která umožňuje extrahovat popředí obrazu pro další zpracování (rozpoznávání objektů atd.).
Mnoho aplikací nemusí vědět vše o vývoji pohybu ve videosekvenci, ale vyžaduje pouze informace o změnách ve scéně, protože oblasti zájmu obrazu jsou objekty (lidé, automobily, text atd.) V jeho popředí. Po fázi předběžného zpracování obrazu (což může zahrnovat potlačení obrazu, post processing jako morfologie atd.) je nutná lokalizace objektu, která může tuto techniku využít.
Detekce popředí odděluje popředí od pozadí na základě těchto změn probíhajících v popředí. Jedná se o soubor technik, které obvykle analyzují videosekvence zaznamenané v reálný čas se stacionární kamerou.

Popis
Všechny detekční techniky jsou založeny na modelování pozadí obrazu, tj. Nastavení pozadí a detekce, které změny nastanou. Definování pozadí může být velmi obtížné, pokud obsahuje tvary, stíny a pohyblivé objekty. Při definování pozadí se předpokládá, že stacionární objekty se mohou časem lišit barvou a intenzitou.
Scénáře, kde se tyto techniky používají, bývají velmi různorodé. Mohou existovat velmi variabilní sekvence, například obrázky s velmi odlišným osvětlením, interiéry, exteriéry, kvalitou a šumem. Kromě zpracování v reálném čase musí být systémy schopny se těmto změnám přizpůsobit.
Velmi dobrý systém detekce popředí by měl být schopen:
- Vypracovat model pozadí (odhad).
- Buďte robustní vůči změnám osvětlení, opakujícím se pohybům (listy, vlny, stíny) a dlouhodobým změnám.
Odečítání pozadí
Odečítání pozadí je pro široce používaný přístup detekce pohybujících se objektů ve videích ze statických kamer. Důvodem tohoto přístupu je detekce pohybujících se objektů z rozdílu mezi aktuálním rámcem a referenčním rámcem, často nazývaným „obrázek na pozadí“ nebo „model na pozadí“. Odečítání pozadí se většinou provádí, pokud je dotyčný obrázek součástí video streamu. Odečítání pozadí poskytuje důležité podněty pro řadu aplikací v počítačovém vidění, například pro sledování sledování nebo odhad lidské pozice.
Odečítání pozadí je obecně založeno na statické hypotéze pozadí, která často není použitelná v reálných prostředích. U scén v interiéru vedou odrazy nebo animované obrázky na obrazovkách ke změnám na pozadí. Podobně, kvůli větru, dešti nebo změnám osvětlení způsobeným počasím, mají metody statického pozadí potíže s venkovními scénami.[1]
Časový průměrný filtr

The dočasný průměrný filtr je metoda, která byla navržena ve Velastinu. Tento systém odhaduje model pozadí z medián všech pixelů z řady předchozích obrázků. Systém používá vyrovnávací paměť s hodnotami pixelů posledních snímků k aktualizaci mediánu pro každý obrázek.
K modelování pozadí systém prozkoumá všechny obrázky v daném volaném časovém období čas tréninku. V tuto chvíli zobrazujeme pouze obrázky a tentokrát najdeme medián po pixelech všech grafů na pozadí.
Po tréninkovém období pro každý nový snímek je každá hodnota pixelu porovnána se vstupní hodnotou dříve vypočítaných prostředků. Pokud je vstupní pixel v prahové hodnotě, považuje se pixel za shodný s modelem pozadí a jeho hodnota je zahrnuta do pixbuf. Jinak, pokud je hodnota mimo tuto prahovou hodnotu, je pixel klasifikován jako popředí a není zahrnut do vyrovnávací paměti.
Tuto metodu nelze považovat za velmi efektivní, protože nepředstavuje přísný statistický základ a vyžaduje vyrovnávací paměť, která má vysoké výpočetní náklady.
Konvenční přístupy
Robustní algoritmus odčítání pozadí by měl být schopen zvládnout změny osvětlení, opakující se pohyby z nepořádku a dlouhodobé změny scény.[2] Následující analýzy využívají funkce PROTI(X,y,t) jako videosekvence, kde t je časová dimenze, X a y jsou proměnné umístění pixelu. např. PROTI(1,2,3) je intenzita pixelu v (1,2) umístění pixelu obrazu na t = 3 ve videosekvenci.
Použití rozdílu snímků
Algoritmus detekce pohybu začíná segmentační částí, kde jsou popředí nebo pohybující se objekty segmentovány z pozadí. Nejjednodušší způsob, jak to implementovat, je pořídit obrázek jako pozadí a vzít snímky získané v časovém plánu označené I (t) pro srovnání s obrázkem pozadí označeným B. Zde pomocí jednoduchých aritmetických výpočtů můžeme objekty jednoduše rozdělit pomocí techniky odčítání obrazu počítačového vidění, což znamená pro každý pixel v I (t), vezměte hodnotu pixelu označenou P [I (t)] a odečtěte ji odpovídajícími pixely ve stejné poloze na pozadí zobrazeném jako P [B] .
V matematické rovnici se píše:
Pozadí se považuje za snímek v čase t. Tento rozdílový obraz by ukazoval pouze určitou intenzitu pro umístění pixelů, které se změnily ve dvou rámcích. Ačkoli jsme zdánlivě odstranili pozadí, tento přístup bude fungovat pouze v případech, kdy se pohybují všechny pixely v popředí a všechny pixely pozadí jsou statické.[2] Na tento rozdílový obraz je přidána prahová hodnota „Prahová hodnota“, aby se zlepšilo odčítání (viz Obrázek prahování ).
To znamená, že intenzity pixelů rozdílového obrazu jsou „prahovány“ nebo filtrovány na základě hodnoty prahu.[3] Přesnost tohoto přístupu závisí na rychlosti pohybu ve scéně. Rychlejší pohyby mohou vyžadovat vyšší prahové hodnoty.
Střední filtr
Pro výpočet obrázku obsahujícího pouze pozadí se zprůměruje řada předchozích obrázků. Pro okamžitý výpočet obrázku na pozadít,
kde N je počet předchozích snímků pořízených pro průměrování. Toto průměrování odkazuje na průměrování odpovídajících pixelů v daných obrázcích. N bude záviset na rychlosti videa (počet obrázků za sekundu ve videu) a rozsahu pohybu ve videu.[4] Po výpočtu pozadí B(X,y,t) pak jej můžeme odečíst z obrázku PROTI(X,y,t) v čase t = ta práh. Takže popředí je
kde Th je prahová hodnota. Podobně můžeme ve výše uvedeném výpočtu použít také medián místo průměru B(X,y,t).
Přesnost výše uvedených dvou přístupů může omezit použití globálních a časově nezávislých prahových hodnot (stejná hodnota Th pro všechny pixely v obraze).[2]
Běžící Gaussův průměr
U této metody Wren et al.[5] navrhnout vybavení a Gaussova funkce pravděpodobnostní hustoty (pdf) na nejnovější rámy. Aby se předešlo tomu, že by se soubor PDF při každém novém časovém úseku přizpůsobil úplně od začátku , je vypočítán průběžný (nebo online kumulativní) průměr.
PDF každého pixelu se vyznačuje znamenat a rozptyl . Následuje možná počáteční podmínka (za předpokladu, že zpočátku je každý pixel pozadí):
kde je hodnota intenzity pixelu v čase . Abychom inicializovali rozptyl, můžeme například použít rozptyl v xay z malého okna kolem každého pixelu.
Pamatujte, že pozadí se může časem měnit (např. Kvůli změnám osvětlení nebo nestatickým objektům pozadí). Abychom této změně vyhověli, na každém snímku , průměr a rozptyl každého pixelu musí být aktualizovány následovně:
Kde Určuje velikost dočasného okna, které se používá k přizpůsobení formátu PDF (obvykle ) a je euklidovská vzdálenost mezi průměrem a hodnotou pixelu.

Nyní můžeme pixel klasifikovat jako pozadí, pokud jeho aktuální intenzita leží v nějakém interval spolehlivosti střední hodnoty jeho distribuce:
kde parametr je bezplatná prahová hodnota (obvykle ). Větší hodnota pro umožňuje dynamičtější pozadí, zatímco menší zvyšuje pravděpodobnost přechodu z pozadí do popředí kvůli jemnějším změnám.
Ve variantě metody se distribuce pixelu aktualizuje, pouze pokud je klasifikována jako pozadí. To zabrání vyblednutí nově zavedených objektů v popředí do pozadí. Vzorec aktualizace pro průměr se odpovídajícím způsobem změní:
kde když je považován za popředí a v opačném případě. Takže když , to znamená, že když je pixel detekován jako popředí, průměr zůstane stejný. Výsledkem je, že jakmile se pixel stane popředím, může se znovu stát pozadím pouze tehdy, když se hodnota intenzity přiblíží tomu, co byla před otočením popředí. Tato metoda má však několik problémů: Funguje pouze v případě, že všechny pixely jsou původně pixely na pozadí (nebo jsou pixely v popředí jako takové anotovány). Rovněž se nedokáže vyrovnat s postupnými změnami pozadí: Pokud je pixel příliš dlouho kategorizován jako popředí, mohla se změnit intenzita pozadí v daném místě (protože se změnilo osvětlení atd.). Výsledkem je, že jakmile objekt popředí zmizí, nová intenzita pozadí již nemusí být jako taková rozpoznána.
Modely směsí pozadí
Metoda Směs Gaussianových metod se modeluje každý pixel jako směs Gaussianů a pro aktualizaci modelu se používá on-line aproximace. V této technice se předpokládá, že hodnoty intenzity každého pixelu ve videu lze modelovat pomocí a Gaussův model směsi.[6] Jednoduchá heuristika určuje, které intenzity jsou pravděpodobně pozadí. Pak se pixely, které se s nimi neshodují, nazývají pixely v popředí. Pixely v popředí jsou seskupeny pomocí 2D připojená součást analýza.[6]
Kdykoli t, určitý pixel () je historie
Tato historie je modelována směsí K. Gaussovy distribuce:
kde
Nejprve je každý pixel charakterizován svou intenzitou v barevném prostoru RGB. Pravděpodobnost pozorování aktuálního pixelu je pak dána následujícím vzorcem ve vícerozměrném případě
Kde K je počet distribucí, ω je váha spojená s i-tou Gaussian v čase t a µ, Σ jsou střední hodnota a standardní odchylka uvedeného Gaussian.
Jakmile je provedena inicializace parametrů, lze provést první detekci popředí, poté se parametry aktualizují. První B Gaussovo rozdělení, které přesahuje prahovou hodnotu T je zachován pro distribuci na pozadí
Ostatní distribuce se považují za distribuci v popředí. Pak, když nový rám občas přijde , je z každého pixelu vytvořen test shody. Pixel odpovídá gaussovské distribuci, pokud Mahalanobisova vzdálenost
kde k je konstantní prahová hodnota rovná . Pak mohou nastat dva případy:
Případ 1: Nalezne se shoda s jedním z k Gaussové. U spárované komponenty se aktualizace provádí následujícím způsobem[7]
Power a Schoonees [3] použili stejný algoritmus k segmentaci popředí obrazu
Základní přiblížení k darováno [8]