Extrakce funkcí - Feature extraction
v strojové učení, rozpoznávání vzorů, a zpracování obrazu, extrakce funkcí začíná od počáteční sady naměřených dat a vytváří odvozené hodnoty (funkce ) zamýšlel být informativní a nepotřebný, usnadňující následné kroky učení a generalizace a v některých případech vedoucí k lepší interpretaci člověka. Extrakce funkcí souvisí s snížení rozměrů.[1]
Když jsou vstupní data do algoritmus je příliš velký na to, aby mohl být zpracován, a existuje podezření, že je nadbytečný (např. stejné měření ve stopách i metrech nebo opakovatelnost obrázků prezentovaných jako pixelů ), pak jej lze transformovat do redukované sady funkce (také pojmenovaný a vektor funkcí ). Volá se určení podmnožiny počátečních funkcí výběr funkcí.[2] Očekává se, že vybrané funkce budou obsahovat relevantní informace ze vstupních dat, takže požadovaný úkol lze provést pomocí této redukované reprezentace namísto úplných počátečních dat.
Všeobecné
Extrakce funkcí zahrnuje snížení počtu zdrojů potřebných k popisu velké sady dat. Při provádění analýzy komplexních dat je jedním z hlavních problémů počet zúčastněných proměnných. Analýza s velkým počtem proměnných obecně vyžaduje velké množství paměti a výpočetního výkonu, může také způsobit a klasifikace algoritmus na overfit trénovat vzorky a špatně generalizovat nové vzorky. Extrakce funkcí je obecný termín pro metody konstrukce kombinací proměnných, které umožňují obejít tyto problémy a přitom stále dostatečně přesně popisovat data. Mnoho strojové učení odborníci se domnívají, že správně optimalizovaná extrakce funkcí je klíčem k efektivní konstrukci modelu.[3]
Výsledky lze vylepšit pomocí sestavených sad funkcí závislých na aplikacích, obvykle vytvořených odborníkem. Jeden takový proces se nazývá funkce inženýrství. Alternativně se používají obecné techniky redukce rozměrů, jako například:
- Analýza nezávislých komponent
- Isomap
- PCA jádra
- Latentní sémantická analýza
- Částečně nejmenší čtverce
- Analýza hlavních komponent
- Snížení rozměrnosti více faktorů
- Nelineární redukce rozměrů
- Multilineární analýza hlavních komponent
- Multilineární podprostorové učení
- Semidefinitní vkládání
- Autoencoder
Zpracování obrazu
Jednou z velmi důležitých oblastí použití je zpracování obrazu, ve kterém algoritmy se používají k detekci a izolaci různých požadovaných částí nebo tvarů (funkcí) a digitalizovaný obrázek nebo stream videa. To je zvláště důležité v oblasti optické rozpoznávání znaků.
Nízká úroveň
Zakřivení
- Směr hrany, změna intenzity, autokorelace.
Pohyb obrazu
- Detekce pohybu. Plošný, diferenciální přístup. Optický tok.
Tvarově založený
- Prahové hodnoty
- Extrakce blobů
- Shoda šablon
- Hough transformace
- Čáry
- Kruhy / elipsy
- Libovolné tvary (zobecněná Houghova transformace)
- Funguje s jakoukoli parametrizovatelnou funkcí (proměnné třídy, detekce clusteru atd.)
- Zobecněná Houghova transformace
Flexibilní metody
- Deformovatelné, parametrizované tvary
- Aktivní kontury (hadi)
Extrakce funkcí v softwaru
Mnoho software pro analýzu dat balíčky umožňují extrakci funkcí a zmenšení rozměrů. Běžná prostředí numerického programování, jako např MATLAB, SciLab, NumPy, Sklearn a jazyk R. poskytnout některé z jednodušších technik extrakce funkcí (např. analýza hlavních komponent ) prostřednictvím vestavěných příkazů. Specifičtější algoritmy jsou často dostupné jako veřejně dostupné skripty nebo doplňky třetích stran. Existují také softwarové balíčky zaměřené na konkrétní aplikace softwarového strojového učení, které se specializují na extrakci funkcí.[4]
Viz také
- Shluková analýza
- Snížení rozměrů
- Detekce funkcí
- Výběr funkcí
- Dolování dat
- Označování připojených komponent
- Segmentace (zpracování obrazu)
- Mapování prostoru
- Dynamická struktura
- Radiomics
Reference
- ^ Sarangi, Susanta; Sahidullah, Md; Saha, Goutam (září 2020). "Optimalizace datové banky filtrů pro automatické ověření reproduktorů". Zpracování digitálních signálů. 104: 102795. arXiv:2007.10729. doi:10.1016 / j.dsp.2020.102795. S2CID 220665533.
- ^ Alpaydin, Ethem (2010). Úvod do strojového učení. London: The MIT Press. str. 110. ISBN 978-0-262-01243-0. Citováno 4. února 2017.
- ^ "Je to všechno o vlastnostech". Reality AI Blog. Září 2017.
- ^ Viz například https://reality.ai/
![]() | tento článek potřebuje další citace pro ověření.Leden 2016) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |