Rozšíření dat - Data augmentation
Rozšíření dat v analýze dat jsou techniky používané ke zvýšení množství dat přidáním mírně upravených kopií již existujících dat nebo nově vytvořených syntetických dat ze stávajících dat. Působí jako regulátor a pomáhá snižovat nadměrné vybavení při trénování modelu strojového učení.[1] Je to úzce spjato s převzorkování v analýze dat.
Techniky syntetického převzorkování pro tradiční strojové učení
Rozšíření dat pro klasifikaci obrázků
Transformace obrázků
Geometrické transformace, převrácení, barevné úpravy, oříznutí, rotace, vkládání šumu a náhodné mazání se používají k rozšíření obrazu při hlubokém učení.[1]
Přidávání nových syntetických obrázků
Protože obrazová data mají obvykle příliš velké rozměry pro tradiční metody syntetického převzorkování, jsou pro vytváření nových syntetických obrázků pro hluboké učení nutné nové metody.
Generativní nepřátelské sítě umožnit vytváření nových syntetických obrázků pro rozšíření dat.[1]
Viz také
- Převzorkování a podvzorkování v analýze dat
- Generativní kontradiktorní síť
- Předběžné zpracování dat
- Konvoluční neuronová síť
- Regularizace (matematika)
- Příprava dat
- Fúze dat
Reference
- ^ A b C Zkrátit, Connore; Khoshgoftaar, Taghi M. (2019). „Průzkum rozšiřování obrazových dat pro hluboké učení“. Matematika a počítače v simulaci. pružina. 6: 60. doi:10.1186 / s40537-019-0197-0.