Minimalizace strukturálních rizik - Structural risk minimization
Minimalizace strukturálních rizik (SRM) je indukční princip použití v strojové učení. Obyčejně ve strojovém učení musí být zobecněný model vybrán z konečné datové sady s následným problémem nadměrné vybavení - model se příliš silně přizpůsobil zvláštnostem tréninkového souboru a špatně generalizoval nová data. Princip SRM řeší tento problém vyvážením složitosti modelu proti jeho úspěšnosti při přizpůsobování tréninkových dat. Tento princip byl poprvé stanoven v dokumentu z roku 1974 od Vladimír Vapnik a Alexey Chervonenkis a používá VC rozměr.
Z praktického hlediska je minimalizace strukturálních rizik implementována minimalizací , kde je chyba vlaku, funkce se nazývá funkce regularizace a je konstanta. je vybráno tak, že má velké parametry které patří k vysokokapacitním podmnožinám prostoru parametrů. Minimalizace ve skutečnosti omezuje kapacitu přístupných podmnožin prostoru parametrů, čímž kontroluje kompromis mezi minimalizací tréninkové chyby a minimalizací očekávané mezery mezi tréninkovou chybou a testovací chybou.[1]
Problém SRM lze formulovat z hlediska údajů. Vzhledem k tomu, že n datových bodů se skládá z dat x a štítků y, je cílem se často vyjadřuje následujícím způsobem:
První člen je pojem střední kvadratické chyby (MSE) mezi hodnotou naučeného modelu, a dané štítky . Tento termín je tréninková chyba, , o kterém jsme hovořili dříve. Druhý člen umístí před váhy závaží, aby upřednostňoval řídkost a penalizoval větší závaží. Koeficient kompromisu, , je hyperparametr, který klade větší nebo menší důležitost na regularizační termín. Větší podporuje menší váhy na úkor optimálnějšího MSE a menších uvolňuje regularizaci a umožňuje modelu přizpůsobit se datům. Všimněte si, že jako váhy se stanou nulou a jako , model obvykle trpí overfittingem.
Viz také
- Vapnik – Chervonenkisova teorie
- Podporujte vektorové stroje
- Výběr modelu
- Occam Learning
- Empirická minimalizace rizik
Reference
- ^ LeCun, Yann. „Učení na základě přechodu na rozpoznávání dokumentů“ (PDF).
externí odkazy
- Minimalizace strukturálních rizik na webu podpory vektorových strojů.
![]() | Tento počítačová věda článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |