Křivka učení (strojové učení) - Learning curve (machine learning)
![]() | tento článek poskytuje nedostatečný kontext pro ty, kteří danému tématu nejsou obeznámeni.Březen 2019) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
![]() | tento článek potřebuje víc odkazy na další články pomoci integrovat to do encyklopedie.Února 2019) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |

Část série na |
Strojové učení a dolování dat |
---|
Místa pro strojové učení |
Související články |
v strojové učení, a křivka učení (nebo tréninková křivka) pozemky the optimální hodnota modelu funkce ztráty pro tréninkovou sadu proti této ztrátové funkci hodnocené na a validace datová sada se stejnými parametry, jaká poskytuje optimální funkci. Jedná se o nástroj ke zjištění, nakolik má model stroje výhody z přidání více tréninkových dat a zda odhadce trpí více chybou odchylky nebo chybou zkreslení. Pokud se validační skóre i tréninkové skóre sbíhají na hodnotu, která je s rostoucí velikostí tréninkové sady příliš nízká, nebude to mít větší užitek z více tréninkových dat.[1]
Křivka strojového učení je užitečná pro mnoho účelů, včetně porovnání různých algoritmů,[2] výběr parametrů modelu během návrhu,[3] úprava optimalizace pro zlepšení konvergence a určení množství dat použitých pro trénink.[4]
V doméně strojového učení existují dva důsledky křivek učení lišících se v ose x křivek, přičemž zkušenosti s modelem jsou zakresleny buď jako počet příkladů tréninku použitých pro učení, nebo jako počet iterací použitých při trénování modelu.[5]
Formální definice
Jeden model strojového učení produkuje a funkce, f (x), který dal nějaké informace, X, předpovídá nějakou proměnnou, y, z tréninkových dat a . Je to odlišné od matematická optimalizace protože by měl dobře předpovídat mimo .
Možné funkce často omezujeme na rodinu takže funkce je zobecnitelný[6] a aby určité vlastnosti byly pravdivé, ať už k nalezení dobrého jednodušší, nebo proto, že máme apriorní důvod domnívat se, že jsou pravdivé.[6]:172
Vzhledem k tomu, že není možné vytvořit funkci, která dokonale zapadá do dat, je nutné vytvořit funkci ztráty měřit, jak dobrá je naše předpověď. Poté definujeme optimalizační proces, který najde a což minimalizuje označované jako .
Cvičná křivka pro množství dat
Pak pokud jsou naše tréninková data a naše ověřovací údaje jsou křivka učení je grafem dvou křivek
kde
Cvičná křivka pro počet iterací
Mnoho optimalizačních procesů je iteračních a opakuje stejný krok až do procesu konverguje na optimální hodnotu. Přechodový sestup je jeden takový algoritmus. Pokud definujete jako aproximace optima po kroky, křivka učení je grafem
Viz také
- Overfitting
- Bias – varianční kompromis
- Výběr modelu
- Křížová validace (statistika)
- Platnost (statistika)
- Ověření a validace
Reference
- ^ vývojáři scikit-learn. "Ověření křivek: vykreslování skóre k vyhodnocení modelů - scikit-learn 0.20.2 dokumentace". Citováno 15. února 2019.
- ^ Madhavan, P.G. (1997). „Nový algoritmus učení neuronových sítí pro predikci časových řad“ (PDF). Journal of Intelligent Systems. p. 113 Obr.
- ^ „Machine Learning 102: Practical Advice“. Výukový program: Strojové učení pro astronomii pomocí Scikit-learn.
- ^ Pokorný, Christopher; Thiesson, Bo; Heckerman, David (léto 2002). „Metoda vzorkování křivky učení použitá pro modelování klastrů“. Journal of Machine Learning Research. 2 (3): 397. Archivovány od originál dne 15. 7. 2013.
- ^ Sammut, Claude; Webb, Geoffrey I. (ed.) (28. března 2011). Encyklopedie strojového učení (1. vyd.). Springer. p. 578. ISBN 978-0-387-30768-8.CS1 maint: další text: seznam autorů (odkaz)
- ^ A b Goodfellow, Iane; Bengio, Yoshua; Courville, Aaron (18.11.2016). Hluboké učení. MIT Stiskněte. p. 108. ISBN 978-0-262-03561-3.
![]() | Tento umělá inteligence související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |
![]() | Tento statistika související článek je a pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |