Automatizované strojové učení - Automated machine learning
![]() | Tento článek má několik problémů. Prosím pomozte vylepši to nebo diskutovat o těchto problémech na internetu diskusní stránka. (Zjistěte, jak a kdy tyto zprávy ze šablony odebrat) (Zjistěte, jak a kdy odstranit tuto zprávu šablony)
|
Část série na |
Strojové učení a dolování dat |
---|
Místa pro strojové učení |
Související články |
Automatizované strojové učení (AutoML) je proces automatizace proces podávání žádosti strojové učení k problémům v reálném světě. AutoML pokrývá kompletní kanál od nezpracované datové sady k nasaditelnému modelu strojového učení. AutoML byl navržen jako umělá inteligence řešení založené na stále rostoucí výzvě aplikace strojového učení.[1][2] Vysoký stupeň automatizace v AutoML umožňuje neodborníkům využívat modely a techniky strojového učení, aniž by se nejprve museli stát odborníkem v oboru.
Automatizace procesu aplikace end-to-end strojového učení navíc nabízí výhody výroby jednodušších řešení, rychlejšího vytváření těchto řešení a modelů, které často překonávají ručně navržené modely.
Srovnání se standardním přístupem
V typické aplikaci pro strojové učení mají praktici sadu vstupních datových bodů, na kterých mohou trénovat. Nezpracovaná data nemusí být ve formě, ve které na ně lze použít všechny algoritmy. Aby byla data přístupná pro strojové učení, bude pravděpodobně nutné použít vhodného odborníka předběžné zpracování dat, funkce inženýrství, extrakce funkcí, a výběr funkcí metody. Po těchto krocích musí praktikující provést výběr algoritmu a optimalizace hyperparametru maximalizovat prediktivní výkon svého modelu. Všechny tyto kroky vyvolávají výzvy, které se hromadí ve značné překážce, abyste mohli začít se strojovým učením.
AutoML dramaticky zjednodušuje tyto kroky pro neodborníky.
Cíle automatizace
Automatizované strojové učení může cílit na různé fáze procesu strojového učení.[2] Kroky k automatizaci jsou:
- Příprava dat a příjem (ze surových dat a různých formátů)
- Sloupec typ detekce; např. booleovský, diskrétní numerický, spojitý numerický nebo textový
- Detekce záměru sloupce; např. cíl / štítek, stratifikace pole, numerická funkce, kategorická textová funkce nebo funkce volného textu
- Detekce úkolů; např., binární klasifikace, regrese, shlukování nebo hodnocení
- Inženýrství funkcí
- Výběr funkcí
- Extrakce funkcí
- Meta učení a přenos učení
- Detekce a zpracování zkosených dat a / nebo chybějících hodnot
- Výběr modelu
- Optimalizace hyperparametru algoritmu učení a funkce
- Výběr kanálu v rámci časových, paměťových a složitých omezení
- Výběr metrik hodnocení a ověřovacích postupů
- Kontrola problému
- Únik detekce
- Detekce chybné konfigurace
- Analýza získaných výsledků
- Uživatelská rozhraní a vizualizace pro automatizované strojové učení
Viz také
Reference
- ^ Thornton C, Hutter F, Hoos HH, Leyton-Brown K (2013). Auto-WEKA: Kombinovaný výběr a optimalizace hyperparametru klasifikačních algoritmů. KDD '13 Proceedings of the 19. ACM SIGKDD international conference on Knowledge discovery and data mining. str. 847–855.
- ^ A b Hutter F, Caruana R, Bardenet R, Bilenko M, Guyon I, Kegl B a Larochelle H. „AutoML 2014 @ ICML“. Workshop AutoML 2014 @ ICML. Citováno 2018-03-28.
Další čtení
- „Nástroje AutoML s otevřeným zdrojovým kódem: AutoGluon, TransmogrifAI, Auto-sklearn a NNI“. Bizety. 2020-06-16.
externí odkazy
- AutoGluon, Amazonka open-source sada nástrojů AutoML pro Hluboké učení, k dispozici také jako AWS CloudFormation šablona
- TransmogrifAI end-to-end AutoML sada nástrojů pro strukturovaná data zapsaná v Scala, který běží dál Apache Spark
- auto-sklearn na GitHub, nástroj AutoML s otevřeným zdrojovým kódem implementovaný v Krajta, postavený kolem scikit-učit se knihovna
- Neural Network Intelligence na GitHub, Microsoft open-source sada nástrojů AutoML
- Dokumentace Azure ML - Co je AutoML? – Microsoft Azure dokumentace ke cloudové službě
- Auto Cloud Google Cloud, AutoML řešení zapnuto Google Cloud Platform
- AutoAI s IBM Watson Studio: automatizace přípravy dat, vývoj modelu, inženýrství funkcí a optimalizace hyperparametrů v IBM Watson Studio
- Potrubí Oracle AutoML, dokumentace sady Oracle Accelerated Data Science (ADS) SDK, knihovny Pythonu zahrnuté jako součást Oracle Cloud Infrastruktura Data Science servis