Pravděpodobně přibližně správné učení - Probably approximately correct learning
Část série na |
Strojové učení a dolování dat |
---|
Místa pro strojové učení |
Související články |
v teorie výpočetního učení, pravděpodobně přibližně správný (PAC) učení se je rámec pro matematickou analýzu strojové učení. Bylo navrženo v roce 1984 Leslie Valiant.[1]
V tomto rámci student obdrží vzorky a musí si vybrat funkci zobecnění (nazývanou hypotéza) z určité třídy možných funkcí. Cílem je, aby s vysokou pravděpodobností („pravděpodobně“ část) měla vybraná funkce nízkou hodnotu chyba generalizace („přibližně správná“ část). Žák musí být schopen naučit se koncept s libovolným poměrem aproximace, pravděpodobností úspěchu nebo distribuce vzorků.
Model byl později rozšířen o léčbu hluku (nesprávně klasifikované vzorky).
Důležitou inovací rámce PAC je zavedení teorie výpočetní složitosti koncepty strojového učení. Od studenta se zejména očekává, že najde efektivní funkce (požadavky na čas a prostor spojené s a polynomiální velikosti příkladu) a samotný student musí implementovat efektivní postup (vyžadující počet příkladů vázaný na polynom velikosti konceptu, upravený aproximací a pravděpodobnost meze).
Definice a terminologie
Abychom mohli dát definici něčeho, co je PAC-učitelné, musíme nejprve zavést nějakou terminologii.[2][3]
Pro následující definice budou použity dva příklady. První je problém rozpoznávání znaků vzhledem k řadě bity kódující obraz v binární hodnotě. Druhým příkladem je problém s nalezením intervalu, který bude správně klasifikovat body v intervalu jako pozitivní a body mimo rozsah jako negativní.
Nechat být soubor nazvaný instanční prostor nebo kódování všech vzorků. V problému s rozpoznáváním znaků je prostor instance . V problému intervalu prostor instance, , je množina všech ohraničených intervalů v , kde označuje množinu všech reálných čísel.
A pojem je podmnožina . Jeden koncept je sada všech vzorů bitů v které zakódují obrázek písmene "P". Ukázkovým konceptem z druhého příkladu je sada otevřených intervalů, , z nichž každý obsahuje pouze kladné body. A koncept třídy je sbírka konceptů . Může to být množina všech podmnožin řady bitů, které jsou skeletonizovaný 4-připojeno (šířka písma je 1).
Nechat být procedurou, která čerpá příklad, pomocí rozdělení pravděpodobnosti a dává správný štítek , to je 1 pokud a 0 jinak.
Nyní, vzhledem , Předpokládejme, že existuje algoritmus a polynom v (a další relevantní parametry třídy ) takové, že vzhledem k velikosti vzorku tažené podle , tedy s pravděpodobností minimálně , vydává hypotézu která má průměrnou chybu menší nebo rovnou na se stejnou distribucí . Dále pokud výše uvedené tvrzení pro algoritmus platí pro každý koncept a pro každou distribuci přes a pro všechny pak je (efektivně) PAC učitelný (nebo zjistitelný PAC bez distribuce). Můžeme to také říci je Algoritmus učení PAC pro .
Rovnocennost
Za určitých pravidelných podmínek jsou tyto podmínky rovnocenné: [4]
- Koncept třídy C je PAC učitelný.
- The VC rozměr z C je konečný.
- C je uniforma Třída Glivenko-Cantelli.[je zapotřebí objasnění ]
- C je stlačitelný ve smyslu Littlestone a Warmuth
Viz také
Reference
- ^ L. Statečný. Teorie učitelného. Sdělení ACM, 27, 1984.
- ^ Kearns a Vazirani, str. 1-12,
- ^ Balas Kausik Natarajan, strojové učení, teoretický přístup, Morgan Kaufmann Publishers, 1991
- ^ Blumer, Anselm; Ehrenfeucht, Andrzej; David, Haussler; Manfred, Warmuth (říjen 1989). „Učitelnost a dimenze Vapnik-Chervonenkis“. Časopis Asociace pro výpočetní techniku. 36 (4): 929–965. doi:10.1145/76359.76371. S2CID 1138467.
https://users.soe.ucsc.edu/~manfred/pubs/lrnk-olivier.pdf
Moran, Shay; Yehudayoff, Amir (2015). Msgstr "Ukázková schémata komprese pro třídy VC". arXiv:1503.06960 [cs.LG ].
Další čtení
- M. Kearns, U. Vazirani. Úvod do teorie výpočetního učení. MIT Press, 1994. Učebnice.
- M. Mohri, A. Rostamizadeh a A. Talwalkar. Základy strojového učení. MIT Press, 2018. Kapitola 2 obsahuje podrobné zpracování PAC-učitelnosti. Čitelné otevřeným přístupem od vydavatele.
- D. Haussler. Přehled pravděpodobně přibližně správného (PAC) vzdělávacího rámce. Úvod do tématu.
- L. Statečný. Pravděpodobně přibližně správné. Basic Books, 2013. Valiant tvrdí, že učení PAC popisuje, jak se organismy vyvíjejí a učí.