The růstová funkce, také nazývaný koeficient rozbití nebo tříštivé číslo, měří bohatství a nastavit rodinu. Používá se zejména v kontextu statistická teorie učení, kde měří složitost třídy hypotéz. Termín 'růstová funkce' vymysleli Vapnik a Chervonenkis ve své práci z roku 1968, kde také prokázali mnoho svých vlastností.[1]Jedná se o základní koncept v strojové učení.[2][3]
Nechat být nastavit rodinu (sada sad) a sada. Jejich průsečík je definována jako následující rodina sad:
The velikost křižovatky (nazývané také index) z s ohledem na je . Pokud sada má prvků je index maximálně . Pokud je index přesně 2m pak sada je prý rozbit , protože obsahuje všechny podmnožiny , tj.:
Funkce růstu měří velikost jako funkce . Formálně:
Definice třídy hypotéz
Ekvivalentně, pojďme být třídou hypotéz (soubor binárních funkcí) a sada s elementy. The omezení z na je sada binárních funkcí na z čehož lze odvodit :[3]:45
1. Doména je skutečná čára . Set-rodina obsahuje všechny půlřádky (paprsky) z daného čísla do kladného nekonečna, tj. všechny sady formuláře pro některé . Pro jakoukoli sadu z reálná čísla, průnik obsahuje sady: prázdná sada, sada obsahující největší prvek , sada obsahující dva největší prvky , a tak dále. Proto: .[1]:Př. 1 Totéž platí, zda obsahuje otevřené poloviční čáry, uzavřené poloviční čáry nebo obojí.
2. Doménou je segment . Set-rodina obsahuje všechny otevřené sady. Pro jakoukoli konečnou množinu z reálná čísla, průnik obsahuje všechny možné podmnožiny . Existují takové podmnožiny, tak .[1]:Př. 2.
4. Doména je skutečná čára . Set-rodina obsahuje všechny skutečné intervaly, tj. všechny sady formuláře pro některé . Pro jakoukoli sadu z reálná čísla, průnik obsahuje všechny běhy od 0 do po sobě jdoucí prvky . Počet takových běhů je , tak .
Polynomiální nebo exponenciální
Hlavní vlastnost, díky které je funkce růstu zajímavá, spočívá v tom, že může být buď polynomiální nebo exponenciální - nic mezi tím.
Pokud pro nějakou sadu velikosti , a pro nějaké číslo , -
pak existuje podmnožina velikosti takhle .
To implikuje následující vlastnost funkce růstu.[1]:Čt.1Pro každou rodinu existují dva případy:
The exponenciální případ: identický.
The polynomiální případ: je zaměřen na , kde je nejmenší celé číslo, pro které .
Další vlastnosti
Triviální horní mez
Pro každou konečnou :
protože pro každého , počet prvků v je nanejvýš . Proto je růstová funkce zajímavá hlavně tehdy, když je nekonečný.
Exponenciální horní mez
Pro jakékoli neprázdné :
Tj. Růstová funkce má exponenciální horní mez.
Říkáme, že set-rodina rozbije se sada pokud jejich průnik obsahuje všechny možné podmnožiny , tj. .Li rozbije se velikosti , pak , což je horní hranice.
Kartézská křižovatka
Definujte kartézský průnik dvou množinových rodin jako:
The VC rozměr z je definována podle těchto dvou případů:
V polynomiální případ, = největší celé číslo pro který .
V exponenciální případ.
Tak pouze-li-li .
Růstovou funkci lze považovat za vylepšení konceptu dimenze VC. Dimenze VC nám pouze říká, zda je rovno nebo menší než , zatímco funkce růstu nám říká přesně jak změny v závislosti na .
takže když je dimenze VC konečná, růstová funkce roste polynomiálně s .
Tato horní hranice je pevná, tj. Pro všechny tady existuje s rozměrem VC takové, že:[2]:56
Entropie
Zatímco růstová funkce souvisí s maximum velikost křižovatky entropie souvisí s průměrný velikost průniku:[1]:272–273
Velikost průniku má následující vlastnost. Pro každou rodinu :
Proto:
Navíc sekvence konverguje na konstantu když .
Navíc náhodná proměnná je soustředěna blízko .
Aplikace v teorii pravděpodobnosti
Nechat být soubor, na kterém a míra pravděpodobnosti je definováno. Nechat být rodinou podmnožin skupina událostí.
Předpokládejme, že jsme vybrali sadu který obsahuje prvky , kde je každý prvek náhodně vybrán podle míry pravděpodobnosti , nezávisle na ostatních (tj. s náhradami). Pro každou událost , porovnáváme následující dvě veličiny:
Jeho relativní frekvence v , tj, ;
Jeho pravděpodobnost .
Zajímá nás rozdíl, . Tento rozdíl splňuje následující horní mez:
Slovy: pravděpodobnost, že pro Všechno události v , relativní frekvence se blíží pravděpodobnosti, je dolní mezí výrazu, který závisí na růstové funkci .
Důsledkem toho je, že pokud je funkce růstu polynomiální (tj. nějaké existují takhle ), pak se výše uvedená pravděpodobnost blíží 1 jako . Tj. Rodina těší se jednotná konvergence v pravděpodobnosti.
Reference
^ AbCdEFGhVapnik, V. N .; Chervonenkis, A. Ya. (1971). „O jednotné konvergenci relativních frekvencí událostí k jejich pravděpodobnostem“. Teorie pravděpodobnosti a její aplikace. 16 (2): 264. doi:10.1137/1116025.Toto je anglický překlad ruského článku B. Secklera: „O jednotné konvergenci relativních frekvencí událostí k jejich pravděpodobnostem“. Dokl. Akad. Nauk. 181 (4): 781. 1968.Překlad byl reprodukován jako:Vapnik, V. N .; Chervonenkis, A. Ya. (2015). „O jednotné konvergenci relativních frekvencí událostí k jejich pravděpodobnostem“. Míra složitosti. str. 11. doi:10.1007/978-3-319-21852-6_3. ISBN978-3-319-21851-9.
^ AbCdMohri, Mehryar; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Základy strojového učení. USA, Massachusetts: MIT Press. ISBN9780262018258., zejména oddíl 3.2
^ AbCdShalev-Shwartz, Shai; Ben-David, Shai (2014). Porozumění strojovému učení - od teorie po algoritmy. Cambridge University Press. ISBN9781107057135.