Jádrová regrese - Kernel regression - Wikipedia
v statistika, Jádrová regrese je neparametrické technika pro odhad podmíněné očekávání a náhodná proměnná. Cílem je najít nelineární vztah mezi dvojicí náhodných proměnných X a Y.
V každém neparametrická regrese, podmíněné očekávání proměnné vzhledem k proměnné lze napsat:
kde je neznámá funkce.
Regrese jádra Nadaraya – Watson
Nadaraya a Watson, oba v roce 1964, navrhli odhadnout jako lokálně vážený průměr pomocí a jádro jako váhová funkce.[1][2][3] Odhad Nadaraya – Watson je:
kde je jádro se šířkou pásma . Jmenovatelem je váhový člen se součtem 1.
Derivace
Za použití odhad hustoty jádra pro společnou distribuci f (x, y) a f (x) s jádrem K.,
,
,
dostaneme
což je odhadovatel Nadaraya – Watson.
Odhad jádra Priestley – Chao
kde je šířka pásma (nebo parametr vyhlazování).
Odhad jádra Gasser – Müller
kde
Příklad

Tento příklad je založen na kanadských průřezových údajích o mzdě sestávajících z náhodného vzorku odebraného z pásky pro veřejné použití v Kanadě ze sčítání lidu z roku 1971 pro jednotlivce mužského pohlaví, kteří mají společné vzdělání (stupeň 13). Existuje celkem 205 pozorování.
Obrázek vpravo ukazuje odhadovanou regresní funkci pomocí Gaussova jádra druhého řádu spolu s hranicemi asymptotické variability
Například scénář
Následující příkazy Programovací jazyk R. použijte npreg ()
funkce pro zajištění optimálního vyhlazení a vytvoření výše uvedené postavy. Tyto příkazy lze zadat na příkazovém řádku pomocí vyjmutí a vložení.
install.packages(„np“)knihovna(np) # neparametrická knihovnadata(cps71)připojit(cps71)m <- npreg(logwage~stáří)spiknutí(m, plot.errors.method="asymptotický", plot.errors.style="kapela", ylim=C(11, 15.2))bodů(stáří, logwage, cex=.25)
Příbuzný
Podle David Salsburg, algoritmy použité při regresi jádra byly nezávisle vyvinuty a použity v fuzzy systémy: "Při vývoji téměř přesně stejného počítačového algoritmu se zdá, že fuzzy systémy a regrese založené na hustotě jádra byly vyvinuty zcela nezávisle na sobě."[4]
Statistická implementace
- GNU oktáva balíček matematického programu
- Julie: KernelEstimator.jl
- MATLAB: Zdarma sada nástrojů MATLAB s implementací regrese jádra, odhadu hustoty jádra, odhadu funkce nebezpečnosti jádra a mnoha dalších je k dispozici na tyto stránky (tato sada nástrojů je součástí knihy [5]).
- Krajta:
KernelReg
třída pro smíšené datové typy vstatsmodels.nonparametric
dílčí balíček (zahrnuje další třídy související s hustotou jádra), balíček kernel_regression jako rozšíření sklearn (neefektivní z hlediska paměti, užitečné pouze pro malé datové sady) - R: funkce
npreg
z np balíček může provádět regresi jádra.[6][7] - Stata: Pokrok, kernreg2
Viz také
Reference
- ^ Nadaraya, E. A. (1964). "Při odhadu regrese". Teorie pravděpodobnosti a její aplikace. 9 (1): 141–2. doi:10.1137/1109020.
- ^ Watson, G. S. (1964). "Hladká regresní analýza". Sankhyā: The Indian Journal of Statistics, Series A. 26 (4): 359–372. JSTOR 25049340.
- ^ Bierens, Herman J. (1994). „Odhad regresní funkce jádra Nadaraya – Watson“. Témata v pokročilé ekonometrii. New York: Cambridge University Press. 212–247. ISBN 0-521-41900-X.
- ^ Salsburg, D. (2002). Dáma ochutnávající čaj: Jak statistika způsobila revoluci ve vědě ve dvacátém století. W.H. Freemane. str. 290–91. ISBN 0-8050-7134-2.
- ^ Horová, I .; Koláček, J .; Zelinka, J. (2012). Vyhlazení jádra v MATLABu: Teorie a praxe vyhlazování jádra. Singapur: World Scientific Publishing. ISBN 978-981-4405-48-5.
- ^ np: Neparametrické metody vyhlazování jádra pro smíšené datové typy
- ^ Kloke, John; McKean, Joseph W. (2014). Neparametrické statistické metody využívající R.. CRC Press. 98–106. ISBN 978-1-4398-7343-4.
Další čtení
- Henderson, Daniel J .; Parmeter, Christopher F. (2015). Aplikovaná neparametrická ekonometrie. Cambridge University Press. ISBN 978-1-107-01025-3.
- Li, Qi; Racine, Jeffrey S. (2007). Neparametrická ekonometrie: teorie a praxe. Princeton University Press. ISBN 0-691-12161-3.
- Pagan, A .; Ullah, A. (1999). Neparametrická ekonometrie. Cambridge University Press. ISBN 0-521-35564-8.
- Simonoff, Jeffrey S. (1996). Vyhlazovací metody ve statistice. Springer. ISBN 0-387-94716-7.
externí odkazy
- Škálově adaptivní regrese jádra (se softwarem Matlab).
- Výukový program pro regresi jádra pomocí tabulky (s Microsoft Excel ).
- Online ukázka regrese jádra Vyžaduje .NET 3.0 nebo novější.
- Jádrová regrese s automatickým výběrem šířky pásma (s Pythonem)