Semiparametrický model - Semiparametric model - Wikipedia
v statistika, a semiparametrický model je statistický model to má parametrické a neparametrické komponenty.
Statistický model je a parametrizovaná rodina distribucí: indexováno a parametr .
- A parametrický model je model, ve kterém je parametr indexování je vektor v -dimenzionální Euklidovský prostor, pro nějaké nezáporné celé číslo .[1] Tím pádem, je konečně-dimenzionální, a .
- S neparametrický model, sada možných hodnot parametru je podmnožinou nějakého prostoru , který nemusí být nutně konečný. Mohli bychom například vzít v úvahu množinu všech distribucí se střední hodnotou 0. Takové prostory jsou vektorové prostory s topologickou strukturou, ale nemusí být konečný rozměr jako vektorové prostory. Tím pádem, pro některé možná nekonečně-dimenzionální prostor .
- U semiparametrického modelu má parametr jak konečně-dimenzionální komponentu, tak nekonečně-dimenzionální komponentu (často je to funkce se skutečnou hodnotou definovaná na reálné linii). Tím pádem, , kde je nekonečně-dimenzionální prostor.
Na první pohled se může zdát, že semiparametrické modely zahrnují neparametrické modely, protože mají nekonečně-dimenzionální i konečně-dimenzionální komponentu. Semiparametrický model je však považován za „menší“ než zcela neparametrický model, protože nás často zajímá pouze konečná dimenzionální složka . To znamená, že nekonečně dimenzionální složka je považována za a obtěžující parametr.[2] Naopak v neparametrických modelech je primárním zájmem odhadnout nekonečně dimenzionální parametr. Úloha odhadu je tedy statisticky těžší v neparametrických modelech.
Tyto modely často používají vyhlazení nebo jádra.
Příklad
Známým příkladem semiparametrického modelu je Coxův model proporcionálních rizik.[3] Pokud máme zájem studovat čas na událost, jako je smrt v důsledku rakoviny nebo selhání žárovky, model Cox specifikuje následující distribuční funkci pro :
kde je kovarianční vektor a a jsou neznámé parametry. . Tady je konečně-dimenzionální a je zajímavý; je neznámá nezáporná funkce času (známá jako základní riziková funkce) a je často a obtěžující parametr. Soubor možných kandidátů na je nekonečně dimenzionální.
Viz také
Poznámky
- ^ Bickel, P. J .; Klaassen, C. A. J .; Ritov, Y .; Wellner, J. A. (2006), "Semiparametrics", in Kotz, S.; et al. (eds.), Encyklopedie statistických věd, Wiley.
- ^ Oakes, D. (2006), „Semi-parametrické modely“, in Kotz, S.; et al. (eds.), Encyklopedie statistických věd, Wiley.
- ^ Balakrishnan, N .; Rao, C. R. (2004). Příručka statistiky 23: Pokroky v analýze přežití. Elsevier. str. 126.
Reference
- Bickel, P. J .; Klaassen, C. A. J .; Ritov, Y .; Wellner, J. A. (1998), Efektivní a adaptivní odhad pro semiparametrické modelySpringer
- Härdle, Wolfgang; Müller, Marlene; Sperlich, Stefan; Werwatz, Axel (2004), Neparametrické a semiparametrické modelySpringer
- Kosorok, Michael R. (2008), Úvod do empirických procesů a semiparametrické inferenceSpringer
- Tsiatis, Anastasios A. (2006), Semiparametrická teorie a chybějící dataSpringer
- Begun, Janet M .; Hall, W. J .; Huang, Wei-Min; Wellner, Jon A. (1983), „Informace a asymptotická účinnost v parametrických - neparametrických modelech“, Annals of Statistics, 11 (1983), č. 1. 2, 432--452