Vlivné pozorování - Influential observation - Wikipedia
v statistika, an vlivné pozorování je postřeh pro a statistický výpočet jehož vymazání z datové sady by znatelně změnilo výsledek výpočtu.[1] Zejména v regresní analýza vlivné pozorování je takové, jehož vypuštění má velký vliv na odhady parametrů.[2]
Posouzení
Byly navrženy různé metody pro měření vlivu.[3][4] Předpokládejme odhadovanou regrese , kde je n× 1 vektor sloupce pro proměnnou odezvy, je n×k návrhová matice vysvětlujících proměnných (včetně konstanty), je n× 1 zbytkový vektor a je k× 1 vektor odhadů některého populačního parametru . Také definujte , projekční matice z . Pak máme následující měřítka vlivu:
- , kde označuje koeficienty odhadované s i-házet z smazáno, označuje i-tá řada . DFBETA tedy měří rozdíl v každém odhadu parametru s nebo bez vlivného bodu. Pro každou proměnnou a každé pozorování existuje DFBETA (pokud existují) N pozorování a k proměnné existují N · k DFBETA).[5] Tabulka ukazuje DFBETA pro třetí datovou sadu z kvarteta Anscombe (graf vlevo dole na obrázku):
X | y | zachytit | sklon |
10.0 | 7.46 | -0.005 | -0.044 |
8.0 | 6.77 | -0.037 | 0.019 |
13.0 | 12.74 | -357.910 | 525.268 |
9.0 | 7.11 | -0.033 | 0 |
11.0 | 7.81 | 0.049 | -0.117 |
14.0 | 8.84 | 0.490 | -0.667 |
6.0 | 6.08 | 0.027 | -0.021 |
4.0 | 5.39 | 0.241 | -0.209 |
12.0 | 8.15 | 0.137 | -0.231 |
7.0 | 6.42 | -0.020 | 0.013 |
5.0 | 5.73 | 0.105 | -0.087 |
Odlehlé hodnoty, vliv a vliv
An odlehlý lze definovat jako a datový bod která se výrazně liší od ostatních pozorování.[6][7]A bod s vysokou pákou jsou pozorování prováděná při extrémních hodnotách nezávislých proměnných.[8]Oba typy atypických pozorování přinutí regresní přímku k bodu.[2] V kvartetu Anscombe má obrázek vpravo dole bod s vysokou pákou a obrázek vlevo dole má odlehlý bod.
Viz také
Reference
- ^ Burt, James E .; Barber, Gerald M .; Rigby, David L. (2009), Základní statistiky pro geografy, Guilford Press, s. 513, ISBN 9781572304840.
- ^ A b C Everitt, Brian (1998). Statistický slovník Cambridge. Cambridge, Velká Británie New York: Cambridge University Press. ISBN 0-521-59346-8.
- ^ Vítěz Larry (25. března 2002). „Statistiky vlivu, odlehlé hodnoty a diagnostika kolinearity“.
- ^ Belsley, David A .; Kuh, Edwin; Welsh, Roy E. (1980). Regrese Diagnostics: Identification Influential Data and Sources of Collinearity. Wiley Series v pravděpodobnosti a matematické statistiky. New York: John Wiley & Sons. str. 11–16. ISBN 0-471-05856-4.
- ^ „Odlehlé hodnoty a DFBETA“ (PDF). Archivováno (PDF) od originálu 11. května 2013.
- ^ Grubbs, F. E. (únor 1969). "Postupy pro detekci odlehlých pozorování ve vzorcích". Technometrics. 11 (1): 1–21. doi:10.1080/00401706.1969.10490657.
Odlehlé pozorování neboli „odlehlá hodnota“ je takové, které se zjevně výrazně liší od ostatních členů vzorku, ve kterém se vyskytuje.
- ^ Maddala, G. S. (1992). „Odlehlé hodnoty“. Úvod do ekonometrie (2. vyd.). New York: MacMillan. str.89. ISBN 978-0-02-374545-4.
Odlehlá hodnota je pozorování, které je daleko od ostatních pozorování.
- ^ Everitt, B. S. (2002). Statistický slovník Cambridge. Cambridge University Press. ISBN 0-521-81099-X.
Další čtení
- Dehon, Catherine; Gassner, Marjorie; Verardi, Vincenzo (2009). „Dejte si pozor na„ dobré “odlehlé hodnoty a příliš optimistické závěry“. Oxford Bulletin of Economics and Statistics. 71 (3): 437–452. doi:10.1111 / j.1468-0084.2009.00543.x.
- Kennedy, Peter (2003). „Robust Estimation“. Průvodce po ekonometrii (Páté vydání). Cambridge: MIT Press. 372–388. ISBN 0-262-61183-X.