Pákový efekt (statistika) - Leverage (statistics)
v statistika a zejména v regresní analýza, vliv je měřítkem toho, jak daleko je nezávislé proměnné hodnoty an pozorování jsou z ostatních pozorování.
Body s vysokou pákou jsou tato pozorování, pokud existují, prováděná při extrémních nebo odlehlých hodnotách nezávislých proměnných tak, že nedostatek sousedních pozorování znamená, že přizpůsobený regresní model projde v blízkosti tohoto konkrétního pozorování.[1]
Definice
V lineární regrese model, pákový efekt pro i-té pozorování je definováno jako:
the i-tý diagonální prvek projekční matice , kde je návrhová matice (jejichž řádky odpovídají pozorováním a jejichž sloupce odpovídají nezávislým nebo vysvětlujícím proměnným).
Výklad
Pákové skóre je také známé jako pozorování vlastní citlivosti nebo vlastního vlivu,[2] kvůli rovnici
který uvádí, že pákový efekt i-té pozorování se rovná parciální derivace namontovaných i-tá závislá hodnota vzhledem k měřenému i-tá závislá hodnota . Tato částečná derivace popisuje míru, do jaké i-th měřená hodnota ovlivňuje i-tá osazená hodnota. Všimněte si, že tento pákový efekt závisí na hodnotách vysvětlujících (x-) proměnných všech pozorování, ale nikoli na žádné z hodnot závislých (y-) proměnných.
Rovnice vyplývá přímo z výpočtu přizpůsobených hodnot pomocí klobouková matice tak jako ; tj. pákový efekt je diagonální prvek matice návrhu:
Omezení pákového efektu
Důkaz
Nejprve si to povšimněte H je idempotentní matice: Dodržujte to také je symetrický (tj .: ). Takže rovnítko ii prvek H k tomu z H 2, my máme
a
Vliv na zbytkovou rozptyl
Pokud jsme v obyčejné nejmenší čtverce nastavení s pevnými X a homoscedastic regresní chyby
pak i-th regresní reziduum
má rozptyl
Jinými slovy, skóre pákového efektu pozorování určuje stupeň šumu v chybné předpovědi modelu u tohoto pozorování, přičemž vyšší páka vede k menšímu šumu.
Důkaz
Nejprve si to povšimněte je idempotentní a symetrický a . To dává
Tím pádem
Studentizované zbytky
Korespondence studentizovaný zbytek —Zbytková hodnota upravená podle odhadované zbytkové odchylky specifické pro pozorování - tedy je
kde je vhodný odhad
Související pojmy
Částečná páka
Částečná páka je měřítkem příspěvku jednotlivce nezávislé proměnné k celkovému využití každého pozorování. Moderní počítačové balíčky pro statistickou analýzu zahrnují jako součást svých zařízení pro regresní analýzu různá kvantitativní opatření pro identifikaci vlivná pozorování, včetně takového měřítka toho, jak nezávislá proměnná přispívá k celkové páce základny.
Mahalanobisova vzdálenost
Pákový efekt úzce souvisí s Mahalanobisova vzdálenost[3] (viz důkaz: [4]).
Konkrétně pro nějakou matici čtvercová Mahalanobisova vzdálenost nějakého řadového vektoru z vektoru střední hodnoty , délky a odhadem kovarianční matice je:
To souvisí s pákovým efektem kloboukové matice poté, co k němu připojíte vektor sloupce 1. Vztah mezi těmito dvěma je:
Vztah mezi pákovým efektem a Mahalanobisovou vzdáleností nám umožňuje rozložit pákový efekt na smysluplné komponenty, aby bylo možné analyticky vyšetřit některé zdroje vysokého pákového efektu. [5]
Softwarové implementace
Mnoho programů a statistických balíčků, například R, Krajta atd., zahrnují implementace Leverage.
Jazyk / Program | Funkce | Poznámky |
---|---|---|
R | klobouk (x, intercept = TRUE) nebo hodnoty (model, ...) | Vidět [1] |
Viz také
- Projekční matice - jehož hlavní diagonální vstupy jsou využitím pozorování
- Mahalanobisova vzdálenost - a (zmenšen ) míra páky data
- Cookova vzdálenost - míra změn regresních koeficientů při vymazání pozorování
- ZÁVADY
- Odlehlá - extrémní pozorování Y hodnoty
- Stupně volnosti (statistika), součet skóre pákového efektu
Reference
- ^ Everitt, B. S. (2002). Statistický slovník Cambridge. Cambridge University Press. ISBN 0-521-81099-X.
- ^ Cardinali, C. (červen 2013). „Asimilace dat: Diagnostika ovlivňující pozorování systému asimilace dat“ (PDF).
- ^ Weiner, Irving B .; Schinka, John A .; Velicer, Wayne F. (23. října 2012). Příručka psychologie, Výzkumné metody v psychologii. John Wiley & Sons. ISBN 978-1-118-28203-8.
- ^ Prokázat vztah mezi Mahalanobisovou vzdáleností a pákou?
- ^ Kim, M. G. (2004). „Zdroje vysoké páky v lineárním regresním modelu (Journal of Applied Mathematics and Computing, Vol 16, 509–513)“. arXiv:2006.04024 [matematika ].