Projekční matice - Projection matrix
v statistika, projekční matice ,[1] někdy také nazývaný matice vlivu[2] nebo klobouková matice , mapuje vektor z hodnoty odezvy (závislé hodnoty proměnných) na vektor přizpůsobené hodnoty (nebo předpokládané hodnoty). Popisuje to vliv každá hodnota odezvy má na každé přizpůsobené hodnotě.[3][4] Diagonální prvky projekční matice jsou využívá, které popisují vliv každé hodnoty odezvy na přizpůsobenou hodnotu pro stejné pozorování.
Přehled
Pokud vektor hodnoty odezvy je označen a vektor přizpůsobených hodnot pomocí ,
Tak jako se obvykle vyslovuje „y-hat“, projekční matice je také pojmenován klobouková matice jak to uvádí čepice na ". Vzorec pro vektor zbytky lze také vyjádřit kompaktně pomocí projekční matice:
kde je matice identity. Matice se někdy označuje jako matice zbytkového výrobce. Navíc prvek v ith řádek a jth sloupec se rovná kovariance mezi jhodnota odezvy a ihodnota, dělená hodnotou rozptyl první:
Proto kovarianční matice zbytků tím, že šíření chyb, rovná se
- ,
kde je kovarianční matice vektoru chyby (a rozšířením také vektor odezvy). Pro případ lineárních modelů s nezávislé a identicky distribuované chyby, ve kterých , to se redukuje na:[3]
- .
Intuice

Z obrázku je zřejmé, že nejbližší bod z vektoru do prostoru sloupců , je , a je jedna, kde můžeme nakreslit přímku kolmou k prostoru sloupců . Vektor, který je kolmý na prostor sloupců matice, je v nulovém prostoru transpozice matice, takže
Odtud se jeden přeskupí, takže
Proto, protože je v prostoru sloupců , projekční matice, která mapuje na je jen nebo
Lineární model
Předpokládejme, že chceme odhadnout lineární model pomocí lineárních nejmenších čtverců. Model lze zapsat jako
kde je matice vysvětlující proměnné (dále jen návrhová matice ), β je vektor neznámých parametrů, který má být odhadnut, a ε je vektor chyby.
Této formulaci podléhá mnoho typů modelů a technik. Několik příkladů je lineární nejmenší čtverce, vyhlazovací splajny, regresní splajny, lokální regrese, regrese jádra, a lineární filtrování.
Obyčejné nejmenší čtverce
Když jsou váhy pro každé pozorování stejné a chyby jsou nekorelované, odhadované parametry jsou
takže přizpůsobené hodnoty jsou
Proto je projekční matice (a klobouková matice) dána vztahem
Vážené a zobecněné nejmenší čtverce
Výše uvedené lze zobecnit na případy, kdy váhy nejsou totožné a / nebo chyby korelují. Předpokládejme, že kovarianční matice chyb je Ψ. Od té doby
- .
klobouková matice je tedy
a znovu to lze vidět , ačkoli nyní to již není symetrické.
Vlastnosti
Projekční matice má řadu užitečných algebraických vlastností.[5][6] V jazyce lineární algebra, projekční matice je ortogonální projekce na sloupcový prostor konstrukční matice .[4](Všimněte si, že je pseudoinverze X.) Některá fakta o projekční matici v tomto nastavení jsou shrnuta následovně:[4]
- a
- je symetrický, a tak je .
- je idempotentní: a tak je .
- Li je n × r matice s , pak
- The vlastní čísla z skládá se z r ty a n − r nuly, zatímco vlastní čísla skládá se z n − r ty a r nuly.[7]
- je neměnný pod : proto .
- je pro určité podprostory jedinečný.
Promítací matice odpovídající a lineární model je symetrický a idempotentní, to znamená, . To však neplatí vždy; v lokálně vážené vyhlazování scatterplot (LOESS) například klobouková matice obecně není symetrická ani idempotentní.
Pro lineární modely, stopa projekční matice se rovná hodnost z , což je počet nezávislých parametrů lineárního modelu.[8] Pro ostatní modely, například LOESS, které jsou v pozorováních stále lineární , projekční matici lze použít k definování účinné stupně volnosti modelu.
Mezi praktické aplikace projekční matice v regresní analýze patří vliv a Cookova vzdálenost, které se zabývají identifikací vlivná pozorování, tj. pozorování, která mají velký vliv na výsledky regrese.
Blokový vzorec
Předpokládejme konstrukční matici lze rozložit podle sloupců jako . Definujte operátor klobouku nebo projekce jako . Podobně definujte zbytkový operátor jako Potom lze projekční matici rozložit následujícím způsobem:[9]
kde např. a Existuje mnoho aplikací takového rozkladu. V klasické aplikaci je sloupec všech, který umožňuje analyzovat dopady přidání zachycovacího výrazu na regresi. Další použití je v model s pevnými efekty, kde je velký řídká matice fiktivních proměnných pro podmínky s pevným účinkem. Tento oddíl lze použít k výpočtu matice klobouku bez výslovného vytvoření matice , který může být příliš velký, aby se vešel do paměti počítače.
Viz také
- Projekce (lineární algebra)
- Studentizované zbytky
- Efektivní stupně volnosti
- Střední a předpokládaná odpověď
Reference
- ^ Basilevsky, Alexander (2005). Aplikovaná maticová algebra ve statistických vědách. Doveru. str. 160–176. ISBN 0-486-44538-0.
- ^ „Asimilace dat: Diagnostika ovlivňující pozorování systému asimilace dat“ (PDF). Archivovány od originál (PDF) dne 03.09.2014.
- ^ A b Hoaglin, David C .; Welsch, Roy E. (únor 1978). „Hat Matrix in Regression and ANOVA“ (PDF). Americký statistik. 32 (1): 17–22. doi:10.2307/2683469. JSTOR 2683469.
- ^ A b C David A. Freedman (2009). Statistické modely: teorie a praxe. Cambridge University Press.
- ^ Gans, P. (1992). Přizpůsobení dat v chemických vědách. Wiley. ISBN 0-471-93412-7.
- ^ Draper, N.R .; Smith, H. (1998). Aplikovaná regresní analýza. Wiley. ISBN 0-471-17082-8.
- ^ Amemiya, Takeshi (1985). Pokročilá ekonometrie. Cambridge: Harvard University Press. str.460 –461. ISBN 0-674-00560-0.
- ^ „Důkazem toho, že stopa„ kloboukové “matice v lineární regrese je hodnost X“. Stack Exchange. 13. dubna 2017.
- ^ Rao, C. Radhakrishna; Toutenburg, Helge; Shalabh; Heumann, Christian (2008). Lineární modely a zobecnění (3. vyd.). Berlín: Springer. str.323. ISBN 978-3-540-74226-5.