Obecný lineární model - General linear model - Wikipedia
Část série na |
Regresní analýza |
---|
![]() |
Modely |
Odhad |
Pozadí |
|
The obecný lineární model nebo obecný vícerozměrný regresní model je prostě kompaktní způsob, jak psát několik současně vícenásobná lineární regrese modely. V tomto smyslu nejde o samostatnou statistiku lineární model. Různé vícenásobné lineární regresní modely lze kompaktně zapsat jako[1]
kde Y je matice se sérií vícerozměrných měření (každý sloupec je souborem měření na jednom z závislé proměnné ), X je matice pozorování na nezávislé proměnné to by mohlo být návrhová matice (každý sloupec je souborem pozorování jedné z nezávislých proměnných), B je matice obsahující parametry, které se obvykle odhadují a U je matice obsahující chyby (šum). Chyby se obvykle považují za nekorelované napříč měřeními a sledují a vícerozměrné normální rozdělení. Pokud chyby nenásledují vícerozměrné normální rozdělení, zobecněné lineární modely lze použít k uvolnění předpokladů o Y a U.
Obecný lineární model zahrnuje řadu různých statistických modelů: ANOVA, ANCOVA, MANOVA, MANCOVA, obyčejný lineární regrese, t-test a F-test. Obecný lineární model je zobecněním vícenásobné lineární regrese pro případ více než jedné závislé proměnné. Li Y, B, a U byly vektory sloupců, maticová rovnice výše by představovala vícenásobnou lineární regresi.
Testy hypotéz s obecným lineárním modelem lze provést dvěma způsoby: vícerozměrný nebo jako několik nezávislých univariate testy. V testech s více proměnnými jsou sloupce Y jsou testovány společně, zatímco v jednorozměrných testech jsou sloupce Y jsou testovány nezávisle, tj. jako několik jednorozměrných testů se stejnou konstrukční maticí.
Srovnání s vícenásobnou lineární regrese
Vícenásobná lineární regrese je zobecněním jednoduchá lineární regrese v případě více než jedné nezávislé proměnné a speciální případ obecných lineárních modelů, omezeno na jednu závislou proměnnou. Základní model pro vícenásobnou lineární regresi je
pro každé pozorování i = 1, ... , n.
Ve výše uvedeném vzorci uvažujeme n pozorování jedné závislé proměnné a p nezávislé proměnné. Tím pádem, Yi je ith pozorování závislé proměnné, Xij je ith pozorování jth nezávislé proměnné, j = 1, 2, ..., p. Hodnoty βj - představují odhadované parametry a - εi je ith nezávislá identicky distribuovaná normální chyba.
V obecnější vícerozměrné lineární regrese existuje jedna rovnice výše uvedené formy pro každou z nich m > 1 závislé proměnné, které sdílejí stejnou sadu vysvětlujících proměnných, a proto se odhadují současně navzájem:
pro všechna pozorování indexovaná jako i = 1, ... , n a pro všechny závislé proměnné indexované jako j = 1, ..., m.
Všimněte si, že protože každá závislá proměnná má svou vlastní sadu regresních parametrů, které mají být přizpůsobeny, je z hlediska výpočtu obecná vícerozměrná regrese jednoduše posloupností standardních vícenásobných lineárních regresí s použitím stejných vysvětlujících proměnných.
Srovnání s generalizovaným lineárním modelem
Obecný lineární model (GLM)[2][3] a zobecněný lineární model (GLiM)[4][5] jsou dvě běžně používané rodiny statistické metody spojit určitý počet kontinuálních a / nebo kategorických prediktory k jedinému výsledná proměnná.
Hlavní rozdíl mezi těmito dvěma přístupy spočívá v tom, že GLM striktně předpokládá, že zbytky bude následovat a podmíněně normální distribuce,[3] zatímco GLiM tento předpoklad uvolňuje a umožňuje řadu dalších distribuce z exponenciální rodina pro zbytky.[4] GLM je zvláštním případem GLiM, ve kterém distribuce zbytků následuje podmíněně normální distribuci.
Distribuce reziduí do značné míry závisí na typu a distribuci výsledné proměnné; různé typy výstupních proměnných vedou k rozmanitosti modelů v rámci rodiny GLiM. Mezi běžně používané modely v rodině GLiM patří binární logistická regrese[6] pro binární nebo dichotomické výsledky, Poissonova regrese[7] pro počet výsledků a lineární regrese pro průběžné, normálně distribuované výsledky. To znamená, že o GLiM lze hovořit jako o obecné rodině statistických modelů nebo jako o konkrétních modelech pro konkrétní typy výsledků.
Obecný lineární model | Zobecněný lineární model | |
---|---|---|
Typická metoda odhadu | Nejmenší čtverce, nejlepší lineární nezaujatá předpověď | Maximální pravděpodobnost nebo Bayesian |
Příklady | ANOVA, ANCOVA, lineární regrese | lineární regrese, logistická regrese, Poissonova regrese, gama regrese,[8] obecný lineární model |
Rozšíření a související metody | MANOVA, MANCOVA, lineární smíšený model | zobecněný lineární smíšený model (GLMM), zobecněné odhadovací rovnice (GEE) |
R balíček a funkce | lm () v balíčku statistik (základní R) | glm () v balíčku statistik (základní R) |
Matlab funkce | mvregress () | glmfit () |
SAS postupy | PROC GLM, PROC REG | PROC GENMOD, LOGISTICKÁ PROC (pro binární a objednané nebo neuspořádané kategorické výsledky) |
Stata příkaz | regres | glm |
SPSS příkaz | regrese, glm | genlin, logistické |
Wolfram jazyk & Mathematica funkce | LinearModelFit [][9] | GeneralizedLinearModelFit [][10] |
EViews příkaz | je[11] | glm[12] |
Aplikace
Aplikace obecného lineárního modelu se objeví v analýze násobku mozkové skeny ve vědeckých experimentech, kde Y obsahuje data ze skenů mozku, X obsahuje experimentální návrhové proměnné a zmatky. Obvykle se testuje jednorozměrným způsobem (obvykle se jedná o a hromadně univariate v tomto nastavení) a je často označován jako statistické parametrické mapování.[13]
Viz také
Poznámky
- ^ K. V. Mardia, J. T. Kent a J. M. Bibby (1979). Vícerozměrná analýza. Akademický tisk. ISBN 0-12-471252-5.
- ^ Neter, J., Kutner, M. H., Nachtsheim, C. J., & Wasserman, W. (1996). Aplikované lineární statistické modely (Sv. 4, s. 318). Chicago: Irwin.
- ^ A b Cohen, J., Cohen, P., West, S. G., & Aiken, L. S. (2003). Aplikovaná vícenásobná regresní / korelační analýza pro behaviorální vědy.
- ^ A b McCullagh, P .; Nelder, J. A. (1989), „Nástin zobecněných lineárních modelů“, Zobecněné lineární modely, Springer USA, s. 21–47, doi:10.1007/978-1-4899-3242-6_2, ISBN 9780412317606
- ^ Fox, J. (2015). Aplikovaná regresní analýza a zobecněné lineární modely. Sage publikace.
- ^ Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Aplikovaná logistická regrese (Sv. 398). John Wiley & Sons.
- ^ Gardner, W .; Mulvey, E. P .; Shaw, E. C. (1995). "Regresní analýzy počtů a sazeb: Poissonovo, příliš rozšířené Poissonovo a negativní binomické modely". Psychologický bulletin. 118 (3): 392–404. doi:10.1037/0033-2909.118.3.392.
- ^ McCullagh, Peter; Nelder, Johne (1989). Zobecněné lineární modely, druhé vydání. Boca Raton: Chapman and Hall / CRC. ISBN 978-0-412-31760-6.
- ^ LinearModelFit, Centrum jazykové dokumentace Wolfram.
- ^ GeneralizedLinearModelFit, Centrum jazykové dokumentace Wolfram.
- ^ je, Nápověda EViews.
- ^ glm, Nápověda EViews.
- ^ K.J. Friston; A.P. Holmes; K.J. Worsley; J.-B. Poline; CD. Frith; R.S.J. Frackowiak (1995). "Statistické parametrické mapy ve funkčním zobrazování: obecný lineární přístup". Mapování lidského mozku. 2 (4): 189–210. doi:10,1002 / hbm. 460020402.
Reference
- Christensen, Ronald (2002). Rovinné odpovědi na složité otázky: Teorie lineárních modelů (Třetí vydání.). New York: Springer. ISBN 0-387-95361-2.
- Wichura, Michael J. (2006). Přístup bez souřadnic k lineárním modelům. Cambridge Series ve statistické a pravděpodobnostní matematice. Cambridge: Cambridge University Press. s. xiv + 199. ISBN 978-0-521-86842-6. PAN 2283455.
- Rawlings, John O .; Pantula, Sastry G .; Dickey, David A., eds. (1998). "Aplikovaná regresní analýza". Springer Texty ve statistice. doi:10.1007 / b98890. ISBN 0-387-98454-2. Citovat deník vyžaduje
| deník =
(Pomoc)