Model s pevnými efekty - Fixed effects model
tento článek potřebuje další citace pro ověření.Září 2009) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Část série na |
Regresní analýza |
---|
Modely |
Odhad |
Pozadí |
|
v statistika, a model s pevnými efekty je statistický model ve kterém je model parametry jsou pevná nebo nenáhodná množství. To je v rozporu s modely náhodných efektů a smíšené modely ve kterém jsou všechny nebo některé parametry modelu náhodné proměnné. V mnoha aplikacích včetně ekonometrie[1] a biostatistika[2][3][4][5] model s pevnými efekty označuje a regresní model ve kterém jsou skupinové prostředky fixní (nenáhodné) na rozdíl od modelu náhodných efektů, ve kterém jsou skupinové prostředky náhodným vzorkem z populace.[6] Obecně lze data seskupit podle několika pozorovaných faktorů. Skupinové prostředky lze modelovat jako pevné nebo náhodné efekty pro každé seskupení. V modelu fixních efektů je každá skupina průměrem fixní množství specifické pro skupinu.
v data panelu tam, kde pro stejný předmět existují podélná pozorování, představují stálé účinky prostředky specifické pro daný předmět. v panelová analýza dat termín odhad pevných efektů (také známý jako v odhadci) se používá k označení odhadce pro koeficienty v regresním modelu včetně těchto fixních efektů (jeden časově invariantní zachycení pro každý subjekt).
Kvalitativní popis
Takové modely pomáhají při ovládání vynechaná odchylka proměnné kvůli nepozorované heterogenitě, když je tato heterogenita v průběhu času konstantní. Tuto heterogenitu lze z dat odstranit diferencováním, například odečtením průměru na úrovni skupiny v čase, nebo odebráním první rozdíl který odstraní kdykoli invariantní komponenty modelu.
O konkrétním konkrétním účinku existují dva společné předpoklady: předpoklad náhodných efektů a předpoklad pevných efektů. The náhodné efekty Předpokládá se, že efekty specifické pro jednotlivce nekorelují s nezávislými proměnnými. Předpoklad fixního efektu je, že efekty specifické pro jednotlivce korelují s nezávislými proměnnými. Pokud platí předpoklad náhodných efektů, odhadce náhodných efektů je více účinný než odhad pevných efektů. Pokud však tento předpoklad neplatí, odhadce náhodných účinků není konzistentní. The Durbin – Wu – Hausmanův test se často používá k rozlišení mezi modely pevných a náhodných efektů.[7][8]
Formální model a předpoklady
Zvažte lineární nepozorovaný model efektů pro pozorování a časová období:
- pro a
Kde:
- je závislá proměnná pozorovaná u jednotlivce v čase .
- je časová varianta (počet nezávislých proměnných) vektor regresoru.
- je matice parametrů.
- je nepozorovaný individuální časově invariantní efekt. Například vrozená schopnost jednotlivců nebo historické a institucionální faktory pro země.
- je chybový termín.
Na rozdíl od , nelze přímo pozorovat.
Na rozdíl od model náhodných efektů kde nepozorovaně je nezávislý na pro všechny umožňuje model s pevnými efekty (FE) korelovat s regresorovou maticí . Přísná exogenita s ohledem na výraz idiosynkratické chyby je stále vyžadováno.
Statistický odhad
Opravený odhad efektů
Od té doby není pozorovatelný, nemůže být přímo kontrolované pro. Model FE vylučuje ponížením proměnných pomocí v rámci proměna:
kde , , a .
Od té doby je konstantní, a tím je účinek eliminován. Odhad FE se pak získá pomocí OLS regrese na .
Nejméně tři alternativy k v rámci transformace existují s variacemi.
Jedním z nich je přidání fiktivní proměnné pro každého jednotlivce (vynechání prvního jedince kvůli multicollinearity ). Toto je numericky, ale ne výpočetně, ekvivalentní modelu s pevným efektem a funguje pouze v případě, že součet počtu sérií a počtu globálních parametrů je menší než počet pozorování.[9] Přístup fiktivní proměnné je obzvláště náročný s ohledem na využití paměti počítače a nedoporučuje se pro problémy větší, než je dostupná paměť RAM a použitá kompilace programu.
Druhou alternativou je použití přístupu postupných opakování k místním a globálním odhadům.[10] Tento přístup je velmi vhodný pro systémy s nízkou pamětí, na kterých je výpočetně mnohem efektivnější než přístup s fiktivními proměnnými.
Třetím přístupem je vnořený odhad, při kterém je místní odhad pro jednotlivé řady naprogramován jako součást definice modelu.[11] Tento přístup je výpočetně a paměťově nejefektivnější, vyžaduje však zdatné programátorské dovednosti a přístup k programovacímu kódu modelu; lze jej ale naprogramovat i v SAS.[12][13]
Nakonec lze každou z výše uvedených alternativ vylepšit, pokud je odhad specifický pro řadu lineární (v rámci nelineárního modelu), přičemž v takovém případě lze přímé lineární řešení pro jednotlivé řady naprogramovat jako součást definice nelineárního modelu.[14]
Odhad prvního rozdílu
Alternativou k vnitřní transformaci je první rozdíl transformace, která vytváří jiný odhad. Pro :
Odhad FD se pak získá pomocí OLS regrese na .
Když , jsou první odhady rozdílu a fixních efektů numericky ekvivalentní. Pro , nejsou. Pokud chyba podmínky jsou homoskedastic bez č sériová korelace, odhad pevných efektů je více účinný než první odhadovač rozdílu. Li následuje a náhodná procházka, první odhad rozdílu je však efektivnější.[15]
Rovnost pevných efektů a odhady prvního rozdílu, když T = 2
Pro speciální případ dvou období (), odhad pevných efektů (FE) a odhad prvního rozdílu (FD) jsou numericky ekvivalentní. Je tomu tak proto, že odhadce FE účinně „zdvojnásobí datovou sadu“ použitou v odhadu FD. Chcete-li to vidět, zjistěte, že odhad pevných efektů je:
Protože každý lze přepsat jako , přepíšeme řádek jako:
Chamberlainova metoda
Gary Chamberlain Nahrazuje metoda, zevšeobecnění odhadu s jeho lineární projekce na vysvětlující proměnné. Psaní lineární projekce jako:
výsledkem je následující rovnice:
což lze odhadnout na minimální odhad vzdálenosti.[16]
Hausman-Taylorova metoda
Potřebujete mít více než jednoho časově variantního regresora () a časově invariantní regresor () a alespoň jeden a jeden které nesouvisí s.
Rozdělte a proměnné takové, že kde a nesouvisí s . Potřeba .
Odhad přes OLS zapnuto použitím a protože nástroje poskytují konzistentní odhad.
Zobecnění s nejistotou vstupu
Pokud existuje nejistota vstupu pro data, , pak hodnota, spíše než součet čtverců zbytků, by měla být minimalizována.[17] Toho lze přímo dosáhnout pomocí pravidel substituce:
- ,
pak hodnoty a směrodatné odchylky pro a lze určit klasicky obyčejné nejmenší čtverce analýza a variance-kovarianční matice.
Testování pevných efektů (FE) vs. náhodných efektů (RE)
Můžeme otestovat, zda je vhodný model s pevnými nebo náhodnými efekty, pomocí a Durbin – Wu – Hausmanův test.
- :
- :
Li je pravda, obojí a jsou konzistentní, ale pouze je efektivní. Li je pravda, je konzistentní a není.
- kde
Hausmanův test je testem specifikací, takže velká statistika testu může naznačovat, že tam může být chyby v proměnných (EIV) nebo náš model není specifikován. Pokud je předpoklad FE pravdivý, měli bychom to zjistit .
Jednoduchá heuristika je, že pokud může být EIV.
Viz také
Poznámky
- ^ Greene, W.H., 2011. Ekonometrická analýza, 7. vydání, Prentice Hall
- ^ Diggle, Peter J .; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Analýza podélných údajů (2. vyd.). Oxford University Press. 169–171. ISBN 0-19-852484-6.
- ^ Fitzmaurice, Garrett M .; Laird, Nan M .; Ware, James H. (2004). Aplikovaná podélná analýza. Hoboken: John Wiley & Sons. 326–328. ISBN 0-471-21487-6.
- ^ Laird, Nan M .; Ware, James H. (1982). "Modely náhodných efektů pro podélná data". Biometrie. 38 (4): 963–974. JSTOR 2529876.
- ^ Gardiner, Joseph C .; Luo, Zhehui; Roman, Lee Anne (2009). "Opravené efekty, náhodné efekty a GEE: Jaké jsou rozdíly?". Statistika v medicíně. 28: 221–239. doi:10.1002 / sim.3478.
- ^ Ramsey, F., Schafer, D., 2002. Statistický detektiv: Kurz v metodách analýzy dat, 2. vyd. Duxbury Press
- ^ Cameron, A. Colin; Trivedi, Pravin K. (2005). Mikroekonomie: Metody a aplikace. Cambridge University Press. s. 717–19.
- ^ Nerlove, Marc (2005). Eseje v panelové datové ekonometrii. Cambridge University Press. s. 36–39.
- ^ Garcia, Oscar. (1983). "Stochastický model diferenciální rovnice pro výškový růst lesních porostů". Biometrie: 1059–1072.
- ^ Tait, David; Cieszewski, Chris J .; Bella, Imre E. (1986). "Dynamika porostu borovice polní". Umět. J. Pro. Res. 18: 1255–1260.
- ^ Strub, Mike; Cieszewski, Chris J. (2006). "Vlastnosti invariance základního věku dvou technik pro odhad parametrů modelů indexů stránek". Forest Science. 52 (2): 182–186.
- ^ Strub, Mike; Cieszewski, Chris J. (2003). „Přizpůsobení parametrů globálního indexu webů, když je s indexem webů spiknutí nebo stromů zacházeno jako s lokálním obtěžujícím parametrem In: Burkhart HA, editor. Proceedings of the Symposium on Statistics and Information Technology in Forestry; 2002 September 8–12; Blacksburg, Virginia: Virginia Polytechnic Institut a státní univerzita “: 97–107. Citovat deník vyžaduje
| deník =
(Pomoc) - ^ Cieszewski, Chris J .; Harrison, Mike; Martin, Stacey W. (2000). „Praktické metody pro odhad neobjektivních parametrů v samoreferenčních modelech růstu a výnosu“ (PDF). Technická zpráva PMRC. 2000 (7): 12.
- ^ Schnute, Jon; McKinnell, Skip (1984). "Biologicky smysluplný přístup k povrchové analýze odezvy". Umět. J. Fish. Aquat. Sci. 41: 936–953.
- ^ Wooldridge, Jeffrey M. (2001). Ekonometrická analýza dat průřezu a panelu. MIT Stiskněte. str.279 –291. ISBN 978-0-262-23219-7.
- ^ Chamberlain, Gary (1984). "Kapitola 22 Data panelu". 2: 1247–1318. doi:10.1016 / S1573-4412 (84) 02014-6. ISSN 1573-4412. Citovat deník vyžaduje
| deník =
(Pomoc) - ^ Ren, Bin; Dong, Ruobing; Esposito, Thomas M .; Pueyo, Laurent; Debes, John H .; Poteet, Charles A .; Choquet, Élodie; Benisty, Myriam; Chiang, Eugene; Grady, Carol A .; Hines, Dean C .; Schneider, Glenn; Soummer, Rémi (2018). „Desetiletí obrazů disků MWC 758: Kde jsou planety poháněné spirálním ramenem?“. The Astrophysical Journal Letters. 857: L9. arXiv:1803.06776. Bibcode:2018ApJ ... 857L ... 9R. doi:10.3847 / 2041-8213 / aab7f5.
Reference
- Christensen, Ronald (2002). Rovinné odpovědi na složité otázky: Teorie lineárních modelů (Třetí vydání.). New York: Springer. ISBN 0-387-95361-2.
- Gujarati, Damodar N .; Porter, Dawn C. (2009). "Panelové modely regrese dat". Základní ekonometrie (Páté mezinárodní vydání). Boston: McGraw-Hill. str. 591–616. ISBN 978-007-127625-2.
- Hsiao, Cheng (2003). „Modely s pevnými efekty“. Analýza dat panelu (2. vyd.). New York: Cambridge University Press. str. 95–103. ISBN 0-521-52271-4.
- Wooldridge, Jeffrey M. (2013). "Odhad pevných efektů". Úvodní ekonometrie: moderní přístup (Páté mezinárodní vydání). Mason, OH: Jihozápadní. 466–474. ISBN 978-1-111-53439-4.