Grangerova kauzalita - Granger causality

Když časová řada X Granger způsobuje časové řady Y, vzory v X se přibližně opakují v Y po nějakém časovém zpoždění (dva příklady jsou označeny šipkami). Takže minulé hodnoty X lze použít pro predikci budoucích hodnot Y.

The Grangerův test kauzality je statistický test hypotéz pro určení, zda jeden časové řady je užitečné v předpovídání další, poprvé navržený v roce 1969.[1] Běžně, regrese odrážejí „pouhé“ korelace, ale Clive Granger argumentoval tím kauzalita v ekonomika by mohly být testovány měřením schopnosti předpovídat budoucí hodnoty časové řady pomocí předchozích hodnot jiné časové řady. Vzhledem k tomu, že otázka „skutečné kauzality“ je hluboce filozofická, a to kvůli post hoc ergo propter hoc omyl předpokládat, že jedna věc předcházející druhé může být použita jako důkaz příčinné souvislosti, ekonometrikáři tvrdí, že Grangerův test shledává pouze „prediktivní kauzalitu“.[2] Samotné použití pojmu „kauzalita“ je nesprávné pojmenování, protože Grangerova kauzalita je lépe popsána jako „priorita“,[3] nebo, jak sám Granger později tvrdil v roce 1977, „časově příbuzný“.[4] Spíše než testovat, zda Y příčiny X, Grangerova kauzalita testuje, zda Y předpovědi X.[5]

Časová řada X říká se Grangerovi Y pokud to lze ukázat, obvykle prostřednictvím série t-testy a F-testy na zpožděné hodnoty z X (a se zpožděnými hodnotami Y také zahrnuty), že ty X hodnoty poskytují statisticky významný informace o budoucích hodnotáchY.

Granger také zdůraznil, že některé studie využívající testování „Grangerovy kauzality“ v oblastech mimo ekonomiku dospěly k „směšným“ závěrům. „Samozřejmě se objevilo mnoho směšných článků,“ řekl ve své Nobelově přednášce.[6] Kvůli své výpočetní jednoduchosti však zůstává populární metodou pro analýzu kauzality v časových řadách.[7][8] Původní definice kauzality Grangera nepočítá latentní matoucí účinky a nezachycuje okamžité a nelineární kauzální vztahy, i když bylo navrženo několik rozšíření k řešení těchto problémů.[7]

Intuice

Říkáme, že proměnná X který se vyvíjí v průběhu času Grangerovy příčiny další vyvíjející se proměnná Y pokud předpovědi hodnoty Y na základě vlastních minulých hodnot a o minulých hodnotách X jsou lepší než předpovědi Y pouze na základě Y 'vlastní minulé hodnoty.

Základní zásady

Granger definoval vztah kauzality na základě dvou principů:[7][9]

  1. Příčina se stane před jejím účinkem.
  2. Příčina má unikátní informace o budoucích hodnotách jeho účinku.

Vzhledem k těmto dvěma předpokladům o kauzalitě Granger navrhl otestovat následující hypotézu pro identifikaci kauzálního účinku na :

kde odkazuje na pravděpodobnost, je libovolná neprázdná množina a a respektive označují informace dostupné v čase v celém vesmíru, a to v modifikovaném vesmíru, ve kterém je vyloučeno. Pokud bude výše uvedená hypotéza přijata, řekneme to Grangerovy příčiny .[7][9]

Metoda

Pokud časové řady je stacionární proces, test se provádí pomocí hodnot úrovní dvou (nebo více) proměnných. Pokud jsou proměnné nestacionární, provede se test pomocí prvních (nebo vyšších) rozdílů. Počet zpoždění, které mají být zahrnuty, se obvykle volí pomocí informačního kritéria, například Informační kritérium Akaike nebo Schwarzovo informační kritérium. Jakákoli konkrétní zpožděná hodnota jedné z proměnných je zachována v regresi, pokud (1) je významná podle t-testu a (2) ji a další zpožděné hodnoty proměnné společně přidají vysvětlující síla k modelu podle F-testu. Pak nulová hypotéza žádná Grangerova příčinnost není odmítnuta právě tehdy, pokud v regresi nebyly zachovány zpožděné hodnoty vysvětlující proměnné.

V praxi lze zjistit, že ani jedna proměnná Granger nezpůsobí druhou, nebo že každá ze dvou proměnných Granger způsobí druhou.

Matematický výrok

Nechat y a X být stacionární časová řada. Chcete-li otestovat nulovou hypotézu, že X nezpůsobuje Granger y, jeden nejprve najde správné zpožděné hodnoty y zahrnout do univariate autoregrese z y:

Dále je autoregrese rozšířena o zahrnutí zpožděných hodnot X:

Jeden zachová v této regrese všechny zpožděné hodnoty X které jsou individuálně významné podle jejich t-statistik za předpokladu, že společně přidají vysvětlující sílu k regresi podle F-testu (jehož nulová hypotéza není vysvětlující silou společně přidanou X's). V zápisu výše rozšířené regrese, p je nejkratší a q je nejdelší zpožděná délka, pro kterou je zpožděná hodnota X je významné.

Nulová hypotéza, že X nezpůsobuje Granger y je přijato, pouze a jen tehdy, pokud nejsou žádné zpožděné hodnoty X jsou zachovány v regresi.

Vícerozměrná analýza

Vícerozměrná Grangerova analýza kauzality se obvykle provádí pomocí a vektorový autoregresní model (VAR) do časové řady. Zejména nechte pro být -rozměrná vícerozměrná časová řada. Grangerova kauzalita se provádí namontováním modelu VAR na časové prodlevy takto:

kde je bílý Gaussův náhodný vektor a je matice pro každého . Časová řada se nazývá Grangerova příčina jiné časové řady , pokud alespoň jeden z prvků pro je výrazně větší než nula (v absolutní hodnotě).[10]

Neparametrický test

Výše uvedené lineární metody jsou vhodné pro testování průměrné Grangerovy kauzality. Nejsou však schopni detekovat Grangerovu kauzalitu ve vyšších okamžicích, např. V rozptylu. K řešení tohoto problému jsou navrženy neparametrické testy kauzality Grangera.[11] Definice Grangerovy kauzality v těchto testech je obecná a nezahrnuje žádné předpoklady modelování, například lineární autoregresní model. Neparametrické testy kauzality Grangera lze použít jako diagnostické nástroje k lepšímu vytváření parametrické modely včetně momentů vyššího řádu a / nebo nelinearity.[12]

Omezení

Jak název napovídá, Grangerova kauzalita nemusí být nutně skutečnou kauzalitou. Testy kauzality Grangerovy ve skutečnosti splňují pouze Humánní definice kauzality který identifikuje vztahy příčiny a následku s konstantními spojkami.[13] Pokud obojí X a Y jsou poháněny společným třetím procesem s různými zpožděními, stále by se mohlo nepodařilo odmítnout alternativní hypotéza kauzality Grangera. Manipulace s jednou z proměnných by druhou nezměnila. Ve skutečnosti jsou testy Grangerovy kauzality navrženy tak, aby zvládly páry proměnných, a pokud skutečný vztah zahrnuje tři nebo více proměnných, mohou způsobit zavádějící výsledky. Poté, co jsme to řekli, se tvrdilo, že vzhledem k pravděpodobnostnímu pohledu na příčinnou souvislost lze Grangerovu příčinnou souvislost v tomto smyslu považovat za skutečnou příčinnou souvislost, zvláště když se zohlední Reichenbachův „screeningový“ pojem pravděpodobnostní příčinné souvislosti.[14] Další možné zdroje chybných výsledků testů jsou: (1) nedostatečně časté nebo příliš časté vzorkování, (2) nelineární kauzální vztah, (3) nestacionarita a nelinearita časových řad a (4) existence racionálních očekávání.[13] Lze použít podobný test zahrnující více proměnných vektorové autoregrese.

Rozšíření

Byla vyvinuta metoda pro Grangerovu kauzalitu, která není citlivá na odchylky od předpokladu, že chybný člen je normálně distribuován.[15] Tato metoda je obzvláště užitečná ve finanční ekonomii, protože mnoho finančních proměnných není běžně distribuováno.[16] Nedávno bylo v literatuře doporučeno testování asymetrického kauzality, aby se oddělil kauzální dopad pozitivních změn od negativních.[17] K dispozici je také rozšíření testování (ne) kauzality Grangera na data panelu.[18] Modifikovaný Grangerův test kauzality založený na typu GARCH (generalizovaná autoregresní podmíněná heteroscedasticita) modelů časových řad s celočíselnou hodnotou je k dispozici v mnoha oblastech. [19][20]

V neurovědě

Dlouhodobá víra o nervové funkci tvrdila, že různé oblasti mozku byly specifické pro daný úkol; že strukturální konektivita místní do určité oblasti nějak diktoval funkci toho kusu. Při shromažďování prací, které byly prováděny po mnoho let, došlo k přechodu na jinou, přístup zaměřený na síť k popisu toku informací v mozku. Vysvětlení funkce začíná zahrnovat koncept sítí existujících na různých úrovních a na různých místech v mozku.[21] Chování těchto sítí lze popsat nedeterministickými procesy, které se vyvíjejí v čase. To znamená, že při stejném vstupním stimulu nebudete mít ze sítě stejný výstup. Dynamika těchto sítí je řízena pravděpodobnostmi, takže s nimi zacházíme jako stochastické (náhodné) procesy abychom mohli zachytit tyto druhy dynamiky mezi různými oblastmi mozku.

V minulosti byly prozkoumány různé metody získávání určité míry toku informací z palebných aktivit neuronu a jeho obklopujícího souboru, ale jsou omezeny druhy závěrů, které lze vyvodit, a poskytují malý vhled do směrového toku informací , jeho velikost účinku a jak se může časem měnit.[22] Nedávno byla Grangerova příčinná souvislost použita k řešení některých z těchto problémů s velkým úspěchem.[23] Jednoduše řečeno, jeden prozkoumá, jak nejlépe předpovědět budoucnost neuronu: pomocí buď celého souboru, nebo celého souboru kromě určitého cílového neuronu. Pokud se predikce zhorší vyloučením cílového neuronu, pak říkáme, že má „g-kauzální“ vztah se současným neuronem.

Rozšíření pro ukazování procesních modelů

Předchozí metody Grangerovy kauzality mohly fungovat pouze na datech s kontinuální hodnotou, takže analýza neurální spike vlak nahrávky zahrnovaly transformace, které nakonec změnily stochastické vlastnosti dat a nepřímo změnily platnost závěrů, které z nich lze vyvodit. V roce 2011 však byl navržen nový obecný rámec Grangerovy kauzality, který by mohl přímo fungovat na jakékoli modalitě, včetně neuronových špičkových vlaků.[22]

Data neurálního spike vlaku lze modelovat jako a bodový proces. Proces časových bodů je stochastická časová řada binárních událostí, ke kterým dochází v nepřetržitém čase. Může nabrat pouze dvě hodnoty v každém okamžiku, což naznačuje, zda k události skutečně došlo nebo ne. Tento typ reprezentace informací v binární hodnotě vyhovuje činnosti neurální populace protože akční potenciál jediného neuronu má typický tvar vlny. Tímto způsobem to, co nese skutečné informace, které jsou vydávány z neuronu, je výskyt „špičky“, stejně jako čas mezi po sobě následujícími špičkami. Použitím tohoto přístupu by bylo možné abstrahovat tok informací v neuronové síti tak, aby byly jednoduše dobou špičky pro každý neuron během období pozorování. Bodový proces může být reprezentován buď načasováním samotných hrotů, čekací dobou mezi hroty, použitím procesu počítání, nebo, pokud je čas dostatečně diskretizován, aby bylo zajištěno, že v každém okně má možnost výskytu pouze jedna událost, že znamená, že časová schránka může obsahovat pouze jednu událost, jako sadu 1 s a 0 s, velmi podobnou binární.[Citace je zapotřebí ]

Jedním z nejjednodušších typů neuronových modelů je Poissonův proces. To je však omezeno tím, že je bez paměti. Při výpočtu aktuální pravděpodobnosti výstřelu nepočítá s žádnou historií špice. Neurony však vykazují základní (biofyzikální) závislost na historii prostřednictvím své relativní a absolutní refrakterní období. Chcete-li to vyřešit, a funkce podmíněné intenzity se používá k reprezentaci pravděpodobnost neuronu, který stoupá, podmíněné na vlastní historii. Funkce podmíněné intenzity vyjadřuje okamžitou pravděpodobnost střelby a implicitně definuje úplný model pravděpodobnosti pro bodový proces. Definuje pravděpodobnost za jednotku času. Pokud je tedy tento jednotkový čas dostatečně malý, aby se zajistilo, že v tomto časovém okně může dojít pouze k jednomu špičce, pak naše funkce podmíněné intenzity zcela specifikuje pravděpodobnost, že daný neuron vystřelí v určitém čase.[Citace je zapotřebí ]

Viz také

Reference

  1. ^ Granger, C. W. J. (1969). "Zkoumání kauzálních vztahů ekonometrickými modely a cross-spektrálními metodami". Econometrica. 37 (3): 424–438. doi:10.2307/1912791. JSTOR  1912791.
  2. ^ Diebold, Francis X. (2007). Prvky prognózování (PDF) (4. vydání). Thomson jihozápadní. str. 230–231. ISBN  978-0324359046.
  3. ^ Leamer, Edward E. (1985). Msgstr "Vektorové autoregrese pro kauzální závěr?". Carnegie-Rochester Conference Series on Public Policy. 22: 283. doi:10.1016/0167-2231(85)90035-1.
  4. ^ Granger, C. W. J .; Newbold, Paul (1977). Prognóza ekonomické časové řady. New York: Academic Press. str. 225. ISBN  0122951506.
  5. ^ Hamilton, James D. (1994). Analýza časových řad (PDF). Princeton University Press. 306–308. ISBN  0-691-04289-6.
  6. ^ Granger, Clive W. J (2004). „Analýza časových řad, kointegrace a aplikace“ (PDF). American Economic Review. 94 (3): 421–425. CiteSeerX  10.1.1.370.6488. doi:10.1257/0002828041464669. Citováno 12. června 2019.
  7. ^ A b C d Eichler, Michael (2012). „Kauzální závěr v analýze časových řad“ (PDF). V Berzuini, Carlo (ed.). Příčinnost: statistické perspektivy a aplikace (3. vyd.). Hoboken, N.J .: Wiley. 327–352. ISBN  978-0470665565.
  8. ^ Seth, Anil (2007). „Grangerova kauzalita“. Scholarpedia. 2 (7): 1667. Bibcode:2007SchpJ ... 2.1667S. doi:10,4249 / scholarpedia.1667.
  9. ^ A b Granger, C.W.J. (1980). "Testování kauzality: osobní hledisko". Journal of Economic Dynamics and Control. 2: 329–352. doi:10.1016 / 0165-1889 (80) 90069-X.
  10. ^ Lütkepohl, Helmut (2005). Nový úvod do analýzy více časových řad (3. vyd.). Berlín: Springer. str.41 –51. ISBN  978-3540262398.
  11. ^ Diks, Cees; Panchenko, Valentyn (2006). „Nové statistické a praktické pokyny pro neparametrické testování kauzality Grangera“ (PDF). Journal of Economic Dynamics and Control. 30 (9): 1647–1669. doi:10.1016 / j.jedc.2005.08.008.
  12. ^ Francis, Bill B .; Mougoue, Mbodja; Panchenko, Valentyn (2010). „Existuje symetrický nelineární kauzální vztah mezi velkými a malými firmami?“ (PDF). Journal of Empirical Finance. 17 (1): 23–28. doi:10.1016 / j.jempfin.2009.08.003.
  13. ^ A b Mariusz, Maziarz (2015-05-20). „Přezkum klamu příčin Grangerovy kauzality“. The Journal of Philosophical Economics: Reflections on Economic and Social Issues. VIII. (2). ISSN  1843-2298.
  14. ^ Mannino, Michael; Bressler, Steven L (2015). „Základní pohledy na kauzalitu ve velkých mozkových sítích“. Recenze fyziky života. 15: 107–23. Bibcode:2015PhLRv..15..107M. doi:10.1016 / j.plrev.2015.09.002. PMID  26429630.
  15. ^ Hacker, R. Scott; Hatemi-j, A. (2006). "Testy kauzality mezi integrovanými proměnnými pomocí asymptotických a bootstrap distribucí: Teorie a aplikace". Aplikovaná ekonomie. 38 (13): 1489–1500. doi:10.1080/00036840500405763. S2CID  121999615.
  16. ^ Mandelbrot, Benoit (1963). "Variace určitých spekulativních cen". The Journal of Business. 36 (4): 394–419. doi:10.1086/294632.
  17. ^ Hatemi-j, A. (2012). „Asymetrické testy kauzality s aplikací“. Empirická ekonomie. 43: 447–456. doi:10.1007 / s00181-011-0484-x. S2CID  153562476.
  18. ^ Dumistrescu, E.-I .; Hurlin, C. (2012). "Testování Grangerovy nekauzality v heterogenních panelech". Ekonomické modelování. 29 (4): 1450–1460. CiteSeerX  10.1.1.395.568. doi:10.1016 / j.econmod.2012.02.014.
  19. ^ Chen, Cathy W. S .; Hsieh, Ying-Hen; Su, Hung-Chieh; Wu, Jia Jing (01.02.2018). „Test příčinné souvislosti jemných částic a lidské chřipky na Tchaj-wanu: disparita specifická podle věkových skupin a geografická heterogenita“. Environment International. 111: 354–361. doi:10.1016 / j.envint.2017.10.011. ISSN  0160-4120. PMID  29173968.
  20. ^ Chen, Cathy W. S .; Lee, Sangyeol (2017). „Bayesovský test kauzality pro modely časových řad s celočíselnou hodnotou s aplikacemi na údaje o klimatu a kriminalitě“. Journal of the Royal Statistical Society: Series C (Applied Statistics). 66 (4): 797–814. doi:10.1111 / rssc.12200. ISSN  1467-9876.
  21. ^ Knight, R. T (2007). „NEUROSCIENCE: Neural Networks Debunk Phrenology“. Věda. 316 (5831): 1578–9. doi:10.1126 / science.1144677. PMID  17569852. S2CID  15065228.
  22. ^ A b Kim, Sanggyun; Putrino, David; Ghosh, Soumya; Brown, Emery N (2011). „Opatření Grangerovy kauzality pro modely bodových procesů Ensemble Neural Spiking Activity“. PLOS výpočetní biologie. 7 (3): e1001110. Bibcode:2011PLSCB ... 7E1110K. doi:10.1371 / journal.pcbi.1001110. PMC  3063721. PMID  21455283.
  23. ^ Bressler, Steven L; Seth, Anil K (2011). „Příčinnost Wiener – Granger: Osvědčená metodika“. NeuroImage. 58 (2): 323–9. doi:10.1016 / j.neuroimage.2010.02.059. PMID  20202481. S2CID  36616970.

Další čtení