Autoregresní model s pohyblivým průměrem - Autoregressive–moving-average model
V statistický analýza časové řady, autoregresní - klouzavý průměr (ARMA) modely poskytnout šetrný popis a (slabě) stacionární stochastický proces pokud jde o dva polynomy, jeden pro autoregrese (AR) a druhý pro klouzavý průměr (MA). Obecný model ARMA byl popsán v diplomové práci z roku 1951 Peter Whittle, Testování hypotéz v analýze časových řad, a to bylo propagováno v knize z roku 1970 George E. P. Box a Gwilym Jenkins.
Vzhledem k časové řadě dat Xt , model ARMA je nástrojem pro porozumění a snad i předpovídání budoucích hodnot v této sérii. Část AR zahrnuje regresi proměnné na jejích vlastních zpožděných (tj. Minulých) hodnotách. Část MA zahrnuje modelování chybový termín jako lineární kombinace chybových termínů vyskytujících se současně a v různých dobách v minulosti. Tento model se obvykle označuje jako ARMA (p,q) model kde p je pořadí části AR a q je pořadí části MA (jak je definováno níže).
Modely ARMA lze odhadnout pomocí Metoda Box – Jenkins.
Autoregresní model
Zápis AR (p) odkazuje na autoregresní model řádu p. AR (p) model je napsán
kde jsou parametry, je konstanta a náhodná proměnná je bílý šum.
Některá omezení týkající se hodnot parametrů jsou nezbytná, aby model zůstal stacionární. Například procesy v modelu AR (1) s nejsou stacionární.
Klouzavý průměr
Zápis MA (q) odkazuje na model klouzavého průměru objednávky q:
kde θ1, ..., θq jsou parametry modelu, μ je očekávání (často se předpokládá, že se rovná 0) a , , ... jsou znovu, bílý šum chybové podmínky.
ARMA model
Zápis ARMA (p, q) odkazuje na model s p autoregresní termíny a q klouzavý průměr. Tento model obsahuje AR (p) a MA (q) modely,
Obecný model ARMA byl popsán v diplomové práci z roku 1951 Peter Whittle, kteří použili matematickou analýzu (Laurentova řada a Fourierova analýza ) a statistická inference.[1][2] Modely ARMA byly propagovány knihou z roku 1970 George E. P. Box a Jenkins, který vysvětlil iterativ (Krabice - Jenkins ) metoda jejich výběru a odhadu. Tato metoda byla užitečná pro polynomy nízkého řádu (stupně tři nebo méně).[3]
Model ARMA je v podstatě nekonečná impulzní odezva filtr aplikovaný na bílý šum, s nějakou další interpretací.
Poznámka o chybových podmínkách
Chybové podmínky obecně se předpokládá, že jsou nezávislé identicky distribuované náhodné proměnné (i.i.d.) vzorkováno z a normální distribuce s nulovým průměrem: ~ N (0, σ2) kde σ2 je to rozptyl. Tyto předpoklady mohou být oslabeny, ale tím se změní vlastnosti modelu. Zejména změna i.i.d. tento předpoklad by měl zásadní rozdíl.
Specifikace, pokud jde o operátora zpoždění
V některých textech budou modely specifikovány z hlediska operátor zpoždění LZa těchto podmínek pak AR (p) model je dán
kde představuje polynom
MA (q) model je dán
kde θ představuje polynom
Nakonec kombinovaná ARMA (p, q) model je dán
nebo výstižněji,
nebo
Alternativní notace
Někteří autoři, včetně Krabice, Jenkins & Reinsel používá pro autoregresní koeficienty jinou konvenci.[4] To umožňuje, aby se všechny polynomy zahrnující operátor zpoždění v celém textu zobrazovaly v podobné formě. Model ARMA by tedy byl zapsán jako
Navíc, pokud nastavíme a , pak získáme ještě elegantnější formulaci:
Montáž modelů
Volba p a q
Hledání vhodných hodnot p a q v ARMA (p,q) lze usnadnit vykreslením částečné autokorelační funkce pro odhad p, a také pomocí autokorelační funkce pro odhad q. Rozšířené autokorelační funkce (EACF) lze použít k simultánnímu určení p a q.[5] Další informace lze shromáždit zvážením stejných funkcí pro zbytky modelu vybaveného počátečním výběrem p a q.
Brockwell & Davis doporučují použití Informační kritérium Akaike (AIC) k nalezení p a q.[6] Další možnou volbou pro určení objednávky je BIC kritérium.
Odhad koeficientů
Tato sekce potřebuje expanzi. Můžete pomoci přidávat k tomu. (Březen 2017) |
ARMA modely obecně mohou být, po výběru p a q, namontováno nejmenší čtverce regrese k nalezení hodnot parametrů, které minimalizují chybový termín. Obecně se považuje za dobrou praxi najít nejmenší hodnoty p a q které poskytují přijatelné přizpůsobení údajům. U čistého modelu AR Yule-Walkerovy rovnice lze použít k zajištění fit.
Implementace ve statistických balíčcích
- v R, arima funkce (ve standardním balení statistiky) je dokumentován v ARIMA modelování časových řad. Balíčky rozšíření obsahují související a rozšířené funkce, např řady balíček obsahuje arma funkce, zdokumentováno v „Přizpůsobit modely ARMA časovým řadám“; the fracdiff balík obsahuje fracdiff () pro částečně integrované procesy ARMA; a předpověď balík zahrnuje auto.arima pro výběr šetrné sady p, q. Zobrazení úlohy CRAN na Časové řady obsahuje odkazy na většinu z nich.
- Mathematica má kompletní knihovnu funkcí časových řad včetně ARMA.[7]
- MATLAB zahrnuje funkce jako arma a ar odhadnout modely AR, ARX (autoregresní exogenní) a ARMAX. Vidět Sada nástrojů pro identifikaci systému a Sada nástrojů ekonometrie Pro více informací.
- Julie má některé balíčky řízené komunitou, které implementují přizpůsobení modelu ARMA, jako je arma.jl.
- Statistické modely Modul Python obsahuje mnoho modelů a funkcí pro analýzu časových řad, včetně ARMA. Dříve součástí Scikit-učit se nyní je samostatný a dobře se integruje do Pandy. Další podrobnosti najdete zde.
- PyFlux má implementaci modelů ARIMAX na bázi Pythonu, včetně modelů Bayesian ARIMAX.
- Numerické knihovny IMSL jsou knihovny funkcí numerické analýzy včetně postupů ARMA a ARIMA implementovaných ve standardních programovacích jazycích, jako jsou C, Java, C # .NET a Fortran.
- gretl umí také odhadnout ARMA model, vidět zde, kde je to uvedeno.
- GNU oktáva umí odhadnout modely AR pomocí funkcí z extra balíčku octave-forge.
- Stata zahrnuje funkci arima který dokáže odhadnout ARMA a ARIMA modely. Další podrobnosti najdete zde.
- SuanShu je Java knihovna numerických metod, včetně komplexních statistických balíčků, ve kterých jsou objektově orientované implementovány univariační / multivariační modely ARMA, ARIMA, ARMAX atd. Tyto implementace jsou zdokumentovány v „SuanShu, numerická a statistická knihovna Java“.
- SAS má ekonometrický balíček ETS, který odhaduje modely ARIMA. Další podrobnosti najdete zde.
Aplikace
ARMA je vhodná, když je systém funkcí řady nepozorovaných šoků (část MA nebo klouzavý průměr) i vlastního chování. Ceny akcií mohou být například šokovány základními informacemi, stejně jako technickými trendy a průměrná reverze dopady způsobené účastníky trhu.[Citace je zapotřebí ]
Zobecnění
Závislost Xt o minulých hodnotách a chybových podmínkách εt Předpokládá se, že je lineární, pokud není uvedeno jinak. Pokud je závislost nelineární, model se konkrétně nazývá a nelineární klouzavý průměr (NMA), nelineární autoregresní (NAR) nebo nelineární autoregresní - klouzavý průměr (NARMA) model.
Autoregresní modely s klouzavým průměrem lze zobecnit i jinými způsoby. Viz také autoregresní podmíněná heteroskedasticita (ARCH) modely a autoregresní integrovaný klouzavý průměr (ARIMA) modely. Pokud má být použito více časových řad, může být použit vektorový model ARIMA (nebo VARIMA). Pokud dotyčná časová řada vykazuje dlouhou paměť, může být vhodné modelování pomocí zlomkové ARIMA (FARIMA, někdy nazývané ARFIMA): viz Autoregresní frakčně integrovaný klouzavý průměr. Pokud se předpokládá, že data obsahují sezónní efekty, lze je modelovat pomocí SARIMA (sezónní ARIMA) nebo periodického modelu ARMA.
Další zobecnění je multiscale autoregresní (MAR) model. Model MAR je indexován uzly stromu, zatímco standardní (diskrétní čas) autoregresní model je indexován celými čísly.
Všimněte si, že model ARMA je univariate Modelka. Rozšíření pro případ více proměnných jsou vektorové autoregrese (VAR) a vektorová autoregrese klouzavý průměr (VARMA).
Autoregresní model s pohyblivým průměrem s modelem exogenních vstupů (model ARMAX)
Zápis ARMAX (p, q, b) odkazuje na model s p autoregresní termíny, q klouzavý průměr podmínek a b termíny exogenních vstupů. Tento model obsahuje AR (p) a MA (q) modely a lineární kombinace posledního b termíny známé a externí časové řady . Je to dáno:
kde jsou parametry exogenního vstupu .
Byly definovány některé nelineární varianty modelů s exogenními proměnnými: viz například Nelineární autoregresní exogenní model.
Statistické balíčky implementují model ARMAX pomocí „exogenních“ (tj. Nezávislých) proměnných. Při interpretaci výstupu těchto balíčků je třeba postupovat opatrně, protože odhadované parametry jsou obvykle (například v R[8] a gretl ) viz regrese:
kde mt zahrnuje všechny exogenní (nebo nezávislé) proměnné:
Viz také
- Autoregresní integrovaný klouzavý průměr (ARIMA)
- Exponenciální vyhlazování
- Lineární prediktivní kódování
- Prediktivní analytika
- Nekonečná impulzní odezva
- Konečná impulzní odezva
Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.Srpna 2010) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Reference
- ^ Hannan, Edward James (1970). Několik časových řad. Wileyova řada v pravděpodobnosti a matematické statistice. New York: John Wiley and Sons.CS1 maint: ref = harv (odkaz)
- ^ Whittle, P. (1951). Testování hypotéz v analýze časových řad. Almquist a Wicksell.Whittle, P. (1963). Predikce a regulace. Anglické univerzity Press. ISBN 0-8166-1147-5.
- Publikováno jako: Whittle, P. (1983). Predikce a regulace lineárními metodami nejmenších čtverců. University of Minnesota Press. ISBN 0-8166-1148-3.
- ^ Hannan & Deistler (1988, str. 227): Hannan, E. J.; Deistler, Manfred (1988). Statistická teorie lineárních systémů. Wileyova řada v pravděpodobnosti a matematické statistice. New York: John Wiley and Sons.CS1 maint: ref = harv (odkaz)
- ^ Box, George; Jenkins, Gwilym M .; Reinsel, Gregory C. (1994). Analýza časových řad: Prognózy a řízení (Třetí vydání.). Prentice-Hall. ISBN 0130607746.
- ^ Státní univerzita v Missouri. "Specifikace modelu, analýza časových řad" (PDF).
- ^ Brockwell, P. J .; Davis, R. A. (2009). Časové řady: Teorie a metody (2. vyd.). New York: Springer. str. 273. ISBN 9781441903198.
- ^ Funkce časových řad v Mathematice Archivováno 24. listopadu 2011, v Wayback Machine
- ^ ARIMA modelování časových řad, Dokumentace R.
Další čtení
- Mills, Terence C. (1990). Techniky časové řady pro ekonomy. Cambridge University Press. ISBN 0521343399.
- Percival, Donald B .; Walden, Andrew T. (1993). Spektrální analýza pro fyzické aplikace. Cambridge University Press. ISBN 052135532X.
- Francq, C .; Zakoïan, J.-M. (2005), „Recent results for linear time series models with non independent innovations“, in Duchesne, P .; Remillard, B. (eds.), Statistické modelování a analýza komplexních problémů s daty, Springer, str. 241–265, CiteSeerX 10.1.1.721.1754.