Průměrná absolutní škálovaná chyba - Mean absolute scaled error - Wikipedia
v statistika, průměrná absolutní chyba měřítka (MASE) je měřítkem přesnost z předpovědi. Je to průměrná absolutní chyba predikčních hodnot vydělená střední absolutní chybou jednokrokové naivní prognózy ve vzorku. Bylo navrženo v roce 2005 statistikem Rob J. Hyndman a profesorka věd o rozhodování Anne B. Koehler, která jej popsala jako „obecně použitelné měření přesnosti předpovědi bez problémů, které se projevily v ostatních měřeních“.[1] Střední absolutní škálovaná chyba má příznivé vlastnosti ve srovnání s jinými metodami výpočtu chyby předpovědi, jako root-mean-square-deviation, a proto se doporučuje pro stanovení srovnávací přesnosti předpovědí.[2]
Odůvodnění
Průměrná absolutní škálovaná chyba má následující žádoucí vlastnosti:[3]
- Měřítko invariance: Průměrná absolutní škálovaná chyba je nezávislá na rozsahu dat, takže ji lze použít k porovnání předpovědí napříč soubory dat s různými měřítky.
- Předvídatelné chování jako : Procentní míra přesnosti předpovědi, jako je Střední absolutní procentuální chyba (MAPE) spoléhají na rozdělení , zkosení distribuce MAPE pro hodnoty blízké nebo rovné 0. To je obzvláště problematické pro datové soubory, jejichž váhy nemají smysluplnou 0, jako je teplota ve stupních Celsia nebo Fahrenheita, a pro datové soubory s přerušovanou poptávkou, kde dochází často.
- Symetrie: Průměrná absolutní škálovaná chyba penalizuje kladné i záporné chyby prognózy stejně a penalizuje chyby velkých a malých prognóz stejně. Naproti tomu MAPE a medián absolutní procentuální chyby (MdAPE) selhávají obě tato kritéria, zatímco „symetrické“ sMAPE a sMdAPE[4] nesplnit druhé kritérium.
- Interpretovatelnost: Průměrná absolutní škálovaná chyba může být snadno interpretována, protože hodnoty větší než jedna naznačují, že jednokrokové předpovědi ve vzorku z naivní metody fungují lépe než uvažované hodnoty prognózy.
- Asymptotická normálnost MASE: Test Diebold-Mariano pro jednokrokové předpovědi se používá k testování statistické významnosti rozdílu mezi dvěma sadami předpovědí.[5][6][7] Chcete-li provést testování hypotéz se statistikou testu Diebold-Mariano, je žádoucí , kde je hodnota statistiky testu. Empiricky se ukázalo, že statistika DM pro MASE aproximuje toto rozdělení, zatímco průměrná relativní absolutní chyba (MRAE), MAPE a sMAPE nikoli.[2]
Nesezónní časové řady
U nesezónní časové řady[8] průměrná absolutní škálovaná chyba se odhaduje pomocí
kde čitatel Ej je chyba předpovědi za dané období (s J, počet předpovědí), definovaný jako skutečná hodnota (Yj) minus hodnota předpovědi (Fj) pro dané období: Ej = Yj − Fja jmenovatelem je znamená absolutní chybu jednostupňového “metoda naivní předpovědi "na tréninkové sestavě (zde definována jako t = 1..n),[8] který jako prognózu používá skutečnou hodnotu z předchozího období: Ft = Yt−1[9]
Sezónní časové řady
U sezónních časových řad se průměrná absolutní škálovaná chyba odhaduje podobným způsobem jako u nesezónních časových řad:
Hlavní rozdíl oproti metodě pro nesezónní časové řady spočívá v tom, že jmenovatelem je znamená absolutní chybu jednostupňového “metoda sezónní naivní prognózy „na tréninkové sestavě,[8] který jako prognózu používá skutečnou hodnotu z předchozí sezóny: Ft = Yt- m,[9] kde m je sezónní období.
Tento bez měřítka error metric "lze použít k porovnání metod předpovědi na jedné sérii a také k porovnání přesnosti předpovědi mezi sériemi. Tato metrika je vhodná pro řady s občasnou poptávkou[je zapotřebí objasnění ] protože nikdy nedává nekonečné nebo nedefinované hodnoty[1] s výjimkou irelevantního případu, kdy jsou všechny historické údaje stejné.[3]
Při porovnávání metod předpovídání je upřednostňovanou metodou s nejnižší MASE.
Viz také
- Střední čtvercová chyba
- Střední absolutní chyba
- Střední absolutní procentuální chyba
- Root-mean-square deviation
- Testovací sada
Reference
- ^ A b Hyndman, R. J. (2006). „Další pohled na míry přesnosti předpovědi“, FORESIGHT, 4. června 2006, s. 46 [1]
- ^ A b Franses, Philip Hans (01.01.2016). „Poznámka o střední absolutní škálované chybě“. International Journal of Forecasting. 32 (1): 20–22. doi:10.1016 / j.ijforecast.2015.03.008. hdl:1765/78815.
- ^ A b C Hyndman, R. J. a Koehler A. B. (2006). „Další pohled na míry přesnosti předpovědi.“ International Journal of Forecasting svazek 22, vydání 4, strany 679-688. doi:10.1016 / j.ijforecast.2006.03.001
- ^ Makridakis, Spyros (01.12.1993). „Přesnost: teoretická a praktická hlediska“. International Journal of Forecasting. 9 (4): 527–529. doi:10.1016/0169-2070(93)90079-3.
- ^ Diebold, Francis X .; Mariano, Roberto S. (1995). "Porovnání prediktivní přesnosti". Journal of Business and Economic Statistics. 13 (3): 253–263. doi:10.1080/07350015.1995.10524599.
- ^ Diebold, Francis X .; Mariano, Roberto S. (2002). "Porovnání prediktivní přesnosti". Journal of Business and Economic Statistics. 20 (1): 134–144. doi:10.1198/073500102753410444.
- ^ Diebold, Francis X. (2015). „Srovnání prediktivní přesnosti o dvacet let později: osobní pohled na používání a zneužívání testů Diebold – Mariano“ (PDF). Journal of Business and Economic Statistics. 33 (1): 1. doi:10.1080/07350015.2014.983236.
- ^ A b C d "2.5 Vyhodnocení přesnosti předpovědi | OTexts". www.otexts.org. Citováno 2016-05-15.
- ^ A b Hyndman, Rob a kol., Prognózy s exponenciálním vyhlazováním: přístup státního prostoru, Berlin: Springer-Verlag, 2008. ISBN 978-3-540-71916-8.