Průměrná absolutní odchylka - Average absolute deviation
Tento článek má několik problémů. Prosím pomozte vylepši to nebo diskutovat o těchto otázkách na internetu diskusní stránka. (Zjistěte, jak a kdy tyto zprávy ze šablony odebrat) (Zjistěte, jak a kdy odstranit tuto zprávu šablony)
|
The průměrná absolutní odchylkanebo znamená absolutní odchylku (ŠÍLENÝ), souboru dat je průměrný z absolutní odchylky z centrálního bodu. Je to souhrnná statistika z statistická disperze nebo variabilita. Obecně může být ústředním bodem a znamenat, medián, režimu nebo výsledek jakéhokoli jiného opatření centrální tendence nebo jakýkoli náhodný datový bod související s daným souborem dat. Absolutní hodnoty rozdílů mezi datovými body a jejich centrální tendencí se sečtou a vydělí počtem datových bodů.
Míra disperze
Několik opatření statistická disperze jsou definovány z hlediska absolutní odchylky. Termín „průměrná absolutní odchylka“ neidentifikuje jednoznačně míru statistická disperze, protože existuje několik měr, které lze použít k měření absolutních odchylek, a existuje několik měřítek centrální tendence které lze také použít. Pro jednoznačnou identifikaci absolutní odchylky je tedy nutné specifikovat jak míru odchylky, tak míru centrální tendence. Statistická literatura bohužel dosud nepřijala standardní notaci, protože obě střední absolutní odchylka kolem střední hodnoty a medián absolutní odchylka kolem mediánu byly v literatuře označeny jejich iniciálami „MAD“, což může vést ke zmatku, protože obecně mohou mít hodnoty značně odlišné od sebe navzájem.
Střední absolutní odchylka kolem centrálního bodu
Střední absolutní odchylka množiny {X1, X2, ..., Xn} je
Volba míry centrální tendence, , má výrazný vliv na hodnotu střední odchylky. Například pro datovou sadu {2, 2, 3, 4, 14}:
Míra centrální tendence | Střední absolutní odchylka |
---|---|
Průměr = 5 | |
Medián = 3 | |
Režim = 2 |
Průměrná absolutní odchylka od mediánu je menší nebo rovna průměrné absolutní odchylce od průměru. Ve skutečnosti je průměrná absolutní odchylka od mediánu vždy menší nebo rovna průměrné absolutní odchylce od jakéhokoli jiného pevného čísla.
Střední absolutní odchylka od průměru je menší nebo rovna standardní odchylka; spoléhá se na jeden způsob, jak to dokázat Jensenova nerovnost.
Důkaz Jensenova nerovnost je ,kde φ je konvexní funkce, což znamená pro že: Jelikož jsou obě strany pozitivní, a odmocnina je monotónně rostoucí funkce v pozitivní doméně:
Obecný případ tohoto tvrzení viz Hölderova nerovnost.
Pro normální distribuce, poměr střední absolutní odchylky ke standardní odchylce je . Tedy pokud X je normálně distribuovaná náhodná proměnná s očekávanou hodnotou 0, viz Geary (1935):[1]
Jinými slovy, pro normální rozdělení je průměrná absolutní odchylka přibližně 0,8násobek standardní odchylky. Měření ve vzorku však poskytují hodnoty poměru průměrné průměrné odchylky / standardní odchylky pro daný Gaussův vzorek n s následujícími mezemi: , se zkreslením pro malé n.[2]
Střední absolutní odchylka kolem střední hodnoty
The znamená absolutní odchylku (MAD), označovaný také jako „průměrná odchylka“ nebo někdy „průměrná absolutní odchylka“, je průměr absolutních odchylek dat kolem průměru dat: průměrná (absolutní) vzdálenost od průměru. „Průměrná absolutní odchylka“ může odkazovat buď na toto použití, nebo na obecnou formu s ohledem na zadaný centrální bod (viz výše).
Bylo navrženo použití MAD místo standardní odchylka protože to lépe odpovídá skutečnému životu.[3] Protože MAD je jednodušší míra variability než standardní odchylka, to může být užitečné ve školní výuce.[4][5]
Přesnost předpovědi této metody velmi úzce souvisí s střední čtvercová chyba (MSE) metoda, která je pouze průměrnou druhou chybou předpovědí. I když jsou tyto metody velmi úzce spjaty, MAD se běžněji používá, protože je jak jednodušší vypočítat (vyhnout se nutnosti kvadratury)[6] a srozumitelnější.[7]
Střední absolutní odchylka kolem mediánu
Střední absolutní odchylka kolem mediánu (MAD medián) nabízí přímou míru měřítka náhodné proměnné kolem jejího mediánu
To je maximální pravděpodobnost odhad parametru stupnice z Laplaceova distribuce. Pro normální rozdělení máme . Protože medián minimalizuje průměrnou absolutní vzdálenost, máme . Použitím funkce obecné disperze definoval Habib (2011) MAD o mediánu jako
kde je indikátorová funkce
Toto znázornění umožňuje získat mediánové korelační koeficienty MAD.[Citace je zapotřebí ]
Střední absolutní odchylka kolem centrálního bodu
Medián absolutní odchylky kolem průměru
V zásadě lze průměr považovat za centrální bod pro střední absolutní odchylku, ale častěji se místo toho použije střední hodnota.
Medián absolutní odchylky kolem mediánu
The střední absolutní odchylka (také MAD) je medián absolutní odchylky od medián. Je to robustní odhad disperze.
Například {2, 2, 3, 4, 14}: 3 je medián, takže absolutní odchylky od mediánu jsou {1, 1, 0, 1, 11} (přeuspořádány jako {0, 1, 1, 1 , 11}) se střední hodnotou 1, v tomto případě neovlivněnou hodnotou odlehlé hodnoty 14, takže střední absolutní odchylka (nazývaná také MAD) je 1.
Maximální absolutní odchylka
The maximální absolutní odchylka kolem libovolného bodu je maximum absolutních odchylek vzorku od tohoto bodu. I když nejde o přísně měřítko centrální tendence, lze maximální absolutní odchylku zjistit pomocí vzorce pro průměrnou absolutní odchylku, jak je uvedeno výše , kde je maximální vzorek.
Minimalizace
Míra statistického rozptylu odvozená z absolutní odchylky charakterizuje různá měřítka centrální tendence jako minimalizace disperze: Medián je míra centrální tendence, která je nejvíce spojena s absolutní odchylkou. Některé parametry umístění lze porovnat takto:
- L2 norma statistika: průměr minimalizuje střední čtvercová chyba
- L1 norma statistika: medián se minimalizuje průměrný absolutní odchylka,
- L∞ norma statistika: střední rozsah minimalizuje maximum absolutní odchylka
- oříznutý L∞ norma statistika: například midhinge (průměr prvního a třetího) kvartily ) který minimalizuje medián absolutní odchylka celé distribuce, také minimalizuje maximum absolutní odchylka distribuce po oříznutí horních a spodních 25%.
Odhad
Tato sekce potřebuje expanzi. Můžete pomoci přidávat k tomu. (Březen 2009) |
Střední absolutní odchylka vzorku je a zkreslený odhad Aby byla absolutní odchylka nestranným odhadcem, musí se očekávaná hodnota (průměr) všech absolutních odchylek vzorku rovnat absolutní odchylce populace. Nicméně není. U populace 1,2,3 je absolutní odchylka populace od mediánu i absolutní odchylka populace od průměru 2/3. Průměr všech absolutních odchylek vzorku o průměru velikosti 3, který lze odvodit z populace, je 44/81, zatímco průměr všech absolutních odchylek vzorku o mediánu je 4/9. Absolutní odchylka je proto zkreslený odhad.
Tento argument je však založen na pojmu střední nestrannost. Každé měřítko polohy má svou vlastní formu nezaujatosti (viz záznam na zkreslený odhad ). Relevantní formou nestrannosti je zde medián nestrannosti.
Viz také
- Odchylka (statistika)
- Střední absolutní chyba
- Chyby a zbytky ve statistikách
- Nejméně absolutní odchylky
- Funkce ztráty
- Střední absolutní procentuální chyba
- Průměrný rozdíl
- Průměrná čtvercová chyba
- Střední absolutní odchylka
- Na druhou odchylky
Reference
- ^ Geary, R. C. (1935). Poměr střední odchylky ke směrodatné odchylce jako test normality. Biometrika, 27 (3/4), 310–332.
- ^ Viz také dokumenty Geary's 1936 and 1946: Geary, R. C. (1936). Okamžiky poměru střední odchylky ke standardní odchylce pro normální vzorky. Biometrika, 28 (3/4), 295–307 a Geary, R. C. (1947). Testování normality. Biometrika, 34 (3/4), 209–242.
- ^ „Archivovaná kopie“. Archivovány od originálu dne 2014-01-16. Citováno 2014-01-16.CS1 maint: archivovaná kopie jako titul (odkaz) CS1 maint: BOT: status original-url neznámý (odkaz)
- ^ Kader, Gary (březen 1999). „Prostředky a VÝROBKY“. Výuka matematiky na střední škole. 4 (6): 398–403. Archivováno z původního dne 2013-05-18. Citováno 20. února 2013.
- ^ Franklin, Christine, Gary Kader, Denise Mewborn, Jerry Moreno, Roxy Peck, Mike Perry a Richard Scheaffer (2007). Pokyny pro hodnocení a výuku ve statistickém vzdělávání (PDF). Americká statistická asociace. ISBN 978-0-9791747-1-1. Archivováno (PDF) z původního dne 2013-03-07. Citováno 2013-02-20.
- ^ Nahmias, Steven; Olsen, Tava Lennon (2015), Analýza výroby a provozu (7. vydání), Waveland Press, str. 62, ISBN 9781478628248,
MAD je často upřednostňovanou metodou měření chyby předpovědi, protože nevyžaduje druhou mocninu.
- ^ Stadtler, Hartmut; Kilger, Christoph; Meyr, Herbert, eds. (2014), Správa dodavatelského řetězce a pokročilé plánování: koncepty, modely, software a případové studie Springer Texts in Business and Economics (5. vydání), Springer, s. 143, ISBN 9783642553097,
význam MAD je snazší interpretovat
.