Střední absolutní rozdíl - Mean absolute difference

The znamenat absolutní rozdíl (univariate) je a míra statistického rozptylu se rovná průměru absolutní rozdíl dvou nezávislých hodnot získaných z a rozdělení pravděpodobnosti. Související statistika je relativní průměr absolutní rozdíl, což je střední absolutní rozdíl dělený aritmetický průměr a rovná se dvojnásobku Giniho koeficient Průměrný absolutní rozdíl je také známý jako absolutní průměrný rozdíl (nezaměňovat s absolutní hodnota z znamená podepsaný rozdíl ) a Gini průměrný rozdíl (GMD).[1] Střední absolutní rozdíl je někdy označen Δ nebo jako MD.

Definice

Střední absolutní rozdíl je definován jako „průměr“ nebo „průměr“, formálně očekávaná hodnota, absolutního rozdílu dvou náhodné proměnné X a Y nezávisle a identicky distribuovány se stejnou (neznámou) distribucí od nynějška Q.

Výpočet

Konkrétně v diskrétním případě

  • Pro náhodný vzorek velikosti n populace rovnoměrně rozdělené podle Qtím, že zákon úplného očekávání (empirický) průměrný absolutní rozdíl v pořadí hodnot vzorku yi, i = 1 až n lze vypočítat jako aritmetický průměr absolutní hodnoty všech možných rozdílů:

V nepřetržitém případě

Relativní průměrný absolutní rozdíl

Když má rozdělení pravděpodobnosti konečné a nenulové aritmetický průměr AM, relativní střední absolutní rozdíl, někdy označovaný jako Δ nebo RMD, je definován jako

Relativní průměrný absolutní rozdíl kvantifikuje průměrný absolutní rozdíl ve srovnání s velikostí průměru a je bezrozměrnou veličinou. Relativní průměrný absolutní rozdíl se rovná dvojnásobku Giniho koeficient který je definován z hlediska Lorenzova křivka. Tento vztah poskytuje doplňkové pohledy jak na relativní průměrný absolutní rozdíl, tak na Giniho koeficient, včetně alternativních způsobů výpočtu jejich hodnot.

Vlastnosti

Průměrný absolutní rozdíl je neměnný vůči překladům a negaci a mění se proporcionálně k pozitivnímu měřítku. To znamená, pokud X je náhodná proměnná a C je konstanta:

  • MD (X + C) = MD (X),
  • MD (-X) = MD (X), a
  • MD (C X) = |C| MD (X).

Relativní průměrný absolutní rozdíl je invariantní k pozitivnímu měřítku, dojíždí s negací a mění se při překladu v poměru k poměru původního a přeloženého aritmetického průměru. To znamená, pokud X je náhodná proměnná a c je konstanta:

  • RMD (X + C) = RMD (X) · znamenat(X)/(znamenat(X) + C) = RMD (X) / (1 + C / znamenat(X)) pro C M −mean (X),
  • RMD (-X) = −RMD (X), a
  • RMD (C X) = RMD (X) pro C > 0.

Pokud má náhodná proměnná kladný průměr, bude její relativní průměrný absolutní rozdíl vždy větší nebo roven nule. Pokud navíc může náhodná proměnná nabrat pouze hodnoty, které jsou větší nebo rovny nule, bude její relativní průměrný absolutní rozdíl menší než 2.

Ve srovnání se směrodatnou odchylkou

Průměrný absolutní rozdíl je dvojnásobek Měřítko L. (druhý L-moment ), zatímco směrodatná odchylka je druhá odmocnina rozptylu o střední hodnotě (druhý konvenční centrální moment). Rozdíly mezi L-momenty a konvenčními momenty se nejprve projeví porovnáním průměrného absolutního rozdílu a směrodatné odchylky (první L-moment a první konvenční moment jsou oba průměrné).

Oba standardní odchylka a střední absolutní rozdíl měří rozptyl - jak jsou rozložené hodnoty populace nebo pravděpodobnosti distribuce. Střední absolutní rozdíl není definován z hlediska konkrétní míry centrální tendence, zatímco standardní odchylka je definována z hlediska odchylky od aritmetického průměru. Protože směrodatná odchylka umocňuje své rozdíly, má tendenci přikládat větší váhu větším rozdílům a menší váhu menším rozdílům ve srovnání se středním absolutním rozdílem. Když je aritmetický průměr konečný, bude absolutní průměrný rozdíl také konečný, i když je směrodatná odchylka nekonečná. Viz příklady pro některá konkrétní srovnání.

Nedávno představený směrodatná odchylka vzdálenosti hraje podobnou roli jako průměrný absolutní rozdíl, ale směrodatná odchylka vzdálenosti funguje se středovými vzdálenostmi. Viz také E-statistiky.

Ukázkové odhady

Pro náhodný vzorek S z náhodné proměnné X, skládající se z n hodnoty yistatistika

je konzistentní a objektivní odhadce MD (X). Statistika:

je konzistentní odhadce RMD (X), ale není obecně objektivní.

Intervaly spolehlivosti pro RMD (X) lze vypočítat pomocí technik vzorkování bootstrap.

Obecně neexistuje objektivní odhad RMD (X), zčásti kvůli obtížnosti nalezení nezaujatého odhadu pro vynásobení inverzí průměru. Například i tam, kde je známo, že je vzorek odebrán z náhodné proměnné X(p) za neznámé p, a X(p) − 1Bernoulliho distribuce, aby Pr (X(p) = 1) = 1 − p a Pr (X(p) = 2) = p, pak

RMD (X(p)) = 2p(1 − p)/(1 + p).

Ale očekávaná hodnota jakéhokoli odhadce R(S) RMD (X(p)) bude ve tvaru:[Citace je zapotřebí ]

Kde r i jsou konstanty. Takže E (R(S)) se nikdy nemůže rovnat RMD (X(p)) pro všechny p mezi 0 a 1.

Příklady

Příklady průměrného absolutního rozdílu a relativního průměrného absolutního rozdílu
RozděleníParametryZnamenatStandardní odchylkaStřední absolutní rozdílRelativní průměrný absolutní rozdíl
Kontinuální uniforma
Normální;
Exponenciální
Pareto; ext {pro} k> 2
Gama;
Gama;
Gama;
Gama;
Gama;
Bernoulli
Studentské t, 2 d.f.nedefinováno
je legalizovaná neúplná funkce Beta

Viz také

Reference

  1. ^ Yitzhaki, Shlomo (2003). „Giniho průměrný rozdíl: vynikající míra variability pro nenormální distribuce“ (PDF). Metron International Journal of Statistics. Springer Verlag. 61 (2): 285–316.