Střední absolutní rozdíl - Mean absolute difference
Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.Listopad 2010) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
The znamenat absolutní rozdíl (univariate) je a míra statistického rozptylu se rovná průměru absolutní rozdíl dvou nezávislých hodnot získaných z a rozdělení pravděpodobnosti. Související statistika je relativní průměr absolutní rozdíl, což je střední absolutní rozdíl dělený aritmetický průměr a rovná se dvojnásobku Giniho koeficient Průměrný absolutní rozdíl je také známý jako absolutní průměrný rozdíl (nezaměňovat s absolutní hodnota z znamená podepsaný rozdíl ) a Gini průměrný rozdíl (GMD).[1] Střední absolutní rozdíl je někdy označen Δ nebo jako MD.
Definice
Střední absolutní rozdíl je definován jako „průměr“ nebo „průměr“, formálně očekávaná hodnota, absolutního rozdílu dvou náhodné proměnné X a Y nezávisle a identicky distribuovány se stejnou (neznámou) distribucí od nynějška Q.
Výpočet
Konkrétně v diskrétním případě
- Pro náhodný vzorek velikosti n populace rovnoměrně rozdělené podle Qtím, že zákon úplného očekávání (empirický) průměrný absolutní rozdíl v pořadí hodnot vzorku yi, i = 1 až n lze vypočítat jako aritmetický průměr absolutní hodnoty všech možných rozdílů:
- -li Q má diskrétní pravděpodobnostní funkce F(y), kde yi, i = 1 až n, jsou hodnoty s nenulovou pravděpodobností:
V nepřetržitém případě
- -li Q má funkce hustoty pravděpodobnosti F(X):
- -li Q má kumulativní distribuční funkce F(X) s kvantilová funkce Q(F), od té doby f (x) = dF (x) / dx a Q (F (x)) = x, z toho vyplývá, že:
Relativní průměrný absolutní rozdíl
Když má rozdělení pravděpodobnosti konečné a nenulové aritmetický průměr AM, relativní střední absolutní rozdíl, někdy označovaný jako Δ nebo RMD, je definován jako
Relativní průměrný absolutní rozdíl kvantifikuje průměrný absolutní rozdíl ve srovnání s velikostí průměru a je bezrozměrnou veličinou. Relativní průměrný absolutní rozdíl se rovná dvojnásobku Giniho koeficient který je definován z hlediska Lorenzova křivka. Tento vztah poskytuje doplňkové pohledy jak na relativní průměrný absolutní rozdíl, tak na Giniho koeficient, včetně alternativních způsobů výpočtu jejich hodnot.
Vlastnosti
Průměrný absolutní rozdíl je neměnný vůči překladům a negaci a mění se proporcionálně k pozitivnímu měřítku. To znamená, pokud X je náhodná proměnná a C je konstanta:
- MD (X + C) = MD (X),
- MD (-X) = MD (X), a
- MD (C X) = |C| MD (X).
Relativní průměrný absolutní rozdíl je invariantní k pozitivnímu měřítku, dojíždí s negací a mění se při překladu v poměru k poměru původního a přeloženého aritmetického průměru. To znamená, pokud X je náhodná proměnná a c je konstanta:
- RMD (X + C) = RMD (X) · znamenat(X)/(znamenat(X) + C) = RMD (X) / (1 + C / znamenat(X)) pro C M −mean (X),
- RMD (-X) = −RMD (X), a
- RMD (C X) = RMD (X) pro C > 0.
Pokud má náhodná proměnná kladný průměr, bude její relativní průměrný absolutní rozdíl vždy větší nebo roven nule. Pokud navíc může náhodná proměnná nabrat pouze hodnoty, které jsou větší nebo rovny nule, bude její relativní průměrný absolutní rozdíl menší než 2.
Ve srovnání se směrodatnou odchylkou
Průměrný absolutní rozdíl je dvojnásobek Měřítko L. (druhý L-moment ), zatímco směrodatná odchylka je druhá odmocnina rozptylu o střední hodnotě (druhý konvenční centrální moment). Rozdíly mezi L-momenty a konvenčními momenty se nejprve projeví porovnáním průměrného absolutního rozdílu a směrodatné odchylky (první L-moment a první konvenční moment jsou oba průměrné).
Oba standardní odchylka a střední absolutní rozdíl měří rozptyl - jak jsou rozložené hodnoty populace nebo pravděpodobnosti distribuce. Střední absolutní rozdíl není definován z hlediska konkrétní míry centrální tendence, zatímco standardní odchylka je definována z hlediska odchylky od aritmetického průměru. Protože směrodatná odchylka umocňuje své rozdíly, má tendenci přikládat větší váhu větším rozdílům a menší váhu menším rozdílům ve srovnání se středním absolutním rozdílem. Když je aritmetický průměr konečný, bude absolutní průměrný rozdíl také konečný, i když je směrodatná odchylka nekonečná. Viz příklady pro některá konkrétní srovnání.
Nedávno představený směrodatná odchylka vzdálenosti hraje podobnou roli jako průměrný absolutní rozdíl, ale směrodatná odchylka vzdálenosti funguje se středovými vzdálenostmi. Viz také E-statistiky.
Ukázkové odhady
Pro náhodný vzorek S z náhodné proměnné X, skládající se z n hodnoty yistatistika
je konzistentní a objektivní odhadce MD (X). Statistika:
je konzistentní odhadce RMD (X), ale není obecně objektivní.
Intervaly spolehlivosti pro RMD (X) lze vypočítat pomocí technik vzorkování bootstrap.
Obecně neexistuje objektivní odhad RMD (X), zčásti kvůli obtížnosti nalezení nezaujatého odhadu pro vynásobení inverzí průměru. Například i tam, kde je známo, že je vzorek odebrán z náhodné proměnné X(p) za neznámé p, a X(p) − 1 má Bernoulliho distribuce, aby Pr (X(p) = 1) = 1 − p a Pr (X(p) = 2) = p, pak
- RMD (X(p)) = 2p(1 − p)/(1 + p).
Ale očekávaná hodnota jakéhokoli odhadce R(S) RMD (X(p)) bude ve tvaru:[Citace je zapotřebí ]
Kde r i jsou konstanty. Takže E (R(S)) se nikdy nemůže rovnat RMD (X(p)) pro všechny p mezi 0 a 1.
Příklady
Rozdělení | Parametry | Znamenat | Standardní odchylka | Střední absolutní rozdíl | Relativní průměrný absolutní rozdíl |
---|---|---|---|---|---|
Kontinuální uniforma | |||||
Normální | ; | ||||
Exponenciální | |||||
Pareto | ; | ext {pro} k> 2 | |||
Gama | ; | † | † | ||
Gama | ; | ||||
Gama | ; | ||||
Gama | ; | ||||
Gama | ; | ||||
Bernoulli | |||||
Studentské t, 2 d.f. | nedefinováno |
Viz také
Reference
- ^ Yitzhaki, Shlomo (2003). „Giniho průměrný rozdíl: vynikající míra variability pro nenormální distribuce“ (PDF). Metron International Journal of Statistics. Springer Verlag. 61 (2): 285–316.
- Xu, Kuan (leden 2004). „Jak se vyvinula literatura o Giniho indexu za posledních 80 let?“ (PDF). Katedra ekonomie, Dalhousie University. Citováno 2006-06-01. Citovat deník vyžaduje
| deník =
(Pomoc) - Gini, Corrado (1912). Variabilità e Mutabilità. Bologna: Tipografia di Paolo Cuppini.
- Gini, Corrado (1921). „Měření nerovnosti a příjmů“. Ekonomický deník. 31 (121): 124–126. doi:10.2307/2223319. JSTOR 2223319.
- Chakravarty, S. R. (1990). Čísla etického sociálního indexu. New York: Springer-Verlag.
- Mills, Jeffrey A .; Zandvakili, Sourushe (1997). "Statistická inference pomocí bootstrappingu pro měření nerovnosti". Journal of Applied Econometrics. 12 (2): 133–150. CiteSeerX 10.1.1.172.5003. doi:10.1002 / (SICI) 1099-1255 (199703) 12: 2 <133 :: AID-JAE433> 3.0.CO; 2-H.
- Lomnicki, Z. A. (1952). „Standardní chyba Giniho průměrného rozdílu“. Annals of Mathematical Statistics. 23 (4): 635–637. doi:10.1214 / aoms / 1177729346.
- Nair, USA (1936). "Standardní chyba Giniho průměrného rozdílu". Biometrika. 28 (3–4): 428–436. doi:10.1093 / biomet / 28.3-4.428.
- Yitzhaki, Shlomo (2003). „Gini's Mean difference: a superior measure of variability for non-normal distributions“ (PDF). Metron - International Journal of Statistics. 61: 285–316.