Invariantní odhad - Invariant estimator

v statistika, pojem bytí invariantní odhad je kritérium, které lze použít k porovnání vlastností různých odhady pro stejné množství. Jedná se o způsob formalizace myšlenky, že odhadce by měl mít určité intuitivně přitažlivé vlastnosti. Přesněji řečeno, „invariantní“ by znamenalo, že samotné odhady se nezmění, když se měření i parametry transformují kompatibilním způsobem, ale význam byl rozšířen, aby se odhady mohly vhodnými způsoby změnit pomocí těchto transformací.[1] Termín ekvivariantní odhad se používá ve formálních matematických kontextech, které obsahují přesný popis vztahu způsobu, jakým se odhad odhaduje v reakci na změny v datové sadě a parametrizaci: odpovídá použití „ekvivariance „v obecnější matematice.

Obecné nastavení

Pozadí

v statistická inference, existuje několik přístupů k teorie odhadu které lze použít k okamžitému rozhodnutí, jaké odhady by měly být použity podle těchto přístupů. Například nápady od Bayesovský závěr by vedlo přímo k Bayesovské odhady. Podobně teorie klasické statistické inference může někdy vést k silným závěrům o tom, jaký odhadce by měl být použit. Užitečnost těchto teorií však závisí na úplném předepsání statistický model a může také záviset na tom, zda je k určení odhadce relevantní funkce ztráty. Tak a Bayesovská analýza může být provedeno, což vede k zadní distribuci relevantních parametrů, ale použití specifické funkce nebo funkce ztráty může být nejasné. Myšlenky invariance lze poté aplikovat na úkol shrnutí zadní distribuce. V ostatních případech se statistické analýzy provádějí bez plně definovaného statistického modelu, nebo nelze klasickou teorii statistické inference snadno použít, protože uvažovaná skupina modelů není takovým způsobem přístupná. Kromě těchto případů, kdy obecná teorie nepředepisuje odhadce, lze koncept invariance odhadce použít při hledání odhadů alternativních forem, buď pro jednoduchost použití odhadce, nebo pro odhad robustní.

Koncept invariance se někdy používá sám o sobě jako způsob výběru mezi odhady, ale není to nutně definitivní. Například požadavek invariance může být neslučitelný s požadavkem, že odhadce být průměrný-nezaujatý; na druhé straně kritérium střední nestrannost je definována z hlediska distribuce vzorkování odhadce a je tak invariantní při mnoha transformacích.

Jedno použití konceptu invariance je tam, kde je navržena třída nebo skupina odhadů a mezi nimi musí být vybrána konkrétní formulace. Jedním z postupů je uložení příslušných invariantních vlastností a poté nalezení formulace v této třídě, která má nejlepší vlastnosti, což vede k tomu, co se nazývá optimální invariantní odhad.

Některé třídy invariantních odhadů

Existuje několik typů transformací, které jsou užitečné při řešení invariantních odhadů. Každý z nich vede ke třídě odhadů, které jsou invariantní k těmto konkrétním typům transformace.

  • Shift invariance: Pomyslně, odhady a parametr umístění by měl být neměnný jednoduchým posunům datových hodnot. Pokud jsou všechny hodnoty dat zvýšeny o danou částku, měl by se odhad změnit o stejnou částku. Při zvažování odhadu pomocí a vážený průměr, tento požadavek invariance okamžitě znamená, že váhy by se měly rovnat jedné. Zatímco stejný výsledek je často odvozen od požadavku na nezaujatost, použití „invariance“ nevyžaduje existenci střední hodnoty a vůbec nevyužívá žádné rozdělení pravděpodobnosti.
  • Scale invariance: Všimněte si, že toto téma o invariance parametru scale odhadce nelze zaměňovat s obecnějším škálová invariance o chování systémů za agregovaných vlastností (ve fyzice).
  • Invariance transformace parametrů: Zde se transformace vztahuje pouze na parametry. Koncept zde spočívá v tom, že z dat a modelu, který zahrnuje parametr θ, by měl být v podstatě stejný závěr, jaký by byl proveden ze stejných dat, pokud by model používal parametr φ, kde φ je individuální transformace θ, φ =h(θ). Podle tohoto typu invariance by výsledky z odhadů invariantních transformací měly také souviset s φ =h(θ). Odhady maximální pravděpodobnosti mít tuto vlastnost, když je transformace monotóní. Ačkoli asymptotické vlastnosti odhadce mohou být neměnné, malé vlastnosti vzorku se mohou lišit a je třeba odvodit konkrétní distribuci.[2]
  • Permutační invariance: Kde lze sadu datových hodnot reprezentovat statistickým modelem, z něhož jsou výsledkem nezávislé a identicky distribuované náhodné proměnné, je rozumné zavést požadavek, aby jakýkoli odhadce jakékoli vlastnosti společné distribuce měl být permutačně invariantní: konkrétně to, že odhadce, považovaný za funkci sady datových hodnot, by se neměl měnit, pokud jsou položky dat vyměňovány v datové sadě.

Kombinace permutační invariance a invariance polohy pro odhad umístění parametru z nezávislé a identicky distribuované datová sada používající vážený průměr znamená, že váhy by měly být identické a součtem jedné. Samozřejmě mohou být vhodnější jiné odhady než vážený průměr.

Optimální invariantní odhady

V tomto nastavení dostaneme sadu měření který obsahuje informace o neznámém parametru . Měření jsou modelovány jako a vektorová náhodná proměnná mít a funkce hustoty pravděpodobnosti což závisí na vektoru parametru .

Problém je odhadnout daný . Odhad označený , je funkcí měření a patří do sady . Kvalitu výsledku definuje a funkce ztráty který určuje a riziková funkce . Sady možných hodnot , , a jsou označeny , , a , resp.

V klasifikaci

v statistická klasifikace, pravidlo, které přiřazuje třídu nové datové položce, lze považovat za speciální typ odhadce. Při formulování lze uplatnit řadu úvah typu invariance předchozí znalosti pro rozpoznávání vzorů.

Matematické nastavení

Definice

An invariantní odhad je odhad, který se řídí následujícími dvěma pravidly:[Citace je zapotřebí ]

  1. Princip racionální invariance: Akce přijatá v rozhodovacím problému by neměla záviset na transformaci použitého měření
  2. Princip invariance: Pokud mají dva problémy s rozhodováním stejnou formální strukturu (pokud jde o , , a ), pak by mělo být v každém problému použito stejné rozhodovací pravidlo.

Chcete-li formálně definovat invariantní nebo ekvivariantní odhad, je nejprve třeba provést některé definice týkající se skupin transformací. Nechat označit soubor možných vzorků dat. A skupina transformací z , bude označen , je sada (měřitelná) 1: 1 a na transformace do sebe, která splňuje následující podmínky:

  1. Li a pak
  2. Li pak , kde (To znamená, že každá transformace má ve skupině inverzi.)
  3. (tj. došlo k transformaci identity )

Datové sady a v jsou ekvivalentní, pokud pro některé . Všechny ekvivalentní body tvoří třída ekvivalence Takové třídě ekvivalence se říká obíhat (v ). The obíhat, , je sada .Li se skládá z jediné oběžné dráhy se říká, že je tranzitivní.

Rodina hustot je podle skupiny invariantní ve skupině pokud pro každého a existuje jedinečný takhle má hustotu . bude označeno .

Li je neměnný ve skupině pak funkce ztráty je řekl, aby byl neměnný pod pokud pro každého a existuje takhle pro všechny . Transformovaná hodnota bude označen .

Ve výše uvedeném je skupina transformací z pro sebe a je skupina transformací z pro sebe.

Problém odhadu je neměnný (ekvivariantní) pod pokud existují tři skupiny jak je definováno výše.

Pro problém odhadu, který je neměnný pod , odhadce je invariantní odhad pod pokud pro všechny a ,

Vlastnosti

  1. Funkce rizika invariantního odhadce, , je na oběžných drahách konstantní . Ekvivalentně pro všechny a .
  2. Riziková funkce invariantního odhadce s tranzitivem je konstantní.

Pro daný problém se invariantní odhadce s nejnižším rizikem říká „nejlepší odhadce invariantu“. Nejlepší invariantní odhad nelze vždy dosáhnout. Zvláštní případ, kterého lze dosáhnout, je případ, kdy je tranzitivní.

Příklad: parametr umístění

Předpokládat je parametr umístění, pokud hustota je ve formě . Pro a , problém je neměnný pod . Invariantní odhad v tomto případě musí vyhovovat

má tedy formu (). je tranzitivní na s tím se riziko nemění : to znamená, . Nejlepší invariantní odhad je ten, který přináší riziko na minimum.

V případě, že L je čtvercová chyba

Pitmanův odhad

Problém odhadu je ten má hustotu , kde θ je parametr, který se má odhadnout, a kde funkce ztráty je . Tento problém je neměnný s následujícími (doplňkovými) transformačními skupinami:

Nejlepší odhad invariantů je ten, který minimalizuje

a toto je Pitmanova odhadce (1939).

Výsledkem je případ ztráty druhé mocniny

Li (tj vícerozměrné normální rozdělení s nezávislými komponentami rozptylu jednotek)

Li (nezávislé komponenty mající a Cauchyovo rozdělení s parametrem měřítka σ) pak, Výsledkem však je

s

Reference

  1. ^ viz část 5.2.1 v Gourieroux, C. a Monfort, A. (1995). Statistika a ekonometrické modely, objem 1. Cambridge University Press.
  2. ^ Gouriéroux a Monfort (1995)
  • Berger, James O. (1985). Teorie statistického rozhodování a Bayesova analýza (2. vyd.). New York: Springer-Verlag. ISBN  0-387-96098-8. PAN  0804611.[stránka potřebná ]
  • Freue, Gabriela V. Cohen (2007). Msgstr "Pitmanův odhad Cauchyho parametru umístění". Journal of Statistical Planning and Inference. 137: 1900–1913. doi:10.1016 / j.jspi.2006.05.002.
  • Pitman, E.J.G. (1939). Msgstr "Odhad umístění a parametrů měřítka spojité populace jakékoli dané formy". Biometrika. 30 (3/4): 391–421. doi:10.1093 / biomet / 30.3-4.391. JSTOR  2332656.
  • Pitman, E.J.G. (1939). "Testy hypotéz týkajících se umístění a parametrů měřítka". Biometrika. 31 (1/2): 200–215. doi:10.1093 / biomet / 31.1-2.200. JSTOR  2334983.