Oblast důvěry - Confidence region
v statistika, a oblast důvěry je vícerozměrné zobecnění a interval spolehlivosti. Je to sada bodů v n-dimenzionální prostor, často reprezentovaný jako elipsoid kolem bodu, který je odhadovaným řešením problému, i když se mohou objevit i jiné tvary.
Výklad
Oblast spolehlivosti se vypočítá takovým způsobem, že pokud by se sada měření opakovala mnohokrát a oblast spolehlivosti se počítala stejným způsobem pro každou sadu měření, pak by určité procento času (např. 95%) oblast spolehlivosti zahrňte bod představující „skutečné“ hodnoty souboru odhadovaných proměnných. Pokud však určité předpoklady o předchozí pravděpodobnosti jsou vyrobeny, to dělá ne znamená, že když byla vypočítána jedna oblast spolehlivosti, existuje 95% pravděpodobnost, že „skutečné“ hodnoty leží uvnitř oblasti, protože nepředpokládáme žádné konkrétní rozdělení pravděpodobnosti „skutečných“ hodnot a můžeme nebo nemusíme mít další informace o tom, kde pravděpodobně budou ležet.
Případ nezávislých, identicky normálně distribuovaných chyb
Předpokládejme, že jsme našli řešení na následující předurčený problém:
kde Y je n-dimenzionální vektor sloupce obsahující pozorované hodnoty závislá proměnná, X je n-podle-str matice sledovaných hodnot nezávislé proměnné (který může představovat fyzický model), o kterém se předpokládá, že je přesně znám, je sloupcový vektor obsahující str - parametry, které mají být odhadnuty, a - je n-dimenzionální sloupcový vektor chyb, o kterých se předpokládá, že jsou nezávisle distribuovány s normální distribuce s nulovým průměrem a každý se stejnou neznámou odchylkou .
Spoj 100 (1 -α)% oblast spolehlivosti pro prvky je reprezentován množinou hodnot vektoru b které splňují následující nerovnost:[1]
kde proměnná b představuje jakýkoli bod v oblasti spolehlivosti, str je počet parametrů, tj. počet prvků vektoru je vektor odhadovaných parametrů a s2 je snížený chi-kvadrát, an nestranný odhad z rovná
Dále, F je kvantilová funkce z F-distribuce, s str a stupně svobody, je statistická významnost úroveň a symbol znamená přemístit z .
Výraz lze přepsat jako:
kde je kovarianční matice s měřítkem nejmenších čtverců .
Výše uvedená nerovnost definuje elipsoidní region v str-rozměrný kartézský prostor parametrů Rstr. Střed elipsoidu je při odhadu . Podle Press et al. Je snadnější vykreslit elipsoid poté, co to uděláte rozklad singulární hodnoty. Délky os elipsoidu jsou úměrné převráceným hodnotám na úhlopříčkách úhlopříčné matice a směry těchto os jsou dány řádky 3. matice rozkladu.
Vážené a zobecněné nejmenší čtverce
Nyní zvažte obecnější případ, kdy některé odlišné prvky znát nenulovou hodnotu kovariance (jinými slovy, chyby v pozorováních nejsou nezávisle distribuovány) a / nebo standardní odchylky chyb nejsou všechny stejné. Předpokládejme kovarianční matici je , kde PROTI je n-podle-n nesingulární matice, která se rovnala v konkrétnějším případě zpracovaném v předchozí části, (kde Já je matice identity,) ale zde je povoleno mít nenulovou hodnotu mimo diagonální prvky představující kovarianci párů jednotlivých pozorování a nemusí mít nutně všechny diagonální prvky stejné.
Je možné najít[2] nesingulární symetrická matice P takhle
V důsledku, P je druhá odmocnina kovarianční matice PROTI.
Problém nejmenších čtverců
pak lze transformovat vynásobením každého termínu převrácenou hodnotou P, formování nové formulace problému
kde
- a
Společná oblast spolehlivosti pro parametry, tj. Pro prvky , je pak ohraničen elipsoidem daným vztahem:[3]
Tady F představuje procentní bod z F-rozdělení a množství str a n-p jsou stupně svobody které jsou parametry této distribuce.
Nelineární problémy
Pro jakékoli rozdělení pravděpodobnosti lze definovat oblasti spolehlivosti. Experimentátor může zvolit úroveň významnosti a tvar oblasti a poté velikost oblasti určí rozdělení pravděpodobnosti. Přirozenou volbou je použít jako hranici množinu bodů s konstantou (chi-kvadrát ) hodnoty.
Jedním z přístupů je použít lineární aproximaci nelineárního modelu, což může být blízká aproximace v blízkosti řešení, a poté použít analýzu pro lineární problém a najít přibližnou oblast spolehlivosti. To může být rozumný přístup, pokud oblast spolehlivosti není příliš velká a druhé deriváty modelu také nejsou příliš velké.
Bootstrapping Lze také použít přístupy.[4]
Vidět Metodiky kvantifikace nejistoty pro šíření dopředné nejistoty pro související pojmy.
Viz také
Poznámky
![]() | Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.Září 2011) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Reference
- Draper, N.R .; H. Smith (1981) [1966]. Aplikovaná regresní analýza (2. vyd.). USA: John Wiley and Sons Ltd. ISBN 0-471-02995-5.
- Press, W.H .; S.A. Teukolsky; W.T. Vetterling; B.P. Flannery (1992) [1988]. Numerické recepty v C: Umění vědeckých výpočtů (2. vyd.). Cambridge UK: Cambridge University Press.