Teorie odhadu - Estimation theory
Teorie odhadu je pobočkou statistika která se zabývá odhadováním hodnot parametry na základě naměřených empirických dat, která mají náhodnou složku. Parametry popisují základní fyzické nastavení takovým způsobem, že jejich hodnota ovlivňuje distribuci měřených dat. An odhadce pokusy o přiblížení neznámých parametrů pomocí měření.
V teorii odhadu se obecně uvažuje o dvou přístupech.[1]
- Pravděpodobnostní přístup (popsaný v tomto článku) předpokládá, že naměřená data jsou náhodná rozdělení pravděpodobnosti v závislosti na sledovaných parametrech
- The přístup set-membership předpokládá, že měřený datový vektor patří do sady, která závisí na vektoru parametru.
Příklady
Například je žádoucí odhadnout podíl populace voličů, kteří budou hlasovat pro konkrétního kandidáta. Tento podíl je hledaným parametrem; odhad vychází z malého náhodného vzorku voličů. Alternativně je žádoucí odhadnout pravděpodobnost hlasování voličů pro konkrétního kandidáta na základě některých demografických rysů, jako je věk.
Nebo například v radar cílem je najít rozsah objektů (letadla, čluny atd.) analýzou obousměrného tranzitního načasování přijatých ozvěn vysílaných pulsů. Vzhledem k tomu, že odražené impulsy jsou nevyhnutelně zakomponovány do elektrického šumu, jsou jejich naměřené hodnoty náhodně rozloženy, takže je třeba odhadnout dobu přechodu.
Jako další příklad v teorii elektrické komunikace jsou měření, která obsahují informace týkající se sledovaných parametrů, často spojována s a hlučný signál.
Základy
Pro daný model je zapotřebí několik statistických „složek“, aby bylo možné implementovat odhadce. První je a statistický vzorek - sada datových bodů převzatých z a náhodný vektor (RV) o velikosti N. Vložit do vektor,
Zadruhé existují M parametry
jejichž hodnoty mají být odhadnuty. Za třetí, kontinuální funkce hustoty pravděpodobnosti (pdf) nebo jeho diskrétní protějšek, funkce pravděpodobnostní hmotnosti (pmf), podkladové distribuce, která generovala data, musí být uvedena podmíněně hodnotami parametrů:
Je také možné, aby samotné parametry měly rozdělení pravděpodobnosti (např. Bayesovské statistiky ). Poté je nutné definovat Bayesovská pravděpodobnost
Po vytvoření modelu je cílem odhadnout parametry, přičemž odhady se běžně označují , kde „klobouk“ označuje odhad.
Jedním běžným odhadcem je minimální střední kvadratická chyba (MMSE) odhad, který využívá chybu mezi odhadovanými parametry a skutečnou hodnotou parametrů
jako základ optimality. Tento chybový termín se pak na druhou a očekávaná hodnota této čtvercové hodnoty je pro odhad MMSE minimalizováno.
Odhady
Mezi běžně používané odhady (metody odhadu) a témata s nimi související patří:
- Maximální pravděpodobnost odhady
- Bayesovy odhady
- Metoda momentů odhady
- Cramér – Rao vázán
- Nejmenší čtverce
- Minimální střední kvadratická chyba (MMSE), také známý jako Bayesova chyba nejmenších čtverců (BLSE)
- Maximálně a posteriori (MAPA)
- Nestranný odhad minimální odchylky (MVUE)
- Nelineární identifikace systému
- Nejlepší lineární nezaujatý odhad (MODRÝ)
- Nestranný odhad - viz zkreslení odhadu.
- Filtr částic
- Markovský řetězec Monte Carlo (MCMC)
- Kalmanův filtr a jeho různé deriváty
- Wienerův filtr
Příklady
Neznámá konstanta v aditivním bílém gaussovském šumu
Zvažte přijaté diskrétní signál, , z nezávislý Vzorky který se skládá z neznámé konstanty s aditivní bílý gaussovský šum (AWGN) s nulou znamenat a známé rozptyl (tj., Protože je známa odchylka, je jediným neznámým parametrem .
Model pro signál je pak
Dva možné (z mnoha) odhadů parametru jsou:
- který je průměr vzorku
Oba tyto odhady mají a znamenat z , což lze prokázat převzetím očekávaná hodnota každého odhadce
a
V tomto okamžiku se zdá, že tyto dva odhady fungují stejně. Rozdíl mezi nimi se však projeví při porovnání odchylek.
a
Zdá se, že průměr vzorku je lepší odhad, protože jeho rozptyl je u každého nižšíN > 1.
Maximální pravděpodobnost
Pokračování příkladu pomocí maximální pravděpodobnost odhadce, funkce hustoty pravděpodobnosti (pdf) hluku pro jeden vzorek je
a pravděpodobnost se stává ( lze myslet na )
Podle nezávislost, pravděpodobnost se stává
Užívání přirozený logaritmus pdf
a odhad maximální pravděpodobnosti je
Vezmeme první derivát funkce logaritmické pravděpodobnosti
a nastavení na nulu
Výsledkem je odhad maximální pravděpodobnosti
Z tohoto příkladu bylo zjištěno, že průměr vzorku je odhadem maximální pravděpodobnosti vzorky pevného, neznámého parametru poškozeného AWGN.
Cramér – Rao dolní mez
Chcete-li najít Cramér – Rao dolní mez (CRLB) odhadu průměrné hodnoty vzorku, je nejprve nutné najít Fisher informace číslo
a kopírování shora
Vezmeme druhou derivaci
a nalezení záporné očekávané hodnoty je triviální, protože je nyní deterministickou konstantou
Nakonec vložíme informace o Fisherovi
výsledky v
Porovnání s rozptylem průměrného vzorku (určeného dříve) ukazuje, že průměrný vzorek je rovná dolní mez Cramér – Rao pro všechny hodnoty a Jinými slovy, průměr vzorku je (nutně jedinečný) efektivní odhad, a tedy také objektivní odhad minimální odchylky (MVUE), kromě toho, že je maximální pravděpodobnost odhadce.
Maximum rovnoměrného rozdělení
Jedním z nejjednodušších netriviálních příkladů odhadu je odhad maxima jednotného rozdělení. Používá se jako praktické cvičení ve třídě a pro ilustraci základních principů teorie odhadu. Dále v případě odhadu založeného na jediném vzorku demonstruje filozofické problémy a možná nedorozumění při používání maximální pravděpodobnost odhady a funkce pravděpodobnosti.
Vzhledem k tomu, diskrétní rovnoměrné rozdělení s neznámým maximem, UMVU odhad pro maximum je dán vztahem
kde m je maximální vzorek a k je velikost vzorku, vzorkování bez výměny.[2][3] Tento problém je obecně známý jako Problém německého tanku kvůli použití maximálního odhadu na odhady německé výroby tanků v průběhu roku 2006 druhá světová válka.
Vzorec lze chápat intuitivně jako;
- "Maximum vzorku plus průměrná mezera mezi pozorováními ve vzorku",
mezera se přidává k vyrovnání záporného vychýlení maxima vzorku jako odhadu maxima populace.[poznámka 1]
To má rozptyl[2]
takže směrodatná odchylka přibližně „(populační) průměrná velikost mezery mezi vzorky; porovnat výše. To lze považovat za velmi jednoduchý případ odhad maximální vzdálenosti.
Ukázkové maximum je maximální pravděpodobnost odhadce populačního maxima, ale jak je uvedeno výše, je zaujatý.
Aplikace
Četná pole vyžadují použití teorie odhadu. Některá z těchto polí zahrnují (ale v žádném případě nejsou omezena na):
- Interpretace vědecké experimenty
- Zpracování signálu
- Klinické testy
- Názorový průzkum
- Kontrola kvality
- Telekomunikace
- Projektový management
- Softwarové inženýrství
- Teorie řízení (zejména Adaptivní ovládání )
- Systém detekce vniknutí do sítě
- Určení oběžné dráhy
Měřené údaje budou pravděpodobně předmětem hluk nebo nejistota a je to prostřednictvím statistik pravděpodobnost že optimální hledají se řešení, která by vyťažila co nejvíce informace z údajů, jak je to možné.
Viz také
- Nejlepší lineární nezaujatý odhad (MODRÝ)
- Čebyševovo centrum
- Úplnost (statistika)
- Cramér – Rao vázán
- Teorie detekce
- Účinnost (statistika)
- Odhad, Předpětí odhadu
- Algoritmus maximalizace očekávání (EM algoritmus)
- Fermiho problém
- Model šedé krabice
- Informační teorie
- Kalmanův filtr
- Spektrální analýza nejmenších čtverců
- Markovský řetězec Monte Carlo (MCMC)
- Odpovídající filtr
- Maximálně a posteriori (MAPA)
- Maximální pravděpodobnost
- Spektrální odhad maximální entropie
- Metoda momentů, zobecněná metoda momentů
- Minimální střední kvadratická chyba (MMSE)
- Nestranný odhad minimální odchylky (MVUE)
- Nelineární identifikace systému
- Obtěžující parametr
- Parametrická rovnice
- Paretův princip
- Filtr částic
- Rao – Blackwellova věta
- Pravidlo tří (statistika)
- Spektrální hustota, Odhad spektrální hustoty
- Statistické zpracování signálu
- Dostatečnost (statistika)
- Wienerův filtr
Poznámky
- ^ Ukázkové maximum nikdy není větší než maximální počet obyvatel, ale může být menší, proto je a zkreslený odhad: bude mít tendenci podcenění populační maximum.
Reference
Citace
- ^ Walter, E .; Pronzato, L. (1997). Identifikace parametrických modelů z experimentálních dat. Londýn, Anglie: Springer-Verlag.
- ^ A b Johnson, Roger (1994), „Odhad velikosti populace“, Statistika výuky, 16 (2 (léto)): 50–52, doi:10.1111 / j.1467-9639.1994.tb00688.x
- ^ Johnson, Roger (2006), „Odhad velikosti populace“, Získejte to nejlepší z výuky statistiky, archivovány z originál (PDF) 20. listopadu 2008
Zdroje
- Teorie odhadu bodu autor: E.L. Lehmann a G. Casella. (ISBN 0387985026)
- Systémové nákladové inženýrství Dale Shermon. (ISBN 978-0-566-08861-2)
- Matematická statistika a analýza dat John Rice. (ISBN 0-534-209343)
- Základy statistického zpracování signálu: teorie odhadu Steven M. Kay (ISBN 0-13-345711-7)
- Úvod do detekce a odhadu signálu autor: H. Vincent Poor (ISBN 0-387-94173-8)
- Teorie detekce, odhadu a modulace, část 1 Harry L. Van Trees (ISBN 0-471-09517-6; webová stránka )
- Optimální odhad stavu: Kalman, H-nekonečno a nelineární přístupy Dan Simon webová stránka
- Ali H. Sayed Adaptivní filtry, Wiley, NJ, 2008, ISBN 978-0-470-25388-5.
- Ali H. Sayed „Základy adaptivního filtrování, Wiley, NJ, 2003, ISBN 0-471-46126-1.
- Thomas Kailath, Ali H. Sayed, a Babak Hassibi, Lineární odhad, Prentice-Hall, NJ, 2000, ISBN 978-0-13-022464-4.
- Babak Hassibi, Ali H. Sayed, a Thomas Kailath „Neurčitý kvadratický odhad a kontrola: jednotný přístup k H2 a H Theories, Society for Industrial & Applied Mathematics (SIAM), PA, 1999, ISBN 978-0-89871-411-1.
- V.G.Voinov, M.S. Nikulin, „Nestranné odhady a jejich aplikace. Vol.1: Univariate case“, Kluwer Academic Publishers, 1993, ISBN 0-7923-2382-3.
- V.G.Voinov, M.S. Nikulin, "Nestranné odhady a jejich aplikace. Vol.2: Případ s více proměnnými", Kluwer Academic Publishers, 1996, ISBN 0-7923-3939-8.
externí odkazy
Média související s Teorie odhadu na Wikimedia Commons