v statistika, Neyman – Pearson lemma byl představen Jerzy Neyman a Egon Pearson v příspěvku v roce 1933.[1] Ukazuje, že test poměru pravděpodobnosti je většina silný test, mezi všemi možnými statistickými testy.
Tvrzení
Předpokládejme, že jeden provádí a test hypotézy mezi dvěma jednoduché hypotézy
a
za použití test poměru pravděpodobnosti s prahem poměru pravděpodobnosti
, který odmítá
ve prospěch
na úrovni významnosti

kde

a
je funkce pravděpodobnosti. Potom Neymanovo-Pearsonovo lemma uvádí, že poměr pravděpodobnosti,
, je většina silný test na úroveň významnosti
.
Pokud je test nejsilnější pro všechny
, říká se, že je rovnoměrně nejsilnější (UMP) pro alternativy v sadě
.
V praxi se míra pravděpodobnosti se často používá přímo pro konstrukci testů - viz test poměru pravděpodobnosti. Lze jej však také použít k navrhování konkrétních statistik testů, které by mohly být zajímavé, nebo k navrhování zjednodušených testů - za tímto účelem se uvažuje o algebraické manipulaci s poměrem, aby se zjistilo, zda v něm existují klíčové statistiky související s velikostí poměru ( tj. zda velká statistika odpovídá malému poměru nebo velké statistice).
Důkaz
Definujte oblast odmítnutí nulové hypotézy pro Neyman – Pearsonův (NP) test jako

kde
je vybrán tak, aby 
Jakýkoli alternativní test bude mít jinou oblast odmítnutí, kterou označujeme
.
Pravděpodobnost, že data spadají do kterékoli oblasti
nebo
daný parametr
je

Pro test s kritickou oblastí
mít úroveň významnosti
, to musí být pravda
, proto

Bude užitečné je rozdělit na integrály v různých oblastech:

kde
je doplněk regionu RNastavení
, tyto dva výrazy a výše uvedená nerovnost to přinášejí

Pravomoci těchto dvou testů jsou
a
, a rádi bychom dokázali, že:

Jak je však uvedeno výše, odpovídá to:

v následujícím textu ukážeme, že výše nerovnost drží:
![{ displaystyle { begin {aligned} operatorname {P} (R _ { text {NP}} cap R _ { text {A}} ^ {c} mid theta _ {1}) & = int _ {R _ { text {NP}} cap R _ { text {A}} ^ {c}} { mathcal {L}} ( theta _ {1} mid x) , operatorname {d} x [4pt] & geqslant { frac {1} { eta}} int _ {R _ { text {NP}} cap R _ { text {A}} ^ {c}} { mathcal {L}} ( theta _ {0} mid x) , operatorname {d} x && { text {podle definice}} R _ { text {NP}} { text {to platí pro jeho podmnožinu }} [4pt] & = { frac {1} { eta}} operatorname {P} (R _ { text {NP}} cap R _ { text {A}} ^ {c} mid theta _ {0}) && { text {podle definice}} operatorname {P} (R mid theta) [4pt] & geqslant { frac {1} { eta}} operatorname {P} (R _ { text {NP}} ^ {c} cap R _ { text {A}} mid theta _ {0}) [4pt] & = { frac {1} { eta}} int _ {R _ { text {NP}} ^ {c} cap R _ { text {A}}} { mathcal {L}} ( theta _ {0} mid x) , operatorname {d} x [4pt] &> int _ {R _ { text {NP}} ^ {c} cap R _ { text {A}}} { mathcal {L}} ( theta _ {1} mid x) , operatorname {d} x && { text {podle definice}} R _ { text {NP}} { text {to platí pro jeho doplněk a dílčí doplněk sady}} [4pt] & = operatorname {P} (R _ { text {NP}} ^ {c} cap R _ { text {A}} mid theta _ {1}) end { zarovnaný}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f5ba5c5152d6a5e6f86f12b33ec442d954d2505f)
Příklad
Nechat
být náhodný vzorek z
distribuce, kde průměr
je známo, a předpokládejme, že si přejeme otestovat
proti
. Pravděpodobnost této sady normálně distribuováno data jsou

Můžeme vypočítat míra pravděpodobnosti najít klíčovou statistiku v tomto testu a jeho vliv na výsledek testu:

Tento poměr závisí pouze na procházejících datech
. Proto podle lemu Neyman – Pearson nejvíce silný test tohoto typu hypotéza protože tato data budou záviset pouze na
. Inspekcí také zjistíme, že pokud
, pak
je klesající funkce z
. Měli bychom tedy odmítnout
-li
je dostatečně velká. Prahová hodnota pro odmítnutí závisí na velikost testu. V tomto příkladu může být statistika testu ukázána jako škálovaná náhodná proměnná s distribucí chí-kvadrát a lze získat přesnou kritickou hodnotu.
Aplikace v ekonomii
Varianta Neymanova-Pearsonova lemmatu našla uplatnění ve zdánlivě nesouvisející oblasti ekonomiky hodnoty půdy. Jedním ze základních problémů v teorie spotřebitele vypočítává funkce poptávky spotřebitele vzhledem k cenám. Zejména s ohledem na heterogenní pozemek, cenovou míru nad zemí a subjektivní míru užitku nad zemí je problémem spotřebitele spočítat nejlepší pozemek, který může koupit - tj. Pozemek s největším užitkem, jehož cena je nanejvýš jeho rozpočet. Ukázalo se, že tento problém je velmi podobný problému hledání nejsilnějšího statistického testu, a proto lze použít Neymanovo-Pearsonovo lema.[2]
Využití v elektrotechnice
Lymma Neyman – Pearson je docela užitečná elektronika, zejména při navrhování a používání radar systémy, digitální komunikační systémy a v zpracování signálu systémy. V radarových systémech se Neymanovo-Pearsonovo lema používá při prvním nastavení rychlosti zmeškané detekce na požadovanou (nízkou) úroveň a poté minimalizovat rychlost falešné poplachy, nebo naopak. Falešné poplachy ani zmeškané detekce nelze nastavit na libovolně nízké rychlosti, včetně nuly. Všechno výše uvedené platí i pro mnoho systémů při zpracování signálu.
Využití ve fyzice částic
Neymanovo-Pearsonovo lema se aplikuje na konstrukci analyticky specifických poměrů pravděpodobnosti, zvyklých např. test na podpisy nová fyzika proti nominálnímu Standardní model predikce v souborech dat o srážkách proton-proton shromážděných na LHC.
Viz také
Reference
- E. L. Lehmann, Joseph P. Romano, Testování statistických hypotéz, Springer, 2008, s. 60
externí odkazy