Waldův test - Wald test
v statistika, Waldův test (pojmenoval podle Abraham Wald ) hodnotí omezení na statistické parametry na základě vážené vzdálenosti mezi neomezený odhad a jeho předpokládaná hodnota pod nulová hypotéza, kde váha je přesnost odhadu.[1][2] Čím větší je tato vážená vzdálenost, tím méně je pravděpodobné, že omezení platí. Zatímco distribuce konečných vzorků Waldovy testy jsou obecně neznámé,[3] má asymptotické χ2-rozdělení podle nulové hypotézy skutečnost, kterou lze použít k určení statistická významnost.[4]
Spolu s Lagrangeův multiplikátor a test poměru pravděpodobnosti, Waldův test je jedním ze tří klasických přístupů k testování hypotéz. Výhodou Waldova testu oproti ostatním dvěma je, že vyžaduje pouze odhad neomezeného modelu, který snižuje výpočetní zátěž ve srovnání s testem pravděpodobnosti. Hlavní nevýhodou však je, že (v konečných vzorcích) není invariantní ke změnám v reprezentaci nulové hypotézy; jinými slovy algebraicky ekvivalentní výrazy nelineárního omezení parametrů může vést k různým hodnotám statistiky testu.[5][6] Je to proto, že Waldova statistika je odvozena z a Taylorova expanze,[7] a různé způsoby psaní ekvivalentních nelineárních výrazů vedou k netriviálním rozdílům v odpovídajících Taylorových koeficientech.[8] Další aberace, známá jako Hauck-Donnerův efekt, se může objevit v binomické modely když je odhadovaný (neomezený) parametr blízko k hranice z prostor parametrů - například přizpůsobená pravděpodobnost je extrémně blízká nule nebo jedné - což má za následek, že Waldův test již nebude monotónně roste ve vzdálenosti mezi neomezeným a omezujícím parametrem.[9][10]
Matematické detaily
Podle Waldova testu odhad který byl nalezen jako maximalizující argument neomezeného funkce pravděpodobnosti je porovnána s předpokládanou hodnotou . Zejména hranatý rozdíl je váženo zakřivením funkce logaritmické pravděpodobnosti.
Vyzkoušejte jeden parametr
Pokud hypotéza zahrnuje pouze omezení jednoho parametru, má Waldova statistika následující podobu:
který podle nulové hypotézy následuje po asymptotickém χ2-distribuce s jedním stupněm svobody. Druhou odmocninu Waldovy statistiky s jedním omezením lze chápat jako (pseudo) t-poměr to však ve skutečnosti není t-distribuováno s výjimkou zvláštního případu lineární regrese s normálně distribuováno chyby.[11] Obecně jde o asymptotiku z rozdělení.[12]
kde je standardní chyba odhadu maximální věrohodnosti (MLE), druhá odmocnina rozptylu. Existuje několik způsobů, jak důsledně odhadovat the varianční matice což v konečných vzorcích vede k alternativním odhadům standardních chyb a souvisejícím statistikám testů a str-hodnoty.[13]
Test (y) na více parametrech
Waldův test lze použít k testování jedné hypotézy o více parametrech, stejně jako k testování společného více hypotéz u jednoho / více parametrů. Nechat být naším odhadcem vzorků P parametrů (tj. je P. 1 vektor), který má asymptoticky sledovat normální rozdělení s kovarianční matice PROTI, Test Q hypotéz na P parametrech je vyjádřen Q P matice R:
Statistika testu je:
kde je odhad kovarianční matice.[14]
Předpokládat . Pak, tím Slutského věta a podle vlastností normální distribuce, vynásobením R má distribuci:
Připomínáme, že kvadratická forma normálního rozdělení má a Distribuce chí-kvadrát:
Přeskupení n konečně dává:
Co když kovarianční matice není známa a priori a je třeba ji odhadnout z údajů? Pokud máme konzistentní odhad z nezávislostí odhadce kovariancí a výše uvedené rovnice máme:
Nelineární hypotéza
Ve standardní formě se Waldův test používá k testování lineárních hypotéz, které mohou být reprezentovány jedinou maticí R. Pokud si přejete otestovat nelineární hypotézu formy:
Statistika testu se stává:
kde je derivát c hodnoceno odhadcem vzorku. Tento výsledek se získá pomocí delta metoda, který používá aproximaci rozptylu prvního řádu.
Ne invariance k opětovným parametrizacím
Skutečnost, že se používá aproximace rozptylu, má tu nevýhodu, že Waldova statistika není invariantní k nelineární transformaci / reparametrizaci hypotézy: může poskytnout různé odpovědi na stejnou otázku v závislosti na tom, jak je otázka formulována .[15][5] Například dotaz, zda R = 1 je to samé jako ptát se, zda logR = 0; ale Waldova statistika pro R = 1 není totéž jako Waldova statistika pro logR = 0 (protože obecně neexistuje čistý vztah mezi standardními chybami R a přihlaste seR, takže je třeba jej aproximovat).[16]
Alternativy k Waldovu testu
K Waldovu testu existuje několik alternativ, jmenovitě test poměru pravděpodobnosti a Lagrangeův multiplikátorový test (také známý jako bodový test). Robert F. Engle ukázaly, že tyto tři testy, Waldův test, test poměru pravděpodobnosti a Lagrangeův multiplikátorový test jsou asymptoticky ekvivalentní.[17] I když jsou asymptoticky ekvivalentní, v konečných vzorcích by mohli nesouhlasit natolik, aby vedly k odlišným závěrům.
Existuje několik důvodů, proč upřednostnit test poměru pravděpodobnosti nebo Lagrangeův multiplikátor před Waldovým testem:[18][19][20]
- Neinvariance: Jak již bylo uvedeno výše, Waldův test není neměnný vůči reparametrizaci, zatímco testy poměru pravděpodobnosti dají přesně stejnou odpověď, ať už pracujeme s R, logR nebo jakýkoli jiný monotóní transformaceR.[5]
- Druhým důvodem je, že Waldův test používá dvě aproximace (že známe standardní chybu a že distribuce je χ2 ), zatímco test poměru pravděpodobnosti používá jednu aproximaci (že rozdělení je χ.)2).[Citace je zapotřebí ]
- Waldův test vyžaduje odhad podle alternativní hypotézy odpovídající „úplnému“ modelu. V některých případech je model při nulové hypotéze jednodušší, takže je možné použít přednostně bodový test (nazývaný také Lagrangeův multiplikační test), který má tu výhodu, že jej lze formulovat v situacích, kdy je obtížné odhadnout variabilitu; např. the Cochran – Mantel – Haenzelův test je bodový test.[21]
Viz také
Reference
- ^ Fahrmeir, Ludwig; Kneib, Thomas; Lang, Stefan; Marx, Brian (2013). Regrese: Modely, metody a aplikace. Berlín: Springer. str. 663. ISBN 978-3-642-34332-2.
- ^ Ward, Michael D.; Ahlquist, John S. (2018). Maximum Likelihood for Social Science: Strategies for Analysis. Cambridge University Press. str. 36. ISBN 978-1-316-63682-4.
- ^ Martin, Vance; Hurn, Stan; Harris, David (2013). Ekonometrické modelování s časovými řadami: Specifikace, odhad a testování. Cambridge University Press. str. 138. ISBN 978-0-521-13981-6.
- ^ Davidson, Russell; MacKinnon, James G. (1993). „Metoda maximální pravděpodobnosti: základní pojmy a notace“. Odhad a závěr v ekonometrii. New York: Oxford University Press. str. 89. ISBN 0-19-506011-3.
- ^ A b C Gregory, Allan W .; Veall, Michael R. (1985). „Formulování Waldových testů nelineárních omezení“. Econometrica. 53 (6): 1465–1468. JSTOR 1913221.
- ^ Phillips, P. C. B.; Park, Joon Y. (1988). „O formulaci Waldových testů nelineárních omezení“. Econometrica. 56 (5): 1065–1083. JSTOR 1911359.
- ^ Hayashi, Fumio (2000). Ekonometrie. Princeton: Princeton University Press. 489–491. ISBN 1-4008-2383-8.,
- ^ Lafontaine, Francine; White, Kenneth J. (1986). "Získání jakékoli Wald statistiky, kterou chcete". Ekonomické dopisy. 21 (1): 35–40. doi:10.1016/0165-1765(86)90117-5.
- ^ Hauck, Walter W., Jr.; Donner, Allan (1977). „Waldův test aplikovaný na hypotézy v analýze Logit“. Journal of the American Statistical Association. 72 (360a): 851–853. doi:10.1080/01621459.1977.10479969.
- ^ King, Maxwell L .; Goh, Kim-Leng (2002). „Vylepšení Waldova testu“. Příručka aplikované ekonometrie a statistické inference. New York: Marcel Dekker. str. 251–276. ISBN 0-8247-0652-8.
- ^ Cameron, A. Colin; Trivedi, Pravin K. (2005). Mikroekonomie: Metody a aplikace. New York: Cambridge University Press. str. 137. ISBN 0-521-84805-9.
- ^ Davidson, Russell; MacKinnon, James G. (1993). „Metoda maximální pravděpodobnosti: základní pojmy a notace“. Odhad a závěr v ekonometrii. New York: Oxford University Press. str. 89. ISBN 0-19-506011-3.
- ^ Martin, Vance; Hurn, Stan; Harris, David (2013). Ekonometrické modelování s časovými řadami: Specifikace, odhad a testování. New York: Cambridge University Press. str. 129. ISBN 978-0-521-13981-6.
- ^ Harrell, Frank E., Jr. (2001). „Oddíl 9.3.1“. Strategie regresního modelování. New York: Springer-Verlag. ISBN 0387952322.
- ^ Fears, Thomas R .; Benichou, Jacques; Gail, Mitchell H. (1996). „Připomenutí omylu Waldovy statistiky“. Americký statistik. 50 (3): 226–227. doi:10.1080/00031305.1996.10474384.
- ^ Critchley, Frank; Marriott, Paul; Salmon, Mark (1996). „O diferenciální geometrii Waldova testu s nelineárními omezeními“. Econometrica. 64 (5): 1213–1222. JSTOR 2171963.
- ^ Engle, Robert F. (1983). „Waldovy testy, koeficient pravděpodobnosti a Lagrangeovy multiplikační testy v ekonometrii“. In Intriligator, M. D .; Griliches, Z. (eds.). Příručka ekonometrie. II. Elsevier. 796–801. ISBN 978-0-444-86185-6.
- ^ Harrell, Frank E., Jr. (2001). „Oddíl 9.3.3“. Strategie regresního modelování. New York: Springer-Verlag. ISBN 0387952322.
- ^ Collett, David (1994). Modelování údajů o přežití v lékařském výzkumu. London: Chapman & Hall. ISBN 0412448807.
- ^ Pawitan, Yudi (2001). Ve vší pravděpodobnosti. New York: Oxford University Press. ISBN 0198507658.
- ^ Agresti, Alan (2002). Kategorická analýza dat (2. vyd.). Wiley. str.232. ISBN 0471360937.
Další čtení
- Greene, William H. (2012). Ekonometrická analýza (Sedmé mezinárodní vydání). Boston: Pearson. str.155 –161. ISBN 978-0-273-75356-8.
- Kmenta, Jan (1986). Prvky ekonometrie (Druhé vydání.). New York: Macmillan. str.492–493. ISBN 0-02-365070-2.
- Thomas, R. L. (1993). Úvodní ekonometrie: Teorie a aplikace (Druhé vydání.). London: Longman. str. 73–77. ISBN 0-582-07378-2.