Trendový test Jonckheeres - Jonckheeres trend test - Wikipedia
v statistika, Trendový test Jonckheere[1] (někdy nazývaný Jonckheere – Terpstra[2] test) je test pro objednané alternativní hypotéza v rámci designu nezávislých vzorků (mezi účastníky). Je to podobné jako u Kruskal – Wallisův test v tom nulová hypotéza je, že několik nezávislých vzorků pochází ze stejné populace. S testem Kruskal – Wallis však neexistuje apriorní uspořádání populací, ze kterých jsou vzorky odebrány. Když tam je a priori objednávání, Jonckheere test má více statistická síla než test Kruskal – Wallis. Test byl vyvinut společností Cílený Robert Jonckheere, který byl psychologem a statistikem v University College v Londýně.
Nulové a alternativní hypotézy lze pohodlně vyjádřit pomocí mediánu populace pro k populace (kde k > 2). Pronájem θi být populací medián pro iu této populace je nulová hypotéza:
Alternativní hypotéza je, že medián populace má a priori uspořádání např .:
- ≤ ≤ ≤
s alespoň jednou přísnou nerovností.
Postup
Na test lze pohlížet jako na zvláštní případ Maurice Kendall Obecnější metoda hodnostní korelace[3] a využívá Kendall S statistický. To lze vypočítat jedním ze dvou způsobů:
Metoda „přímého počítání“
- Uspořádejte vzorky v předpokládaném pořadí
- Pro každé skóre zase spočítejte, kolik skóre ve vzorcích vpravo je větší než dané skóre. Tohle je P.
- Pro každé skóre zase spočítejte, kolik skóre ve vzorcích vpravo je menší než dané skóre. Tohle je Q.
- S = P – Q
„Námořní“ metoda
- Vložit data do objednaného pohotovostní tabulka, s úrovněmi nezávislé proměnné zvyšující se zleva doprava a hodnoty závislá proměnná roste shora dolů.
- U každé položky v tabulce spočítejte všechny ostatní položky, které leží na „jihovýchodě“ konkrétní položky. Tohle je P.
- U každé položky v tabulce spočítejte všechny ostatní položky, které leží na „Jihozápad“ konkrétní položky. Tohle je Q.
- S = P – Q
Všimněte si, že v nezávislé proměnné vždy budou vazby (jednotlivci jsou „vázáni“ v tom smyslu, že jsou ve stejné skupině), ale v závislé proměnné mohou nebo nemusí být vazby. Pokud neexistují žádné vazby - nebo se vazby vyskytují v konkrétním vzorku (což nemá vliv na hodnotu statistiky testu) - přesné tabulky S jsou dostupné; například Jonckheere[1] poskytl vybrané tabulky pro hodnoty k od 3 do 6 a stejné velikosti vzorků (m) od 2 do 5. Leach představoval kritické hodnoty S pro k = 3 s velikostí vzorku v rozmezí od 2,2,1 do 5,5,5.[4]
Normální aproximace na S
The standardní normální rozdělení lze použít k přiblížení distribuce S pod nulovou hypotézou pro případy, kdy nejsou k dispozici přesné tabulky. The znamenat distribuce S bude vždy nula a za předpokladu, že mezi hodnotami ve dvou (nebo více) různých vzorcích nejsou žádné vazby rozptyl darováno
Kde n je celkový počet skóre a ti je počet skóre v i-tom vzorku. Aproximaci standardního normálního rozdělení lze zlepšit použitím korekce spojitosti: SC = |S| - 1. Tedy 1 se odečte od pozitivu S hodnota a 1 se přidá k zápornému S hodnota. Ekvivalent z-skóre je pak dán vztahem
Kravaty
Pokud jsou skóre svázána mezi hodnotami ve dvou (nebo více) různých vzorcích, neexistuje přesná tabulka pro rozdělení S a je třeba použít přiblížení k normálnímu rozdělení. V tomto případě se na hodnotu S a rozptyl je dán vztahem
kde ti je řádek mezní součet a ui mezní součet sloupců v kontingenční tabulce. The z-skóre ekvivalent je pak dán
Numerický příklad
Při částečné replikaci studie Loftuse a Palmera byli účastníci náhodně přiřazeni k jedné ze tří skupin a poté promítli film dvou aut, která do sebe narazila.[5] Po zhlédnutí filmu dostali účastníci v jedné skupině následující otázku: „O tom, jak rychle jedou auta, když se navzájem kontaktují?“ Účastníci druhé skupiny byli požádáni: „O tom, jak rychle jedou auta, když do sebe narazily?“ Účastníci třetí skupiny byli požádáni: „O tom, jak rychle jedou auta, když do sebe narazily?“ Loftus a Palmer předpovídali, že použité akční sloveso (kontaktované, narazené, rozbité) ovlivní odhady rychlosti v mílích za hodinu (mph), takže akční slovesa naznačující větší energii povedou k vyšším odhadovaným rychlostem. Byly získány následující výsledky (simulovaná data):
Kontaktováno Narazil Rozbité 10 12 20 12 18 25 14 20 27 16 22 30 mdn = 13 mdn = 19 mdn = 26
Metoda „přímého počítání“
- Ukázky jsou již v předpokládaném pořadí
- Pro každé skóre zase spočítejte, kolik skóre ve vzorcích vpravo je větší než skóre, které chcete získat P:
- P = 8 + 7 + 7 + 7 + 4 + 4 + 3 + 3 = 43
- Pro každé skóre zase spočítejte, kolik skóre ve vzorcích vpravo je menší než skóre, které chcete získat Q:
- Q = 0 + 0 + 1 + 1 + 0 + 0 + 0 + 1 = 3
- S = P - Q = 43 - 3
- S = 40
„Námořní“ metoda
- Přeneste data do objednané pohotovostní tabulky
mph Kontaktováno Narazil Rozbité Součty (ti) 10 1 0 0 1 12 1 1 0 2 14 1 0 0 1 16 1 0 0 1 18 0 1 0 1 20 0 1 1 2 22 0 1 0 1 25 0 0 1 1 27 0 0 1 1 30 0 0 1 1 Součty (ui) 4 4 4 12
- U každé položky v tabulce spočítejte všechny ostatní položky, které leží na „jihovýchodě“ konkrétní položky. Tohle je P:
- P = (1 × 8) + (1 × 7) + (1 × 7) + (1 × 7) + (1 × 4) + (1 × 4) + (1 × 3) + ( 1 × 3) = 43
- U každé položky v tabulce spočítejte všechny ostatní položky, které leží na „Jihozápad“ konkrétní položky. Tohle je Q:
- Q = (1 × 2) + (1 × 1) = 3
- S = P − Q = 43 − 3
- S = 40
Pomocí přesných tabulek
Když je vazeb mezi vzorky málo (jako v tomto příkladu), Leach navrhl, že ignorování vazeb a použití přesných tabulek by poskytlo přiměřeně přesný výsledek.[4] Jonckheere navrhl prolomit vazby proti alternativní hypotéze a poté použít přesné tabulky.[1] V aktuálním příkladu, kde se vázané výsledky zobrazují pouze v sousedních skupinách, je hodnota S se nezmění, pokud dojde k porušení vazeb vůči alternativní hypotéze. To lze ověřit nahrazením 11 mph namísto 12 mph v narazeném vzorku a 19 mph namísto 20 mph v rozbitém a přepočtením statistiky testu. Ze stolů s k = 3 a m = 4, kritický S hodnota pro α = 0,05 je 36 a výsledek by tak byl deklarován statisticky významný na této úrovni.
Výpočet standardní normální aproximace
Rozptyl S je tedy
A z darováno
Pro α = 0,05 (jednostranný) kritický z hodnota je 1 645, takže výsledek by byl na této úrovni prohlášen za významný. Podobný test trendu v kontextu návrhů opakovaných opatření (v rámci účastníků) a na základě Spearmanova koeficientu korelace pořadí byl vyvinut Strana.[6]
Reference
- ^ A b C Jonckheere, A. R. (1954). „Bez distribuce k- ukázkový test proti objednaným alternativám ". Biometrika. 41: 133–145. doi:10.2307/2333011.
- ^ Terpstra, T. J. (1952). „Asymptotická normálnost a konzistence Kendallova testu proti trendu, když jsou vazby přítomny v jednom hodnocení“ (PDF). Indagationes Mathematicae. 14: 327–333.
- ^ Kendall, M. G. (1962). Rank korelační metody (3. vyd.). Londýn: Charles Griffin.
- ^ A b Leach, C. (1979). Úvod do statistiky: Neparametrický přístup pro sociální vědy. Chichester: John Wiley.
- ^ Loftus, E. F .; Palmer, J. C. (1974). "Rekonstrukce automobilové destrukce: Příklad interakce mezi jazykem a pamětí". Časopis slovního učení a slovního chování. 13: 585–589. doi:10.1016 / S0022-5371 (74) 80011-3.
- ^ Page, E. B. (1963). "Objednané hypotézy pro více ošetření: Test významnosti pro lineární řady". Journal of the American Statistical Association. 58 (301): 216–30. doi:10.2307/2282965.
Další čtení
- Daniel, Wayne W. (1990). „Jonckheere – Terpstra tst pro objednané alternativy“. Aplikovaná neparametrická statistika (2. vyd.). Boston: PWS-Kent. 234–240. ISBN 0-534-91976-6.