Polytomous Rasch model - Polytomous Rasch model

The polytomický model Rasch je zobecnění dichotomický Rasch model. Je to měření model, který má potenciální uplatnění v jakémkoli kontextu, ve kterém je cílem měřit vlastnost nebo schopnost prostřednictvím procesu, ve kterém jsou reakce na položky skóroval s postupným celá čísla. Například model je použitelný pro použití Likertovy váhy, hodnotící stupnice a na položky vzdělávacího hodnocení, u nichž mají postupně vyšší celočíselná skóre naznačovat zvyšující se úrovně kompetencí nebo dosažených výsledků.

Pozadí a přehled

The polytomický model Rasch byl odvozen od Andrichu (1978), po derivacích od Rasch (1961) a Andersen (1977), prostřednictvím rozlišení příslušných pojmů obecné formy Raschova modelu do práh a diskriminace parametry. Když byl model odvozen, Andrich se zaměřil na použití Likertových stupnic v psychometrie, a to jak pro ilustraci, tak pro pomoc při interpretaci modelu.

Model se někdy označuje jako Hodnocení v měřítku když (i) položky mají stejný počet prahových hodnot a (ii) je rozdíl mezi jakýmkoli daným prahovým umístěním a průměrem prahových poloh stejný nebo stejný u všech položek. Toto je však potenciálně zavádějící název modelu, protože je v jeho aplikaci mnohem obecnější než v případě takzvaných hodnotících stupnic. Tento model se také někdy označuje jako Částečný úvěrový model, zejména pokud se používají ve vzdělávacích kontextech. Model částečného úvěru (Masters, 1982) má identickou algebraickou formu, ale byl odvozen z jiného výchozího bodu v pozdější době a je interpretován poněkud odlišným způsobem. Model částečného úvěru také umožňuje různé prahové hodnoty pro různé položky. Ačkoli se tento název modelu často používá, poskytuje Andrich (2005) podrobnou analýzu problémů spojených s prvky přístupu Masters, které se konkrétně týkají typu procesu reakce, který je s modelem kompatibilní, a empirických situací, v nichž odhady prahových poloh jsou neuspořádané. Tyto otázky jsou diskutovány při zpracování modelu, který následuje.

Model je obecný pravděpodobnostní model měření, který poskytuje teoretický základ pro použití sekvenčních celočíselných skóre způsobem, který zachovává charakteristickou vlastnost, která definuje Raschovy modely: dostatečné statistiky pro parametry modelů. Viz hlavní článek pro Rasch model za vypracování této nemovitosti. Kromě zachování této vlastnosti model povoluje přísné empirický test hypotéza že kategorie odpovědí představují rostoucí úrovně latentního atributu nebo vlastnosti, proto jsou seřazeny. Důvodem, proč model poskytuje základ pro testování této hypotézy, je to, že je empiricky možné, že prahové hodnoty nebudou zobrazovat zamýšlené uspořádání.

V této obecnější formě Rasch model pro dichotomická data skóre na konkrétní položce je definován jako počet počtu prahových poloh na latentní vlastnosti překonaných jednotlivcem. To neznamená, že proces měření zahrnuje takové počty v doslovném smyslu; spíše prahová umístění na latentní kontinuum jsou obvykle odvozeno z matice dat odezvy prostřednictvím procesu odhadu, jako je Podmíněné Maximální pravděpodobnost odhad. Obecně je hlavním rysem procesu měření to, že jednotlivci jsou klasifikovaný do jedné z množiny souvislých nebo sousedících uspořádaných kategorií. Formát odpovědi použitý v daném experimentálním kontextu toho může dosáhnout mnoha způsoby. Respondenti si například mohou vybrat kategorii, kterou vnímají nejlépe, vystihuje jejich úroveň schválení výroku (například „rozhodně souhlasím“), soudci mohou osoby klasifikovat do kategorií na základě přesně stanovených kritérií nebo osoba může kategorizovat fyzický stimul na základě na vnímané podobnosti se souborem referenčních podnětů.

Polytomous Rasch model se specializuje na model pro dichotomická data, když jsou odpovědi klasifikovatelné pouze do dvou kategorií. V tomto zvláštním případě jsou obtížnost položky a (jednotlivý) práh identické. Koncept prahové hodnoty je rozpracován v následující části.

Model Polytomous Rasch

Nejprve nechte

být celé číslo náhodná proměnná kde je maximální skóre za předmět i. To je proměnná je náhodná proměnná, která může nabývat celočíselných hodnot mezi 0 a maximem .

V modelu Polytomous Rasch (Andrich, 1978) je pravděpodobnost výsledku je

kde je kth prahové umístění položky i na latentním kontinuu, je umístění osoby n na stejném kontinuu a je maximální skóre za předmět i. Tyto rovnice jsou stejné jako

kde hodnota je vybráno pro výpočetní pohodlí, které je: .

Ratingový měřítkový model

Podobně tomu je u Raschova „Rating Scale“ modelu (Andrich, 1978)

kde je obtížnost položky i a je kth prahové umístění hodnotící stupnice, které je společné pro všechny položky. m je maximální skóre a je stejné pro všechny položky. je vybrán pro výpočetní pohodlí.

aplikace

Aplikovaný v daném empirickém kontextu lze model považovat za matematickou hypotézu, že pravděpodobnost daného výsledku je pravděpodobnostní funkcí těchto parametrů osoby a položky. Graf znázorňující vztah mezi pravděpodobností dané kategorie jako funkce polohy osoby se označuje jako a Křivka pravděpodobnosti kategorie (CPC). Příklad CPC pro položku s pěti kategoriemi s hodnocením od 0 do 4 je uveden na obrázku 1.

Obrázek 1: Křivky pravděpodobnosti kategorie Rasch pro položku s pěti seřazenými kategoriemi

Daná hranice rozděluje kontinuum na regiony nad a pod jeho umístěním. Prahová hodnota odpovídá umístění na latentním kontinuu, ve kterém je stejně pravděpodobné, že bude osoba klasifikována do sousedních kategorií, a proto získat jedno ze dvou po sobě jdoucích skóre. První práh položky i, , je místo v kontinuu, kde osoba pravděpodobně získá skóre 0 nebo 1, druhou prahovou hodnotou je místo, kde osoba stejně pravděpodobně získá skóre 1 a 2 atd. V příkladu zobrazeném na obrázku 1 jsou umístění prahových hodnot -1,5, -0,5, 0,5 a 1,5.

Respondenti mohou získat skóre mnoha různými způsoby. Například tam, kde jsou použity Likertovy formáty odpovědí, Rozhodně nesouhlasím lze přiřadit 0, Nesouhlasit a 1, Souhlasit a 2 a Velmi souhlasím a 3. V kontextu hodnocení v vzdělávací psychologie, postupně vyšší celočíselná skóre mohou být udělena podle explicitních kritérií nebo popisů, které charakterizují zvyšující se úrovně dosažených výsledků v určité oblasti, jako je čtení s porozuměním. Společným a ústředním rysem je, že některý proces musí vyústit v klasifikaci každého jednotlivce do jedné ze sady seřazených kategorií, které společně tvoří hodnotící položku.

Vypracování modelu

Při zpracování vlastností modelu Andrich (2005) objasňuje, že jeho struktura zahrnuje a simultánní klasifikační proces, což vede k jedinému manifest reakce a zahrnuje řadu dichotomních latentních odpovědí. Kromě toho latentní dichotomické reakce fungují v Guttmanově struktuře a souvisejícím prostoru odpovědí, jak je charakterizováno následovat.

Nechat

být soubor nezávislých dichotomických náhodných proměnných. Andrich (1978, 2005) ukazuje, že polytomický Raschův model vyžaduje, aby tyto dichotomické reakce odpovídaly latentnímu podprostoru Guttmanovy odpovědi:

ve kterém X po nich následuje m-x nuly. Například v případě dvou prahových hodnot jsou přípustné vzory v tomto podprostoru odpovědi:

kde celé číslo skóre X implikované každým vzorem (a naopak) je znázorněno. Důvod, proč tento podprostor implikuje model, je následující. Nechat

je pravděpodobnost, že a nechte . Tato funkce má strukturu Rasch model pro dichotomická data. Dále zvažte následující podmíněnou pravděpodobnost v případě dvou prahových hodnot:

Je možné ukázat, že tato podmíněná pravděpodobnost se rovná

což je zase pravděpodobnost dán polytomickým modelem Rasch. Ze jmenovatele těchto rovnic je vidět, že pravděpodobnost v tomto příkladu je podmíněna reakčními vzory nebo . Je tedy zřejmé, že obecně jde o podprostor odpovědi , jak je definováno dříve, je vnitřní ke struktuře polytomického modelu Rasch. Toto omezení podprostoru je nezbytné k odůvodnění celočíselného bodování odpovědí: tj. Takové, že skóre je jednoduše překročený počet objednaných prahů. Andrich (1978) ukázal, že pro toto odůvodnění je rovněž nezbytná stejná diskriminace na každé z prahových hodnot.

V modelu Polytomous Rasch skóre X na dané položce znamená, že jednotlivec současně překonal X prahové hodnoty pod určitou oblastí kontinua a nepodařilo se jim překonat zbývající m − X prahové hodnoty nad touto oblastí. Aby to bylo možné, musí být prahové hodnoty v jejich přirozeném pořadí, jak ukazuje příklad na obrázku 1. Neuspořádané odhady prahových hodnot naznačují neschopnost vytvořit kontext hodnocení, ve kterém klasifikace představované postupnými skóre odrážejí zvyšující se úrovně latentní vlastnost. Zvažte například situaci, ve které existují dva prahy a kdy je odhad druhého prahu na kontinuu nižší než odhad prvního prahu. Pokud se místa berou doslovně, klasifikace osoby do kategorie 1 znamená, že umístění osoby současně překračuje druhou prahovou hodnotu, ale nepřekračuje první prahovou hodnotu. To zase znamená vzor odezvy {0,1}, vzor, ​​který nepatří do podprostoru vzorů, který je vlastní struktuře modelu, jak je popsáno výše.

Jsou-li prahové odhady neuspořádané, nelze je tedy brát doslovně; poněkud disordering sám o sobě neodmyslitelně naznačuje, že klasifikace nesplňují kritéria, která musí být logicky splněna, aby bylo možné ospravedlnit použití postupných celočíselných skóre jako základu pro měření. Pro zdůraznění tohoto bodu Andrich (2005) používá příklad, ve kterém jsou udělovány stupně neúspěchu, prospěchu, zápočtu a vyznamenání. Tyto stupně nebo klasifikace mají obvykle představovat zvyšující se úrovně dosažení. Zvažte osobu A, jejíž poloha v latentním kontinuu je na prahu mezi regiony v kontinuu, kde je s největší pravděpodobností udělen průkaz a kredit. Zvažte také další osobu B, jejíž poloha je na prahu mezi regiony, ve kterých bude s největší pravděpodobností udělen kredit a vyznamenání. V příkladu zvažovaném Andrichem (2005, s. 25) by neuspořádané prahové hodnoty, pokud se berou doslovně, znamenaly, že umístění osoby A (na prahové hodnotě pas / kredit) je vyšší než umístění osoby B (na kredit / rozdíl práh). To znamená, doslovně, že neuspořádaná prahová umístění by znamenala, že by osoba musela prokázat vyšší úroveň dosažení, aby byla na prahu pro úspěšné absolvování / kredit, než by byla nutná pro dosažení prahové hodnoty pro kredit / rozlišení. Je zřejmé, že to nesouhlasí se záměrem takového systému hodnocení. Porušování prahových hodnot by tedy naznačovalo, že způsob udělování známek není v souladu se záměrem systému známek. To znamená, že disordering by naznačoval, že hypotéza implicitní v klasifikačním systému - že známky představují uspořádané klasifikace zvyšujícího se výkonu - není podložena strukturou empirických dat.

Reference

  • Andersen, E.B. (1977). Dostatečné statistiky a modely latentních znaků, Psychometrika, 42, 69–81.
  • Andrich, D. (1978). Formulace hodnocení pro objednané kategorie odpovědí. Psychometrika, 43, 561–73.
  • Andrich, D. (2005). Vysvětlil model Rasch. Ve věcech Sivakumar Alagumalai, David D Durtis a Njora Hungi (ed.) Applied Rasch Measurement: Kniha příkladů. Springer-Kluwer. Kapitola 3, 308–328.
  • Masters, G.N. (1982). Rasch model pro částečné hodnocení kreditu. Psychometrika, 47, 149–174.
  • Rasch, G. (1960/1980). Pravděpodobnostní modely pro některé testy inteligence a dosažení. (Kodaň, Dánský institut pro pedagogický výzkum), rozšířené vydání (1980) s předmluvou a doslovem B.D. Wrighte. Chicago: The University of Chicago Press.
  • Wright, B.D. & Masters, G.N. (1982). Ratingová škálová analýza. Chicago: MESA Press. (Dostupné z Institutu pro objektivní měření.)

externí odkazy