Rasch model - Rasch model

The Rasch model, pojmenoval podle Georg Rasch, je psychometrické model pro analýzu kategorická data, jako jsou odpovědi na otázky týkající se hodnocení čtení nebo odpovědi na dotazník, jako funkce kompromisu mezi (a) schopnostmi, postoji respondenta nebo osobnostní rysy a (b) obtížnost položky.^[1] Mohou být například použity k odhadu čtenářské schopnosti studenta nebo extrémnosti postoje člověka k trestu smrti z odpovědí na dotazník. Navíc psychometrie a pedagogický výzkum, model Rasch a jeho rozšíření se používají v jiných oblastech, včetně zdravotnická profese^[2] a průzkum trhu^[3] z důvodu jejich obecné použitelnosti.^[4]

Matematická teorie, která je základem Raschových modelů, je zvláštním případem teorie odezvy na položku a obecněji speciální případ a zobecněný lineární model. Existují však důležité rozdíly ve výkladu parametrů modelu a jeho filozofických důsledků^[5] že samostatní zastánci Rasch model z tradice modelování odezvy na položku. Ústřední aspekt tohoto rozdělení se týká role specifické objektivity,^[6] definující vlastnost modelu Rasch podle Georg Rasch, jako požadavek na úspěšné měření.

Přehled

Raschův model pro měření

V modelu Rasch je pravděpodobnost zadané odpovědi (např. Správná / špatná odpověď) modelována jako funkce parametrů osoby a položky. Konkrétně v původním modelu Rasch je pravděpodobnost správné odpovědi modelována jako a logistická funkce rozdílu mezi parametrem osoba a položka. Matematická forma modelu je uvedena dále v tomto článku. Ve většině kontextů charakterizují parametry modelu odbornost respondentů a obtížnost položek jako umístění na spojité latentní proměnné. Například ve vzdělávacích testech představují parametry položek obtížnost položek, zatímco parametry osob představují úroveň schopností nebo úrovně lidí, kteří jsou hodnoceni. Čím vyšší je schopnost člověka ve vztahu k obtížnosti položky, tím vyšší je pravděpodobnost správné odpovědi na tuto položku. Když se umístění osoby na latentním znaku rovná obtížnosti položky, existuje podle definice pravděpodobnost 0,5 v modelu Rasch správné odpovědi.

Model Rasch je a Modelka v jednom smyslu v tom smyslu, že představuje strukturu, kterou by data měla vykazovat, aby bylo možné z těchto dat získat měření; tj. poskytuje kritérium pro úspěšné měření. Kromě dat modelují Raschovy rovnice vztahy, které očekáváme v reálném světě. Například vzdělávání má připravit děti na celou řadu výzev, kterým v životě budou čelit, nejen na ty, které se objevují v učebnicích nebo na testech. Vyžadováním opatření, která mají zůstat stejná (neměnná) napříč různými testy měřícími stejnou věc, umožňují Raschovy modely testovat hypotézu, že konkrétní výzvy kladené v učebních osnovách a na testu souvisle představují nekonečnou populaci všech možných výzev v tom doména. Raschův model je tedy modelem ve smyslu ideál nebo standard, který poskytuje heuristickou fikci sloužící jako užitečný organizační princip, i když ve skutečnosti není nikdy v praxi dodržován.

Perspektiva nebo paradigma, o které se opírá model Rasch, se liší od perspektivy, o kterou se opírá statistické modelování. Modely se nejčastěji používají se záměrem popsat soubor dat. Parametry se upravují a přijímají nebo odmítají na základě toho, jak dobře odpovídají datům. Naproti tomu, když je použit Raschův model, cílem je získat data, která se k modelu hodí (Andrich, 2004; Wright, 1984, 1999). Důvodem této perspektivy je, že Raschův model ztělesňuje požadavky, které musí být splněny, aby bylo možné získat měření, v tom smyslu, že měření je obecně chápáno ve fyzikálních vědách.

Užitečnou analogií pro pochopení tohoto zdůvodnění je zvážit objekty měřené na stupnici váhy. Předpokládejme, že váha objektu A je při jedné příležitosti měřena jako podstatně větší než váha objektu B, pak se bezprostředně poté váha objektu B měří jako podstatně větší než váha objektu A. Vlastnost, kterou požadujeme měření spočívá v tom, že výsledné srovnání mezi objekty by mělo být stejné nebo neměnné, bez ohledu na jiné faktory. Tento klíčový požadavek je zakotven ve formální struktuře modelu Rasch. V důsledku toho se model Rasch nezmění tak, aby vyhovoval datům. Místo toho by měla být metoda hodnocení změněna tak, aby byl tento požadavek splněn, stejně jako by měla být opravena váhová stupnice, pokud poskytuje různá srovnání mezi objekty při samostatném měření objektů.

Data analyzovaná pomocí modelu jsou obvykle odpověďmi na konvenční položky testů, jako jsou vzdělávací testy se správnými / špatnými odpověďmi. Model je však obecný a lze ho použít všude tam, kde jsou získána diskrétní data se záměrem měřit kvantitativní atribut nebo vlastnost.

Škálování

Obrázek 1: Charakteristická křivka testu ukazující vztah mezi celkovým skóre v testu a odhadem polohy osoby

Pokud mají všichni účastníci testu příležitost vyzkoušet všechny položky v jediném testu, každé celkové skóre v testu se mapuje na jedinečný odhad schopností a čím vyšší je celkový počet, tím vyšší je odhad schopností. Celkové skóre nemá lineární vztah s odhady schopností. Vztah je spíše nelineární, jak je znázorněno na obrázku 1. Celkové skóre je zobrazeno na svislé ose, zatímco odhad polohy odpovídající osoby je zobrazen na vodorovné ose. U konkrétního testu, na kterém je založena testovací charakteristika (TCC) uvedená na obrázku 1, je vztah přibližně lineární v celém rozsahu celkového skóre od přibližně 13 do 31. Tvar TCC je obecně poněkud sigmoidní jako v tomto příkladu . Přesný vztah mezi celkovým skóre a odhady polohy osoby však závisí na distribuci položek v testu. TCC je strmější v rozsazích kontinua, ve kterých je řada položek, například v rozsazích po obou stranách 0 na obrázcích 1 a 2.

Při použití modelu Rasch jsou umístění položek často zmenšena jako první, na základě metod, jako jsou metody popsané níže. Tato část procesu změny měřítka se často označuje jako položka kalibrace. Ve vzdělávacích testech platí, že čím menší je podíl správných odpovědí, tím vyšší je obtížnost položky, a tím tedy i vyšší umístění na škále položky. Jakmile se změní umístění položek, změří se umístění osob na stupnici. Ve výsledku jsou polohy osob a předmětů odhadovány na jedné stupnici, jak je znázorněno na obrázku 2.

Interpretace umístění měřítka

Obrázek 2: Graf ukazující histogramy distribuce osob (nahoře) a distribuce položek (dole) na stupnici

U dichotomických údajů, jako jsou správné / nesprávné odpovědi, je podle definice umístění položky na stupnici s umístěním osoby, kde je 0,5 pravděpodobnost správné odpovědi na otázku. Obecně je pravděpodobnost, že osoba správně odpoví na otázku s obtížemi menšími než je poloha této osoby, větší než 0,5, zatímco pravděpodobnost správné odpovědi na otázku s obtížemi většími, než je poloha dané osoby, je menší než 0,5. Charakteristická křivka položky (ICC) nebo funkce reakce na položku (IRF) ukazuje pravděpodobnost správné odpovědi jako funkce schopnosti osob. Jeden ICC je zobrazen a vysvětlen podrobněji ve vztahu k obrázku 4 v tomto článku (viz také funkce odezvy na položku ). Levé ICC na obrázku 3 jsou nejjednodušší položky, položky zcela vpravo na stejném obrázku jsou nejtěžší položky.

Pokud jsou odpovědi osoby uvedeny podle obtížnosti položky, od nejnižší po nejvyšší, je nejpravděpodobnější vzor a Guttmanův vzor nebo vektor; tj. {1,1, ..., 1,0,0,0, ..., 0}. I když je tento vzor nejpravděpodobnější vzhledem ke struktuře modelu Rasch, vyžaduje tento model pouze pravděpodobnostní Guttmanovy odezvy; tj. vzory, které směřují ke Guttmanovmu vzoru. Je neobvyklé, aby se odpovědi striktně shodovaly se vzorem, protože existuje mnoho možných vzorů. Aby se data vešly do modelu Rasch, není nutné, aby se odpovědi striktně shodovaly se vzorem.

Obrázek 3: ICC pro řadu položek. ICC jsou barevně zvýrazněny, aby se zvýraznila změna v pravděpodobnosti úspěšné reakce u osoby s umístěním schopností ve svislé linii. Osoba pravděpodobně bude správně reagovat na nejjednodušší položky (s umístěním nalevo a vyššími křivkami) a je nepravděpodobné, že bude správně reagovat na obtížné položky (umístění do pravé a spodní křivky).

Každý odhad schopností má přidružené standardní chyba měření, který kvantifikuje míru nejistoty spojené s odhadem schopností. Odhady položek mají také standardní chyby. Obecně jsou standardní chyby odhadů položek podstatně menší než standardní chyby odhadů osob, protože u položky je obvykle více dat odpovědí než u osob. To znamená, že počet lidí, kteří se pokusí o danou položku, je obvykle větší než počet položek, o které se daná osoba pokusí. Standardní chyby odhadů osob jsou menší, pokud je sklon ICC strmější, což je obvykle přes střední rozsah skóre v testu. V tomto rozsahu tedy existuje větší přesnost, protože čím strmější je sklon, tím větší je rozdíl mezi libovolnými dvěma body na přímce.

Statistické a grafické testy se používají k vyhodnocení shody dat s modelem. Některé testy jsou globální, zatímco jiné se zaměřují na konkrétní položky nebo lidi. Některé testy přizpůsobení poskytují informace o tom, které položky lze použít ke zvýšení spolehlivost testu vynecháním nebo opravou problémů se špatnými položkami. V Rasch Measurement se místo indexů spolehlivosti používá index oddělení osob. Index oddělení osob je však analogický s indexem spolehlivosti. Index separace je souhrnem skutečné separace jako poměru k separaci včetně chyby měření. Jak již bylo zmíněno dříve, úroveň chyby měření není jednotná v celém rozsahu testu, ale je obecně větší pro extrémnější skóre (nízké a vysoké).

Vlastnosti modelu Rasch

Třída modelů je pojmenována po Georg Rasch, dánský matematik a statistik, který postoupil do epistemologický případ pro modely založené na jejich shodě se základním požadavkem měření v fyzika; jmenovitě požadavek invariantní srovnání.^[1] Toto je charakteristický rys třídy modelů, jak je rozpracován v následující části. Raschův model pro dichotomická data má úzký koncepční vztah k zákon srovnávacího úsudku (LCJ), model formulovaný a hojně používaný L. L. Thurstone,^[7]^[8] a tedy také k Thurstoneova stupnice.^[9]

Před zavedením modelu měření, pro který je nejlépe známý, použil Rasch Poissonovo rozdělení čtení dat jako modelu měření s hypotézou, že v příslušných empirických souvislostech se počet chyb, kterých se daný jedinec dopustil, řídí poměrem obtížnosti textu k schopnosti čtení dané osoby. Rasch označoval tento model jako multiplikativní Poissonův model. Raschův model pro dichotomická data - tj. Kde lze odpovědi zařadit do dvou kategorií - je jeho nejznámějším a nejpoužívanějším modelem a je zde hlavním zaměřením. Tento model má podobu jednoduchého logistická funkce.

Stručný obrys výše zdůrazňuje určité charakteristické a vzájemně související rysy Raschova pohledu na sociální měření, které jsou následující:

Zabýval se hlavně měřením Jednotlivci, spíše než s distribucemi mezi populacemi.
Zabýval se vytvořením základny pro a priori setkání požadavky pro měření odvozené z fyziky a v důsledku toho nevyvolával žádné předpoklady o distribuci úrovní zvláštnosti v populaci.
Raschův přístup výslovně uznává, že jde o vědeckou hypotézu, že daná vlastnost je kvantitativní i měřitelná, jak je operacionalizována v konkrétním experimentálním kontextu.

Tedy v souladu s perspektivou vyjádřenou Thomas Kuhn ve svém příspěvku z roku 1961 Funkce měření v moderní fyzice, měření bylo považováno za založené v roce 2006 teorie, a je nástrojem pro detekci kvantitativních anomálií, které neodpovídají hypotézám vztahujícím se k širšímu teoretickému rámci.^[10] Tato perspektiva je v rozporu s obecně převládajícími ve společenských vědách, ve kterých se s údaji, jako jsou výsledky testů, přímo zachází jako s měřením, aniž by bylo nutné měřit teoreticky. Ačkoli tento kontrast existuje, Raschova perspektiva ve skutečnosti doplňuje použití statistické analýzy nebo modelování, které vyžaduje měření na intervalové úrovni, protože účelem použití Raschova modelu je získání takových měření. Aplikace modelů Rasch jsou popsány v široké škále zdrojů, včetně Alagumalai, Curtis & Hungi (2005), Bezruczko (2005), Bond & Fox (2007), Burro (2016), Fisher & Wright (1994), Masters & Keeves (1999) a Journal of Applied Measurement.

Invariantní srovnání a dostatečnost

Raschův model pro dichotomická data je často považován za teorie odezvy na položku (IRT) model s jedním parametrem položky. Navrhovatelé modelu však nejsou konkrétním modelem IRT^[11] považovat to za model, který má vlastnost, která ji odlišuje od ostatních modelů IRT. Specificky je definující vlastnost Raschových modelů jejich formální nebo matematická ztělesnění principu invariantního srovnání. Rasch shrnul princip invariantního srovnání následovně:

Srovnání mezi dvěma podněty by mělo být nezávislé na tom, kteří jednotliví jednotlivci k porovnání přispěli; a mělo by to být také nezávislé na tom, které další podněty v uvažované třídě byly nebo mohly být také porovnány.

Symetricky by srovnání mezi dvěma jedinci mělo být nezávislé na tom, které konkrétní podněty v rámci uvažované třídy byly pro srovnání užitečné; a mělo by to být také nezávislé na tom, které další osoby byly také srovnávány, při stejné nebo jiné příležitosti.^[12]

Raschovy modely ztělesňují tento princip, protože jejich formální struktura umožňuje algebraické oddělení parametrů osoby a položky v tom smyslu, že parametr osoby může být vyloučeno během procesu statistický odhad parametrů položky. Tohoto výsledku je dosaženo použitím podmíněného maximální pravděpodobnost odhad, ve kterém je prostor odpovědí rozdělen podle celkového skóre osoby. Důsledkem je, že surové skóre položky nebo osoby je dostatečná statistika pro položku nebo osobu parametr. Totéž znamená, že celkové skóre osoby obsahuje všechny informace dostupné ve specifikovaném kontextu o jednotlivci a celkové skóre položky obsahuje všechny informace týkající se položky, s ohledem na relevantní latentní vlastnost. Rasch model vyžaduje specifickou strukturu v datech odezvy, konkrétně pravděpodobnostní Guttman struktura.

V poněkud známějších pojmech poskytují Raschovy modely základ a ospravedlnění pro získání umístění osob na kontinuu z celkového skóre v hodnoceních. Ačkoli není neobvyklé zacházet s celkovým skóre přímo jako s měřením, ve skutečnosti jde o počet diskrétních pozorování spíše než měření. Každé pozorování představuje pozorovatelný výsledek srovnání mezi osobou a položkou. Takové výsledky jsou přímo analogické pozorování rotace váhy v jednom či druhém směru. Toto pozorování by naznačovalo, že jeden nebo druhý objekt má větší hmotnost, ale počty takových pozorování nelze považovat přímo za měření.

Rasch poukázal na to, že princip invariantního srovnání je charakteristický pro měření ve fyzice pomocí příkladu dvousměrného experimentálního referenčního rámce, ve kterém každý přístroj vykonává mechanické platnost na výrobu pevných těles akcelerace. Rasch^[1]^:112–3 uvedl v tomto kontextu: „Obecně: Pokud pro libovolné dva objekty najdeme určitý poměr jejich zrychlení vyprodukovaných jedním nástrojem, pak stejný poměr bude nalezen pro jakýkoli jiný z nástrojů“. Je to snadno ukázáno Newtonův druhý zákon znamená, že takové poměry jsou nepřímo úměrné poměrům EU masy těl.

Matematická forma Raschova modelu pro dichotomická data

Nechat ${ displaystyle X_ {ni} = x v {0,1 }}$ být dichotomická náhodná proměnná, kde například ${ displaystyle x = 1}$ označuje správnou odpověď a ${ displaystyle x = 0}$ nesprávná odpověď na danou položku hodnocení. V Raschově modelu pro dichotomická data pravděpodobnost výsledku ${ displaystyle X_ {ni} = 1}$ darováno:

{ displaystyle Pr {X_ {ni} = 1 } = { frac {e ^ {{ beta _ {n}} - { delta _ {i}}}} {1 + e ^ {{ beta _ {n}} - { delta _ {i}}}}},}

kde ${ displaystyle beta _ {n}}$ je schopnost člověka ${ displaystyle n}$ a ${ displaystyle delta _ {i}}$ je obtížnost položky ${ displaystyle i}$ . V případě dichotomického předmětu dosažení tedy ${ displaystyle Pr {X_ {ni} = 1 }}$ je pravděpodobnost úspěchu při interakci mezi příslušnou osobou a položkou hodnocení. Je snadno ukázáno, že log šance nebo logit, správné odpovědi osoby na položku, na základě modelu, se rovná ${ displaystyle beta _ {n} - delta _ {i}}$ . Vzhledem k tomu, dva zkoumaní s různými parametry schopností ${ displaystyle beta _ {1}}$ a ${ displaystyle beta _ {2}}$ a libovolný předmět s obtížemi ${ displaystyle delta _ {i}}$ , spočítat rozdíl v logitech těchto dvou zkoumaných pomocí ${ displaystyle ( beta _ {1} - delta _ {i}) - ( beta _ {2} - delta _ {i})}$ . Tento rozdíl se stává ${ displaystyle beta _ {1} - beta _ {2}}$ . Naopak je možné ukázat, že logaritmická pravděpodobnost správné odpovědi stejné osoby na jednu položku, podmiňovací způsob na správnou odpověď na jednu ze dvou položek, se rovná rozdílu mezi umístěními položek. Například,

{ displaystyle operatorname {log-odds} {X_ {n1} = 1 mid r_ {n} = 1 } = delta _ {2} - delta _ {1}, ,}

kde ${ displaystyle r_ {n}}$ je celkové skóre osoby n přes dvě položky, což znamená správnou odpověď na jednu nebo druhou z položek.^[1]^[13]^[14] Podmíněné kurzy logů proto nezahrnují parametr osoby ${ displaystyle beta _ {n}}$ , což tedy může být vyloučeno podmíněním celkového skóre ${ displaystyle r_ {n} = 1}$ . To znamená, že rozdělení odpovědí podle hrubých skóre a výpočet logaritmu správné odpovědi představuje odhad ${ displaystyle delta _ {2} - delta _ {1}}$ je získán bez zapojení ${ displaystyle beta _ {n}}$ . Obecněji lze řadu parametrů položek iterativně odhadnout pomocí aplikace procesu, jako je odhad podmíněné maximální pravděpodobnosti (viz Odhad modelu Rasch ). I když jsou tyto odhady více zapojeny, platí stejný základní princip.

Obrázek 4: ICC pro Raschův model zobrazující srovnání pozorovaných a očekávaných proporcí správných pro pět třídních intervalů osob

ICC Raschova modelu pro dichotomická data je znázorněna na obrázku 4. Šedá čára mapuje pravděpodobnost diskrétního výsledku ${ displaystyle X_ {ni} = 1}$ (tj. správné zodpovězení otázky) pro osoby s různým umístěním latentního kontinua (tj. s jejich úrovní schopností). Umístění položky je podle definice místo, kde je pravděpodobnost, že ${ displaystyle X_ {ni} = 1}$ se rovná 0,5. Na obrázku 4 černé kruhy představují skutečný nebo pozorovaný podíl osob v intervalech tříd, u nichž byl pozorován výsledek. Například v případě položky posouzení použité v kontextu vzdělávací psychologie, mohly by představovat podíly osob, které na položku odpověděly správně. Osoby jsou seřazeny podle odhadů jejich umístění na latentním kontinuu a na tomto základě jsou klasifikovány do třídních intervalů, aby graficky zkontrolovaly shodu pozorování s modelem. Existuje úzký soulad dat s modelem. Kromě grafické kontroly dat je k dispozici řada statistický testy přizpůsobení se používají k vyhodnocení, zda lze připsat odchylky pozorování z modelu náhodný samotné efekty podle potřeby nebo zda existují systematické odchylky od modelu.

Polytomous rozšíření modelu Rasch

Existuje několik polytomických rozšíření modelu Rasch, které generalizují dichotomický model tak, aby jej bylo možné použít v kontextech, ve kterých po sobě jdoucí celočíselné skóre představují kategorie rostoucí úrovně nebo velikosti latentního znaku, jako je zvýšení schopnosti, motorické funkce, schválení prohlášení atd. Tato polytomická rozšíření jsou například použitelná pro použití Likertových stupnic, hodnocení při hodnocení vzdělávání a hodnocení výkonů soudců.

Další úvahy

Kritika Raschova modelu spočívá v tom, že je příliš restriktivní nebo normativní, protože předpokladem modelu je, že všechny položky mají stejnou diskriminaci, zatímco v praxi se diskriminace položek liší, a proto žádný soubor dat nikdy nebude dokonale odpovídat datovému modelu. Častým nedorozuměním je, že Raschův model nedovoluje, aby každá položka měla jinou diskriminaci, ale stejná diskriminace je předpokladem invariantního měření, takže rozdílná diskriminace položky není zakázána, ale spíše naznačuje, že kvalita měření se nerovná teoretickému ideálu. Stejně jako ve fyzickém měření se reálné datové sady nikdy nebudou dokonale shodovat s teoretickými modely, takže je relevantní otázka, zda určitý soubor dat poskytuje dostatečnou kvalitu měření pro daný účel, ne zda dokonale odpovídá nedosažitelnému standardu dokonalosti.

Kritika specifická pro použití modelu Rasch s daty odezvy z položek s výběrem položek je, že v modelu není žádné ustanovení pro hádání, protože levá asymptota se vždy v modelu Rasch blíží nulové pravděpodobnosti. To znamená, že člověk s nízkou schopností vždy pokazí předmět. Jedinci s nízkou schopností, kteří absolvují zkoušku s výběrem z více možností, však mají podstatně vyšší pravděpodobnost, že si správnou odpověď vyberou jen náhodou (pro k-volba, pravděpodobnost je kolem 1 /k).

Tříparametrický logistický model uvolňuje oba tyto předpoklady a dvouparametrický logistický model umožňuje různé sklony.^[15] Specifikace jednotné diskriminace a asymptoty s nulovou levicí jsou však nezbytnými vlastnostmi modelu, aby byla zachována dostatečnost jednoduchého neváženého hrubého skóre. V praxi je nenulová nižší asymptota nalezená v souborech dat s výběrem dat menší hrozbou pro měření, než se běžně předpokládá, a při rozumném použití dobře vyvinutých testovaných položek obvykle nevede k podstatným chybám v měření ^[16]

Verhelst & Glas (1995) odvozují rovnice podmíněné maximální věrohodnosti (CML) pro model, který označují jako One Parameter Logistic Model (OPLM). V algebraické formě se to zdá být identické s modelem 2PL, ale OPLM obsahuje přednastavené diskriminační indexy, spíše než odhadované parametry diskriminace 2PL. Jak uvedli tito autoři, problém, kterému čelí při odhadu s odhadovanými parametry diskriminace, spočívá v tom, že diskriminace jsou neznámé, což znamená, že vážené hrubé skóre „není pouhá statistika, a proto je nemožné použít CML jako metodu odhadu "(Verhelst & Glas, 1995, s. 217). To znamená, že dostatečnost váženého „skóre“ v 2PL nelze použít podle způsobu, jakým a dostatečná statistika je definováno. Pokud se váhy počítají místo toho, aby se odhadovaly, jako v OPLM, je podmíněný odhad možný a některé vlastnosti modelu Rasch se zachovají (Verhelst, Glas & Verstralen, 1995; Verhelst & Glas, 1995). V OPLM jsou hodnoty indexu diskriminace omezeny na 1 až 15. Omezení tohoto přístupu spočívá v tom, že v praxi musí být jako výchozí bod nastaveny hodnoty indexů diskriminace. To znamená, že se jedná o určitý typ odhadu diskriminace, pokud je účelem se tomu vyhnout.

Raschův model pro dichotomická data neodmyslitelně zahrnuje jediný diskriminační parametr, který, jak poznamenal Rasch,^[1]^:121 představuje libovolnou volbu jednotka pokud jde o vyjádření nebo odhad veličin latentního znaku. Raschův model však vyžaduje, aby byla diskriminace napříč jednotná interakce mezi osobami a položkami v rámci stanoveného referenčního rámce (tj. kontext hodnocení za daných podmínek pro hodnocení).

Aplikace modelu poskytuje diagnostické informace o tom, jak dobře je kritérium splněno. Aplikace modelu může také poskytnout informace o tom, jak dobře fungují položky nebo otázky týkající se hodnocení k měření schopností nebo vlastností. Například, když známe podíl osob, které se daným chováním zabývají, lze Raschův model použít k odvození vztahů mezi obtížnost chování, postoje a chování.^[17] Mezi významné obhájce modelů Rasch patří Benjamin Drake Wright, David Andrich a Erling Andersen.

Viz také

Další čtení

Alagumalai, S., Curtis, D.D. & Hungi, N. (2005). Applied Rasch Measurement: Kniha příkladů. Springer-Kluwer.
Andrich, D. (1978a). Formulace hodnocení pro objednané kategorie odpovědí. Psychometrika, 43, 357–74.
Andrich, D. (1988). Rasch modely pro měření. Beverly Hills: Sage Publications.
Andrich, D. (2004). Kontroverze a Raschův model: charakteristika nekompatibilních paradigmat? Zdravotní péče, 42, 1–16.
Baker, F. (2001). Základy teorie odezvy na položku. ERIC Clearinghouse pro hodnocení a hodnocení, University of Maryland, College Park, MD. K dispozici zdarma se softwarem zahrnutým z IRT na Edres.org
Bezruczko, N. (vyd.). (2005). Měření rašple ve zdravotnických vědách. Maple Grove, MN: JAM Press.
Bond, T.G. & Fox, C.M. (2007). Uplatnění modelu Rasch: Základní měření v humanitních vědách. 2. vydání (zahrnuje software Rasch na disku CD-ROM). Lawrence Erlbaum.
Burro, R. (2016). Být objektivní v experimentální fenomenologii: aplikace psychofyziky. SpringerPlus, 5 (1), 1720. doi: 10,1186 / s40064-016-3418-4
Fischer, G.H. & Molenaar, I.W. (1995). Rasch modely: základy, nejnovější vývoj a aplikace. New York: Springer-Verlag.
Fisher, W. P., Jr., a Wright, B. D. (Eds.). (1994). Aplikace pravděpodobnostního společného měření. International Journal of Educational Research, 21(6), 557–664.
Goldstein H & Blinkhorn S. (1977). Monitorování vzdělávacích standardů: nevhodný model. . Bull.Br.Psychol.Soc. 30 309–311
Goldstein H & Blinkhorn S. (1982). Model Rasch stále nesedí. . BERJ 82 167–170.
Hambleton RK, Jones RW. „Srovnání klasické testovací teorie a odezvy předmětu,“ Vzdělávací měření: problémy a praxe 1993; 12 (3): 38–47. k dispozici v ITEMS Series od Národní rada pro měření ve vzdělávání
Harris D. Porovnání 1-, 2- a 3-parametrových modelů IRT. Vzdělávací měření: problémy a praxe ;. 1989; 8: 35–41 k dispozici v ITEMS Series od Národní rada pro měření ve vzdělávání
Kuhn, T.S. (1961). Funkce měření v moderní fyzice. ISIS, 52, 161–193. JSTOR
Linacre, J. M. (1999). "Porozumění měření Rasch: Metody odhadu pro měření Rasch". Journal of Outcome Measurement. 3 (4): 382–405. PMID 10572388.CS1 maint: ref = harv (odkaz)
Masters, G. N., & Keeves, J. P. (Eds.). (1999). Pokroky v měření ve pedagogickém výzkumu a hodnocení. New York: Pergamon.
Verhelst, N.D. a Glas, C.A.W. (1995). Logistický model s jedním parametrem. V G.H. Fischer a I.W. Molenaar (Eds.), Rasch Models: Foundations, recent development, and applications (str. 215–238). New York: Springer Verlag.
Verhelst, N.D., Glas, C.A.W. a Verstralen, H.H.F.M. (1995). Jeden parametr logistický model (OPLM). Arnhem: CITO.
von Davier, M., & Carstensen, C. H. (2007). Modely Rasch pro distribuci více proměnných a směsí: Rozšíření a aplikace. New York: Springer.
Wright, B. D. (1984). Zoufalství a naděje na vzdělávací měření. Recenze současného vzdělávání, 3(1), 281-288 [1].
Wright, B. D. (1999). Základní měření pro psychologii. In S. E. Embretson & S. L. Hershberger (Eds.), Nová pravidla měření: Co by měl vědět každý pedagog a psycholog (str. 65–104. Hillsdale, New Jersey: Lawrence Erlbaum Associates.
Wright, B.D., & Stone, M.H. (1979). Nejlepší design testu. Chicago, IL: MESA Press.
Wu, M. & Adams, R. (2007). Uplatnění Raschova modelu na psychosociální měření: Praktický přístup. Melbourne, Austrálie: Educational Measurement Solutions. K dispozici zdarma od Řešení pro měření ve vzdělávání

Reference

^ ^A ^b ^C ^d ^E Rasch, G. (1960/1980). Pravděpodobnostní modely některých testů inteligence a výsledků. (Kodaň, Dánský institut pro výzkum vzdělávání), rozšířené vydání (1980) s předmluvou a doslovem B.D. Wrighte. Chicago: The University of Chicago Press.
^ Bezruczko, N. (2005). Měření rašple ve zdravotnických vědách. Maple Grove, MN: Jam Press.
^ Bechtel, G. G. (1985). Zobecnění modelu Rasch pro stupnice hodnocení spotřebitelů. Marketing Science, 4 (1), 62-73.
^ Wright, B. D. (1977). Řešení problémů s měřením pomocí modelu Rasch. Journal of Educational Measurement, 14 (2), 97-116.
^ Linacre J.M. (2005). Rasch dichotomický model vs. jednoparametrový logistický model. Transakce měření rasch, 19: 3, 1032
^ Rasch, G. (1977). O specifické objektivitě: Pokus o formalizaci požadavku na obecnost a platnost vědeckých prohlášení. Dánská ročenka filozofie, 14, 58-93.
^ Thurstone, L. L. (1927). Zákon srovnávacího rozsudku. Psychologický přehled, 34 (4), 273.
^ Thurstone a senzorické škálování: dříve a nyní. (1994). Thurstone a senzorické škálování: dříve a nyní. Psychological Review, 101 (2), 271–277. doi: 10.1037 / 0033-295X.101.2.271
^ Andrich, D. (1978b). Vztahy mezi přístupy Thurstone a Rasch k škálování položek. Aplikované psychologické měření, 2, 449–460.
^ Kuhn, Thomas S. "Funkce měření v moderní fyzikální vědě." Isis (1961): 161-193.
^ * Bond, T.G. & Fox, C.M. (2007). Uplatnění modelu Rasch: Základní měření v humanitních vědách. 2. vydání (zahrnuje software Rasch na disku CD-ROM). Lawrence Erlbaum. Stránka 265
^ Rasch, G. (1961). O obecných zákonech a významu měření v psychologii, s. 321–334 v Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, IV. Berkeley, Kalifornie: University of California Press. K dispozici zdarma od Projekt Euclid
^ Andersen, E.B. (1977). Dostatečné statistiky a modely latentních znaků, Psychometrika, 42, 69–81.
^ Andrich, D. (2010). Dostatečnost a podmíněný odhad parametrů osoby v modelu polytomous Rasch. Psychometrika, 75(2), 292-308.
^ Birnbaum, A. (1968). Některé modely skrytých znaků a jejich použití k vyvození schopností vyšetřovaného. V lordovi, F.M. & Novick, M.R. (ed.), Statistické teorie skóre mentálních testů. Reading, MA: Addison – Wesley.
^ Holster, Trevor A .; Lake, J. W. (2016). "Hádání a Raschův model". Jazykové hodnocení čtvrtletně. 13 (2): 124–141. doi:10.1080/15434303.2016.1160096. S2CID 148393334.
^ Byrka, Katarzyna; Jȩdrzejewski, Arkadiusz; Sznajd-Weron, Katarzyna; Weron, Rafał (01.09.2016). „Obtížnost je kritická: Význam sociálních faktorů při modelování šíření zelených produktů a postupů“. Recenze obnovitelné a udržitelné energie. 62: 723–735. doi:10.1016 / j.rser.2016.04.063.

externí odkazy

[Rasch1960-1] A ^b ^C ^d ^E Rasch, G. (1960/1980). Pravděpodobnostní modely některých testů inteligence a výsledků. (Kodaň, Dánský institut pro výzkum vzdělávání), rozšířené vydání (1980) s předmluvou a doslovem B.D. Wrighte. Chicago: The University of Chicago Press.

[2] Bezruczko, N. (2005). Měření rašple ve zdravotnických vědách. Maple Grove, MN: Jam Press.

[3] Bechtel, G. G. (1985). Zobecnění modelu Rasch pro stupnice hodnocení spotřebitelů. Marketing Science, 4 (1), 62-73.

[4] Wright, B. D. (1977). Řešení problémů s měřením pomocí modelu Rasch. Journal of Educational Measurement, 14 (2), 97-116.

[5] Linacre J.M. (2005). Rasch dichotomický model vs. jednoparametrový logistický model. Transakce měření rasch, 19: 3, 1032

[6] Rasch, G. (1977). O specifické objektivitě: Pokus o formalizaci požadavku na obecnost a platnost vědeckých prohlášení. Dánská ročenka filozofie, 14, 58-93.

[7] Thurstone, L. L. (1927). Zákon srovnávacího rozsudku. Psychologický přehled, 34 (4), 273.

[8] Thurstone a senzorické škálování: dříve a nyní. (1994). Thurstone a senzorické škálování: dříve a nyní. Psychological Review, 101 (2), 271–277. doi: 10.1037 / 0033-295X.101.2.271

[9] Andrich, D. (1978b). Vztahy mezi přístupy Thurstone a Rasch k škálování položek. Aplikované psychologické měření, 2, 449–460.

[10] Kuhn, Thomas S. "Funkce měření v moderní fyzikální vědě." Isis (1961): 161-193.

[11] * Bond, T.G. & Fox, C.M. (2007). Uplatnění modelu Rasch: Základní měření v humanitních vědách. 2. vydání (zahrnuje software Rasch na disku CD-ROM). Lawrence Erlbaum. Stránka 265

[12] Rasch, G. (1961). O obecných zákonech a významu měření v psychologii, s. 321–334 v Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, IV. Berkeley, Kalifornie: University of California Press. K dispozici zdarma od Projekt Euclid

[13] Andersen, E.B. (1977). Dostatečné statistiky a modely latentních znaků, Psychometrika, 42, 69–81.

[14] Andrich, D. (2010). Dostatečnost a podmíněný odhad parametrů osoby v modelu polytomous Rasch. Psychometrika, 75(2), 292-308.

[15] Birnbaum, A. (1968). Některé modely skrytých znaků a jejich použití k vyvození schopností vyšetřovaného. V lordovi, F.M. & Novick, M.R. (ed.), Statistické teorie skóre mentálních testů. Reading, MA: Addison – Wesley.

[16] Holster, Trevor A .; Lake, J. W. (2016). "Hádání a Raschův model". Jazykové hodnocení čtvrtletně. 13 (2): 124–141. doi:10.1080/15434303.2016.1160096. S2CID 148393334.

[17] Byrka, Katarzyna; Jȩdrzejewski, Arkadiusz; Sznajd-Weron, Katarzyna; Weron, Rafał (01.09.2016). „Obtížnost je kritická: Význam sociálních faktorů při modelování šíření zelených produktů a postupů“. Recenze obnovitelné a udržitelné energie. 62: 723–735. doi:10.1016 / j.rser.2016.04.063.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]