Stropní efekt (statistika) - Ceiling effect (statistics)

„Stropní efekt“ je jedním typem efektu zeslabení stupnice;[1] dalším efektem zeslabení stupnice je „podlahový efekt“. The stropní efekt je pozorováno, když nezávislé proměnné již nemá vliv na a závislá proměnná nebo úroveň, nad kterou již není možné měřit odchylku v nezávislé proměnné.[2] Specifická aplikace se mírně liší v rozlišení mezi dvěma oblastmi použití tohoto termínu: farmakologická nebo statistická. Příkladem použití v první oblasti, efektem stropu při léčbě, je úleva od bolesti u některých druhů analgetikum léky, které nemají žádný další účinek na bolest nad určitou dávkovou hladinou (viz také: stropní efekt ve farmakologii ). Příkladem použití ve druhé oblasti, efektu stropu při sběru dat, je průzkum, který seskupuje všechny respondenty do příjmových kategorií, přičemž nerozlišuje příjmy respondentů nad nejvyšší úroveň měřenou v nástroji průzkumu. Maximální úroveň příjmu, kterou lze vykazovat, vytváří „strop“, který vede k nepřesnosti měření, protože rozsah závislé proměnné nezahrnuje skutečné hodnoty nad tímto bodem. Efekt stropu může nastat kdykoli, když opatření zahrnuje nastavený rozsah, ve kterém normální rozdělení předpovídá více skóre na nebo nad maximální hodnotou pro závislou proměnnou.

Sběr dat

Stropní efekt při shromažďování dat, když se odchylka v závislé proměnné neměřuje nebo neodhaduje nad určitou úroveň, je běžně se vyskytujícím praktickým problémem při shromažďování údajů v mnoha vědeckých oborech. Takový účinek je často výsledkem omezení nástrojů pro shromažďování údajů. Když se při sběru dat objeví efekt stropu, existuje hromada skóre na horní úrovni hlášená nástrojem.[3]

Omezení zkreslení odpovědi

Předpětí odpovědi vyskytuje se běžně ve výzkumu týkajícím se problémů, které mohou mít etické základy nebo jsou obecně vnímány jako negativní konotace.[4] Účastníci nemusí na opatření správně reagovat na základě toho, zda se domnívají, že přesná odpověď je vnímána negativně. Populační průzkum týkající se proměnných životního stylu ovlivňujících zdravotní výsledky může zahrnovat otázku kouření. Aby se zabránilo možnosti, že by respondent, který je silným kuřákem, mohl odmítnout poskytnout přesnou odpověď na kouření, může být nejvyšší míra kouření, na kterou se dotazovací nástroj v průzkumovém nástroji vztahuje, „dvě balení denně nebo více“. Výsledkem je efekt stropu v tom, že osoby, které kouří tři nebo více balení denně, se nerozlišují od osob, které kouří přesně dvě balení. Populační průzkum týkající se příjmů by podobně mohl mít nejvyšší úroveň odpovědí „100 000 USD ročně nebo více“, místo aby zahrnoval vyšší rozmezí příjmů, protože respondenti by mohli odmítnout vůbec odpovědět, pokud by otázky z průzkumu příliš konkrétně identifikovaly jejich příjem. I to má za následek stropní efekt, nerozlišující osoby, které mají příjem 500 000 $ ročně nebo vyšší od těch, jejichž příjem je přesně 100 000 $ ročně. Role zkreslení odezvy při vyvolávání stropních efektů je jasně vidět na příkladu respondentů průzkumu, kteří se domnívají, že žádoucí odpovědí je maximální reportovatelná hodnota, což vede ke shlukování datových bodů. Pokus o prevenci zkreslení odpovědí v případě průzkumu kuřáckých návyků vede k efektům stropu prostřednictvím základního návrhu opatření.

Omezení rozsahu přístroje

Rozsah dat, které lze sbírat konkrétním nástrojem, může být omezen inherentními limity v konstrukci nástroje. Návrh konkrétního nástroje často zahrnuje kompromisy mezi stropními efekty a podlahové efekty. Pokud závislá proměnná měřená na nominální stupnici nemá kategorie odezvy, které vhodně pokrývají horní konec distribuce vzorku, odpověď maximální hodnoty bude muset zahrnovat všechny hodnoty nad koncem stupnice. To povede k efektu stropu díky seskupení respondentů do kategorie jediné maximum, což zabrání přesnému vyjádření odchylky za tímto bodem. K tomuto problému dochází v mnoha typech průzkumů, které používají předem určené odpovědi ve stylu závorky. Když mnoho subjektů má skóre na proměnné na horní hranici toho, co přístroj hlásí, analýza dat poskytuje nepřesné informace, protože některé skutečné odchylky v datech se neodráží ve výsledcích získaných z tohoto nástroje.[5]

Efekt stropu se říká, že nastane, když vysoký podíl subjektů ve studii má maximální skóre na pozorované proměnné. To znemožňuje diskriminaci mezi subjekty na horním konci stupnice. Například zkouška může vést například k tomu, že 50% studentů dosáhne 100%. I když takový příspěvek může sloužit jako užitečný prahový test, neumožňuje hodnocení nejlepších hráčů. Z tohoto důvodu je zkoumání výsledků zkoušek z hlediska možného stropního efektu a efektu obrácené podlahy často zabudováno do validace nástrojů, jako jsou ty, které se používají k měření kvality života.[6]

V takovém případě efekt stropu zabrání tomu, aby si nástroj všiml měření nebo odhadu vyššího než určitý limit, který nesouvisí s pozorovaným jevem, ale spíše s designem nástroje. Surovým příkladem by bylo měření výšek stromů pomocí pravítka o délce pouze 20 metrů, pokud je na základě jiných důkazů zřejmé, že existují stromy mnohem vyšší než 20 metrů. Použití 20metrového pravítka jako jediného prostředku měření stromů by znamenalo strop pro shromažďování údajů o výšce stromů. Stropní efekty i podlahové efekty omezují rozsah údajů hlášených přístrojem, čímž snižují variabilitu shromážděných údajů. Omezená variabilita údajů shromážděných u jedné proměnné může snížit sílu statistik o korelacích mezi touto proměnnou a jinou proměnnou.

Přijímací zkoušky na vysokou školu

V různých zemích, které používají přijímací testy jako hlavní prvek nebo důležitý prvek pro stanovení způsobilosti pro vysokoškolské nebo univerzitní studium, se shromážděné údaje týkají rozdílné úrovně výkonu uchazečů o testy. Pokud má přijímací test na vysokou školu maximální možné skóre, kterého lze dosáhnout bez dokonalého výkonu obsahu předmětu testu, má bodovací stupnice testu stropní efekt. Kromě toho, pokud je obsah položky testu pro mnoho účastníků testu snadný, nemusí test odrážet skutečné rozdíly ve výkonu (jak by byly zjištěny u jiných přístrojů) mezi účastníky testu na horním konci rozsahu výkonnosti testu. Matematické testy používané pro přijetí na vysokou školu ve Spojených státech a podobné testy používané pro přijetí na univerzitu v Británii ilustrují oba jevy.

Kognitivní psychologie

v kognitivní psychologie „Mentální procesy, jako je řešení problémů a zapamatování, jsou studovány experimentálně pomocí provozních definic, které umožňují jasná měření. Běžným měřením zájmu je čas potřebný k reakci na daný podnět. Při studiu této proměnné může být stropem nejnižší možný počet (nejméně milisekund odezvy), spíše než nejvyšší hodnota, jak je obvyklá interpretace „stropu“. Ve studiích doby odezvy se může zdát, že v měření došlo ke stropu kvůli zjevnému shlukování kolem minimálního času (například nejrychlejšího času zaznamenaného v experimentu).[7] Toto shlukování by však ve skutečnosti mohlo představovat přirozený fyziologický limit doby odezvy, spíše než artefakt citlivosti stopek (což by samozřejmě byl efekt stropu). Další statistická studie a vědecký úsudek mohou vyřešit, zda jsou pozorování způsobena stropem nebo zda jsou pravdou věci.

Platnost omezení nástroje

IQ testování

Někteří autoři[SZO? ] o nadaném vzdělávání pište o stropních efektech v IQ testování, které mají negativní důsledky pro jednotlivce. Tito autoři někdy tvrdí, že takové stropy produkují systematické podhodnocování IQ intelektuálně nadaný lidé. V tomto případě je nutné pečlivě rozlišovat dva různé způsoby, jak se pojem „strop“ používá ve spisech o IQ testování.

IQ skóre se může do určité míry lišit u stejného jedince v různých IQ testech (věk 12–13 let). (Data IQ skórovací tabulky a pseudonymy žáků převzata z popisu normalizační studie KABC-II citované v Kaufman 2009.[8])
ŽákKABC-IIWISC-IIIWJ-III
Asher9095111
Brianno125110105
Colin10093101
Danica116127118
Elfa9310593
Fritz106105105
Georgi9510090
Sekýrovat112113103
Imelda1049697
Jose1019986
Keoku817875
Lev116124102

Stropy subtestů IQ jsou dány jejich rozsahem postupně obtížnějších položek. IQ test se širokou škálou postupně obtížnějších otázek bude mít vyšší strop než test s úzkým rozsahem a několika obtížnými položkami. Efekty stropu vedou k neschopnosti zaprvé rozlišovat mezi nadanými (zda jsou středně nadaní, hluboce nadaní atd.) A zadruhé vede k chybné klasifikaci některých nadaných lidí jako nadprůměrných, ale nikoli nadaných.

Předpokládejme, že IQ test má tři dílčí testy: slovník, aritmetika a obrazové analogie. Skóre v každém z dílčích testů je normalizováno (viz standardní skóre ) a poté se sčítají a vytvoří se složené skóre IQ. Nyní předpokládejme, že Joe získá maximální skóre 20 v aritmetickém testu, ale získá 10 z 20 v testech slovní zásoby a analogií. Je spravedlivé říci, že Joeovo celkové skóre 20 + 10 + 10 nebo 40 představuje jeho celkovou schopnost? Odpověď zní ne, protože Joe v aritmetickém testu dosáhl maximálního možného skóre 20. Pokud by aritmetický test zahrnoval další, obtížnější položky, mohl by Joe za tento subtest získat 30 bodů, což by vedlo k „opravdovému“ skóre 30 + 10 + 10 nebo 50. Porovnejte Joeův výkon s výkonem Jima, který zaznamenal 15 + 15 + 15 = 45, aniž by narazil na stropy subtestů. V původní formulaci testu si Jim vedl lépe než Joe (45 versus 40), zatímco je to Joe, kdo ve skutečnosti měl dosáhnout vyššího „celkového“ skóre inteligence než Jim (skóre 50 pro Joe versus 45 pro Jim) pomocí přeformulovaný test, který zahrnuje složitější aritmetické položky.

Spisy o nadaném vzdělávání přinášejí dva důvody, proč se domnívat, že některá skóre IQ jsou podhodnocením inteligence testujícího:

  1. mají tendenci provádět všechny dílčí testy lépe než méně talentovaní lidé;
  2. mají tendenci dělat mnohem lépe u některých subtestů než u jiných, což zvyšuje variabilitu mezi subtesty a šanci, že dojde ke stropu.

Statistická analýza

Stropní účinky na měření kompromitují vědeckou pravdu a porozumění prostřednictvím řady souvisejících statistických aberací.

Za prvé, stropy narušují schopnost vyšetřovatelů určit centrální tendenci údajů. Pokud se stropní efekt týká dat shromážděných na závislé proměnné, může nerozpoznání tohoto stropního efektu „vést k mylnému závěru, že nezávislá proměnná nemá žádný účinek“.[3] Z matematických důvodů přesahujících rámec tohoto článku (viz analýza rozptylu ), tato potlačená odchylka snižuje citlivost vědeckých experimentů určených k určení, zda se průměr jedné skupiny významně liší od průměru jiné skupiny. Například léčba poskytnutá jedné skupině může vyvolat účinek, ale účinek může uniknout detekci, protože průměr léčené skupiny nebude vypadat dostatečně odlišně od průměru neošetřené skupiny.

„Stropní efekty jsou tedy komplexem záležitostí a jejich zamezení je věcí pečlivého vyhodnocení řady záležitostí.“[3]

Prevence

Jelikož stropní efekty zabraňují přesné interpretaci dat, je důležité se pokusit zabránit jejich vzniku nebo použít jejich přítomnost k úpravě použitého nástroje a postupů. Vědci se mohou pokusit zabránit účinkům stropu pomocí řady metod. Prvním z nich je výběr dříve ověřeného opatření přezkoumáním minulých výzkumů. Pokud neexistují žádná validovaná opatření, lze pilotní testování provést pomocí navrhovaných metod. Pilotní testování nebo provádění a pilotní experiment, zahrnuje malou zkoušku nástrojů a postupů před vlastním experimentem, což umožňuje uznat, že je třeba provést úpravy za účelem co nejúčinnějšího a nejpřesnějšího sběru dat. Pokud vědci používají design, který nebyl dříve validován, lze k posouzení přítomnosti stropních efektů použít kombinaci průzkumů zahrnujících původně navržený a jiný podporovaný v minulé literatuře.[9] Pokud jakýkoli výzkum, zejména pilotní studie, vykazuje efekt stropu, je třeba vyvinout úsilí k úpravě nástroje tak, aby byl účinek zmírněn a mohl být proveden informativní výzkum.[2]

Viz také

Poznámky

  1. ^ „Efekt zmenšení měřítka - metody výzkumu SAGE“. methods.sagepub.com. Citováno 22. října 2020.
  2. ^ A b "Stropní efekt". Encyclopedia of Research Design. 2455 Teller Road, Thousand Oaks Kalifornie 91320 USA: SAGE Publications, Inc. 2010. doi:10.4135 / 9781412961288.n44. ISBN  9781412961271.CS1 maint: umístění (odkaz)
  3. ^ A b C Cramer 2005, str. 21
  4. ^ Randall, D.M .; Fernandes, M.F. (1991). „Předpojatost reakce na sociální žádanost v etickém výzkumu“. Journal of Business Ethics. 10 (11): 805–817. doi:10.1007 / BF00383696.
  5. ^ Vogt 2005, str. 40
  6. ^ Po 1998, str. 20
  7. ^ Dykiert, Dominika; Der, Geoff; Starr, John M .; Vážení, Ian J. (11. října 2012). „Věkové rozdíly v intraindividuální variabilitě v jednoduchém a volitelném reakčním čase: Systematický přehled a metaanalýza“. PLOS One. 7 (10): e45759. Bibcode:2012PLoSO ... 745759D. doi:10.1371 / journal.pone.0045759. PMC  3469552. PMID  23071524.
  8. ^ Kaufman 2009, str. 151–153
  9. ^ J., Privitera, Gregory (27. ledna 2016). Metody výzkumu pro behaviorální vědy (Druhé vydání.). Los Angeles. ISBN  9781506326573. OCLC  915250239.

Bibliografie

Další čtení

Můžete také vidět toto: https://methods.sagepub.com/Reference/encyc-of-research-design/n44.xml

externí odkazy