Vzdělávací hodnocení - Educational assessment
Vzdělávací hodnocení nebo vzdělávací hodnocení[1] je systematický proces dokumentování a pomocí empirických údajů o znalost, dovednost, postoje a víry zdokonalit programy a zlepšit učení studentů.[2] Údaje o hodnocení lze získat z přímého zkoumání práce studentů za účelem posouzení výsledků učení nebo mohou být založeny na datech, z nichž lze vyvodit závěry o učení.[3] Hodnocení se často používá zaměnitelně s testem, ale neomezuje se pouze na testy.[4] Hodnocení se může zaměřit na jednotlivého studenta, učící se komunitu (třída, workshop nebo jiná organizovaná skupina studentů), kurz, akademický program, instituci nebo vzdělávací systém jako celek (také známý jako granularity). Slovo „hodnocení“ se ve vzdělávacím kontextu začalo používat po druhé světové válce.[5]
Jako kontinuální proces hodnocení zavádí měřitelné a jasné výsledky učení studentů pro učení, poskytuje dostatečné množství vzdělávacích příležitostí k dosažení těchto výsledků, zavádí systematický způsob shromažďování, analýzy a interpretace důkazů, aby určil, jak dobře učení studentů odpovídá očekáváním, a využívá shromážděné informace informují o zlepšení učení studentů.[6]
Konečný účel postupů hodnocení ve vzdělávání závisí na teoretický rámec praktiků a vědců, jejich předpokladů a přesvědčení o povaze lidské mysli, původu znalostí a procesu učení.
Typy
Termín Posouzení se obecně používá k označení všech činností, které učitelé používají k tomu, aby pomohli studentům učit se a měřili pokrok studentů.[7] Hodnocení lze kvůli pohodlí rozdělit pomocí následujících kategorizací:
- Umístění, formativní, sumativní a diagnostické hodnocení
- Objektivní a subjektivní
- Odkazy (odkazované na kritérium, odkazované na normu a ipsative (vynucená volba) )
- Neformální a formální
- Interní a externí
Umístění, formativní, sumativní a diagnostické
Hodnocení je často rozděleno do počáteční, formativní a sumativní kategorie za účelem zvážení různých cílů postupů hodnocení.
- Hodnocení umístění - Hodnocení umístění se používá k umisťování studentů podle předchozího úspěchu nebo osobních charakteristik, na nejvhodnější místo v pořadí výuky, v jedinečné výukové strategii nebo s vhodným učitelem[8] provedeno prostřednictvím testování umístění, tj. testy, které vysoké školy a univerzity používají k hodnocení připravenosti školy a zařazení studentů do jejich počátečních tříd. Hodnocení umístění, označované také jako předběžné nebo počáteční hodnocení, se provádí před instrukcí nebo intervencí, aby se stanovila základní linie, ze které lze měřit růst jednotlivých studentů. Tento typ hodnocení se používá ke zjištění, jaká je úroveň dovedností studenta v daném předmětu. Pomáhá učiteli efektivněji vysvětlovat materiál. Tato hodnocení nejsou hodnocena.[9]
- Formativní hodnocení - Formativní hodnocení se obvykle provádí v průběhu kurzu nebo projektu. Na podporu učení se používá formativní hodnocení, označované také jako „vzdělávací hodnocení“. Ve vzdělávacím prostředí může být formativním hodnocením učitel (nebo peer ) nebo student, poskytující zpětnou vazbu o práci studenta a nemusel by být nutně používán pro účely klasifikace. Formativní hodnocení mohou mít formu diagnostických, standardizovaných testů, kvízů, otázek k ústnímu zodpovězení nebo návrhů prací. Formativní hodnocení se provádí souběžně s pokyny. Výsledek se může počítat. Cílem formativních hodnocení je před souhrnným hodnocením zjistit, zda studenti instrukci rozumí.[9]
- Souhrnné hodnocení - Souhrnné hodnocení se obvykle provádí na konci kurzu nebo projektu. Ve vzdělávacím prostředí se souhrnná hodnocení obvykle používají k přiřazení hodnocení kurzu studentům. Souhrnná hodnocení jsou hodnotící. Provádí se souhrnná hodnocení, která shrnují, co se studenti naučili, a určují, zda učivu dobře rozumí. Tento typ hodnocení je obvykle klasifikován (např. Prospěl / nevyhověl, 0-100) a může mít formu testů, zkoušek nebo projektů. Souhrnná hodnocení se často používají k určení, zda student ve třídě obstál nebo neuspěl. Kritika souhrnného hodnocení spočívá v tom, že jsou reduktivní a studenti zjistí, jak dobře získali znalosti příliš pozdě na to, aby je bylo možné použít.[9]
- Diagnostické hodnocení - Diagnostické hodnocení se zabývá všemi obtížemi na konci, ke kterému dojde během procesu učení.
Jay McTighe a Ken O'Connor navrhli sedm postupů pro efektivní učení.[9] Jedním z nich je ukázat kritéria hodnocení před testem. Další je o důležitosti předběžného hodnocení, aby bylo možné zjistit, jaké jsou úrovně dovedností studenta, než vydá pokyny. Další praktiky jsou poskytování zpětné vazby a povzbuzení.
Výzkumný pracovník ve výzkumu Robert Stake[10] vysvětluje rozdíl mezi formativním a sumativním hodnocením pomocí následující analogie:
Když kuchař ochutná polévku, je to formativní. Když hosté ochutnají polévku, je to souhrnné.[11]
Souhrnné a formativní hodnocení se v kontextu učení často označuje jako hodnocení učení a hodnocení pro učení resp. Hodnocení učení má obecně souhrnnou povahu a je určeno k měření výsledků učení a hlášení těchto výsledků studentům, rodičům a správcům. Hodnocení učení se obvykle provádí na konci třídy, kurzu, semestru nebo akademického roku. Hodnocení pro učení má obecně formativní charakter a používají ho učitelé k zvažování přístupů k výuce a dalších kroků pro jednotlivé studenty a třídu.[12]
Běžnou formou formativního hodnocení je diagnostické hodnocení. Diagnostické hodnocení měří současné znalosti a dovednosti studenta za účelem identifikace vhodného programu učení. Sebehodnocení je forma diagnostického hodnocení, které zahrnuje hodnocení studentů. Výhledové hodnocení žádá hodnocené, aby se v budoucích hypotetických situacích považovali.[13]
Hodnocení založené na výkonu je podobné souhrnnému hodnocení, protože se zaměřuje na výsledky. Často je v souladu s reforma vzdělávání založená na standardech a vzdělávání založené na výsledcích hnutí. I když v ideálním případě se výrazně liší od tradičního testu s výběrem z více možností, nejčastěji se s ním spojují hodnocení založené na normách které využívají odpovědi ve formě volných formulářů na standardní otázky hodnocené lidskými zapisovateli v měřítku založeném na standardech, přičemž se setkávají, klesají pod nebo překračují výkonnostní standard, místo aby byly hodnoceny na křivce. Je identifikován dobře definovaný úkol a studenti jsou požádáni, aby něco vytvořili, vytvořili nebo udělali, často v prostředí, které zahrnuje aplikaci znalostí a dovedností v reálném světě. Odbornost je prokázána poskytnutím rozšířené odezvy. Výkonové formáty se dále rozlišují na produkty a výkony. Výsledkem představení může být produkt, jako je malba, portfolio, papír nebo výstava, nebo se může skládat z představení, jako je řeč, atletické dovednosti, hudební recitál nebo čtení.
Objektivní a subjektivní
Hodnocení (sumativní nebo formativní) je často kategorizováno jako objektivní nebo subjektivní. Objektivní hodnocení je forma dotazování, která má jedinou správnou odpověď. Subjektivní hodnocení je forma dotazování, která může mít více než jednu správnou odpověď (nebo více než jeden způsob vyjádření správné odpovědi). Existují různé typy objektivních a subjektivních otázek. Objektivní typy otázek zahrnují pravdivé / nepravdivé odpovědi, výběr z několika možností, více odpovědí a párování otázek. Subjektivní otázky zahrnují otázky a eseje s rozšířenou odpovědí. Objektivní hodnocení je vhodné pro stále populárnější počítačové nebo online hodnocení formát.
Někteří argumentovali tím, že rozdíl mezi objektivním a subjektivním hodnocením není ani užitečný, ani přesný, protože ve skutečnosti neexistuje nic jako „objektivní“ hodnocení. Ve skutečnosti jsou všechna hodnocení vytvářena s přirozenými předsudky zabudovanými do rozhodování o příslušných tématech a obsahu, stejně jako s předsudky kulturními (třídními, etnickými a genderovými).[14]
Základ pro srovnání
Výsledky testu lze porovnat se stanoveným kritériem nebo s výkonem ostatních studentů nebo s předchozím výkonem:
- Posouzení podle kritérií, obvykle pomocí a test podle kritérií, jak název napovídá, nastává, když jsou kandidáti měřeni podle definovaných (a objektivních) kritérií. Hodnocení založené na kritériích se často, ale ne vždy, používá ke stanovení kompetence osoby (zda může něco udělat). Nejznámějším příkladem hodnocení podle kritérií je řidičský test, kdy se učící se řidiči měří podle řady výslovných kritérií (například „Neohrožuje ostatní účastníky silničního provozu“).
- Posouzení podle norem (hovorově známý jako „třídění na křivce "), obvykle pomocí a test podle normy, není měřeno podle definovaných kritérií. Tento typ hodnocení se týká studentského orgánu, který hodnocení provádí. Je to efektivně způsob srovnání studentů. IQ test je nejznámějším příkladem hodnocení podle norem. Mnoho vstupních testů (na prestižní školy nebo univerzity) odkazuje na normy, což umožňuje absolvovat pevný podíl studentů („absolvování“ v tomto kontextu znamená přijetí na školu nebo univerzitu spíše než na výslovnou úroveň schopností). To znamená, že standardy se mohou rok od roku lišit, v závislosti na kvalitě kohorty; hodnocení podle kritérií se rok od roku neliší (pokud se kritéria nezmění).[15]
- Ipsativní hodnocení je vlastní srovnání buď ve stejné doméně v průběhu času, nebo srovnávací s jinými doménami ve stejném studentovi.
Neformální a formální
Hodnocení může být buď formální nebo neformální. Formální posouzení obvykle zahrnuje písemný dokument, například test, kvíz nebo referát. Formálnímu hodnocení se uděluje číselné skóre nebo známka na základě výkonu studenta, zatímco neformální hodnocení nepřispívá ke konečné známce studenta. Neformální hodnocení obvykle probíhá neformálnějším způsobem a může zahrnovat pozorování, soupisy, kontrolní seznamy, stupnice hodnocení, rubriky, hodnocení výkonnosti a portfolia, účast, vzájemné hodnocení a sebehodnocení a diskuse.[16]
Interní a externí
Interní hodnocení stanoví a označí škola (tj. Učitelé). Studenti získají známku a zpětnou vazbu týkající se hodnocení. Externí hodnocení je stanoveno řídícím orgánem a je označeno neobjektivním personálem. Některá externí hodnocení poskytují při hodnocení mnohem omezenější zpětnou vazbu. V testech, jako je australský NAPLAN, je však kritériem, kterému se studenti věnují, poskytnuta podrobná zpětná vazba, aby jejich učitelé mohli řešit a porovnávat studijní úspěchy studentů a také plánovat budoucnost.
Standardy kvality
Obecně se za vysoce kvalitní hodnocení považují hodnocení s vysokou úrovní spolehlivost a platnost. Přístupy ke spolehlivosti a platnosti se však liší.
Spolehlivost
Spolehlivost souvisí s konzistencí hodnocení. Spolehlivé hodnocení je takové, které soustavně dosahuje stejných výsledků se stejnou (nebo podobnou) kohortou studentů. Spolehlivost ovlivňují různé faktory - včetně nejednoznačných otázek, příliš mnoha možností v dotazníku, nejasných pokynů pro značení a špatně proškolených značek. Spolehlivost hodnocení je tradičně založena na následujícím:
- Časová stabilita: Výkon v testu je srovnatelný při dvou nebo více různých příležitostech.
- Ekvivalence formulářů: Výkon zkoumaných je ekvivalentní v různých formách testu založeného na stejném obsahu.
- Interní konzistence: Odpovědi na test jsou konzistentní napříč otázkami. Například: V průzkumu, který žádá respondenty, aby hodnotili postoje k technologii, lze očekávat konzistenci v odpovědích na následující otázky:
- „Cítím se obecně velmi negativně vůči počítačům.“
- „Rád používám počítače.“[17]
Spolehlivost měření x lze také definovat kvantitativně jako: kde je spolehlivost ve sledovaném (testovacím) skóre, x; a jsou variabilita „skutečného“ (tj. vrozeného výkonu kandidáta) a naměřených výsledků testů. může se pohybovat od 0 (zcela nespolehlivý) do 1 (zcela spolehlivý).
Platnost
Platný hodnocení je takové, které měří to, co má měřit. Například by nebylo platné hodnotit řidičské dovednosti pouze písemným testem. Platnějším způsobem hodnocení řidičských dovedností by byla kombinace testů, které by pomohly určit, co řidič ví, například písemný test řidičských znalostí a co je řidič schopen udělat, například prostřednictvím hodnocení výkonu skutečných řidičů. řízení. Učitelé si často stěžují, že některé zkoušky řádně neposuzují osnovy na kterém je zkouška založena; ve skutečnosti zpochybňují platnost zkoušky.
Platnost posouzení se obecně měří zkoumáním důkazů v následujících kategoriích:
- Obsah - Stanovuje obsah testovacího opatření cíle?
- Kritérium - Souvisí skóre s externím odkazem? (např.: Předpovídají vysoké skóre ve čtenářském testu 4. ročníku přesně předpověď čtenářské dovednosti v budoucích ročnících?)
- Construct - Odpovídá hodnocení jiným významným proměnným? (např ESL studenti na zkoušce z písemného projevu důsledně vystupují jinak než rodilí mluvčí?)[18]
Dobré hodnocení má platnost i spolehlivost a další atributy kvality uvedené výše pro konkrétní kontext a účel. V praxi je hodnocení zřídka zcela platné nebo zcela spolehlivé. Pravítko, které je označeno nesprávně, bude vždy poskytovat stejné (nesprávné) rozměry. Je to velmi spolehlivé, ale ne příliš platné. Jako příklad hodnocení, které je platné, ale nespolehlivé, se někdy používá požádání náhodných jednotlivců, aby řekli čas, aniž by se dívali na hodiny nebo hodinky. Odpovědi se budou mezi jednotlivci lišit, ale průměrná odpověď se pravděpodobně blíží skutečnému času. V mnoha oblastech, jako je lékařský výzkum, testování ve vzdělávání a psychologie, často dojde ke kompromisu mezi spolehlivostí a platností. Test historie napsaný pro vysokou platnost bude mít mnoho esejů a otázek typu fill-in-the-blank. Bude to dobrá míra zvládnutí předmětu, ale obtížné dosáhnout úplně přesného skóre. Test historie napsaný pro vysokou spolehlivost bude mít na výběr. Není to tak dobré v měření znalostí historie, ale lze jej snadno zaznamenat s velkou přesností. Z toho můžeme zobecnit. Čím spolehlivější je náš odhad toho, co chceme měřit, tím méně jsme si jisti, že ve skutečnosti měříme tento aspekt dosažení.
Je dobré rozlišovat mezi „předmětnou“ platností a „prediktivní“ platností. První z nich, široce používaný ve vzdělávání, předpovídá skóre, které by student získal v podobném testu, ale s různými otázkami. Druhá možnost, široce používaná na pracovišti, předpovídá výkon. Je tedy vhodná věcná zkouška znalostí pravidel řízení, zatímco prediktivně platná zkouška by posoudila, zda by potenciální řidič mohl tato pravidla dodržovat.
Standardy hodnocení
V oblasti hodnocení, a zejména vzdělávací hodnocení, Smíšený výbor pro standardy pro hodnocení vzdělávání vydala tři soubory standardů pro hodnocení. The Standardy hodnocení zaměstnanců byly publikovány v roce 1988,[19] Standardy hodnocení programu (2. vydání) byly publikovány v roce 1994,[20] a Standardy hodnocení studentů byly publikovány v roce 2003.[21]
Každá publikace představuje a rozpracovává soubor standardů pro použití v různých vzdělávacích prostředích. Standardy poskytují pokyny pro navrhování, provádění, hodnocení a zlepšování identifikované formy hodnocení. Každý ze standardů byl zařazen do jedné ze čtyř základních kategorií, aby podporoval vzdělávací hodnocení, které je správné, užitečné, proveditelné a přesné. V těchto sadách norem se v rámci tématu přesnosti zabývá aspekty platnosti a spolehlivosti. Například standardy přesnosti studentů pomáhají zajistit, aby hodnocení studentů poskytovala spolehlivé, přesné a důvěryhodné informace o učení a výkonu studentů.
Ve Velké Británii je k dispozici ocenění v oblasti školení, hodnocení a zajišťování kvality (TAQA), které pomáhá zaměstnancům učit se a rozvíjet osvědčené postupy v souvislosti s hodnocením vzdělávání v kontextech vzdělávání dospělých a dalšího vzdělávání a odborné přípravy.[22]
Souhrnná tabulka hlavních teoretických rámců
Následující tabulka shrnuje hlavní teoretické rámce téměř za celou teoretickou a výzkumnou prací a za výukovou praxi ve výuce (jednou z nich je samozřejmě praxe hodnocení). Tyto různé rámce vedly k zajímavým debatám mezi vědci.
TÉMATA | EMPIRISMUS | RACIONALISMUS | Sociokulturalismus |
---|---|---|---|
Filozofická orientace | Hume: Britský empirismus | Kant, Descartes: Kontinentální racionalismus | Hegel, Marx: kulturní dialektika |
Metaforická orientace | Mechanismus / provoz stroje nebo počítače | Organismus / růst rostliny | Kontextualista / Zkoumání historické události |
Přední teoretici | B. F. Skinner (behaviorismus )/ Bylina Simon, John Anderson, Robert Gagné: (kognitivismus ) | Jean Piaget /Robbie Case | Lev Vygotsky, Luria, Bruner / Alan Collins, Jim Greeno, Ann Brown, John Bransford |
Povaha mysli | Zpočátku prázdné zařízení, které detekuje vzory ve světě a pracuje na nich. Kvalitativně shodný s nižšími zvířaty, ale kvantitativně lepší. | Orgán, který se vyvinul, aby získal znalosti tím, že dává smysl světu. Jedinečně člověk, kvalitativně odlišný od nižších zvířat. | Unikátní mezi druhy pro rozvoj jazyka, nástrojů a vzdělávání. |
Povaha poznání (epistemologie) | Hierarchicky organizovaná sdružení, která představují přesnou, ale neúplnou reprezentaci světa. Předpokládá, že součet složek znalostí je stejný jako celek. Protože znalosti přesně reprezentují komponenty, předpokládá se, že ten, kdo tyto komponenty předvede, bude vědět | Obecné a / nebo specifické kognitivní a koncepční struktury vytvořené myslí a podle racionálních kritérií. V podstatě se jedná o struktury na vyšší úrovni, které jsou konstruovány tak, aby asimilovaly nové informace ke stávající struktuře a protože struktury pojmou více nových informací. Znalosti představují schopnost řešit nové problémy. | Distribuováno mezi lidi, komunity a fyzické prostředí. Představuje kulturu komunity, která ji nadále vytváří. Znát znamená být naladěn na omezení a možnosti systémů, ve kterých k činnosti dochází. Znalosti jsou zastoupeny v zákonitostech úspěšné činnosti. |
Povaha učení (proces, kterým se zvyšují nebo mění znalosti) | Formování a posilování kognitivních nebo S-R asociací. Generování znalostí (1) vystavením vzorům, (2) účinnému rozpoznávání a reakci na vzor (3) rozpoznávání vzorů v jiných kontextech. | Zapojení do aktivního procesu vytváření smyslu („racionalizace“) prostředí. Nezapomeňte použít stávající strukturu na novou zkušenost a racionalizovat ji. Opravdu se komponenty nenaučíte, pouze struktury potřebné k pozdějšímu řešení těchto komponent. | Zvyšování schopnosti účastnit se konkrétní komunity praxe. Zasvěcení do života skupiny, posílení schopnosti účastnit se naladěním na omezení a finanční náklady. |
Vlastnosti autentického hodnocení | Posoudit složky znalostí. Zaměřte se na zvládnutí mnoha komponent a plynulost. Standardizujte pomocí psychometrie. | Posoudit rozšířený výkon u nových problémů Úvěrové odrůdy excelence. | Posouzení účasti na dotazování a sociálních praktikách učení (např. Portfolia, pozorování) Studenti by se měli účastnit procesu hodnocení. Hodnocení by měla být integrována do širšího prostředí. |
Kontroverze
Obavy z toho, jak nejlépe uplatnit postupy hodnocení napříč veřejnými školskými systémy, se do značné míry zaměřily na otázky týkající se použití testů s vysokými sázkami a standardizovaných testů, které se často používají k měření pokroku studentů, kvality učitelů a školního, okresního nebo celostátního vzdělávacího úspěchu .
Žádné dítě nezůstalo pozadu
U většiny výzkumníků a odborníků není otázkou, zda by testy měly být vůbec podávány - existuje obecná shoda, že pokud jsou testy podávány užitečnými způsoby, mohou poskytnout užitečné informace o pokroku studentů a implementaci kurikula, stejně jako nabídnout formativní využití pro studující.[23] Skutečným problémem tedy je, zda testovací postupy, jak jsou v současné době implementovány, mohou poskytnout tyto služby pedagogům a studentům.
Prezident Bush podepsal zákon NCLB (No Child Left Behind Act) 8. ledna 2002. Zákon NCLB znovu schválil zákon o základním a středním školství (ESEA) z roku 1965. Prezident Johnson podepsal ESEA, aby pomohl bojovat proti válce proti chudobě, a pomohl financovat základní a střední školy. Cílem prezidenta Johnsona bylo zdůraznit rovný přístup ke vzdělání a zavést vysoké standardy a odpovědnost. Zákon o NCLB vyžadoval, aby státy vypracovaly hodnocení základních dovedností. Aby státy získaly federální financování škol, musely dát tato hodnocení všem studentům na úrovni vybraných ročníků.
V USA Zákon o nezůstávajícím dítěti nařizuje standardizované testování na celostátní úrovni. Tyto testy odpovídají státnímu vzdělávacímu programu a spojují odpovědnost učitele, studenta, okresu a státu s výsledky těchto testů. Zastánci NCLB argumentují, že nabízí hmatatelnou metodu měření úspěchu ve vzdělávání, odpovědnost učitelů a škol za neúspěšné výsledky a uzavření mezera v úspěchu napříč třídami a etnikem.[24]
Odpůrci standardizovaného testování s těmito tvrzeními nesouhlasí a tvrdí, že odpovědnost učitelů za výsledky testů vede k praxi „výuka k testu Mnozí navíc tvrdí, že zaměření na standardizované testování povzbuzuje učitele, aby vybavili studenty úzkou sadou dovedností, které zvyšují výkon testů, aniž by skutečně podporovaly hlubší pochopení učiva nebo klíčových principů v oblasti znalostí.[25]
Testování vysokých sázek
Hodnocení, která v USA vyvolala největší polemiku, je použití maturitní zkoušky, které se používají k zamítnutí diplomů studentům, kteří navštěvují střední školu čtyři roky, ale nemohou prokázat, že se při psaní zkoušek naučili požadovaný materiál. Oponenti říkají, že žádný student, který se zapsal do čtyř let doba sedačky by měl být odepřen středoškolský diplom pouze za to, že opakovaně selhal v testu, nebo dokonce za to, že neznal požadovaný materiál.[26][27][28]
Testy vysoké sázky byly obviňovány z vyvolání nemoci a test úzkosti u studentů a učitelů a pro učitele, kteří se rozhodnou zúžit učební plán na to, o čem učitel věří, že bude testován. Ve cvičení, které má dětem usnadnit testování, a Spokane, Washington noviny zveřejnily obrázek a netvor který se živí strachem.[29] Zveřejněný obrázek je údajně odpovědí studentky, která byla požádána, aby nakreslila obrázek toho, co si myslela o hodnocení stavu.
Další kritici, například Washington State University Don Orlich, zpochybňují použití testovaných položek daleko nad standardní kognitivní úrovně pro věk studentů.[30]
Ve srovnání s hodnocením portfolia jsou jednoduché testy s výběrem z více možností mnohem levnější, méně náchylné k neshodám mezi zapisovateli a lze je vyhodnotit dostatečně rychle, aby mohly být vráceny před koncem školního roku. Standardizované testy (všichni studenti absolvují stejný test za stejných podmínek) z těchto důvodů často používají testy s výběrem odpovědí. Orlich kritizuje použití drahých, holisticky odstupňovaných testů namísto levných „bublinových testů“ s možností výběru z více možností k měření kvality systému i jednotlivců u velmi vysokého počtu studentů.[30] Mezi další významné kritiky testování vysokých sázek patří Nejférovější a Alfie Kohn.
Použití IQ testy byl v některých státech zakázán pro vzdělávací rozhodnutí a normou odkazované testy, kteří hodnotí studenty od „nejlepších“ po „nejhorší“, byli kritizováni za zaujatost vůči menšinám. Většina školských úředníků podporuje testy založené na kritériích (skóre každého jednotlivého studenta závisí výhradně na tom, zda správně odpověděl na otázky, bez ohledu na to, zda jeho sousedé udělali lepší nebo horší) pro rozhodování o vysokých sázkách.
Posouzení 21. století
Bylo všeobecně známo, že se vznikem sociální média a Web 2.0 technologie a myšlení, učení stále více spolupracuje a znalosti jsou stále více distribuovány mezi mnoho členů učící se komunity. Tradiční postupy hodnocení se však z velké části zaměřují na jednotlivce a nezohledňují budování znalostí a učení v kontextu. Vzhledem k tomu, že vědci v oblasti hodnocení berou v úvahu kulturní posuny, které vyplývají ze vzniku více participativní kultura, budou muset najít nové metody aplikace hodnocení na studenty.[31]
Rozsáhlé hodnocení učení
Hlavní článek: Rozsáhlé hodnocení učení
Hodnocení učení ve velkém měřítku (LSLA) jsou hodnocení na úrovni systému, která poskytují přehled výsledků učení pro skupinu studentů v daném roce a v omezeném počtu domén. Často jsou kategorizovány jako národní nebo nadnárodní hodnocení a upozorňují na problémy spojené s úrovněmi učení a determinanty učení, včetně učitel kvalifikace; kvalita škola prostředí; rodičovská podpora a vedení; a sociální a emocionální zdraví ve školách i mimo ně.[32]
Hodnocení v demokratické škole
The Sudbury model školy demokratického vzdělávání neprovádějí a nenabízejí hodnocení, hodnocení, přepisy ani doporučení. Tvrdí, že nehodnotí lidi a že škola není soudcem; vzájemné srovnávání studentů nebo s nějakým standardem, který byl stanoven, je pro ně porušením studenta právo na soukromí a sebeurčení. Studenti se sami rozhodnou, jak měřit svůj postup jako samostartující žáci jako proces autoevaluace: tvrdí se o skutečném celoživotním učení a správném hodnocení vzdělávání pro 21. století. [33]
Podle sudburyských škol tato politika nezpůsobuje újmu jejich studentům při přechodu k životu mimo školu. Přiznávají však, že to celý proces ztěžuje, ale že takové strádání je součástí toho, že se studenti učí dělat si vlastní cestu, stanovit si vlastní standardy a plnit své vlastní cíle.
Zásady no-grading a no-rating pomáhá vytvářet atmosféru bez konkurence mezi studenty nebo bitev o souhlas dospělých a podporuje pozitivní prostředí pro spolupráci mezi studentským sborem.[34]
Konečnou fází vzdělávání v Sudbury je diplomová práce, pokud se student rozhodne ji absolvovat. Každý student píše na téma, jak se připravil na dospělost a na vstup do celé komunity. Tato práce je předložena shromáždění, které ji posoudí. Závěrečnou fází procesu diplomové práce je ústní obhajoba studenta, při které se otevírá prostor pro otázky, výzvy a komentáře všech členů shromáždění. Na konci shromáždění hlasuje tajným hlasováním o tom, zda udělit diplom nebo ne.[35]
Hodnocení studentů ELL
Hlavním problémem při používání hodnocení vzdělávání je celková platnost, přesnost a spravedlnost, pokud jde o hodnocení studentů anglického jazyka (ELL). Většina hodnocení ve Spojených státech má normativní standardy založené na anglicky mluvící kultuře, která dostatečně nereprezentuje populace ELL.[36] V důsledku toho by bylo v mnoha případech nepřesné a nevhodné vyvozovat závěry z normativních skóre studentů ELL. Výzkum ukazuje, že většina škol vhodně nemění hodnocení, aby vyhověla studentům z jedinečných kulturních prostředí.[36] To vedlo k nadměrnému postoupení studentů ELL na speciální pedagogiku, což způsobilo jejich nepřiměřené zastoupení ve speciálních vzdělávacích programech. I když někteří mohou toto nevhodné umístění ve speciální pedagogice považovat za podpůrné a užitečné, výzkum ukázal, že nevhodně umístění studenti ve skutečnosti postupovali.[36]
Často je nutné využít služeb překladatele, aby bylo možné administrovat hodnocení v rodném jazyce studenta ELL; při překladu hodnotících položek však existuje několik problémů. Jedním problémem je, že překlady mohou často naznačovat správnou nebo očekávanou odpověď, což mění obtížnost položky hodnocení.[37] Překlad položek posouzení může navíc někdy narušit původní význam položky.[37] A konečně, mnoho překladatelů není kvalifikovaných ani řádně vyškolených pro práci se studenty ELL v hodnotící situaci.[36] Všechny tyto faktory narušují platnost a nestrannost hodnocení, takže výsledky nejsou spolehlivé. Neverbální hodnocení se ukázala být méně diskriminační pro studenty ELL, nicméně někteří stále vykazují kulturní předsudky v položkách hodnocení.[37]
Při zvažování studenta ELL pro speciální vzdělávání by měl hodnotící tým integrovat a interpretovat všechny shromážděné informace, aby byl zajištěn neobjektivní závěr.[37] Rozhodnutí by mělo být založeno na vícerozměrných zdrojích údajů, včetně rozhovorů s učiteli a rodiči, jakož i pozorování ve třídě.[37] Rozhodnutí by měla vzít v úvahu jedinečné kulturní, jazykové a zážitkové zázemí studentů a neměla by být striktně založena na výsledcích hodnocení.
Univerzální promítání
Hodnocení může být spojeno s disparitou, když jsou studenti z tradičně nedostatečně zastoupených skupin vyloučeni z testování nutného pro přístup k určitým programům nebo příležitostem, jako je tomu v případě nadaný programy. Jedním ze způsobů, jak bojovat s touto nerovností, je univerzální screening, který zahrnuje testování všech studentů (například pro nadání) namísto testování pouze některých studentů na základě doporučení učitelů nebo rodičů. Univerzální screening vede k velkému nárůstu tradičně nedostatečně podporovaných skupin (jako jsou černé, hispánské, chudé, ženské a ELL) identifikovaných pro nadané programy, aniž by byly jakkoli upravovány standardy pro identifikaci.[38]
Viz také
- Počítačem podporované hodnocení
- Koncept inventáře
- Učení založené na důvěře přesně měří kvalitu znalostí studenta měřením jak správnosti jeho znalostí, tak důvěry dané osoby v tyto znalosti.
- Uniknout, technologie a přístup, který se zaměřuje konkrétně na hodnocení kreativity a spolupráce.
- Vzdělávací cíle a cíle
- Vzdělávací hodnocení se konkrétně zabývá hodnocením, protože se vztahuje na vzdělávací prostředí. Jako příklad může být použit v Žádné dítě nezůstalo pozadu (NCLB) vládní program zavedený vláda USA
- Elektronické portfolio je osobní digitální záznam obsahující informace, jako je sbírka artefaktů nebo důkazy ukazující, co člověk ví a může dělat.
- Hodnocení je proces pohledu na to, co se posuzuje, aby se zajistilo, že budou zohledněny ty správné oblasti.
- Hodnocení je proces přiřazování (případně vzájemně se vylučujících) hodnocení studentům.
- Posouzení dopadů na zdraví zkoumá potenciální dopady politik, programů a projektů na zdraví.
- Macabreova konstanta je teoretická zaujatost ve vzdělávacím hodnocení
- Měření je proces hodnocení nebo hodnocení, ve kterém je cílem vyčíslit úroveň dosažených znalostí nebo kompetencí v určité oblasti. Viz Rasch model pro měření za účelem rozpracování koncepčních požadavků těchto procesů, včetně těch, které se týkají klasifikace a použití hrubých skóre z hodnocení.
- Hodnocení programu je v podstatě soubor filozofií a technik k určení, zda program „funguje“.
- Průběžné testování
- Psychometrie, věda měření psychologických charakteristik.
- Rubriky pro hodnocení
- Věda, technologie, společnost a environmentální vzdělávání
- Posouzení sociálních dopadů zkoumá možné sociální dopady navrhovaných nových infrastrukturních projektů, projektů přírodních zdrojů nebo rozvojových aktivit.
- Standardizované testování je jakýkoli test, který se používá v různých školách nebo jiných situacích.
- Hodnocení založené na normách
- Robert E. Vklad je pedagogický pracovník v oblasti hodnocení kurikula.
- Písemné hodnocení
Zdroje
Tento článek včlení text z a bezplatný obsah práce. Licencováno pod CC BY-SA 3.0 IGO. Text převzat z Příslib rozsáhlých hodnocení učení: uznávání limitů pro odemykání příležitostí, UNESCO, UNESCO. UNESCO.
Reference
- ^ Some educators and education theorists use the terms assessment and evaluation to refer to the different concepts of testing during a learning process to improve it (for which the equally unambiguous terms formativní hodnocení nebo formativní hodnocení are preferable) and of testing after completion of a learning process (for which the equally unambiguous terms souhrnné posouzení nebo summative evaluation are preferable), but they are in fact synonyms and do not intrinsically mean different things. Most dictionaries not only say that these terms are synonyms but also use them to define each other. If the terms are used for different concepts, careful editing requires both the explanation that they are normally synonyms and the clarification that they are used to refer to different concepts in the current text.
- ^ Allen, M.J. (2004). Assessing Academic Programs in Higher Education. San Francisco: Jossey-Bass.
- ^ Kuh, G.D.; Jankowski, N.; Ikenberry, S.O. (2014). Knowing What Students Know and Can Do: The Current State of Learning Outcomes Assessment in U.S. Colleges and Universities (PDF). Urbana: University of Illinois and Indiana University, National Institute for Learning Outcomes Assessment.
- ^ National council on Measurement in Education http://www.ncme.org/ncme/NCME/Resource_Center/Glossary/NCME/Resource_Center/Glossary1.aspx?hkey=4bb87415-44dc-4088-9ed9-e8515326a061#anchorA Archivováno 2017-07-22 na Wayback Machine
- ^ Nelson, Robert; Dawson, Phillip (2014). "A contribution to the history of assessment: how a conversation simulator redeems Socratic method". Hodnocení a hodnocení ve vysokoškolském vzdělávání. 39 (2): 195–204. doi:10.1080/02602938.2013.798394. S2CID 56445840.
- ^ Suskie, Linda (2004). Assessing Student Learning. Bolton, MA: Anker.
- ^ Black, Paul, & William, Dylan (October 1998). "Inside the Black Box: Raising Standards Through Classroom Assessment."Phi Beta Kappan. Dostupné v http://www.pdkmembers.org/members_online/members/orders.asp?action=results&t=A&desc=Inside+the+Black+Box%3A+Raising+Standards+Through+Classroom+Assessment&text=&lname_1=&fname_1=&lname_2=&fname_2=&kw_1=&kw_2=&kw_3=&kw_4=&mn1=&yr1=&mn2=&yr2=&c1=[trvalý mrtvý odkaz ] PDKintl.org]. Získaný 28. ledna 2009.
- ^ Madaus, George F .; Airasian, Peter W. (1969-11-30). "Placement, Formative, Diagnostic, and Summative Evaluation of Classroom Learning". Citovat deník vyžaduje
| deník =
(Pomoc) - ^ A b C d Mctighe, Jay; O'Connor, Ken (November 2005). "Seven practices for effective learning". Vzdělávací vedení. 63 (3): 10–17. Citováno 3. března 2017.
- ^ „Archivovaná kopie“. Archivovány od originál dne 8. 2. 2009. Citováno 2009-01-29.CS1 maint: archivovaná kopie jako titul (odkaz)
- ^ Scriven, M. (1991). Evaluation thesaurus. 4. vyd. Newbury Park, CA:Sage publikace. ISBN 0-8039-4364-4.
- ^ Earl, Lorna (2003). Assessment as Learning: Using Classroom Assessment to Maximise Student Learning. Thousand Oaks, CA, Corwin Press. ISBN 0-7619-4626-8
- ^ Reed, Daniel. "Diagnostic Assessment in Language Teaching and Learning." Center for Language Education and Research, available at Google.com Archivováno 14.09.2011 na Wayback Machine. Získaný 28. ledna 2009.
- ^ Joint Information Systems Committee (JISC). "What Do We Mean by e-Assessment?" JISC InfoNet. Retrieved January 29, 2009 from http://tools.jiscinfonet.ac.uk/downloads/vle/eassessment-printable.pdf Archivováno 2016-01-16 na Wayback Machine
- ^ Educational Technologies at Virginia Tech. "Assessment Purposes." VirginiaTech DesignShop: Lessons in Effective Teaching, available at Edtech.vt.edu Archivováno 2009-02-26 na Wayback Machine. Retrieved January 29, 2009.
- ^ Valencia, Sheila W. "What Are the Different Forms of Authentic Assessment?" Understanding Authentic Classroom-Based Literacy Assessment (1997), available at Eduplace.com. Retrieved January 29, 2009.
- ^ Yu, Chong Ho (2005). "Reliability and Validity." Educational Assessment. Dostupné v Creative-wisdom.com. Retrieved January 29, 2009.
- ^ Moskal, Barbara M., & Leydens, Jon A (2000). "Scoring Rubric Development: Validity and Reliability." Practical Assessment, Research & Evaluation, 7(10). Retrieved January 30, 2009.
- ^ Smíšený výbor pro standardy pro hodnocení vzdělávání. (1988). "The Personnel Evaluation Standards: How to Assess Systems for Evaluating Educators". Newbury Park, CA: Sage Publications
- ^ Smíšený výbor pro standardy pro hodnocení vzdělávání. (1994).The Program Evaluation Standards, 2. vydání. Newbury Park, CA: Sage Publications
- ^ Committee on Standards for Educational Evaluation. (2003). The Student Evaluation Standards: How to Improve Evaluations of Students. Newbury Park, CA: Corwin Press
- ^ City & Guilds, Understanding the Principles and Practice of Assessment: Qualification Factsheet, accessed 26 February 2020
- ^ Americká psychologická asociace. "Appropriate Use of High-Stakes Testing in Our Nation's Schools." APA Online, available at APA.org, Retrieved January 24, 2010
- ^ (nd) Reauthorization of NCLB. Ministerstvo školství. Retrieved 1/29/09.
- ^ (nd) What's Wrong With Standardized Testing? FairTest.org. Retrieved January 29, 2009.
- ^ Dang, Nick (18 March 2003). "Reform education, not exit exams". Daily Bruin.
One common complaint from failed test-takers is that they weren't taught the tested material in school. Here, inadequate schooling, not the test, is at fault. Blaming the test for one's failure is like blaming the service station for a failed smog check; it ignores the underlying problems within the 'schooling vehicle.'
[trvalý mrtvý odkaz ] - ^ Weinkopf, Chris (2002). "Blame the test: LAUSD denies responsibility for low scores". Denní zprávy.
The blame belongs to 'high-stakes tests' like the Stanford 9 and California's High School Exit Exam. Reliance on such tests, the board grumbles, 'unfairly penalizes students that have not been provided with the academic tools to perform to their highest potential on these tests'.
- ^ "Blaming The Test". Investiční obchodní den. 11. května 2006.
A judge in California is set to strike down that state's high school exit exam. Proč? Because it's working. It's telling students they need to learn more. We call that useful information. To the plaintiffs who are suing to stop the use of the test as a graduation requirement, it's something else: Evidence of unequal treatment... the exit exam was deemed unfair because too many students who failed the test had too few credentialed teachers. Well, maybe they did, but granting them a diploma when they lack the required knowledge only compounds the injustice by leaving them with a worthless piece of paper."
[trvalý mrtvý odkaz ] - ^ "ASD.wednet.edu". Archivovány od originál dne 25.02.2007. Citováno 2006-09-22.
- ^ A b Bach, Deborah, & Blanchard, Jessica (April 19, 2005). "WASL worries stress kids, schools." Seattle Post-Intelligencer. Retrieved January 30, 2009 from Seattlepi.nwsource.com.
- ^ Fadel, Charles, Honey, Margaret, & Pasnik, Shelley (May 18, 2007). "Assessment in the Age of Innovation." Týden vzdělávání. Retrieved January 29, 2009 from http://www.edweek.org/ew/articles/2007/05/23/38fadel.h26.html
- ^ UNESCO (2019). Příslib rozsáhlých hodnocení učení: uznávání limitů pro odemykání příležitostí. UNESCO. ISBN 978-92-3-100333-2.
- ^ Greenberg, D. (2000). 21st Century Schools, edited transcript of a talk delivered at the April 2000 International Conference on Learning in the 21st Century.
- ^ Greenberg, D. (1987). Chapter 20,Hodnocení, Free at Last — The Sudbury Valley School.
- ^ Graduation Thesis Procedure, Mountain Laurel Sudbury School.
- ^ A b C d http://ehis.ebscohost.com.libdata.lib.ua.edu/eds/pdfviewer/pdfviewer?sid=221ae7c6-6895-4b02-bc69-759936218fba%40sessionmgr104&vid=12&hid=20[mrtvý odkaz ]
- ^ A b C d E „Archivovaná kopie“ (PDF). Archivovány od originál (PDF) dne 2012-05-29. Citováno 2012-04-11.CS1 maint: archivovaná kopie jako titul (odkaz)
- ^ Card, D., & Giuliano, L. (2015). Can universal screening increase the representation of low income and minority students in gifted education? (Working Paper No. 21519). Cambridge, MA: National Bureau of Economic Research. Retrieved from www.nber.org/papers/w21519
Další čtení
- American Educational Research Association, American Psychological Association, & National Council for Measurement in Education. (2014). Standards for Educational and Psychological Testing. Washington, DC: Americká asociace pro výzkum vzdělávání.
- Bennett, R. E. (2015). The changing nature of educational assessment. Review of Research in Education, 39(1), 370-407.
- Brown, G. T. L. (2018). Assessment of Student Achievement. New York: Routledge.
- Carless, David. Excellence in University Assessment: Learning from Award-Winning Practice. London: Routledge, 2015.
- Klinger, D., McDivitt, P., Howard, B., Rogers, T., Munoz, M., & Wylie, C. (2015). Classroom Assessment Standards for PreK-12 Teachers: Joint Committee on Standards for Educational Evaluation.
- Kubiszyn, T., & Borich, G. D. (2012). Educational Testing and Measurement: Classroom Application and Practice (10th ed.). New York: John Wiley & Sons.
- Miller, D. M., Linn, R. L., & Gronlund, N. E. (2013). Measurement and Assessment in Teaching (11th ed.). Boston, MA: Pearson.
- Národní rada pro výzkum. (2001). Knowing What Students Know: The Science and Design of Educational Assessment. Washington, DC: National Academy Press.
- Nitko, A. J. (2001). Educational assessment of students (3rd ed.). Upper Saddle River, N.J.: Merrill.
- Phelps, Richard P., Ed. Oprava klamů ohledně pedagogických a psychologických testů. Washington, DC: American Psychological Association, 2008.
- Phelps, Richard P., Standardized Testing Primer. New York: Peter Lang, 2007.
- Russell, M. K., & Airasian, P. W. (2012). Classroom Assessment: Concepts and Applications (7th ed.). New York: McGraw Hill.
- Shepard, L. A. (2006). Classroom assessment. In R. L. Brennan (Ed.), Educational Measurement (4th ed., pp. 623-646). Westport, CT: Praeger.