MENY

Er leseprøvene gode nok?

Forskarar har etterlyst dokumentasjon på kvaliteten på leseprøver som blir brukt i skolen. Dette har gjort lærarar usikre på kva prøver som er gode nok. Både nasjonale prøver i lesing og dei obligatoriske kartleggingsprøvene i lesing innfrir imidlertid dei etterlyste krava til validitet og reliabilitet.

Elever har prøve Ein fersk forskningsartikkel stiller spørsmål ved kvaliteten på norske lesetestar, men den gir oss ikkje heile biletet, skriv forskarar ved Lesesenterets forskningsenhet for vurdering av lese- og skriveferdighet. (Foto: Getty)

Anne Arnesen med kollegaer stiller i ein nyleg publisert artikkel spørsmål ved kvaliteten på lesetestar som er i bruk i norsk skole. Dette fokuset ønsker vi velkommen. Mange av prøvene som blir brukt i norsk skole har for dårleg kvalitet. Andre prøver bør i større grad dokumentere kvalitet. Vi treng også å finne ut kva verktøy som faktisk ikkje held mål.

På Lesesenteret er vi einige i at det er testutviklaren sitt ansvar å dokumentere kvaliteten av ei prøve. Artikkelen til Arnesen med kollegaer har imidlertid blitt kilde til nokre misvisande oppslag i media, oppslag som har gjort lærarar og skoleleiarar usikre på kva ein skal gjere som følge av denne kritikken.

Kva seier forskningsartikkelen?

Arnesen et al. undersøker kva verktøy som faktisk blir brukt i skolen, deretter bruker dei ein anerkjent metode for å evaluere kvaliteten på desse. Når dei gjer det, baserer dei seg på informasjon som testutviklarane har publisert, til dømes manualar, materiell, rapportar og tidsskriftsartiklar. Dei finn at det er stor variasjon i kva testutviklarane dokumenterer, og dei viser kva testar som kjem godt eller dårleg ut av ein slik kritisk gjennomgang.

Forskarane seier difor - faktisk - ikkje at testane er dårlege, men at ein på grunn av mangel på dokumentasjon ikkje kan vite kva kvalitet dei har. Forskingsartikkelen etterlyser såleis ei sjekkliste for testkvalitet.

Held nasjonale prøver og kartleggingsprøver mål?

Ja, dei oppfyller anerkjente psykometriske krav. Artikkelen til Arnesen et al. stiller imidlertid Nasjonale prøver i lesing og Obligatoriske kartleggingsprøver i lesing i eit litt uheldig lys. Sidan artikkelforfattarane baserer seg på informasjon som er tilgjengeleg for alle, tek dei i artikkelen ikkje omsyn til dokumentasjonsarbeidet og kvalitetssikringa som er gjort av desse prøvane. Denne dokumentasjonen finst, men den er ikkje gjort tilgjengeleg for alle.

Udir har solid dokumentasjon på god validitet og reliabilitet, kvalititssikra av ledande prøveutviklarar og psykometrikarar. Vi utfordrar derfor Udir til å publisere denne dokumentasjonen rutinemessig, slik at meir informasjon om kvaliteten på prøvene blir tilgjengelege for alle.

Kva tenkjer vi som leseforskarar om kritikken som blir reist?

Det er testutviklaren sitt ansvar å beskrive formål og å dokumentere kvalitet. Alle som utviklar prøver må strekke seg etter å kommunisere meir av grunnlagsmaterialet offentleg. Om vi også fekk til å kommunisere ein "vaskelapp" om kva dokumentasjon prøver generelt må legge ved, ville det ha vore ein positiv konsekvens av Arnesen et al.'s artikkel. Først når prøveutviklarane har gjort dette, kan lærarar vurdere kor godt eit verktøy er.

Artikkelen til Arnesen og kollegaer gir oss imidlertid ikkje heile biletet her, men viser litt av vegen ein må gå. Artikkelen vil vere lite anvendbar for lærarar, sidan tilnærminga er fjern frå den faktiske bruken av prøver, og fjern frå kategoriar lærarar har føresetnader for å vurdere. Artikkelen vender seg i staden til testutviklarar og forskarar, der det vesentlege bidraget er i form av et første forsøk på å løfte opp ein standard for dokumentasjon for leseprøver.

Kva med testbrukaren?

Over skildra vi kva testutviklaren sitt ansvar er, men testbrukaren (lærar, skoleleiar) har også eit ansvar. Dette ansvaret inneber å bruke prøva i tråd med formålet - å kun dra slutningar som det er grunnlag for. Dette krev ein kontinuerleg refleksjon, til dømes om kva dei obligatoriske kartleggingsprøvene kan seie oss. Dei er utvikla for å fange opp dei aller svakeste lesarane, og gir liten informasjon om dei andre. Altfor ofte blir desse brukt til å seie noko om alle elevar. 

Kommunar og skoleleiarar burde også styrke si rolle som kundar og etterlyse dokumentasjon hos dei som leverer prøver. Når det gjeld den testen som blir mest brukt - Carlsten - viser Arnesen et al. at den står heilt utan dokumentasjon på psykometrisk kvalitet. Resultat frå denne prøven er blitt forkynt med autoritet i utallige foreldresamtaler. Mangelen på dokumentert kvalitet - sett i lys av utstrakt bruk - er eit klårt fareteikn, og om ikkje fagfolka og forlaget bak prøven (Cappelen Damm)  innan rimeleg tid framskaffar nødvendig dokumentasjon bør ein vurdere å slutte å bruke denne.

Seriøse aktørar har gjerne dokumentert kvaliteten på prøvene, men har ikkje sett det som naudsynt å kommunisere denne.

Kva med prøver til undervegsvurdering?

Det er også eit spørsmål om me skal stille same krav til alle typar verktøy eller prøver. Prøver som har diagnosar som mål, må heilt opplagt ha strenge krav til psykometriske kvalitetar. Men for prøver som blir brukt til undervegsvurdering eller liknande, kan ein kanskje diskutere å ha litt andre krav. Spesielt viktig blir då er det at slike verktøy i beskrivinga av formlået ikkje lovar meir enn ein kan halde.

Ved bruk av slike verktøy speler det sjølvsagt inn - som alltid - kva status læraren gir prøveresultatet.  Difor hender det at ei "halvgod" prøve i handa på ein lærar som tek alle naudsynte atterhald for tolking av resultata, kan fungere fint, medan ei "god" prøve  - som tilfredsstiller psykometriske mål - i handa på ein lærar som ikkje brukar prøva etter formålet, er bortkasta tid; det vill-leier lærar, elev og foreldre, og det legg tilpassa opplæring i grus. Fram til vi får ein ideell situasjon med god dokumentasjon på kvalitet i alle ledd, kan lærarar halde fram med godt arbeid der prøver blir brukt i tråd med formålet  - vel vitande om kva slutningar dei kan trekke ut frå desse.

Kva med andre prøver frå Lesesenteret?

Artikkelen til Arnesen med kollegaer inkluderer også to typar materiell som kjem frå fagfolk som har vore eller er tilknytt lLesesenteret: Staveprøven og Leselos. Heller ikkje desse får høg skåre i høve til den dokumentasjonsstandarden som Arnesen et al stiller opp.

I møte med desse to døma, vil nettopp ein slik standard hjelpe oss til betre dokumentasjon, men på ulik måte. Staveprøven har god dokumentasjon på alle punkt i den nemnde standarden. Denne dokumentasjonen er i all hovudsak publisert, men Arnesen et al etterlyser endå meir informasjon om validitet.

Når det gjeld Leselos, så er ikkje dette eit kartleggingsverktøy i prøve-forstand, og rapporterer (som Arnesen et al. viser) ikkje normer eller reliabilitet. Leselos er i hovudsak eit verktøy for undervisningsplanlegging og kvalitativ observasjon av elevane si lesing. Slik sett fell Leselos meir innunder det vi over diskuterte som materiell til undervegsvurdering.

Slike klargjeringar kan vere svært nyttige for både praksis og forsking.

I tillegg til å vere opptatt av at dei prøvene med nyttar for å måle elevane si leseferdighet har godt kvalitet, er Lesesenteret er ein pådrivar for god bruk av prøver og prøveresultat. Som del av dette arbeidet har Lesesenteret utvikla fleire typar materiell for lærarar. Sjå til dømes materiellet knytt til tidlig kartlegging og kartleggingsprøvers kvalitet i Språkløyper, eller Når skriftspråket blir utfordrende.Utvikling, kartlegging og tiltak på begynnertrinnene

Oddny Judith Solheim, Aslaug Gourvennec, Vibeke Rønneberg, Njål Foldnes, Bente Rigmor Walgermo, Per Henning Uppstad / Lesesenteret forskningsenhet for vurdering av lese- og skriveferdighet (RUALS).