Normering centrale examens

Elk jaar in de maand mei doen zo'n 200.000 leerlingen centraal examen, in vijf of meer vakken. Als de leerlingen hun examenwerk hebben ingeleverd, wordt in twee stappen hun cijfer vastgesteld: eerst de correctie, dan de normering.

De correctie

Bij de centrale examens hoort een correctievoorschrift. Dat geeft aan wat het juiste antwoord is, hoeveel punten het juiste antwoord waard is, en of er ook punten kunnen worden gegeven voor deelstappen. De correctoren, de eigen docent en iemand van een andere school, hanteren het correctievoorschrift en tellen de punten op die de leerling heeft gehaald. Daarmee stellen zij de score van de leerling vast, bijvoorbeeld 38 van de 76 punten. Het cijfer staat dan nog niet vast, daarvoor is de tweede stap nodig: de normering.

Wat is normering?

Op grond van de behaalde resultaten bij de centrale examens (reacties vakinhoudelijke verenigingen, docenten, leerlingen, analyse en vergelijking referentie-examens) wordt de normering bepaald. Daarbij wordt de zogenaamde normeringsvariabele vastgesteld.

Normering is nodig om de resultaten van examens in verschillende jaren te kunnen vergelijken. Het mag niet zo zijn dat leerlingen in het ene jaar geluk hebben met een gemakkelijk examen, voor bijvoorbeeld natuurkunde havo, en dat wie een ander jaar examen doet, pech heeft omdat het examen een stuk moeilijker is.

De simpele oplossing is: zorg ervoor dat het examen elk jaar precies even moeilijk is. Dat is helaas niet uitvoerbaar. Onze examens bevatten geen standaard vragen van een type dat elk jaar terugkomt. Maar ook als de vragen vrij standaard zijn, is het niet mogelijk om twee precies even moeilijke teksten Frans te vinden.

Een nog simpeler oplossing is: geef elk jaar hetzelfde examen. Dat is dan gegarandeerd even moeilijk. Ook daaraan kleven bezwaren: geleidelijk aan worden immers de examenvragen bekend.

Kortom: examens zijn van jaar tot jaar niet identiek en niet precies even moeilijk. Een leerling kan in het ene jaar een lastiger examen economie, Duits of natuurkunde treffen dan in het andere jaar. Is het examen natuurkunde havo een jaar aan de moeilijke kant, dan zijn minder punten nodig voor een 6. Is een examen een keer eenvoudiger, dan zijn er meer punten nodig voor die 6. Om de eisen gelijk te houden en de lat op dezelfde hoogte wordt geschoven met de normering.

De normeringsterm (N-term) zorgt voor de omrekening van scores in cijfers. De N-term zorgt ervoor dat een leerling bij een heel moeilijk examen met 40% van de scorepunten al een voldoende krijgt, terwijl hij bij een gemakkelijk examen misschien wel 60% van de scorepunten moet halen voor een voldoende. Hoe makkelijker het examen, hoe meer punten voor een voldoende nodig zijn. Leerlingen weten dat. Zij gaan bij hun voorspellingen vaak uit van de strengste N-term, ook al adviseert het LAKS: 'N-termen uit het verleden zijn geen garantie voor de toekomst'. N-termen moeten variëren: bij niet-identieke examens is een niet-gelijke N-term een noodzaak.

Hoe komt het CvTE aan de N-term?

De N-term wisselt dus. Hoe stelt het College voor Toetsen en Examens (het CvTE) dan de juiste N-term vast? Vaak wordt gedacht: door 'gewoon' het gemiddelde constant te houden. Dat lijkt simpel en voor de hand liggend. De redenering is dan: als alle leerlingen het examen ineens goed maken, dan zal het wel makkelijk zijn. Dat lijkt simpel, maar het is niet fair. Als leerlingen en docenten harder gaan werken, hebben ze er recht op dat ze daarvoor beloond worden in plaats van afgestraft met een strengere N-term.

Hoe weet het CvTE wat er aan de hand is? Als het examen Engels dit jaar beter wordt gemaakt dan vorig jaar, dan kunnen er twee dingen spelen: het examen kan makkelijker zijn of de leerlingen zijn harder gaan werken. Of misschien wel allebei. Om een faire vergelijking te kunnen maken, moet je de groepen kunnen vergelijken, waarna je conclusies kan trekken over de examens. Of je moet de examens vergelijken, waarna je conclusies kan trekken over de groepen. Het CvTE doet, samen met Cito, het laatste.

Hoe meten we?

Een vergelijking: de groep kandidaten in jaar x met een bepaalde vaardigheid kan worden voorgesteld als een bak vloeistof met een bepaalde temperatuur. Hetzelfde geldt voor de groep van vijf jaar eerder. We weten de vaardigheid/temperatuur niet, die gaan we meten met het examen als thermometer, en – in de huidige praktijk – met voor elk jaar/voor elke bak, een eigen 'thermometer'. Elke natuurkundige zal nu meteen zeggen: met twee verschillende thermometers weten we nog niets. Een eenvoudige oplossing zou zijn: stop dezelfde 'thermometer' in beide bakken. Dat is bij examens niet echt praktisch om de redenen die eerder zijn genoemd. Elk jaar hetzelfde examen afnemen stuit op bezwaren. Het CvTE en Cito hanteren daarom een andere methode. We ijken beide 'thermometers' op elkaar, door beide 'thermometers'/examens in nog een andere groep te steken. Dat gaat, bijvoorbeeld bij Duits TL, als volgt.

Direct na het centraal examen van jaar x worden er opgavenboekjes naar een aantal scholen gestuurd. Die opgavenboekjes bevatten door elkaar gehusseld opgaven Duits TL van jaar x en Duits TL, bijvoorbeeld, jaar x-5. De scholen nemen de toets af in havo 3. Beide 'thermometers', het examen jaar x en het examen jaar x-5, worden dus getest in dezelfde 'bak', een groep havo-3-leerlingen. Die bak mag best beter of zwakker zijn dan TL; waar het om gaat is dat we de 'thermometer' jaar x kunnen vergelijken met (ijken op) de 'thermometer' jaar x-5.

Misschien geeft de 'thermometer' voor jaar x bij deze leerlingen wel steeds wat hogere waarden aan. We weten dan dat het examen jaar x wat gemakkelijker is dan jaar x-5, en een lagere N-term moet krijgen. Op die manier zijn de examens geijkt: je moet in jaar x even goed zijn in Duits als in jaar x-5 om een voldoende te halen. De leerling krijgt waar hij recht op heeft. Daarna kunnen we ook conclusies trekken over de groep. Als in jaar x bij Duits TL het gemiddelde hoger is dan in jaar x-5, zijn de leerlingen (gemiddeld) beter geworden. Het hogere gemiddelde kan niet komen door een makkelijk examen, het examen is geijkt. Alleen als de leerlingen harder zijn gaan werken, komt er een hoger gemiddelde uit. De betere prestatie wordt beloond.

Bij andere examens moet het systeem wat worden aangepast. Het examen vwo 6 Duits bijvoorbeeld kan worden getest in vwo 5. Die leerlingen zijn wat minder vaardig in Duits dan leerlingen in vwo 6, maar de 'thermometers' kunnen we in die wat koudere bak wel vergelijken. Bij vakken als natuurkunde ligt het ingewikkelder. Het examen TL natuurkunde kan niet worden getest in havo 3, omdat de examenstof daar waarschijnlijk niet is behandeld. Daar zijn echter oplossingen voor. Met andere, complexer systemen kunnen toch de natuurkunde-examens over de jaren heen worden vergeleken en geijkt.

Veranderde uitslagregels

Als het systeem verandert, bijvoorbeeld zoals in 2012 en 2013 door aangescherpte uitslagregels, is ijking zoals hierboven beschreven cruciaal. Gaan scholen en leerlingen beter presteren, of is de praktijk weerbarstiger? Zonder ijking is daar niets over te zeggen. Met ijking kan worden gemeten of leerlingen beter zijn gaan presteren, en kunnen ze voor hun betere prestatie worden beloond.

Het systeem van normering is cruciaal, niet alleen bij ingrijpende maatregelen, maar bijvoorbeeld ook bij maatschappelijke ontwikkelingen. Tweetalig onderwijs is in. Dat leidt, althans dat is de bedoeling, tot een betere beheersing van het Engels. Worden anderen die geen tweetalig onderwijs volgen daar niet de dupe van? Wat als de gemiddelde vaardigheid stijgt en de lat schuift mee omhoog. Is dan wie geen tweetalig onderwijs volgt, daarvan de dupe? Nee, zo werkt het niet. De 'thermometer' Engels jaar x is geijkt op jaren geleden. De eisen zijn onveranderd. Wie zonder tweetalig onderwijs in jaar x dezelfde prestatie levert als zijn oudere broer in jaar x-5, krijgt hetzelfde cijfer. Ook al stijgt het gemiddelde misschien, als een deel van de leerlingen door tweetalig onderwijs beter is gaan presteren.

Infographic

Infographic

Meer informatie

Pijl omhoog