audiofeedback: een waardevolle vorm van feedback

Het begon allemaal op een donderdagmiddag in een pauze. Ik had vier dagen de tijd om ongeveer 90 essays van feedback te voorzien. Ik was al fier begonnen met een aantal toen er een idee binnensloop: wat als ik het gewoon inspreek en de leerlingen het laat opschrijven? De deur stond open en een collega maakte een grap over hoe ik in het lege lokaal voor me uit zat te staren. Ik legde mijn idee uit en zijn eerste reactie was: ‘daar zit eigenlijk best wel wat in.’ Een nieuw idee had voedingsbodem gevonden.

hoe ik feedback geef

6VWO moet een (pre-)academisch essay schrijven (met pen en papier) over een onderwerp in een 100-minutentoets in de toetsweek. Gedurende de module doorlopen we elk onderdeel van het essay. Er zijn lessen over de introductie, de hoofdtekst, de conclusie, en andere zaken. Daarbij leer ik ze een eenvoudige basisstructuur. Elke les schrijven ze een onderdeel van een essay dat via peer review van feedback wordt voorzien. Dit gebeurt iedere keer via een single-point rubric. Aan het einde van de lessenserie schrijven leerlingen in twee lesuren (2×50 minuten) een volledig essay. Deze voorzie ik van feedback.

Omdat dit een volledig eindproduct is, besteed ik altijd veel tijd aan het geven van feedback. In de eerste plaats gebruik ik een kleurencodering voor de verschillende elementen van het essay. Als dat onderdeel goed is, zet ik in die kleur een krul. Als ik commentaar heb, schrijf ik het commentaar in die kleur. Ik heb een ‘algemene kleur’ voor feedback die niet gaat over deze elementen, waaronder spelling- en grammaticafouten. Aan het einde schrijf ik vaak een kort lijstje met verbeterpunten.

Ik heb in het verleden codes gebruikt die verwezen naar grammatica- of spellingsfouten. Leerlingen moesten dan zelf via de code achterhalen wat hun fout was. Echter, dit werd niet veel gedaan en kostte mij uiteindelijk meer energie en tijd in het onthouden van toekennen van de codes.

audiofeedback geven: het proces

Het proces van audiofeedback geven is vrij simpel. Ik pak een essay, zet mijn voice recorder aan (de Sony ICD-PX470), en begin met lezen. Terwijl ik lees denk ik hardop na, verbeter fouten, doe suggesties, en vertel ik wat ik van het essay vind. Aan het einde schrijf ik voor Style & Contents en Spelling & Grammar een +, een –,  of een ±. Voor deze twee onderdelen krijgen leerlingen namelijk een deelcijfer op de toets. Echter, ik wil geen fictieve cijfers geven voor proefessays. Ervaring heeft geleerd dat leerlingen te veel gefocust zijn op het cijfer en minder open staan voor feedback als het voldoende is. De plussen en minnen geven een indruk zodat ze wel weten hoe het over het algemeen is gegaan. Ik schrijf verder geen feedback op de blaadjes.

De opnamen duren ongeveer 8-12 minuten. Na vijf essays zet ik de bestanden op mijn laptop, voorzie ik ze van een klasnummer en naam, en neem ik een korte pauze van een paar minuten. Wanneer ik alle bestanden heb, stuur ik ze naar de leerlingen via een persoonlijk bericht op Teams Chat.

Leerlingen moeten de eerstvolgende les hun telefoon met koptelefoon of oordopjes meenemen (bij ons mag alleen klas 5/6 een telefoon bij zich hebben en in de les mogen ze alleen gebruikt worden voor educatieve doeleinden; wij hebben geen laptops of tablets voor onze leerlingen, wel vier computerlokalen).

In de les laat ik de tafels een halve meter uit elkaar zetten (dit doe ik altijd als ik wil dat leerlingen zelfstandig, gefocust moeten werken). Ik leg uit dat leerlingen moeten luisteren naar de feedback en mee moeten schrijven op hun proefessay blad. Ook krijgen ze een feedbackformulier waar ze een samenvatting kunnen maken van alle feedback. Leerlingen mogen de opname pauzeren of terugspoelen.

Ik deel de essays en het feedbackformulier uit en leerlingen zetten hun koptelefoon op. Leerlingen mogen vragen stellen tijdens de feedbacksessie. De ene klas deed dit meer dan de ander, maar ik kon direct extra uitleg geven als leerlingen een vraag hadden over mijn feedback.

Leerlingen die geen koptelefoon hadden, moesten de opdracht thuis maken. Zij werkten in stilte in een opdrachtenboekje over sentence grammar of aan hun Cambridge examen. Wanneer leerlingen klaar waren met het verwerken van de feedback, werkten zij ook, zelfstandig en stil aan sentence grammar of Cambridge. Het verwerken van de feedback duurde gemiddeld per leerling ongeveer 20-25 minuten.

reflectie op het proces

Een goede rekenaar zal hebben uitgerekend dat 90 essays (drie klassen) van elk gemiddeld 8 minuten audiofeedback, werk oplevert van ongeveer 12 uur. Dit heb ik verdeeld over vier dagen. Ik zal zeker niet ontkennen dat dit veel is. Echter, als ervaren docent heb ik minimale lesvoorbereiding voor mijn klassen. De twee lesuren van elk 50 minuten waarin ze hun essay schrijven was tien minuten voorbereiding in het bedenken van drie onderwerpen. Ook heb ik veel bovenbouwklassen met geen schriftelijke overhoringen in de module zelf. We weten dat onderwijs meer is dan alleen lesgeven en als die drie uur feedback per klas waardevol is en past binnen mijn werkuren, vind ik die 12 uur niet gek. Net als de ICT-wereld kent het onderwijs nu eenmaal piek- en dalmomenten.

Het opnemen via een fysieke voice recorder vond ik zeer prettig. Het gaf ruimte op mijn bureau en het ging heel snel. De geluidskwaliteit was prima. Ik had ook gebruik kunnen maken van een simpele voice recorder op mijn laptop of een programma zoals Audacity, maar dit voelde beter en minder gedoe. De bestanden konden, vanwege een uitschuifbare USB-stick, makkelijk op mijn laptop worden overgezet.

Ik had geen vaste methodiek voor het geven van de feedback. Ik begon altijd wel met de klas en naam van de leerling. Daarna keek ik vluchtig naar de brainstorm van leerling (als die er was), ik scande het essay, gaf kort commentaar op een aantal opmaakregels die verplicht zijn bij de toets en begon dan met lezen. Terwijl ik las gaf ik direct commentaar op wat ik las. Ik zei wat ik dacht. Dit zorgde er soms voor dat ik iets verkeerd las en mijzelf moest herstellen, maar dit leverde wel meer authenticiteit op en dat er blijkbaar verwarring ontstaat bij de lezer.

Wat ik vooral heb gemerkt bij geven van audiofeedback, is dat ik minder (lang) stil sta bij grammatica- en spellingsfouten. Ik benoem ze wel, maar neig veel meer naar feedback op structuur en zinsopbouw. Ik geef ook suggesties hoe je iets beter zou kunnen verwoorden. Daarnaast geeft audiofeedback meer ruimte om uitgebreider over het essay als geheel te praten. Het helpt dat we in de lessen ieder onderdeel van het essay stap voor stap al hadden doorgenomen zodat ik daarnaar kon verwijzen.

Alle leerlingen, zonder uitzondering, zijn serieus aan de slag gegaan. Eén keer heb ik aan het begin een groepje jongens gewezen op het feit dat ze niet mogen praten of overleggen (toegegeven het was half vijf). Verder was iedere leerling op zijn of haar manier feedback aan het opschrijven op het essay en het feedbackformulier. Het was interessant om te zien dat de ene leerling al beter wist hoe dit goed te doen en de ander wat meer moeite had.

Ik heb bij alle klassen de les ongeveer 8 minuten voordat de bel ging afgesloten. Dit gaf leerlingen de ruimte om (informeel) met elkaar over de feedback te praten. Ik gaf deze instructie niet, maar je zag dat veel leerlingen graag wilde delen welke feedback ze hadden gehad op hun essay. Ook gaf het mij de ruimte sommige leerlingen persoonlijk te peilen hoe de feedback was geland en of ze nog vragen hadden.

de voor- en nadelen

De voordelen van audiofeedback zijn:

  • Je kunt in kortere tijd meer informatie delen met de leerling.
  • Het is, naar mijn ervaring, minder intensief dan met pen feedback geven (en veel minder omslachtig dan feedback typen).
  • Je laat leerlingen actief met de feedback omgaan in plaats van passief de feedback te laten lezen.
  • Je krijgt de ruimte om de leerling persoonlijk aan te spreken alsof hij of zij naast je zit. Dit levert, naar mijn mening, rijkere en meer persoonlijke feedback op en kan de band met de leerling versterken.

De nadelen van audiofeedback zijn:

  • Het vraagt nog steeds veel tijd bij het geven van feedback.
  • Je moet als docent goed in de stof zitten. Je moet in het moment feedback geven en hebt weinig tot geen tijd om iets op te zoeken.
  • Met audiofeedback stel je jezelf kwetsbaarder op dan met schriftelijke feedback. Ik geef feedback in het Engels en ik maak wel eens een foutje in het Engels. Ook krijgen leerlingen een bestand met jouw stem. Dat kan een docent een minder prettig gevoel geven. Je weet niet wat ze ermee zouden kunnen doen.

de feedback van leerlingen

Ik heb aan het einde van de les aan de leerlingen gevraagd of ze schriftelijk en anoniem hun feedback konden geven op audiofeedback. Ik had drie vragen op het bord geschreven:

  1. Was the feedback you received helpful?
  2. Would you prefer audio feedback over written feedback? Why / why not?
  3. Do you have any tips or advice?

Niet alle leerlingen waren aanwezig, maar in totaal hadden twee leerlingen van de drie klassen voorkeur voor schriftelijke feedback en drie leerlingen gaven aan dat er geen verschil was tussen schriftelijke feedback en audiofeedback. Hier kom ik later op terug. Hier volgt een selectie van de positieve feedback van de rest:

Yes, because you give more context and explain better what the problem is. Also, hearing the feedback makes it more memorable and engaging causing me to better understand my mistakes and how to fix them.

 

I liked this way of feedback because I looked at it more than usual. If it were written, I would have given it a quick scan.

 

It was more clear and it was helpful to hear more feedback than you normally get. It was also good to write it down myself so I can filter what I find helpful and have a clear list.

 

Yes, this way you can provide more nuanced feedback.

 

Because you have to write the feedback yourself, you’re more involved with it and therefore you learn the feedback better.

 

Because I can hear the thought process behind it, which explains a lot more.

 

Because you get more in depth feedback which you cannot get with when written.

 

Elke zin wordt gecontroleerd.

 

Hierdoor is het uitgebreider en begrijp je alle fouten die je hebt gemaakt. Je kunt ook zelf aantekeningen maken op een manier die je zelf goed begrijpt.

 

I found the feedback really helpful, I got better insight into how you felt about my essay compared to normal feedback on paper. It’s also your first impression of the essay, which makes it honest and real.

 

It is less structured, but it explains the process that you would have gone through when grading the essay. This is helpful because it gives complete ideas about what can be improved for a higher mark.

 

I find this form of feedback better because the reasons as to why something is wrong are clearer to me.

 

I’m now writing actively with the feedback.

 

Yes, because there is better interaction with the student. Normally I just skim the feedback and as you can see, my essays don’t really improve a lot.

 

It is less boring than on paper.

 

I could also hear how bad my handwriting is to read. I will try to improve it for the test!

 

When the feedback is spoken, I can actually hear your thought process instead of just seeing a mark.

 

Hearing your thoughts is way more helpful than just seeing some corrections.

 

When reading feedback I tend to glance over it, this required more attention.

 

Yes, it is easier to explain thoroughly when talking, it gives more space to elaborate. And it does make you pay more attention to the feedback.

 

Because like this I think about my mistakes a lot more. I actually analyse it all instead of just reading it.

 

Yes, it was more and you gave more examples how to do it better.

 

It is different and it takes a bit more time to look over it but you do look better at your essay.

 

De negatieve feedback geef ik met reflectie:

Because I did the same as the teacher, writing down the mistakes. While interesting, the inner/outer thoughts weren’t that useful. (Keep innovating!)

 

I personally like it better when it is written out, but I do think this way gives a lot more context and extra info. I guess both are good.

 

I think it is better when you just write it down because you know better how to write down feedback than me.

 

Written down may be better, because you don’t need to search or locate what you’d like.

 

I find it difficult to correct myself sometimes.

Een deel van de negatieve feedback heeft te maken met onzekerheid over hoe je feedback opschrijft. Dit lijkt mij een belangrijke studievaardigheid die zou moeten worden opgenomen in het schoolprogramma. Het zou zeker helpen om leerlingen een voorbeeld te laten zien. In klas 5 experimenteer ik met analytisch en actief lezen van non-fictie; het opschrijven van je gedachten terwijl je leest. Ook hier zie ik grote verschillen tussen leerlingen. De één lukt het al vrij goed, de ander weet totaal niet waar te beginnen en wat op te schrijven. Ook zullen voorbeelden helpen voor meer ‘scaffolding’. Dit materiaal ben ik nu ook aan het verzamelen voor volgend jaar.

Het lokaliseren van de feedback kan misschien bij dat specifieke essay rommelig zijn geweest. In principe volg ik het essay. Soms ga ik terug naar het begin van een alinea en dan probeer ik dat wel te benoemen ( “Let’s go back to the beginning of the paragraph”).

Op vraag 3 werd weinig feedback gegeven. Dit is wat er wel werd gezegd:

Maybe a short list of what the main things are to improve.

 

Give ways to practice.

 

Maybe some short notes while speaking.

 

Maybe try to scan it once before giving feedback.

 

Elaboration on the grade itself.

 

Maybe a short summary with the biggest points of criticism. A tip, also for your time, it could be a lot shorter and maybe more concise if you first read through the essay and after that just sum up some points. For me that would already have been enough and it would save you time.

 

Maybe sending it via a different app so we can speed it up.

Om met de laatste te beginnen, deze leerling heeft het over versneld afspelen (x1.25 / x1.5) van de opname. Dit is steeds meer een fenomeen bij het het luisteren van audioboeken en YouTube video’s. Persoonlijk ben ik hier terughoudender in. Zelf doe ik het soms wanneer iemand behoorlijk langzaam praat, maar als je een opname te snel afspeelt, is er minder ruimte voor reflectie. Echter, in principe hebben ze een mp3-bestand van mij gekregen en kunnen deze downloaden en openen in de app van hun voorkeur.

Ondanks dat ik dus geen voorstander ben van een focus op cijfers, snap ik de feedback van de leerling wel (cijfer is in deze die + / -). Wat de leerling, denk ik, eigenlijk vraagt is hoe verhoudt die score zich tot de feedback? Wat is de relatie tussen beide scores en de punten die worden benoemd. Niet iedere fout telt even zwaar mee.

Ik kan verbaal een kort overzicht geven van de belangrijkste punten die ik heb gevonden, en soms heb ik dit ook gedaan. Schriftelijk zou ik niet doen. Dit is een vaardigheid die leerlingen zich eigen zouden moeten maken. Hier en daar een aantekening zal ik overwegen.

Tips hoe en waar je meer kunt oefenen ga ik zeker meenemen voor een volgende keer. Ik heb veel materiaal. Het is alleen een kwestie van het aanbieden en op een duidelijke manier naar verwijzen.

Louise Taylor, docent en onderzoeker aan de Universiteit van Amsterdam, was hier drie jaar geleden al mee bezig en geeft een heldere uitleg hoe zij het heeft gedaan en hoe het op studenten overkwam. Ik zie veel overeenkomsten.

vervolgles

Het viel mij op dat veel leerlingen moeite hadden met structuur binnen alinea’s (micro structure). Ook zag ik weinig brainstorms (het kan zijn dat een aantal deze op een ander blaadje had gemaakt). De eerstvolgende les heb ik daarom leerlingen geleerd hoe ze een opdracht moeten ontrafelen (deconstruction), hoe en hoe lang ze moeten brainstormen (getting ideas), en hoe ze een outline van de brainstorm moeten maken (making choices and creating structure). Het is ook niet zo vreemd dat ik juist dit wilde oppakken. Zoals ik al eerder had aangeven, zorgt deze manier van feedback geven voor een (deel onbewuste) neiging naar een focus op structuur en opbouw in plaats van spelling- en grammaticafouten.

feedback via ChatGPT

Er werd op LinkedIn ook de suggestie gegeven om ChatGPT te gebruiken om feedback op essay te geven. Hier heb ik zeker al een mening over, maar zal het uitproberen. Ik heb een aantal essays gescand en zal deze maand onderzoek doen. Hierover komt later nog een apart artikel.

hoe nu verder

Het is zeker niet zo dat ik vanaf nu al mijn feedback verbaal wil geven. Het blijft een intensieve methode. Ik zou deze vorm van feedback vooral gebruiken bij het eindproduct (mits het een diagnostische opdracht is en geen summatieve toets). Voor kortere opdrachten zou ik nog steeds inzetten op peer feedback door middel van een single-point rubric. Wel is het zo dat het audiofeedback een waardevolle vorm van feedback geven is en het zeker verdient uitgeprobeerd te worden.

GenAI maakt programmeurs dommer: een les voor het onderwijs

Er is nog weinig onderzoek gedaan naar de leereffecten van GenAI in het onderwijs. Dat is ook niet zo vreemd aangezien het nog in haar kinderschoenen staat. Het is daarom goed om te kijken wat er bij domeinen die al langer gebruik maken van AI gebeurt. Één van die domeinen is softwareontwikkeling, met in het bijzonder GitHub. Hier zullen we zien dat de risico’s die ik besprak in mijn vorige artikel over Generatieve AI in het onderwijs ook worden gezien in de wereld van programmeren.

GitHub

GitHub is een platform waar ontwikkelaars en programmeurs programmeercodes ontwikkelen, bewaren, en delen. In 2018 werd GitHub overgenomen door Microsoft en in 2021 werd GitHub Copilot geïntroduceerd, een versie van Microsofts GenAI Assistent Copilot, gespecialiseerd in het schrijven en controleren van code. Een belangrijke functie is de autocomplete waarbij Copilot suggesties doet om code, geschreven door een programmeur, af te maken. Dit is vergelijkbaar met de autocomplete in Word maar dan natuurlijk veel uitgebreider.

Via een YouTube video van ThePrimeTime kwam ik op een artikel van softwareontwikkelaar, Darren Horrocks. Hij schreef begin september een artikel over de gevaren van veelvuldig gebruik van GitHub Copilot door programmeurs. Deze zorgen sluiten aan bij wat de cognitieve wetenschap ons vertelt over leren, kritisch denken, en creativiteit. In zijn artikel “Why Copilot is Making Programmers Worse at Programming” bespreekt Horrocks zijn zorgen over het gebruik van GitHub Copilot.

De kritiek van Horrocks gaat over het eroderen van kennis en daarmee kritisch en creatief kunnen denken bij ontwikkelaars, een te grote afhankelijkheid van zowel het product als het bedrijf daarachter, een gebrek aan eigenaarschap en daarmee verantwoordelijkheid, het verkleinen van leermogelijkheden, en een misplaatst gevoel van meesterschap bij programmeurs.

van kennis naar kopiëren

Horrocks geeft aan dat door de komst van Copilot programmeurs steeds minder kennis over code en coderen ontwikkelen. Daar waar zij in het verleden de onderliggende structuur moesten kennen om problemen op te lossen, kunnen ze nu automatisch gegenereerde stukjes code door Copilot laten schrijven. Dit klinkt als een verrijking, zeker als je alleen naar de eindoplossing kijkt. Voor de (kennis)ontwikkeling van programmeurs kan echter dit problematisch worden, niet in de minste plaats omdat we voorlopig nog niet zonder programmeurs kunnen. We creëren een wereld waarin de fouten van AI niet meer opgemerkt worden door softwareontwikkelaars.

Omdat programmeurs niet meer kennis opbouwen over programmeren en programmeercodes, zijn zij minder in staat om kritisch en creatief te denken over softwareontwikkeling. De oplossingen die door Copilot worden aangedragen zijn niet altijd het meest optimaal en kunnen ook fouten bevatten waardoor er veiligheidsrisico’s kunnen ontstaan. Omdat Copilot code op het eerste gezicht werkt, zijn programmeurs minder geneigd goed onderzoek te doen naar de gevolgen voor de lange termijn. Er ontstaat een blind vertrouwen in AI en daarmee een vermindering van eigenaarschap en een gevoel van verantwoordelijkheid: “De AI heeft het gegenereerd, dus moet het kloppen.”

Echter, het is nog helemaal niet zeker dat we geen programmeurs nodig zullen hebben op de korte tot middellange termijn, sterker nog, we hebben er waarschijnlijk meer nodig. Er is nog steeds die kritische blik nodig bij het ontwikkelen en controleren van software. Copilot maakt nog steeds fouten en die fouten moeten door mensen nog steeds opgelost worden. Echter, die kritische blik wordt steeds minder scherp door een gebrek aan domeinkennis.

Ook in het onderwijs zullen we een gemakzucht naar kennis zien als we Generatieve AI argeloos inzetten en kennisverwerving inruilen voor AI-verwondering. Leerlingen (en ook docenten) zullen zich meer richten op het eindproduct en niet op de ontwikkeling van de leerling. Waarom nog zelf denken als GenAI het antwoord kan produceren?

gemak boven geploeter

Wanneer een AI als Copilot je een oplossing aanreikt, ben je minder geneigd om het zelf te willen leren. Leren doet immers pijn en kost energie. Het is gemak tegenover hard werken en wij mensen zijn over het algemeen geneigd gemak boven geploeter te kiezen. Copilot geeft een kortere route naar het antwoord waardoor programmeurs niet dieper gaan nadenken over het waarom van een oplossing. Dit kwam ook naar boven in het onderzoek “Generative AI Can Harm Learning” waar een GPT Base assistent antwoorden gaf in het leerproces en daarmee een negatieve invloed had op de leerprestaties van leerlingen.

Dit ‘voorzeggen’ zorgt ook voor een vernauwing van creatief denken. Niet alleen zorgt een gebrek aan kennis voor een vermindering aan creativiteit bij ontwikkelaars, dat wat AI voorzegt zijn vooral suggesties uit bekende patronen. Het is immers een voorspelmachine op basis van een dataset uit het verleden. GenAI kan niet out-of-the-box denken. De angst is dan ook dat overmatig gebruik van AI ertoe zal leiden dat programmeren meer een mechanisch proces wordt in het accepteren van suggesties in plaats van ‘een creatieve zoektocht dat grenzen verlegt,’ aldus Horrocks.

voorbeeld hoe GitHub Copilot werkt, <https://github.com/features/copilot>

afhankelijkheid

Deze afhankelijkheid van AI loopt door naar de bedrijven achter de modellen. Omdat programmeurs steeds meer kennis ontbeert, zullen zij Copilot nodig blijven hebben in hun werk. Dit wordt problematisch als het gereedschap later gebreken vertoont, de gebruikersvoorwaarden worden veranderd, of het te duur begint te worden. Je maakt jezelf als programmeur afhankelijk van een commercieel product; je raakt ‘locked-in’.

Studenten kunnen gratis gebruik maken van GitHub Copilot waardoor zij meegenomen worden in de afhankelijkheid van de GenAI van Microsoft. Het zou voor hen beter zijn in eerste instantie op eigen benen te kunnen staan alvorens Copilot te betrekken bij hun werkzaamheden. Echter, afhankelijkheid creëren is lucratief voor bedrijven en het is hen er alles aangelegen om gebruikers aan te trekken en vast te houden.

een vals gevoel van meesterschap

Als laatste kan het gebruik van Copilot een vals gevoel van expertise geven. Dit wordt problematisch wanneer deze programmeurs doorgroeien naar meer complexe opdrachten waar fundamentele programmeerkennis van vitaal belang is.

Dit valse gevoel van expertise is vergelijkbaar met leerstof herkennen in plaats van kennen. Leerlingen die leerstof herlezen krijgen vaak een vals gevoel van meesterschap. Ze herkennen het materiaal maar kunnen het niet reproduceren zonder bron. GenAI is permanente scaffolding waarbij gebruikers afhankelijk blijven van het hulpmiddel en niet zelfstandig leren denken. Leerlingen leren niets anders dan het verplaatsen en laten verwerken van data.

aangeleerde hulpeloosheid

ThePrimeTime heeft het over ‘aangeleerde hulpeloosheid’ in het gebruik van GitHub Copilot. Wat wij moeten voorkomen is dat we leerlingen opleiden tot burgers die afhankelijk zijn geworden van AI om goed te kunnen functioneren in de maatschappij. Dat gaat verder dan dat we dit in het onderwijs benoemen, maar moet expliciet worden meegenomen in curriculumontwikkeling en lesontwerp.

De oudere generatie heeft via een traditioneel onderwijssysteem veel kennis eigengemaakt voordat ze aan de slag gingen met GenAI. Zijn beseffen vanwege hun kennisbias niet (voldoende) wat jongeren niet weten en welke gevolgen dat heeft in hun ontwikkeling en functioneren in de maatschappij.

Daarom is een goede voorbereiding op de onbekende toekomst gericht op het ontwikkelen van uitgebreide kennis bij jongeren in plaats van alleen te leren hoe de knoppen van een softwareproduct werken. Dat product kan alleen kritisch en creatief worden gebruikt als ze domeinkennis hebben. Zo niet, dan zal je, aldus Horrocks, nooit iets anders kunnen dan wat een robot al kan doen.

Wat voegt Generatieve AI nu eigenlijk toe aan het onderwijs?

30 november 2022, ChatGPT wordt gelanceerd door OpenAI en zette de wereld op zijn kop. Het onderwijs kan niet anders dan hierin meegaan. We kunnen de ontwikkelingen niet tegenhouden en zullen ons aan moeten passen aan de dans van Big Tech. Of moeten wij dat eigenlijk wel?

In alle discussies rondom Generatieve AI in het onderwijs wordt de meest cruciale vraag maar zelden gesteld: hoe sluit dit aan bij onderwijsonderzoek, bij dat wat, in grote lijnen, werkt in het leerproces? Welke onderdelen uit het leerproces ondersteunt AI nu eigenlijk? En waar zal het onze kinderen dommer en daarmee afhankelijker maken? Het is tijd voor een kritische noot.

Vormen van AI

Sinds 2022 kennen we AI vooral van ChatGPT, maar we hebben al veel langer AI in ons leven. Er zijn al geruime tijd chatbots die klanten helpen zoals bijvoorbeeld ‘Billy’ bij Bol, maar ook YouTube suggesties worden uitgevoerd door AI. Banken werken al lange tijd met AI en het toeslagenschandaal in Nederland was mede door het gebruik van voorspellende AI ontstaan. Op je telefoon zit al lange tijd AI om processen te verbeteren en een stofzuigerrobot werkt ook op AI. Voor nu kijken we alleen naar een specifieke AI: Generatieve AI (GenAI), AI zoals deze wordt toegepast in bijvoorbeeld ChatGPT.

Hoe werkt GenAI?

GenAI onderscheidt zich door originele inhoud te creëren naar aanleiding van een opdracht, beter bekend als een prompt. GenAI kent een lange geschiedenis maar om beetje een beeld te krijgen wat het min of meer is en doet volgt hier een simplistische uitleg.

GenAI, zoals ChatGPT, genereert (de ‘G’ in GPT) nieuwe inhoud naar aanleiding van een prompt, een opdracht vaak in tekst. Het gebruikt hiervoor een voorgeprogrammeerde dataset (de ‘P’ in GPT). Omdat taal complex is en de AI alleen met (reeksen van) getallen kan werken, heb je een transformer nodig (de ‘T’ in GPT). De transformer vertaalt tekst naar getallen en getallen naar tekst.

GenAI verwerkt die reeksen van getallen in een neuraal netwerk (genaamd Large Language Model [LLM] voor ChatGPT) dat vergelijkbaar is met hoe onze hersenen werken. In dat netwerk voorspelt de AI welk woord volgt na welk ander woord om een logische zin te maken. Als je in zou voeren “De kat is een…” zal GPT dat hoogstwaarschijnlijk aanvullen met ‘dier’, maar dit kan natuurlijk veel complexer tot korte verhalen en complete programmeercode om een app te maken. Deze uitkomsten ontstaan door middel van berekeningen in een ‘black box’. Niemand kan in kaart brengen hoe GenAI exact tot een product is gekomen. Men heeft alleen invloed op de dataset.

In GenAI wordt een woord, stuk tekst, of leesteken omschreven als een token. Om een enkele token te genereren, moet ChatGPT ongeveer een biljoen berekeningen maken. GenAI vraagt dus om veel rekenkracht en daarmee energie.

Welke vormen van GenAI zijn er?

Bij het grote publiek is vooral ChatGPT bekend. ChatGPT is ontwikkeld door stichting OpenAI (dat op het punt staat zichzelf om te vormen tot een commercieel bedrijf met winstoogmerk), maar er zijn ook andere aanbieders. Er is Claude van oud-medewerkers van OpenAI, Llama, de open source GenAI van Meta, het bedrijf achter Facebook, Gemini van Google, het Franse Mistral AI, en nog vele Open Source initiatieven.

Je hebt ook GenAI specifiek voor afbeeldingen zoals Midjourney en Pixlr. Suno genereert liedjes in een muziekstijl naar keuze en Github Copilot helpt bij programmeren. Daarnaast hebben modellen zoals ChatGPT de mogelijkheid om toepassingen (add-ons) gebruik te laten maken van de rekenkracht van ChatGPT.

De lucratieve onderwijsmarkt

Met huidige ontwikkelingen van GenAI lijken de mogelijkheden eindeloos. We zouden nog maar een glimp gezien hebben van wat ons te wachten staat en de wereld zal een grote verandering doormaken. Echter, deze verafgoding van IT hebben we al eerder gezien. De meeste recente hypes waren Big Data en Virtual Reality en deze hypes zijn ook afgevlakt. En kent iemand nog de Steve Jobs/iPad-scholen? De resultaten van GenAI zijn indrukwekkend, maar achter de façade van verwondering schuilt ook een verdienmodel en zelfs een grens lijkt, voorlopig, in zicht.

Al decennia proberen IT-bedrijven grip te krijgen op de lucratieve onderwijsmarkt. Was het vroeger vooral jonge gebruikers gekoppeld te krijgen aan Google, Microsoft, of Apple-diensten, nu gaat het om controle van het onderwijsproces door middel van de producten die zij verkopen.

Als docent word je dan overgeleverd aan het algoritme van het model en fungeer je meer als coach of faciliteerder in plaats van een onderwijsexpert. Het model, en het bedrijf achter dat model, bepaalt in grotere mate de inhoud en het onderwijsproces. Echter, “[AI] kan het onderwijs beperken tot alleen datgene wat AI kan verwerken, modelleren en leveren.” (UNESCO).

Hallucinaties

Omdat GenAI zichzelf aanstuurt aan de hand van een zeer grote dataset, komt het wel eens voor dat GenAI feiten verdraait of verzint. GenAI is dan ook niets anders dan een voorspelmachine. Het begrijpt niet wat het zegt en maalt niet om waarheid. Het aanbieden van onjuiste informatie wordt ‘hallucineren’ genoemd: het presenteren van een onsamenhangend antwoord of in volle overtuiging verkeerde informatie geven. Bedrijven proberen dit te voorkomen door ‘fine-tuning’ en hard gecodeerde regels. In het eerste geval krijgt het model een beperkte extra dataset om bij te sturen. In het tweede geval krijgt het model instructies wat te doen bij bepaalde invoer: als dit, doe dan dat.

In beide gevallen oefent het bedrijf invloed uit op de uitkomsten die niet zichtbaar zijn voor de eindgebruiker. We varen dus niet alleen blind op de zee van het algoritme, het is Big Tech die onzichtbaar aan het roer staat om bij te sturen. Gezien de grote invloed GenAI heeft en gaat hebben in onze informatievoorziening, vormt dit een substantieel gevaar voor onze democratie. Grote bedrijven zijn niet politiek neutraal en hebben belang bij wet- en regelgeving. De positie van Elon Musk bij de verkiezingen in Amerika dit jaar laten duidelijk zien dat er grote belangen spelen bij Big Tech.

Het is aan leraren om de hallucinaties van GenAI in het onderwijs bij te sturen. Dit betekent dat de leraar vaak moet controleren of zijn of haar leerlingen wel de juiste informatie krijgen. De leraar moet dus het leerproces constant monitoren en bijsturen waar AI de mist in gaat. Dit verandert niet alleen de rol van de leraar, maar zal er ook voor zorgen dat de leraar uiteindelijk meer werk te doen heeft. Zij is echter dan wel haar handelingsvermogen kwijtgeraakt. Of zoals Joop Berding zegt: “Je krijgt een ontwikkeling waarbij de leidende vraag niet meer is ‘hoe kunnen we zorgen dat de middelen die we inzetten ons helpen bij ons doel’, maar meer van ‘hoe moet het onderwijs er eigenlijk uit zien zodat die middelen hun werk kunnen doen?’”

Datasets

GenAI wordt getraind door middel van datasets. De legaliteit van deze datasets wordt steeds meer ter discussie gesteld. Zo zijn meerdere visuele GenAI modellen getraind op afbeeldingen van artiesten zonder hier toestemming voor te vragen. The Times klaagde OpenAI en Microsoft al in 2023 aan voor het gebruik van duizenden van haar artikelen voor het trainen van hun GenAI model. Ook worden er nu transcripties van YouTube video’s gebruikt om GenAI te trainen zonder dat hier toestemming voor is gegeven door de makers van deze video’s.

Datasets leveren niet altijd feitelijke informatie. Een dataset is bij elkaar geschraapte informatie waar feit en fictie gelijkwaardig zijn. Vooroordelen en complottheorieën zijn meegenomen in die datasets. Datasets kunnen dasn vervuild zijn.  Google heeft data van Reddit gekocht, een internetforum waar het niet altijd om waarheid gaat, Meta gebruikt posts op Facebook en Instagram om zijn GenAI Llama te trainen, en Elon Musk gebruikt X posts om zijn Grok GenAI te trainen. Social media geven niet een goed beeld van de werkelijkheid. Toch wordt GenAI getraind op data van deze platformen. Het gaat allemaal om het herkennen van patronen, ongeacht of die patronen feitelijk juist zijn. Daarnaast raakt de internetdata om GenAI te trainen rond 2026 op en wordt er nu al data gegenereerd door GenAI om GenAI te blijven trainen.

We hebben al gezien dat bedrijven in extreme gevallen moeten bijsturen en de uitkomsten van GenAI moeten manipuleren door middel van fine-tuning en harde codering. Deze bijsturing zal in ieder geval nog voorlopig moeten plaatsvinden simpelweg omdat GenAI niet de natuurkundige wetten van de wereld begrijpt. “LLM’s leren immers op een manier die tegengesteld is aan die van mensen. Deze modellen beginnen met het leren van taal. Daarna proberen ze die kennis te gebruiken om abstracte concepten te begrijpen. Menselijke baby’s, daarentegen, leren eerst concepten en vervolgens de taal om die te beschrijven.”

GenAI blijft in de kern een voorspelmachine. Het heeft data uit het verleden nodig om een voorspelling te doen als antwoord op een prompt. In het klein is dat de berekening van een token, in het groot is dat een tekst of afbeelding bestaande uit duizenden tokens. Indrukwekkend, maar nog steeds een numerieke voorspelling op basis van vervuilde datasets.

GenAI heeft ook een andere insteek voor waarheidsvinding. GenAI creëert een werkelijkheid op basis van patronen vanuit data uit het verleden. Dit is anders dan hoe onze wetenschap veelal werkt. Wetenschap komt tot waarheidsvinding door middel van onderzoek, veelal, in het heden. We krijgen nieuwe kennis door het uitvoeren van experimenten. Daarnaast is het fundament van wetenschap het stellen van kritische vragen en peer reviews. Wetenschappelijke waarheidsvinding wordt continu gecontroleerd. GenAI kan niet gecontroleerd worden omdat we geen idee hebben hoe de ‘black box’ tot een antwoord is gekomen. Resultaten kunnen ook niet gereproduceerd worden, omdat de uitkomsten iedere keer weer anders zijn. De validiteit van (Gen)AI-onderzoek is dan ook moeilijk te controleren. GenAI vraagt daarmee om, bijna religieus, blind vertrouwen.

Data degeneratie

Een ander gevaar is data degeneratie, of modelinstorting. GenAI neemt in kwaliteit af als het traint op GenAI data (en het kost ook meer energie). Het internet raakt steeds meer vervuild met AI-genereerde inhoud. Nieuwe generaties GenAI worden dan getraind op die GenAI-inhoud. Dit kopieerproces is te vergelijken met het recycleproces van papier, waar plastic de kwaliteit van papier vermindert. In zulke processen sluipt onzuiverheid zodat je eindproduct steeds meer in kwaliteit inlevert. Omdat GenAI sneller nieuwe afbeeldingen kan maken en tekst kan schrijven dan mensen, zal ons internet vol gaan staan met data dat niet door mensen is gemaakt, maar door machines.

Datadegeneratie bij Generatieve AI. Links een eerste generatie GenAI. Rechts een vierde generatie Generatieve AI gebaseerd op GenAI datasets. <https://ediscoverytoday.com/2024/08/26/degenerative-ai-what-happens-when-ai-trains-on-ai-data-artificial-intelligence-trends/ >

Koud water

GenAI is een ‘black box’ die voorspellingen doet op basis van datasets en wordt bijgestuurd door Big Tech. De uitkomsten van GenAI zijn indrukwekkend maar moeilijk te controleren op validiteit op hoe het tot die uitkomsten is gekomen. Het komt nog wel eens voor dat GenAI ernaast zit en gaat ‘hallucineren’. Dit betekent niet dat GenAI gemeden moet worden in het onderwijs. Het vraagt wel om een flinke plens koud water om uit de verwondering en uit de angst te stappen en het kritisch te benaderen.

Wat is (goed) onderwijs?

In de kern bestaat onderwijs om de jongere generatie voor te bereiden op de maatschappij (socialisatie). Hiertoe dienen zij in staat te zijn zich zelfstandig en kritisch op te stellen (subjectivering) door middel van basiskennis (kwalificatie) over die maatschappij en de wereld. Zij moeten ook in staat zijn samen te werken en anderen in hun waarde te laten (‘jouw vrijheid eindigt waar die van een ander begint’).

Onderwijs leert jongeren de wereld zoals wij hem kennen. Dit is de ‘erfenis’. Met deze erfenis leren jongeren waarom de wereld is zoals zij nu is, welke gevaren en successen de mensheid al heeft doorlopen, en welke inzichten tot nu toe zijn verworven. Het is dan aan de nieuwe generatie om de toekomst vorm te geven op basis van deze erfenis en hun inzichten weer over te dragen aan hun kinderen.

Je kunt alleen kritisch de toekomst vormgeven via het bezit van (domein)kennis. (Domein)kennis wordt verkregen via het eigen en inzichtelijk maken van informatie. Hoe meer informatie is eigen gemaakt als kennis in je langetermijngeheugen (opgeslagen als concepten en schema’s), hoe meer ruimte er overblijft in je werkgeheugen (kortetermijngeheugen) om kritisch en zelfstandig in de maatschappij te kunnen functioneren.

Het leren van feiten is nodig om tot concepten en schema’s te komen. Concepten beklijven, feiten raak je vaak onderweg kwijt. Echter, zonder die feiten was je niet tot dieper leren gekomen. Feitenkennis is en blijft dus cruciaal in het leerproces.

Beklijving van feiten, concepten, en schema’s vindt plaats door middel van ‘retrieval practice’: stof moet vaker terugkomen en opgehaald worden om verankerd te raken in het langetermijngeheugen. Vaardigheden worden daarnaast eigen gemaakt in een formatief proces. Toetsing meet van tijd tot tijd hoe de beklijving verloopt en geeft inzicht of bijsturing nodig is. Eindtoetsing blijft belangrijk als objectief meetinstrument om kwalificaties en beklijving van de ‘erfenis’ te waarborgen.

Onderwijs moet zich daarom vooral richten op het proces en niet op het eindproduct. Het eindproduct is een zichtbaar bewijs dat de leerdoelen zijn behaald. In een goed leerproces is het eindproduct meer een formaliteit dan een obstakel. Als dit wel het geval is, dan legt het eindproduct bloot dat er problemen in het leerproces zijn. Dit kan aan de leerling, de docent, of de methodiek liggen. Alle drie dienen dan kritisch bekeken te worden.

Welke plek heeft GenAI in het onderwijs?

(Basis en Voortgezet) Onderwijs dient er dus vooral voor om jongeren te vormen tot kritische en zelfstandige burgers. Hiervoor is kennisverwerving nodig. Hoe meer kennis iemand bezit hoe makkelijker, sneller, en dieper hij of zij nieuwe informatie kan beoordelen en tot zich kan nemen. Wanneer GenAI daarin kan ondersteunen, is zij welkom in het onderwijsproces. Als zij kennis onttrekt uit dat onderwijsproces, moeten leraren waakzaam zijn.

De gevaren van GenAI zijn betrouwbaarheid van informatie, de groeiende macht van Big Tech en hun invloed op het democratisch proces, de privacy van gegevensverwerking, het verlies van handelingsvermogen van de leraar, en het ontnemen van kennisverwerking bij leerlingen zodat zij minder kritisch en creatief kunnen denken. De vraag is dan, wat dient het onderwijs te ontwikkelen: GenAI modellen of de hersenen van onze jongeren?

In het GenAI tijdperk hebben we juist meer kennis nodig bij onze leerlingen willen ze kritisch GenAI kunnen benaderen. Wil je fake news en het zogenaamde ‘bullshitting’ van GenAI kunnen identificeren, dan moet je zelf ook een goed beeld van de wereld hebben, van topografie tot natuurkunde, van geschiedenis tot scheikunde. Dat hoeft niet in detail te zijn, dat hoeven niet eindeloze rijtjes feiten te zijn, maar concepten en schema’s waarmee je GenAI output alerter kan controleren.

Als onze leerlingen niet meer leren hoe ze hun eigen ideeën kunnen verwoorden, niet leren hoe ze tot eigen ideeën komen en ze communiceren, schuift de macht steeds meer naar Big Tech, die de poortwachters van informatie worden (en misschien al grotendeels zijn). De leerling offert dan alleen nog maar prompts op het GenAI-altaar om verwonderd te raken van het orakel en waarbij aflaten toegang geven tot meer mogelijkheden tot verwondering.

Waarom GenAI niet is zoals de introductie van de rekenmachine was

Er wordt wel eens gezegd dat de introductie van GenAI niet veel anders is dan de introductie van de rekenmachine: het vergemakkelijkt processen die niet meer noodzakelijk worden geacht zelf te doen. Zouden we deze theorie toepassen op GenAI dan zou je zoiets krijgen als, het vergemakkelijken van denken en het maken van teksten omdat dat dat tegenwoordig niet meer noodzakelijk is. Het zal echter kennis onttrekken uit het onderwijssysteem waardoor jongeren meer moeite hebben de wereld goed te begrijpen. Ook is GenAI output niet betrouwbaar daar waar een rekenmachine dat wel is

Zelf schrijven is het helder onder woorden brengen van wat je denkt. “Schrijven ordent en verheldert onze gedachten. Schrijven is hoe we ons een onderwerp eigen maken en begrijpen. Schrijven stelt ons in staat te ontdekken wat we weten – en wat we niet weten – over wat we proberen te leren.” (Zinsser). Als GenAI voor ons de teksten schrijft, in hoeverre weten we hoe we zelf denken? Schrijven brengt feitenkennis en inzichten in concepten bij elkaar. Het leert ons onszelf te begrijpen.

Daarnaast is ChatGPT gebruiken om informatie op te zoeken niet alleen inefficiënter dan je eigen hersenen, het belemmert dieper begrip. Immers, we kunnen maar 5-7 items vasthouden in ons kortetermijngeheugen. We hebben ons langetermijngeheugen nodig om dieper begrip te krijgen van complexe materie. Nieuwe informatie gepresenteerd door GenAI wordt verwerkt in het kortetermijngeheugen maar dat raakt dan snel te vol, de zogenaamde cognitieve overbelasting, waardoor we niet tot dieper inzicht komen.

Ook is het niet verstandig om onze kennis over te dragen aan Big Tech. Uiteindelijk blijven OpenAI, Claude, en Meta commerciële bedrijven met winstoogmerk en worden zij de nieuwe poortwachters van data en kennis. Het is belangrijker om de markt en hun aandeelhouders tevreden te houden, dan waarheidsvinding te waarborgen. Mogelijkheden worden opgeblazen en vernieuwingen moeten zo snel mogelijk worden doorgevoerd. De verwondering onder de (betalende) gebruikers moet in stand worden gehouden.

van verwondering naar een kritische benadering

We kunnen verwonderd raken over de mogelijkheden van GenAI en zullen in de toekomst nog vele wonderbaarlijke ontwikkelingen zien. Maar GenAI is van nature niet zonder fouten, sterker nog, het zit in de architectuur dat er fouten in het systeem sluipen, resulterend in de eerdergenoemde data degeneratie. Big Tech probeert dat nu steeds meer te verkopen als onderdeel van de magie omdat zij ook weten dat het niet helemaal zal verdwijnen.

Algoritmen zijn, naast het ‘black box’ principe, niet objectief of neutraal. Modellen zijn getraind op basis van wat ontwikkelaars hebben bestempeld als juist of onjuist. Zij volgen ook patronen op internet die niet altijd over waarheidsvinding gaan. GenAI blijft een gestuurde voorspelmachine zonder begrip van de wereld, ongevoelig voor feit en fictie. Alleen als je boven de stof staat kan je informatie die GenAI genereert controleren op juistheid.

Toch zullen veel mensen kennisverwerving wederom ter discussie stellen nu GenAI ons zoveel werk uit handen neemt. Zeker de oudere generatie die al veel kennis heeft verworven via een traditioneel onderwijssysteem zullen moeilijker kunnen begrijpen wat de gevolgen zullen zijn als we de nieuwe generatie niet meer de erfenis overdragen maar op GenAI vertrouwen dat informatie gewaarborgd blijft. En dit is niet de eerste keer dat kennisverwerving ter discussie wordt gesteld. De opkomst van Google aan het begin van deze eeuw zorgde er ook al voor dat mensen vragen stelden bij het verwerven van kennis, je kunt het immers toch altijd opzoeken?

Leren zal, net als bij de introductie van de TV en het internet, in twijfel worden getrokken. Leren doet immers pijn. Je moet er moeite voor doen, waarom zou je zelf nog iets leren als GenAI het binnen een paar seconden kan produceren? Hier zien we wederom de focus op het eindproduct. Dat is ook wat je op social media en LinkedIn langs ziet komen: een vitrine van curiositeiten zonder dat we goed weten wat het bijdraagt aan een goed leerproces. Het gaat er niet om wat GenAI kan. Het gaat erom welk residu er achterblijft bij onze leerlingen.

GenAI is vooral handig als je de boven de stof staat. Voor het (mede-)creëren van eindproducten, een sparringspartner, een automatiseringsmaatje, een razendsnel woordenboek, een eindeloze thesaurus. Maar in een leerproces dient er kritisch gekeken te worden naar het verkrijgen van diepere kennis door middel van GenAI.

leraren als hoeders van kennis

Leraren en scholen krijgen in het AI-tijdperk een belangrijke rol. Zij zullen, naast een aantal andere beroepen, de cruciale taak van hoeders van kennis op zich moeten nemen. Leraren hebben niet zoveel geld en macht als Big Tech, maar hebben ook geen direct lucratief belang bij het slagen van hun leerlingen. Zij waarborgen de overdracht van kennis en vaardigheden zodat de maatschappij zelfstandige en (zelf-)kritische burgers heeft om de democratie in stand te houden. Als je dit als leraar pretentieuze grootspraak vindt, onderschat je de rol van de leraar in een democratie en wordt het hoog tijd de positie van de leraar niet alleen in de maatschappij maar ook bij leraren zelf in aanzien te verhogen.

Deze belangrijke taak vraagt om een grote verantwoordelijkheid. Leraren zullen hun vakkennis moeten beheersen en bijhouden. Zij moeten de betrouwbare informatiebron zijn en als leerlingen kritische vragen stellen in staat moeten zijn op een professionele manier antwoord te geven of bij te sturen in hun eigen kennis. AI vormt een reële bedreiging voor de nauwkeurigheid van schoolkennis en daarmee voor de geldigheid van lesmateriaal. Het is dan ook aan de leraar om GenAI te gebruiken of toe te staan in zijn of haar onderwijsproces. Elke toepassing van GenAI waarbij de leerling minder hoeft te kennen of te leren, moet met argusogen worden benaderd.

Waarom je niet veel tijd hoeft en moet besteden in het onderwijs aan het leren van GenAI

GenAI is de eerste ICT-innovatie waar je maar weinig uitleg voor nodig hebt. Je kunt letterlijk aan ChatGPT vragen: “hoe werkt dit?” of “wat als ik dit wil doen…?” Je vraagt of GenAI iets wil doen alsof je het aan een persoon vraagt. Je kunt het systeem binnen 30 minuten uitleggen. Het vereist geen diepgaande kennis. Het is begrijpen hoe het min of meer werkt. De rest is experimenteren.

Het enige deel waar je bij GenAI expert in kunt worden is het goed formuleren van prompts. Binnen 30 minuten kan je leerlingen uitleggen waar goede prompts aan moeten voldoen. Dit vraagt echter om meer dan alleen GenAI kennis. Om iets goed te formuleren heb je goede taalbeheersing nodig. Je moet goed kunnen omschrijven wat je wilt in de juiste bewoordingen. Hoe breder je woordenschat in je langetermijngeheugen, hoe betere prompts je kunt maken. Je kunt veel promptlijstjes op internet vinden, maar als je de prompt van iemand anders in een GenAI black box stopt, in hoeverre ben je nog aan het leren? In hoeverre ben je jezelf nog aan het ontwikkelen? Ligt de focus dan op het proces of het wonderbaarlijke eindproduct?

Daarnaast heeft het ook niet veel zin om leerlingen diepgaande gebruikerskennis van ChatGPT mee te geven. De ontwikkelingen gaan te snel. Tien jaar geleden was de programmeertaal Java de meeste gebruikte taal in de ICT-wereld. Vandaag de dag is dat Python. Als we leerlingen van toen volop Java hadden geleerd, hebben ze daar nu weinig aan.

Wat dan overblijft in het onderwijs is veelal fröbelen met AI. Leerlingen krijgen allerlei opdrachten die bij lange na niet altijd iets bijdragen aan het eigen maken van kennis, maar slecht vragen om een ‘ervaring’. De kernvraag voor het gebruik van GenAI in het onderwijs zou altijd moeten zijn: wat draagt dit bij aan het creëren van kennis in het langetermijngeheugen van de leerling?

Als laatste lijkt de GenAI hype grotendeels de Gartner technologie hype cyclus te volgen. De afgelopen maanden komt er steeds meer kritiek op de stagnering van ontwikkelingen. Het is zeker zo dat er nieuwe elementen worden toegevoegd, maar de vraag die steeds meer wordt gesteld is, “wat hebben we hieraan?” Het feit dat nieuwe data om GenAI te trainen opraakt rond 2026, geeft aan dat er een plafond in zicht is wat betreft trainingsdata. Kwantiteit kan niet meer compenseren voor kwaliteit. De output van GenAI blijft fouten houden, komt steeds meer vlak over, en vervuilt het internet met nietszeggende informatie. Probleem is alleen dat Big Tech hier volledig op heeft ingezet en het ‘too big to fail’ is geworden om de kritiek serieus te nemen en nuchter naar GenAI te kijken.

 

Kansen: naar het plateau van productiviteit

Dit betekent niet dat we GenAI moeten weren uit het onderwijs. Het kan, mits kritisch (dat wil zeggen op basis van kennis over GenAI), worden ingezet. De kernvraag is, versnelt het denkprocessen, zoals een rekenmachine, of neemt het denkprocessen over?

Je kunt het vergelijken met koken. Als je kookt en een recept volgt, gebruik je hulpmiddelen zoals een mes, een pan, en een keukenmachine. In eerste instantie duurt het wat langer om je gerecht te maken. Je moet de vaardigheid nog eigen maken. Stappen mislukken en je probeert zo goed als je kunt het recept te volgen. Naar mate je vaker het gerecht maakt, kan je het uit je hoofd, verbeter je processen, en experimenteer je met smaakvariaties. Dit is een leerproces. GenAI heeft het risico de magnetronmaaltijdvariant te zijn dat je binnen 5 minuten hebt opgewarmd. Het resultaat is hetzelfde (een warm gerecht) maar je hebt geen vaardigheden eigengemaakt, je hebt geen goed idee welke ingrediënten erin zitten (tenzij je de E-nummers opzoekt), en het smaakt minder lekker. Daar bovenop heb je jezelf niet ontwikkeld.

Als je GenAI als keukenmachine gebruikt, als onderdeel van het leerproces, maar niet cruciale elementen laat overnemen, kan het van waarde zijn in het onderwijs. Hiervoor is kennis nodig over effectief onderwijs en over Generatieve AI. Omdat GenAI een stuk gereedschap voor de docent is, moet hij ook zo benaderd worden. Waar in het leerproces heeft het meerwaarde? Hoe kan ik de kwalificatie van mijn leerlingen waarborgen? Wat kan ik uit handen geven? Waar wil ik regie houden? Uiteindelijk zullen er steeds meer ‘good practices’ gedeeld worden (en helaas de mislukkingen minder). Voor nu is het kijken waar processen verantwoord geautomatiseerd kunnen worden.

Voor mijn eigen lessen gebruik ik ChatGPT om oefeningen te maken, weggezakte kennis over literatuur en taalkunde op te frissen, synoniemen te vinden, of zinnen in mijn readers anders te formuleren. Ik gebruik ChatGPT in combinatie met Suno om grammaticaliedjes te maken om na een EDI-les af te spelen, materiaal te ontwikkelen voor mijn StarlingESL platform, en korte samenvattingen te maken voor boeken op RookReading.com. Dit werkt prima omdat ik boven de stof sta en kan controleren op fouten. Ook kan ik wijzigingen in het materiaal aanbrengen waarvan ik uit ervaring weet dat het beter is voor mijn leerlingen. Ik behoud mijn handelingsvermogen en controle over de leerdoelen die ik met mijn leerlingen wil bereiken.

Om deze reden laat ik GenAI niet mijn lessen plannen of complete toetsen maken. Beide zijn een uiting van mijn expertise over het onderwijsproces. Iedere klas is anders, ieder cohort is anders, het moment van de dag is bepalend voor mijn les. Wanneer ik ChatGPT mijn lessen laat plannen, mist de AI heel veel informatie en variabelen om tot een goede les te komen en leer ik mijzelf niet het organiseren van een degelijke les. Het verstoort mijn leerproces in het ontwikkelen van goede lessen. Waar GenAI wel bij kan helpen is suggesties doen, die ik mee kan nemen in mijn lesvoorbereiding, maar ik behoud de controle en bewaak mijn handelingsvermogen.

Mijn 6VWO klas moet een pre-academisch essay schrijven. Hiervoor dienen zij eerst over het onderwerp te brainstormen. Ik wil niet dat zij hier ChatGPT voor gebruiken want één van mijn leerdoelen is dat leerlingen zelfstandig tot eigen ideeën moeten kunnen komen, deze op waarde oordelen, en organiseren waaruit zij vervolgens een essay schrijven. Zodra ik de brainstorm overlaat aan ChatGPT, voeren leerlingen niet hun eigen ideeën uit, maar laten zij zich leiden door informatie die uit een voorspelling het meest waarschijnlijk is.

Wanneer leerlingen klaar zijn met hun brainstorm en hebben overlegd met hun klasgenoten laat ik op het bord ChatGPT een brainstorm doen. Op deze manier kunnen leerlingen zien wat ze kunnen toevoegen aan hun eigen brainstorm. Deze stap is overigens niet noodzakelijk, maar kan gezien worden als een digitale vaardigheden oefening hoe om te gaan met GenAI: eerste zelf nadenken voordat je GenAI gebruikt. Het doel is niet het creëren van een product (de brainstorm), maar om vaardigheden aan te leren die zelfstandig toe te passen zijn. Alleen dan maak je iemand weerbaar voor de toekomst.

Teacher Assistent op basis van eigen datasets

Waar ik een grote toepassing in zie is het gebruik van Open Source GenAI toolkits. Dit zijn kleine, lokale AI-modellen die in de basis alleen ‘taal’ kennen maar verder geen inhoudelijke datasets hebben. Lokaal hoeft overigens niet fysiek ‘lokaal’ te zijn, maar kan ook een gesloten omgeving in de cloud zijn. Op Harvard hebben ze al een dergelijk experiment gedaan met basisnatuurkunde. De resultaten waren positief, maar ze geven wel de kanttekening dat het echt als ondersteuning gebruikt moet worden en niet als vervanging van de docent.

De docent kan dan een eigen dataset (de stof van een hoofdstuk of een heel jaar) toevoegen aan het model en aanbieden aan zijn of haar leerlingen om als Teacher Assistent te gebruiken. Omdat de data niet vervuild is zal het model weinig tot niet hallucineren. Wanneer er toch fouten optreden kan je als docent de AI bijsturen met een nieuwe dataset.

Deze datasets kunnen tussen leraren uitgewisseld worden. Je hoeft hier geen programmeerkennis voor te hebben. Informatie kan in een tekstbestand aangeleverd worden. Dit zorgt ervoor dat de leraar zijn controle en handelingsvermogen behoudt en niet wordt overgeleverd aan Big Tech.

Toch moet er bij het gebruik van GenAI als Teacher Assistant voorzichtigheid geboden worden. In een onderzoek van Hamsa Bastani et al. genaamd Generative AI Can Harm Learning hielp een GPT Tutor leerlingen weliswaar bij het maken van wiskunde opgaven, maar presteerden leerlingen naderhand net zo goed als leerlingen die geen GPT Tutor hadden gebruikt. De GPT Tutor hielp wel beter dan de GPT Base, die vergelijkbaar werkt met ChatGPT. Hier presteerden leerlingen slechter na verwijdering van de GenAI. De onderzoekers concludeerden dat leerlingen de GenAI vooral als ‘krukje’ gebruikten: zodra het krukje verwijderd werd, presteerden leerlingen met de GPT Base slechter. Je zou de GPT Tutor dus vooral in de ‘scaffolding’ fase kunnen inzetten in het leerproces, maar je zal als docent de leerlingen zeker nog na deze fase moeten begeleiden om er zelfstandige, kritische denkers van te maken. Mitte Schroeven schreef hier nog een artikel over: “Onderzoek in een notendop: Generatieve AI kan het leren schaden.”

Conclusie

Uiteindelijk gaat er om niet het hele curriculum het raam uit te gooien, maar om GenAI daar te gebruiken waar het het leerproces kan bevorderen. Leraren moeten boven de verwondering staan en in staat zijn hun onderwijsproces te verdedigen tegenover de gehypnotiseerde stemmen uit de maatschappij. Big Tech moet in dienst staan van het onderwijs in plaats van andersom. Het doel van onderwijs is namelijk niet veranderd: kwalificatie, socialisatie, en subjectificatie. Onze hersenen werken nog steeds hetzelfde als duizend jaar geleden: feiten bouwen concepten en schema’s die blijven hangen in het langetermijngeheugen. Hiermee levert onderwijs kritische, zelfstandige, en weerbare jongeren in de maatschappij, die de erfenis kennen en daarop voortbouwen. GenAI kan hierin een waardevolle bijdrage leveren, maar verandert deze kerntaak niet. Het wordt tijd dat het onderwijs haar verantwoordelijkheid oppakt.

ervaren & beheersen: zoeken naar verduidelijking in het conceptexamenprogramma

Het definitieve conceptexamenprogramma Engels (en ook andere programma’s) heeft een nieuw concept ten opzichte van het oude programma: ervaringsdoelen. “In tegenstelling tot de vorige generatie gaat het […] om zowel beheersings- als ervaringsdoelen.” (Toelichtingsdocument, p. 5). Eindtermen zijn gelabeld met ‘E’ (Ervaring), ‘B’ (Beheersing), of ‘H’ (Hybride; een combinatie van de twee). Ondanks dat deze ‘ervaringsdoelen’ nieuw zijn, wordt er niet goed uitgelegd hoe een docent deze moet interpreteren.

Beheersingsdoelen zijn duidelijk. Men mag aannemen dat deze op dezelfde manier moet worden geïnterpreteerd als de oude doelen. Een doel moet in het PTA staan en worden afgerond. Afronding vindt plaats door middel van een toets of een praktische opdracht. De normering kan een cijfer zijn, maar ook een ‘handelingsdeel’: de leerling heeft het naar behoren afgerond. Als een leerling een beoordelingsmoment heeft gemist moet hij of zij dit inhalen. Een leerling mag alleen aan het Centraal Examen beginnen als het PTA compleet is.

Er is één domein uit het huidige programma waar weliswaar verantwoording voor moet worden afgelegd in het PTA maar geen beoordelingsmoment kent: Domein F -Oriëntatie op studie en beroep. Echter, dit domein kent geen eindterm.

De ervaringsdoelen in het nieuwe programma zijn wel gekoppeld aan een eindterm. De vraag is of deze doelen in het PTA moeten worden verantwoord. Moet de docent aangeven of een leerling voldoende ‘ervaring’ heeft ondergaan? Als een leerling een ‘ervaring gemist heeft, moet deze leerling deze inhalen? Wat als een leerling weliswaar aanwezig was bij de activiteit, maar zichtbaar geen prestatie heeft verricht? Moet een docent de leerling een nieuwe mogelijkheid bieden om de ‘ervaring’ in te halen? Kan het zo zijn dat een ervaring, bijvoorbeeld, slechts een half uur is in het gehele examentraject, met andere woorden, is er een kwantiteitseis bij een (rijke) ‘ervaring’?

Hybride eindtermen zouden nog problematischer kunnen worden. Welk deel van de eindterm is beheersing en welk deel ervaring? Laten we er een hybride Eindterm bij pakken:

Welk onderdeel moet ik als docent beoordelen? Of staat het mij vrij zelf te bepalen of ik het inzicht in taalleerprocessen beoordeel of de reflectie daarop, of allebei? Hoe gaat de inspectie dit beoordelen? Los van het feit dat ervaringsdoelen beter uitgelegd moeten worden, is het ook belangrijk om te weten welk deel bij hybride eindtermen beheersing is en welk deel ervaring.

SLO gaat niet over hoe iets beoordeeld wordt. Dat ligt bij de scholen en secties in het bijzonder. Echter, het is wel belangrijk voor de docenten en de inspectie om te weten hoe de ‘ervaringen’ gelezen moeten worden. Docenten willen zich voorbereiden op het maken van materiaal en weten in hoeverre de ‘ervaringen’ worden gemonitord door de inspectie. Je kunt alleen ontwerpen als je weet hoe je de doelen moet interpreteren en toepassen.

Uiteindelijk gaat het erom dat we leerlingen rijke ervaringen van taal willen meegeven, maar als docenten weten wij ook dat wij ons moeten houden aan het examenprogramma. Als docent wil ik houvast en concreet weten hoe een ervaring moet worden geïnterpreteerd, toegepast, en verantwoord. Alleen dan kan ik beoordelen of dit examenprogramma haalbaar is of niet.

Overzicht eindtermen Engels vwo

Engels Domein B (taalbewustzijn) – Eindterm 14: een nieuw voorstel

[artikel in .pdf]

In mijn brief aan de Commissie Onderwijs was ik voor domeinen B en C behoorlijk kritisch op het definitieve conceptexamenprogramma Engels vwo. Het is altijd makkelijker om kritiek te uiten, maar het vraagt meer tijd en inspanning om met een tegenvoorstel te komen. Hierbij doe ik een poging Eindterm 14 te herschrijven naar een beknopter en meer werkbare eindterm. Het is zeker niet mijn bedoeling om dit te presenteren als hét alternatief, maar schrijven verheldert het denken. Ook hoop ik dat ik een inhoudelijke bijdrage kan leveren aan de discussie over curriculumvernieuwing. Zie het als mijn manier om feedback te geven.

Eindterm 14

Eindterm 14 gaat over digitale middelen in relatie tot Engels. Echter, Eindterm 14 is bij iedere MVT (Frans, Duits, en Engels) exact hetzelfde. Het enige verschil is dat het in de specifieke taal moet zijn, niet per definitie in relatie tot die taal. Daarmee kom je meer in Domein A dan in Domein C. De vraag is dan ook of dezelfde digitale vaardigheden bij elk van de verschillende talen moet worden afgerond.

Het zou beter zijn als er een apart programma Digitale Geletterdheid komt waar doelen uit ‘geadopteerd’ kunnen worden door verschillende vakken. De inspectie kan dan controleren of en waar die doelen behaald worden binnen het complete PTA. Het staat scholen natuurlijk vrij om de digitale vaardigheden bij meerdere vakken te laten terugkomen en zo een rijk digitaal programma te bieden.

Voor nu kijken we alleen naar Eindterm 14 binnen Engels. Eerst geef ik het huidige concept, daarna kom ik met een voorstel.  De verschillende elementen zijn genummerd voor referentie later. 14 staat voor het huidige concept en N14 staat voor nieuw concept.

Huidig concept Eindterm 14 (blz. 20-21).

Nieuw concept Eindterm 14 (N14).

Eindterm 14 gaat over kritische reflectie op het gebruik van digitale middelen, over bewustwording van het effect van technologie op taalgebruik, bekend raken met de huidige ontwikkelingen in technologie en de communicatie, verschillende vormen van informatie- en communicatievoorziening via ICT kennen, en effectief gebruik kunnen maken van die technologie. Domein A gaat over de bruikbaarheid, relevantie, en betrouwbaarheid van (digitale) bronnen; Eindterm 14 in Domein C over de bruikbaarheid, relevantie, en betrouwbaarheid van het digitale middel. Anders gezegd, Domein A gaat over de inhoud en dat gericht op de taal, Eindterm 14 gaat over hoe het middel functioneert, hoe die inhoud tot stand is gekomen, en hoe het middel zich verhoudt tot de doeltaal (Engels in dit geval).

Het is belangrijk ICT-middelen niet concreet te benoemen om de doelen voor de lange termijn houdbaar te houden. Zo vind je hier niets over VR-toepassingen of de risico’s van Big Data, al zijn deze net zo relevant als het gebruik van Generatieve AI of andere genererende toepassingen. Dit is omdat het niet gaat om de beheersing van een specifiek middel, maar de mogelijkheid te hebben technologie in algemene zin kritisch te beoordelen met communicatie in het bijzonder.

De einddoelen zijn van 4 naar 2 teruggebracht en breder opgezet. Ik heb ‘evalueer’ veranderd naar ‘kritisch en effectief’ (N14.2). ‘Kritisch’ impliceert (domein)kennis, waardoor je als leerling ook meer gedwongen wordt leerlingen kennis over ICT mee te geven in plaats alleen met ICT te werken. Het doel, lijkt mij, is dat een leerling ICT kritisch kan evalueren op de relevantie en effectiviteit voor de Engelse taal.

Ik heb de twee ‘experimenteer’ punten (14.3 en 14.4) uit de doelen gehaald. Als docent kan je dit moeilijk beoordelen. Experimenteren is een onderdeel van een leerproces, maar dat zou geen doel op zich moeten zijn. Experimenteren met VR heeft als doel een beter begrip van deze technologie te krijgen en daardoor het kritisch te kunnen evalueren wanneer het effectief gebruikt kan worden en hoe. Vervang VR voor elke andere, bekende en nog onbekende, digitale ontwikkeling en je kerndoelen blijven in het nieuwe voorstel houdbaar.

Suggesties (‘te denken valt aan’)

Suggesties geven richting aan de doelen. Het gaat verder dan ‘slechts’ een optie geven wat je eventueel zou kunnen doen, zoals door sommige mensen wordt aangedragen. Suggesties geven aan hoe het adviesorgaan de doelen in de lespraktijk voor zich ziet en hoe je de eindterm met doelen moet interpreteren.

Het is opvallend dat in de suggesties nergens een voorstel wordt gedaan voor concrete kennisoverdracht zoals de EDI-methode, terwijl dit wel een valide middel is om eindtermen af te ronden. Hierin zie je dat de suggesties een hint geven in hoe SLO kijkt naar de eindtermen en de doelen. Het is zeker zo dat SLO niet voorschrijft hoe je de doelen moet behalen, maar de suggesties geven wel richting.

De suggesties

Suggestie 14.a lijkt mij prima zoals hij is. Wel moet het hier verder gaan dan alleen simpele opmaakmogelijkheden zoals tekst dik gedrukt maken. Denk hierbij aan tabellen, regelafstand, effectief gebruik van grammatica- en spellingcheck, het maken van kolommen, een inhoudsopgave, etc. Dit kan worden opgenomen in een digitale leerlijn ICT-vaardigheden.

Suggestie 14.b heeft niet veel met Engels te maken. Dit gaat ook niet veel verder dan wat knip- en plakwerk. Het mist een kritische benadering en begrip van het gebruik van taal door Generatieve AI. Goed taalgebruik vraagt om een opbouw waarbij de verschillende tekstelementen (zoals alinea’s) elkaar logisch opvolgen. Ik begrijp dat de evaluatie in de keuzes van de output van AI is, maar het leert een leerling niet hoe je Generatieve AI goed in kunt zetten.

Suggestie 14.c leert leerlingen niet kritisch naar Generatieve AI output te kijken. Het product van 14.c is een presentatie over onderwerp X, samengesteld door een kritische selectie van output. Wat veel beter werkt is leerlingen output van verschillende AI-platforms met elkaar te vergelijken en evalueren op waarheid en taalgebruik (zie N14.b). Dit kan anoniem via DuckDuckGo AI Chat, waarbij vier modellen gebruikt kunnen worden.

De uitkomsten van deze analyse (academische vaardigheid) kunnen schriftelijk of mondeling gepresenteerd worden Het doel is dan niet meer een product via Generatieve AI, maar een product over Generatieve AI. Dit sluit beter aan bij doelen N14.1 maar vooral bij N14.2. Ik heb een korte lessenserie uitgewerkt hoe dat vorm kan krijgen. Deze wordt verderop in dit artikel besproken.

Suggestie 14.d lijkt mij verder prima. Wel moet domein A hier veel bij betrokken worden, maar er is ook het voorstel om meerdere domeinen in een één product te mogen afsluiten.

Suggestie 14.e lijkt mij niet goed aansluiten bij de doelen. Hier wordt namelijk niet ingegaan op het evalueren en op waarde inschatten van chatbots.  Het zegt alleen, ‘gebruik ICT ter voorbereiding op een taaltaak’.

Bij suggestie N14.e wordt aansluiting gezocht bij duale codering uit de cognitieve wetenschap en kan helpen in het vervolgonderwijs. Het woord project lijkt het groter te maken dan het is. Je kunt hier denken aan een groepsopdracht waarin verschillende applicaties worden onderverdeeld onder de leden, en na bespreking een infographic laten maken. Daarna worden de infographics en ervaringen gedeeld met de klas. Dit kan in twee lessen afgerond worden

Je kunt ook denken aan een opdracht waarbij je aan het begin van een module leerlingen een onderzoeksopdracht geeft over leerapps en die laat toepassen in hun eigen leerproces. Aan het begin van de volgende module evalueer je de uitkomsten via infographics en (groeps-)gesprekken.

Mijn vraag is dan wel, moet dit via een beoordeling worden afgesloten, zoals bijvoorbeeld een ‘handelingsdeel’ of volstaat het uitvoeren van dit idee om te voldoen aan Eindterm 14? Het moet in het PTA terugkomen, dus mijn vermoeden ligt bij het leveren van een beoordeling.

Voorbeeld les: Begrijpen en vergelijken van AI-modellen

De lessenserie in pdf uitgewerkt.

Al hoewel de praktische uitvoering pas in een later stadium aan bod komt, kan het geen kwaad om een fictieve lessenserie op te stellen om te zien hoe de doelen kunnen worden behaald. Als je geen helder beeld hebt van de uitvoering van je eindtermen, weet je ook minder goed of zij überhaupt haalbaar zijn. Het helpt ook in discussies om iets concreets te hebben zodat men een beter beeld heeft over de praktijk.

Ik heb een lessenserie gemaakt over het maken en beoordelen van Generatieve AI over een bepaald controversieel onderwerp. Dit ontwerp is verre van perfect en vraagt ook om nog verder onderzoek in de middelen. Zoals ik al vaker heb aangedragen is er een probleem met Generatieve AI en de AVG. Het voorstel dat ik doe zal niet waterdicht zijn, maar benadert veilig gebruik van Generatieve AI meer dat het programma dat op dit moment doet.

DuckDuckGo AI Chat is een platform waar je vier verschillende AI-modellen kunt gebruiken (Chat-4o, Claude, Llama, Mixtral). Het gebruik is anoniem, je hebt geen account nodig, en de gegevens worden na gebruik verwijderd. Hopelijk zullen er in de (nabije) toekomst meerdere van dit soort initiatieven worden gelanceerd zodat Generatieve AI beter in het onderwijs gebruik kan worden. ChatGPT heeft al een optie dat gegevens niet worden opgeslagen, maar vraagt nog wel om een account.

De opbouw van de les is kennisverwerving (les 1), verzamelen van data (les 2), data vergelijken en analyseren (les 3), ideeën over AI-modellen delen via een beschouwing (les 4). Bij het schrijven van deze beschouwing mogen ze geen gebruik maken van het internet. Het doel is namelijk dat ze laten zien dat ze inzichten hebben verworven in Generatieve AI, niet het verzamelen van informatie op internet. Huiswerk is minimaal zodat leerlingen meer tijd hebben om voor hun leeslijst te lezen.

Nakijken kan gedaan worden met behulp van een rubric, en hoeft niet per definitie met een cijfer worden afgesloten. Je kunt het ook beoordelen als handelingsdeel of punten toekennen voor een Digitale Geletterdheid portfolio. De beschouwing is weliswaar in het Engels, maar dient niet nagekeken te worden op grammatica en spelling, tenzij dit de communicatie hindert (ideeën zijn niet duidelijk, zinnen lopen niet logisch). Dit zorgt ervoor dat er een minder grote nakijkdruk is voor de docent. De kerndoelen van Eindterm N14 zijn leidend.

Conclusie

Het is zeker belangrijk om nieuwe technologie, zoals Generatieve AI, te behandelen in de les. Het zou wel beter zijn als scholen meer flexibiliteit krijgen in het behandelen van Digitale Geletterdheid over het hele PTA. Dit zou kunnen via een apart programma waar verschillende vakken elementen uit kunnen ‘adopteren’ en integreren in hun eigen PTA.

Het is belangrijk de doelen bij de eindtermen beknopt te houden zodat er ruimte blijft bij de docent om keuzes te maken in de verdieping en verbreding. We gaan van 26 doelen in het huidige systeem naar 84 doelen in het nieuwe systeem. Dit maakt het programma niet concreter maar vooral groter. Door terug te snijden naar de kern van ICT-vaardigheden houd je de doelen houdbaar voor de langere termijn en is het voor docenten duidelijker waar de eindterm over gaat.

Geachte leden van de commissie Onderwijs

Conceptexamenprogramma Engelse taal en cultuur – vwo

Commissiedebat : Curriculumherziening en de voortgangsrapportage masterplan basisvaardigheden

Twtter/X thread (met screenshots uit het programma)

Met dank aan Charlotte Goulmy voor het wegwijs maken in het schrijven van brieven aan de Tweede Kamer :).

Tekst kan typefouten bevatten, het is maandagnacht geschreven met weinig tot geen tijd voor een goede controle.

_________________________________________________

 

Geachte leden van de commissie Onderwijs,

Excuses voor de lange mail. Ik had zelf ook andere plannen voor mijn maandagavond, maar dit geeft aan hoe urgent de situatie is. 16 oktober aanstaande gaan jullie in gesprek over Curriculumherziening en de voortgangsrapportage masterplan basisvaardigheden en hoe belangrijk die zijn. Hieronder volgt mijn kritiek op dit programma. Ik heb de belangrijkste punten dikgedrukt, zodat mijn grootste zorgen duidelijk zijn. Deze mail is op persoonlijke titel.

Mijn naam is Wouter de Jong. Ik ben 18 jaar werkzaam in het onderwijs en werk op dit moment alweer 14 jaar als eerstegraads docent op het Stedelijk Gymnasium in Leiden. Daarnaast ben ik lange tijd ICT&Onderwijs Coördinator geweest bij verschillende scholen. Didactisch zit ik grotendeels in de Directe Instructie hoek van het onderwijs, waarbij ik kritisch kijk naar wetenschappelijk onderzoek. Ik innoveer graag, ook digitaal, maar wel vanuit inzichten uit de cognitieve wetenschap.

Na het lezen van het Conceptexamenprogramma Engels vwo voelde ik mij genoodzaakt hier op te reageren omdat ik mij zorgen maak over de gevolgen van dit voorstel. Het zal de werkdruk van leerlingen en docenten verhogen, kansarme leerlingen in het nadeel brengen, en met het verheffen van het gebruik van experimentele technologie (Generatieve AI, zoals ChatGPT) grote risico’s met zich meebrengen.

Maar bovenal zie ik een groot probleem in de uitvoering. Met 20 eindtermen en 84(!) doelen binnen die eindtermen is het nog maar de vraag of dit programma überhaupt op een degelijke manier kan worden uitgevoerd in twee jaar. De kans is groot dat doelen worden afgeraffeld en afgevinkt. Tijd voor verdieping en beklijving is er nauwelijks, laat staan inspelen op gebeurtenissen uit de maatschappij.

Er wordt al jaren geroepen om rust in het onderwijs. We zitten met een groot lerarentekort. Dit programma zorgt voor meer werkdruk en minder ruimte voor de eigen professionele ontwikkeling en maakt het beroep minder aantrekkelijk. De kernvraag is, zijn grote domeinen B (Taalbewustzijn) en C (Cultuurbewustzijn) van zo groot belang dat ze in een MVT curriculum moeten worden verankerd?

Algemeen

Ieder curriculum dient om de zoveel jaar kritisch bekeken te worden en bijgesteld naar de huidige normen van de maatschappij. Daarbij moeten we het kerndoel van onderwijs niet uit het oog worden verliezen: de erfenis van onze beschaving overdragen aan de nieuwe generatie zodat zij daarop kritisch kunnen voortbouwen. Deze erfenis kan alleen kritisch en creatief benaderd worden met voldoende (domein)kennis.

Het lijkt erop dat er met dit programma meer is bijgekomen en dat taalverwerving ruimte moet maken voor zaken die eerder met taalkunde dan met Engels te maken. Er zijn maar liefst 20 eindtermen die afgesloten moeten worden. Daarnaast laten de suggesties bij deze 20 eindtermen allerlei voorbeelden zien met werkstukken, verslagen, en presentaties. Dit zal in de praktijk betekenen dat

  • Dit de werkdruk bij zowel leerlingen als bij docenten zal verhogen.
  • Eindtermen niet degelijk behandeld kunnen worden.
  • Zwakke leerlingen geen ruimte krijgen voldoende (domein)kennis eigen te maken.
  • Scholen minder ruimte krijgen hun eigen accenten te leggen.
  • Docenten minder ruimte krijgen hun passie binnen hun vak te kunnen delen met leerlingen.

Indien werkstukken en verslagen thuis gemaakt mogen worden, wordt dit zeer problematisch met Generatieve AI. Leerlingen kunnen nu massaal hun werkstukken via Generatieve AI laten doen. Wat overigens niet wil zeggen dat je nooit Generatieve AI moet gebruiken, maar wat wil je vandaag de dag nog bereiken met verslagen en werkstukken in de wereld van AI?

Het lijkt erop dat er in dit programma wordt vergeten dat we het hier hebben over leerlingen die nog een moderne vreemde taal eigen moeten maken. Het programma heeft er alle schijn van er vanuit te gaan dat leerlingen de taal voldoende beheersen om er analytisch naar te kijken. Sommige doelen gaan meer over filologie en taalkunde, over identiteit, over culturele bewustwording, maar niet over de Engelse taal.

Het gaat er niet om of het wel of niet belangrijk is, het gaat erom of het belangrijk genoeg is voor een eindterm. Ik vertel graag over de ontwikkeling van taal, maar om hier een eindterm van te maken wordt het verheven naar  een platform dat al bezet was door taalbeheersing. Leerlingen moeten Engels beheersen. Het zijn (nog) geen studenten Vergelijkende Taalwetenschappen. Daarbij kan een docent natuurlijk af en toe verdieping zoeken in dit mooie domein, maar een eindterm dwingt een tijdsinvestering af die de docent en zwakkere leerlingen niet altijd hebben.

Als laatste wil ik hier alvast aanstippen dat de verankering van het gebruik van Generatieve AI in het onderwijs praktische, juridisch, en morele bezwaren heeft. Ik ben op dit moment bezig met het schrijven van een artikel over Generatieve AI in het onderwijs en ben dus ondertussen redelijk ingelezen over deze techniek en de risico’s van Generatieve AI in het onderwijs. Het is nog te vroeg om deze experimentele technologie in een eindterm vast te leggen. Geef scholen de komende jaren eerst de gelegenheid Generatieve AI te onderzoeken alvorens dit te verankeren in een MVT programma.

Raamwerk met domeinen en subdomeinen (blz 10).

Bij de opmerkingen staat dat het CE schriftelijke, én auditieve, én audiovisuele bronnen gebruikt. Betekent dit dat het CE digitaal getoetst gaat worden? Omdat Engels een kernvak is, zal een compleet cohort in één keer het examen moeten doen. Hebben scholen voldoende ICT voorzieningen om dit te doen? Of is het idee dat er ook gesplitst getoetst mag worden? Zal er geld beschikbaar worden gesteld om dit te bewerkstelligen of zal dit van de lumpsum moeten worden bekostigd?

Het is overigens opvallend dat de huidige domeinen A, B,C en D nu allemaal worden samengevat in domein A. Er is ruimte gemaakt voor nieuwe eindtermen en doelen en er is dus minder ruimte voor taalvaardigheid.

Eindtermen

Eindterm 1 (p.11)

Geen opmerkingen. Dit is een prima eindterm. Niet te specifiek, genoeg invulling voor accenten van de docent.

Eindterm 2 (p. 11)

Wat mij betreft hoeven creatieve uitingen niet in een eindterm, maar ik zie als docent voldoende mogelijkheden om hier iets moois en waardevols van te maken. Het geeft een bredere benadering van taalgebruik.

De vraag is wel, hoe becijfer je creativiteit? Komen hier (suggestie) criteria voor vanuit SLO?

Eindterm 3 (p. 12)

Geen opmerkingen. Dit is het huidige domein B.

Eindterm 4 (p. 13)

Geen opmerkingen. Dit is het huidige domein A

Eindterm 5 (p. 14)

Is relatief nieuw, maar lijkt mij relevant.

Eindterm 6 (p. 14)

Geen opmerkingen. Dit is het huidige subdomein C2.

Eindterm 7 (p. 15)
Geen opmerkingen. Dit is het huidige subdomein C1.

Eindterm 8 (p. 16)

Geen opmerkingen. Dit is min of meer het huidige subdomein D1. Het socioculturele element zou er wat mij betreft uit mogen. Niet dat het niet belangrijk is, maar moet dit in een eindterm?

Eindterm 9 (p. 17)

Dit is Vergelijkende Taalwetenschappen. Waarom zou een VWO leerling deze expertise moeten ontwikkelen? Het is zeker interessant, maar is het belangrijk genoeg om verplicht kostbare lestijd aan te besteden? Een dergelijke vergelijking vraagt ook om een goede beheersing van de L2 talen (Engels, Frans, Latijn). Zonder degelijke domeinkennis is het lastiger talen te analyseren. Het blijft dan oppervlakkig en geeft weinig toevoeging.

Het vergelijken van talen op deze manier lijkt mij zeker interessant om te behandelen in de les en voor een deel doe ik dit al. Maar ik wil de ruimte behouden om extra taalverwerving te geven als de taalvaardigheid van leerlingen achterloopt. Anders krijg je weer meer schaduwonderwijs.

Eindterm 10 (p. 17)

Dit klinkt als een interessant project binnen het domein literatuur, maar als eigen eindterm lijkt mij overtrokken. Ook hier ben ik nu verplicht een plek in mijn lestijd te reserveren.

Eindterm 11 (p. 18)

Deze doelen krijgen meer betekenis binnen Domein A. De doelen zelf zijn nuttig voor het vwo, maar vallen mijns inziens onder taalvaardigheid, niet Taalbewustzijn.

Eindterm 12 (p. 19)

Dit is onderdeel van mijn beroep: hoe maak je Engels eigen? Om hier weer opdrachten aan te koppelen (presentaties, portfolio, taalleerplan) is onnodige werkdrukverhoging bij de leerling en de docent. Ook de notie dat je als leerling het gewoon AI kunt vragen heeft een aantal problemen die ik bij eindterm 14 zal bespreken.

Eindterm 13 (p. 20)

Dit voegt weinig toe aan taalvaardigheid van Engels. Het valt mij ook op dat hier constant gesproken wordt over meertaligheid. We hebben het hier over het curriculum Engels maar in dit domein gaat het meer over taalbewustzijn in zijn algemene vorm. Ook hier lijkt men te vergeten dat Engels hier een moderne vreemde taal is waar leerlingen tijd en ruimte voor nodig hebben om eigen te maken.

Eindterm 14 (p. 20)

Deze eindterm heeft één van mijn grootste bezwaren. Zoals gezegd ben ik met een verdiepend artikel bezig over Generatieve AI in het onderwijs. Ik zal probereren het beknopt te houden.

Om te beginnen is het opvallend dat er gesproken wordt over ‘experimenteren’. We hebben het hier over eindtermen die beoordeeld moeten worden. Hoe beoordeel ik ‘experimenteren’?

Ten tweede is het opvallend dat er gehint wordt naar Generatieve AI, maar niet benoemd. Veel AI geven alleen toestemming voor gebruik vanaf 18 jaar. Bij ChatGPT is dit 13 jaar met toestemming van ouders. Wat als een ouder geen toestemming geeft? Er zijn mogelijkheden voor open source (bijvoorbeeld via misschien Kennisnet?), maar dat heeft tijd nodig.

Ten derde zijn scholen verplicht een AVG-overeenkomst te sluiten met externe bedrijven (de Europese GDPR) omdat leerlingen gebruik maken van hun diensten. Moeten scholen nu een AVG-overeenkomst proberen te sluiten met bedrijven als OpenAI, Anthropic en Meta? Dit is sowieso een interessant vraagstuk omdat niemand, ook de ontwikkelaars niet, weet wat er binnen Generatieve AI gebeurt. Er kan niet bekeken worden wat de AI met de data doet. Dit moet echt eerst onderzocht worden alvorens dit in een curriculum te verankeren.

Generatieve AI wordt nu gedomineerd door Big Tech. Miljardenbedrijven die al decennia proberen het onderwijs te domineren omdat dit een lucratieve markt is. Door kennisoverdracht en didactiek over te hevelen naar deze bedrijven, in hoeverre blijft er dan nog handelingsvermogen over bij de docent?

Daarnaast is het belangrijk te beseffen dat Generatieve AI niet gaat om waarheid. Feit en fictie hebben dezelfde waarde binnen Generatieve AI. Ook is de vraag, willen we onze leerlingen domeinkennis bijbrengen of Generatieve AI leren lezen, een geavanceerde numerieke voorspellingsmachine?

Generatieve AI staat nog in de kinderschoenen, dit vastleggen in een curriculum voor de komende jaren kan schadelijk zijn. De laatste maanden komen er steeds meer scheurtjes in de hoge verwachtingen van Generatieve AI en het is onverstandig deze technologie in een programma te verankeren. Het lijkt alsof de opstellers zelf verwonderd zijn over deze technologie, maar niet voldoende kennis hebben om AI kritisch te beoordelen. Alsof dit erin moest omdat we nu in de hype zitten.

Ik ben zeker geen tegenstander van AI in het onderwijs, ik gebruik het dagelijks voor verrijking van mijn onderwijs, maar we weten er op dit moment nog te weinig over hoe het aansluit op de cognitieve wetenschap en onderzoeken over effectief leren. Generatieve AI in je curriculum zetten brengt een onnodig risico.  Generatieve AI kan kennis en vaardigheden bij leerlingen ontnemen. Ik heb het gevoel dat de risico’s zwaar onderschat worden. Het zijn niet de leerlingen die in eerste instantie Generatieve AI kritisch moet benaderen, maar de overheid, de onderwijsinstellingen, en de docenten.

Eindterm 15 (p. 21)

Dit is het oude domein F: Oriëntatie op studie en beroep, maar dan meer uitgewerkt. Lijkt mij verder prima.

Eindterm 16 (p. 22)

Het valt op dat het lezen van literatuur uitgebreid is met allerlei eisen. Het lijkt mij voor de leesbevordering van jongeren niet verstandig allerlei verplichtingen op te leggen. Kwaliteitskaders moeten er zeker zijn, maar leg niet te veel op aan leerlingen en docenten.  Geef hen de ruimte om zelf projecten op te zetten en leeservaringen op te bouwen.

Verder is de inhoud van eindterm 16 prima.

Eindterm 17 (p. 23)

Ik vraag mij af hoeveel presentaties men wil dat leerlingen doen. Het wordt zo vaak als suggestie gegeven. Maar presentaties afnemen kost veel leertijd en dienen tactisch ingezet te worden.

De kijk op de wereld van de auteur lijkt mij minder belangrijk voor een moderne vreemde taal. Interessant als je het als docent kunt bespreken, maar leg de verplichting niet op. Geef docenten ruimte en vertrouwen.

Eindterm 18 (p. 23)

Zie eindterm 16. Voeg eindtermen 16, 17, en 18 samen met kwaliteitsborging maar ook ruimte.

Eindterm 19 (p.24)

Dit gaat over burgerschap. Op zich is de insteek niet verkeerd. Het kan worden gecombineerd met andere eindtermen. Maar wederom moet de leerling weer produceren, presteren, bewijzen. En dat moet dan ook weer nagekeken en besproken worden.

Eindterm 20 (p. 25)

Deze eindterm kan veel beter worden opgenomen in Subdomein A3 en eindterm 19.

Aanbevelingen

Dit programma is simpelweg te veel voor mij als docent om degelijk les te kunnen geven. Bepaalde elementen zouden niet misstaan op universitaire studies van Vergelijkende Taalwetenschappen, Sociologie, en Antropologie. En hoewel ik dit mooie, waardevolle studies vind, zal dit ten koste gaan van mijn primaire taak: jongeren Engels bijbrengen. Het moet veel compacter zodat er ruimte ontstaat om contact met de leerling te kunnen maken, persoonlijke accenten te kunnen leggen, en alle leerlingen op alle niveaus mee te krijgen.

Daarnaast is het aantal werkstukken, presentaties en portfolio’s opvallend. Dit geeft leerlingen en docenten onnodig veel studielast en werkdruk. Ook met de komst van Generatieve AI zijn deze producten in waarde gedaald en moeten er andere meetinstrumenten worden gevonden om de kwaliteit van het onderwijs te waarborgen.

Ik ben geen onbekende met Generatieve AI en altijd zeer geïnteresseerd geweest in nieuwe ontwikkelingen in de ICT, maar Generatieve AI brengt op dit moment nog te veel risico’s met zich mee om op te nemen in een nationaal curriculum. Het voelt als meeliften op de hype, maar nog niet zo goed weten wat de meerwaarde is (en wat de regelgeving zegt over het gebruik van Generatieve AI).

Beperk literatuur ook tot één eindterm en geef docenten en scholen de ruimte hier invulling aan te geven.

Dit programma raakt jongeren uit een kansarme omgeving. Zij hebben minder voorkennis over de wereld en zullen meer moeite hebben met domeinen B en C mee te draaien waardoor zijn minder aan taalvaardigheid kunnen werken.

Al sinds het begin van Onderwijs 2032 en daarna met curriculum.nu is er een trend bij beleidsmakers om meer projectmatig te werken, kennis op een zijspoor te zetten, en te richten op individuele ontwikkeling, de zogenaamde 21st century skills. Die lees ik tussen de regels door wederom in dit voorstel. Mijn hoop als docent in deze groep mensen wiens ideeën altijd weer ergens de kop opsteken is allang verdwenen. De enige invloed die ik nog heb is mijn (praktijk)kennis delen met de politiek in de hoop dat degenen die het laatste oordeel vellen dit, wederom, een halt toeroepen.

Ik hoop dat u de tijd hebt kunnen vinden om deze brief te lezen en het Engels onderwijs verdedigen tegenover dit gevaarte. Het zou een mooi verjaardagscadeau zijn.

Met vriendelijk groet en grote hoop,

Wouter de Jong

VWO Examens Engels

Reclamevrije examens met Word versie van de bijlage en opgaven. Alles zit samengepakt in een .zip bestand. Nieuwe examens worden van tijd tot tijd toegevoegd.

Let op, ondanks dat de Word bestanden in Word zijn gemaakt, wil de opmaak nog wel anders worden weergeven in andere Word programma’s.

2024

Engels VWO 2024 Tijdvak 1 (.zip)
Engels VWO 2024 Tijdvak 2 (.zip)

2023

Engels VWO 2023 Tijdvak 1 (.zip)
Engels VWO 2023 Tijdvak 2 (.zip)

2022

Engels VWO 2022 Tijdvak 1 (.zip)
Engels VWO 2022 Tijdvak 2 (.zip)

2021

Engels VWO 2021 Tijdvak 1 (.zip)
Engels VWO 2021 Tijdvak 2 (.zip)
Engels VWO 2021 Tijdvak 3 (.zip)

2020

geen examens in verband met COVID-19

2019

Engels VWO 2019 Tijdvak 1 (.zip)
Engels VWO 2019 Tijdvak 2 (.zip)

2018

Engels VWO 2018 Tijdvak 1 (.zip)
Engels VWO 2018 Tijdvak 2 (.zip)

vrijheid is geen vrijblijvendheid

Hotel Roermond

Wanneer ik Hotel Roermond binnenloop zie ik Sjef Drummen al aan een klein tafeltje zitten. Ik had mij voorgenomen om deze ‘kleine koffie’ niet te belasten met discussievragen. Ik moest nog een geleend boek teruggeven (Catharsia) en zag kans verzendkosten te besparen. Ik was niet gekomen om een duel aan te gaan. Daarnaast helpt het veel als je iemand met wie je wel eens de digitale degens kruist, ziet en spreekt. Ondanks dat wij het op een aantal fundamentele punten oneens zijn, kan je altijd van elkaar leren en als dat niet kan, proberen elkaar te begrijpen. Als je gelooft in de goedheid van de mens, dan wil iedereen uiteindelijk het beste voor de jongere generatie.

Ik had het boek nog niet uit mijn tas gehaald of Sjef legde een ander boek op tafel: Je mag geen eisen aan leerlingen stellen. Hij had mij al een exemplaar beloofd, maar ik had niet verwacht dat ik het zo snel zou krijgen, zeker niet omdat ik niet op de boekpresentatie aanwezig kon zijn. We hadden elkaar al eerder gesproken op LinkedIn en wat ik waardeer is dat hij altijd de tijd nam om mijn vragen te beantwoorden en ook om deze ‘kleine koffie’ te hebben.

In ons korte gesprek hebben we het toch over onderwijs gehad en ja, we kwamen in een lichte discussie over verschillende onderwijsaspecten. Echter, dan pas merk je hoe beperkt digitale communicatie is. Ik zag een trotse vader, een oud-docent met sterke onderwijsideeën, en een groot onderwijshart. We vonden elkaar ook op bepaalde punten. Het hielp dat ik Catharsia had gelezen, wat ook min of meer een biografie van Sjef is. Na een vogelvlucht over Nikè (Wings) en Athena (Stedelijk Gymnasium) gaven wij elkaar de hand en haastten ons allebei weer naar onze drukke levens. Het boek ging snel, maar kortstondig in mijn tas. Dat boek is nu uit.

 

een Agoriaans handboek

Je mag geen eisen aan leerlingen stellen: Maak een kunstwerk van je leven is eigenlijk twee boeken in één gebonden. Aan de ene kant heb je Je mag geen eisen aan leerlingen stellen: Maak een kunstwerk van je leven geschreven door Sjef Drummen. Als je het boek omdraait krijg je het andere boek: Maak een kunstwerk van je leven: Je mag geen eisen aan leerlingen stellen door Jan Fasen. Mijn reflectie is op het deel van Drummen. Het deel van Fasen zal in de nabije toekomst gelezen worden.

Het is een “handboek geworden voor Agoriaans denken, handelen, ervaren en voelen. Het geeft handvatten aan het zo noodzakelijke en moeilijke proces van onderwijsvernieuwing” (p. 3). In het boek zijn er naast Drummen en Fasen ook “dertien bijdragen van wetenschappers die je aan het denken zetten over onderwijs” (p. 3).

Daar waar Catharsia voor een deel een autobiografie is en ingaat op de totstandkoming van Agora, probeert het tweede boek zich meer te richten op de filosofie en gedachte van het Agora-onderwijs. Veel elementen uit Catharsia komen weer aan bod, zoals de vijf dimensies van duurzaamheid: sociaal, ecologisch, economisch, spiritueel en cultureel. “Dat betekent dat niet het ‘ik’ centraal staat, maar het ‘wij’” (p. 23).

Agora wil betekenisvol onderwijs bieden dat geïnitieerd wordt vanuit de leerling zelf (al kon ik nergens het woord ‘constructivisme’ vinden): “Leren vanuit intrinsieke motivatie is de meest zinvolle manier van leren” (p. 99). Het is aan de coaches om het leerproces van de leerling bij te sturen zonder haar autonomie te beklemmen; ‘verleiden’ noemde Sjef dat in Hotel Roermond.

 

Agora wil betekenisvol onderwijs bieden dat geïnitieerd wordt vanuit de leerling zelf.

 

intrinsieke motivatie

Als het om intrinsieke motivatie gaat, heeft Agora een heel sterk verhaal. Als je mijn Gameful Design diagram erbij pakt, een schema dat aangeeft welke elementen in spellen en daarmee ook onderwijs intrinsieke motivatie kunnen aanwakkeren, betrekt Agora er veel van:

https://drakenvlieg.nl/wp-content/uploads/2023/02/gameful-design.jpg

Sjef Drummen stelt dat de ‘autonomie’ van de leerling onaantastbaar is. Vanuit dit idee krijgt de leerling eigenaarschap over haar leerproces. Hierbij is de ‘subjectivatie (persoonsvorming) van Biesta zeer belangrijk. Coaches zijn niet (alleen) een vakdocent. Zij helpen de jongeren ook in het vormen van hun identiteit. De leerling kan alleen ontdekken in autonomie als zij veilig kan falen. Er zijn geen summatieve toetsen (behalve in het eindexamentraject) en de leerling wordt niet afgerekend op een slecht resultaat. Omdat de leerling vanuit autonomie werkt, zit zij, met begeleiding van een coach, op haar competentieniveau: “de leerling moet leren eisen aan zichzelf te stellen” (p. 103). En omdat de leerling uit autonomie heeft gekozen is het ook relevant (betekenisvol).

De voortgang wordt ook gemeten in een eigen volgsysteem (Quissum) waarin leerlingen foto’s en tekst plaatsen over wat ze allemaal doen. Hierbij wordt gebruik gemaakt van de 20 perspectieven (brillen) die professor Fred Jansen heeft bedacht. Deze brillen komen redelijk overeen met de verschillende schoolvakken en dat is handig voor het bepalen van het profiel voor de leerling in het eindexamentraject: computerbril, levensbril, plaatsbril, millieubril, gezondbril, ontwerpbril, tijdreisbril, ramen- en verschilbril, beweegbril, kunstbril, stoffenbril, geldbril, zingevingsbril, ik- en jijbril, helikopterbril, taalbril, regelbril, rekenbril, meetbril, goed- en kwaadbril.

Daarnaast zet Agora heel erg in op gemeenschapsgevoel. Je leert op een Agora relationeel autonoom dat wil zeggen “je leert niet voor jezelf maar voor de ander. Mensen willen wat bereiken voor de ander. En wat bereiken betekent dat anderen jou het predicaat ‘goed’ geven” (p. 22).

Agora kent een vaste weekstructuur met een centrale opening met je ‘leerfamilie’: een klein groep leerlingen onder begeleiding van een vaste coach. Daarna wordt er aan challenges gewerkt, projecten met een einddoel dat bedacht is door de leerling. Na de middagpauze is er een half uur stilte moment waarin vaak wordt gelezen (zonder muziek).

Het is dan ook niet zo gek dat als je je richt op intrinsieke motivatie en relatieve autonomie van de leerling, dat je het goed doet bij persoonsontwikkeling en gemeenschapsgevoel. Het reguliere onderwijs kan op deze gebieden veel leren van Agora. Onderwijs gaat niet alleen om kwalificatie, maar ook op socialisatie en subjectivatie en die laatste twee moeten in het reguliere onderwijs nog wel eens ruimte maken voor, bijvoorbeeld, toetsing.

 

welke kennis is belangrijk?

Toch blijft mijn fundamentele zorg over Agora onbeantwoord. Als onderwijssysteem dragen wij de verantwoordelijkheid om de opgedane kennis van vorige generaties over te dragen aan de nieuwe generatie. Wij vormen het geheugen van de menselijke geschiedenis en de huidige generatie kan alleen de toekomst vormen als zij kritisch naar het heden kan kijken. Dat gaat echter alleen als zij begrijpt hoe het heden uit het verleden is ontstaan. Deze belangrijke taak is niet gewaarborgd in het Agorasysteem en kan niet toevertrouwd worden aan BigTech. Een leerling ‘verleiden’ om kennis te nemen van deze belangrijke kennis (wat niet altijd leuk of aantrekkelijk is) is voor mij te summier.

 

Als onderwijssysteem dragen wij de verantwoordelijkheid om de opgedane kennis van vorige generaties over te dragen aan de nieuwe generatie.

 

Daarnaast zal een jongere die zelf mag bepalen wat hij of zij wil leren, blinde vlekken hebben. Eén van de weinige kritische noten in het boek komt van Monique Volman: “[ik zie] het risico dat dit type onderwijs kansenongelijkheid tussen leerlingen kan vergroten. Hoe kan je leerlingen in vrijheid laten kiezen en tegelijkertijd zorgen dat de kwaliteit van de leerervaringen die ze opzoeken en opdoen niet bepaald wordt door de bagage die ze van huis uit of vanuit het basisonderwijs hebben meegekregen.” (p. 57). Hier geeft Je mag geen eisen aan leerlingen stellen geen duidelijk antwoord op.

Vrijheid in autonomie is geen vrijblijvendheid. Drummen richt zich hierbij vooral op het sociale domein: “In een leergemeenschap is niets vrijblijvend” (p. 30). Echter, dit geldt ook voor kennisoverdracht. Immers, als je ervoor kiest om geen kennis op te doen die de gemeenschap belangrijk acht om te functioneren in de maatschappij, zet je jezelf buiten de groep. Dit gaat dan ook tegen de relationele autonomie in. Je hebt een verantwoordelijkheid naar de groep, de maatschappij. Alleen willen leren wat jij belangrijk vindt, is geen oog hebben voor de gemeenschap en haar toekomst.

Drummen spreekt over het ‘fragmentarisch’ karakter van het reguliere onderwijs. Hier heeft hij zeker een punt; meer integratie lijkt mij evident. Echter, de challenges die het Agora biedt, geven ook een fragmentarisch beeld van de wereld. De kennis die je opdoet is weliswaar betekenisvol voor je project, maar je mist een fundamentele opbouw van de vakgebieden die je gebruikt. Ik denk dat hier een betere balans in moet worden gevonden, want kennis op zichzelf is niet relevant. Het wordt betekenisvol als je het kunt koppelen aan iets wat je al kent (context) of aan iets wat je interesseert. Maar die kennis wordt binnen zijn eigen vakgebied pas relevant als je het vakgebied beter beheerst. Drummen stelt dat “Agora [uitgaat] van het geheel (wereld, universum) en via nieuwsgierigheid van de leerling naar een specialisatie [voert]” (p. 119), maar dat geheel blijft onbegrijpelijk als je geen fundament hebt opgebouwd.

Ook merk ik op dat het lijkt alsof alle ‘kennis’ voor Drummen evenveel waard is. Drummen benadrukt dat motivatie zorgt voor kennis. Wanneer een leerling intrinsiek gemotiveerd is, komt de kennis vanzelf (daarom dat je geen eisen mag stellen). Maar welke kennis komt er dan en welke kennis wordt er gemist? Het eindexamen met haar eindtermen zorgt er nog voor dat leerlingen in de laatste jaren worden klaargestoomd voor het vervolgonderwijs, maar hier wil Drummen vanaf. Wat je dan, naar mijn mening, krijgt, is een slager die zijn eigen vlees gaat keuren en dat vervolgopleidingen door middel van toelatingstoetsen moeten meten of iemand de opleiding wel aan kan.

Ook is er nog geen bewijs dat er causaal verband zit tussen motivatie en leren: “motivatie leidt niet per definitie tot beter leren en presteren” (Op de Schouders van Reuzen, 2018). Hier gaat Drummen dus te kort door de bocht: ‘Als je maar gemotiveerde leerlingen hebt, komt alles goed.’ Ook het hoofdstuk met de hoopvolle titel ‘Leert de leerling wel genoeg?’ spreekt alleen over de overmatige meetcultuur in het reguliere onderwijs, dat leren synoniem is aan ontwikkeling, en dat leerlingen een inspanning moeten verrichten om tot resultaten te komen. Of de leerling wel genoeg leert wordt niet besproken (en die vraag is voor Agora ook absurd, want je bent nooit uitgeleerd en niemand mag je opleggen om iets te leren). Of de leerling genoeg leert voor zijn vervolgopleiding of voldoende basisvaardigheden heeft, blijft dus onbeantwoord.

De bijdragen van de wetenschappers vielen mij wat tegen. In het gedeelte van Drummen zijn er bijdragen van Rob Martens, Robbert Dijkgraaf, Yuli Tamir (oud-Minister van Onderwijs van Israël), Monique Volman, Jelle Jolles, Jan Bransen, Henk Oosterling, en Joseph Kessels. Echter, het gros van de bijdragen gaan niet over Agora maar over de principes die Agora inspireren. Dit was een kleine teleurstelling. Ik had gehoopt op wetenschappers die kritisch naar Agora-concept in de praktijk zouden kijken. Volman komt daar nog het meest in de buurt. Wetenschap is namelijk ook kritische vragen stellen. Daarnaast zijn Martens en Bransen niet onbekend in het Agora cirkeltje. Ook zijn er bijdragen die eerder als ‘flavour’ aanvoelen dan een waardevolle bijdrage leveren, zoals het interview met Yuli Tamir en een citaat van Robbert Dijkgraaf. Ik hoop nog steeds op een onderzoek dat oud-Agoraleerlingen volgt in het vervolgonderwijs en deze vergelijkt met oud-leerlingen uit het reguliere onderwijs. In hoeverre kunnen deze studenten meedraaien in dat vervolgonderwijs? Zijn deze leerlingen meer autonoom en mentaal sterker dan reguliere studenten?

reflectie

En dat is ook het gemis in de rest van het boek: reflectie, adaptie, voortschrijdend inzicht, groei, ideeën voor de toekomst. Het is voornamelijk een herhaald relaas over hoe belangrijk de autonome leerling is en dat motivatie leidt tot kennis. Durft Agora kritisch naar zichzelf te kijken en een paar fundamentele elementen kritisch te benaderen? Volgens Drummen is die ruimte er wel: “Agora [kent] geen dogma, alleen een sterke visie […] Onze ‘why’ biedt geen kant-en-klare oplossingen” (p. 93), maar na tien jaar mag je meer reflectie verwachten. Alleen door kritisch naar jezelf te kijken, behoed je jezelf voor dogma’s.

 

Alleen door kritisch naar jezelf te kijken, behoed je jezelf voor dogma’s.

 

Agora is voor sommige leerlingen een redding. Jongeren die verdrinken in de scholengemeenschap, die te eigenzinnig en te nieuwsgierig zijn om in lesuren te vangen, die baat hebben bij een hechte gemeenschap. Ik kan op ons Stedelijk Gymnasium zo de leerlingen aanwijzen die in een Agora systeem meer kunnen groeien dan in het reguliere onderwijs. Aan de andere kant zie ik ook leerlingen die zullen onderpresteren, die zichzelf tekortdoen, die baat hebben bij goede scaffolding voordat ze zelfstandig kunnen uitvliegen.

kleine koffie

Het reguliere onderwijs kan veel leren van het Agora op het gebied van gemeenschap, identiteitsontwikkeling, autonomie, structuur en stilte momenten. Het Agora moet, naar mijn mening, kritischer kijken naar haar maatschappelijke taak in het waarborgen van de gemeenschappelijke kennis. Mijn ideale school ligt daar waar kennis en eigenaarschap elkaar in balans houden en elkaar versterken. En ja, daar zit ook een stukje plicht in. Onderwijs is ook kennismaken met het onbekende, met het ongewilde, met het vervelende. Het leven is mooi, maar kent ook haar duistere kanten en haar verantwoordelijkheden naar de groep.

Daarom dat we als onderwijsveld met elkaar in gesprek moeten blijven. Geen verwijten moeten maken, maar kritische vragen moeten blijven stellen die soms (vooralsnog) onbeantwoord blijven. Daarom dat ik ‘kleine koffies’ waardeer, omdat die laten zien dat we mensen zijn met een hart voor leren, voor ontwikkelen, en voor de nieuwe generatie.

Er is één advies van Sjef die zeker ik ter harte zal nemen. Een advies dat mij misschien (meer) gesprek brengt met anderen: ‘Je moet je avatar aanpassen, want in het echt ben je veel positiever.’ Daar ga ik niet over in discussie.

 

Hoe cijfers de motivatie van leerlingen om zeep helpen – twee reacties

Twee reacties op het artikel van Johannes Visser “Hoe cijfers de motivatie van leerlingen om zeep helpen” door een leerling (Robert Schippers) en een docent (Wouter de Jong).

PDF: Hoe cijfers de motivatie van leerlingen om zeep helpen – twee reacties.pdf

De toekomst van cijfers in het onderwijs

Robert Schippers

Of ze je nu ont- of aanmoedigden, iedereen heeft ervaring met cijfers in het onderwijs. Cijfers zijn een fundamenteel onderdeel van het huidige onderwijssysteem, maar past dit systeem nog wel bij deze tijd? Terwijl onze wereld steeds verandert is het onderwijs sinds 1850 voor een groot deel hetzelfde gebleven. Dit roept vragen op omdat het onderwijs leerlingen klaar moet maken voor de wereld maar worden leerlingen nu niet voorbereid op de wereld in 1850? Dat leidt dan ook onvermijdelijk tot de vraag: moeten cijfers blijven bestaan en zo ja, in welke vorm moeten ze dan aanwezig zijn? Het antwoord op die vraag is complex, er wordt dan ook al jarenlang over gesproken, zonder dat er een consensus ontstaat. Ik stel daarom voor om cijfers aan te passen zodat ze het onderwijs bevorderen in plaats van belemmeren.

Het eerste argument tegen cijfers in hun huidige vorm is de stress die het bij leerlingen oplevert. Veel leerlingen beamen dat het hebben van een beperkt aantal metingen per jaar de druk onnodig verhoogt. Doordat er een beperkt aantal meetmomenten zijn gaan leerlingen vaak pas rond de meetmomenten leren, daardoor wordt de stof niet echt begrepen, maar eerder tijdelijk bekend. Dit heeft ook als gevolg dat leerlingen motivatie verliezen om te leren omdat ze de stof niet kunnen toepassen, maar tijdelijk uit hun hoofd weten. Daarmee komen leerlingen in een vicieuze cirkel met als eindresultaat leerlingen die gedemotiveerd zijn en de stof niet in de praktijk kunnen toepassen. Hierdoor leveren cijfers meer stress op dan nodig.

Vervolgens wordt door het beperkte aantal meetmomenten het ook erg belangrijk om goed te presteren om zo door te kunnen naar je volgende jaar of om voor je examen te slagen. Hierdoor wordt de prestatiedruk voor leerlingen verhoogd en ervaren leerlingen dus weer meer stress van toetsen. Dit alles wordt niet alleen bevestigd door leerlingen maar ook door scholen die rond de toetsweek vaak extra nadruk leggen op het vermijden van stress. Je zou dan kunnen zeggen dat een zekere hoeveelheid druk goed is voor leerlingen maar de huidige hoeveelheid druk leidt, voornamelijk bij leerlingen met faalangst of een buitengewone prestatiedruk, tot blackouts tijdens toetsen en zenuwinzinkingen thuis.

Niet alleen ervaren leerlingen meer stress, ook neemt hun intrinsieke motivatie af doordat ze een extrinsieke motivatiebron hebben. Je hoort leerlingen als gevolg vaak klagen over op school zitten, omdat ze het gevoel hebben dat ze er niet voor zichzelf zitten. Dit laat zien dat de motivatie om te leren extreem laag is geworden en voor sommigen geldt daarbij dat ze alleen nog maar door de extrinsieke factoren, zoals de straffen die zouden volgen bij absentie en het niet slagen voor het eindexamen, blijven komen. Juist door het gebrek aan motivatie als gevolg van bovenmaatse extrinsieke motivatie wordt de effectiviteit van het onderwijs onnodig laag.

Juist door het gebrek aan motivatie als gevolg van bovenmaatse extrinsieke motivatie wordt de effectiviteit van het onderwijs onnodig laag.

Een argument dat pleit vóór cijfers in hun huidige vorm is de objectieve meetbaarheid van de vooruitgang van leerlingen. Dit is een goede reden om cijfers te behouden, het is echter niet nodig om daarvoor zo’n grote druk op leerlingen te leggen. Het is bijvoorbeeld ook mogelijk om iedere les toetsjes af te nemen, hierdoor wordt getest of leerlingen de stof kunnen toepassen. Op het einde is er dan nog een afsluitende toets, die vergelijkbaar is met de huidige proefwerken. Met dit systeem is het ook niet erg als leerlingen een slechte dag of week hebben omdat de invloed op het eindresultaat minimaal wordt beïnvloed door één cijfer. Hierdoor is het risico op faalangst en abnormale prestatiedruk ook minder omdat de “toetsjes” een minder grote impact hebben. Daarmee is het behouden van cijfers in hun huidige vorm dus niet noodzakelijk.

Cijfers moeten dus zo snel mogelijk veranderen, omdat ze veel stress opleveren en leerlingen hun motivatie laten verliezen, terwijl cijfers in hun huidige vorm niet veel bijdragen aan het onderwijs. Een lange termijn meting is veel nuttiger om te kijken naar de vooruitgang van leerlingen, daarnaast is deze methode ook minder vatbaar voor faalangst. Dat komt door het cijfer dat de leerlingen al hebben staan. Het is dus tijd voor verandering en daarom wil ik iedereen oproepen hierbij te helpen dus help mij mee met deze wijziging want alleen op die manier kunnen we het onderwijs terugbrengen tot waar het in de kern over gaat.

 

cijfers: van trucje naar instrument

Wouter de Jong

Een paar weken geleden stuurde één van mijn 6VWO leerlingen, Robert Schippers, een link naar Johannes Vissers artikel “Hoe cijfers de motivatie van leerlingen om zeep helpen” met de vraag of het mogelijk is een schoolsysteem te creëren waarin cijfers niet bepalen of je slaagt. Ik besloot niet gelijk met een antwoord te komen, maar stelde voor dat we allebei een reactie zouden schrijven: één vanuit een leerlingperspectief en één vanuit een docentperspectief. Wij zouden elkaar niet informeren over onze reacties. Hier volgt mijn reactie.

Wat opvalt in het artikel van Johannes Visser is dat hij vooral de nadruk legt op cijfers als beloning zonder een breder perspectief te bieden over welke waarde cijfers hebben in het leerproces. Wanneer leerlingen alleen werken als ze er een cijfer voor krijgen, hebben ze een verkeerd beeld over onderwijs, over hun leerproces, en over de rol van cijfers. Door cijfers te koppelen aan beloningen wekt ook Visser de indruk dat cijfers puur beloningen zijn en daarmee demotiverend werken. En het is niet alleen Visser. Ook docenten en ouders wekken vaak de indruk dat cijfers een beloning zijn. Wie goed is krijgt lekkers, wie slecht is de roe. Daarmee creëren wij een wereld van winnaars en verliezers en zullen leerlingen zich daar ook naar gedragen.

Toegegeven, Visser bespreekt kort dat onderzoek ook heeft uitgewezen dat cijfers goed zijn voor het gevoel van competentie. Hoe leerlingen cijfers ervaren ligt aan de docent: “Ervaren ze het cijfer als een manier waarop een leraar feedback geeft die hun laat zien waar ze goed in zijn of waar ze beter in kunnen worden, dan is dat goed voor hun intrinsieke motivatie. Ervaren ze het daarentegen als een middel waarmee een leraar druk uitoefent om iets gedaan te krijgen, dan is dat juist funest voor hun intrinsieke motivatie.” Daarna vervolgt hij echter met onderzoeken die aangeven dat zowel autonomie, verbinding, én competentie negatief worden beïnvloed door cijfers. Hier gaat hij te kort door de bocht en mist het bredere perspectief dat hij eerder leek in te zetten. Cijfers creëren volgens Visser een dictatuur.

beloningen

Beloningen werken slecht voor de intrinsieke motivatie. In mijn artikel “De Leugen van Gamification” betoogde ik al dat punten, badges, en leaderboards vaak intrinsieke motivatie negatief beïnvloeden. Ook Karl Kapp, gamification expert, geeft aan: “vooral in een leersituatie zal er waarschijnlijk weinig of geen overdracht plaatsvinden als de leerling uiteindelijk alleen gemotiveerd is door de beloningen.” (The Gamification of Learning and Instruction, p. 93). Alfie Kohn voegt daar aan toe: “‘Doe dit en je krijgt dat’ zorgt ervoor dat mensen zich richten op het ‘dat’, niet op ‘dit’” (Punished by Rewards, p. 67). Cijfers als beloning maakt dat leerlingen zich richten op het cijfer en minder op de inhoud. In het ergste geval koppelen leerlingen hun identiteit aan hun cijfers: wie ze zijn en hoeveel ze waard zijn.

Alle onderzoeken die Visser aanhaalt, Ryan en Deci, Krijgsman, Pulfrey, Butera en Darnon, kijken naar het effect van cijfers als beloning. In ieder onderzoek worden cijfers aan het einde van een taak gegeven zonder dat er sprake is van een leerproces. Je kunt als testpersoon niets met deze cijfers behalve aanschouwen. Ze vertellen alleen of je iets goed hebt gedaan of niet. Wat deze onderzoeken aantonen is dat cijfers als beloning niet werken. De onderzoeken zeggen weinig tot niets over cijfers als instrument. Dit is een belangrijk verschil omdat het verkeerd interpreteren van de resultaten van deze onderzoeken kan resulteren in de schadelijke aanname dat cijfers uit het onderwijs moeten (don’t shoot the messenger).

Cijfers hebben echter weldegelijk een beloningselement in zich en het is onvermijdelijk dat cijfers ook een extrinsieke invloed hebben op een leerling. Het is zelfs noodzakelijk. Leren doet immers pijn en je hebt nog wel eens een zetje nodig om in een ‘flow state’ te komen of geïnteresseerd te raken in onderwerpen die op het eerste gezicht eigenaardig of te moeilijk lijken. Daarnaast zijn extrinsieke en intrinsieke motivatie onlosmakelijk met elkaar verbonden en is niet altijd duidelijk of iemand actie onderneemt vanuit zichzelf of vanwege een externe factor. Het is de wisselwerking tussen beide motivaties die een leerling tot leren zet. Het is dan ook aan de docent om in de lessen beide motivaties te gebruiken om de leerling verder te helpen.

beoordelen

In de eerste plaats zijn cijfers het resultaat van een beoordeling. De vraag is dan niet, willen we cijfers geven, maar willen we beoordelen? Willen we meten? Iedere beoordeling kent namelijk cijfers. Dat kan op een schaal van 1,0 tot 10,0, of van F tot A, of van rood tot blauw, of een rubric, of slechts een voldoende of onvoldoende zijn (mijn voorkeur voor het gehele onderwijs heeft overigens een viercijferig systeem met onvoldoende, zwak, voldoende, goed).

Beoordelingen spelen belangrijke rol in de autonomie, competentie en verbinding in het leerproces: het meten of een leerling voldoende kennis heeft om naar een volgende fase te gaan. Je moet immers eerst weten, een kennisbasis hebben, voordat je kritisch naar iets kunt kijken, of er creatief mee kunt omgaan. Maar hoe weet je of je genoeg (basis)kennis hebt? Omdat je als lerende niet boven de stof staat, kan je niet beoordelen of je voldoende kennis en kunde hebt om verder te groeien. Hiervoor heb je iemand nodig die wel boven de stof staat en kan beoordelen waar je staat in je leerproces zodat je betekenisvolle keuzes kunt maken.

Als wij leerlingen willen beoordelen op hun kennen en kunnen, op hun bekwaamheid om door te groeien, dan hebben we een meetinstrument nodig. Cijfers vormen daarbij een simplistische weergave die ons en de leerling in staat stellen keuzes te maken. Zonder deze gegevens word je belemmerd in het maken van de juiste keuzes. Wanneer leerlingen na het maken van een oefentoets aan mij vragen wat voor cijfer ze zouden hebben gehaald, vragen ze eigenlijk: “Waar sta ik in mijn leerproces ten opzichte van mijn einddoel?” Het ontnemen van cijfers is het ontnemen van informatie voor de leerling om betekenisvolle keuzes te maken en daarmee, paradoxaal, een stukje autonomie weg te nemen.

In Flourish: A Visionary New Understanding of Happiness and Well-Being haalt Martin E.P. Seligman een casus aan hoe bepaalde interventies en de cijfers die gekoppeld zijn aan die interventies depressieve cliënten kunnen helpen: “Na drie maanden hard werken, deed [de cliënt] de test en was blij te zien dat de drie gebieden [waaraan ze had gewerkt] behoorlijk in balans waren met ongeveer 3,5 op een schaal van 5. Ze was heel blij en bemoedigd dat er een meetinstrument beschikbaar was om haar voortgang te meten.” (Flourish, p. 36). Cijfers geven een simplistische weergave van werkelijkheid, maar we hebben wel die weergave nodig om een beeld te krijgen over het (leer)proces waarin we zitten. Deze cliënt heeft geen uitgebreide feedback gekregen, maar heeft wel het gevoel dat ze op de goede weg zit en kan doorwerken op de manier waarop ze heeft gewerkt. Ze werkte niet voor een cijfer, maar het cijfer werkte voor haar. De 3,5 maakte haar gemaakte keuzes betekenisvol en gaf perspectief voor de toekomst.

Dit verklaart ook waarom onderzoek heeft aangetoond dat kleine summatieve toetsen in het Hoger Onderwijs nut hebben zonder te bijten in de bevindingen van Deci en anderen. In een artikel van Dominique Sluijsmans en Valentina Devid (“De plek van summatieve toetsing op de weg naar zelfstandigheid“) wordt aangetoond dat korte summatieve toetsen in de beginfase van het Hoger Onderwijs nut hebben, “[n]iet vanuit het adagium ‘zonder toets doen ze niks,’ maar vanuit de kennis over motivatie en expertiseontwikkeling.” Toetsing (en de cijfers die daarbij komen) worden hier als sturend element gebruikt en vormen een belangrijk onderdeel van het leerproces waarin het doel is de student naar zelfstandigheid te dirigeren en zichzelf te beoordelen. De nadruk ligt dan op het onderwijsproces in plaats van op het cijfer. Cijfers zijn een middel geworden en geen doel (geen ‘beloning’).

Ook Veronica Bruins geeft in haar studie “Het effect van tussentijds toetsen op studierendement: een literatuurstudie” het nut van summatieve toetsen aan: “Regelmatig toetsmomenten inbouwen in het programma gedurende een blok of semester – zowel formatief als summatief – kan bevorderen dat studenten de benodigde tijd aan de studie besteden, die tijd beter spreiden over het blok of semester en minder stof hoeven te bestuderen per toets.” Toetsen en becijferen worden dan niet als beloning gebruikt (al kan je als student een goed cijfer zeker zien als een beloning voor je harde werk; wat je hebt gedaan heeft gewerkt), maar als instrument om de stof begrijpelijker te maken, inzicht te geven in kennisbegrip en studenten te helpen in het maken van betekenisvolle keuzes in het leerproces. Overigens zou het interessant zijn om te kijken hoe deze bevindingen in het Hoger Onderwijs aansluiten op het VO-systeem van een beperkt aantal schoolexamens waarbij juist wordt beoogd meer zelfstandigheid bij leerlingen te creëren door weinig summatief te toetsen.

het gaat niet om kwantiteit, maar om inzicht

Visser schrikt wanneer hij beseft dat zijn leerlingen “148 (!)” toetsen per jaar krijgen. Ik mag mijzelf dan klaarblijkelijk de toets-tsaar van Nederland noemen wanneer ik op ongeveer 140 (!) toetsen per onderbouwjaar per leerling voor enkel mijn eigen vak kom. Toch werd ik op een informatieavond ‘werkdruk onder leerlingen’ bij ons op school door de leerlingenraad expliciet genoemd als een docent die werkdruk van leerlingen begrijpt, serieus neemt, en naar handelt. Ik geef geen S.O.’s, maar meet continu het leerproces met behulp van minitoetsen waardoor de leerling en de docent kunnen zien waar de leerling staan in het leerproces. Dat proces is zo gebouwd dat er een gevoel van veiligheid is ingebouwd, een stukje eigenaarschap geeft, competentie ondersteunt, en inzicht biedt in de voortgang. Daarnaast help ik met mijn systeem leerlingen de leerstof in kleinere stukjes te knippen. Is het systeem perfect? Nee, verre van, maar ik heb wel het gevoel dat het beter bijdraagt aan de beheersing van de stof dan het ouderwetse, risicovolle S.O.-systeem.

We moeten cijfers niet als trucje zien, maar als onderdeel van het leerproces. In een interview van Visser met economiedocent Jeroen Lamberts (“Deze leraar geeft geen cijfers meer“) wordt duidelijk waar vaak de denkfout zit. Op de vraag wat Lamberts deed nadat hij cijfers had afgeschaft, zegt hij: “M’n boek openslaan en kijken: wat wil ik nu eigenlijk dat ze hiervan weten? Toen heb ik 40 procent van de lesstof geschrapt.” Je lesdoelen staan los van het feit of je cijfers geeft of niet. Lamberts had ook 40% kunnen schrappen met cijfers. Het is goed dat hij kritisch is gaan kijken naar zijn lesmethode en daarin professionele keuzes heeft gemaakt, maar met wel of niet cijfers geven heeft niet veel te maken. Het is dan ook een vals dilemma om te stellen dat je moet kiezen tussen cijfers of intrinsieke motivatie.

Het is dan ook een vals dilemma om te stellen dat je moet kiezen tussen cijfers of intrinsieke motivatie.

Waar Lamberts vooral over praat zijn veranderingen in zijn onderwijsproces. Veranderingen die niet afhankelijk waren of je wel of geen cijfers geeft. Ook hij heeft de illusie dat cijfers vooral beloningen zijn en geen (feedback)instrument. Door het weghalen van cijfers, ontneemt Lamberts echter belangrijke informatie voor leerlingen om inzicht te krijgen in waar ze staan in hun leerproces. Hij probeert dat te vervangen door andere vormen van feedback, maar komt tot de conclusie dat dat zeer tijdrovend is. De vraag is ook of een cijfer in sommige gevallen niet veel duidelijker aangeeft waar een leerling staat in zijn of haar leerproces in plaats van een lang verhaal of “je hebt een goed antwoord gegeven” of “je hebt hier een denkfout gemaakt.” Wanneer je je onderwijs goed ontwerpt, weet je wanneer je welk meetinstrument nodig hebt: een cijfer, een rubric, peer feedback, of een gesprek.

Maar hoe zit het dan met een onderwijssysteem zoals Agora waar leerlingen meer zelf de regie hebben over hoe ze willen leren? In een gesprek met Mathijs Drummen (Buurtcollege Maas en Peel) geeft Drummen aan dat Agora soms ook cijfers geeft. Door te meten krijg je inzicht in de voortgang van een leerling en daarmee kan de leerling en de school betekenisvolle keuzes maken en bijsturen. Wel geeft hij aan dat cijfers ‘valide’ moeten zijn, met andere woorden, is het cijfer ontstaan door een paar S.O.-tjes of door middel van een gedegen ontworpen leerproces? Je moet je daarbij richten op de randvoorwaarden in dat proces. Juist omdat het Agora minder traditioneel denkt in leerjaren, niveaus, en overgang kunnen cijfers leerlingen belangrijke informatie geven over hun voortgang. In de onderbouw is dit vooral op vrijwillige basis, terwijl in de bovenbouw leerlingen schoolexamens moeten maken. Het basisprincipe bij Agora is de welwillendheid om te leren en het welbevinden van de leerling te behouden door middel van het geven van eigenaarschap en het veilig mogen falen. Cijfers zijn daarbij geen veroordeling maar een instrument die inzicht geven in het leerproces voor zowel de leerling als de docent. Daarin verschillen Agora en traditionelere typen onderwijs niet, althans, zouden ze niet moeten verschillen.

van cijfers naar proces

De vraag is dus niet of moeten becijferen, maar hoe we becijferen, hoe wij als docenten een onderwijsproces kunnen ontwikkelen waarin leerlingen veilig fouten mogen maken en informatie krijgen over de ontwikkeling in dat leerproces, met een duidelijke lat, een degelijke polsstok, en een betrouwbare training. Ik ben het met Johannes Visser en Jeroen Lamberts eens dat ons onderwijssysteem onnodig veel druk op onze leerlingen legt mede door het verkeerd gebruik van cijfers. Echter, dat is dus niet omdat wij cijfers geven, maar hoe wij cijfers geven, en daarmee hoe wij ons onderwijs ontwerpen, als overheid, als school, en als docenten.

De vraag is dus niet of moeten becijferen, maar hoe we becijferen

Een schoolsysteem waarin cijfers niet bepalen of je slaagt is beoordelen zonder meetlat: je denkt dat het wel goed zit, maar je durft het niet te meten. Cijfers vormen een belangrijk onderdeel in het leerproces van een leerling. Ze geven het nodige simplistische overzicht om betekenisvolle keuzes te maken. Ontneem cijfers en je ontneemt een stukje autonomie en competentie. In een goed ontworpen leerproces is een summatieve eindtoets, met cijfers, een belangrijke formaliteit: de uitslag is min of meer bekend maar wordt nu officieel erkend.

In mei gaat Robert eindexamens doen. Dan zal ik, samen met een collega elders in het land, zijn werk beoordelen. Ik vermoed bij Robert een gezonde spanning voor het Engels examen, maar het moet wel heel vreemd lopen wil hij op Engels zakken. In zijn leerproces hebben wij geen problemen gezien om ons zorgen over te maken. Hij heeft zich op onze school ontwikkeld tot een intelligente, kritische leerling via zowel beoordeelde taken (schoolexamens) als niet beoordeelde taken (secretaris-generaal van LEMUN, politiek en maatschappelijke gesprekken voeren in les en daar buiten, een reactie schrijven op een artikel van iemand van de Correspondent) die weet dat hij goed is voorbereid voor zijn eindexamens en daarmee voor de volgende fase in zijn leerproces.

Veronica Bruins, “Het effect van tussentijds toetsen op studierendement: een literatuurstudie”, <https://docplayer.nl/2334622-Het-effect-van-tussentijds-toetsen-op-studierendement-een-literatuurstudie.html>, 2014
Wouter de Jong, “De Leugen van Gamification”, <https://drakenvlieg.nl/didactiek/gameful-design/gamification/>, 2023
Wouter de Jong, “Puntensysteem”, <https://drakenvlieg.nl/2021/09/03/puntensysteem>, 2021
Karl M. Kapp, The Gamification of Learning and Instruction, 2012
Alfie Kohn, Punished by Rewards, 1993
Christa Krijgsman, “Assessment and Motivation: A Self-Determination Theory Perspective on Performance Grading, Goal Clarification and Process Feedback in Physical Education”,< ‘Assessment and Motivation: A Self-Determination Theory Perspective on Performance Grading, Goal Clarification and Process Feedback in Physical Education’>, 2021
Caroline Pulfrey, Fabrizio Butera en Cèline Darnon, “Autonomy and Task Performance: Explaining the Impact of Grades on Intrinsic Motivation”, <https://www.researchgate.net/publication/260188115_Autonomy_and_Task_Performance_Explaining_the_Impact_of_Grades_on_Intrinsic_Motivation>, 2013
Richard M. Ryan en Edward L. Deci, ‘Self-Determination Theory: Basic Psychological Needs in Motivation, Development, and Wellness’, Guilford Publications, 2018
Martin E.P. Seligman, Flourish: A Visionary New Understanding of Happiness and Well-Being, 2013
Dominique Sluijsmans en Valentina Devid, “De plek van summatieve toetsing op de weg naar zelfstandigheid”, <https://toetsrevolutie.nl/?p=3042>, 2022
Johannes Visser, “Deze leraar geeft geen cijfers meer”, <https://decorrespondent.nl/14196/deze-leraar-geeft-geen-cijfers-meer/1127914788-ecf2c3e0>, 2023
Johannes Visser, “Hoe cijfers de motivatie van leerlingen om zeep helpen”, <https://decorrespondent.nl/14112/hoe-cijfers-de-motivatie-van-leerlingen-om-zeep-helpen/542535840-74b98a57>, 2023

Mastodon EduLijst (#mastedu)

Hier volgt een lijst met onderwijsmensen op Mastodon. Wil je jezelf of iemand anders toevoegen? Stuur een bericht op Mastodon.

Je kunt ook via deze website kijken welke Twitteraars die jij volgt ook op Mastodon zitten: https://www.movetodon.org/

PO




















(speciaal basisonderwijs)









(in wording)



(schoolleider)

(speciaal basisonderwijs)



@Linda_v
(zij-instromer)
(schoolleider)
(Montessori)

 

VO

@drakenvlieg (Engels)
@fransdroog (Biologie)
@MaartenFLT (Nederlands)
@DvdWateren (Natuurkunde/Aardrijkskunde)
@bertthijsdejong
@michelverschuren (Geschiendenis)
@Grietwerk (Duits)
@hjbatelaan (Maatschappijleer en Maatschappijwetenschappen)
@analytical_bc (economie)
@si2mev (Biologie)
@dpdykman (Wiskunde)
(decanaat)
(vestigingsdirecteur)

(Nederlands & consultant)
(natuurkunde)
(Wiskunde)
(Nederlands)
(Nederlands)
(Technologie & Informatica)
( Sport & Bewegen )
(Wiskunde)
(Wiskunde)
(Nederlands en Spaans)
(levensbeschouwing)
(Biologie)
(Praktijkvak Economie en Ondernemen)

(natuurkunde)
(Geschiedenis en Wiskunde)
(Nederlands)
@FransvHaandel (Wiskunde)
@marcotenhoff (Wiskunde)
(Geschiedenis, Aardrijkskunde, en Maatschappijleer)
(economie en bedrijfseconomie)
(docent Frans; leraaropleider)
(Engels)
(Engels)
(natuurkunde)
(Nedelands)
(wiskunde)
(Wiskunde + Nederlands)
(Klassieke Talen)
(Informatica & beheerder mastodon.education)
(Geschiedenis, Nederlands, Aardrijkskunde)
(biologie)
(Engels, Geschiedenis)
(adjunct directeur/teamleider)
(Kunst)
(levensbeschouwing)
(Economie en Ondernemen)
(Aardrijkskunde en Geschiedenis)
(Wiskunde)
(Wiskunde & programmeren)
@robmenting (Klassieke Talen)
@mjavdgrond (Nederlands)
(Natuurkunde, NLT en Informtica)
(biologie)
(& VSO)
(informatica; decaan)

VAVO
(Frans)

GVO (VSO/SO)
@Anoniemedocent

(logopedist; cluster 2)

MBO
@annetsmith (i-coach)


(MBO Raad)

(MBO [met pensioen])
(Sociaal Werk)


(consortium voor innovatie)

(onderwijskundige)

HBO/WO
@joeyvanderbie




@gvanginkel (lerarenopleider )

@PaulKirschner
@theband
(lerarenopleider Engels)
(lerarenopleider Wiskunde)
(lerarenopleider [vakdidacticus scheikunde])
(HBO verpleegkunde)
(lerarenopleider Wiskunde)
(lerarenopleider Natuurkunde)
(HBO-v en Social Work)
(lerarenopleider )
(+ Lid Meesterschapsteam Nederlands)



 (lerarenopleider )
(storytelling [HBO journalistiek])
(consultant onderwijsinnovatie Fontys)
(PO)
(pedagogiek PABO)

(HO onderwijsinnovatie )

(theaterdocent en communicatietrainer)
(& adviseur MBO/VO)
(PABO)
@phronese (PABO / digitale geletterdheid)

 

SURF
@michielschok

overig/onbekend
@Vantrood (consultant)
@rheaflohr (coach)
(onderzoeker en coach)
@RuudvdBraber (adviseur leermiddelen [MBO])
(Expertisecentrum Nederlands)
(politicus [D66])
(vicevoorzitter AOB)
(CvB saamscholen)
(IISG en KNAW)
(adviseur)
(pedagoog)
(Beleidsmedewerker onderwijskwaliteit)
(academische bibliotheek)
(stichting leerKRACHT)

(kunstenaar in de klas)
(Klasveren.be)

(Avans)
(eTwinning)
(docent HBO; WO; aviseur MBO/VO)

(programmamanager onderwijsinnovatie)
(VO inspecteur)

(Zorgeloos naar School)

@TeacherTappNL  (de enige echte)

 

België


DKO