AI Feedback – Here Be Dragons

Feedback is een belangrijk element in het leerproces. Het geeft informatie over wat er goed gaat en wat er verbeterd kan worden. Met de komst van AI lijkt er waardevol feedbackgereedschap bij gekomen. Echter, ondanks de explosieve groei van AI en AI agents zitten er behoorlijk wat haken en ogen aan feedback via AI.

Het was in eerste instantie de bedoeling dat ik, net als bij audiofeedback, een nieuwe vorm van feedback zou uitproberen bij mijn leerlingen. Na het lezen van een aantal boeken en onderzoek over feedback en AI, ben ik hiervan teruggekomen. Dit artikel zal dus geen praktijkvoorbeeld laten zien van AI feedback in het onderwijs.

Dat wil niet zeggen dat AI feedback geen waarde heeft in het feedbackproces. Het kan zeker een rol spelen, maar het is belangrijk te beseffen dat het niet om de kwaliteit van het AI model gaat, maar de rol van AI in het leerproces van de leerling. Ongeacht hoe goed AI gaat worden, het verandert niet de risico’s die het met zich meebrengt. Leraren dienen bewust te zijn van deze risico’s voordat ze kunnen bepalen welke rol AI in het feedbackproces zal innemen. Ik eindig dit artikel dan ook met een aantal vragen die leraren kunnen helpen AI op een verantwoorde manier in te zetten in het feedbackproces.

 

Feedback en zijn waarde

Wanneer we het hebben over feedback op school, denken veel mensen aan het geven van het juiste antwoord of vertellen hoe het eigenlijk had moeten zijn. Dit is slechts maar een deel van het verhaal. Effectieve en efficiënte feedback gaat over het begeleiden van een proces. Het beoogt verandering bij de leerling teweeg te brengen en helpt bij het ontwikkelen van zelfstandig leren. “Het doel van feedback is invloed uitoefenen op toekomstig werk van leerlingen en op hun leerstrategieën. Aan de hand van de verkregen informatie kunnen leerlingen een volgende stap zetten in hun leerproces.” (Feedback in de Klas)

Cognitieve neurowetenschapper Stanislas Dehaene geeft in How We Learn aan dat er vier belangrijke pijlers zijn in het leerproces: gerichte aandacht, actieve betrokkenheid, terugkoppeling van fouten, en een cyclus van dagelijkse repetitie met nachtelijke consolidatie. Over feedback is hij heel helder: “de kwaliteit van de feedback die studenten krijgen, is een van de bepalende factoren voor hun academisch succes” (How We Learn). Volgens Dehaene bouwt een docent ervaring op over welke fouten zijn leerlingen doorgaans maken en verbetert daarmee de kwaliteit van zijn feedback: “deze leraren vinden de juiste woorden om het zelfvertrouwen van hun leerlingen te steunen, hen gerust te stellen en te herstellen, terwijl ze tegelijkertijd hun foutieve mentale representaties corrigeren.” (How We Learn)

Feedback is een parapluterm voor verschillende soorten reacties op handelingen en producten van leerlingen. We kunnen in de eerste plaats de verdeling maken in corrigerende feedback, evaluerende feedback, activerende feedback, en motiverende feedback. Corrigerende feedback richt zich op fouten in de taak en kan correcties aandragen. Evaluerende feedback geeft een waardeoordeel op de taak en is veelal subjectief. Activerende feedback (ook wel bekend als feed forward) geeft feedback voor het vervolg van de taak. Wat kan er beter gedaan worden? Wat zijn punten van aandacht? Motiverende feedback richt zich op de motivatie van de leerling. Feedback in de Klas heeft een andere vierdeling, al toont het ook overeenkomsten: feedback op taakniveau (hoe goed is de taak gedaan?), procesniveau (hoe is de taak op- en aangepakt?), zelfsturing (hoe heeft de leerling zich voorbereid?) en persoon (vergelijkbaar met motiverende feedback).

Het is daarnaast belangrijk om het verschil te duiden tussen feedback in een formatief proces en een evaluatie op een summatieve toets. Feedback heeft als doel de leerling verder te brengen in een leerproces. Een evaluatie op een summatieve toets heeft als doel uit te leggen waarom er tot een bepaald oordeel is gekomen. Dit verschil is belangrijk. Er wordt nog wel eens uitgebreide feedback gegeven op het eindproduct maar de kans dat dit blijft hangen bij een leerling is niet groot. Beter is het om deze tijd te investeren in feedback in het proces naar het eindproduct toe.

In Feedback in de Klas richten Stijn Verhoof en Geert Speltincx zich vooral op het feedbackgesprek. Leraren zijn expert in hun vakgebied en dat vereist kennis over veel verschillende situaties waarin de aan te leren vaardigheid wordt toegepast. In het gesprek tussen feedbackgever en feedbackontvanger is ruimte voor de nuance en ontwikkelt kwaliteitsbesef. Het is niet simpelweg het geven van een goed antwoord. Het is de fout herkennen, de fout aantonen, en de leerling begeleiden in de correctie. Dit is een holistische benadering van feedback: het gaat niet om het product zelf, maar hoe het product tot stand komt.

Feedback is dus een belangrijk onderdeel in het leerproces. Je hebt hiervoor heldere doelen nodig en duidelijkheid over het proces naar die doelen, of zoals Stijn Verhoof en Geert Speltincx zeggen: “Waar sta ik als leerling nu? Heb ik vooruitgang geboekt? Hoe ver ben ik nog verwijderd van het doel? Maar ook: Wat is de volgende stap?” (Feedback in de Klas). Zonder een duidelijk doel zegt feedback niet veel. Ook kan bij onduidelijke doelen de feedbackverwachting van de leerling verschillen van wat de leraar voor ogen had.

Het hebben van heldere doelen is één van de meest belangrijke elementen in het geven van feedback. Echter, het stellen van heldere doelen is niet zo makkelijk als het lijkt. Bij schrijfproducten is het vaak moeilijk om objectieve, eenduidige criteria te geven, vaak tot frustratie van leerlingen. Wanneer is het goed genoeg? Waarom zijn er meerdere antwoorden goed maar niet die van mij? Ook rubrics bieden slechts richting: “Los van het gegeven dat er in het ‘echte leven’ ook geen rubrics voorhanden zijn voor de producten of taken die je moet afronden, is er ook het probleem dat veel aspecten van een taak zich niet goed laten vangen in een rubric of lijst met criteria” (Formatief Handelen). Een rubric werkt niet als afvinklijst maar kan wel helpen in een feedbackgesprek. “Criteria zijn meer een gesprekspartner dan een eindproduct.” (Feedback in de Klas)

Het gaat bij effectieve feedback dus veelal niet om het antwoord (correctieve feedback), maar om de vragen die we als docenten en de leerlingen aan zichzelf stellen (evaluerende feedback): “Soms denk ik dat wij, als leraren, zo graag de antwoorden willen weten dat we niet voldoende tijd besteden aan het ontwikkelen van de vraag. Maar het is de vraag die de interesse van mensen prikkelt. Het vertellen van het antwoord doet niets voor je.” (Willingham in Feedback in de Klas). Een antwoord is vaak een eindpunt terwijl een vraag het begin is van een ontdekkingstocht naar inzicht. Het gaat er uiteindelijk om welk residu er achterblijft bij onze leerlingen na die tocht.

AI als fenomeen

Automatisch evalueren van betogen bestaat al sinds de jaren zestig van de vorige eeuw. In 1968 publiceerde Dr Ellis Page Project Essay Grade (PEG). Het was een behoorlijk betrouwbaar systeem maar was gericht op het becijferen van betogen. Het geven van feedback door middel van Generatieve AI (GenAI) is natuurlijk nog vrij jong. Er is op dit moment dan ook geen hard bewijs dat GenAI feedback betere leerresultaten oplevert. Wat we kunnen doen is naar een aantal onderzoeken kijken en de bevindingen naast bewezen effectieve en efficiënte feedback leggen. Op deze manier weten we welke bijdrage AI feedback zou kunnen leveren aan het leerproces.

Als je nog niet weet wat Generatieve AI is en hoe het werkt adviseer ik mijn artikel te lezen over Generatieve AI in het onderwijs. GenAI, zoals ChatGPT, genereert (de ‘G’ in GPT) nieuwe inhoud naar aanleiding van een prompt, een opdracht vaak in tekst. Het gebruikt hiervoor een voorgeprogrammeerde dataset (de ‘P’ in GPT). Omdat taal complex is en de AI alleen met (reeksen van) getallen kan werken, heb je een transformer nodig (de ‘T’ in GPT). De transformer vertaalt tekst naar getallen en getallen naar tekst. Kort gezegd, GenAI voorspelt tekst naar aanleiding van een vraag op basis van zijn dataset.

Onderzoek naar AI en feedback

In mijn artikel Wat voegt Generatieve AI nu eigenlijk toe aan het onderwijs? haalde ik het onderzoek “Generative AI Can Harm Learning” door Hamsa Bastani et al. aan. In dit onderzoek, gedaan onder 1000 Turkse leerlingen, kwam naar voren dat het gebruik van het type Generatieve AI verschil maakt in de leerprestaties van leerlingen. Het onderzoek maakt onderscheid in GPT Base (min of meer ChatGPT) en GPT Tutor een speciaal ontwikkelde AI ter ondersteuning van leerlingen in het leerproces. GPT Tutor is bijvoorbeeld minder geneigd het antwoord te geven, maar de leerling naar het antwoord te begeleiden. Hier kwam uit dat het gebruik van zowel GPT Base en GPT Tutor de leerprestaties verhoogden. Echter, werd de AI uit het leerproces gehaald, verslechterde de resultaten: “Bovendien stellen we vast dat wanneer de toegang later wordt afgenomen, studenten eigenlijk slechter presteren dan diegenen die nooit toegang hebben gehad.” Een logische vervolgtrekking is dan ook dat GenAI een eeuwige scaffold is: “Onze resultaten suggereren dat studenten proberen GPT-4 te gebruiken als ‘krukje’ tijdens oefenprobleemsessies en, wanneer dat succesvol is, ze slechter presteren als ze zichzelf aangewezen zijn.”

In “Feedback sources in essay writing: peer generated or AI-generated feebdack?” door Seyyed Kazem Banihashem et al. is onderzocht wat het verschil is tussen peerfeedback en GenAI feedback op een betoog (argumentative essay). Hier waren ook de Open Universiteit in Heerlen en de Universiteit Wageningen betrokken. In dit onderzoek werd vooral een verschil gevonden in het soort feedback dat gegeven werd: “Terwijl ChatGPT meer beschrijvende feedback gaf, inclusief informatie over hoe het essay is geschreven, gaven leerlingen feedback inclusief informatie over de identificatie van het probleem in het essay.” De onderzoekers zien vooral complementaire rol voor ChatGPT in het feedback proces.

Echter, het onderzoek keek alleen naar het soort feedback, niet welk effect de feedback had op het leerproces. Anders gezegd, studenten schreven niet een herziene versie naar aanleiding van de feedback. Hierdoor is ook moeilijk vast te stellen of de feedback van medeleerlingen en van ChatGPT invloed had op de kwaliteit van het schrijfproduct. Ook is onduidelijk of en hoe de studenten waren geïnstrueerd over het geven van peerfeedback.

In “Impact of AI assistance on student agency” door Ali Darvishi et al. werd gekeken naar het idee of AI kan helpen in geven van peerfeedback en zelfregulatie. Dit valt een beetje buiten ons onderwerp, maar wat wel interessant is, is dat de student inleverde op zelfwerkzaamheid, een probleem dat we ook al zagen in het onderzoek van Hamsa Bastani: “Studenten neigden ertoe om afhankelijk te zijn van, in plaats van te leren van AI-hulp. Als de AI-hulp werd verwijderd, konden zelfregulatie strategieën helpen om het gat op te vullen, maar ze waren niet zo effectief als de AI-hulp.” AI assistentie helpt bij zelfregulering, maar (ironisch) alleen wanneer het aangeboden wordt. Er vindt geen leerproces plaats. Dit is dan ook de waarschuwing die de onderzoekers geven: verlies niet de negatieve invloed op zelfredzaamheid uit het oog. Uiteindelijk is het doel van onderwijs kritische en zelfstandige burgers op te leiden, geen dienaren voor het AI orakel.

AI als extrinsieke motivator

In “AI feedback: Moving beyond the hype to integrating it into a coherent feedback pedagogy” door Hui Yong Tay werd gekeken naar de invloed van AI feedback op het verwerven van de Engelse taal door kansarme leerlingen. Het ging om 21 leerlingen in de leeftijd van 13-14 jaar. Zij kregen, naast online lessen, feedback op hun schrijfproducten via de app Scribo. De conclusie was dat AI feedback een positieve werking had op de prestaties van de leerlingen, maar dat dit mede kwam door ingebouwde routines in het programma.

Interessant aan dit onderzoek zijn de reacties van de leerlingen, want het lijkt erop dat AI vooral handig was om antwoorden te krijgen. “Je kunt gewoon erop klikken (de fout die door het systeem is gemarkeerd) en het woord veranderen. En je blijft maar op ‘accepteren’ klikken en dan verandert alles en dan krijg je meer punten,” aldus een leerling. De vraag is dan ook, wordt hier een product verbetert of een leerling? Diezelfde leerling zegt later: “Als je de discipline hebt, zou je er eigenlijk doorheen moeten lezen in plaats van op alles ‘accepteren’ te drukken… je weet niet wat je fout hebt gedaan.”

De reden dat leerlingen de AI feedback waardeerden was dat het makkelijk te gebruiken was. Ook was er onmiddellijk feedback via de Scribo scores. Daarnaast was de feedback niet veroordelend en hielp de zichtbare verbetering in het programma leerlingen gemotiveerd te houden. Het viel mij op dat veel genoemde positieve ervaringen gebaseerd waren op extrinsieke motivatie (‘scores’, ‘badge’). De vraag is dan ook welk deel wordt veroorzaakt door AI en welk deel door de gamification. Daarnaast leek het er ook op dat leerlingen een negatief beeld op feedback door docenten hadden ontwikkeld.

De ‘verbetering’ die wordt aangetoond in het artikel is vooral gericht op de perceptie, emotie, en handelingen van leerlingen wanneer ze interactie hadden met AI, niet op de kwaliteit van de producten of het leerproces. Ook is dit onderzoek meer gericht op bewerken (‘edit’) van producten in plaats van het geven van feedback om de leerling zelf aan de slag te laten gaan.

AI feedback kan dus een positieve bijdrage leveren aan de motivatie van leerlingen om te leren. De vraag is of er sprake is van een motivatievoordeel of van een leervoordeel. Meer motivatie leidt niet automatisch tot beter leren: “Natuurlijk zal een gemotiveerde leerling sneller aan iets beginnen, maar dit is geen garantie voor leren. Het is zelfs zo, dat als een leerling gemotiveerd begint en geen succes boekt, die motivatie snel wegebt.” (Op de Schouders van Reuzen)

Cognitive Offloading

In “AI tools in Society: Impacts on Cognitive Offloading and the future of Critical Thinking” van Michael Gerlich wordt aangetoond dat het gebruik van Generatieve AI kan leiden tot verlies in kritisch denkvermogen door het fenomeen “cognitive offloading” (cognitieve uitbesteding): het gebruik van externe hulpmiddelen om de cognitieve inspanning van de gebruiker te verlagen. Cognitive offloading kan helpen in het creëren van ruimte in het denken om de verdieping te vinden. Aan de andere kant zorgt het ervoor dat de gebruiker zelf minder hoeft te doen en minder kennis hoeft te hebben waardoor het kritisch denkvermogen van de gebruiker verandert: “De bevindingen toonden een significante negatieve correlatie aan tussen frequent AI-toolgebruik en kritisch denkvermogen, beïnvloed door toegenomen cognitieve uitbesteding.”

Gerlich geeft aan dat AI gereedschap kan helpen bij het leren, maar dat overmatige afhankelijkheid leidt tot cognitive offloading. Dit kan resulteren in dat werknemers efficiënter werken maar minder in staat zijn zelfstandig problemen op te lossen en kritisch te evalueren. Dit komt overeen met de uitkomsten van eerder genoemde onderzoeken: gebruik van AI gereedschap zorgt voor betere resultaten in het moment maar creëert ook een afhankelijkheid van dat gereedschap (de eeuwige ‘scaffolding’). Wanneer processen worden overgenomen door AI gereedschap kan dit ook leiden tot een gebrek aan transparantie en begrip. Gerlich adviseert dan ook een balans te vinden tussen de voordelen van AI integratie met de ontwikkeling van zelfstandige analytische vaardigheden in met name het onderwijs en organisaties. Hoe dit eruit zou moeten zien, blijft onbeantwoord.

De bevindingen van Gerlich worden ondersteund in het artikel “Beware of metacognitive laziness: Effects of generative artificial intelligence on learning motivation, processes, and performance” van Yizhou Fan et al. Dit onderzoek keek naar de mogelijkheden voor ‘hybride intelligentie’ waarbij er een wisselwerking plaatsvindt tussen mens en AI. Het onderzoek, dat werd gedaan onder 117 universiteitsstudenten, ondersteunt het gevaar van cognitieve uitbesteding: “Technologieën zoals ChatGPT kunnen de afhankelijkheid van studenten van technologie bevorderen en mogelijk metacognitieve ‘luiheid’ veroorzaken, wat hun vermogen voor zelfregulatie en diepgaand leren kan belemmeren.”

Daarnaast geeft het onderzoek aan dat de resultaten bij gebruik van ChatGPT significant verbeterden, maar weer wegvielen wanneer er geen AI beschikbaar was: “ChatGPT kan de prestaties bij kortetermijntaken aanzienlijk verbeteren, maar het zal mogelijk de intrinsieke motivatie, kennisverwerving en kennisoverdracht niet bevorderen.” Deze verbeterde prestaties worden overigens ook, voor een deel, in twijfel getrokken. De onderzoekers ontdekten dat sommige studenten de inhoud van ChatGPT kopieerden en plakten, bijvoorbeeld voorbeeldzinnen gemaakt door ChatGPT: “Metacognitieve luiheid kan kortetermijnprestatieverbeteringen stimuleren, maar op de lange termijn leiden tot stagnatie van vaardigheden.”

Zowel Fan en Gerlich geven aan dat metacognitieve vaardigheden cruciaal zijn in de omgang van Generatieve AI. Deelnemers in Gerlichs onderzoek die een hoger opleidingsniveau hadden gingen kritischer om met AI: “Mijn opleiding heeft mij geleerd hoe belangrijk het is om dingen niet zomaar voor waar aan te nemen, vooral wanneer het gaat om AI, dat soms vooringenomen of incomplete informatie kan bieden,” aldus een deelnemer. Hier wordt dus ook duidelijk dat het belangrijk is dat alvorens leerlingen en studenten AI gebruiken voor feedback, zij opgeleid moeten zijn in kritisch denken en AI geletterdheid.

Het onderzoek geeft daarnaast aan dat hoe hoger het vertrouwen van de deelnemers in AI, hoe hoger de kans dat ze cognitieve taken overdragen aan dit gereedschap. Nu Generatieve AI steeds meer algemeen goed wordt, verhoogt dit ook het risico op een verminderde kritische benadering van de mens, of, zoals Nicholas Carr in The Shallows zegt: “Wanneer we ons geheugen overdragen aan een machine, dragen we ook een zeer belangrijk deel van ons intellect en zelfs onze identiteit over.”

Gevolgen AI op schrijfvaardigheid

Om te zien welk effect AI heeft op de kwaliteit van schrijfproducten hoef je niet ver te kijken. “Feedback sources in essay writing: peer generated or AI-generated feedback?” van Seyyed Kazern Banihashem et al. gebruikt veel AI taal. Banihashem geeft dit ook aan: “De auteurs gebruikten generatieve AI voor taalbewerking en namen de volledige verantwoordelijkheid.” Welbekende AI favorieten zijn goed vertegenwoordigd in dit artikel: delve, foster, enhance, en deep/depth. Daarnaast is er sprake van veel wollig taalgebruik:

This investigation serves as a critical step in determining whether the feedback imparted by peers and AI holds the necessary caliber to enhance the craft of essay writing.

The ramifications of addressing this query are noteworthy. Firstly, it stands to significantly alleviate the workload carried by teachers in the process of essay evaluation. By ascertaining the viability of feedback from peers and AI, teachers can potentially reduce the time and effort expended in reviewing essays.

Dit kan als volgt menselijker worden gemaakt:

This research can help in answering the question whether feedback by peers and AI will improve essay writing.

The impact of answering this question is significant. Firstly, if viable, peer and AI feedback could significantly reduce the workload of teachers when evaluating essays.

Een ander voorbeeld:

[D]irecting attention towards the comparison of peer-generated feedback quality and AI- generated feedback quality within the realm of essay writing bestows substantial value upon both research and practical application.

Kan ook minder wollig:

Comparing peer-generated feedback quality with AI-generated quality in essay writing can provide valuable insights for both research and practical application.

Als je aan ChatGPT vraagt als een editor je teksten door te lezen en aanpassingen te maken daar waar nodig, zal ChatGPT altijd veranderingen aanbrengen, ongeacht of de geschreven tekst ook gewoon al goed was. Dit zorgt ervoor dat je schrijfproduct een persoonlijke stem kwijtraakt en meer generiek wordt. We zullen zelf steeds minder schrijfvaardig worden en daardoor steeds vaker grijpen naar AI gereedschap om dat voor ons te doen. Dit is een neerwaartse spiraal. Als je weet dat ‘leren denken, leren schrijven’ is (Zinsser in Writing to Learn) kan dit grote gevolgen hebben voor onze zelfredzaamheid. Door deze artikelen zelf te schrijven leer ik AI en feedback beter te begrijpen. Dat hierdoor fouten in mijn artikel kunnen sluipen, weet ik maar al te goed. Echter, het schrijfproces heeft een persoonlijk doel (inzicht krijgen in de materie); het artikel heeft als doel de informatie te delen met geïnteresseerden, “warts and all.”

Uit de onderzoeken hierboven kunnen we de volgende conclusies trekken. AI is effectieve scaffolding maar creëert een afhankelijkheid bij de gebruiker. Deze cognitieve uitbesteding heeft een negatief effect op ons kritsch denkvermogen. AI feedback richt zich veelal op een schrijfproduct als tekst, terwijl peerfeedback zich meer richt op de probleemstelling. AI feedback kan daarmee leerlingen extrinsiek motiveren en hen daarmee met de materie aan de slag laten gaan. Het gebruik van AI voor feedback vraagt hierdoor om een weldoordachte integratie: “activiteiten moeten zorgvuldig worden ontworpen zodat studenten niet kunnen vermijden om met deze relevante informatie te interacteren.” (Hidden Lives of Learners)

AI feedback

Anders dan met audiofeedback, waar ik eerder over schreef, dient grote voorzichtigheid te worden geboden met AI feedback. Schrijven is niet altijd een objectief proces. Spelling en grammatica zijn dat veelal wel, maar over stijl en inhoud verschillen nog wel eens de meningen. Daarnaast kan AI feedback een tweede kapitein worden op het feedbackschip waardoor de leraar zichzelf naar leerlingen moet verdedigen als de AI andere feedback geeft dan hijzelf.

Je kunt een rubriks uploaden in een Generatieve AI waarin je omschrijft waar het product aan moet voldoen. Echter, los van het feit dat AI kan hallucineren, maakt AI nog steeds keuzes waar op te reageren, hoe te reageren, en welke voorstellen er worden gedaan. Deze voorstellen zijn niet objectief. Generatieve AI heeft zelf ook voorkeuren in stijl en woordenschat. Het is zeker zo dat Generatieve AI vaak ook goede voorstellen doet. Het blijft immers een taalmodel. Het weet best wel wat over taal.

proces vs. product

Zoals Feedback in de Klas al aangaf, feedback is een proces, geen moment. Generatieve AI wordt nog steeds beter en de correctieve feedback zal daarmee ook steeds beter worden. Maar ongeacht de kwaliteit van de feedback, blijft het een probleem dat AI feedback geeft op het product en (nog) niet bezig is met het leerproces verspreid over een langere periode.

Je kunt ervoor kiezen om AI de leiding te geven in het schrijfproces om zo ook meer feedback te geven op dat proces. Echter, zoals onderzoek heeft uitgewezen, loop je dan het risico dat de leerling afhankelijk blijft van het systeem. Ook is de vraag wat er dan overblijft voor de rol van docent. Onderzoek heeft aangetoond dat onderwijs complex is, waar cognitieve, sociaalpedagogische, en psychologische aspecten samenkomen. Wanneer AI de regie neemt, hoe waarborg je al deze aspecten? Dit is een discussie die buiten dit artikel valt, maar is stof tot nadenken voor een mogelijk toekomstig artikel.

docentgestuurd

Er is natuurlijk een groot verschil tussen een docent die AI gebruikt om feedback te geven op leerlingwerk en een leerling die AI gebruikt om feedback te krijgen op haar schrijfproducten. Een docent kan de AI output redigeren alvorens het aan de leerling te geven. De vraag is dan welke winst het gebruik van AI zou geven.

Een mogelijk gebruik van AI door docenten is, zoals Daisy Christodoulou aangeeft in “Using AI to automate written comments,” dat AI audio feedback kan omzetten naar geschreven tekst. Dat bespaart tijd (al zou ik zeggen, laat leerlingen zelf de feedback opschrijven zoals ik bespreek in “audio feedback”). Maar deze functie bestond al vóór de opkomst van generatieve AI.

Docentgestuurde feedback kan beter ingaan op inzichten verworven uit de cognitieve wetenschap dan wanneer een leerling met AI als feedbackgever aan de slag gaat. Zo kan een docent feedback beter uitstellen: “Sommig bewijs toont aan dat het kort uitstellen van feedback beter langetermijnleren oplevert dan onmiddellijke feedback” (making it stick, p. 39). Ook kan een docent beter inschatten waar een leerling zich eerst op moet richten en daarmee de hoeveelheid feedback beperken (voorkomen van cognitieve overbelasting). Daarnaast kennen de meeste docenten hun leerlingen goed en zullen zij de toon en de vorm van hun feedback aanpassen aan de leerling.

Als een docent zelf gebruik wil maken van AI feedback voor leerlingen moet de docent eerst bij de AI aangeven aan welke criteria de feedback moet voldoen. Dit kan door een rubriks te uploaden. Daarna kan hij of zij werk van leerlingen delen met de AI. Het werk dient wel geanonimiseerd te zijn. Het is dan te adviseren een eigen codesysteem aan te houden om werk te traceren en de feedback bij de juiste leerling te krijgen. Het maakt geen groot verschil of het werk getypt of geschreven is. Een model als ChatGPT heeft een OCR functionaliteit waarmee het foto’s van geschreven werk kan worden omgezet in digitale tekst. De docent kan aan een model zoals ChatGPT vragen de feedback in een Word bestand aan te leveren zodat deze later makkelijker met een leerling gedeeld kan worden.

In een notitie op Substack stelt Arvind Narayanan, professor aan de Universiteit van Princeton en schrijver van het boek AI Snake Oil, het nut van bepaalde AI agents ter discussie. Hij heeft het over het automatiseren van winkelen of het boeken van een reis, maar het is geen grote sprong om ook zo naar feedback agents te kijken: “Het zal onvermijdelijk vele rondes van heen-en-weer communicatie vereisen om te ontdekken wat de gebruiker wil, of anders het risico lopen dat dingen fout gaan.” Wil je een feedback agent gebruiken, maar zelf de regie houden, dan zal je heel veel moeten fine-tunen. Op een gegeven moment moet je je dan als docent afvragen of het gebruik van AI juist niet meer werk oplevert zonder significante verbetering van het leerproces voor de leerling.

Het voordeel is dat GPT veel nakijkwerk bespaart, maar je levert weer veel tijd in met het organiseren van de data. Je kunt het bulkwerk automatiseren door middel van een ‘agent’ maar dit vergt diepere kennis over AI en is uiteindelijk minder flexibel dan zelf nakijken. Uiteindelijk zal je de vraag moeten stellen of de AI past binnen jouw systeem of dat je het systeem passend aan het maken bent voor AI.

leerlinggestuurd

Je kunt ook leerlingen zelf hun schrijfproduct laten aanbieden aan AI. Hiervoor moet in de eerste plaats bekend zijn of de leerling gebruik mag maken van de AI applicatie. Vaak zijn er leeftijdslimieten aan het gebruik van AI modellen of moeten ouders toestemming geven voor het gebruik (ook vanwege de AVG). Vaak ligt die grens bij 13 jaar, met ouderlijke toestemming, maar voor sommige modellen moet je minimaal 18 jaar zijn.

Het moment van feedback is een tactische keuze. Wordt deze keuze bepaald door de docent, de AI, of de leerling in zelfsturend leren? Effectieve feedback heeft immers niet tot doel direct correcties aan te brengen op een product. Ook is de vraag of je leerlingen met een AI Base, zoals ChatGPT, laat werken of een AI Tutor en hoe je ervoor zorgt dat de AI feedback geeft naar aanleiding van de leerdoelen die je hebt gesteld (bijvoorbeeld een rubriks). Er zijn voorzichtige positieve ervaringen met een AI Tutor, zoals het onderzoek op Harvard waarin eerstejaars studenten gebruikmaakten van een AI Tutor om basis natuurkunde eigen te maken. Aan de andere kant kan een AI Tutor ook de neiging hebben een eeuwig ‘krukje’ te worden, zoals aangetoond in “Generative AI Can Harm Learning.”

Wanneer een leerling met Generatieve AI aan de slag gaat, wordt het lastig voor de leerling om prioriteiten te stellen. Een leerling staat immers nog niet boven de stof en zal overspoeld worden met feedback waardoor zij niet meer duidelijk ziet waar aan te werken. Dit zal vaak leiden tot cognitieve overbelasting. De leerling zal de neiging hebben om ‘het goede antwoord’ te vragen en de feedback klakkeloos accepteren. Het is dan geen feedback meer, maar een correctie geworden: “Wanneer leerlingen fouten maken en correctieve feedback krijgen, worden de fouten niet geleerd” (making it stick, p. 90).

Alleen wanneer een leerling goed is opgeleid in het gebruik van AI als gereedschap, kan het effectief worden ingezet. Zo moet een leerling beseffen dat het antwoord van AI een suggestie is en dat Generatieve AI de neiging heeft de gebruiker tevreden te stellen. Ook moet een leerling keuzes durven maken in het schrijfproces dat tegen het advies van AI ingaat. Het is vooral zaak dat de leerling zelf schrijft en niet een voorstel van AI bewerkt. Het moet een schrijfproduct van de leerling zijn, niet van AI.

conclusie

Het doel van feedback is het creëeren en vormen van kritisch denkprocessen in de leerling zodat zij uiteindelijk zelfstandig kan handelen. Het geven van feedback is niet in de eerste plaats om een product te verbeteren, maar om de leerling kennis en vaardigheden eigen te laten maken zodat ze later de handeling zelfstandig kan verrichten.

Goede feedback staat niet op zichzelf maar wordt gegeven in een proces. Het is een complexe werkwijze dat vraagt om inzicht in het doel, de leerling, en de situatie wanneer welke informatie op welke manier te delen De leraar moet wel boven de domeinkennis staan, ervaring hebben opgebouwd, en bewust zijn van de valkuilen in het feedbackproces.

Daarnaast is feedback een sociaal proces, een relatie tussen mensen: “Feedback is een gesprek tussen de schrijver en het publiek. Het kan bemoedigend of controversieel zijn, maar bovenal is het een relatie tussen mensen” aldus Marc Watkins in “What does Automating Feedback Mean for Learning?” Hoe meer technologie tussen de docent en de leerling staat, hoe verder de connectie tussen mensen zal zijn en hoe meer technologie de leiding zal nemen.

De rol van AI in het feedbackproces is daarmee een stuk moeilijker te bepalen dan dat je op het eerste gezicht zou verwachten. We zijn verwonderd over de capaciteiten van AI modellen maar vergeten dat onderwijs niet gaat om het eindproduct. Het gaat uiteindelijk om de menselijke relatie en ‘het residu dat achterblijft bij de leerling’. Programmeurs trainen modellen, leraren trainen mensen.

Het is daarom moeilijk te bepalen welke waardevolle bijdrage AI kan geven aan het feedbackproces. Het is zeker niet zo dat je AI het werk kan laten doen zodat jij als docent bezig kunt zijn met de ‘leuke dingen’ van het vak (een uitspraak die ik altijd vreemd heb gevonden, want leerlingen begeleiden in het leerproces is het ‘leuke’ van mijn vak, en daar is feedback een essentieel element in). Je zult als docent goed moeten nadenken wanneer en op welke manier je AI feedback laat geven op het werk van leerlingen.

  • Wil je AI inzetten in het feedbackproces, stel jezelf dan de volgende vragen:
  • Wat is het doel van het leerproces? Waar werk je naar toe?
  • Zijn leerlingen AI geletterd?
  • Welk deel neem jij als docent op je en welk deel doet de AI?
  • Welke AI wil je inzetten en wie maakt er gebruik van (docentgestuurd of leerlinggestuurd)?
    • Is dit een Base AI of een Tutor AI? Wat zijn de gevolgen voor de keuze van het type AI?
    • Zijn er leeftijdsgrenzen aan het gebruik voor het model?
  • Welke data heeft de AI nodig om aan te sluiten aan jouw doelen en hoe lever je die data?
  • Waar in het leerproces wordt AI ingezet als feedback? Wordt de AI in de les gebruikt of mag het ook buiten de les?
  • Wat voor soort feedback moet er door AI gegeven worden: correctief, evaluerend, of activerend?
  • Hoe voorkom je scaffolding afhankelijkheid? Hoe voorkom je motivatie zonder verandering in het langetermijngeheugen?

Nicholas Carr in The Shallows stelt dat “de hechte band die we met ons gereedschap vormen, in beide richtingen werkt. Terwijl onze technologieën uitbreidingen van onszelf worden, worden wij uitbreidingen van onze technologieën.” Onderzoek heeft aangetoond dat de afhankelijkheid voor AI een inherent risico is. Leren doet pijn en leerlingen zijn geneigd zich te richten op het antwoord in plaats van op de beantwoording. Feedback moet leerlingen zelfstandiger maken, niet afhankelijker. Het is aan leraren, en niet aan modellen, om hier de leiding in te nemen.

Bronnen

Banihashem, Seyyed Kazem, et al., “Feedback sources in essay writing: peer generated or AI-generated feebdack?”, 2024

Bastani, Hamsa et al., Generative AI Can Harm Learning”, 2024

Carr, Nicholas, The Shallows: How the Internet Is Changing the Way We Think, Read and Remember, 2010

Christodoulou, Daisy, “Using AI to automate written comments”, 2024

Darvishi, Ali, et al., “Impact of AI assistance on student agency” , 2024

Dehaene, Stanislas, How We Learn: Why Brains Learn Better Than Any Machine . . . for Nown, 2018

Fan, Yizhou, et al., “Beware of metacognitive laziness: Effects of generative artificial intelligence on learning motivation, processes, and performance”, 2024

Gerlich, Michael, “AI tools in Society: Impacts on Cognitive Offloading and the future of Critical Thinking”, 2025

Kestin, Gregory, et al., “AI Tutoring Outperforms Active Learning”, 2024

Kirschner, Paul A., Claessens, Luce, Raaijmaker, Steven, Op de Schouders van Reuzen, 2019

Kneyber, René, Sluijsmans, Dominique, Wilde, Bianca, Devid, Valentina, Formatief handelen: Van instrument naar ontwerp, 2022

Nuthall, Graham, The Hidden Lives of Learners, 2007

Page, Ellis, “Project Essay Grade (PEG)”, 1968

Tay, Hui Yong, “AI feedback: Moving beyond the hype to integrating it into a coherent feedback pedagogy”, 2024

Vanhoof, Stijn, Speltincx, Geert, Feedback in de klas: Verborgen leerkansen, 2021

Watkins, Marc, “What does Automating Feedback Mean for Learning?”, 2024

EU AI Act en onderwijs – wat scholen moeten weten en doen nu de wet is ingegaan

Dit jaar is de Europese AI Act ingegaan waarin Europa regels heeft vastgelegd voor alle lidstaten omtrent kunstmatige intelligentie. Met deze wet wordt eenduidigheid gecreëerd over de wet- en regelgeving over kunstmatige intelligentie en worden de democratische waarden van de Unie geborgd. “[AI] moet dienen als instrument voor mensen, met als uiteindelijke doel het welzijn van de mens te vergroten.” (EU AI Act, p. 2). In dit artikel wil ik uiteenzetten wat dit betekent voor scholen en wat zij al kunnen, maar uiteindelijk ook moeten, doen.

Voor de duidelijkheid, ik ben geen jurist. Ik heb de EU AI Act gelezen en verschillende bronnen geraadpleegd om te begrijpen wat de implicaties voor scholen zijn. De informatie is niet altijd duidelijk en vaak worden scholen niet benoemd. Toch vallen scholen onder de wet als ‘gebruiksverantwoordelijke’: “een natuurlijke of rechtspersoon, overheidsinstantie, agentschap of ander orgaan die/dat een AI-systeem onder eigen verantwoordelijkheid gebruikt, tenzij het AI-systeem wordt gebruikt in het kader van een persoonlijke niet-beroepsactiviteit” (artikel 3, lid 4; p. 46). Ik probeer zoveel mogelijk te verwijzen naar de Verordening om anderen te helpen de Verordening te lezen en te interpreteren. Mochten er onjuistheden in dit artikel staan, dan hoor ik graag en pas ik het aan.

EU AI Act [NL]

EU AI Act [ENG and other languages]

artikel in PDF

Welke AI?

Wanneer we aan AI denken, komt vrij snel ChatGPT of een andere Generatieve AI in beeld. Echter, de Verordening gaat ook over andere AI-systemen zoals voorspellende AI en identificatie AI. Daarnaast zijn er ook verplichtingen voor AI Geletterdheid.

De AI Act verdeelt AI in vier risicogebieden: onaanvaardbaar (zoals het ‘social scoring systeem’ in China), hoog-risico (hier valt ook onderwijs onder), beperkt risico (chatbots), en minimaal (spamfilters).

De EU AI Act gaat niet direct over onderwijskundig gebruik van Generatieve AI modellen zoals ChatGPT of de controle van werk van een leerling waarbij een vermoeden bestaat dat GenAI is gebruikt. Het richt zich vooral op hoog-risico AI-systemen. Die AI-systemen gaan over de toegang, toelating en toewijzing tot onderwijs, het evalueren van leerresultaten, het sturen van het leerproces, beoordelen van het passende onderwijsniveau, en het monitoren en detecteren van ongeoorloofd gedrag tijdens toetsen (overweging 56, p. 16)

AI Geletterdheid (vanaf februari 2025)

De EU AI Act stelt dat aanbieder, gebruiksverantwoordelijken, en betrokken personen AI geletterd moeten zijn om de grondrechten, gezondheid, en veiligheid te beschermen en democratisch controle mogelijk te maken (sectie 20, p. 6). In artikel 4 (p. 51) wordt de uitvoering uiteengezet:

Artikel 4 is niet heel uitgebreid, maar dit is wat we eruit kunnen halen. Scholen vallen onder gebruiksverantwoordelijken. Zij zijn degenen die AI-systemen gebruiken voor hun taak (onderwijs). Een school moet daarom maatregelen nemen om haar personeel AI geletterd te hebben zodat zij AI binnen hun onderwijs (context) kunnen gebruiken

Deze geletterdheid wordt ook elders in de verordening benadrukt. Gebruiksverantwoordelijken moeten ‘relevante capaciteiten en beperkingen van het AI-systeem met hoog risico goed begrijpen en werking ervan naar behoren kunnen monitoren (artikel 14, lid 4a: menselijk toezicht). Ook benadrukt artikel 26, lid 2 dat gebruiksverantwoordelijken het menselijk toezicht op aan “natuurlijke personen die over de nodige bekwaamheid, opleiding, en autoriteit beschikken en de nodige ondersteuning krijgen” (p. 68). Al hoewel artikel 4 niet expliciet aangeeft dat leerlingen AI geletterd moeten zijn alvorens zij met AI aan de slag kunnen, vallen zij waarschijnlijk wel onder ‘andere personen’ en dienen dus eerst instructie te krijgen over de risico’s van AI. Iets wat voor mij niets meer dan logisch is.

Als een school ChatGPT aanbiedt (en dit kan dus ook via een enthousiaste enkele docent zijn), moeten gebruikers daarvoor geletterd zijn. Maar denk ook aan een programma zoals Snappet dat een AI-functionaliteit in zijn systeem heeft dat valt onder ‘hoog risico’ (zie onder).

Het gaat bij AI-geletterdheid niet alleen om een knoppencursus. Het gaat juist om het herkennen, begrijpen, en adequaat kunnen toepassen van AI. Voor leerlingen is het belangrijk te begrijpen wat AI is, hoe resultaten tot stand komen, en wat de risico’s zijn.

Deze cursussen zouden gegeven moeten worden zonder, wat Neil Postman noemt in The End of Education “hyperactieve fantasieën van cheerleaders,” maar cursusleiders die de EU AI Act kennen en kritisch kunnen kijken naar de risico’s van AI-systemen. Een cursusleider moet ook op de hoogte zijn van de context (onderwijs). Het gaat immers niet (alleen) over het begrijpen van AI, maar ook wat de implicaties zijn binnen de onderwijscontext. Een cursus over welke ‘fantastische’ dingen AI allemaal kan, is een ander soort cursus en kan de AI-geletterdheid overschaduwen.

Praktijkcodes (mei 2025; p. 86)

Vanaf 2 mei 2025 moeten de praktijkcodes gereed zijn. Praktijkcodes helpen bij het uitvoeren van de EU AI Act. Ze worden voor specifieke sectoren, waaronder onderwijs, opgesteld zodat zij niet alles zelf hoeven uit te zoeken. Ik vermoed dat Kennisnet dit zal gaan doen, al kan het ook vanuit het Ministerie van Onderwijs gebeuren of een andere overkoepelende organisatie. Deelname aan praktijkcodes is vanuit de AI Act niet verplicht, maar in de praktijk zal een school zich hierbij aansluiten (artikel 56, pp. 86-87).

AI-systemen met hoog risico (augustus 2026; p. 53)

Zoals gezegd zijn er vier subdomeinen voor hoog-risico systemen voor het onderwijs:

  • toegang, toelating en toewijzing tot onderwijs
  • beoordelen van het passend onderwijsniveau
  • monitoren en detecteren van ongeoorloofd gedrag tijdens toetsen
  • evalueren van leerresultaten en sturen van het leerproces

Ik richt mij hier op het basisonderwijs en voortgezet onderwijs. “Toegang, toelating en toewijzing tot onderwijs” en “beoordelen van het passende onderwijsniveau” zijn voor nu nog niet relevant voor het basis- en voortgezet onderwijs, maar zijn wel belangrijke kaders voor als er ooit in de toekomst worden besloten om AI te gebruiken om, bijvoorbeeld, het onderwijsniveau van een leerling te bepalen in groep 8. Ook “het monitoren en detecteren van ongeoorloofd gedrag tijdens toetsen” is prettig in een wet te hebben gekaderd. Dergelijke controlesystemen zullen uiteindelijk op de onderwijsmarkt komen.

Wat voor nu het meest belangrijk is het “evalueren van leerresultaten en sturen van het leerproces”. Dit vindt namelijk al plaats. Een van de meest gebruikte systemen voor dit soort doeleinden is Snappet. Snappet heeft een ingebouwde AI-module die voorspelt op welk niveau leerlingen opdrachten aangeboden krijgen. Dit valt, naar mijn mening, onder het sturen van het leerproces en is daarmee een hoog-risico systeem.

Het is nog steeds toegestaan om dit soort AI te gebruiken maar de EU AI Act vraagt wel om een borging bij zowel de aanbieder als de gebruikersverantwoordelijke (de school). Beide partijen dragen de verantwoordelijkheid om AI-systemen aan te bieden conform de EU AI Act. Onderdeel van deze borging is het personeel AI geletterd te hebben voor adequaat gebruik van het systeem. Docenten mogen dus niet zomaar de AI-functie in Snappet aanzetten en met de armen over elkaar naar de resultaten kijken. Hoog-risico systemen dienen daarnaast een CE-markering te hebben (artikel 48; p. 81).

De EU AI Act stelt dat hoog-risico systemen dermate transparant moeten zijn dat het gebruikersverantwoordelijken in staat moet stellen “de output van het systeem te interpreteren en op passende wijze te gebruiken” (artikel 13, p. 59). Het is belangrijk voor hoog-risico systemen dat er menselijk toezicht kan plaatsvinden (artikel 14, p. 60) en dat er bij onregelmatigheden kan worden ingegrepen. Kort gezegd, de school moet weten hoe de motor functioneert en die motor kunnen aanpassen. Docenten moeten de Snappet AI kunnen monitoren en ingrijpen als Snappet verkeerde lessen klaarzet.

AI-functionaris

Voorspellings- en evaluatiesystemen zullen steeds meer de onderwijsmarkt betreden en het is daarom voor iedere school belangrijk een AI-functionaris aan te stellen zoals bij de AVG ook het geval was. Het hebben van een AI-functionaris is niet verplicht vanuit de AI Act (het wordt nergens genoemd), maar wel logisch om te borgen zodat een school zich aan de Verordening houdt. Een ICT&Onderwijs Coördinator kan deze taak ook op zich nemen, maar betekent wel een uitbreiding van zijn of haar taak.

De AI-functionaris is verantwoordelijk voor het controleren van AI hoog-risico systemen die worden gebruikt binnen de organisatie en het opleiden van het personeel. Als er, bijvoorbeeld, een nieuwe methode met AI-ondersteuning wordt aangeschaft, kan de AI-functionaris helpen bij het in kaart brengen van de AI-risico’s. Ook kan de AI-functionaris nieuwe AI-toepassingen registreren zodat voor de school duidelijk is welke AI er wordt gebruikt en op welke manier.

Generatieve AI (augustus 2025; p. 83)

Per 2 augustus 2025 moeten ‘AI-modellen voor algemene doeleinden’ (dat is ChatGPT, Claude, Gemini, etc.) voldoen aan de AI Act. De school blijft echter gebruiksverantwoordelijke. Dit betekent dat de school verantwoordelijk is dat het gebruik van generatieve AI-systemen in overeenstemming met de Verordening is, waaronder de AVG. Daarnaast hebben Generatie AI modellen ook leeftijdsgrenzen die vaak in de EULA’s van AI-modellen te vinden zijn (opvallend genoeg was het niet altijd makkelijk deze informatie te vinden):

ChatGPT (OpenAI) van 13 tot 18 jaar met ouderlijke toestemming
Claude (Anthropic) 18 jaar
Gemini (Google) 16 jaar
Llama (Meta) tot 15 jaar met ouderlijke toestemming (AVG)
Copilot (Microsoft) 18 jaar
Mistral (Mistral AI) van 13 tot 18 jaar met ouderlijke toestemming
Perplexity (Perplexity AI) van 13 tot 18 jaar met ouderlijke toestemming

Het is aan te raden om ouderlijke toestemming voor modellen zoals ChatGPT, Mistral en Perplexity te registreren in een leerlingvolgsysteem, net als op veel scholen de ouderlijke toestemming voor de Coronatest in het leerlingvolgsysteem stond geregistreerd. Zonder deze toestemming mag je, volgens de gebruikersovereenkomsten van deze bedrijven, leerlingen niet met deze AI laten werken.

Zoals eerder genoemd moeten docenten, voordat zij aan de slag kunnen met Generatieve AI, AI geletterd zijn om de veiligheid en democratische rechten van hun leerlingen te waarborgen (zie ook artikel 9, lid 5 op pagina 56 over het wegnemen van hoog-risico en artikel 13, lid 1 op pagina 59 over het interpreteren van systemen). Dit raakt ook de regels over de AVG. Het is daarom belangrijk dat de school haar werknemers instrueert over het adequaat gebruik (laten) maken van Generatieve AI. Dit zou in de praktijkcode onderwijs kunnen worden meegenomen. Het is echter zeker aan te raden dat een school binnen haar eigen identiteit een richtlijn opstelt voor haar personeel.

Tijdpad (p. 44 en p. 123)

Hieronder volgt een schema met de meest belangrijke data voor het basis- en voortgezet onderwijs.

Conclusie

De EU AI Act is een belangrijke verordening die de democratische rechten van haar burgers moet waarborgen. Het dwingt scholen en docenten kritisch naar hun gebruik van AI te kijken en het personeel op te leiden. Er moet gecontroleerd worden of AI-systemen voldoen aan de regelgeving en dat docenten en leerlingen AI geletterd zijn. Scholen die op tijd beginnen en een AI-functionaris aanstellen zullen niet veel tijd hoeven te besteden aan het voldoen aan deze wet. Daarom is het belangrijk dat scholen nu een AI-functionaris aanstellen die een plan gaat schrijven voor de implementatie van deze EU Verordening op school. De tijd van verwondering en wegduiken is nu echt voorbij zijn en scholen moeten hun verantwoordelijkheid nemen om de veiligheid en privacy van hun leerlingen te waarborgen. Pas als dat is gebeurd, kunnen we verder kijken of en hoe AI het onderwijsproces kan verrijken.

UPDATE: Leeftijd om Gemini te gebruiken is 16 jaar (geen 18): Google Gemini

audiofeedback: een waardevolle vorm van feedback

Het begon allemaal op een donderdagmiddag in een pauze. Ik had vier dagen de tijd om ongeveer 90 essays van feedback te voorzien. Ik was al fier begonnen met een aantal toen er een idee binnensloop: wat als ik het gewoon inspreek en de leerlingen het laat opschrijven? De deur stond open en een collega maakte een grap over hoe ik in het lege lokaal voor me uit zat te staren. Ik legde mijn idee uit en zijn eerste reactie was: ‘daar zit eigenlijk best wel wat in.’ Een nieuw idee had voedingsbodem gevonden.

hoe ik feedback geef

6VWO moet een (pre-)academisch essay schrijven (met pen en papier) over een onderwerp in een 100-minutentoets in de toetsweek. Gedurende de module doorlopen we elk onderdeel van het essay. Er zijn lessen over de introductie, de hoofdtekst, de conclusie, en andere zaken. Daarbij leer ik ze een eenvoudige basisstructuur. Elke les schrijven ze een onderdeel van een essay dat via peer review van feedback wordt voorzien. Dit gebeurt iedere keer via een single-point rubric. Aan het einde van de lessenserie schrijven leerlingen in twee lesuren (2×50 minuten) een volledig essay. Deze voorzie ik van feedback.

Omdat dit een volledig eindproduct is, besteed ik altijd veel tijd aan het geven van feedback. In de eerste plaats gebruik ik een kleurencodering voor de verschillende elementen van het essay. Als dat onderdeel goed is, zet ik in die kleur een krul. Als ik commentaar heb, schrijf ik het commentaar in die kleur. Ik heb een ‘algemene kleur’ voor feedback die niet gaat over deze elementen, waaronder spelling- en grammaticafouten. Aan het einde schrijf ik vaak een kort lijstje met verbeterpunten.

Ik heb in het verleden codes gebruikt die verwezen naar grammatica- of spellingsfouten. Leerlingen moesten dan zelf via de code achterhalen wat hun fout was. Echter, dit werd niet veel gedaan en kostte mij uiteindelijk meer energie en tijd in het onthouden van toekennen van de codes.

audiofeedback geven: het proces

Het proces van audiofeedback geven is vrij simpel. Ik pak een essay, zet mijn voice recorder aan (de Sony ICD-PX470), en begin met lezen. Terwijl ik lees denk ik hardop na, verbeter fouten, doe suggesties, en vertel ik wat ik van het essay vind. Aan het einde schrijf ik voor Style & Contents en Spelling & Grammar een +, een –,  of een ±. Voor deze twee onderdelen krijgen leerlingen namelijk een deelcijfer op de toets. Echter, ik wil geen fictieve cijfers geven voor proefessays. Ervaring heeft geleerd dat leerlingen te veel gefocust zijn op het cijfer en minder open staan voor feedback als het voldoende is. De plussen en minnen geven een indruk zodat ze wel weten hoe het over het algemeen is gegaan. Ik schrijf verder geen feedback op de blaadjes.

De opnamen duren ongeveer 8-12 minuten. Na vijf essays zet ik de bestanden op mijn laptop, voorzie ik ze van een klasnummer en naam, en neem ik een korte pauze van een paar minuten. Wanneer ik alle bestanden heb, stuur ik ze naar de leerlingen via een persoonlijk bericht op Teams Chat.

Leerlingen moeten de eerstvolgende les hun telefoon met koptelefoon of oordopjes meenemen (bij ons mag alleen klas 5/6 een telefoon bij zich hebben en in de les mogen ze alleen gebruikt worden voor educatieve doeleinden; wij hebben geen laptops of tablets voor onze leerlingen, wel vier computerlokalen).

In de les laat ik de tafels een halve meter uit elkaar zetten (dit doe ik altijd als ik wil dat leerlingen zelfstandig, gefocust moeten werken). Ik leg uit dat leerlingen moeten luisteren naar de feedback en mee moeten schrijven op hun proefessay blad. Ook krijgen ze een feedbackformulier waar ze een samenvatting kunnen maken van alle feedback. Leerlingen mogen de opname pauzeren of terugspoelen.

Ik deel de essays en het feedbackformulier uit en leerlingen zetten hun koptelefoon op. Leerlingen mogen vragen stellen tijdens de feedbacksessie. De ene klas deed dit meer dan de ander, maar ik kon direct extra uitleg geven als leerlingen een vraag hadden over mijn feedback.

Leerlingen die geen koptelefoon hadden, moesten de opdracht thuis maken. Zij werkten in stilte in een opdrachtenboekje over sentence grammar of aan hun Cambridge examen. Wanneer leerlingen klaar waren met het verwerken van de feedback, werkten zij ook, zelfstandig en stil aan sentence grammar of Cambridge. Het verwerken van de feedback duurde gemiddeld per leerling ongeveer 20-25 minuten.

reflectie op het proces

Een goede rekenaar zal hebben uitgerekend dat 90 essays (drie klassen) van elk gemiddeld 8 minuten audiofeedback, werk oplevert van ongeveer 12 uur. Dit heb ik verdeeld over vier dagen. Ik zal zeker niet ontkennen dat dit veel is. Echter, als ervaren docent heb ik minimale lesvoorbereiding voor mijn klassen. De twee lesuren van elk 50 minuten waarin ze hun essay schrijven was tien minuten voorbereiding in het bedenken van drie onderwerpen. Ook heb ik veel bovenbouwklassen met geen schriftelijke overhoringen in de module zelf. We weten dat onderwijs meer is dan alleen lesgeven en als die drie uur feedback per klas waardevol is en past binnen mijn werkuren, vind ik die 12 uur niet gek. Net als de ICT-wereld kent het onderwijs nu eenmaal piek- en dalmomenten.

Het opnemen via een fysieke voice recorder vond ik zeer prettig. Het gaf ruimte op mijn bureau en het ging heel snel. De geluidskwaliteit was prima. Ik had ook gebruik kunnen maken van een simpele voice recorder op mijn laptop of een programma zoals Audacity, maar dit voelde beter en minder gedoe. De bestanden konden, vanwege een uitschuifbare USB-stick, makkelijk op mijn laptop worden overgezet.

Ik had geen vaste methodiek voor het geven van de feedback. Ik begon altijd wel met de klas en naam van de leerling. Daarna keek ik vluchtig naar de brainstorm van leerling (als die er was), ik scande het essay, gaf kort commentaar op een aantal opmaakregels die verplicht zijn bij de toets en begon dan met lezen. Terwijl ik las gaf ik direct commentaar op wat ik las. Ik zei wat ik dacht. Dit zorgde er soms voor dat ik iets verkeerd las en mijzelf moest herstellen, maar dit leverde wel meer authenticiteit op en dat er blijkbaar verwarring ontstaat bij de lezer.

Wat ik vooral heb gemerkt bij geven van audiofeedback, is dat ik minder (lang) stil sta bij grammatica- en spellingsfouten. Ik benoem ze wel, maar neig veel meer naar feedback op structuur en zinsopbouw. Ik geef ook suggesties hoe je iets beter zou kunnen verwoorden. Daarnaast geeft audiofeedback meer ruimte om uitgebreider over het essay als geheel te praten. Het helpt dat we in de lessen ieder onderdeel van het essay stap voor stap al hadden doorgenomen zodat ik daarnaar kon verwijzen.

Alle leerlingen, zonder uitzondering, zijn serieus aan de slag gegaan. Eén keer heb ik aan het begin een groepje jongens gewezen op het feit dat ze niet mogen praten of overleggen (toegegeven het was half vijf). Verder was iedere leerling op zijn of haar manier feedback aan het opschrijven op het essay en het feedbackformulier. Het was interessant om te zien dat de ene leerling al beter wist hoe dit goed te doen en de ander wat meer moeite had.

Ik heb bij alle klassen de les ongeveer 8 minuten voordat de bel ging afgesloten. Dit gaf leerlingen de ruimte om (informeel) met elkaar over de feedback te praten. Ik gaf deze instructie niet, maar je zag dat veel leerlingen graag wilde delen welke feedback ze hadden gehad op hun essay. Ook gaf het mij de ruimte sommige leerlingen persoonlijk te peilen hoe de feedback was geland en of ze nog vragen hadden.

de voor- en nadelen

De voordelen van audiofeedback zijn:

  • Je kunt in kortere tijd meer informatie delen met de leerling.
  • Het is, naar mijn ervaring, minder intensief dan met pen feedback geven (en veel minder omslachtig dan feedback typen).
  • Je laat leerlingen actief met de feedback omgaan in plaats van passief de feedback te laten lezen.
  • Je krijgt de ruimte om de leerling persoonlijk aan te spreken alsof hij of zij naast je zit. Dit levert, naar mijn mening, rijkere en meer persoonlijke feedback op en kan de band met de leerling versterken.

De nadelen van audiofeedback zijn:

  • Het vraagt nog steeds veel tijd bij het geven van feedback.
  • Je moet als docent goed in de stof zitten. Je moet in het moment feedback geven en hebt weinig tot geen tijd om iets op te zoeken.
  • Met audiofeedback stel je jezelf kwetsbaarder op dan met schriftelijke feedback. Ik geef feedback in het Engels en ik maak wel eens een foutje in het Engels. Ook krijgen leerlingen een bestand met jouw stem. Dat kan een docent een minder prettig gevoel geven. Je weet niet wat ze ermee zouden kunnen doen.

de feedback van leerlingen

Ik heb aan het einde van de les aan de leerlingen gevraagd of ze schriftelijk en anoniem hun feedback konden geven op audiofeedback. Ik had drie vragen op het bord geschreven:

  1. Was the feedback you received helpful?
  2. Would you prefer audio feedback over written feedback? Why / why not?
  3. Do you have any tips or advice?

Niet alle leerlingen waren aanwezig, maar in totaal hadden twee leerlingen van de drie klassen voorkeur voor schriftelijke feedback en drie leerlingen gaven aan dat er geen verschil was tussen schriftelijke feedback en audiofeedback. Hier kom ik later op terug. Hier volgt een selectie van de positieve feedback van de rest:

Yes, because you give more context and explain better what the problem is. Also, hearing the feedback makes it more memorable and engaging causing me to better understand my mistakes and how to fix them.

 

I liked this way of feedback because I looked at it more than usual. If it were written, I would have given it a quick scan.

 

It was more clear and it was helpful to hear more feedback than you normally get. It was also good to write it down myself so I can filter what I find helpful and have a clear list.

 

Yes, this way you can provide more nuanced feedback.

 

Because you have to write the feedback yourself, you’re more involved with it and therefore you learn the feedback better.

 

Because I can hear the thought process behind it, which explains a lot more.

 

Because you get more in depth feedback which you cannot get with when written.

 

Elke zin wordt gecontroleerd.

 

Hierdoor is het uitgebreider en begrijp je alle fouten die je hebt gemaakt. Je kunt ook zelf aantekeningen maken op een manier die je zelf goed begrijpt.

 

I found the feedback really helpful, I got better insight into how you felt about my essay compared to normal feedback on paper. It’s also your first impression of the essay, which makes it honest and real.

 

It is less structured, but it explains the process that you would have gone through when grading the essay. This is helpful because it gives complete ideas about what can be improved for a higher mark.

 

I find this form of feedback better because the reasons as to why something is wrong are clearer to me.

 

I’m now writing actively with the feedback.

 

Yes, because there is better interaction with the student. Normally I just skim the feedback and as you can see, my essays don’t really improve a lot.

 

It is less boring than on paper.

 

I could also hear how bad my handwriting is to read. I will try to improve it for the test!

 

When the feedback is spoken, I can actually hear your thought process instead of just seeing a mark.

 

Hearing your thoughts is way more helpful than just seeing some corrections.

 

When reading feedback I tend to glance over it, this required more attention.

 

Yes, it is easier to explain thoroughly when talking, it gives more space to elaborate. And it does make you pay more attention to the feedback.

 

Because like this I think about my mistakes a lot more. I actually analyse it all instead of just reading it.

 

Yes, it was more and you gave more examples how to do it better.

 

It is different and it takes a bit more time to look over it but you do look better at your essay.

 

De negatieve feedback geef ik met reflectie:

Because I did the same as the teacher, writing down the mistakes. While interesting, the inner/outer thoughts weren’t that useful. (Keep innovating!)

 

I personally like it better when it is written out, but I do think this way gives a lot more context and extra info. I guess both are good.

 

I think it is better when you just write it down because you know better how to write down feedback than me.

 

Written down may be better, because you don’t need to search or locate what you’d like.

 

I find it difficult to correct myself sometimes.

Een deel van de negatieve feedback heeft te maken met onzekerheid over hoe je feedback opschrijft. Dit lijkt mij een belangrijke studievaardigheid die zou moeten worden opgenomen in het schoolprogramma. Het zou zeker helpen om leerlingen een voorbeeld te laten zien. In klas 5 experimenteer ik met analytisch en actief lezen van non-fictie; het opschrijven van je gedachten terwijl je leest. Ook hier zie ik grote verschillen tussen leerlingen. De één lukt het al vrij goed, de ander weet totaal niet waar te beginnen en wat op te schrijven. Ook zullen voorbeelden helpen voor meer ‘scaffolding’. Dit materiaal ben ik nu ook aan het verzamelen voor volgend jaar.

Het lokaliseren van de feedback kan misschien bij dat specifieke essay rommelig zijn geweest. In principe volg ik het essay. Soms ga ik terug naar het begin van een alinea en dan probeer ik dat wel te benoemen ( “Let’s go back to the beginning of the paragraph”).

Op vraag 3 werd weinig feedback gegeven. Dit is wat er wel werd gezegd:

Maybe a short list of what the main things are to improve.

 

Give ways to practice.

 

Maybe some short notes while speaking.

 

Maybe try to scan it once before giving feedback.

 

Elaboration on the grade itself.

 

Maybe a short summary with the biggest points of criticism. A tip, also for your time, it could be a lot shorter and maybe more concise if you first read through the essay and after that just sum up some points. For me that would already have been enough and it would save you time.

 

Maybe sending it via a different app so we can speed it up.

Om met de laatste te beginnen, deze leerling heeft het over versneld afspelen (x1.25 / x1.5) van de opname. Dit is steeds meer een fenomeen bij het het luisteren van audioboeken en YouTube video’s. Persoonlijk ben ik hier terughoudender in. Zelf doe ik het soms wanneer iemand behoorlijk langzaam praat, maar als je een opname te snel afspeelt, is er minder ruimte voor reflectie. Echter, in principe hebben ze een mp3-bestand van mij gekregen en kunnen deze downloaden en openen in de app van hun voorkeur.

Ondanks dat ik dus geen voorstander ben van een focus op cijfers, snap ik de feedback van de leerling wel (cijfer is in deze die + / -). Wat de leerling, denk ik, eigenlijk vraagt is hoe verhoudt die score zich tot de feedback? Wat is de relatie tussen beide scores en de punten die worden benoemd. Niet iedere fout telt even zwaar mee.

Ik kan verbaal een kort overzicht geven van de belangrijkste punten die ik heb gevonden, en soms heb ik dit ook gedaan. Schriftelijk zou ik niet doen. Dit is een vaardigheid die leerlingen zich eigen zouden moeten maken. Hier en daar een aantekening zal ik overwegen.

Tips hoe en waar je meer kunt oefenen ga ik zeker meenemen voor een volgende keer. Ik heb veel materiaal. Het is alleen een kwestie van het aanbieden en op een duidelijke manier naar verwijzen.

Louise Taylor, docent en onderzoeker aan de Universiteit van Amsterdam, was hier drie jaar geleden al mee bezig en geeft een heldere uitleg hoe zij het heeft gedaan en hoe het op studenten overkwam. Ik zie veel overeenkomsten.

vervolgles

Het viel mij op dat veel leerlingen moeite hadden met structuur binnen alinea’s (micro structure). Ook zag ik weinig brainstorms (het kan zijn dat een aantal deze op een ander blaadje had gemaakt). De eerstvolgende les heb ik daarom leerlingen geleerd hoe ze een opdracht moeten ontrafelen (deconstruction), hoe en hoe lang ze moeten brainstormen (getting ideas), en hoe ze een outline van de brainstorm moeten maken (making choices and creating structure). Het is ook niet zo vreemd dat ik juist dit wilde oppakken. Zoals ik al eerder had aangeven, zorgt deze manier van feedback geven voor een (deel onbewuste) neiging naar een focus op structuur en opbouw in plaats van spelling- en grammaticafouten.

feedback via ChatGPT

Er werd op LinkedIn ook de suggestie gegeven om ChatGPT te gebruiken om feedback op essay te geven. Hier heb ik zeker al een mening over, maar zal het uitproberen. Ik heb een aantal essays gescand en zal deze maand onderzoek doen. Hierover komt later nog een apart artikel.

hoe nu verder

Het is zeker niet zo dat ik vanaf nu al mijn feedback verbaal wil geven. Het blijft een intensieve methode. Ik zou deze vorm van feedback vooral gebruiken bij het eindproduct (mits het een diagnostische opdracht is en geen summatieve toets). Voor kortere opdrachten zou ik nog steeds inzetten op peer feedback door middel van een single-point rubric. Wel is het zo dat het audiofeedback een waardevolle vorm van feedback geven is en het zeker verdient uitgeprobeerd te worden.

GenAI maakt programmeurs dommer: een les voor het onderwijs

Er is nog weinig onderzoek gedaan naar de leereffecten van GenAI in het onderwijs. Dat is ook niet zo vreemd aangezien het nog in haar kinderschoenen staat. Het is daarom goed om te kijken wat er bij domeinen die al langer gebruik maken van AI gebeurt. Één van die domeinen is softwareontwikkeling, met in het bijzonder GitHub. Hier zullen we zien dat de risico’s die ik besprak in mijn vorige artikel over Generatieve AI in het onderwijs ook worden gezien in de wereld van programmeren.

GitHub

GitHub is een platform waar ontwikkelaars en programmeurs programmeercodes ontwikkelen, bewaren, en delen. In 2018 werd GitHub overgenomen door Microsoft en in 2021 werd GitHub Copilot geïntroduceerd, een versie van Microsofts GenAI Assistent Copilot, gespecialiseerd in het schrijven en controleren van code. Een belangrijke functie is de autocomplete waarbij Copilot suggesties doet om code, geschreven door een programmeur, af te maken. Dit is vergelijkbaar met de autocomplete in Word maar dan natuurlijk veel uitgebreider.

Via een YouTube video van ThePrimeTime kwam ik op een artikel van softwareontwikkelaar, Darren Horrocks. Hij schreef begin september een artikel over de gevaren van veelvuldig gebruik van GitHub Copilot door programmeurs. Deze zorgen sluiten aan bij wat de cognitieve wetenschap ons vertelt over leren, kritisch denken, en creativiteit. In zijn artikel “Why Copilot is Making Programmers Worse at Programming” bespreekt Horrocks zijn zorgen over het gebruik van GitHub Copilot.

De kritiek van Horrocks gaat over het eroderen van kennis en daarmee kritisch en creatief kunnen denken bij ontwikkelaars, een te grote afhankelijkheid van zowel het product als het bedrijf daarachter, een gebrek aan eigenaarschap en daarmee verantwoordelijkheid, het verkleinen van leermogelijkheden, en een misplaatst gevoel van meesterschap bij programmeurs.

van kennis naar kopiëren

Horrocks geeft aan dat door de komst van Copilot programmeurs steeds minder kennis over code en coderen ontwikkelen. Daar waar zij in het verleden de onderliggende structuur moesten kennen om problemen op te lossen, kunnen ze nu automatisch gegenereerde stukjes code door Copilot laten schrijven. Dit klinkt als een verrijking, zeker als je alleen naar de eindoplossing kijkt. Voor de (kennis)ontwikkeling van programmeurs kan echter dit problematisch worden, niet in de minste plaats omdat we voorlopig nog niet zonder programmeurs kunnen. We creëren een wereld waarin de fouten van AI niet meer opgemerkt worden door softwareontwikkelaars.

Omdat programmeurs niet meer kennis opbouwen over programmeren en programmeercodes, zijn zij minder in staat om kritisch en creatief te denken over softwareontwikkeling. De oplossingen die door Copilot worden aangedragen zijn niet altijd het meest optimaal en kunnen ook fouten bevatten waardoor er veiligheidsrisico’s kunnen ontstaan. Omdat Copilot code op het eerste gezicht werkt, zijn programmeurs minder geneigd goed onderzoek te doen naar de gevolgen voor de lange termijn. Er ontstaat een blind vertrouwen in AI en daarmee een vermindering van eigenaarschap en een gevoel van verantwoordelijkheid: “De AI heeft het gegenereerd, dus moet het kloppen.”

Echter, het is nog helemaal niet zeker dat we geen programmeurs nodig zullen hebben op de korte tot middellange termijn, sterker nog, we hebben er waarschijnlijk meer nodig. Er is nog steeds die kritische blik nodig bij het ontwikkelen en controleren van software. Copilot maakt nog steeds fouten en die fouten moeten door mensen nog steeds opgelost worden. Echter, die kritische blik wordt steeds minder scherp door een gebrek aan domeinkennis.

Ook in het onderwijs zullen we een gemakzucht naar kennis zien als we Generatieve AI argeloos inzetten en kennisverwerving inruilen voor AI-verwondering. Leerlingen (en ook docenten) zullen zich meer richten op het eindproduct en niet op de ontwikkeling van de leerling. Waarom nog zelf denken als GenAI het antwoord kan produceren?

gemak boven geploeter

Wanneer een AI als Copilot je een oplossing aanreikt, ben je minder geneigd om het zelf te willen leren. Leren doet immers pijn en kost energie. Het is gemak tegenover hard werken en wij mensen zijn over het algemeen geneigd gemak boven geploeter te kiezen. Copilot geeft een kortere route naar het antwoord waardoor programmeurs niet dieper gaan nadenken over het waarom van een oplossing. Dit kwam ook naar boven in het onderzoek “Generative AI Can Harm Learning” waar een GPT Base assistent antwoorden gaf in het leerproces en daarmee een negatieve invloed had op de leerprestaties van leerlingen.

Dit ‘voorzeggen’ zorgt ook voor een vernauwing van creatief denken. Niet alleen zorgt een gebrek aan kennis voor een vermindering aan creativiteit bij ontwikkelaars, dat wat AI voorzegt zijn vooral suggesties uit bekende patronen. Het is immers een voorspelmachine op basis van een dataset uit het verleden. GenAI kan niet out-of-the-box denken. De angst is dan ook dat overmatig gebruik van AI ertoe zal leiden dat programmeren meer een mechanisch proces wordt in het accepteren van suggesties in plaats van ‘een creatieve zoektocht dat grenzen verlegt,’ aldus Horrocks.

voorbeeld hoe GitHub Copilot werkt, <https://github.com/features/copilot>

afhankelijkheid

Deze afhankelijkheid van AI loopt door naar de bedrijven achter de modellen. Omdat programmeurs steeds meer kennis ontbeert, zullen zij Copilot nodig blijven hebben in hun werk. Dit wordt problematisch als het gereedschap later gebreken vertoont, de gebruikersvoorwaarden worden veranderd, of het te duur begint te worden. Je maakt jezelf als programmeur afhankelijk van een commercieel product; je raakt ‘locked-in’.

Studenten kunnen gratis gebruik maken van GitHub Copilot waardoor zij meegenomen worden in de afhankelijkheid van de GenAI van Microsoft. Het zou voor hen beter zijn in eerste instantie op eigen benen te kunnen staan alvorens Copilot te betrekken bij hun werkzaamheden. Echter, afhankelijkheid creëren is lucratief voor bedrijven en het is hen er alles aangelegen om gebruikers aan te trekken en vast te houden.

een vals gevoel van meesterschap

Als laatste kan het gebruik van Copilot een vals gevoel van expertise geven. Dit wordt problematisch wanneer deze programmeurs doorgroeien naar meer complexe opdrachten waar fundamentele programmeerkennis van vitaal belang is.

Dit valse gevoel van expertise is vergelijkbaar met leerstof herkennen in plaats van kennen. Leerlingen die leerstof herlezen krijgen vaak een vals gevoel van meesterschap. Ze herkennen het materiaal maar kunnen het niet reproduceren zonder bron. GenAI is permanente scaffolding waarbij gebruikers afhankelijk blijven van het hulpmiddel en niet zelfstandig leren denken. Leerlingen leren niets anders dan het verplaatsen en laten verwerken van data.

aangeleerde hulpeloosheid

ThePrimeTime heeft het over ‘aangeleerde hulpeloosheid’ in het gebruik van GitHub Copilot. Wat wij moeten voorkomen is dat we leerlingen opleiden tot burgers die afhankelijk zijn geworden van AI om goed te kunnen functioneren in de maatschappij. Dat gaat verder dan dat we dit in het onderwijs benoemen, maar moet expliciet worden meegenomen in curriculumontwikkeling en lesontwerp.

De oudere generatie heeft via een traditioneel onderwijssysteem veel kennis eigengemaakt voordat ze aan de slag gingen met GenAI. Zijn beseffen vanwege hun kennisbias niet (voldoende) wat jongeren niet weten en welke gevolgen dat heeft in hun ontwikkeling en functioneren in de maatschappij.

Daarom is een goede voorbereiding op de onbekende toekomst gericht op het ontwikkelen van uitgebreide kennis bij jongeren in plaats van alleen te leren hoe de knoppen van een softwareproduct werken. Dat product kan alleen kritisch en creatief worden gebruikt als ze domeinkennis hebben. Zo niet, dan zal je, aldus Horrocks, nooit iets anders kunnen dan wat een robot al kan doen.

Wat voegt Generatieve AI nu eigenlijk toe aan het onderwijs?

30 november 2022, ChatGPT wordt gelanceerd door OpenAI en zette de wereld op zijn kop. Het onderwijs kan niet anders dan hierin meegaan. We kunnen de ontwikkelingen niet tegenhouden en zullen ons aan moeten passen aan de dans van Big Tech. Of moeten wij dat eigenlijk wel?

In alle discussies rondom Generatieve AI in het onderwijs wordt de meest cruciale vraag maar zelden gesteld: hoe sluit dit aan bij onderwijsonderzoek, bij dat wat, in grote lijnen, werkt in het leerproces? Welke onderdelen uit het leerproces ondersteunt AI nu eigenlijk? En waar zal het onze kinderen dommer en daarmee afhankelijker maken? Het is tijd voor een kritische noot.

Vormen van AI

Sinds 2022 kennen we AI vooral van ChatGPT, maar we hebben al veel langer AI in ons leven. Er zijn al geruime tijd chatbots die klanten helpen zoals bijvoorbeeld ‘Billy’ bij Bol, maar ook YouTube suggesties worden uitgevoerd door AI. Banken werken al lange tijd met AI en het toeslagenschandaal in Nederland was mede door het gebruik van voorspellende AI ontstaan. Op je telefoon zit al lange tijd AI om processen te verbeteren en een stofzuigerrobot werkt ook op AI. Voor nu kijken we alleen naar een specifieke AI: Generatieve AI (GenAI), AI zoals deze wordt toegepast in bijvoorbeeld ChatGPT.

Hoe werkt GenAI?

GenAI onderscheidt zich door originele inhoud te creëren naar aanleiding van een opdracht, beter bekend als een prompt. GenAI kent een lange geschiedenis maar om beetje een beeld te krijgen wat het min of meer is en doet volgt hier een simplistische uitleg.

GenAI, zoals ChatGPT, genereert (de ‘G’ in GPT) nieuwe inhoud naar aanleiding van een prompt, een opdracht vaak in tekst. Het gebruikt hiervoor een voorgeprogrammeerde dataset (de ‘P’ in GPT). Omdat taal complex is en de AI alleen met (reeksen van) getallen kan werken, heb je een transformer nodig (de ‘T’ in GPT). De transformer vertaalt tekst naar getallen en getallen naar tekst.

GenAI verwerkt die reeksen van getallen in een neuraal netwerk (genaamd Large Language Model [LLM] voor ChatGPT) dat vergelijkbaar is met hoe onze hersenen werken. In dat netwerk voorspelt de AI welk woord volgt na welk ander woord om een logische zin te maken. Als je in zou voeren “De kat is een…” zal GPT dat hoogstwaarschijnlijk aanvullen met ‘dier’, maar dit kan natuurlijk veel complexer tot korte verhalen en complete programmeercode om een app te maken. Deze uitkomsten ontstaan door middel van berekeningen in een ‘black box’. Niemand kan in kaart brengen hoe GenAI exact tot een product is gekomen. Men heeft alleen invloed op de dataset.

In GenAI wordt een woord, stuk tekst, of leesteken omschreven als een token. Om een enkele token te genereren, moet ChatGPT ongeveer een biljoen berekeningen maken. GenAI vraagt dus om veel rekenkracht en daarmee energie.

Welke vormen van GenAI zijn er?

Bij het grote publiek is vooral ChatGPT bekend. ChatGPT is ontwikkeld door stichting OpenAI (dat op het punt staat zichzelf om te vormen tot een commercieel bedrijf met winstoogmerk), maar er zijn ook andere aanbieders. Er is Claude van oud-medewerkers van OpenAI, Llama, de open source GenAI van Meta, het bedrijf achter Facebook, Gemini van Google, het Franse Mistral AI, en nog vele Open Source initiatieven.

Je hebt ook GenAI specifiek voor afbeeldingen zoals Midjourney en Pixlr. Suno genereert liedjes in een muziekstijl naar keuze en Github Copilot helpt bij programmeren. Daarnaast hebben modellen zoals ChatGPT de mogelijkheid om toepassingen (add-ons) gebruik te laten maken van de rekenkracht van ChatGPT.

De lucratieve onderwijsmarkt

Met huidige ontwikkelingen van GenAI lijken de mogelijkheden eindeloos. We zouden nog maar een glimp gezien hebben van wat ons te wachten staat en de wereld zal een grote verandering doormaken. Echter, deze verafgoding van IT hebben we al eerder gezien. De meeste recente hypes waren Big Data en Virtual Reality en deze hypes zijn ook afgevlakt. En kent iemand nog de Steve Jobs/iPad-scholen? De resultaten van GenAI zijn indrukwekkend, maar achter de façade van verwondering schuilt ook een verdienmodel en zelfs een grens lijkt, voorlopig, in zicht.

Al decennia proberen IT-bedrijven grip te krijgen op de lucratieve onderwijsmarkt. Was het vroeger vooral jonge gebruikers gekoppeld te krijgen aan Google, Microsoft, of Apple-diensten, nu gaat het om controle van het onderwijsproces door middel van de producten die zij verkopen.

Als docent word je dan overgeleverd aan het algoritme van het model en fungeer je meer als coach of faciliteerder in plaats van een onderwijsexpert. Het model, en het bedrijf achter dat model, bepaalt in grotere mate de inhoud en het onderwijsproces. Echter, “[AI] kan het onderwijs beperken tot alleen datgene wat AI kan verwerken, modelleren en leveren.” (UNESCO).

Hallucinaties

Omdat GenAI zichzelf aanstuurt aan de hand van een zeer grote dataset, komt het wel eens voor dat GenAI feiten verdraait of verzint. GenAI is dan ook niets anders dan een voorspelmachine. Het begrijpt niet wat het zegt en maalt niet om waarheid. Het aanbieden van onjuiste informatie wordt ‘hallucineren’ genoemd: het presenteren van een onsamenhangend antwoord of in volle overtuiging verkeerde informatie geven. Bedrijven proberen dit te voorkomen door ‘fine-tuning’ en hard gecodeerde regels. In het eerste geval krijgt het model een beperkte extra dataset om bij te sturen. In het tweede geval krijgt het model instructies wat te doen bij bepaalde invoer: als dit, doe dan dat.

In beide gevallen oefent het bedrijf invloed uit op de uitkomsten die niet zichtbaar zijn voor de eindgebruiker. We varen dus niet alleen blind op de zee van het algoritme, het is Big Tech die onzichtbaar aan het roer staat om bij te sturen. Gezien de grote invloed GenAI heeft en gaat hebben in onze informatievoorziening, vormt dit een substantieel gevaar voor onze democratie. Grote bedrijven zijn niet politiek neutraal en hebben belang bij wet- en regelgeving. De positie van Elon Musk bij de verkiezingen in Amerika dit jaar laten duidelijk zien dat er grote belangen spelen bij Big Tech.

Het is aan leraren om de hallucinaties van GenAI in het onderwijs bij te sturen. Dit betekent dat de leraar vaak moet controleren of zijn of haar leerlingen wel de juiste informatie krijgen. De leraar moet dus het leerproces constant monitoren en bijsturen waar AI de mist in gaat. Dit verandert niet alleen de rol van de leraar, maar zal er ook voor zorgen dat de leraar uiteindelijk meer werk te doen heeft. Zij is echter dan wel haar handelingsvermogen kwijtgeraakt. Of zoals Joop Berding zegt: “Je krijgt een ontwikkeling waarbij de leidende vraag niet meer is ‘hoe kunnen we zorgen dat de middelen die we inzetten ons helpen bij ons doel’, maar meer van ‘hoe moet het onderwijs er eigenlijk uit zien zodat die middelen hun werk kunnen doen?’”

Datasets

GenAI wordt getraind door middel van datasets. De legaliteit van deze datasets wordt steeds meer ter discussie gesteld. Zo zijn meerdere visuele GenAI modellen getraind op afbeeldingen van artiesten zonder hier toestemming voor te vragen. The Times klaagde OpenAI en Microsoft al in 2023 aan voor het gebruik van duizenden van haar artikelen voor het trainen van hun GenAI model. Ook worden er nu transcripties van YouTube video’s gebruikt om GenAI te trainen zonder dat hier toestemming voor is gegeven door de makers van deze video’s.

Datasets leveren niet altijd feitelijke informatie. Een dataset is bij elkaar geschraapte informatie waar feit en fictie gelijkwaardig zijn. Vooroordelen en complottheorieën zijn meegenomen in die datasets. Datasets kunnen dasn vervuild zijn.  Google heeft data van Reddit gekocht, een internetforum waar het niet altijd om waarheid gaat, Meta gebruikt posts op Facebook en Instagram om zijn GenAI Llama te trainen, en Elon Musk gebruikt X posts om zijn Grok GenAI te trainen. Social media geven niet een goed beeld van de werkelijkheid. Toch wordt GenAI getraind op data van deze platformen. Het gaat allemaal om het herkennen van patronen, ongeacht of die patronen feitelijk juist zijn. Daarnaast raakt de internetdata om GenAI te trainen rond 2026 op en wordt er nu al data gegenereerd door GenAI om GenAI te blijven trainen.

We hebben al gezien dat bedrijven in extreme gevallen moeten bijsturen en de uitkomsten van GenAI moeten manipuleren door middel van fine-tuning en harde codering. Deze bijsturing zal in ieder geval nog voorlopig moeten plaatsvinden simpelweg omdat GenAI niet de natuurkundige wetten van de wereld begrijpt. “LLM’s leren immers op een manier die tegengesteld is aan die van mensen. Deze modellen beginnen met het leren van taal. Daarna proberen ze die kennis te gebruiken om abstracte concepten te begrijpen. Menselijke baby’s, daarentegen, leren eerst concepten en vervolgens de taal om die te beschrijven.”

GenAI blijft in de kern een voorspelmachine. Het heeft data uit het verleden nodig om een voorspelling te doen als antwoord op een prompt. In het klein is dat de berekening van een token, in het groot is dat een tekst of afbeelding bestaande uit duizenden tokens. Indrukwekkend, maar nog steeds een numerieke voorspelling op basis van vervuilde datasets.

GenAI heeft ook een andere insteek voor waarheidsvinding. GenAI creëert een werkelijkheid op basis van patronen vanuit data uit het verleden. Dit is anders dan hoe onze wetenschap veelal werkt. Wetenschap komt tot waarheidsvinding door middel van onderzoek, veelal, in het heden. We krijgen nieuwe kennis door het uitvoeren van experimenten. Daarnaast is het fundament van wetenschap het stellen van kritische vragen en peer reviews. Wetenschappelijke waarheidsvinding wordt continu gecontroleerd. GenAI kan niet gecontroleerd worden omdat we geen idee hebben hoe de ‘black box’ tot een antwoord is gekomen. Resultaten kunnen ook niet gereproduceerd worden, omdat de uitkomsten iedere keer weer anders zijn. De validiteit van (Gen)AI-onderzoek is dan ook moeilijk te controleren. GenAI vraagt daarmee om, bijna religieus, blind vertrouwen.

Data degeneratie

Een ander gevaar is data degeneratie, of modelinstorting. GenAI neemt in kwaliteit af als het traint op GenAI data (en het kost ook meer energie). Het internet raakt steeds meer vervuild met AI-genereerde inhoud. Nieuwe generaties GenAI worden dan getraind op die GenAI-inhoud. Dit kopieerproces is te vergelijken met het recycleproces van papier, waar plastic de kwaliteit van papier vermindert. In zulke processen sluipt onzuiverheid zodat je eindproduct steeds meer in kwaliteit inlevert. Omdat GenAI sneller nieuwe afbeeldingen kan maken en tekst kan schrijven dan mensen, zal ons internet vol gaan staan met data dat niet door mensen is gemaakt, maar door machines.

Datadegeneratie bij Generatieve AI. Links een eerste generatie GenAI. Rechts een vierde generatie Generatieve AI gebaseerd op GenAI datasets. <https://ediscoverytoday.com/2024/08/26/degenerative-ai-what-happens-when-ai-trains-on-ai-data-artificial-intelligence-trends/ >

Koud water

GenAI is een ‘black box’ die voorspellingen doet op basis van datasets en wordt bijgestuurd door Big Tech. De uitkomsten van GenAI zijn indrukwekkend maar moeilijk te controleren op validiteit op hoe het tot die uitkomsten is gekomen. Het komt nog wel eens voor dat GenAI ernaast zit en gaat ‘hallucineren’. Dit betekent niet dat GenAI gemeden moet worden in het onderwijs. Het vraagt wel om een flinke plens koud water om uit de verwondering en uit de angst te stappen en het kritisch te benaderen.

Wat is (goed) onderwijs?

In de kern bestaat onderwijs om de jongere generatie voor te bereiden op de maatschappij (socialisatie). Hiertoe dienen zij in staat te zijn zich zelfstandig en kritisch op te stellen (subjectivering) door middel van basiskennis (kwalificatie) over die maatschappij en de wereld. Zij moeten ook in staat zijn samen te werken en anderen in hun waarde te laten (‘jouw vrijheid eindigt waar die van een ander begint’).

Onderwijs leert jongeren de wereld zoals wij hem kennen. Dit is de ‘erfenis’. Met deze erfenis leren jongeren waarom de wereld is zoals zij nu is, welke gevaren en successen de mensheid al heeft doorlopen, en welke inzichten tot nu toe zijn verworven. Het is dan aan de nieuwe generatie om de toekomst vorm te geven op basis van deze erfenis en hun inzichten weer over te dragen aan hun kinderen.

Je kunt alleen kritisch de toekomst vormgeven via het bezit van (domein)kennis. (Domein)kennis wordt verkregen via het eigen en inzichtelijk maken van informatie. Hoe meer informatie is eigen gemaakt als kennis in je langetermijngeheugen (opgeslagen als concepten en schema’s), hoe meer ruimte er overblijft in je werkgeheugen (kortetermijngeheugen) om kritisch en zelfstandig in de maatschappij te kunnen functioneren.

Het leren van feiten is nodig om tot concepten en schema’s te komen. Concepten beklijven, feiten raak je vaak onderweg kwijt. Echter, zonder die feiten was je niet tot dieper leren gekomen. Feitenkennis is en blijft dus cruciaal in het leerproces.

Beklijving van feiten, concepten, en schema’s vindt plaats door middel van ‘retrieval practice’: stof moet vaker terugkomen en opgehaald worden om verankerd te raken in het langetermijngeheugen. Vaardigheden worden daarnaast eigen gemaakt in een formatief proces. Toetsing meet van tijd tot tijd hoe de beklijving verloopt en geeft inzicht of bijsturing nodig is. Eindtoetsing blijft belangrijk als objectief meetinstrument om kwalificaties en beklijving van de ‘erfenis’ te waarborgen.

Onderwijs moet zich daarom vooral richten op het proces en niet op het eindproduct. Het eindproduct is een zichtbaar bewijs dat de leerdoelen zijn behaald. In een goed leerproces is het eindproduct meer een formaliteit dan een obstakel. Als dit wel het geval is, dan legt het eindproduct bloot dat er problemen in het leerproces zijn. Dit kan aan de leerling, de docent, of de methodiek liggen. Alle drie dienen dan kritisch bekeken te worden.

Welke plek heeft GenAI in het onderwijs?

(Basis en Voortgezet) Onderwijs dient er dus vooral voor om jongeren te vormen tot kritische en zelfstandige burgers. Hiervoor is kennisverwerving nodig. Hoe meer kennis iemand bezit hoe makkelijker, sneller, en dieper hij of zij nieuwe informatie kan beoordelen en tot zich kan nemen. Wanneer GenAI daarin kan ondersteunen, is zij welkom in het onderwijsproces. Als zij kennis onttrekt uit dat onderwijsproces, moeten leraren waakzaam zijn.

De gevaren van GenAI zijn betrouwbaarheid van informatie, de groeiende macht van Big Tech en hun invloed op het democratisch proces, de privacy van gegevensverwerking, het verlies van handelingsvermogen van de leraar, en het ontnemen van kennisverwerking bij leerlingen zodat zij minder kritisch en creatief kunnen denken. De vraag is dan, wat dient het onderwijs te ontwikkelen: GenAI modellen of de hersenen van onze jongeren?

In het GenAI tijdperk hebben we juist meer kennis nodig bij onze leerlingen willen ze kritisch GenAI kunnen benaderen. Wil je fake news en het zogenaamde ‘bullshitting’ van GenAI kunnen identificeren, dan moet je zelf ook een goed beeld van de wereld hebben, van topografie tot natuurkunde, van geschiedenis tot scheikunde. Dat hoeft niet in detail te zijn, dat hoeven niet eindeloze rijtjes feiten te zijn, maar concepten en schema’s waarmee je GenAI output alerter kan controleren.

Als onze leerlingen niet meer leren hoe ze hun eigen ideeën kunnen verwoorden, niet leren hoe ze tot eigen ideeën komen en ze communiceren, schuift de macht steeds meer naar Big Tech, die de poortwachters van informatie worden (en misschien al grotendeels zijn). De leerling offert dan alleen nog maar prompts op het GenAI-altaar om verwonderd te raken van het orakel en waarbij aflaten toegang geven tot meer mogelijkheden tot verwondering.

Waarom GenAI niet is zoals de introductie van de rekenmachine was

Er wordt wel eens gezegd dat de introductie van GenAI niet veel anders is dan de introductie van de rekenmachine: het vergemakkelijkt processen die niet meer noodzakelijk worden geacht zelf te doen. Zouden we deze theorie toepassen op GenAI dan zou je zoiets krijgen als, het vergemakkelijken van denken en het maken van teksten omdat dat dat tegenwoordig niet meer noodzakelijk is. Het zal echter kennis onttrekken uit het onderwijssysteem waardoor jongeren meer moeite hebben de wereld goed te begrijpen. Ook is GenAI output niet betrouwbaar daar waar een rekenmachine dat wel is

Zelf schrijven is het helder onder woorden brengen van wat je denkt. “Schrijven ordent en verheldert onze gedachten. Schrijven is hoe we ons een onderwerp eigen maken en begrijpen. Schrijven stelt ons in staat te ontdekken wat we weten – en wat we niet weten – over wat we proberen te leren.” (Zinsser). Als GenAI voor ons de teksten schrijft, in hoeverre weten we hoe we zelf denken? Schrijven brengt feitenkennis en inzichten in concepten bij elkaar. Het leert ons onszelf te begrijpen.

Daarnaast is ChatGPT gebruiken om informatie op te zoeken niet alleen inefficiënter dan je eigen hersenen, het belemmert dieper begrip. Immers, we kunnen maar 5-7 items vasthouden in ons kortetermijngeheugen. We hebben ons langetermijngeheugen nodig om dieper begrip te krijgen van complexe materie. Nieuwe informatie gepresenteerd door GenAI wordt verwerkt in het kortetermijngeheugen maar dat raakt dan snel te vol, de zogenaamde cognitieve overbelasting, waardoor we niet tot dieper inzicht komen.

Ook is het niet verstandig om onze kennis over te dragen aan Big Tech. Uiteindelijk blijven OpenAI, Claude, en Meta commerciële bedrijven met winstoogmerk en worden zij de nieuwe poortwachters van data en kennis. Het is belangrijker om de markt en hun aandeelhouders tevreden te houden, dan waarheidsvinding te waarborgen. Mogelijkheden worden opgeblazen en vernieuwingen moeten zo snel mogelijk worden doorgevoerd. De verwondering onder de (betalende) gebruikers moet in stand worden gehouden.

van verwondering naar een kritische benadering

We kunnen verwonderd raken over de mogelijkheden van GenAI en zullen in de toekomst nog vele wonderbaarlijke ontwikkelingen zien. Maar GenAI is van nature niet zonder fouten, sterker nog, het zit in de architectuur dat er fouten in het systeem sluipen, resulterend in de eerdergenoemde data degeneratie. Big Tech probeert dat nu steeds meer te verkopen als onderdeel van de magie omdat zij ook weten dat het niet helemaal zal verdwijnen.

Algoritmen zijn, naast het ‘black box’ principe, niet objectief of neutraal. Modellen zijn getraind op basis van wat ontwikkelaars hebben bestempeld als juist of onjuist. Zij volgen ook patronen op internet die niet altijd over waarheidsvinding gaan. GenAI blijft een gestuurde voorspelmachine zonder begrip van de wereld, ongevoelig voor feit en fictie. Alleen als je boven de stof staat kan je informatie die GenAI genereert controleren op juistheid.

Toch zullen veel mensen kennisverwerving wederom ter discussie stellen nu GenAI ons zoveel werk uit handen neemt. Zeker de oudere generatie die al veel kennis heeft verworven via een traditioneel onderwijssysteem zullen moeilijker kunnen begrijpen wat de gevolgen zullen zijn als we de nieuwe generatie niet meer de erfenis overdragen maar op GenAI vertrouwen dat informatie gewaarborgd blijft. En dit is niet de eerste keer dat kennisverwerving ter discussie wordt gesteld. De opkomst van Google aan het begin van deze eeuw zorgde er ook al voor dat mensen vragen stelden bij het verwerven van kennis, je kunt het immers toch altijd opzoeken?

Leren zal, net als bij de introductie van de TV en het internet, in twijfel worden getrokken. Leren doet immers pijn. Je moet er moeite voor doen, waarom zou je zelf nog iets leren als GenAI het binnen een paar seconden kan produceren? Hier zien we wederom de focus op het eindproduct. Dat is ook wat je op social media en LinkedIn langs ziet komen: een vitrine van curiositeiten zonder dat we goed weten wat het bijdraagt aan een goed leerproces. Het gaat er niet om wat GenAI kan. Het gaat erom welk residu er achterblijft bij onze leerlingen.

GenAI is vooral handig als je de boven de stof staat. Voor het (mede-)creëren van eindproducten, een sparringspartner, een automatiseringsmaatje, een razendsnel woordenboek, een eindeloze thesaurus. Maar in een leerproces dient er kritisch gekeken te worden naar het verkrijgen van diepere kennis door middel van GenAI.

leraren als hoeders van kennis

Leraren en scholen krijgen in het AI-tijdperk een belangrijke rol. Zij zullen, naast een aantal andere beroepen, de cruciale taak van hoeders van kennis op zich moeten nemen. Leraren hebben niet zoveel geld en macht als Big Tech, maar hebben ook geen direct lucratief belang bij het slagen van hun leerlingen. Zij waarborgen de overdracht van kennis en vaardigheden zodat de maatschappij zelfstandige en (zelf-)kritische burgers heeft om de democratie in stand te houden. Als je dit als leraar pretentieuze grootspraak vindt, onderschat je de rol van de leraar in een democratie en wordt het hoog tijd de positie van de leraar niet alleen in de maatschappij maar ook bij leraren zelf in aanzien te verhogen.

Deze belangrijke taak vraagt om een grote verantwoordelijkheid. Leraren zullen hun vakkennis moeten beheersen en bijhouden. Zij moeten de betrouwbare informatiebron zijn en als leerlingen kritische vragen stellen in staat moeten zijn op een professionele manier antwoord te geven of bij te sturen in hun eigen kennis. AI vormt een reële bedreiging voor de nauwkeurigheid van schoolkennis en daarmee voor de geldigheid van lesmateriaal. Het is dan ook aan de leraar om GenAI te gebruiken of toe te staan in zijn of haar onderwijsproces. Elke toepassing van GenAI waarbij de leerling minder hoeft te kennen of te leren, moet met argusogen worden benaderd.

Waarom je niet veel tijd hoeft en moet besteden in het onderwijs aan het leren van GenAI

GenAI is de eerste ICT-innovatie waar je maar weinig uitleg voor nodig hebt. Je kunt letterlijk aan ChatGPT vragen: “hoe werkt dit?” of “wat als ik dit wil doen…?” Je vraagt of GenAI iets wil doen alsof je het aan een persoon vraagt. Je kunt het systeem binnen 30 minuten uitleggen. Het vereist geen diepgaande kennis. Het is begrijpen hoe het min of meer werkt. De rest is experimenteren.

Het enige deel waar je bij GenAI expert in kunt worden is het goed formuleren van prompts. Binnen 30 minuten kan je leerlingen uitleggen waar goede prompts aan moeten voldoen. Dit vraagt echter om meer dan alleen GenAI kennis. Om iets goed te formuleren heb je goede taalbeheersing nodig. Je moet goed kunnen omschrijven wat je wilt in de juiste bewoordingen. Hoe breder je woordenschat in je langetermijngeheugen, hoe betere prompts je kunt maken. Je kunt veel promptlijstjes op internet vinden, maar als je de prompt van iemand anders in een GenAI black box stopt, in hoeverre ben je nog aan het leren? In hoeverre ben je jezelf nog aan het ontwikkelen? Ligt de focus dan op het proces of het wonderbaarlijke eindproduct?

Daarnaast heeft het ook niet veel zin om leerlingen diepgaande gebruikerskennis van ChatGPT mee te geven. De ontwikkelingen gaan te snel. Tien jaar geleden was de programmeertaal Java de meeste gebruikte taal in de ICT-wereld. Vandaag de dag is dat Python. Als we leerlingen van toen volop Java hadden geleerd, hebben ze daar nu weinig aan.

Wat dan overblijft in het onderwijs is veelal fröbelen met AI. Leerlingen krijgen allerlei opdrachten die bij lange na niet altijd iets bijdragen aan het eigen maken van kennis, maar slecht vragen om een ‘ervaring’. De kernvraag voor het gebruik van GenAI in het onderwijs zou altijd moeten zijn: wat draagt dit bij aan het creëren van kennis in het langetermijngeheugen van de leerling?

Als laatste lijkt de GenAI hype grotendeels de Gartner technologie hype cyclus te volgen. De afgelopen maanden komt er steeds meer kritiek op de stagnering van ontwikkelingen. Het is zeker zo dat er nieuwe elementen worden toegevoegd, maar de vraag die steeds meer wordt gesteld is, “wat hebben we hieraan?” Het feit dat nieuwe data om GenAI te trainen opraakt rond 2026, geeft aan dat er een plafond in zicht is wat betreft trainingsdata. Kwantiteit kan niet meer compenseren voor kwaliteit. De output van GenAI blijft fouten houden, komt steeds meer vlak over, en vervuilt het internet met nietszeggende informatie. Probleem is alleen dat Big Tech hier volledig op heeft ingezet en het ‘too big to fail’ is geworden om de kritiek serieus te nemen en nuchter naar GenAI te kijken.

 

Kansen: naar het plateau van productiviteit

Dit betekent niet dat we GenAI moeten weren uit het onderwijs. Het kan, mits kritisch (dat wil zeggen op basis van kennis over GenAI), worden ingezet. De kernvraag is, versnelt het denkprocessen, zoals een rekenmachine, of neemt het denkprocessen over?

Je kunt het vergelijken met koken. Als je kookt en een recept volgt, gebruik je hulpmiddelen zoals een mes, een pan, en een keukenmachine. In eerste instantie duurt het wat langer om je gerecht te maken. Je moet de vaardigheid nog eigen maken. Stappen mislukken en je probeert zo goed als je kunt het recept te volgen. Naar mate je vaker het gerecht maakt, kan je het uit je hoofd, verbeter je processen, en experimenteer je met smaakvariaties. Dit is een leerproces. GenAI heeft het risico de magnetronmaaltijdvariant te zijn dat je binnen 5 minuten hebt opgewarmd. Het resultaat is hetzelfde (een warm gerecht) maar je hebt geen vaardigheden eigengemaakt, je hebt geen goed idee welke ingrediënten erin zitten (tenzij je de E-nummers opzoekt), en het smaakt minder lekker. Daar bovenop heb je jezelf niet ontwikkeld.

Als je GenAI als keukenmachine gebruikt, als onderdeel van het leerproces, maar niet cruciale elementen laat overnemen, kan het van waarde zijn in het onderwijs. Hiervoor is kennis nodig over effectief onderwijs en over Generatieve AI. Omdat GenAI een stuk gereedschap voor de docent is, moet hij ook zo benaderd worden. Waar in het leerproces heeft het meerwaarde? Hoe kan ik de kwalificatie van mijn leerlingen waarborgen? Wat kan ik uit handen geven? Waar wil ik regie houden? Uiteindelijk zullen er steeds meer ‘good practices’ gedeeld worden (en helaas de mislukkingen minder). Voor nu is het kijken waar processen verantwoord geautomatiseerd kunnen worden.

Voor mijn eigen lessen gebruik ik ChatGPT om oefeningen te maken, weggezakte kennis over literatuur en taalkunde op te frissen, synoniemen te vinden, of zinnen in mijn readers anders te formuleren. Ik gebruik ChatGPT in combinatie met Suno om grammaticaliedjes te maken om na een EDI-les af te spelen, materiaal te ontwikkelen voor mijn StarlingESL platform, en korte samenvattingen te maken voor boeken op RookReading.com. Dit werkt prima omdat ik boven de stof sta en kan controleren op fouten. Ook kan ik wijzigingen in het materiaal aanbrengen waarvan ik uit ervaring weet dat het beter is voor mijn leerlingen. Ik behoud mijn handelingsvermogen en controle over de leerdoelen die ik met mijn leerlingen wil bereiken.

Om deze reden laat ik GenAI niet mijn lessen plannen of complete toetsen maken. Beide zijn een uiting van mijn expertise over het onderwijsproces. Iedere klas is anders, ieder cohort is anders, het moment van de dag is bepalend voor mijn les. Wanneer ik ChatGPT mijn lessen laat plannen, mist de AI heel veel informatie en variabelen om tot een goede les te komen en leer ik mijzelf niet het organiseren van een degelijke les. Het verstoort mijn leerproces in het ontwikkelen van goede lessen. Waar GenAI wel bij kan helpen is suggesties doen, die ik mee kan nemen in mijn lesvoorbereiding, maar ik behoud de controle en bewaak mijn handelingsvermogen.

Mijn 6VWO klas moet een pre-academisch essay schrijven. Hiervoor dienen zij eerst over het onderwerp te brainstormen. Ik wil niet dat zij hier ChatGPT voor gebruiken want één van mijn leerdoelen is dat leerlingen zelfstandig tot eigen ideeën moeten kunnen komen, deze op waarde oordelen, en organiseren waaruit zij vervolgens een essay schrijven. Zodra ik de brainstorm overlaat aan ChatGPT, voeren leerlingen niet hun eigen ideeën uit, maar laten zij zich leiden door informatie die uit een voorspelling het meest waarschijnlijk is.

Wanneer leerlingen klaar zijn met hun brainstorm en hebben overlegd met hun klasgenoten laat ik op het bord ChatGPT een brainstorm doen. Op deze manier kunnen leerlingen zien wat ze kunnen toevoegen aan hun eigen brainstorm. Deze stap is overigens niet noodzakelijk, maar kan gezien worden als een digitale vaardigheden oefening hoe om te gaan met GenAI: eerste zelf nadenken voordat je GenAI gebruikt. Het doel is niet het creëren van een product (de brainstorm), maar om vaardigheden aan te leren die zelfstandig toe te passen zijn. Alleen dan maak je iemand weerbaar voor de toekomst.

Teacher Assistent op basis van eigen datasets

Waar ik een grote toepassing in zie is het gebruik van Open Source GenAI toolkits. Dit zijn kleine, lokale AI-modellen die in de basis alleen ‘taal’ kennen maar verder geen inhoudelijke datasets hebben. Lokaal hoeft overigens niet fysiek ‘lokaal’ te zijn, maar kan ook een gesloten omgeving in de cloud zijn. Op Harvard hebben ze al een dergelijk experiment gedaan met basisnatuurkunde. De resultaten waren positief, maar ze geven wel de kanttekening dat het echt als ondersteuning gebruikt moet worden en niet als vervanging van de docent.

De docent kan dan een eigen dataset (de stof van een hoofdstuk of een heel jaar) toevoegen aan het model en aanbieden aan zijn of haar leerlingen om als Teacher Assistent te gebruiken. Omdat de data niet vervuild is zal het model weinig tot niet hallucineren. Wanneer er toch fouten optreden kan je als docent de AI bijsturen met een nieuwe dataset.

Deze datasets kunnen tussen leraren uitgewisseld worden. Je hoeft hier geen programmeerkennis voor te hebben. Informatie kan in een tekstbestand aangeleverd worden. Dit zorgt ervoor dat de leraar zijn controle en handelingsvermogen behoudt en niet wordt overgeleverd aan Big Tech.

Toch moet er bij het gebruik van GenAI als Teacher Assistant voorzichtigheid geboden worden. In een onderzoek van Hamsa Bastani et al. genaamd Generative AI Can Harm Learning hielp een GPT Tutor leerlingen weliswaar bij het maken van wiskunde opgaven, maar presteerden leerlingen naderhand net zo goed als leerlingen die geen GPT Tutor hadden gebruikt. De GPT Tutor hielp wel beter dan de GPT Base, die vergelijkbaar werkt met ChatGPT. Hier presteerden leerlingen slechter na verwijdering van de GenAI. De onderzoekers concludeerden dat leerlingen de GenAI vooral als ‘krukje’ gebruikten: zodra het krukje verwijderd werd, presteerden leerlingen met de GPT Base slechter. Je zou de GPT Tutor dus vooral in de ‘scaffolding’ fase kunnen inzetten in het leerproces, maar je zal als docent de leerlingen zeker nog na deze fase moeten begeleiden om er zelfstandige, kritische denkers van te maken. Mitte Schroeven schreef hier nog een artikel over: “Onderzoek in een notendop: Generatieve AI kan het leren schaden.”

Conclusie

Uiteindelijk gaat er om niet het hele curriculum het raam uit te gooien, maar om GenAI daar te gebruiken waar het het leerproces kan bevorderen. Leraren moeten boven de verwondering staan en in staat zijn hun onderwijsproces te verdedigen tegenover de gehypnotiseerde stemmen uit de maatschappij. Big Tech moet in dienst staan van het onderwijs in plaats van andersom. Het doel van onderwijs is namelijk niet veranderd: kwalificatie, socialisatie, en subjectificatie. Onze hersenen werken nog steeds hetzelfde als duizend jaar geleden: feiten bouwen concepten en schema’s die blijven hangen in het langetermijngeheugen. Hiermee levert onderwijs kritische, zelfstandige, en weerbare jongeren in de maatschappij, die de erfenis kennen en daarop voortbouwen. GenAI kan hierin een waardevolle bijdrage leveren, maar verandert deze kerntaak niet. Het wordt tijd dat het onderwijs haar verantwoordelijkheid oppakt.

ervaren & beheersen: zoeken naar verduidelijking in het conceptexamenprogramma

Het definitieve conceptexamenprogramma Engels (en ook andere programma’s) heeft een nieuw concept ten opzichte van het oude programma: ervaringsdoelen. “In tegenstelling tot de vorige generatie gaat het […] om zowel beheersings- als ervaringsdoelen.” (Toelichtingsdocument, p. 5). Eindtermen zijn gelabeld met ‘E’ (Ervaring), ‘B’ (Beheersing), of ‘H’ (Hybride; een combinatie van de twee). Ondanks dat deze ‘ervaringsdoelen’ nieuw zijn, wordt er niet goed uitgelegd hoe een docent deze moet interpreteren.

Beheersingsdoelen zijn duidelijk. Men mag aannemen dat deze op dezelfde manier moet worden geïnterpreteerd als de oude doelen. Een doel moet in het PTA staan en worden afgerond. Afronding vindt plaats door middel van een toets of een praktische opdracht. De normering kan een cijfer zijn, maar ook een ‘handelingsdeel’: de leerling heeft het naar behoren afgerond. Als een leerling een beoordelingsmoment heeft gemist moet hij of zij dit inhalen. Een leerling mag alleen aan het Centraal Examen beginnen als het PTA compleet is.

Er is één domein uit het huidige programma waar weliswaar verantwoording voor moet worden afgelegd in het PTA maar geen beoordelingsmoment kent: Domein F -Oriëntatie op studie en beroep. Echter, dit domein kent geen eindterm.

De ervaringsdoelen in het nieuwe programma zijn wel gekoppeld aan een eindterm. De vraag is of deze doelen in het PTA moeten worden verantwoord. Moet de docent aangeven of een leerling voldoende ‘ervaring’ heeft ondergaan? Als een leerling een ‘ervaring gemist heeft, moet deze leerling deze inhalen? Wat als een leerling weliswaar aanwezig was bij de activiteit, maar zichtbaar geen prestatie heeft verricht? Moet een docent de leerling een nieuwe mogelijkheid bieden om de ‘ervaring’ in te halen? Kan het zo zijn dat een ervaring, bijvoorbeeld, slechts een half uur is in het gehele examentraject, met andere woorden, is er een kwantiteitseis bij een (rijke) ‘ervaring’?

Hybride eindtermen zouden nog problematischer kunnen worden. Welk deel van de eindterm is beheersing en welk deel ervaring? Laten we er een hybride Eindterm bij pakken:

Welk onderdeel moet ik als docent beoordelen? Of staat het mij vrij zelf te bepalen of ik het inzicht in taalleerprocessen beoordeel of de reflectie daarop, of allebei? Hoe gaat de inspectie dit beoordelen? Los van het feit dat ervaringsdoelen beter uitgelegd moeten worden, is het ook belangrijk om te weten welk deel bij hybride eindtermen beheersing is en welk deel ervaring.

SLO gaat niet over hoe iets beoordeeld wordt. Dat ligt bij de scholen en secties in het bijzonder. Echter, het is wel belangrijk voor de docenten en de inspectie om te weten hoe de ‘ervaringen’ gelezen moeten worden. Docenten willen zich voorbereiden op het maken van materiaal en weten in hoeverre de ‘ervaringen’ worden gemonitord door de inspectie. Je kunt alleen ontwerpen als je weet hoe je de doelen moet interpreteren en toepassen.

Uiteindelijk gaat het erom dat we leerlingen rijke ervaringen van taal willen meegeven, maar als docenten weten wij ook dat wij ons moeten houden aan het examenprogramma. Als docent wil ik houvast en concreet weten hoe een ervaring moet worden geïnterpreteerd, toegepast, en verantwoord. Alleen dan kan ik beoordelen of dit examenprogramma haalbaar is of niet.

Overzicht eindtermen Engels vwo

Engels Domein B (taalbewustzijn) – Eindterm 14: een nieuw voorstel

[artikel in .pdf]

In mijn brief aan de Commissie Onderwijs was ik voor domeinen B en C behoorlijk kritisch op het definitieve conceptexamenprogramma Engels vwo. Het is altijd makkelijker om kritiek te uiten, maar het vraagt meer tijd en inspanning om met een tegenvoorstel te komen. Hierbij doe ik een poging Eindterm 14 te herschrijven naar een beknopter en meer werkbare eindterm. Het is zeker niet mijn bedoeling om dit te presenteren als hét alternatief, maar schrijven verheldert het denken. Ook hoop ik dat ik een inhoudelijke bijdrage kan leveren aan de discussie over curriculumvernieuwing. Zie het als mijn manier om feedback te geven.

Eindterm 14

Eindterm 14 gaat over digitale middelen in relatie tot Engels. Echter, Eindterm 14 is bij iedere MVT (Frans, Duits, en Engels) exact hetzelfde. Het enige verschil is dat het in de specifieke taal moet zijn, niet per definitie in relatie tot die taal. Daarmee kom je meer in Domein A dan in Domein C. De vraag is dan ook of dezelfde digitale vaardigheden bij elk van de verschillende talen moet worden afgerond.

Het zou beter zijn als er een apart programma Digitale Geletterdheid komt waar doelen uit ‘geadopteerd’ kunnen worden door verschillende vakken. De inspectie kan dan controleren of en waar die doelen behaald worden binnen het complete PTA. Het staat scholen natuurlijk vrij om de digitale vaardigheden bij meerdere vakken te laten terugkomen en zo een rijk digitaal programma te bieden.

Voor nu kijken we alleen naar Eindterm 14 binnen Engels. Eerst geef ik het huidige concept, daarna kom ik met een voorstel.  De verschillende elementen zijn genummerd voor referentie later. 14 staat voor het huidige concept en N14 staat voor nieuw concept.

Huidig concept Eindterm 14 (blz. 20-21).

Nieuw concept Eindterm 14 (N14).

Eindterm 14 gaat over kritische reflectie op het gebruik van digitale middelen, over bewustwording van het effect van technologie op taalgebruik, bekend raken met de huidige ontwikkelingen in technologie en de communicatie, verschillende vormen van informatie- en communicatievoorziening via ICT kennen, en effectief gebruik kunnen maken van die technologie. Domein A gaat over de bruikbaarheid, relevantie, en betrouwbaarheid van (digitale) bronnen; Eindterm 14 in Domein C over de bruikbaarheid, relevantie, en betrouwbaarheid van het digitale middel. Anders gezegd, Domein A gaat over de inhoud en dat gericht op de taal, Eindterm 14 gaat over hoe het middel functioneert, hoe die inhoud tot stand is gekomen, en hoe het middel zich verhoudt tot de doeltaal (Engels in dit geval).

Het is belangrijk ICT-middelen niet concreet te benoemen om de doelen voor de lange termijn houdbaar te houden. Zo vind je hier niets over VR-toepassingen of de risico’s van Big Data, al zijn deze net zo relevant als het gebruik van Generatieve AI of andere genererende toepassingen. Dit is omdat het niet gaat om de beheersing van een specifiek middel, maar de mogelijkheid te hebben technologie in algemene zin kritisch te beoordelen met communicatie in het bijzonder.

De einddoelen zijn van 4 naar 2 teruggebracht en breder opgezet. Ik heb ‘evalueer’ veranderd naar ‘kritisch en effectief’ (N14.2). ‘Kritisch’ impliceert (domein)kennis, waardoor je als leerling ook meer gedwongen wordt leerlingen kennis over ICT mee te geven in plaats alleen met ICT te werken. Het doel, lijkt mij, is dat een leerling ICT kritisch kan evalueren op de relevantie en effectiviteit voor de Engelse taal.

Ik heb de twee ‘experimenteer’ punten (14.3 en 14.4) uit de doelen gehaald. Als docent kan je dit moeilijk beoordelen. Experimenteren is een onderdeel van een leerproces, maar dat zou geen doel op zich moeten zijn. Experimenteren met VR heeft als doel een beter begrip van deze technologie te krijgen en daardoor het kritisch te kunnen evalueren wanneer het effectief gebruikt kan worden en hoe. Vervang VR voor elke andere, bekende en nog onbekende, digitale ontwikkeling en je kerndoelen blijven in het nieuwe voorstel houdbaar.

Suggesties (‘te denken valt aan’)

Suggesties geven richting aan de doelen. Het gaat verder dan ‘slechts’ een optie geven wat je eventueel zou kunnen doen, zoals door sommige mensen wordt aangedragen. Suggesties geven aan hoe het adviesorgaan de doelen in de lespraktijk voor zich ziet en hoe je de eindterm met doelen moet interpreteren.

Het is opvallend dat in de suggesties nergens een voorstel wordt gedaan voor concrete kennisoverdracht zoals de EDI-methode, terwijl dit wel een valide middel is om eindtermen af te ronden. Hierin zie je dat de suggesties een hint geven in hoe SLO kijkt naar de eindtermen en de doelen. Het is zeker zo dat SLO niet voorschrijft hoe je de doelen moet behalen, maar de suggesties geven wel richting.

De suggesties

Suggestie 14.a lijkt mij prima zoals hij is. Wel moet het hier verder gaan dan alleen simpele opmaakmogelijkheden zoals tekst dik gedrukt maken. Denk hierbij aan tabellen, regelafstand, effectief gebruik van grammatica- en spellingcheck, het maken van kolommen, een inhoudsopgave, etc. Dit kan worden opgenomen in een digitale leerlijn ICT-vaardigheden.

Suggestie 14.b heeft niet veel met Engels te maken. Dit gaat ook niet veel verder dan wat knip- en plakwerk. Het mist een kritische benadering en begrip van het gebruik van taal door Generatieve AI. Goed taalgebruik vraagt om een opbouw waarbij de verschillende tekstelementen (zoals alinea’s) elkaar logisch opvolgen. Ik begrijp dat de evaluatie in de keuzes van de output van AI is, maar het leert een leerling niet hoe je Generatieve AI goed in kunt zetten.

Suggestie 14.c leert leerlingen niet kritisch naar Generatieve AI output te kijken. Het product van 14.c is een presentatie over onderwerp X, samengesteld door een kritische selectie van output. Wat veel beter werkt is leerlingen output van verschillende AI-platforms met elkaar te vergelijken en evalueren op waarheid en taalgebruik (zie N14.b). Dit kan anoniem via DuckDuckGo AI Chat, waarbij vier modellen gebruikt kunnen worden.

De uitkomsten van deze analyse (academische vaardigheid) kunnen schriftelijk of mondeling gepresenteerd worden Het doel is dan niet meer een product via Generatieve AI, maar een product over Generatieve AI. Dit sluit beter aan bij doelen N14.1 maar vooral bij N14.2. Ik heb een korte lessenserie uitgewerkt hoe dat vorm kan krijgen. Deze wordt verderop in dit artikel besproken.

Suggestie 14.d lijkt mij verder prima. Wel moet domein A hier veel bij betrokken worden, maar er is ook het voorstel om meerdere domeinen in een één product te mogen afsluiten.

Suggestie 14.e lijkt mij niet goed aansluiten bij de doelen. Hier wordt namelijk niet ingegaan op het evalueren en op waarde inschatten van chatbots.  Het zegt alleen, ‘gebruik ICT ter voorbereiding op een taaltaak’.

Bij suggestie N14.e wordt aansluiting gezocht bij duale codering uit de cognitieve wetenschap en kan helpen in het vervolgonderwijs. Het woord project lijkt het groter te maken dan het is. Je kunt hier denken aan een groepsopdracht waarin verschillende applicaties worden onderverdeeld onder de leden, en na bespreking een infographic laten maken. Daarna worden de infographics en ervaringen gedeeld met de klas. Dit kan in twee lessen afgerond worden

Je kunt ook denken aan een opdracht waarbij je aan het begin van een module leerlingen een onderzoeksopdracht geeft over leerapps en die laat toepassen in hun eigen leerproces. Aan het begin van de volgende module evalueer je de uitkomsten via infographics en (groeps-)gesprekken.

Mijn vraag is dan wel, moet dit via een beoordeling worden afgesloten, zoals bijvoorbeeld een ‘handelingsdeel’ of volstaat het uitvoeren van dit idee om te voldoen aan Eindterm 14? Het moet in het PTA terugkomen, dus mijn vermoeden ligt bij het leveren van een beoordeling.

Voorbeeld les: Begrijpen en vergelijken van AI-modellen

De lessenserie in pdf uitgewerkt.

Al hoewel de praktische uitvoering pas in een later stadium aan bod komt, kan het geen kwaad om een fictieve lessenserie op te stellen om te zien hoe de doelen kunnen worden behaald. Als je geen helder beeld hebt van de uitvoering van je eindtermen, weet je ook minder goed of zij überhaupt haalbaar zijn. Het helpt ook in discussies om iets concreets te hebben zodat men een beter beeld heeft over de praktijk.

Ik heb een lessenserie gemaakt over het maken en beoordelen van Generatieve AI over een bepaald controversieel onderwerp. Dit ontwerp is verre van perfect en vraagt ook om nog verder onderzoek in de middelen. Zoals ik al vaker heb aangedragen is er een probleem met Generatieve AI en de AVG. Het voorstel dat ik doe zal niet waterdicht zijn, maar benadert veilig gebruik van Generatieve AI meer dat het programma dat op dit moment doet.

DuckDuckGo AI Chat is een platform waar je vier verschillende AI-modellen kunt gebruiken (Chat-4o, Claude, Llama, Mixtral). Het gebruik is anoniem, je hebt geen account nodig, en de gegevens worden na gebruik verwijderd. Hopelijk zullen er in de (nabije) toekomst meerdere van dit soort initiatieven worden gelanceerd zodat Generatieve AI beter in het onderwijs gebruik kan worden. ChatGPT heeft al een optie dat gegevens niet worden opgeslagen, maar vraagt nog wel om een account.

De opbouw van de les is kennisverwerving (les 1), verzamelen van data (les 2), data vergelijken en analyseren (les 3), ideeën over AI-modellen delen via een beschouwing (les 4). Bij het schrijven van deze beschouwing mogen ze geen gebruik maken van het internet. Het doel is namelijk dat ze laten zien dat ze inzichten hebben verworven in Generatieve AI, niet het verzamelen van informatie op internet. Huiswerk is minimaal zodat leerlingen meer tijd hebben om voor hun leeslijst te lezen.

Nakijken kan gedaan worden met behulp van een rubric, en hoeft niet per definitie met een cijfer worden afgesloten. Je kunt het ook beoordelen als handelingsdeel of punten toekennen voor een Digitale Geletterdheid portfolio. De beschouwing is weliswaar in het Engels, maar dient niet nagekeken te worden op grammatica en spelling, tenzij dit de communicatie hindert (ideeën zijn niet duidelijk, zinnen lopen niet logisch). Dit zorgt ervoor dat er een minder grote nakijkdruk is voor de docent. De kerndoelen van Eindterm N14 zijn leidend.

Conclusie

Het is zeker belangrijk om nieuwe technologie, zoals Generatieve AI, te behandelen in de les. Het zou wel beter zijn als scholen meer flexibiliteit krijgen in het behandelen van Digitale Geletterdheid over het hele PTA. Dit zou kunnen via een apart programma waar verschillende vakken elementen uit kunnen ‘adopteren’ en integreren in hun eigen PTA.

Het is belangrijk de doelen bij de eindtermen beknopt te houden zodat er ruimte blijft bij de docent om keuzes te maken in de verdieping en verbreding. We gaan van 26 doelen in het huidige systeem naar 84 doelen in het nieuwe systeem. Dit maakt het programma niet concreter maar vooral groter. Door terug te snijden naar de kern van ICT-vaardigheden houd je de doelen houdbaar voor de langere termijn en is het voor docenten duidelijker waar de eindterm over gaat.

Geachte leden van de commissie Onderwijs

Conceptexamenprogramma Engelse taal en cultuur – vwo

Commissiedebat : Curriculumherziening en de voortgangsrapportage masterplan basisvaardigheden

Twtter/X thread (met screenshots uit het programma)

Met dank aan Charlotte Goulmy voor het wegwijs maken in het schrijven van brieven aan de Tweede Kamer :).

Tekst kan typefouten bevatten, het is maandagnacht geschreven met weinig tot geen tijd voor een goede controle.

_________________________________________________

 

Geachte leden van de commissie Onderwijs,

Excuses voor de lange mail. Ik had zelf ook andere plannen voor mijn maandagavond, maar dit geeft aan hoe urgent de situatie is. 16 oktober aanstaande gaan jullie in gesprek over Curriculumherziening en de voortgangsrapportage masterplan basisvaardigheden en hoe belangrijk die zijn. Hieronder volgt mijn kritiek op dit programma. Ik heb de belangrijkste punten dikgedrukt, zodat mijn grootste zorgen duidelijk zijn. Deze mail is op persoonlijke titel.

Mijn naam is Wouter de Jong. Ik ben 18 jaar werkzaam in het onderwijs en werk op dit moment alweer 14 jaar als eerstegraads docent op het Stedelijk Gymnasium in Leiden. Daarnaast ben ik lange tijd ICT&Onderwijs Coördinator geweest bij verschillende scholen. Didactisch zit ik grotendeels in de Directe Instructie hoek van het onderwijs, waarbij ik kritisch kijk naar wetenschappelijk onderzoek. Ik innoveer graag, ook digitaal, maar wel vanuit inzichten uit de cognitieve wetenschap.

Na het lezen van het Conceptexamenprogramma Engels vwo voelde ik mij genoodzaakt hier op te reageren omdat ik mij zorgen maak over de gevolgen van dit voorstel. Het zal de werkdruk van leerlingen en docenten verhogen, kansarme leerlingen in het nadeel brengen, en met het verheffen van het gebruik van experimentele technologie (Generatieve AI, zoals ChatGPT) grote risico’s met zich meebrengen.

Maar bovenal zie ik een groot probleem in de uitvoering. Met 20 eindtermen en 84(!) doelen binnen die eindtermen is het nog maar de vraag of dit programma überhaupt op een degelijke manier kan worden uitgevoerd in twee jaar. De kans is groot dat doelen worden afgeraffeld en afgevinkt. Tijd voor verdieping en beklijving is er nauwelijks, laat staan inspelen op gebeurtenissen uit de maatschappij.

Er wordt al jaren geroepen om rust in het onderwijs. We zitten met een groot lerarentekort. Dit programma zorgt voor meer werkdruk en minder ruimte voor de eigen professionele ontwikkeling en maakt het beroep minder aantrekkelijk. De kernvraag is, zijn grote domeinen B (Taalbewustzijn) en C (Cultuurbewustzijn) van zo groot belang dat ze in een MVT curriculum moeten worden verankerd?

Algemeen

Ieder curriculum dient om de zoveel jaar kritisch bekeken te worden en bijgesteld naar de huidige normen van de maatschappij. Daarbij moeten we het kerndoel van onderwijs niet uit het oog worden verliezen: de erfenis van onze beschaving overdragen aan de nieuwe generatie zodat zij daarop kritisch kunnen voortbouwen. Deze erfenis kan alleen kritisch en creatief benaderd worden met voldoende (domein)kennis.

Het lijkt erop dat er met dit programma meer is bijgekomen en dat taalverwerving ruimte moet maken voor zaken die eerder met taalkunde dan met Engels te maken. Er zijn maar liefst 20 eindtermen die afgesloten moeten worden. Daarnaast laten de suggesties bij deze 20 eindtermen allerlei voorbeelden zien met werkstukken, verslagen, en presentaties. Dit zal in de praktijk betekenen dat

  • Dit de werkdruk bij zowel leerlingen als bij docenten zal verhogen.
  • Eindtermen niet degelijk behandeld kunnen worden.
  • Zwakke leerlingen geen ruimte krijgen voldoende (domein)kennis eigen te maken.
  • Scholen minder ruimte krijgen hun eigen accenten te leggen.
  • Docenten minder ruimte krijgen hun passie binnen hun vak te kunnen delen met leerlingen.

Indien werkstukken en verslagen thuis gemaakt mogen worden, wordt dit zeer problematisch met Generatieve AI. Leerlingen kunnen nu massaal hun werkstukken via Generatieve AI laten doen. Wat overigens niet wil zeggen dat je nooit Generatieve AI moet gebruiken, maar wat wil je vandaag de dag nog bereiken met verslagen en werkstukken in de wereld van AI?

Het lijkt erop dat er in dit programma wordt vergeten dat we het hier hebben over leerlingen die nog een moderne vreemde taal eigen moeten maken. Het programma heeft er alle schijn van er vanuit te gaan dat leerlingen de taal voldoende beheersen om er analytisch naar te kijken. Sommige doelen gaan meer over filologie en taalkunde, over identiteit, over culturele bewustwording, maar niet over de Engelse taal.

Het gaat er niet om of het wel of niet belangrijk is, het gaat erom of het belangrijk genoeg is voor een eindterm. Ik vertel graag over de ontwikkeling van taal, maar om hier een eindterm van te maken wordt het verheven naar  een platform dat al bezet was door taalbeheersing. Leerlingen moeten Engels beheersen. Het zijn (nog) geen studenten Vergelijkende Taalwetenschappen. Daarbij kan een docent natuurlijk af en toe verdieping zoeken in dit mooie domein, maar een eindterm dwingt een tijdsinvestering af die de docent en zwakkere leerlingen niet altijd hebben.

Als laatste wil ik hier alvast aanstippen dat de verankering van het gebruik van Generatieve AI in het onderwijs praktische, juridisch, en morele bezwaren heeft. Ik ben op dit moment bezig met het schrijven van een artikel over Generatieve AI in het onderwijs en ben dus ondertussen redelijk ingelezen over deze techniek en de risico’s van Generatieve AI in het onderwijs. Het is nog te vroeg om deze experimentele technologie in een eindterm vast te leggen. Geef scholen de komende jaren eerst de gelegenheid Generatieve AI te onderzoeken alvorens dit te verankeren in een MVT programma.

Raamwerk met domeinen en subdomeinen (blz 10).

Bij de opmerkingen staat dat het CE schriftelijke, én auditieve, én audiovisuele bronnen gebruikt. Betekent dit dat het CE digitaal getoetst gaat worden? Omdat Engels een kernvak is, zal een compleet cohort in één keer het examen moeten doen. Hebben scholen voldoende ICT voorzieningen om dit te doen? Of is het idee dat er ook gesplitst getoetst mag worden? Zal er geld beschikbaar worden gesteld om dit te bewerkstelligen of zal dit van de lumpsum moeten worden bekostigd?

Het is overigens opvallend dat de huidige domeinen A, B,C en D nu allemaal worden samengevat in domein A. Er is ruimte gemaakt voor nieuwe eindtermen en doelen en er is dus minder ruimte voor taalvaardigheid.

Eindtermen

Eindterm 1 (p.11)

Geen opmerkingen. Dit is een prima eindterm. Niet te specifiek, genoeg invulling voor accenten van de docent.

Eindterm 2 (p. 11)

Wat mij betreft hoeven creatieve uitingen niet in een eindterm, maar ik zie als docent voldoende mogelijkheden om hier iets moois en waardevols van te maken. Het geeft een bredere benadering van taalgebruik.

De vraag is wel, hoe becijfer je creativiteit? Komen hier (suggestie) criteria voor vanuit SLO?

Eindterm 3 (p. 12)

Geen opmerkingen. Dit is het huidige domein B.

Eindterm 4 (p. 13)

Geen opmerkingen. Dit is het huidige domein A

Eindterm 5 (p. 14)

Is relatief nieuw, maar lijkt mij relevant.

Eindterm 6 (p. 14)

Geen opmerkingen. Dit is het huidige subdomein C2.

Eindterm 7 (p. 15)
Geen opmerkingen. Dit is het huidige subdomein C1.

Eindterm 8 (p. 16)

Geen opmerkingen. Dit is min of meer het huidige subdomein D1. Het socioculturele element zou er wat mij betreft uit mogen. Niet dat het niet belangrijk is, maar moet dit in een eindterm?

Eindterm 9 (p. 17)

Dit is Vergelijkende Taalwetenschappen. Waarom zou een VWO leerling deze expertise moeten ontwikkelen? Het is zeker interessant, maar is het belangrijk genoeg om verplicht kostbare lestijd aan te besteden? Een dergelijke vergelijking vraagt ook om een goede beheersing van de L2 talen (Engels, Frans, Latijn). Zonder degelijke domeinkennis is het lastiger talen te analyseren. Het blijft dan oppervlakkig en geeft weinig toevoeging.

Het vergelijken van talen op deze manier lijkt mij zeker interessant om te behandelen in de les en voor een deel doe ik dit al. Maar ik wil de ruimte behouden om extra taalverwerving te geven als de taalvaardigheid van leerlingen achterloopt. Anders krijg je weer meer schaduwonderwijs.

Eindterm 10 (p. 17)

Dit klinkt als een interessant project binnen het domein literatuur, maar als eigen eindterm lijkt mij overtrokken. Ook hier ben ik nu verplicht een plek in mijn lestijd te reserveren.

Eindterm 11 (p. 18)

Deze doelen krijgen meer betekenis binnen Domein A. De doelen zelf zijn nuttig voor het vwo, maar vallen mijns inziens onder taalvaardigheid, niet Taalbewustzijn.

Eindterm 12 (p. 19)

Dit is onderdeel van mijn beroep: hoe maak je Engels eigen? Om hier weer opdrachten aan te koppelen (presentaties, portfolio, taalleerplan) is onnodige werkdrukverhoging bij de leerling en de docent. Ook de notie dat je als leerling het gewoon AI kunt vragen heeft een aantal problemen die ik bij eindterm 14 zal bespreken.

Eindterm 13 (p. 20)

Dit voegt weinig toe aan taalvaardigheid van Engels. Het valt mij ook op dat hier constant gesproken wordt over meertaligheid. We hebben het hier over het curriculum Engels maar in dit domein gaat het meer over taalbewustzijn in zijn algemene vorm. Ook hier lijkt men te vergeten dat Engels hier een moderne vreemde taal is waar leerlingen tijd en ruimte voor nodig hebben om eigen te maken.

Eindterm 14 (p. 20)

Deze eindterm heeft één van mijn grootste bezwaren. Zoals gezegd ben ik met een verdiepend artikel bezig over Generatieve AI in het onderwijs. Ik zal probereren het beknopt te houden.

Om te beginnen is het opvallend dat er gesproken wordt over ‘experimenteren’. We hebben het hier over eindtermen die beoordeeld moeten worden. Hoe beoordeel ik ‘experimenteren’?

Ten tweede is het opvallend dat er gehint wordt naar Generatieve AI, maar niet benoemd. Veel AI geven alleen toestemming voor gebruik vanaf 18 jaar. Bij ChatGPT is dit 13 jaar met toestemming van ouders. Wat als een ouder geen toestemming geeft? Er zijn mogelijkheden voor open source (bijvoorbeeld via misschien Kennisnet?), maar dat heeft tijd nodig.

Ten derde zijn scholen verplicht een AVG-overeenkomst te sluiten met externe bedrijven (de Europese GDPR) omdat leerlingen gebruik maken van hun diensten. Moeten scholen nu een AVG-overeenkomst proberen te sluiten met bedrijven als OpenAI, Anthropic en Meta? Dit is sowieso een interessant vraagstuk omdat niemand, ook de ontwikkelaars niet, weet wat er binnen Generatieve AI gebeurt. Er kan niet bekeken worden wat de AI met de data doet. Dit moet echt eerst onderzocht worden alvorens dit in een curriculum te verankeren.

Generatieve AI wordt nu gedomineerd door Big Tech. Miljardenbedrijven die al decennia proberen het onderwijs te domineren omdat dit een lucratieve markt is. Door kennisoverdracht en didactiek over te hevelen naar deze bedrijven, in hoeverre blijft er dan nog handelingsvermogen over bij de docent?

Daarnaast is het belangrijk te beseffen dat Generatieve AI niet gaat om waarheid. Feit en fictie hebben dezelfde waarde binnen Generatieve AI. Ook is de vraag, willen we onze leerlingen domeinkennis bijbrengen of Generatieve AI leren lezen, een geavanceerde numerieke voorspellingsmachine?

Generatieve AI staat nog in de kinderschoenen, dit vastleggen in een curriculum voor de komende jaren kan schadelijk zijn. De laatste maanden komen er steeds meer scheurtjes in de hoge verwachtingen van Generatieve AI en het is onverstandig deze technologie in een programma te verankeren. Het lijkt alsof de opstellers zelf verwonderd zijn over deze technologie, maar niet voldoende kennis hebben om AI kritisch te beoordelen. Alsof dit erin moest omdat we nu in de hype zitten.

Ik ben zeker geen tegenstander van AI in het onderwijs, ik gebruik het dagelijks voor verrijking van mijn onderwijs, maar we weten er op dit moment nog te weinig over hoe het aansluit op de cognitieve wetenschap en onderzoeken over effectief leren. Generatieve AI in je curriculum zetten brengt een onnodig risico.  Generatieve AI kan kennis en vaardigheden bij leerlingen ontnemen. Ik heb het gevoel dat de risico’s zwaar onderschat worden. Het zijn niet de leerlingen die in eerste instantie Generatieve AI kritisch moet benaderen, maar de overheid, de onderwijsinstellingen, en de docenten.

Eindterm 15 (p. 21)

Dit is het oude domein F: Oriëntatie op studie en beroep, maar dan meer uitgewerkt. Lijkt mij verder prima.

Eindterm 16 (p. 22)

Het valt op dat het lezen van literatuur uitgebreid is met allerlei eisen. Het lijkt mij voor de leesbevordering van jongeren niet verstandig allerlei verplichtingen op te leggen. Kwaliteitskaders moeten er zeker zijn, maar leg niet te veel op aan leerlingen en docenten.  Geef hen de ruimte om zelf projecten op te zetten en leeservaringen op te bouwen.

Verder is de inhoud van eindterm 16 prima.

Eindterm 17 (p. 23)

Ik vraag mij af hoeveel presentaties men wil dat leerlingen doen. Het wordt zo vaak als suggestie gegeven. Maar presentaties afnemen kost veel leertijd en dienen tactisch ingezet te worden.

De kijk op de wereld van de auteur lijkt mij minder belangrijk voor een moderne vreemde taal. Interessant als je het als docent kunt bespreken, maar leg de verplichting niet op. Geef docenten ruimte en vertrouwen.

Eindterm 18 (p. 23)

Zie eindterm 16. Voeg eindtermen 16, 17, en 18 samen met kwaliteitsborging maar ook ruimte.

Eindterm 19 (p.24)

Dit gaat over burgerschap. Op zich is de insteek niet verkeerd. Het kan worden gecombineerd met andere eindtermen. Maar wederom moet de leerling weer produceren, presteren, bewijzen. En dat moet dan ook weer nagekeken en besproken worden.

Eindterm 20 (p. 25)

Deze eindterm kan veel beter worden opgenomen in Subdomein A3 en eindterm 19.

Aanbevelingen

Dit programma is simpelweg te veel voor mij als docent om degelijk les te kunnen geven. Bepaalde elementen zouden niet misstaan op universitaire studies van Vergelijkende Taalwetenschappen, Sociologie, en Antropologie. En hoewel ik dit mooie, waardevolle studies vind, zal dit ten koste gaan van mijn primaire taak: jongeren Engels bijbrengen. Het moet veel compacter zodat er ruimte ontstaat om contact met de leerling te kunnen maken, persoonlijke accenten te kunnen leggen, en alle leerlingen op alle niveaus mee te krijgen.

Daarnaast is het aantal werkstukken, presentaties en portfolio’s opvallend. Dit geeft leerlingen en docenten onnodig veel studielast en werkdruk. Ook met de komst van Generatieve AI zijn deze producten in waarde gedaald en moeten er andere meetinstrumenten worden gevonden om de kwaliteit van het onderwijs te waarborgen.

Ik ben geen onbekende met Generatieve AI en altijd zeer geïnteresseerd geweest in nieuwe ontwikkelingen in de ICT, maar Generatieve AI brengt op dit moment nog te veel risico’s met zich mee om op te nemen in een nationaal curriculum. Het voelt als meeliften op de hype, maar nog niet zo goed weten wat de meerwaarde is (en wat de regelgeving zegt over het gebruik van Generatieve AI).

Beperk literatuur ook tot één eindterm en geef docenten en scholen de ruimte hier invulling aan te geven.

Dit programma raakt jongeren uit een kansarme omgeving. Zij hebben minder voorkennis over de wereld en zullen meer moeite hebben met domeinen B en C mee te draaien waardoor zijn minder aan taalvaardigheid kunnen werken.

Al sinds het begin van Onderwijs 2032 en daarna met curriculum.nu is er een trend bij beleidsmakers om meer projectmatig te werken, kennis op een zijspoor te zetten, en te richten op individuele ontwikkeling, de zogenaamde 21st century skills. Die lees ik tussen de regels door wederom in dit voorstel. Mijn hoop als docent in deze groep mensen wiens ideeën altijd weer ergens de kop opsteken is allang verdwenen. De enige invloed die ik nog heb is mijn (praktijk)kennis delen met de politiek in de hoop dat degenen die het laatste oordeel vellen dit, wederom, een halt toeroepen.

Ik hoop dat u de tijd hebt kunnen vinden om deze brief te lezen en het Engels onderwijs verdedigen tegenover dit gevaarte. Het zou een mooi verjaardagscadeau zijn.

Met vriendelijk groet en grote hoop,

Wouter de Jong

VWO Examens Engels

Reclamevrije examens met Word versie van de bijlage en opgaven. Alles zit samengepakt in een .zip bestand. Nieuwe examens worden van tijd tot tijd toegevoegd.

Let op, ondanks dat de Word bestanden in Word zijn gemaakt, wil de opmaak nog wel anders worden weergeven in andere Word programma’s.

2024

Engels VWO 2024 Tijdvak 1 (.zip)
Engels VWO 2024 Tijdvak 2 (.zip)

2023

Engels VWO 2023 Tijdvak 1 (.zip)
Engels VWO 2023 Tijdvak 2 (.zip)

2022

Engels VWO 2022 Tijdvak 1 (.zip)
Engels VWO 2022 Tijdvak 2 (.zip)

2021

Engels VWO 2021 Tijdvak 1 (.zip)
Engels VWO 2021 Tijdvak 2 (.zip)
Engels VWO 2021 Tijdvak 3 (.zip)

2020

geen examens in verband met COVID-19

2019

Engels VWO 2019 Tijdvak 1 (.zip)
Engels VWO 2019 Tijdvak 2 (.zip)

2018

Engels VWO 2018 Tijdvak 1 (.zip)
Engels VWO 2018 Tijdvak 2 (.zip)

vrijheid is geen vrijblijvendheid

Hotel Roermond

Wanneer ik Hotel Roermond binnenloop zie ik Sjef Drummen al aan een klein tafeltje zitten. Ik had mij voorgenomen om deze ‘kleine koffie’ niet te belasten met discussievragen. Ik moest nog een geleend boek teruggeven (Catharsia) en zag kans verzendkosten te besparen. Ik was niet gekomen om een duel aan te gaan. Daarnaast helpt het veel als je iemand met wie je wel eens de digitale degens kruist, ziet en spreekt. Ondanks dat wij het op een aantal fundamentele punten oneens zijn, kan je altijd van elkaar leren en als dat niet kan, proberen elkaar te begrijpen. Als je gelooft in de goedheid van de mens, dan wil iedereen uiteindelijk het beste voor de jongere generatie.

Ik had het boek nog niet uit mijn tas gehaald of Sjef legde een ander boek op tafel: Je mag geen eisen aan leerlingen stellen. Hij had mij al een exemplaar beloofd, maar ik had niet verwacht dat ik het zo snel zou krijgen, zeker niet omdat ik niet op de boekpresentatie aanwezig kon zijn. We hadden elkaar al eerder gesproken op LinkedIn en wat ik waardeer is dat hij altijd de tijd nam om mijn vragen te beantwoorden en ook om deze ‘kleine koffie’ te hebben.

In ons korte gesprek hebben we het toch over onderwijs gehad en ja, we kwamen in een lichte discussie over verschillende onderwijsaspecten. Echter, dan pas merk je hoe beperkt digitale communicatie is. Ik zag een trotse vader, een oud-docent met sterke onderwijsideeën, en een groot onderwijshart. We vonden elkaar ook op bepaalde punten. Het hielp dat ik Catharsia had gelezen, wat ook min of meer een biografie van Sjef is. Na een vogelvlucht over Nikè (Wings) en Athena (Stedelijk Gymnasium) gaven wij elkaar de hand en haastten ons allebei weer naar onze drukke levens. Het boek ging snel, maar kortstondig in mijn tas. Dat boek is nu uit.

 

een Agoriaans handboek

Je mag geen eisen aan leerlingen stellen: Maak een kunstwerk van je leven is eigenlijk twee boeken in één gebonden. Aan de ene kant heb je Je mag geen eisen aan leerlingen stellen: Maak een kunstwerk van je leven geschreven door Sjef Drummen. Als je het boek omdraait krijg je het andere boek: Maak een kunstwerk van je leven: Je mag geen eisen aan leerlingen stellen door Jan Fasen. Mijn reflectie is op het deel van Drummen. Het deel van Fasen zal in de nabije toekomst gelezen worden.

Het is een “handboek geworden voor Agoriaans denken, handelen, ervaren en voelen. Het geeft handvatten aan het zo noodzakelijke en moeilijke proces van onderwijsvernieuwing” (p. 3). In het boek zijn er naast Drummen en Fasen ook “dertien bijdragen van wetenschappers die je aan het denken zetten over onderwijs” (p. 3).

Daar waar Catharsia voor een deel een autobiografie is en ingaat op de totstandkoming van Agora, probeert het tweede boek zich meer te richten op de filosofie en gedachte van het Agora-onderwijs. Veel elementen uit Catharsia komen weer aan bod, zoals de vijf dimensies van duurzaamheid: sociaal, ecologisch, economisch, spiritueel en cultureel. “Dat betekent dat niet het ‘ik’ centraal staat, maar het ‘wij’” (p. 23).

Agora wil betekenisvol onderwijs bieden dat geïnitieerd wordt vanuit de leerling zelf (al kon ik nergens het woord ‘constructivisme’ vinden): “Leren vanuit intrinsieke motivatie is de meest zinvolle manier van leren” (p. 99). Het is aan de coaches om het leerproces van de leerling bij te sturen zonder haar autonomie te beklemmen; ‘verleiden’ noemde Sjef dat in Hotel Roermond.

 

Agora wil betekenisvol onderwijs bieden dat geïnitieerd wordt vanuit de leerling zelf.

 

intrinsieke motivatie

Als het om intrinsieke motivatie gaat, heeft Agora een heel sterk verhaal. Als je mijn Gameful Design diagram erbij pakt, een schema dat aangeeft welke elementen in spellen en daarmee ook onderwijs intrinsieke motivatie kunnen aanwakkeren, betrekt Agora er veel van:

https://drakenvlieg.nl/wp-content/uploads/2023/02/gameful-design.jpg

Sjef Drummen stelt dat de ‘autonomie’ van de leerling onaantastbaar is. Vanuit dit idee krijgt de leerling eigenaarschap over haar leerproces. Hierbij is de ‘subjectivatie (persoonsvorming) van Biesta zeer belangrijk. Coaches zijn niet (alleen) een vakdocent. Zij helpen de jongeren ook in het vormen van hun identiteit. De leerling kan alleen ontdekken in autonomie als zij veilig kan falen. Er zijn geen summatieve toetsen (behalve in het eindexamentraject) en de leerling wordt niet afgerekend op een slecht resultaat. Omdat de leerling vanuit autonomie werkt, zit zij, met begeleiding van een coach, op haar competentieniveau: “de leerling moet leren eisen aan zichzelf te stellen” (p. 103). En omdat de leerling uit autonomie heeft gekozen is het ook relevant (betekenisvol).

De voortgang wordt ook gemeten in een eigen volgsysteem (Quissum) waarin leerlingen foto’s en tekst plaatsen over wat ze allemaal doen. Hierbij wordt gebruik gemaakt van de 20 perspectieven (brillen) die professor Fred Jansen heeft bedacht. Deze brillen komen redelijk overeen met de verschillende schoolvakken en dat is handig voor het bepalen van het profiel voor de leerling in het eindexamentraject: computerbril, levensbril, plaatsbril, millieubril, gezondbril, ontwerpbril, tijdreisbril, ramen- en verschilbril, beweegbril, kunstbril, stoffenbril, geldbril, zingevingsbril, ik- en jijbril, helikopterbril, taalbril, regelbril, rekenbril, meetbril, goed- en kwaadbril.

Daarnaast zet Agora heel erg in op gemeenschapsgevoel. Je leert op een Agora relationeel autonoom dat wil zeggen “je leert niet voor jezelf maar voor de ander. Mensen willen wat bereiken voor de ander. En wat bereiken betekent dat anderen jou het predicaat ‘goed’ geven” (p. 22).

Agora kent een vaste weekstructuur met een centrale opening met je ‘leerfamilie’: een klein groep leerlingen onder begeleiding van een vaste coach. Daarna wordt er aan challenges gewerkt, projecten met een einddoel dat bedacht is door de leerling. Na de middagpauze is er een half uur stilte moment waarin vaak wordt gelezen (zonder muziek).

Het is dan ook niet zo gek dat als je je richt op intrinsieke motivatie en relatieve autonomie van de leerling, dat je het goed doet bij persoonsontwikkeling en gemeenschapsgevoel. Het reguliere onderwijs kan op deze gebieden veel leren van Agora. Onderwijs gaat niet alleen om kwalificatie, maar ook op socialisatie en subjectivatie en die laatste twee moeten in het reguliere onderwijs nog wel eens ruimte maken voor, bijvoorbeeld, toetsing.

 

welke kennis is belangrijk?

Toch blijft mijn fundamentele zorg over Agora onbeantwoord. Als onderwijssysteem dragen wij de verantwoordelijkheid om de opgedane kennis van vorige generaties over te dragen aan de nieuwe generatie. Wij vormen het geheugen van de menselijke geschiedenis en de huidige generatie kan alleen de toekomst vormen als zij kritisch naar het heden kan kijken. Dat gaat echter alleen als zij begrijpt hoe het heden uit het verleden is ontstaan. Deze belangrijke taak is niet gewaarborgd in het Agorasysteem en kan niet toevertrouwd worden aan BigTech. Een leerling ‘verleiden’ om kennis te nemen van deze belangrijke kennis (wat niet altijd leuk of aantrekkelijk is) is voor mij te summier.

 

Als onderwijssysteem dragen wij de verantwoordelijkheid om de opgedane kennis van vorige generaties over te dragen aan de nieuwe generatie.

 

Daarnaast zal een jongere die zelf mag bepalen wat hij of zij wil leren, blinde vlekken hebben. Eén van de weinige kritische noten in het boek komt van Monique Volman: “[ik zie] het risico dat dit type onderwijs kansenongelijkheid tussen leerlingen kan vergroten. Hoe kan je leerlingen in vrijheid laten kiezen en tegelijkertijd zorgen dat de kwaliteit van de leerervaringen die ze opzoeken en opdoen niet bepaald wordt door de bagage die ze van huis uit of vanuit het basisonderwijs hebben meegekregen.” (p. 57). Hier geeft Je mag geen eisen aan leerlingen stellen geen duidelijk antwoord op.

Vrijheid in autonomie is geen vrijblijvendheid. Drummen richt zich hierbij vooral op het sociale domein: “In een leergemeenschap is niets vrijblijvend” (p. 30). Echter, dit geldt ook voor kennisoverdracht. Immers, als je ervoor kiest om geen kennis op te doen die de gemeenschap belangrijk acht om te functioneren in de maatschappij, zet je jezelf buiten de groep. Dit gaat dan ook tegen de relationele autonomie in. Je hebt een verantwoordelijkheid naar de groep, de maatschappij. Alleen willen leren wat jij belangrijk vindt, is geen oog hebben voor de gemeenschap en haar toekomst.

Drummen spreekt over het ‘fragmentarisch’ karakter van het reguliere onderwijs. Hier heeft hij zeker een punt; meer integratie lijkt mij evident. Echter, de challenges die het Agora biedt, geven ook een fragmentarisch beeld van de wereld. De kennis die je opdoet is weliswaar betekenisvol voor je project, maar je mist een fundamentele opbouw van de vakgebieden die je gebruikt. Ik denk dat hier een betere balans in moet worden gevonden, want kennis op zichzelf is niet relevant. Het wordt betekenisvol als je het kunt koppelen aan iets wat je al kent (context) of aan iets wat je interesseert. Maar die kennis wordt binnen zijn eigen vakgebied pas relevant als je het vakgebied beter beheerst. Drummen stelt dat “Agora [uitgaat] van het geheel (wereld, universum) en via nieuwsgierigheid van de leerling naar een specialisatie [voert]” (p. 119), maar dat geheel blijft onbegrijpelijk als je geen fundament hebt opgebouwd.

Ook merk ik op dat het lijkt alsof alle ‘kennis’ voor Drummen evenveel waard is. Drummen benadrukt dat motivatie zorgt voor kennis. Wanneer een leerling intrinsiek gemotiveerd is, komt de kennis vanzelf (daarom dat je geen eisen mag stellen). Maar welke kennis komt er dan en welke kennis wordt er gemist? Het eindexamen met haar eindtermen zorgt er nog voor dat leerlingen in de laatste jaren worden klaargestoomd voor het vervolgonderwijs, maar hier wil Drummen vanaf. Wat je dan, naar mijn mening, krijgt, is een slager die zijn eigen vlees gaat keuren en dat vervolgopleidingen door middel van toelatingstoetsen moeten meten of iemand de opleiding wel aan kan.

Ook is er nog geen bewijs dat er causaal verband zit tussen motivatie en leren: “motivatie leidt niet per definitie tot beter leren en presteren” (Op de Schouders van Reuzen, 2018). Hier gaat Drummen dus te kort door de bocht: ‘Als je maar gemotiveerde leerlingen hebt, komt alles goed.’ Ook het hoofdstuk met de hoopvolle titel ‘Leert de leerling wel genoeg?’ spreekt alleen over de overmatige meetcultuur in het reguliere onderwijs, dat leren synoniem is aan ontwikkeling, en dat leerlingen een inspanning moeten verrichten om tot resultaten te komen. Of de leerling wel genoeg leert wordt niet besproken (en die vraag is voor Agora ook absurd, want je bent nooit uitgeleerd en niemand mag je opleggen om iets te leren). Of de leerling genoeg leert voor zijn vervolgopleiding of voldoende basisvaardigheden heeft, blijft dus onbeantwoord.

De bijdragen van de wetenschappers vielen mij wat tegen. In het gedeelte van Drummen zijn er bijdragen van Rob Martens, Robbert Dijkgraaf, Yuli Tamir (oud-Minister van Onderwijs van Israël), Monique Volman, Jelle Jolles, Jan Bransen, Henk Oosterling, en Joseph Kessels. Echter, het gros van de bijdragen gaan niet over Agora maar over de principes die Agora inspireren. Dit was een kleine teleurstelling. Ik had gehoopt op wetenschappers die kritisch naar Agora-concept in de praktijk zouden kijken. Volman komt daar nog het meest in de buurt. Wetenschap is namelijk ook kritische vragen stellen. Daarnaast zijn Martens en Bransen niet onbekend in het Agora cirkeltje. Ook zijn er bijdragen die eerder als ‘flavour’ aanvoelen dan een waardevolle bijdrage leveren, zoals het interview met Yuli Tamir en een citaat van Robbert Dijkgraaf. Ik hoop nog steeds op een onderzoek dat oud-Agoraleerlingen volgt in het vervolgonderwijs en deze vergelijkt met oud-leerlingen uit het reguliere onderwijs. In hoeverre kunnen deze studenten meedraaien in dat vervolgonderwijs? Zijn deze leerlingen meer autonoom en mentaal sterker dan reguliere studenten?

reflectie

En dat is ook het gemis in de rest van het boek: reflectie, adaptie, voortschrijdend inzicht, groei, ideeën voor de toekomst. Het is voornamelijk een herhaald relaas over hoe belangrijk de autonome leerling is en dat motivatie leidt tot kennis. Durft Agora kritisch naar zichzelf te kijken en een paar fundamentele elementen kritisch te benaderen? Volgens Drummen is die ruimte er wel: “Agora [kent] geen dogma, alleen een sterke visie […] Onze ‘why’ biedt geen kant-en-klare oplossingen” (p. 93), maar na tien jaar mag je meer reflectie verwachten. Alleen door kritisch naar jezelf te kijken, behoed je jezelf voor dogma’s.

 

Alleen door kritisch naar jezelf te kijken, behoed je jezelf voor dogma’s.

 

Agora is voor sommige leerlingen een redding. Jongeren die verdrinken in de scholengemeenschap, die te eigenzinnig en te nieuwsgierig zijn om in lesuren te vangen, die baat hebben bij een hechte gemeenschap. Ik kan op ons Stedelijk Gymnasium zo de leerlingen aanwijzen die in een Agora systeem meer kunnen groeien dan in het reguliere onderwijs. Aan de andere kant zie ik ook leerlingen die zullen onderpresteren, die zichzelf tekortdoen, die baat hebben bij goede scaffolding voordat ze zelfstandig kunnen uitvliegen.

kleine koffie

Het reguliere onderwijs kan veel leren van het Agora op het gebied van gemeenschap, identiteitsontwikkeling, autonomie, structuur en stilte momenten. Het Agora moet, naar mijn mening, kritischer kijken naar haar maatschappelijke taak in het waarborgen van de gemeenschappelijke kennis. Mijn ideale school ligt daar waar kennis en eigenaarschap elkaar in balans houden en elkaar versterken. En ja, daar zit ook een stukje plicht in. Onderwijs is ook kennismaken met het onbekende, met het ongewilde, met het vervelende. Het leven is mooi, maar kent ook haar duistere kanten en haar verantwoordelijkheden naar de groep.

Daarom dat we als onderwijsveld met elkaar in gesprek moeten blijven. Geen verwijten moeten maken, maar kritische vragen moeten blijven stellen die soms (vooralsnog) onbeantwoord blijven. Daarom dat ik ‘kleine koffies’ waardeer, omdat die laten zien dat we mensen zijn met een hart voor leren, voor ontwikkelen, en voor de nieuwe generatie.

Er is één advies van Sjef die zeker ik ter harte zal nemen. Een advies dat mij misschien (meer) gesprek brengt met anderen: ‘Je moet je avatar aanpassen, want in het echt ben je veel positiever.’ Daar ga ik niet over in discussie.