Zoals eerder genoemd is het niet heel lastig woordenlijsten te vinden voor Engels. Echter deze woordenlijsten zijn vaak verbonden aan een methode. Het is verstandig op zoek te gaan naar een basiswoordenlijst en vanuit daar uit te bouwen. De woordenlijst bestaat niet en het gaat er vooral om dat de algemene woordenschat wordt opgekrikt, hoe meer, hoe beter.
Een goed begin is de GSL: “The words were selected to represent the most frequent words of English and were taken from a corpus of written English. The target audience was English language learners and ESL teachers.” Echter, de lijst komt uit 1953. Dr. Charles Browne, Dr. Brent Culligan and Joseph Phillips hebben de lijst geüpdate onder de naam NGSL (New General Service List): “First published in early 2013, the NGSL provides over 92% coverage for most general English texts (the highest of any corpus-derived general English word list to date)”. Dit gaat al richting de belangrijke 98% (pdf) die nodig is voor goed tekstbegrip: “It was calculated that 98% text coverage (1 unknown word in 50) would be needed for most learners to gain adequate comprehension.”
De NGSL is dus niet genoeg. Dat klopt ook in de aantallen. Volgens Paul Nation heeft een non-native 8.000 – 9.000 woordfamilies nodig heeft voor schrijven en 6.000-7.000 voor spreken (een woordfamilie is bijvoorbeeld infect > infects, infected, infecting, infectings) Dat is meer dan de 2368 woordfamilies van de NGSL. Volgens de website van de NGSL zou dit 92,34% moeten zijn. Het gat van 6% is een moeilijk gat, omdat we hier in het gebied van de meer obsure woorden komen. Het is ook niet gek dat de eerste 92% een kleiner deel van de 8.000 – 9.000 woorden bevat. In de NGSL zitten veel basiswoorden die vaak voorkomen zoals ‘the’, ‘be’, ‘and’, ‘of’ en ‘to’. De kanttekening moet wel gemaakt worden dat ik voorbij ga aan het feit dat beide onderzoeken andere meetmethodes hebben gebruikt, maar als ‘simpele’ docent zal ik het met indicaties moeten doen. Er moet straks weer lesgegeven worden.
De NGSL biedt wel een vervolg met de New Academic Word List (1200 woorden), de TOEIC Service List (1700 woorden), en de New Business Service List (721 wooorden). Deze lijsten sluiten aan op de NGSL, omdat er geen duplicaten ten opzicht van de NGSL zitten. Nadeel is wel dat de lijsten vrij droog zijn. Ze zijn niet gethematiseerd, wat het leren soms vervelend kan maken.
Een ander probleem is het niveau. Om een beter inzicht te krijgen in het niveau van de NGSL heb ik de ERK niveaus gekoppeld aan de woorden. Deze koppeling heb ik gemaakt met behulp van www.vocabkitchen.com. De NGSL is verdeeld in drie lijsten van respectievelijk 1000, 1000 en 802 (dit is een discrepantie met de het vorige genoemde aantal, misschien dat er later meer woorden zijn toegevoegd?).
A1 | A2 | B1 | B2 | C1 | C2 | |
L1 | 36% | 27,7% | 25,8% | 9,8% | 4% | 1% |
L2 | 17,7% | 31.5% | 25,8% | 33.1% | 6.2% | 14% |
L3 | 6% | 11% | 26% | 34% | 15% | 6% |
Als je de ERK niveaus erbij haalt op schoolniveau, dan moet de NGSL zeker aan het einde van 3VWO passief beheerst worden en aan het einde van klas 4 actief. Ik heb gemerkt dat iedere woordenlijst pieken heeft naar C1/C2. Dit is niet erg, want dit bevat ook woorden zoals “principle” (C1), “respectively” (C1), “peer” (C1), “representation” (C2) en “dispute” (C2). Dit zou betekenen dat je in klas 5 en 6 kunt werken aan de NAWL (deze lijst ben ik nog aan het categoriseren op ERK niveau), naast thematische woorden en “universitaire termen en afkortingen”.
Het is zeker niet zo dat hoe meer C1/C2 woorden een leerling kent, hoe beter zijn of haar woordenschat is. Als je bijvoorbeeld een C1 tekst van de British Council bekijkt zit daar een gezonde mix in (bron: lextutor.ca).
K1 en K2 is de oude onderverdeling van GSL, met K1 alszijnde de basiswoordenlijst en K2 de meer gavanceerde lijst. Opvallend is het percentage AWL woorden. De gemiddelde verdeling van academische teksten is 70% K1, 10% K2, 10% AWL, 10% Off-List (specialistische woorden).
Pak je een willekeurige CITO tekst (2016-I, tekst 4: A Healthier Urban Jungle) dan kom je op de volgene onderverdeling:
Het lastige is natuurlijk dat hier geen ERK niveaus aan zijn gekoppeld, maar als we K1 min of meer gelijk kunnen stellen aan L1, en K2 aan L2/L3, dan hoeven leerlingen niet extreem veel C1 te kennen op C1 niveau. Het ERK niveau wordt immers ook op andere punten gevormd.
Grofweg gesteld zou je kunnen zeggen dat NGSL L1 eind 3VWO passief. eind 4VWO actief beheerst moet worden. Hiernaast kan je als docent thematische woorden aanbieden om je lijsten meer smaak te geven of bepaalde gebieden zoals recht, natuur en wetenschap te belichten. Na 4VWO kan je verder met de NAWL en het bieden van meer B2-C2 thematische woorden. Ook het herhalen van woorden van L1-L3 is natuurlijk belangrijk. Dit zou voldoende houvast moeten bieden voor een basis woordenschat en vrijheid om eigen accenten te leggen.