Heb jij je wel eens afgevraagd hoe groot jouw woordenschat is? In mijn voorbereidingen op een webinar over ‘woordjes leren’ die ik dinsdag 12 november verzorg, kwam ik dit bericht op nu.nl (16 augustus 2016) tegen: “De gemiddelde woordenschat van een volwassene bedraagt ongeveer 42.000 woorden, zo blijkt uit een nieuwe studie.” Ik had er mijn bedenkingen bij. Heb jij dat ook?
Woordenschat in getallen
Het bericht op nu.nl gaat verder: “Mensen met een zeer grote woordenschat kennen ongeveer 52.000 woorden, terwijl mensen die weinig taalvaardigheid hebben slechts 27.000 woorden gebruiken.” Het onderzoek waarnaar verwezen wordt, gaat overigens niet over moedertaalsprekers van het Nederlands, maar van het Engels. En als je in het onderzoek zelf duikt, zie je dat het niet om het aantal ‘woorden’ gaat, maar om het aantal trefwoorden. Dat zijn de vetgedrukte, alfabetisch geordende woorden waarop je zoekt in traditionele papieren woordenboeken.
Op internet zijn meer bronnen te vinden met gegevens over de gemiddelde woordenschat van Nederlandstaligen. Volgens Anneke Smits, lector Onderwijsinnovatie aan Hogeschool Windesheim, kennen Nederlanders meer dan 38.000 woorden (EenVandaag, 7 oktober 2022). Volgens hoogleraar Marc van Oostendorp kent een laagopgeleide volwassen Nederlander “zo’n 15.000 tot 20.000 woorden” (NRC, 30 september 2010). Op de website Schrijven & schrappen lees ik dat de gemiddelde Nederlander 23.000 woorden kent.
Wat zeggen deze getallen?
Wat zeggen deze getallen? Wat heb je eraan? Mijn antwoord: helemaal niets. Nou ja, je ziet dat er een verschil is tussen de woordenschat van geletterde en minder geletterde mensen, maar dat is niet echt een briljant inzicht. Wat verder opvalt, is dat de getallen behoorlijk uiteenlopen, en juist dat zegt veel over hun waarde.
Ik roer graag een paar kwesties aan die aantonen hoe zinloos vragen als “Hoeveel woorden ken je?” of “Hoeveel woorden kent een gemiddelde Nederlander?” zijn:
- Wat is een woord? (Deel 1) Zoals ik hierboven schrijf, gaat het in het onderzoek waarnaar nu.nl verwijst, niet om ‘woorden’, maar om trefwoorden. Neem een eenvoudig trefwoord als steen. Dat telt in de Dikke Van Dale dertien betekenissen. Als je alleen trefwoorden telt, veronderstel je dat iemand die steen kent, ook alle betekenissen van dat woord kent (zoals de gewichtseenheid), inclusief alle uitdrukkingen met steen (zoals iemand van de steen snijden). Ik weet zeker dat geen enkele spreker van het Nederlands alle betekenissen van en alle uitdrukkingen met alle voor hem of haar bekende woorden kent.
- Wat betekent ‘woorden kennen’? Er is een groot verschil tussen woorden (her)kennen en begrijpen (in teksten en gesprekken die je leest en hoort) en diezelfde woorden in gesproken of geschreven taal gebruiken.
- Wat is ‘begrijpen’? Begrip van de betekenis van een woord is vaak afhankelijk van de context waarin dat woord voorkomt. In rijke contexten kun je zelfs de betekenis begrijpen van woorden die je niet eerder hebt gezien. De vraag is dan wel of je de volledige betekenis begrijpt of bijvoorbeeld de diepere culturele implicaties doorgrondt.
- Hoe tel je het aantal (tref)woorden dat iemand kent? Hoe meet je dat? Laat je mensen de Dikke Van Dale trefwoord voor trefwoord doornemen en aangeven of een woord bekend of onbekend is? Dat lijkt me schier onmogelijk. De Dikke Van Dale telt volgens Van Dale zelf “meer dan een kwart miljoen trefwoorden”.
- Wat is een woord? (Deel 2) De Nederlandse Taalunie schrijft: “Het aantal Nederlandse woorden is onbeperkt, want je kunt met de bestaande grondwoorden steeds nieuwe samenstellingen en afleidingen maken.” Taalgebruikers ‘kennen’ dus ook heel veel woorden die niet in een woordenboek staan. Je ‘kent’ veel meer woorden dan je denkt.
- Ken jij ‘de gemiddelde Nederlander ‘? Iedere taalgebruiker heeft een eigen woordenschat. Geen twee Nederlanders kennen dezelfde woorden of hetzelfde aantal woorden.
Kortom
Zo’n nieuwsbericht als dat op nu.nl lijkt misschien heel leuk en aardig, maar je hebt er geen bal aan. Volgens mij moet je sowieso achterdochtig zijn als er in de media stellige uitspraken en keurig afgeronde cijfers worden gepresenteerd. Zeker als het over taal gaat, want taal is nauwelijks in cijfers te vangen.
Marcel, je column over kwantificering van de menselijke woordenschat is rijk met argumenten gelardeerd en je hoofdconclusie: “valt niet zinvol te kwantificeren”, overtuigt mij.
Maar pas nadat wij het eens zijn over de precieze betekenis die jij aan het woordje ‘nauwelijks’ geeft, kunnen we zinvol discussiëren over je conclusie in je slotzin.
Ik vind het frappant hoe met lineaire algebra, statistiek en waarschijnlijkheidsleer, taal in vectoren (getallen) kan worden omgezet en, na toetsing met een enorme hoeveelheid vastgelegde natuurlijke taal, weer terugvertaald kan worden naar ‘nieuwe’ begrijpelijke taal. Zie, ondanks al hun beperkingen, de tegenwoordige chatbots. Natuurlijk blijft dit gering tot het geheel van de menselijke taal, maar voor mij is het indrukwekkend dat dit uiteindelijk mogelijk is gebleken en zou daarom het woord ‘nauwelijks’ in dit verband niet hebben gebruikt.
Bedankt voor je heldere commentaar, Louis. Heel nuttig. Zo zie je maar wat één woord kan doen. 😉
Grappig, Marcel. Ik was gisteravond aan het lezen en kwam in mijn (Engelse) boek de zinsnede ‘a smell of must’ tegen. Nou ken ik natuurlijk wel het woord ‘must’, ook als zelfstandig naamwoord (‘a must’) en zelfs in de betekenis van seksueel opgewonden olifanten (soms geschreven met een -h aan het eind), maar hier was ik toch een beetje ‘stumped’, zoals men zegt. ‘Musty’, OK. Maar ‘a smell of must’? Even opzoeken. Hebbes. Zo zie je maar weer. Wat een ogenschijnlijk simpel woordje allemaal kan betekenen.
Mooi voorbeeld, Tony. Dank je wel.