Leugens, grove leugens en …

StatistiekenMisschien kent u de Engelse uitdrukking ‘Lies, damned lies and statistics’. Die wordt in het Nederlands vaak vertaald met ‘Leugens, grove leugens en statistieken’. Statistieken. Daar wil ik het met u over hebben. 

Van Dale
Het Engelse statistics komt alleen in het meervoud voor en kan in het Nederlands zowel ‘statistiek’ als ‘statistieken’ betekenen. Voor de eerste betekenis geeft Van Dale: ‘wetenschap van het verzamelen en vergelijken van massale verschijnselen en van de weergave hiervan in tabellen of grafische voorstellingen’; voor de tweede: ‘stuk waarin feiten of gegevens van statistische aard zijn vervat’. Wat betekent ‘stuk’ hier?

Google
De twee betekenissen vind je terug in de manier waarop de bovenstaande Engelse uitdrukking wordt vertaald: ‘Leugens, grove leugens en statistiek’ (Google: 4.900 vindplaatsen) en ‘Leugens, verdomde leugens en statistieken’ (Google: 28.300 vindplaatsen).

Statistieken
Het is mij niet altijd duidelijk wat er precies wordt bedoeld met statistieken. Ik keek vorige week op een website van Stedenband Maastricht-Rama en vond op het tabblad Statistieken uitsluitend grafieken. Zijn dat ook statistieken? Dat is toch net iets anders dan bijvoorbeeld op de website van Yourhosting, waar de website van Taalpraat is ondergebracht. Daar heb je ook een tabblad Statistieken, en daar vind je ook echt een keur aan cijfers, tabellen en grafieken. Op de website www.foodholland.nl zag ik ‘Cijfers en statistieken voedingsindustrie’. Wat is het verschil tussen de twee?

Cijfers, tabellen en grafieken
De media staan tegenwoordig bol van de cijfers, tabellen en grafieken, of het nou gaat over het groeiende aantal laaggeletterden in Nederland, de stijgende zeespiegel of het gemiddelde aantal minuten tussen twee doelpunten tijdens een voetbalwedstrijd. Ze lijken zekerheid en overredingskracht te geven. Ze lijken de inhoud van berichten nog belangrijker te maken. Maar je vervat de gegevens dan niet in ‘cijfers’, ‘tabellen’ of ‘grafieken’, maar in ‘statistieken’, zoals in het volgende voorbeeld:

“Meten is weten! Van de statistieken die worden verzameld van de bezoekers kunnen belangrijke conclusies getrokken worden. … Er zijn ontzettend veel statistieken te meten, maar wat is relevant? Dat verschilt natuurlijk per website. Hieronder staan de statistieken vermeld die het meest gebruikt worden.” (www.swat.nl)

Stat
Stervoetballer Robin van Persie werd op 11 oktober de nummer één op de topscorerlijst van het Nederlands elftal. De dag erna stond op nos.nl het volgende citaat: “Het is een stat die heeft tien jaar gestaan, daarvoor Wilkes, een jaartje of dertig. Het is niet een stat die elke week verandert.” Nu is het zo dat Van Persie in Engeland voetbalt en de Engelse afkorting stat overneemt, maar het is toch tekenend. Wil je gezag afdwingen? Gebruik dan statistiek, statistieken of stat. Net als je tegenwoordig niet meer spreekt over gegevens, maar over data.

Leugens
Nu we het toch over voetbal hebben. Op 25 januari stond de volgende kop in de Volkskrant: ‘De statistieken wijzen uit: PSV wordt kampioen’. Daar heb je het weer: leugens, grove leugens en statistieken.

5 reacties op Leugens, grove leugens en …

  1. wim lichtenauer zegt

    Zeur voor de verandering eens niet over voebal,
    Statistisch gezien bestaat bv. “De Volkskrant”
    voor minstens 50 % uit gezeur over voetbal.

  2. mw.van den Bosch (JSD) zegt

    Het woord ‘gegevens’ wordt regelmatig gebruikt. Het is gewoon een gangbaar echt Nederlands woord: Uit de volgende gegevens blijkt…. Het gebruik van een woord als data zou hier niet op zijn plaats wezen en vreemd overkomen. Zelfs als het woord ,data’ betrekking heeft op de betekenis van het woord “statistieken” dan vind ik het nog altijd vreemd klinken.
    Met det woorden ‘statistiek’ of ‘statistieken’ raak ik een beetje de kluts kwijt. Misschien mogen in het kader van de taalverandering waar men gtegenwoordig zo vol van zit deze woorden allebei worden gebruikt. De gektste woorden gaan als broodjes over de toonbankk, dus……dit mag ook(?) l

  3. Antoinette Steemers zegt

    Vorige week stond in de NRC “dank zij de statistieken zijn wij nu uit de recessie”. Al dagenlang loop ik nu vertwijfeld rond: zijn we nu wel of niet uit de recessie en is dit dank zij of ondanks de statistieken? Het taalgebruik wordt er niet duidelijker op.

  4. Louis zegt

    Als je de eigenaardigheden van “statistiek” kent, wordt de connectie met “leugens” wel heel begrijpelijk.

    De Waarschijnlijkheidsleer en de Statistiek zijn twee verwante wetenschappelijke methoden. Ze genereren als uitkomst onder meer Statistieken (vaak grafische omdat dat het meest sprekend is). Beide wetenschappelijke methoden gaan uit van dezelfde wiskundige concepten:
    – centraal staat het wiskundige begrip waarschijnlijkheid;
    – een populatie van individuele elementen (vandaar “massaal” in de Van Dale definitie);
    – een steekproef (sample) uit deze populatie.

    In de waarschijnlijkheidsleer ga je uit van volledige kennis van de samenstelling van de te onderzoeken populatie en doe je daarmee voorspellingen over hoe een toekomstige steekproef eruit kan zien. Besef dat deze voorspellingen uitgaan van een wiskundig-fysische ideale modelwereld.

    In de praktijk van de menswetenschappen (medisch, taal, economie, psychologie, sociologie, enz.) is vooraf-kennis over de populatiesamenstelling meestal niet voorhanden. Dit is het werkgebied van de statistiek. In deze meer toepassingsgerichte wetenschap probeer je juist kennis over deze onbekende populatie te verwerven op basis van de analyse van grote aantallen meetgegevens (de “invoer-data”) die uit random samples (willekeurige steekproeven) in de echte wereld zijn verkregen.

    Elk van de volgende punten kan op zich al makkelijk tot “leugens” leiden, laat staan combinaties ervan:
    – Het geloofsuitgangspunt van de statisticus, namelijk de definitie van het begrip waarschijnlijkheid, kan praktisch verschil uitmaken:
    De “frequentist” ziet waarschijnlijkheid als de verwachting op lange termijn van de frequentie van optreden van de beschouwde gebeurtenis (het aantal keren dat de gebeurtenis plaats vindt, gegeven het aantal mogelijke situaties waarin de gebeurtenis zou kunnen plaatsvinden).
    De “Bayesiaan” daarentegen ziet waarschijnlijkheid als mate van geloof (plausibiliteit) in het optreden van de gebeurtenis, gegeven het feit dat zij beseft over incomplete informatie te beschikken;
    – Vaktechnisch kent statistiek legio valkuilen omdat de definities, concepten en methoden zeer specifiek zijn gedefinieerd en soms tegennatuurlijk aanvoelen. Het niet nauwgezet gehoorzamen aan de eisen en beperkingen van statistische methoden leidt tot valse uitkomsten (statisteken). Zelfs statistici maken hiermee nog wel eens fouten;
    – De populatie-verdeling wordt vaak verondersteld een “klokfunctie” (Gaussische normaalverdeling) te zijn, maar in extreme gevallen en niet-lineaire (complexe) situaties blijkt dat zelden het geval te zijn;
    – Het aantal vrijheidsgraden kan in de praktijk enorm groot en erg moeilijk eenduidig bepaalbaar zijn, zoals aan het volgende voorbeeld illustreert:
    Welk percentage van een geconstateerd aantal van X leukemiegevallen bij mensen die meer dan Y jaar (bijv. 10j) binnen Z meter (bijv. 25 m) van een V kV hoogspanningsleiding (bijv. 150kV) hebben gewoond, kan aan dit feit worden toegeschreven?
    – Steekproeven worden zelden volkomen random getrokken, terwijl dat een harde eis is om statistisch verantwoorde conclusies te mogen trekken;
    – De invoergegevens van statistische methoden bevatten altijd wel fouten en onzekerheden.
    Statistieken (de uitvoergegevens van statistische berekeningen) vormen op hun beurt weer invoergegevens voor besluitvorming in de dagelijkse praktijk. Helaas dan dus wel op basis van imperfecte gegevens;
    – Door de aard van het beestje levert statistiek, zelfs bij perfecte toepassing, hooguit betrouwbare correlaties en geen eenduidige causale verbanden en conclusies op.
    Dit in tegenstelling tot in de veel beperktere niet-menswetenschappen zoals de fysica. Maar ook daarin worden statistische methoden gebruikt, bijv. in de statistische mechanica en de theoretische elementaire deeltjesfysica;
    – En tenslotte natuurlijk nog het menselijke: kwaadwillige opzet.
    Maar om dat goed te doen, heb je wel een erg goede statisticus nodig. Anders val je vroeg of laat geheid door de mand.

    Het is dus bijna onbegrijpelijk dat er door de statistiek niet uitsluitend leugens worden verspreid. Soms worden voor de hele populatie zeer bruikbare conclusies geproduceerd. Het voorbeeld is de statistisch bewezen correlatie tussen roken en longkanker. Maar daar was wel een langdurig onderzoeksproces voor nodig.

    Degene die voorspelde dat ‘de statistieken wijzen uit: PSV wordt kampioen’ heeft statistiek niet echt begrepen, zelfs niet als PSV kampioen wordt.
    De NRC met het cynische: “dankzij de statistieken zijn wij nu uit de recessie” heeft het denk ik wel begrepen. Een uitkomstgetalletje blijkt (iets) groter dan datzelfde getalletje uit de vorige periode. Maar vergeet niet dat alle bovengenoemde mogelijke probleempunten ook op dit getalletje slaan. En ook dat er nog veel meer (vrij te kiezen) getalletjes bestaan waar niet over wordt gesproken.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *