Groepen vergelijken

Je kunt groepen vergelijken op basis van de kerngegevens:

  • centrummaten: gemiddelde, mediaan en modus
  • spreiding: standaardafwijking en kwartielafstand
  • soort verdeling: symmetrisch, links- of rechtsscheef, met meerdere toppen, e.d.

Statistische samenhang en causualteit

Bij een statistische samenhang hoeft er nog geen sprake te zijn van causualiteit (oorzaak en gevolg).

Er is alleen sprake van een oorzakelijk verband als:

  • de veroorzakende variabele (de onafhankelijke variabele) in de tijd vooraf gaat aan de andere variabele (de afhankelijke variabele)
  • er geen andere variabelen in het spel zijn die het verband veroorzaken

Conclusies trekken uit statistisch onderzoek

De meest voorkomende fouten:

  • conclusies op basis van een niet representatieve steekproef
  • voor de conclusie is slechts een gedeelte van de onderzoeksresultaten gebruikt
  • er wordt ten onrechte uitgegaan van causualiteit

Voorbeeld

Een klassiek voorbeeld van een correlatie zonder causaliteit is dat in gebieden waar meer ooievaars voorkomen meer kinderen worden geboren.

Een leuke website met allerlei onzincorrelatie kan je vinden op:

q12253img1.gif

Opdracht 1

De minister beweert dat de werkloosheid met 3% is afgenomen. De vakbonden reageren zeer verontwaardigd, want het aantal werklozen is volgens hen toegenomen met 160.000 mensen. Toch hebben ze allebei gelijk.

  • Maar kan dat eigenlijk wel? Leg uit.

Opdracht 2

Een onderzoeker heeft ontdekt dat als er meer ijsjes worden verkocht (variabele X) dan stijgt het aantal verdrinkingen (variabele Y).

  • Geef commentaar op deze ontdekking.

Opdracht 3

Professor van der Putte heeft ontdekt dat er een grote samenhang bestaat het aantal ingezette brandweerlieden en de schade die een brand veroorzaakt. De professor adviseert om bij brand voorzichtig te zijn met het bellen van de brandweer.

  • Wat denk je? Heeft de professor een punt?

Meer weten of gewoon geinteresseerd in het onderwerp?
Ga 's kijken op deze website

Opdracht 4

q12253img2.gif

In bovenstaande puntenwolk zie je de resultaten van een onderzoek naar hashgebruik en het IQ na een aantal jaren.

Welke conclusie ligt het meest voor de hand? (Geef argumenten)

  • Van veel hash gebruiken gaat je IQ omlaag.
  • Met een hoog IQ ga je minder hash gebruiken

Opdracht 1

Het gaat er om waar de 3% van genomen is. Als het percentage werklozen ten opzichte van de totale beroepsbevolking eerst 20% is en daarna 17% dan kun je spreken van een afname van 3%. Als de beroepsbevolking toeneemt kan het absoluut aantal werklozen toch gestegen zijn.

Voorbeeld: In een dorp wonen 100 mensen, 20 mensen zijn werkloos. Een jaar later wonen er in het dorp 200 mensen. Er zijn 34 mensen werkloos.

  • Werkloosheid neemt toe van 20 naar 34 (absoluut).
  • Werkloosheid neemt af van 20% naar 17% (relatief).

Opdracht 2

q12628img1.gifHet is waarschijnlijkers dat er een derde factor in het spel is. Wat dacht je van mooi weer? Dan worden er meer ijsjes verkocht (variabele X) en als meer mensen naar het strand gaan dan stijgt het aantal verdrinkingen (variabele Y) misschien ook wel...

Opdracht 3

Dat is kletspraat. Bij grotere branden is de schade groter maar er zullen ook meer brandweermannen ingezet. Een hoge samenhang maar zeker geen causaliteit.

q12628img2.gif

Opdracht 4

Het lijkt erop dat veel hashgebruik inderdaad het IQ lager maakt...