Correlatie: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Geen bewerkingssamenvatting
Regel 11:
Een bepaalde mate van statistische correlatie hoeft echter niet altijd te betekenen dat er inderdaad een oorzakelijk verband tussen de twee variabelen is. Als geen aanleiding bestaat om een correlatie te vermoeden (zoals tussen de kleur van de ogen en criminaliteit) betekent de correlatie waarschijnlijk niets. Als men correlaties test tussen honderden eigenschappen, zal een op de twintig onderzochte relaties statistisch significant zijn (wanneer men toetst op 5%-niveau), als de betreffende samenhang in de populatie waaruit de [[steekproef]] is getrokken, niet bestaat.
 
Een (significante) correlatie suggereert ook geen [[oorzakelijkheid|oorzakelijk verband]]. Als er een correlatie wordt gevonden tussen verhoogde [[agressiviteit]] bij kinderen en het aantal uren dat ze naar tv kijken is daarmee niet bewezen dat kinderen agressief worden van het televisiekijken. Net zo goed is het mogelijk dat kinderen die in aanleg meer neigen tot agressiviteit ook vaker televisiekijken als vrijetijdsbesteding kiezen, of dat een derde variabele (bijvoorbeeld [[sociaal milieu]]) verantwoordelijk is voor de samenhang tussen televisie kijken en agressiviteit. Er is in dit geval dus slechts sprake van een [[statistiek|statistisch verband]], en niet van een [[Oorzakelijkheid|oorzakelijk verband]]. Een duidelijk voorbeeld is de correlatie tussen iemands leeftijd en de benzineprijs. Deze correlatie is zo goed als 100%, en het is duidelijk dat er geen oorzakelijk verband is.
 
Bekende voorbeelden van zulke "nonsenscorrelaties" zijn: de sterke, positieve correlatie tussen de grootte van de schade bij een brand en het aantal ingezette brandweerlieden, en de positieve correlatie tussen het aantal gesignaleerde ooievaars in Nederland en het geboortecijfer.