Verdelingsvrije statistiek: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Geen bewerkingssamenvatting
Geen bewerkingssamenvatting
Regel 1:
De naam '''niet-parametrische methode''' is bijzonder slecht gekozen. Het is namelijk een statistische methode waar best parameters in mogen voorkomen, maar waar geen aanname ten aanzien van de vorm van de [[waarschijnlijkheidsverdeling]] bij gemaakt wordt. Dit is een vrij uitzonderlijke zaak omdat bij de meeste statistische methodes eerst zo'n aanname gemaakt wordt: men gaat er meestal van uit dat de willekeurige variabelen die men tot onderwerp van de methode maakt bijvoorbeeld een [[normaalverdeling]] bezitten.
 
De term 'niet-parametrische methode' is een slechte vertaling uit voornamelijk Engelstalige literatuur ('non parametric method'). In het Nederlands is de officiele aanduiding beduidend accurater: '''verdelingsvrije methode'''. (Zie http://europa.eu.int/en/comm/eurostat/research/isi/concepts/concept01999.htm .)
 
Nu is het in de natuurwetenschap inderdaad vrij ''vaak''' zo dat herhaaldelijk gemeten grootheden een normale verdeling bezitten. Dit is een direct gevolg van de [[centrale limiet stelling]]. Omdat een meting al gauw ergens een gemiddelde over voorstelt (bijvoorbeeld een gemiddelde over alle moleculen in het monster of alle fotonen in de straal) is er een drijvende kracht die normaliteit bevordert. Dat wil echter niet zeggen dat ''alle'' metingen ook inderdaard normaal verdeeld zijn. Er zijn voorbeelden te over waar dit niet zo is. Het vervelende is dat dat alleen vast te stellen is als er een vrij groot aantal data is. Vaak is het gewoon te duur of niet mogelijk om zo veel te meten. Bij twijfel over het normaal gedrag zou het dus bijzonder wenselijk zijn om methoden te hebben die goed blijven functioneren ook als de data niet normaal is. Dit zijn de verdelingsvrije methoden.