Verdelingsvrije statistiek: verschil tussen versies

43 bytes toegevoegd ,  18 jaar geleden
k
opmaakfoutje; spelling
Geen bewerkingssamenvatting
k (opmaakfoutje; spelling)
De naam '''niet-parametrische methode''' is een [[statistiek|statistische]] methode waarvan de naam bijzonder slecht is gekozen. Het is namelijk een statistische methode waar best parameters in mogen voorkomen, maar waar geen aanname ten aanzien van de vorm van de [[waarschijnlijkheidsverdeling]] bij gemaakt wordt. Dit is een vrij uitzonderlijke zaak omdat bij de meeste statistische methodes eerst zo'n aanname gemaakt wordt: men gaat er meestal van uit dat de willekeurige variabelen die men tot onderwerp van de methode maakt bijvoorbeeld een [[normaalverdeling]] bezitten.
 
De term 'niet-parametrische methode' is een slechte vertaling uit voornamelijk Engelstalige literatuur ('non parametric method'). In het Nederlands is de officieleofficiële aanduiding beduidend accurater: '''verdelingsvrije methode'''. (Zie [http://europa.eu.int/en/comm/eurostat/research/isi/concepts/concept01999.htm ].)
 
Nu is het in de natuurwetenschap inderdaad vrij ''vaak''' zo dat herhaaldelijk gemeten grootheden een normale verdeling bezitten. Dit is een direct gevolg van de [[centrale limiet stelling]]. Omdat een meting al gauw ergens een gemiddelde over voorstelt (bijvoorbeeld een gemiddelde over alle moleculen in het monster of alle fotonen in de straal) is er een drijvende kracht die normaliteit bevordert. Dat wil echter niet zeggen dat ''alle'' metingen ook inderdaardinderdaad normaal verdeeld zijn. Er zijn voorbeelden te over waar dit niet zo is. Het vervelende is dat dat alleen vast te stellen is als er een vrij grootgrote aantalhoeveelheid data is. Vaak is het gewoon te duur of niet mogelijk om zo veel te meten. Bij twijfel over het normaal gedragnormaalgedrag zou het dus bijzonder wenselijk zijn om methoden te hebben die goed blijven functioneren ook als de data niet normaal iszijn. Dit zijn de verdelingsvrije methoden.
 
Kenmerkend voor verdelingsvrije methoden is dat niet de meetwaarden zelf worden gebruikt maar een afgeleiddeafgeleide daarvan. Een voorbeeld is het bepalen van correlatie tussen paren van gemeten grootheden. Een verdelingsvrije methode is de rangcorrelatietoets van Spearman. Hierbij worden de gemeten waarden omgezet naar rangnummers waarna wordt getoetst of die rangnummers correleren. De feitelijke meetwaarden, en dus ook hun kansverdeling, heeft daarom geen invloed op de uitkomst van de toets. Een nadeel van verdelingsvrije methoden is dat deze minder efficientefficiënt zijn omdat ze een deel van de informatie verwaarlozen. Indien de verdeling onbekend is, of er geen toets bestaat voor de betreffende verdeling, is men echter aangewezen op verdelingsvrije methoden.
6.026

bewerkingen