Verdelingsvrije statistiek: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Cat. statistische toets zit al binnen cat. statistiek; aparte vermelding statistiek dus niet nodig.
Madyno (overleg | bijdragen)
Geen bewerkingssamenvatting
Regel 1:
Een '''verdelingsvrije toets''' is een [[statistische toets]] waarbij geen aannamenveronderstellingen over de [[verdelingsfunctie]] en bijhorendeonderhavige [[parameterkansverdelling|verdeling]]s nodig zijn. Bij de meestgebruikte statistische toetsen wordt er wel van uitgegaan dat de gemeten waardewaarden verdeeldafkomstig zijn volgensuit een bepaaldeverdeling die op een of meer parameters na bekend verdelingsfunctieis, bijvoorbeeld deeen [[normale verdeling]] met onbekende [[verwachtingswaarde]].
 
Een verdelingsvrije toets wordt ook wel een '''parametervrije toets''' genoemd, maar die naam is eigenlijk slecht gekozen. Het is namelijk een methode waar best parameters in mogen voorkomen. De term 'niet-parametrische methode' is een slechte vertaling uit voornamelijk Engelstalige literatuur ('non parametric method'). In het Nederlands is de officiële aanduiding beduidend accurater: '''verdelingsvrije methode'''.
 
==Voor- en nadelen==
Het voordeel van verdelingsvrije methoden is, dat ze breder toepasbaar zijn dan parametrische methoden. Parametrische methoden zijn alleen toepasbaar als aan twee voorwaarden is voldaan:
* men kent op een of meer parameters na de verdeling van de waargenomen grootheid.
* men kent de verdelingsfunctie van de grootheid. Om de verdelingsfunctie van een grootheid te bepalen heeft men echter een vrij grote hoeveelheid data nodig. Vaak is het gewoon te duur of niet mogelijk om zo veel te meten.
* men beschikt over een statistische toets voor die verdeling.
 
* men kent de verdelingsfunctie van de grootheid. Om de verdelingsfunctie van een grootheid te bepalen heeft men echter een vrij grote hoeveelheid data nodig. Vaak is het gewoon te duur of niet mogelijk om zo veel metingen te metendoen.
Nu is het in de natuurwetenschap inderdaad vrij vaak zo dat herhaaldelijk gemeten grootheden een normale verdeling bezitten. Dit is een direct gevolg van de [[centrale limiet stelling]]. Omdat een meting al gauw ergens een gemiddelde over voorstelt (bijvoorbeeld een gemiddelde over alle moleculen in het monster of alle fotonen in de straal) is er een drijvende kracht die normaliteit bevordert. In die gevallen kan een parametrische methode toegepast worden.
 
Nu is het in de natuurwetenschap inderdaad vrij vaakweliswaar zo dat herhaaldelijk gemeten grootheden vaak (bij benadering) een normale verdeling bezitten. Dit is een direct gevolg van de [[centrale limiet stellinglimietstelling]]. Omdat een meting al gauw ergens een gemiddelde over voorstelt (bijvoorbeeld een gemiddelde over alle moleculen in het monster of alle fotonen in de straal) is er een drijvende kracht die normaliteit bevordert. In die gevallen kan een parametrische methode toegepast worden.
Een nadeel van verdelingsvrije methoden is dat deze minder efficiënt zijn omdat ze een deel van de informatie verwaarlozen.
 
Een nadeel van verdelingsvrije methoden is dat deze minder efficiënt zijn, omdat ze eenniet deelgebruik kunnen maken van de informatie verwaarlozenvan de onderliggende verdeling.
Bij twijfel over het normaalgedrag zou het dus bijzonder wenselijk zijn om methoden te hebben die goed blijven functioneren ook als de data niet normaal zijn. Dit zijn de verdelingsvrije methoden.
 
Bij twijfel overof hetbijvoorbeeld normaalgedragwel zoueen hetnormale dusverdeling bijzonderverondersteld wenselijkmag zijnworden, omis het bijzonder wenselijk methoden te hebben die goed blijven functioneren ook als de data niet normaal verdeeld zijn. Dit zijn de verdelingsvrije methoden.
 
==Kenmerk van verdelingsvrije methoden==
Kenmerkend voor verdelingsvrije methoden is dat niet de meetwaarden zelf worden gebruikt maar eendaarvan afgeleide daarvangrootheden, zoals de rangnummers. Een voorbeeld is het bepalen van de correlatie tussen paren van gemeten grootheden. Een verdelingsvrije methode is de [[rangcorrelatietoets van Spearman]]. Hierbij worden de gemeten waarden omgezet naar rangnummers waarna wordt getoetst of die rangnummers correleren. De feitelijke meetwaarden, en dus ook hun kansverdeling, heefthebben daarom geen invloed op de uitkomst van de toets.
 
==Voorbeelden==
 
Voorbeelden van verdelingsvrije toetsen zijn:
* De rangcorrelatietoets[[Spearmans van Spearmanrangcorrelatiecoëfficiënt]], die hiervoor als voorbeeld genoemd is
* De [[Kolmogorov-Smirnov]] -toets
* De [[Wilcoxon|toets van Wilcoxon]], oftewel de [[Mann-Whitney|Mann-Whitney toets]]
* De "runs" toets van [[Runstoets|Wald-Wolfowitz]]
* De [[tekentoets]] (En: sign test)
* De [[symmetrietoets van Wilcoxon]]
* De [[Kruskall-Wallis]] -toets
* De [[Chi-kwadraattoets]]