Verdelingsvrije statistiek: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Madyno (overleg | bijdragen)
Geen bewerkingssamenvatting
uitgebreid en verbeterd - niet alle claims in het artikel waren correct
Regel 1:
Een '''verdelingsvrije toets''' is een [[statistische toets]] waarbij geen veronderstellingen over de onderhavige [[kansverdelling|verdeling]] nodig zijn. Bij de meestgebruikte statistische toetsen wordt er wel van uitgegaan dat de gemeten waarden afkomstig zijn uit een verdeling die op een of meer parameters na bekend is, bijvoorbeeld een [[normale verdeling]] met onbekende [[verwachtingswaarde]].
 
Een verdelingsvrije toets wordt ook wel een '''parametervrije toets''' genoemd, maar die naam is eigenlijk slecht gekozenverwarrend. Het is namelijk een methode waar best parameters in mogen voorkomen. DeEen termbetere vertaling van het Engelse ''non parametric test'' zou ''niet-parametrische methodetoets'' iszijn: eenhet slechteis vertalingnamelijk uitniet voornamelijkeen Engelstalige[[parametrische literatuur ('non parametric method')toets]]. In het Nederlands is de officiële aanduiding beduidend accurater: ''verdelingsvrije methodetoets''.
 
==Voor- en nadelen==
Het voordeel van verdelingsvrije methoden is, dat ze breder toepasbaar zijn dan parametrische methoden. Parametrische methoden zijn alleen toepasbaar als aanmen tweede voorwaardenverdeling isvan de waargenomen grootheid kent op één of meer parameters na. voldaan:
* men kent op een of meer parameters na de verdeling van de waargenomen grootheid.
* men beschikt over een statistische toets voor die verdeling.
 
Een nadeel van verdelingsvrije methoden is dat deze minder efficiënt zijn (een lager [[onderscheidingsvermogen]] hebben), omdat ze niet gebruik kunnen maken van de informatie van de onderliggende verdeling.
Om de verdelingsfunctie van een grootheid te bepalen heeft men echter een vrij grote hoeveelheid data nodig. Vaak is het gewoon te duur of niet mogelijk om zo veel metingen te doen.
 
Nu is het in de natuurwetenschap weliswaar zo dat herhaaldelijk gemeten grootheden vaak (bij benadering) een normale verdeling bezitten. Dit is een direct gevolg van de [[centrale limietstelling]]. Omdat een meting al gauw ergens een gemiddelde over voorstelt (bijvoorbeeld een gemiddelde over alle moleculen in het monster of alle fotonen in de straal) is er een drijvende kracht die normaliteit bevordert. In die gevallen kan een parametrische methode toegepast worden.
 
Een nadeel van verdelingsvrije methoden is dat deze minder efficiënt zijn, omdat ze niet gebruik kunnen maken van de informatie van de onderliggende verdeling.
 
Bij twijfel of bijvoorbeeld wel een normale verdeling verondersteld mag worden, is het bijzonder wenselijk methoden te hebben die goed blijven functioneren ook als de data niet normaal verdeeld zijn. Dit zijn de verdelingsvrije methoden.
 
==Kenmerk van verdelingsvrije methoden==