Wilcoxontoets

(Doorverwezen vanaf Rangsomtoets)

De wilcoxontoets voor twee steekproeven is een verdelingsvrije (statistische) toets om na te gaan of twee verdelingen ten opzichte van elkaar verschoven zijn. De toets is genoemd naar de Amerikaanse scheikundige Frank Wilcoxon en equivalent aan de mann-whitneytoets.

Voorbeeld bewerken

Een landmeter heeft een nieuwe theodoliet gekregen omdat de oude aan vervanging toe is. Het instrument is van hetzelfde merk en van dezelfde uitvoering als het oude. Om na te gaan of de nul-instellingen van de instrumenten gelijk zijn, meet hij met beide instrumenten een aantal keren dezelfde hoogte. Hij doet 10 metingen X met het oude instrument en 12 metingen Y met het nieuwe.

We kunnen ervan uitgaan dat de verdelingen van X en van Y op een verschuiving na aan elkaar gelijk zijn.

De nulhypothese is dat de nul-instellingen dezelfde zijn, dus dat de verdelingen exact aan elkaar gelijk zijn, zonder verschuiving. Als alternatieve hypothese nemen we voor de eenvoud een eenzijdige, namelijk dat het nieuwe instrument systematisch te hoog meet.

Met het oude instrument meet hij achtereenvolgens:

Instrument X: 3,0163 3,0147 3,0175 3,0150 3,0123 3,0169 3,0143 3,0122 3,0154 3,0164

Met het nieuwe instrument meet hij:

Instrument Y: 3,0148 3,0146 3,0162 3,0155 3,0153 3,0190 3,0187 3,0167 3,0152 3,0178 3,0177 3,0158

De uitkomsten rangschikken we naar grootte:

Rangnummer: 1 2 3 4 5 6 7 8 9 10 11 12
Instrument: X X X Y X Y X Y Y X Y Y
Meetwaarde: 3,0122 3,0123 3,0143 3,0146 3,0147 3,0148 3,0150 3,0152 3,0153 3,0154 3,0155 3,0158

Vervolg tabel:

13 14 15 16 17 18 19 20 21 22
Y X X Y X X Y Y Y Y
3,0162 3,0163 3,0164 3,0167 3,0169 3,0175 3,0177 3,0178 3,0187 3,0190

Vervolgens zetten we de instrumentaanduidingen uit de tabel op een rij:

X X X Y X Y X Y Y X Y Y Y X X Y X X Y Y Y Y

Onder de nulhypothese is voor elke plaats in de rij de kans op een X dezelfde, maar onder de alternatieve hypothese zullen aan het begin van de rij met grotere kans X'en te vinden zijn en aan het eind van de rij Y'en. In het extreme geval dat de metingen als volgt waren:

X X X X X X X X X X Y Y Y Y Y Y Y Y Y Y Y Y

is het duidelijk: het nieuwe instrument geeft systematisch hogere waarden dan het oude. Als we vinden:

Y X Y X Y X Y X Y X Y X Y X Y X Y X Y X Y X

is dit weliswaar een heel bijzondere uitkomst, maar er is geen reden om het nieuwe instrument te wantrouwen.

Wat moeten we concluderen uit de gevonden uitkomst? Op het eerste gezicht lijken de X'en meer naar links en de Y'en meer naar rechts te liggen. Dus bewijs tegen de nulhypothese. Maar is dit resultaat significant? Om dat na te gaan berekent de toetsingsgrootheid   het totaal van de rangnummers van de X'en in de rij. In ons geval dus:

 

Het zal duidelijk zijn dat hoe kleiner W is hoe meer reden er is om de nulhypothese te verwerpen. Maar is onze uitkomst   te klein? Met kansrekening kan de verdeling van   onder de nulhypothese bepaald worden, gebruikmakend van het feit dat, als de nulhypothese waar is, alle mogelijke rangschikkingen van de X'en en Y'en even waarschijnlijk zijn. We hoeven deze berekening niet steeds zelf uit te voeren, daarvoor zijn er tabellen.

Definitie bewerken

De twee toevalsvariabelen   en   zijn onderling onafhankelijk en continu verdeeld met verdelingsfuncties   respectievelijk   die op een verschuiving na aan elkaar gelijk zijn. Er geldt dus:

 .

Van   en   zijn aselecte steekproeven   en   gegeven.

De toetsingsgrootheid   van de wilcoxontoets voor het toetsen van de nulhypothese

 

bestaat uit de som van de rangnummers van een van de steekproeven, zeg  , in het totaal van de waarnemingen:

 .

Daarin is dus   het rangnummer van   in de geordende rij van beide steekproeven. Afhankelijk van de alternatieve hypothese wordt de nulhypothese verworpen voor te kleine, te grote of te kleine en te grote waarden van  .

Exacte verdeling bewerken

Voor steekproeven met omvang   en  , kan de exacte verdeling van de toetsingsgrootheid   onder de nulhypothese met behulp van combinatoriek gemakkelijk bepaald worden. Voor grotere steekpoeven neemt echter de hoeveelheid rekenwerk flink toe. De verdeling kan ook bepaald worden met de onderstaande recursieve formule. De formule ontstaat door conditionering op de voorwaarde dat de laatste waarde in de volgorde een X ("...X") of een Y ("...Y") is.

 
 
 

Normale benadering bewerken

Voor grotere waarden van   en   kan een normale benadering toegepast worden. De verwachtingswaarde en de variantie van   onder de nulhypothese worden gegeven door:

 
 

Mann-whitneytoets bewerken

De mann-whitneytoets berekent om de volgorde van de X'en en Y'en te vergelijken een andere grootheid  , die echter omgerekend kan worden in de wilcoxontoetsingsgrootheid.