Cronbachs α (alfa) is een maat voor de betrouwbaarheid van psychometrische tests of van vragenlijsten.[1] De waarde van is een schatting voor de ondergrens van de betrouwbaarheid van de betrokken test. Om een schatting te bepalen van de betrouwbaarheid van een test zijn ten minste twee testafnames nodig. Op basis van één testafname kan Cronbachs berekend worden om zo een schatting van de ondergrens te verkrijgen. Cronbachs hangt af van het aantal items of vragen in de test, de gemiddelde covariantie tussen de items en de spreiding van de somscore.[2]

Cronbachs is ontwikkeld door Lee Cronbach, die hem in 1951 voor het eerst gebruikte. Andere, verwante maten zijn de Kuder-Richardson Formule 20, kortweg KR-20, en lambda-2 van Guttman.

Cronbachs kan waarden aannemen van minus oneindig tot 1 (waarbij wordt opgemerkt dat alleen positieve waarden zinvol zijn). Als vuistregel wordt vaak gehanteerd dat een test of onderzoeksvragenlijst bruikbaar is bij een van 0,70 of hoger, hoewel de gebruiken verschillen per onderzoeksdiscipline. Intelligentietests hebben vaak een hogere waarde voor dan tests voor attitude of persoonlijkheid.

In de psychologie en sociologie wordt Cronbachs frequent toegepast, maar ook in andere wetenschappen is het een belangrijke maat.

Om duidelijk te maken dat Cronbachs een schatting is van de betrouwbaarheid die is gebaseerd op louter één testafname, wordt ook wel gezegd dat Cronbachs een schatting is van de interne consistentie van een instrument. Deze term wordt helaas vaak verkeerd begrepen, namelijk als indicator van constructvaliditeit of dimensionaliteit. Clustering van items is echter niet terug te zien in de waarde van , omdat er bij de berekening van gebruik wordt gemaakt van de gemiddelde covariantie. Mede daarom is het geen goede maat voor dimensionaliteit/factor structuur. Een hoge waarde van impliceert dus niet noodzakelijkerwijs dat de test enkel één construct meet. Daarom raden verschillende auteurs aan om de term interne consistentie te vermijden. Als men een uitspraak wil doen over de dimensionaliteit van een test, is het beter om factoranalyse of item respons theorie[3] te gebruiken.

Definitie

bewerken

In de klassieke testtheorie wordt de score   op een test bepaald als het totaal van de scores   op   afzonderlijke items:

 

De score   op item   wordt daarin opgevat als de som van de true score   en een storingsterm, de error score,  :

 

daarin zijn de true score en de error score ongecorreleerd, en ook worden de error scores van de verschillende items als ongecorreleerd beschouwd. Bovendien is de verwachte error score 0:

 

De variantie van de totale score kan uiteengelegd worden in:

 
 

De onbetrouwbaarheid in de testscore vindt z'n oorzaak in de varianties van de true scores en de error scores. Daarom kan de betrouwbaarheid worden afgemeten aan:

 
 

Deze parameter is maximaal gelijk aan  . Zie ter illustratie Voorbeeld 1. Ter normering wordt de betrouwbaarheid daarom gedefinieerd als:

 

De waarde van de betrouwbaarheid is maximaal 1 en naar beneden onbegrensd. Het is deze parameter waarvan Cronbachs   een schatting geeft.

 ,

daarin stellen de verschillende   respectievelijk de steekproefvarianties voor van de totale score   en de scores op de items  .

Als   de score is van testpersoon   op item   en er zijn   testpersonen, dan zijn de benodigde formules:

 

waarin

 

de gemiddelde score op item   is, en

 

waarin

 

de testscore van testpersoon   is.

Voorbeeld

bewerken

Een eenvoudig getallenvoorbeeld demonstreert de berekeningen. In de tabel staan van 3 items ( ) de itemscores   van 5 testpersonen ( ) en als rijsom de testscores  .

item 1 2 3 rijsom
itemscore testscore
testpersoon        
1 4 3 5 12
2 2 0 3 5
3 1 1 2 4
4 3 2 4 9
5 4 2 3 9
variantie 10,70
variantie 1,7 1,3 1,3 4,30

In de onderste rijen staat de variantie   van de 5 testscores en de 3 varianties   van de itemscores met hun totaal  . Voor   berekenen we dan:

 

Gestandaardiseerde items

bewerken

Als de items gestandaardiseerd zijn, dat wil zeggen met variantie 1, kan de betrouwbaarheid geschreven worden als:

 
 

Als schatter kan dan gebruikt worden:

 

Hierin staat   voor de gemiddelde onderlinge steekproefcorrelatie tussen de items.

Gebruik

bewerken

Cronbachs   kan in verschillende fasen van een onderzoek gebruikt worden.

Onderzoeksfase Toepassing
Vooraf Bij de ontwikkeling van psychometrische tests, door de test voor te leggen aan een groot aantal proefrespondenten alvorens hem in de praktijk toe te passen
Bij de ontwikkeling van een onderzoeksvragenlijst, door hem voor te leggen aan een aantal proefrespondenten alvorens het onderzoek met deze vragenlijst uit te voeren
Tijdens Bij de uitvoering van een onderzoek met een onderzoeksvragenlijst, door items alsnog te verwijderen als ze bij deze onderzoeksgroep Cronbachs   nadelig blijken te beïnvloeden
Achteraf Cronbachs   geeft een maat voor de betrouwbaarheid van de data. Als bijvoorbeeld een enquête willekeurig is ingevuld of data verzonnen zijn, kan dit leiden tot een lage waarde van α[4]