Factoranalyse: verschil tussen versies
Verwijderde inhoud Toegevoegde inhoud
→Voorbeeld: doel |
taal |
||
Regel 8:
Een zeer vereenvoudigd voorbeeld verduidelijkt een en ander.
Stel dat een groep proefpersonen van een vragenlijst twee vragen, A en B, beantwoordt. Uit analyse blijkt dat er een verband is tussen A en B. Dan kan dit komen door de invloed van A op B, door de invloed van B op A, of doordat er nog een andere onbekende
Duidelijk is te zien dat de beide variabelen A en B [[correlatie|gecorreleerd]] zijn. De lijn die goed bij de [[puntenwolk]] past geeft deze samenhang tussen A en B weer. De grootste variatie vindt plaats langs de lijn, de kleinste loodrecht daarop. De lijn stelt een nieuwe variabele, in dit geval factor genaamd, voor, die de plaats van A en B kan innemen. Een lage score op die variabele komt overeen met een lage score op zowel A als B en een hoge score met een hoge score op A en B. Het doel van factoranalyse is in dit geval het bepalen van deze lijn en daarmee de onbekende factor.
Regel 19:
Factoranalyse lijkt erg op [[hoofdcomponenten]]analyse. Wat in factoranalyse ''factoren'' genoemd wordt, wordt in hoofdcomponentenanslyse ''componenten'' genoemd. Het verschil tussen beide analysetechnieken is dat bij factoranalyse alleen naar de gemeenschappelijke variantie in de oorspronkelijke variabelen wordt gekeken, terwijl hoofdcomponentenanalyse ook naar de unieke variantie kijkt. In de meeste gevallen zijn de verschillen tussen beide methoden niet erg groot. Mochten er wel verschillen zijn, dan komt dit dus door de unieke variantie binnen (sommige) van de geobserveerde variabelen.
* Communaliteiten: de communaliteit van een geobserveerde variabele geeft het deel van de variantie weer dat door de factor voorspeld wordt. Omdat een communaliteit een proportie van de totale variantie is, kan deze in theorie slechts waarden tussen de 0 en 1 aannemen. Als vuistregel wordt doorgaans gehanteerd dat een variabele pas goed op een factor laadt als deze een communaliteit heeft van meer dan 0.45. In situaties waarin te weinig data aanwezig is, de startwaarden verkeerd gekozen zijn, of het aantal
[[Afbeelding:3 factor screeplot.png|right|thumb|350px|[[Screeplot]] van 18 variabelen, waarbij 3 factoren een eigenwaarde hebben groter dan 1 (in de afbeelding boven de blauwe lijn). <
* Aantal factoren: het aantal factoren kan onder meer op basis van de [[Eigenwaarde (wiskunde)|eigenwaarden]] van de factoren bepaald worden. De eigenwaarde geeft hierbij aan hoeveel additionele variantie door de extra factor wordt verklaard. Omdat het hier
*Factorladingen zijn de [[correlatiecoëfficiënt]]en tussen de gemeten variabelen en de verklarende factoren.
[[Afbeelding:factor rotatie.jpg|right|thumb|350px|Links een factoroplossing die hoog laadt op beide factoren; Rechts de (oblique) geroteerde factoren, waarbij duidelijk wordt dat er twee factoren zijn]]
*Rotatie: Nadat factoren uit de correlatiematrix zijn geëxtraheerd is het mogelijk om de factoren te draaien met als doel de interpretatie van de factoren te vergemakkelijken. Factorrotatie verandert niets aan de oplossing, maar wijst combinaties van de oorspronkelijke factoren als nieuwe factoren aan. Vooral wanneer de factoren niet grafisch, maar in tabelvorm geïnterpreteerd worden, werkt rotatie vaak verhelderend.
*Factorscores: De hypothetische scores van individuen op de gevonden factoren. Deze worden uitgedrukt als [[Z-scores]], d.w.z. met een [[standaarddeviatie]] van 1 en een [[verwachting]] 0.
|