Variantieanalyse: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
k Wimpus heeft de pagina Variantie-analyse naar Variantieanalyse hernoemd: Geen klinkerbotsing. Dus koppelteken kan weg.
Koppelteken kon weg. Geen klinkerbotsing
Regel 1:
'''Variantie-analyseVariantieanalyse''', een begrip uit de [[statistiek]], vaak aangeduid als '''ANOVA''' (van het Engelse ''Analysis of variance''), is een [[statistische toets|toetsingsprocedure]] om na te gaan of de [[gemiddelde|populatiegemiddelden]] van twee of meer groepen van elkaar verschillen. Het is in die zin een generalisatie van de [[t-toets]] voor twee [[steekproef|steekproeven]]. De term variantie-analysevariantieanalyse verwijst naar de uiteenlegging (analyse) van de totale variantie van de gemeten grootheid in twee delen, de variantie binnen de groepen (''binnenvariantie'') en de variantie tussen de groepen (''tussenvariantie'') die met elkaar vergeleken worden. De analysetechniek is bedacht door de Britse statisticus en geneticus [[Ronald Aylmer Fisher]] in de jaren 1920 - 1930.
 
== Voorbeeld ==
Regel 6:
We vragen ons af of er tussen drie verschillende groepen wat de lichaamslengte van de personen uit die groepen betreft, systematische verschillen zijn of dat eventuele verschillen zuiver op [[toeval]] berusten. We vergelijken [[Friesland|Friezen]], [[Holland]]ers en [[Limburg (Nederland)|Limburgers]]. Is de lichaamslengte in deze groepen gemiddeld genomen dezelfde, of zijn er systematische verschillen? Duidelijk is dat ''binnen'' elke groep verschillen in lengte zijn. Niet alle Hollanders zijn even lang en ook niet alle Friezen. De vraag is of er ook ''tussen'' de groepen verschillen zijn. Of bijvoorbeeld de gemiddelde lengte van Friezen anders is dan de gemiddelde lengte van Limburgers. Of de verschillende groepen een bron van variatie zijn. Natuurlijk zullen de gemiddelden van de drie groepen niet precies aan elkaar gelijk zijn. We vragen ons daarom af of deze verschillen tussen de groepen vergelijkbaar zijn met, of veel groter zijn dan de verschillen binnen de groepen. Daartoe worden steekproeven genomen en de totale "variantie", die een maat is voor de variatie, uiteengelegd, geanalyseerd, in twee componenten, de ''[[variantie]] binnen de groepen'' en de ''variantie tussen de groepen''. Door vergelijken van deze twee componenten kan beslist worden of de groepsgemiddelden als verschillend beschouwd mogen worden of niet.
 
Het bovenstaande is een voorbeeld van een eenweg-variantie-analysevariantieanalyse. Er is sprake van één factor (de lichaamslengte), en drie niveaus (de drie groepen, Friezen, Hollanders en Limburgers).
 
== Formules ==
Regel 78:
 
== Tabel ==
De resultaten van de berekeningen worden meestal weergegeven in een variantie-analysetabelvariantieanalysetabel:
 
:{|
Regel 129:
De verschillen tussen de groepen zijn nu veel groter dan binnen de groepen.
 
De variantie-analysetabelvariantieanalysetabel wordt nu:
 
:{|
Regel 158:
Er is dus alle reden om aan te nemen dat de groepsgemiddelden onderling verschillen.
 
== Meerweg-variantie-analysevariantieanalyse ==
Een soortgelijke analyse kan ook gedaan worden met meer factoren. We spreken dan van ''meerweg-variantie-analysevariantieanalyse'', of naar het aantal beschouwde factoren van bijvoorbeeld drieweg-, vierweg-variantie-analysevariantieanalyse. Een complicatie daarbij is dat de factoren elkaar kunnen beïnvloeden, wat aangeduid wordt als ''interactie''. Ook worden met toenemend aantal factoren de formules ingewikkelder en minder overzichtelijk. Een belangrijk praktisch nadeel van veel factoren is de noodzakelijk grote steekproefomvang voor een betrouwbare analyse.
 
=== Voorbeeld ===
We bespreken een voorbeeld van een tweeweg-variantie-analysevariantieanalyse.
 
In een onderzoek naar de opbrengst van tarwesoorten in relatie met de bodemgesteldheid, worden 4 soorten tarwe vergeleken elk groeiend op 3 grondsoorten. Er zijn dus twee factoren: soort op 4 niveaus en grond op 3 niveaus. De opbrengst X van een tarwe-aar wordt gemodelleerd als: