Variantieanalyse: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Madyno (overleg | bijdragen)
Versie 19818462 van 84.192.229.58 (overleg) ongedaan gemaakt.
MondalorBot (overleg | bijdragen)
k Robot Erbij: hi:भिन्नता का विश्लेषण; cosmetische veranderingen
Regel 1:
'''Variantie-analyse''', een begrip uit de [[statistiek]], vaak aangeduid als '''ANOVA''' (van het Engelse 'Analysis of variance'), is een [[statistische toets|toetsingsprocedure]] om na te gaan of de [[gemiddelde|populatiegemiddelden]] van twee of meer groepen van elkaar verschillen. Het is in die zin een generalisatie van de [[t-toets]] voor twee [[steekproef|steekproeven]]. De term variantie-analyse verwijst naar de uiteenlegging (analyse) van de totale variantie van de gemeten grootheid in twee delen, de variantie binnen de groepen en de variantie tussen de groepen die met elkaar vergeleken worden. De analysetechniek is bedacht door de Britse statisticus en geneticus [[Ronald Aylmer Fisher]] in de jaren 1920 - 1930.
 
== Voorbeeld ==
Een eenvoudig voorbeeld, met drie groepen, zal de gedachtegang verduidelijken.
 
We vragen ons af of er tussen drie verschillende groepen wat de lichaamslengte van de personen uit die groepen betreft, systematische verschillen zijn of dat eventuele verschillen zuiver op [[toeval]] berusten. We vergelijken [[Friesland|Friezen]], [[Hollander|Hollanders]]s en [[Limburg (Nederland)|Limburgers]]. Is de lichaamslengte in deze groepen gemiddeld genomen dezelfde, of zijn er systematische verschillen? Duidelijk is dat ''binnen'' elke groep verschillen in lengte zijn. Niet alle Hollanders zijn even lang en ook niet alle Friezen. De vraag is of er ook ''tussen'' de groepen verschillen zijn. Of bijvoorbeeld de gemiddelde lengte van Friezen anders is dan de gemiddelde lengte van Limburgers. Of de verschillende groepen een bron van variatie zijn. Natuurlijk zullen de gemiddelden van de drie groepen niet precies aan elkaar gelijk zijn. We vragen ons daarom af of deze verschillen tussen de groepen vergelijkbaar zijn met, of veel groter zijn dan de verschillen binnen de groepen. Daartoe worden steekproeven genomen en de totale "variantie", die een maat is voor de variatie, uiteengelegd, geanalyseerd, in twee componenten, de ''[[variantie]] binnen de groepen'' en de ''variantie tussen de groepen''. Door vergelijken van deze twee componenten kan beslist worden of de groepsgemiddelden als verschillend beschouwd mogen worden of niet.
 
Het bovenstaande is een voorbeeld van een eenweg-variantie-analyse. Er is sprake van één factor (de lichaamslengte), en drie niveaus (de drie groepen, Friezen, Hollanders en Limburgers).
 
== Formules ==
Als [[wiskundig model|model]] nemen we aan dat de lichaamslengte in elk van de a=3 groepen een [[normale verdeling]] heeft, met [[verwachtingswaarde]]n resp. <math>\mu_1</math>, <math>\mu_2</math> en <math>\mu_3</math> en voor elke groep dezelfde [[variantie]] <math>\sigma^2</math>.
 
Het is gebruikelijk om het gemiddelde niveau van de a groepen met μ aan te duiden en de afwijkingen daarvan met <math>\alpha_i</math>, dus:
Regel 31:
Zo is de lengte van de eerste gemeten Fries:
:<math>X_{11}=\mu+\alpha_1+U_{11}\!</math>,
dus de som van het algemeen gemiddelde <math>\mu</math>, de afwijking <math>\alpha_1</math> daarvan voor Friezen in het algemeen, en een persoonlijke bijdrage <math>U_{11}</math>.
De persoonlijke bijdragen (storingstermen) (<math>U_{ij}</math>) zijn onderling onafhankelijk en alle <math>N(0,\sigma^2)</math>-verdeeld.
 
Regel 77:
In ons voorbeeld is dus: ''F=84/100=0.84''. Aangezien ''F<1'', is de overschrijdingskans ''p>0.5''; geen reden om de nulhypothese te verwerpen.
 
== Tabel ==
De resultaten van de berekeningen worden meestal weergegeven in een variantie-analysetabel:
 
Regel 149:
Er is dus alle reden om aan te nemen dat de groepsgemiddelden onderling verschillen.
 
== Meerweg-variantie-analyse ==
Een soortgelijke analyse kan ook gedaan worden met meer factoren. We spreken dan van ''meerweg-variantie-analyse'', of naar het aantal beschouwde factoren van bijvoorbeeld drieweg-, vierweg-variantie-analyse. Een complicatie daarbij is dat de factoren elkaar kunnen beïnvloeden, wat aangeduid wordt als ''interactie''. Ook worden met toenemend aantal factoren de formules ingewikkelder en minder overzichtelijk. Een belangrijk praktisch nadeel van veel factoren is de noodzakelijk grote steekproefomvang voor een betrouwbare analyse.
 
=== Voorbeeld ===
We bespreken een voorbeeld van een tweeweg-variantie-analyse.
 
Regel 180:
:<math>SS_A=\sum(X_i..-X...)^2</math> de kwadratensom van de factor A, "soort"
:<math>SS_B=\sum(X._j.-X...)^2</math> de kwadratensom van de factor B, "grond".
 
 
[[Categorie:Statistiek]]
Regel 195 ⟶ 194:
[[gl:Análise da varianza]]
[[gu:અંતરનું વિશ્લેષણ]]
[[hi:भिन्नता का विश्लेषण]]
[[hu:Varianciaanalízis]]
[[id:Analisis varians]]