Variantieanalyse: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
k r2.7.2+) (Robot: gewijzigd: ar:تحليل التباين
Mexicano (overleg | bijdragen)
k wijziging op verzoek, zie Wikipedia:Verzoekpagina voor bots met AWB
Regel 4:
Een eenvoudig voorbeeld, met drie groepen, zal de gedachtegang verduidelijken.
 
We vragen ons af of er tussen drie verschillende groepen wat de lichaamslengte van de personen uit die groepen betreft, systematische verschillen zijn of dat eventuele verschillen zuiver op [[toeval]] berusten. We vergelijken [[Friesland|Friezen]], [[Holland|Hollander]]sers en [[Limburg (Nederland)|Limburgers]]. Is de lichaamslengte in deze groepen gemiddeld genomen dezelfde, of zijn er systematische verschillen? Duidelijk is dat ''binnen'' elke groep verschillen in lengte zijn. Niet alle Hollanders zijn even lang en ook niet alle Friezen. De vraag is of er ook ''tussen'' de groepen verschillen zijn. Of bijvoorbeeld de gemiddelde lengte van Friezen anders is dan de gemiddelde lengte van Limburgers. Of de verschillende groepen een bron van variatie zijn. Natuurlijk zullen de gemiddelden van de drie groepen niet precies aan elkaar gelijk zijn. We vragen ons daarom af of deze verschillen tussen de groepen vergelijkbaar zijn met, of veel groter zijn dan de verschillen binnen de groepen. Daartoe worden steekproeven genomen en de totale "variantie", die een maat is voor de variatie, uiteengelegd, geanalyseerd, in twee componenten, de ''[[variantie]] binnen de groepen'' en de ''variantie tussen de groepen''. Door vergelijken van deze twee componenten kan beslist worden of de groepsgemiddelden als verschillend beschouwd mogen worden of niet.
 
Het bovenstaande is een voorbeeld van een eenweg-variantie-analyse. Er is sprake van één factor (de lichaamslengte), en drie niveaus (de drie groepen, Friezen, Hollanders en Limburgers).
Regel 13:
Het is gebruikelijk om het gemiddelde niveau van de a groepen met μ aan te duiden en de afwijkingen daarvan met <math>\alpha_i</math>, dus:
 
:<math>\mu_i = \mu + \alpha_i\!</math>,
 
zodat:
 
:<math>\sum \alpha_i=0</math>.
 
De systematische verschillen komen dan tot uiting in de <math>\alpha_i's</math>.
Regel 23:
Uit de groepen nemen we (onafhankelijke, aselecte) [[steekproef|steekproeven]], voor het gemak alle van dezelfde omvang ''m'':
 
:<math>X_{11},...,X_{1m},X_{21},...,X_{2m},X_{31},...,X_{3m}\!</math>.
 
Voor een zo'n element kunnen we schrijven:
Regel 30:
Zo is de lengte van de eerste gemeten Fries:
:<math>X_{11}=\mu+\alpha_1+U_{11}\!</math>,
dus de som van het algemeen gemiddelde <math>\mu</math>, de afwijking <math>\alpha_1</math> daarvan voor Friezen in het algemeen, en een persoonlijke bijdrage <math>U_{11}</math>.
De persoonlijke bijdragen (storingstermen) (<math>U_{ij}</math>) zijn onderling onafhankelijk en alle <math>N(0,\sigma^2)</math>-verdeeld.
Regel 63:
 
Onder de gemiddelde kwadratensom verstaat men de kwadratensom gedeeld door de bijbehorende vrijheidsgraden:
:<math>MSE=SSE/(a(m-1))\!</math>
en
:<math>MSA=SSA/(a-1)\!</math>.
Regel 163:
:<math>\mu\!</math> de verwachte opbrengst gemiddeld over alle soorten en gronden
:<math>\alpha_i\!</math> de bijdrage aan de opbrengst van soort i
:<math>\beta_j\!</math> de bijdrage aan de opbrengst van grond j
:<math>U_{ijk}\!</math> de eigen specifieke bijdrage van aar k van soort i op grond j; onderling onafhankelijk en <math>N(0,\sigma^2)-</math>verdeeld verondersteld.
De term
:<math>\alpha\beta_{ij}\!</math>
de zgn.zogenaamde interactieterm behoeft nog wat nadere verklaring. Niet altijd nemen we deze op in het model. Als er reden is om aan te nemen dat een bepaalde soort tarwe het beter doet op de ene grondsoort en een andere soort weer beter groeit op een andere grondsoort, is er sprake van interactie tussen de tarwesoort en de grondsoort. Om het effect daarvan in het model te beschrijven, nemen we de bovengenoemde interactieterm op. Het is gebruikelijk deze weer te geven met de symbolen van de interagerende factoren, hier dus α en β (dus niet te lezen als het product van beide!)
 
De analyse van de variantie houdt nu in dat de totale kwadratensom als volgt uiteengelegd wordt (ook hier wordt weer door een . aangegeven dat over de betrokken index gemiddeld is):