Mediaan (statistiek): verschil tussen versies

272 bytes verwijderd ,  8 jaar geleden
layout
(tabellen)
(layout)
 
Als de steekproef maar 12 elementen bevat is er geen middelste.
 
:{| class="wikitable" style="text-align:center;width:500px;"
!<math> i</math>
| -2,1|| -1,6||0,1||0,2||0,6||'''0,7'''||'''0,8'''||0,8||0,9||1,1||1,2||6,5
|}
 
Nu is de mediaan het gemiddelde van de middelste twee data. Dus is de mediaan gelijk aan 0,75.
 
Het steekproefgemiddelde is superieur wanneer het erom gaat tot het uiterste gebruik te maken van de in de steekproef aanwezige informatie. Dit noemt men ''efficiëntie''. Het steekproefgemiddelde onderdrukt de willekeurige fout in de steekproef beter dan de mediaan en is daarmee een nauwkeuriger schatting van μ. Daar staat echter iets tegenover. Laten we bijvoorbeeld de bovenstaande getallen nemen, maar een typefout introduceren.
 
::{| class="wikitable" style="text-align:center;width:500px;"
!<math> i</math>
!align=center|''i''
|1|| 2 || 3|| 4|| 5|| 6|| 7||8|| 9|| 10|| 11|| 12|| 13
|align=center|1||align=center|2||align=center|3||align=center|4||align=center|5||align=center|6||align=center|7||align=center|8||align=center|9||align=center|10||align=center|11||align=center|12||align=center|13
|-
! <math> x_i</math>
!align=center|''x<sub> i</sub>''
| -2,1|| -1,6||0,1||0,2||0,5||0,7||'''0,7'''||0,8||0,8||0,9||1,1||1,2
| style="background:Yellow" | ''650''
|}
 
Voor het gemiddelde heeft de typefout in het laatste getal (nl. 650) desastreuze gevolgen; de mediaan echter blijft onveranderd. Medianen zijn dus ''robuust'' in de aanwezigheid van '[[uitbijter]]s'. In de praktijk is dat zeer waardevol omdat bij grote steekproeven de kans op een uitbijter niet te verwaarlozen is.
 
 
Deze wordt berekend door eerst van alle getallen de mediaan ''m = 0,7'' af te trekken en de absolute waarde te nemen.
 
::{| class="wikitable"
:{| class="wikitable" style="text-align:center;width:500px;"
!align=center|''i''
!<math> i</math>
|align=center|1||align=center|2||align=center|3||align=center|4||align=center|5||align=center|6||align=center|7||align=center|8||align=center|9||align=center|10||align=center|11||align=center|12||align=center|13
|1|| 2 || 3|| 4|| 5|| 6|| 7||8|| 9|| 10|| 11|| 12|| 13
|-
! <math> x_i</math>
!align=center|''x<sub>i</sub>''
| -2,1|| -1,6||0,1||0,2||0,5||0,7||'''0,7'''||0,8||0,8||0,9||1,1||1,2
| style="background:Yellow" | ''650''
|-
! <math>| x_i-m|</math>
!align=center|''|x<sub>i</sub>–m|''
||2,8|| 2,3|| 0,6|| 0,5|| 0,2|| 0|| 0|| 0,1|| 0,1|| 0,2|| 0,4|| 0,5|| 649,3
|-
|}
 
Daarna opnieuw rangschikken:
 
::{| class="wikitable" style="text-align:center;width:500px;"
! opnieuw gerangschikt
|align=center|''opnieuw gerangschikt''||align=center| 0||align=center | 0|| 0,1|| 0,1|| 0,2|| 0,2|| '''0,4'''|| 0,5|| 0,5|| 0,6||2,3|| 2,8|| 649,3
|-
|}
 
:<math>\frac a\sigma=\Phi^{-1}(0{,}75)=0{,}6745,</math>
zodat:
:<math>\sigma=1{,}4826 a\,.</math>.
)
 
Met behulp van mediaan en MAD is het mogelijk de uitbijter te verwijderen door zijn deviatie (649,3) te vergelijken met de geschatte σ (0,6). Omdat dit een factor 100 scheelt is het uiterst onwaarschijnlijk dat dit punt bij de onderliggende verdeling hoort.
31.366

bewerkingen