Kurtosis: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Thijs!bot (overleg | bijdragen)
Nieuwe versie; oude versie was niet meer dan een beginnetje
Regel 1:
Het begrip '''kurtosis''' (vaak ook ''platheid'' genoemd) is een maat voor 'piekvormigheid' in de [[statistiek]]. Kurtosis is zowel te berekenen voor een [[kansverdeling]] als een [[steekproef]]. Een hoge kurtosis wijst op een verdeling, of data, met een sterke piek. Dit houdt in dat een relatief groot deel van de [[variantie]] veroorzaakt wordt door zeldzame extreme waarden. Een lage kurtosis wijst op een platte verdeling, of data. Hier wordt de variantie voornamelijk veroorzaakt door een groter deel minder extreme waarden.
'''Kurtosis''' is een begrip uit de statistiek.
 
==Definitie==
De kurtosis geeft de relatieve piekvorm (anders gezegd: vlakheid van een verdeling) aan in vergelijking met de [[normale verdeling]]. Een positieve kurtosis wijst op een verdeling met een relatief hoge piek. Een negatieve kurtosis wijst op een relatief vlakke verdeling.
Voor kurtosis worden in de statistische literatuur twee verschillende definities gebruikt. Als eerste, wordt kurtosis gedefinieerd als het vierde gestandaardiseerde [[moment (wiskunde)|moment]]:
:<math>
\gamma'_2 = \frac{\mu_4}{\sigma^4} = \frac{{\rm E}((X-\mu)^4)}{{\rm E}(X-\mu)^2)^2)}
</math>
waarbij <math>\mu_4={\rm E}((X-\mu)^4)</math> het vierde centrale moment is, en &sigma; de [[standaarddeviatie]].
 
Het meestgebruikt is de volgende definitie van kurtosis
:<math>
\gamma_2 = \gamma'_2 - 3.\;
</math>
Een wiskundige theoretische reden voor deze aangepaste definitie is dat de kurtosis nu gelijk is aan het [[quotiënt]] van het vierde [[cumulant]] en het kwadraat van de variantie. Een praktische reden is dat volgens deze formule, de normale verdeling een kurtosis gelijk aan nul heeft.
 
*Een positieve kurtosis duidt op een stevige piekvorm van de kansverdeling, dit wordt ''leptokurtosisch'' genoemd. Voorbeelden van leptokurtosische verdelingen zijn de [[Laplace verdeling]] en de [[logistische verdeling]].
* Een negatieve kurtosis duidt op een platte vorm van de kansverdeling, dit wordt ''platykurtosisch'' genoemd. Voorbeelden hiervan zijn de [[uniforme verdeling]]. De meest platykurtosische verdeling is de [[Bernoulli-verdeling]] met parameter ''p'' = -2, deze heeft een kurtosis van -2.
* Verdelingen met kurtosis 0 worden ''mesokurtosisch'' genoemd. Voorbeelden hiervan zijn de normale verdelingen.
 
==Eigenschappen==
* Als ''X'' een normale verdeling volgt, dan is &gamma;<sub>2</sub>(''X'') = 0.
* Als ''Y'' de som is van ''n'' onafhankelijke, identiek verdeelde [[toevalsgrootheid|toevalsgrootheden]] ''X'', dan is &gamma;<sub>2</sub>(''Y'') = &gamma;<sub>2</sub>(''X'')/''n''
* Als ''X''<sub>1</sub>, ..., ''X''<sub>''n''</sub> onafhankelijke toevalsgrootheden zijn, allen met dezelfde variantie, dan geldt dat <math>\gamma_2(\sum_{i=1}^n X_i) = \sum_{i=1}^n (\gamma_2(X_i))/n^2</math>.
 
NB: deze drie eigenschappen gelden voor &gamma;<sub>2</sub> en niet voor &gamma;'<sub>2</sub>.
 
==Kurtosis in een steekproef==
Voor een [[steekproef]] van ''n'' waarden is de '''steekproefkurtosis''' gelijk aan
 
:<math> g_2 = \frac{n\,\sum_{i=1}^n (x_i - \overline{x})^4}{\left(\sum_{i=1}^n (x_i - \overline{x})^2\right)^2} - 3 </math>
waar ''x''<sub>''i''</sub> de ''i''de waarde is en <math>\overline{x}</math> het steekproef[[gemiddelde]]. Omdat dit geen [[zuivere schatter]] voor de populatiekurtosis is, dat wil zeggen <math>{\rm E}g_2 \neq \gamma_2</math>, wordt in praktijk, en in de meeste softwarepakketten, meestal de volgende, wel zuivere, schatter gebruikt
:<math>G_2 = \frac{n-1}{(n-2) (n-3)} \left( (n+1)\,g_2 + 6 \right).</math>
 
===Voorbeeld===
Beschouw de steekproef 1, 2, 4, 5. Hiervoor geldt ''n'' = 4 en <math>\bar{x}=3</math>. De scheefheid is als volgt
:<math>
g_2 = \frac{4\sum_{i=1}^4 (x_i-3)^4}{\left(\sum_{i=1}^4 (x_i-3)^2\right)^2} -3 = -1.64
</math>
en
:<math>
G_2 = \frac{3}{2} ( 5\,g_2 + 6) = -3.3.
</math>
 
{{Beschrijvende statistiek}}
[[Categorie:Kansrekening]]
[[Categorie:Statistiek]]