Kurtosis: verschil tussen versies
Verwijderde inhoud Toegevoegde inhoud
k robot Erbij: he:גבנוניות (סטטיסטיקה) |
Nieuwe versie; oude versie was niet meer dan een beginnetje |
||
Regel 1:
Het begrip '''kurtosis''' (vaak ook ''platheid'' genoemd) is een maat voor 'piekvormigheid' in de [[statistiek]]. Kurtosis is zowel te berekenen voor een [[kansverdeling]] als een [[steekproef]]. Een hoge kurtosis wijst op een verdeling, of data, met een sterke piek. Dit houdt in dat een relatief groot deel van de [[variantie]] veroorzaakt wordt door zeldzame extreme waarden. Een lage kurtosis wijst op een platte verdeling, of data. Hier wordt de variantie voornamelijk veroorzaakt door een groter deel minder extreme waarden.
==Definitie==
Voor kurtosis worden in de statistische literatuur twee verschillende definities gebruikt. Als eerste, wordt kurtosis gedefinieerd als het vierde gestandaardiseerde [[moment (wiskunde)|moment]]:
:<math>
\gamma'_2 = \frac{\mu_4}{\sigma^4} = \frac{{\rm E}((X-\mu)^4)}{{\rm E}(X-\mu)^2)^2)}
</math>
waarbij <math>\mu_4={\rm E}((X-\mu)^4)</math> het vierde centrale moment is, en σ de [[standaarddeviatie]].
Het meestgebruikt is de volgende definitie van kurtosis
:<math>
\gamma_2 = \gamma'_2 - 3.\;
</math>
Een wiskundige theoretische reden voor deze aangepaste definitie is dat de kurtosis nu gelijk is aan het [[quotiënt]] van het vierde [[cumulant]] en het kwadraat van de variantie. Een praktische reden is dat volgens deze formule, de normale verdeling een kurtosis gelijk aan nul heeft.
*Een positieve kurtosis duidt op een stevige piekvorm van de kansverdeling, dit wordt ''leptokurtosisch'' genoemd. Voorbeelden van leptokurtosische verdelingen zijn de [[Laplace verdeling]] en de [[logistische verdeling]].
* Een negatieve kurtosis duidt op een platte vorm van de kansverdeling, dit wordt ''platykurtosisch'' genoemd. Voorbeelden hiervan zijn de [[uniforme verdeling]]. De meest platykurtosische verdeling is de [[Bernoulli-verdeling]] met parameter ''p'' = -2, deze heeft een kurtosis van -2.
* Verdelingen met kurtosis 0 worden ''mesokurtosisch'' genoemd. Voorbeelden hiervan zijn de normale verdelingen.
==Eigenschappen==
* Als ''X'' een normale verdeling volgt, dan is γ<sub>2</sub>(''X'') = 0.
* Als ''Y'' de som is van ''n'' onafhankelijke, identiek verdeelde [[toevalsgrootheid|toevalsgrootheden]] ''X'', dan is γ<sub>2</sub>(''Y'') = γ<sub>2</sub>(''X'')/''n''
* Als ''X''<sub>1</sub>, ..., ''X''<sub>''n''</sub> onafhankelijke toevalsgrootheden zijn, allen met dezelfde variantie, dan geldt dat <math>\gamma_2(\sum_{i=1}^n X_i) = \sum_{i=1}^n (\gamma_2(X_i))/n^2</math>.
NB: deze drie eigenschappen gelden voor γ<sub>2</sub> en niet voor γ'<sub>2</sub>.
==Kurtosis in een steekproef==
Voor een [[steekproef]] van ''n'' waarden is de '''steekproefkurtosis''' gelijk aan
:<math> g_2 = \frac{n\,\sum_{i=1}^n (x_i - \overline{x})^4}{\left(\sum_{i=1}^n (x_i - \overline{x})^2\right)^2} - 3 </math>
waar ''x''<sub>''i''</sub> de ''i''de waarde is en <math>\overline{x}</math> het steekproef[[gemiddelde]]. Omdat dit geen [[zuivere schatter]] voor de populatiekurtosis is, dat wil zeggen <math>{\rm E}g_2 \neq \gamma_2</math>, wordt in praktijk, en in de meeste softwarepakketten, meestal de volgende, wel zuivere, schatter gebruikt
:<math>G_2 = \frac{n-1}{(n-2) (n-3)} \left( (n+1)\,g_2 + 6 \right).</math>
===Voorbeeld===
Beschouw de steekproef 1, 2, 4, 5. Hiervoor geldt ''n'' = 4 en <math>\bar{x}=3</math>. De scheefheid is als volgt
:<math>
g_2 = \frac{4\sum_{i=1}^4 (x_i-3)^4}{\left(\sum_{i=1}^4 (x_i-3)^2\right)^2} -3 = -1.64
</math>
en
:<math>
G_2 = \frac{3}{2} ( 5\,g_2 + 6) = -3.3.
</math>
{{Beschrijvende statistiek}}
[[Categorie:Kansrekening]]
[[Categorie:Statistiek]]
|