Kwantiel

getal met een gegeven relatieve positie in een oplopende rij

In de statistiek is een kwantiel een getal dat een multiset van getallen verdeelt in twee delen: het deel met de kleinere en het deel met de grotere getallen. De verzameling kan een concrete of abstracte populatie zijn of de uitkomsten van een steekproef. Voor het getal , en een verzameling met omvang , verdeelt het -kwantiel de verzameling in een deel met de kleinere waarden met omvang en een deel met de grotere waarden met omvang . Een bekend kwantiel is de mediaan, het 0,5-kwantiel, dat het midden is van de rij van in volgorde van grootte geplaatste getallen.

Spraakgebruik bewerken

De specifiekere termen percentiel, deciel en kwartiel worden in de praktijk ook gebruikt voor de betreffende delen van de dataset. Bij een verdeling in tien delen bijvoorbeeld zijn er negen deelpunten, de decielen  , maar worden de tien delen ook wel aangeduid als decielen. Het eerste deciel bestaat dan uit de 10% van de populatie die volgens de gekozen ordening de kleinste zijn, de volgende 10% kleinsten vormen het tweede deciel en er is een tiende deciel van de 10% grootste. De genoemde percentages kunnen niet altijd exact gerealiseerd worden, maar worden zo goed mogelijk benaderd. Daarbij is het gebruik het minimum als ondergrens en het maximum als bovengrens te nemen. Deze worden dan officieus als   en   aangeduid.

Meerdere variabelen bewerken

Bij een dataset met meerdere variabelen met waarden in een geordende verzameling (zoals getallen) kan een populatie met betrekking tot verschillende variabelen geordend worden. Voor bijvoorbeeld een dataset met de inkomens en vermogens van huishoudens kan gekeken worden naar het gemiddelde inkomen per inkomensdeciel en het gemiddelde vermogen per vermogensdeciel. Voor de samenhang tussen beide variabelen kan ook naar het gemiddelde vermogen per inkomensdeciel gekeken worden.[1]

Definitie bewerken

Voor een ordinaal kenmerk   van een abstracte populatie gegeven door een kansverdeling is het getal   een  -kwantiel als:

 

en

 

In het bijzonder kunnen er dus meerdere  -kwantielen bestaan. Om eenduidigheid af te dwingen wordt door sommige auteurs het gemiddelde van de mogelijke waarden die als kwantiel in aanmerking komen, als kwantiel gedefinieerd.

In termen van de verdelingsfunctie   van   zijn de bovenstaande eisen:

 

en

 

Bij een continue stochastische variabele   met strikt stijgende verdelingsfunctie   is het  -kwantiel de eenduidige   waarvoor geldt:

 ,

oftewel

 

Voor een concrete populatie of een steekproef, bestaande uit   getallen  , waaronder mogelijk gelijke, wordt het  -kwantiel   bepaald door de eisen:

  • ten minste   van de data zijn kleiner dan of gelijk aan  .
  • ten minste   van de data zijn groter dan of gelijk aan  .

Hier geldt hetzelfde als in een discrete verdeling: als twee aangrenzende uitkomsten aan de eisen voldoen, neemt men het gemiddelde van beide als kwantiel.

In een abstracte of concrete populatie is een kwantiel een parameter van de populatie. In een steekproef is een kwantiel een schatting van het overeenkomstige kwantiel in de populatie waaruit de steekproef getrokken is.

Voorbeelden bewerken

Het 0,20-kwantiel   in een exponentiële verdeling met parameter 1 wordt bepaald door de vergelijking:

 ,

waaruit volgt:

 


Het 0,2-kwantiel van de (geordende) dataset van 9 data:

 

is het getal 3. Er zijn 2, dus ten minste 0,2×9=1,8 getallen kleiner dan of gelijk aan 3 en er zijn 8, dus ten minste 0,8×9=7,2 getallen groter dan of gelijk aan 3.

Van de dataset:

 

met 10 data voldoen zowel 3 als 5 aan de eisen. Het 0,2-kwantiel kwantiel is dus (3+5)/2 = 4. Het getal 4 scheidt de dataset mooi in een deel van 2 en een deel van 8 getallen.

Formule bewerken

Als de dataset een eindige populatie of een steekproefuitkomst betreft van   elementen, is het  -kwantiel het "element" met als rangnummer in de geordende data:

 

Het woord "element" staat tussen aanhalingstekens, want niet altijd is dit rangnummer een geheel getal. Als kwantiel wordt dan het gemiddelde van de omliggende elementen gekozen.

Speciale kwantielen bewerken

De kwantielen die behoren bij een verdeling in 2, 4, 10 of 100 delen hebben een aparte naam. Bij een verdeling in: