Verdelingsfunctie

In de kansrekening en de statistiek is de verdelingsfunctie, ook aangeduid als cumulatieve (kans)verdelingsfunctie of cumulatieve distributiefunctie (cdf), van een reëelwaardige stochastische variabele de functie waarmee de verdeling van de stochastische variabele beschreven of vastgelegd wordt. De verdelingsfunctie bestaat altijd en voor elke gebeurtenis die de stochastische variabele betreft, kan daarmee de kans op die gebeurtenis bepaald worden. Populair gezegd worden alle kansen betreffende de stochastische variabele bepaald door de verdelingsfunctie.

Elke functie die opgevat kan worden als verdelingsfunctie van een stochastische variabele, wordt ook verdelingsfunctie genoemd. Het betreft dan een functie met de hieronder aangeduide eigenschappen.

Definitie bewerken

De verdelingsfunctie van de stochastische variabele   op de kansruimte  , is de functie  , gedefinieerd voor   door:

 .

(Let op het verschil tussen   en  .)

De waarde   van de verdelingsfunctie van   in het punt  , is dus de (cumulatieve) kans op waarden van   kleiner dan of gelijk aan  .

Eigenschappen bewerken

Een verdelingsfunctie is een monotoon stijgende, rechtscontinue functie   met domein   en bereik  , waarvoor geldt:

 

en

 .

Rechtscontinu betekent:

 .

Monotoon stijgend betekent:

 .


De verdelingsfunctie   en de verdeling   van een stochastische variabele   zijn eeneenduidig met elkaar verbonden door de relatie:

 

Als de verdelingsfunctie absoluut continu is, dan is ze de integraal van een kansdichtheid. Als de verdeling singulier is, dan is de verdelingsfunctie soms de integraal van een discrete kansfunctie. In het algemeen garandeert de Stelling van Radon-Nikodym-Lebesgue dat de verdeling de som is van een absoluut continu en een singulier gedeelte.

Van de bekende kansverdelingen bestaan tabellen, waarin meestal de verdelingsfunctie getabelleerd is. Uit zo'n tabel kan men dus eenvoudig van die verdeling de linker overschrijdingskans aflezen.

Voorbeeld bewerken

Een willekeurig getal   tussen 0 en 1 wordt beschreven door de kansdichtheid:

  voor   en 0 elders.

De bijbehorende verdelingsfunctie is:

 

Om de kans te bepalen dat   tussen 0,33 en 0,44 ligt, berekenen we:

 .

Waardenbereik bewerken

Het waardenbereik van een stochastische variabele (de verzameling van mogelijke waarden) is het beeld van de uitkomstenruimte. Als van een stochastische variabele de verdelingsfunctie is gegeven, kan daaruit niet eenduidig het waardenbereik afgeleid worden. Als in het bovenstaande voorbeeld alleen de verdelingsfunctie gegeven is, is niet af te leiden of 0 een mogelijke waarde is, en ook niet of 1 dat is. Sterker nog, er kunnen ook nog een aftelbaar aantal onmogelijke waarden tussen 0 en 1 zijn, zonder dat dit voor de verdelingsfunctie verschil maakt.

Zie ook bewerken