Geordende steekproef

In de statistiek vormen de naar grootte gerangschikte elementen van een steekproef van continue stochastische variabelen, die onderling onafhankelijk zijn, maar niet noodzakelijk gelijkverdeeld, de geordende steekproef, meestal genoteerd als

.

Met wordt het steekproefelement aangeduid met het rangnummer . De notatie wordt ook gebruikt, waaraan tevens de steekproefomvang is te zien. Als er geen knopen zijn, geldt dus:

Als de uitkomst van de steekproef is, worden de geordende resultaten genoteerd als:

De elementen in de geordende steekproef zijn stochastisch afhankelijk en elk van de elementen is een steekproeffunctie van de oorspronkelijke steekproef. In het bijzonder is

en

Verdeling

bewerken

In de meeste gevallen worden gelijkverdeelde variabelen beschouwd, die dus een aselecte steekproef vormen.

In het algemene geval is de verdeling gecompliceerder en wordt deze gegeven door de stelling van Bapat–Beg, die in 1989 gepubliceerd werd door Bapat en Beg. De auteurs gaven geen bewijs, maar in 1994 gaf Hande een eenvoudig bewijs van de stelling.

Aselecte steekproef

bewerken

Voor een aselecte steekproef van   dus voor onderling onafhankelijke en gelijkverdeelde  -en, is de simultane verdeling voor   gegeven door de kansdichtheid:

 

De verdelingsfunctie van   wordt gegeven door:

 
 
 
 ,

want elk van de   gebeurtenissen

 

heeft dezelfde kans als

 

De dichtheid van   is:

 

Immers:

 
 
 
Andere berekening 

Dit resultaat kan ook worden verkregen door het berekenen van de afgeleide van  .

 
 
 
 
 
Minimum en maximum

Voor het minimum geldt dus:

  en  ,

en voor het maximum:

  en  

Uniforme verdeling op (0,1)

bewerken

Voor een aselecte steekproef   uit de uniforme verdeling op het interval (0,1) is:

 

Dit betekent dat   een bètaverdeling heeft met parameters   en  :

 

Stelling van Bapat-Beg

bewerken

De stochastische variabelen   zijn onderling onafhankelijk en hebben verdelingsfuncties  . De simultane verdelingsfunctie van de elementen   van de geordende steekproef wordt voor   gegeven door:

 
 ,

waarin

 
 

de permanent is van de genoemde matrix met   en onder de accolades de getallen staan, die het aantal kolommen aangeven.

Bewijs 

Definieer

 ,

dan

 
 

Daarin is, met   lopend over alle permutaties van de getallen  , en voor de eenvormigheid van de formule   en  :

 
 
 

En:

 

Voor een aselecte steekproef geeft de stelling voor bijvoorbeeld de gehele geordende steekproef:

 
 

Toepassing

bewerken

De geordende steekproef en de rangnummers spelen een belangrijke rol in de verdelingsvrije statistiek.

Als de verdelingsfunctie van de verdeling waaruit de steekproef getrokken is, bekend is, kan de geordende steekproef herleid worden tot de geordende steekproef uit de uniforme verdeling, en de eigenschappen aan de hand hiervan bestudeerd worden.

Literatuur

bewerken
  • Bapat, R. B.; Beg, M. I. (1989). "Order Statistics for Nonidentically Distributed Variables and Permanents". Sankhyā: The Indian Journal of Statistics, Series A (1961-2002) 51 (1): 79–93. JSTOR 25050725. MR 1065561.
  • David, H. A. Order Statistics, 2nd ed. New York: Wiley, 1981.
  • Gibbons, J. D. and Chakraborti, S. (Eds.). Nonparametric Statistic Inference, 3rd ed. exp. rev. New York: Dekker, 1992.
  • Hande, Sayaji (1994). "A Note on Order Statistics for Nondentically Distributed Variables". Sankhyā: The Indian Journal of Statistics, Series A (1961-2002) 56 (2): 365–368. JSTOR 25050995. MR 1664921.
  • Hogg, R. V. and Craig, A. T. Introduction to Mathematical Statistics, 3rd ed. New York: Macmillan, 1970.
  • Rose, C. and Smith, M. D. "Order Statistics." §9.4 in Mathematical Statistics with Mathematica. New York: Springer-Verlag, pp. 311-322, 2002.

Websites

bewerken