Voor een stochastische variabele X, met verdelingsfunctie ,
is
het percentiel
de uitkomst die met p% kans niet overschreden
wordt. Voor p kan elk getal van 0 tot 100 ingevuld worden.
In formulevorm is de definitie van (het p-de percentiel):
Dit wil bijvoorbeeld zeggen dat X met 99% kans kleiner is dan, of
gelijk aan . Met 1% kans is X groter dan
.
Formule (2.35) kan ook geschreven worden als:
Let wel, p is gegeven en moet gevonden worden. Het gaat dus om
de inverse functie van
.
Gegeven de verdelingsfunctie van de tijd tussen twee opeenvolgende aankomsten van voorbeeld 2.2:
Men wil weten:
met een klein beetje algebra volgt hieruit:
Bij vraag b) hebben we in eerste instantie alleen het begrip verdelingsfunctie nodig. De gevraagde kans is:
Maar vergelijken we dit met formule (2.36) dan zien we dat bij deze kansverdeling het 63-ste percentiel bijna gelijk is aan het gemiddelde.
Bij symmetrische verdeling is juist het 50-ste percentiel (dit is de mediaan van de verdeling) gelijk aan het gemiddelde. Bij deze verdeling is dat niet het geval.
Het antwoord op c) vinden we op dezelfde wijze als bij a), en hier komt uit:
Het bepalen van percentielen komt neer op het bepalen van de
inverse functie van de verdelingsfunctie. Bij de verdelingsfunctie
van een discrete stochastische variabele stuit dit wiskundig
gezien op problemen. In dat geval moeten we definiëren als
de
kleinste waarde
waarvoor geldt:
. In de
grafiek van
zo'n verdelingsfunctie (zie figuur 2.1) komt dat neer op het
bepalen van de plaats van de ``knobbel'' die ter hoogte zit van
of, als die ``knobbel'' er niet is, de eerste die boven p% is.