next up previous contents
Volgende: Binomiale verdeling Terug: Speciale verdelingen Vorige: Speciale verdelingen

Geometrische verdeling

Beschouw een experiment dat met kans p ``succes'' oplevert en met kans 1-p ``faalt''. De toevalsgrootheid X definiëren we als het aantal keren dat we het experiment moeten doen totdat het eerste ``succes'' optreedt. We schrijven ``succes'' tussen aanhalingstekens omdat deze benaming, die het meest gebruikelijk is, ook kan slaan op het optreden van een bitfout, waarbij het experiment het ontvangen van een bit uit een bitstroom is. Als de ``succes''-kansen van de opeenvolgende experimenten onafhankelijk van elkaar zijn, dan heeft X een geometrische verdeling.

Opdat het eerste ``succes'' optreedt bij het i-de experiment, moeten we eerst i-1 keer ``falen'' meemaken, de kans hierop is , en dan één maal ``succes'', de kans daarop is p. De i-de kans van de geometrische verdeling wordt nu gegeven door:

 

De verwachtingswaarde (eerste moment) wordt volgens de definitie van het vorige hoofdstuk gegeven door:

 

Om dit te berekenen (en voor later) is de volgende hulpformule en afleiding handig:

 

Dan is voor de geometrische verdeling het eerste moment:

 

Zo kunnen we, met iets meer moeite, ook de variantie van de geometrische verdeling berekenen. De afleiding laten we hier achterwege; het resultaat is:

 

 

Een mogelijke methode om met een computer een willekeurig aankomstproces (bijvoorbeeld van telefoon oproepen) te simuleren is om de tijdas in kleine stukjes te verdelen en per tijdsleuf (zo'n stukje) te loten of er een aankomst is in die tijdsleuf. Stel dat de tijdas is opgedeeld in tijdsleuven van 200 ms. De grootheid p geeft de kans op een aankomst voor elke tijdsleuf. De loting voor elke tijdsleuf is onafhankelijk van de lotingen in voorgaande tijdsleuven.

Gevraagd:

  1.   Hoe groot moet p gekozen worden opdat het aankomstproces gemiddeld 1 aankomst per 2 seconden genereert?
  2.   Hoe ziet de kansverdeling van het nummer van de tijdsleuf met de eerste aankomst eruit voor de in a) gevonden p?
  3.   De simulatie wordt gestart op t=0 s. Hoe groot is de kans dat er op t=2 seconde nog geen aankomst heeft plaatsgevonden?
  4.   Hoe hangt de coëfficiënt van variatie van de tussenaankomsttijd af van de waarde van p?

In een interval van 2 seconden zitten 10 tijdsleuven. En aankomst per 2 seconden betekent dus n aankomst per 10 tijdsleuven. Elke loting per tijdsleuf is op te vatten als een experiment met kans p op ``succes'' (aankomst). Het aantal tijdsleuven dat verloopt tot en met de eerste aankomst is gemiddeld . Elke volgende aankomst duurt weer gemiddeld tijdsleuven. Het antwoord op a) is dan dat met er gemiddeld één aankomst per 10 tijdsleuven is.

Ad c): Het nummer van de tijdsleuf met de eerste aankomst geeft aan het aantal keren dat de loting gedaan moet worden totdat er een ``succes'' is. Deze grootheid is een discrete stochastische variabele met een geometrische verdeling. Het histogram ziet er uit als in figuur 3.1 weergegeven.

 
Figuur: Histogram aantal lotingen tot eerste aankomst (Geometrische verdeling). 

Ad c): Op t=2 seconden zijn er 10 tijdsleuven ``achter de rug''. De kans dat er in die 10 tijdsleuven geen aankomst was is gelijk aan de kans dat de eerste aankomst in tijdsleuf 11 of later valt. Deze kans is gelijk aan de waarschijnlijkheidsmassa in de staafjes rechts van 10:

Bij d) gaat het om de coëfficiënt van variatie van een geometrisch verdeelde stochastische variabele. We moeten hier uit (3.6) en uit (3.7) invullen in de definitie (2.34). Dit geeft:

Voor is de coëfficiënt van variatie 0.949; hoe kleiner p wordt, des te dichter komt C bij 1. Alleen voor kansen p groter dan 0.1 neemt C duidelijk af; eerst langzaam en dan steeds steiler gaat C naar 0 als p de waarde 1 nadert.

De geometrische verdeling heeft, als enige discrete verdeling, de geheugenloze eigenschap. Dit wil zeggen, dat wanneer er al k experimenten gedaan zijn én er is nog geen ``succes'' opgetreden, dan is de kansverdeling van het aantal experimenten dat nog gedaan moet worden (na die eerste k) totdat ``succes'' optreedt weer dezelfde als de oorspronkelijke kansverdeling.

 
Figuur: Geheugenloze eigenschap geometrische verdeling. Kansverdeling van eerste aankomst, gegeven geen aankomst in eerste tien sleuven. 

Iets wiskundiger geformuleerd: de kansverdeling van X-k gegeven X>k, is gelijk aan de kansverdeling van X. Dit kan als volgt worden ingezien. De geometrische kansverdeling wordt gekenmerkt door de constante verhouding (ratio = 1-p) tussen opeenvolgende kansen in het histogram. Wanneer nu gegeven is: X>k, dan betekent dit dat de eerste k kansen in het histogram 0 geworden zijn. De resterende kansen worden genormeerd (om de som van de kansen weer gelijk aan 1 te maken), hetgeen de ratio van die kansen onaangetast laat. De conditionele kansverdeling (dit betekent de kansverdeling gegeven X>k) is daardoor een verschoven versie van de oorspronkelijke kansverdeling.



next up previous contents
Volgende: Binomiale verdeling Terug: Speciale verdelingen Vorige: Speciale verdelingen



Geert A. Awater
Mon Dec 11 15:33:15 MET 1995