Diskrete Zufallsvariablen Erste Beispiele diskreter Verteilungen Bernoulli-Verteilung Eine diskrete Zufallsvariable X heißt bernoulliverteilt mit Parameter p, falls sie die Wahrscheinlichkeitsfunktion

x = 1,  p,  f ( x ) = P( X = x ) =  1 − p, x = 0,  0, sonst  besitzt.

Bedeutung?

Beispiel?

Bemerkung Bei einem Zufallsvorgang oft von Interesse ob ein Ereignis A eintritt oder nicht Kodierung durch „Bernoulli-Variable“ Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

407

Diskrete Zufallsvariablen Diskrete Gleichverteilung Eine diskrete Zufallsvariable X heißt gleichverteilt auf dem Träger

T = { a1 , a2 , K, ak } , falls sie die Wahrscheinlichkeitsfunktion f ( x ) = P (X = a j ) = besitzt.

Bedeutung?

1 , j = 1, K , k k Beispiel?

Geometrische Verteilung Eine diskrete Zufallsvariable X heißt geometrisch verteilt mit Parameter p, kurz X ~ G(p), falls sie die Wahrscheinlichkeitsfunktion

 (1 − p )x −1 p, x = 1, 2, K , f (x ) = P( X = x ) =  0, sonst  besitzt.

Wie lautet die Summe aller Wahrscheinlichkeiten? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

408

Diskrete Zufallsvariablen Modell der geometrischen Verteilung Bei einem Zufallsvorgang sei nur von Interesse, ob ein bestimmtes Ereignis A eintritt oder nicht, wobei P(A) = p mit 0 < p < 1. Der Zufallsvorgang wird nun unabhängig voneinander so oft wiederholt, bis zum ersten Mal A eintritt. Definiere Zufallsvariable X = „Anzahl der Versuche bis zum ersten Mal A eintritt“

!

Gelegentlich auch alternative Definition: X = „Anzahl der Fehlerversuche bis zum ersten Mal A eintritt“

P( X = 1) = P( A1 ) = p,

Warum geht das?

P( X = 2 ) = P (A1 ∩ A2 ) = P (A ) P( A) = (1 − P ( A)) P ( A) = (1 − p ) p,

P( X = 3) = P (A1 ∩ A2 ∩ A3 ) = P (A ) P (A ) P( A) = (1 − P ( A)) P ( A) = (1 − p ) p, 2

2

M k −1 P( X = k ) = P (A1 ∩ K ∩ Ak −1 ∩ Ak ) = P (A )⋅ K ⋅ P (A ) P ( A) = (1 − p ) p. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

409

Diskrete Zufallsvariablen Geometrische Verteilung mit p =0.1

Geometrische Verteilung mit p =0.5

Träger? Anwendungsmöglichkeiten:

Lebensdauer- und Wartezeitmodelle

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

410

Diskrete Zufallsvariablen Unabhängigkeit von diskreten Zufallsvariablen Zur Erinnerung: Postulat der empirischen Unabhängigkeit zweier Merkmale (vgl. S. 214): fij f i•

= f• j

fij = f• j fi•

für i = 1, ..., k und j = 1, ..., l

Übertragung auf Zufallsvariablen Unabhängigkeit von zwei diskreten Zufallsvariablen Zwei diskrete Zufallsvariablen X und Y mit Trägern TX = { a1 , a2 ,K, ak ,K} und

TY = { b1 , b2 ,K, bl ,K} heißen unabhängig, falls für beliebige x ∈ TX und y ∈ TY P( X = x, Y = y ) = P( X = x ) P(Y = y )

gilt.

Analogie zur Unabhängigkeit von zwei Ereignissen? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

411

Diskrete Zufallsvariablen Bemerkung: Sind zwei Zufallsvariablen X und Y gemäß dieser Definition unabhängig, so folgt sogar allgemeiner die Unabhängigkeit von zwei Ereignissen der Form

{X ∈A}

und { Y ∈ B }, wobei A und B zulässige Bereiche auf der Menge der reellen Zahlen sind (vgl. S. 399). Beispiel: Zweimaliger Würfelwurf X = „Augenzahl im ersten Wurf“, Y = „Augenzahl im zweiten Wurf“ Klar:

P( X = 1, Y = 2) = P( X = 1) P(Y = 2) = 1 / 6 ×1 / 6 = 1 / 36.

Es gilt aber auch P( X ≤ 2, Y = 1) = P( X ≤ 2) P(Y = 1) = 1 / 3 ×1 / 6 = 1 / 18,

da

P( X ≤ 2, Y = 1) = P( X = 1, Y = 1) + P( X = 2, Y = 1) = P( X = 1) P(Y = 1) + P( X = 2) P(Y = 1) = [P( X = 1) + P( X = 2)] P(Y = 1) = P( X ≤ 2) P(Y = 1) . Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

412

Diskrete Zufallsvariablen Unabhängigkeit von mehreren diskreten Zufallsvariablen Die diskreten Zufallsvariablen X1, X2, ..., Xn heißen unabhängig, falls für beliebige Werte x1, x2, ..., xn aus den jeweiligen Trägern

P( X 1 = x1 , X 2 = x2 ,K, X n = xn ) = P( X 1 = x1 ) P( X 2 = x2 ) ⋅K⋅ P( X n = xn ) gilt.

Analogie zur Unabhängigkeit von mehreren Ereignissen?

Bemerkung: Beachte: Aus der Unabhängigkeit gemäß dieser Definition lässt sich wiederum die Unabhängigkeit von mehreren Ereignissen ableiten. Beispiel: Dreimaliger Würfelwurf Xi = „Augenzahl im i-ten Wurf“, i = 1, 2, 3.

Dann gilt z.B.: P( X 1 ≤ 2, X 2 = 1) = P( X 1 ≤ 2) P( X 2 = 1) = 1 / 3 ×1 / 6 = 1 / 18, da Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

413

Diskrete Zufallsvariablen 6

6

i =1

i =1

P( X 1 ≤ 2, X 2 = 1) = ∑ P( X 1 = 1, X 2 = 1, X 3 = i ) + ∑ P( X 1 = 2, X 2 = 1, X 3 = i ) 6

6

i =1

i =1

= ∑ P( X 1 = 1)P( X 2 = 1)P( X 3 = i ) + ∑ P( X 1 = 2)P( X 2 = 1)P( X 3 = i ) 6

6

i =1

i =1

= P( X 1 = 1)P( X 2 = 1)∑ P( X 3 = i ) + P( X1 = 2)P( X 2 = 1)∑ P( X 3 = i ) = P( X 1 = 1) P( X 2 = 1) + P( X 1 = 2) P( X 2 = 1)

= [P( X1 = 1) + P( X1 = 2)]P( X 2 = 1) = P( X 1 ≤ 2) P( X 2 = 1) . „Unabhängige Zufallsvariablen erzeugen unabhängige Ereignisse“.

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

414

Diskrete Zufallsvariablen Berechnung von Lageparametern Berechnung von Erwartungswerten Erwartungswert einer diskreten Zufallsvariablen Der Erwartungswert E ( X ) einer diskreten Zufallsvariable X ist gegeben durch

E ( X ) = a1 p1 + K + ak pk + K = ∑ a j p j = ∑ a j P(X = a j ) = ∑ a j f (a j ). j ≥1

j ≥1

j ≥1

Anstelle von E ( X ) wird auch häufig das Symbol µ X oder einfach µ verwendet. Analogie in deskriptiver Statistik? Interpretation?

!

Erwartungswert kann bereits vor Ablauf des Zufallsvorgangs berechnet werden. Die Berechnung beruht also nicht auf vorliegenden Daten!

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

!

415

Wie ist der Erwartungswert zu interpretieren?

416

Was unterscheidet arithmetisches Mittel und Erwartungswert?

417

Diskrete Zufallsvariablen Beispiel: Würfelwurf Sei X = „Augenzahl“ beim einmaligen Würfelwurf. 1 1 1 1 1 1 E( X ) = a1 p1 + K + a6 p6 = 1⋅ + 2 ⋅ + 3 ⋅ + 4 ⋅ + 5 ⋅ + 6 ⋅ = 3.5 6 6 6 6 6 6 Angenommen, ein Würfel werde fünfmal unabhängig voneinander geworfen. Sei nun X i die Augenzahl beim i-ten Würfelwurf für i = 1, ..., 5. Dann sind die Zufallsvariablen X 1 , X 2 ,K, X 5 stochastisch unabhängig und identisch verteilt wie X. Lauten die Ergebnisse der Zufallsexperimente (Realisationen)

x1 = 4, x2 = 3, x3 = 1, x4 = 3, x5 = 6, so ergibt sich für das arithmetische Mittel der Realisationen (Beobachtungswerte) 1 5 x = ∑ xi = 3.2. n i =1 Was ist bei einer 1000-maligen Wiederholung des Experiments zu erwarten?

!

Beachte: Zufallsvariablen werden i.d.R. groß, Realisationen klein geschrieben. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

418

Diskrete Zufallsvariablen Transformationsregel für Erwartungswerte Sei X eine diskrete Zufallsvariable und g(x) eine reelle Funktion. Dann gilt für Y = g(X):

E(Y ) = E (g ( X )) = ∑ g (a j ) p j = ∑ g (a j ) f (a j ). j ≥1

Beispiel:

j ≥1

Sei X = „Augenzahl“ beim einmaligen Würfelwurf

( )= ∑ j 6

EX

2

j =1

2

1 1 1 1 1 1 1 ⋅ = 12 ⋅ + 22 ⋅ + 32 ⋅ + 42 ⋅ + 52 ⋅ + 66 ⋅ = 15.167 6 6 6 6 6 6 6

Erwartungswert bei Lineartransformation Sei X eine diskrete Zufallsvariable. Dann gilt für Y = a + bX:

E (Y ) = a + b E ( X ) .

Analogie in deskriptiver Statistik?

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

419

Diskrete Zufallsvariablen Beachte:

E (Y ) = ∑ b j p j = ∑ (a + ba j ) p j = ∑ ap j + b∑ a j p j j

j

j

j

= a∑ p j + bE( X ) = a + bE( X ) j

für b j = a + ba j . Erwartungswert der Summe von Zufallsvariablen Für zwei diskrete Zufallsvariablen X und Y gilt:

E( X + Y ) = E( X ) + E (Y ) . Für n diskrete Zufallsvariablen X 1 , X 2 ,K, X n und n Konstanten c1 , c2 ,K, cn gilt:

E(c1 X1 + c2 X 2 + K + cn X n ) = c1E( X1 ) + c2 E( X 2 ) + K + cn E( X n ) . Ohne formalen Beweis Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

420

Diskrete Zufallsvariablen Produktregel für unabhängige Zufallsvariablen Für zwei unabhängige(!) diskrete Zufallsvariablen X und Y gilt:

E( X ⋅ Y ) = E( X ) E(Y ) . Ohne formalen Beweis Beispiel: Beim zweimaligen Würfeln gilt für das Produkt der Augenzahl X und Y

E( X ⋅Y ) = 3.5 ⋅ 3.5 = 12.25 . Wie würden Sie ohne Produktregel E( X ⋅ Y ) berechnen?

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

421

Diskrete Zufallsvariablen Berechnung von Quantilen Quantile und Median einer diskreten Zufallsvariable Sei X eine diskrete Zufallsvariable mit Verteilungsfunktion F(x). Dann heißt qα mit 0 < α < 1 α-Quantil von X, falls

F (qα ) = P( X ≤ qα ) ≥ α und

F (qα − ε ) < α für ε > 0 .

Interpretation?

Analogie in deskriptiver Statistik? Für α = 0.5 heißt q0.5 Median. Beispiel: Einmaliger Würfelwurf

aj

1

f (a j ) 1/6

F (a j ) 1/6

2

3

4

5

6

1/6

1/6

1/6

1/6

1/6

2/6

3/6

4/6

5/6

1

Fortsetzung auf Folgeseite ...

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

422

Diskrete Zufallsvariablen Übung: Zeichnen Sie die Verteilungsfunktion der diskreten Zufallsvariablen X, wobei X = „Augensumme beim einmaligen Würfelwurf“. Bestimmen Sie anschließend das 0.25-, das 0.5- und das 0.75-Quantil von X.

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

423

Diskrete Zufallsvariablen Aufgabe 48 Gegeben sei die Situation des viermaligen Münzwurfs (vgl. S. 395 und 405). Die Zufallsvariable X gebe die Anzahl von „Zahl“ an. R

F Der Erwartungswert von X ist gleich 2. Der Median von X ist gleich 2.5. Das 0.25-Quantil ist gleich 1.5. Das 0.75-Quantil ist gleich 3. Der Erwartungswert von X3 ist gleich 8. Der Erwartungswert von Y mit Y = 2X2 - 8 ist gleich 0. Würde die Münze 5 mal geworfen, so wäre der Erwartungswert für die Anzahl von „Zahl“ gleich 2.5.

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

424

Diskrete Zufallsvariablen Berechnung von Streuungsparametern Varianz und Standardabweichung einer diskreten Zufallsvariable Die Varianz Var( X ) einer diskreten Zufallsvariable X ist gegeben durch

(

) ( )

Var( X ) = E ( X − µ ) = E X 2 − µ 2 2

= ∑ (a j − µ ) f (a j ) 2

j ≥1

2

  = ∑ a 2j f (a j ) −  ∑ a j f (a j ) . j ≥1  j ≥1  Anstelle von Var( X ) wird auch häufig das Symbol σ X2 oder einfach σ 2 verwendet. Die Standardabweichung ist σ = σ 2 = Var( X ) . Analogie in deskriptiver Statistik? Interpretation? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

425

Diskrete Zufallsvariablen Beachte:

(

) (

E ( X − µ ) = E X 2 − 2 Xµ + µ 2 2

( ) = E ( X ) − 2µ = E (X ) − µ

)

( )

= E X 2 − 2µ E ( X ) + E µ 2 2 2

2

+ µ2

2

Die anderen Gleichungen in der Definition folgen aus den Rechenregeln für Erwartungswerte. Beispiel: Würfelwurf Sei X = „Augenzahl“ beim einmaligen Würfelwurf.

( )

Var( X ) = E X 2 − µ 2 1 1 1 1 1 1 = 12 ⋅ + 22 ⋅ + 32 ⋅ + 42 ⋅ + 52 ⋅ + 62 ⋅ − 3.52 6 6 6 6 6 6 = 15.167 − 12.25 = 2.917 Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

426

Diskrete Zufallsvariablen Angenommen, ein Würfel werde fünfmal unabhängig voneinander geworfen. Sei nun X i die Augenzahl beim i-ten Würfelwurf für i = 1, ..., 5. Dann sind die Zufallsvariablen X 1 , X 2 ,K, X 5 stochastisch unabhängig und identisch verteilt wie X. Lauten die Ergebnisse der Zufallsexperimente (Realisationen) x1 = 4, x2 = 3, x3 = 1, x4 = 3, x5 = 6, so ergibt sich für die (empirische) Varianz der Realisationen (Beobachtungswerte) 1 5 1 5 2 2 2 s = ∑ (xi − x ) = ∑ xi − x 2 = 14.2 − 3.22 = 3.96 . n i =1 n i =1 Was ist bei einer 1000-maligen Wiederholung des Experiments zu erwarten? Weitaus schwierigere Frage: Angenommen, der fünfmalige Würfelwurf werde 1000 mal wiederholt und jedes mal die empirische Varianz berechnet. Würde das arithmetische Mittel der einzelnen Varianzen dann der Varianz von X (nahezu) entsprechen? Problemfeld der schließenden Statistik: „Erwartungstreue Schätzung“ der Parameter von Verteilungen durch endliche Stichproben. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

427

Diskrete Zufallsvariablen Varianz bei Lineartransformation Sei X eine diskrete Zufallsvariable. Dann gilt für Y = a + bX:

Var(Y ) = b 2Var( X ) und σ Y = b σ X .

Analogie in deskriptiver Statistik?

(

) (

Beweis: Var(Y ) = σ Y2 = Var(a + bX ) = E (a + bX − E (a + bX )) = E (a + bX − a − bµ )

(

)

(

2

)

= E b 2 ( X − µ ) = b 2 E ( X − µ ) = b 2Var( X ) = b 2σ X2 2

2

2

)

Varianz der Summe von unabhängigen Zufallsvariablen Für unabhängige diskrete Zufallsvariablen X und Y bzw. X 1 , X 2 ,K, X n gilt:

Var( X + Y ) = Var( X ) + Var(Y ) und mit beliebigen Konstanten c1 , c2 ,K, cn

Var(c1 X 1 + c2 X 2 + K + cn X n ) = c12Var( X 1 ) + c22Var( X 2 ) + K + cn2Var( X n ) . Ohne formalen Beweis Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

428

Diskrete Zufallsvariablen Übung: Berechnen Sie die Varianz für X, falls X einer Bernoulli-Verteilung genügt. Wahrscheinlichkeitsfunktion der Bernoulli-Verteilung

x = 1,  p,  f ( x ) = P( X = x ) =  1 − p, x = 0,  0, sonst 

Var ( X ) =

Für welchen Wert von p ist die Varianz von X maximal?

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

429

Diskrete Zufallsvariablen Aufgabe 49 Gegeben sei eine diskrete Zufallsvariable X. Dann gilt stets: R

F

Var ( X ) = 0, falls E ( X ) = 0,

( )

E X 2 ≥ (E ( X )) = µ X2 , 2

Var ( X + a ) = Var ( X ) für jede beliebige Konstante a, Var (− X ) = − Var ( X ) . Aufgabe 50 Gegeben sei die Situation des viermaligen Münzwurfs (vgl. S. 395 und 405). Die Zufallsvariable X gebe die Anzahl von „Zahl“ an. R

F Die Varianz von X ist gleich 2. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

430

Diskrete Zufallsvariablen Aufgabe 51 Für zwei unabhängige diskrete Zufallsvariablen X und Y gilt stets: R

F

Var ( X − Y ) = Var ( X + Y ) , Var ( X − Y ) = Var ( X ) − Var (Y ) , Var (2 X + 2Y ) = 4 Var ( X + Y ) .

Aufgabe 52 Seien X 1 , X 2 ,K, X n stochastisch unabhängig und identisch verteilt mit

E ( X i ) = µ und Var ( X i ) = σ 2 für i = 1, ..., n. Dann gilt: R

F

1 n  E ∑ X i  = µ  n i =1  1 n  σ2 Var  ∑ X i  =  n i =1  n Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

431

Diskrete Zufallsvariablen Spezielle diskrete Verteilungsmodelle Ziel: Lösung bestimmter Problemstellungen durch parametrische Verteilungen. Parametrische Verteilung: Wahrscheinlichkeitsfunktion wird durch einen oder mehrere Parameter bestimmt, z.B. Bernoulli-Verteilung und Geometrische Verteilung (jeweils einparametrige Verteilungen mit Parameter p) Binomialverteilung Urnenmodell: Aus einer Urne mit N Kugeln, darunter M schwarze und N-M weiße Kugeln, werden n Kugeln mit Zurücklegen gezogen. Die Zufallsvariable X gebe gerade die Anzahl der schwarzen Kugeln in der Stichprobe an. Wie sieht die Verteilung von X aus? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

432

Diskrete Zufallsvariablen Realisation könnte z.B. so aussehen:

x=2

Wie groß ist die Wahrscheinlichkeit für dieses Ergebnis? Wahrscheinlichkeit für Ereignis A = „schwarze Kugel“ ist bei jedem Zug p = M/N = 1/3. Die Wahrscheinlichkeit für dieses spezielle Ergebnis errechnet sich dann durch

1  1 1  1 4 P ( A ∩ A ∩ A ∩ A ) = P ( A) P ( A ) P ( A ) P ( A ) = ⋅ 1 −  ⋅ ⋅ 1 −  = . 3  3  3  3  81 Allerdings folgt daraus nicht

P( X = 2) = 4 / 81 , da z.B. auch das Ergebnis

{X =2}

A ∩ A ∩ A ∩ A das Ereignis

impliziert.

 4 Nach kombinatorischen Überlegungen (vgl. S. 363) gibt es hier genau   = 6  2 mögliche Ergebnisse (Elementarereignisse) , die das Ereignis { X = 2 } implizieren. Damit gilt:

 4  1  P( X = 2) =   ⋅    2  3 

2

2

4 24  1 ⋅ 1 −  = 6 ⋅ = = 0.2963 . 81 81  3

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

433

Diskrete Zufallsvariablen Binomialverteilung Eine Zufallsvariable X heißt binomialverteilt mit den Parametern n und p, kurz X ~ B(n, p), wenn sie die Wahrscheinlichkeitsfunktion

  f (x ) =   

 n x   p (1 − p )n− x , x = 0, 1, K, n  x Bedeutung? 0, sonst

besitzt. Die Verteilung heißt Binomialverteilung oder kurz B(n, p)-Verteilung. Binomialverteilung und Bernoulli-Verteilung Die B(1, p)-Verteilung entspricht gerade einer Bernoulli-Verteilung mit Parameter p. Sind X 1 , X 2 ,K, X n stochastisch unabhängig B(1, p)-verteilt, so ist die Summe n

X = ∑ Xi

B(n, p)-verteilt.

i =1

Damit folgt unmittelbar: Sind X ~ B(n, p) und Y ~ B(m, p) unabhängig, so ist X + Y ~ B (n+ m, p). Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

434

Diskrete Zufallsvariablen Betrachte nochmals das vorige Urnenmodell. Das Ereignis A = „schwarze Kugel“ wird nun mit der Zahl 1 kodiert und das Gegenereignis mit 0. Dann ist X bernoulliverteilt mit Parameter p = 1/3, falls nur einmal gezogen wird. Da nun aber n mal unabhängig (mit Zurücklegen) gezogen wird, entspricht X gerade der Summe von n unabhängigen Bernoulli-Variablen. x1=0 x2=1 x3=0 x4=1 x = x1 + x2 + x3 + x4 = 2

Erwartungswert und Varianz der Binomialverteilung a) Falls X ~ B(1, p)-verteilt, so gilt:

E ( X ) = p, Var ( X ) = p (1 − p ) .

b) Falls X ~ B(n, p)-verteilt, so gilt:

E( X ) = n p, Var ( X ) = n p (1 − p ) .

Beweis von a) ist klar (vgl. auch Übung S. 429). Teil b) folgt aus dem Zusammenhang von Binomial- und Bernoulli-Verteilung. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

435

Diskrete Zufallsvariablen Beispiele :Wahrscheinlichkeitsfunktionen der Binomialverteilung für n = 10

Schief oder symmetrisch?

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

436

Diskrete Zufallsvariablen Beispiele :Wahrscheinlichkeitsfunktionen der Binomialverteilung für p = 0.1

Bedeutung?

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

437

Diskrete Zufallsvariablen Hypergeometrische Verteilung

Urnenmodell: Aus einer Urne mit N Kugeln, darunter M schwarze und N-M weiße Kugeln, werden n Kugeln ohne Zurücklegen gezogen. Die Zufallsvariable X gebe gerade die Anzahl der schwarzen Kugeln in der Stichprobe an.

4 5 1

2 6

3

Wie sieht die Verteilung von X aus?

Realisation könnte z.B. so aussehen:

1

6

3

5

x=2

Wie groß ist die Wahrscheinlichkeit für dieses Ergebnis? Klar: Die Ergebnisse der einzelnen Züge sind nicht mehr unabhängig voneinander. Weshalb? Was passiert, falls n/N (Auswahlsatz) sehr klein ist? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

438

Diskrete Zufallsvariablen Verteilung von X durch rein kombinatorische Überlegungen ermitteln Wir beachten folgende „kombinatorischen Fakten“ für das Ziehen ohne Zurücklegen und ohne Berücksichtigung der Anordnung.

 6 1. Es gibt genau   = 15 Möglichkeiten, 4 Kugeln aus 6 Kugeln zu ziehen.  4  2

2. Es gibt genau   = 1 2

 

Möglichkeit, aus den 2 schwarzen Kugeln 2 zu ziehen.

 4 3. Es gibt genau   = 12 Möglichkeiten, aus den 4 weißen Kugeln 2 zu ziehen.  2 Die Wahrscheinlichkeit aus einer Urne mit 4 weißen und 2 schwarzen Kugeln in vier Zügen genau 2 schwarze und 2 weiße Kugeln zu ziehen beträgt damit

 2  4 P( X = 2 ) =   ⋅    2  2

 6  12   = = 0.75 . 4 15  

Weshalb?

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

439

Diskrete Zufallsvariablen Hypergeometrische Verteilung Eine Zufallsvariable X heißt hypergeometrisch verteilt mit den Parametern n, M und N, kurz X ~ H(n, M, N), falls sie die Wahrscheinlichkeitsfunktion

    f (x ) =     

M N − M      x n x −   , N   n

x ∈T

0,

sonst

Bedeutung? Was soll denn das?

besitzt. Dabei ist T durch T = { max(0, n − ( N − M )), K, min (n, M ) } gegeben. Es gilt:

E(X ) = n

M M , Var ( X ) = n N N

 M  N −n . 1 −  N  N −1 

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

Interpretation? Beweis?

440

Diskrete Zufallsvariablen Poisson-Verteilung Eine Zufallsvariable X, die zählt, wie oft ein relativ seltenes Ereignis in einem festen, vorgegebenen Zeitintervall auftritt, kann oft als poissonverteilt angenommen werden. Ebenso erhält man die Poisson-Verteilung als Grenzverteilung der B(n, p)-Verteilung, falls p sehr klein und n sehr groß ist (vgl. Seite 443). Poisson-Verteilung Eine Zufallsvariable X heißt poissonverteilt mit Parameter λ > 0, kurz X ~ Po(λ), falls sie die Wahrscheinlichkeitsfunktion

 λx − λ e , x ∈ { 0, 1, 2, K }  f (x ) =  x !   0, sonst

Bedeutung?

besitzt. Es gilt: E ( X ) = λ , Var ( X ) = λ . Sind X ~ Po(λ1) und Y ~ Po(λ2) unabhängig, so ist X + Y ~ Po (λ1+λ2). Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

441

Diskrete Zufallsvariablen Beispiele :Wahrscheinlichkeitsfunktionen der Poisson-Verteilung

Bedeutung?

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

442

Diskrete Zufallsvariablen Verteilungskonvergenz der Binomialverteilung gegen die Poisson-Verteilung Sei X binomialverteilt mit Parametern n und p. Für np = λ gilt dann:

 n x n  λ   λ   λ  n− x   ( ) ( ) =     1 −  1 −  P X = x =   p 1− p  x  x  n   n   n  x

n

−x

n ⋅ (n − 1) ⋅K ⋅ (n − x + 1) λx  λ   λ  = ⋅ ⋅  1 −  1 −  . x n x!  n   n  −x

n

Damit folgt für festes x und festes λ für n → ∞

n−x+ j → 1, n

1 ≤ j ≤ x,

 λ 1 −  → 1  n x

Daraus folgt

P( X = x ) →

Bedeutung?

 λ −λ 1 −  → e .  n n

und

λx x!

e −λ für n → ∞ .

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

443

Diskrete Zufallsvariablen Beispiel: Anzahl von Schadensmeldungen bei einer Sachversicherung Die Wahrscheinlichkeit für einen Versicherungsfall eines Versicherungsnehmers bei einer Sachversicherung bezogen auf einen Zeitraum von einem Jahr beträgt p = 0.0001. Angenommen, die Anzahl der Versicherungsnehmer ist n = 10000. Im Falle von mehr als 30 Versicherungsfällen wäre das Versicherungsunternehmen ruiniert. Es interessiert nun die Frage, mit welcher Wahrscheinlichkeit mehr als 30 Versicherungsfälle eintreten. Zur Vereinfachung sei angenommen, dass die einzelnen Versicherungsfälle stets unabhängig voneinander eintreten. Für X = „Anzahl der Versicherungsfälle“ gilt X ~ B(10000, 0.0001). Weshalb?

n n− x 1 − P( X ≤ 30) = 1 − ∑   p x (1 − p ) x =0  x  30

Exakte Lösung wäre also:

Probleme?

Da nun p „klein“ und n „groß“, kann X ~ Po(λ) mit λ = np = 1 angenommen werden. 30

Damit gilt:

1 − P( X ≤ 30 ) ≈ 1 − ∑ x =0

λx x!

e

−λ

30

1 −1 1 30 1 = 1− ∑ e = 1− ∑ ≈ 0 e x =0 x ! x =0 x !

Wann ist p „klein“ und wann ist n „groß“? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

444

Diskrete Zufallsvariablen Diskrete Verteilungen im Überblick Verteilung

Wahrscheinlichkeitsfunktion

X ~ B(n, p )

  f (x ) =   

 n x   p (1 − p )n − x , x = 0, 1, K, n  x 0, sonst

X ~ H (n, M , N )

  f (x ) =   

M N − M       x  n− x  0,

(n, M, N „sinnvoll“)

N   , x ∈ T n sonst

E(X)

Var(X)

np

np(1 − p )

M N

siehe Seite 440

n

X ~ Po(λ )

 λx − λ  f ( x ) =  x ! e , x ∈ { 0, 1, 2, K },  0, sonst

λ

λ

X ~ G (λ )

 (1 − p )x −1 p, x = 1, 2, K , f (x ) =  0, sonst 

1 p

1− p p2

(λ > 0)

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

445

Diskrete Zufallsvariablen Diskrete Verteilungsmodelle und Approximationsregeln Anzahl des Eintretens von A in n Versuchen (n mal Ziehen) B(n, p) Modell mit Zurücklegen unabhängige Wiederholungen

n/N klein p = M/N

p klein, n groß np = λ

G(p) Anzahl der Versuche bis zum Eintreten von A

Po(λ) Anzahl der beobachteten Ereignisse in einem Zeitintervall

H(n, M, N) Modell ohne Zurücklegen

n/N klein, M/N klein, N groß nM/N = λ Approximationsregeln n/N klein:

< 0.05

p bzw. M/N klein: < 0.05 n bzw. N groß:

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

> 30 446

Diskrete Zufallsvariablen Aufgabe 53 Beim Lotto 6 aus 49 (Ziehen ohne Zurücklegen und ohne Berücksichtigung der Anordnung) ist die Wahrscheinlichkeit R

F für 6 gerade Zahlen größer als 2%, für mindestens 1 Richtige größer als 50%, für genau 1 Richtige größer als 40%, für mindestens 3 Richtige größer als 2%,

Aufgabe 54 Ein Versicherungsvertreter schließt mit 5 Kunden, die alle das gleiche Alter besitzen, Lebensversicherungsverträge ab. Nach der Sterbetafel beträgt die Wahrscheinlichkeit, die nächsten 30 Jahre zu überleben, für jeden Versicherungsnehmer 0.65. Die Wahrscheinlichkeit dafür, dass nach 30 Jahren Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

447

Diskrete Zufallsvariablen R

F alle Kunden noch leben, ist größer als 0.1, wenigstens 3 Kunden noch leben, ist größer als 0.8, genau 2 Kunden noch leben, ist kleiner als 0.2, höchstens 1 Kunde noch lebt, ist kleiner als 0.05,

Aufgabe 55 Folgende Verteilungsapproximationen sind zulässig: R

F H(4, 50, 100)-Verteilung durch B(4, 0.5)-Verteilung, B(0.03, 100)-Verteilung durch Po(3)-Verteilung, H(4, 10, 100)-Verteilung durch Po(0.4)-Verteilung.

Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen

448