Diskrete Zufallsvariablen Erste Beispiele diskreter Verteilungen Bernoulli-Verteilung Eine diskrete Zufallsvariable X heißt bernoulliverteilt mit Parameter p, falls sie die Wahrscheinlichkeitsfunktion
x = 1, p, f ( x ) = P( X = x ) = 1 − p, x = 0, 0, sonst besitzt.
Bedeutung?
Beispiel?
Bemerkung Bei einem Zufallsvorgang oft von Interesse ob ein Ereignis A eintritt oder nicht Kodierung durch „Bernoulli-Variable“ Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
407
Diskrete Zufallsvariablen Diskrete Gleichverteilung Eine diskrete Zufallsvariable X heißt gleichverteilt auf dem Träger
T = { a1 , a2 , K, ak } , falls sie die Wahrscheinlichkeitsfunktion f ( x ) = P (X = a j ) = besitzt.
Bedeutung?
1 , j = 1, K , k k Beispiel?
Geometrische Verteilung Eine diskrete Zufallsvariable X heißt geometrisch verteilt mit Parameter p, kurz X ~ G(p), falls sie die Wahrscheinlichkeitsfunktion
(1 − p )x −1 p, x = 1, 2, K , f (x ) = P( X = x ) = 0, sonst besitzt.
Wie lautet die Summe aller Wahrscheinlichkeiten? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
408
Diskrete Zufallsvariablen Modell der geometrischen Verteilung Bei einem Zufallsvorgang sei nur von Interesse, ob ein bestimmtes Ereignis A eintritt oder nicht, wobei P(A) = p mit 0 < p < 1. Der Zufallsvorgang wird nun unabhängig voneinander so oft wiederholt, bis zum ersten Mal A eintritt. Definiere Zufallsvariable X = „Anzahl der Versuche bis zum ersten Mal A eintritt“
!
Gelegentlich auch alternative Definition: X = „Anzahl der Fehlerversuche bis zum ersten Mal A eintritt“
P( X = 1) = P( A1 ) = p,
Warum geht das?
P( X = 2 ) = P (A1 ∩ A2 ) = P (A ) P( A) = (1 − P ( A)) P ( A) = (1 − p ) p,
P( X = 3) = P (A1 ∩ A2 ∩ A3 ) = P (A ) P (A ) P( A) = (1 − P ( A)) P ( A) = (1 − p ) p, 2
2
M k −1 P( X = k ) = P (A1 ∩ K ∩ Ak −1 ∩ Ak ) = P (A )⋅ K ⋅ P (A ) P ( A) = (1 − p ) p. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
409
Diskrete Zufallsvariablen Geometrische Verteilung mit p =0.1
Geometrische Verteilung mit p =0.5
Träger? Anwendungsmöglichkeiten:
Lebensdauer- und Wartezeitmodelle
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
410
Diskrete Zufallsvariablen Unabhängigkeit von diskreten Zufallsvariablen Zur Erinnerung: Postulat der empirischen Unabhängigkeit zweier Merkmale (vgl. S. 214): fij f i•
= f• j
fij = f• j fi•
für i = 1, ..., k und j = 1, ..., l
Übertragung auf Zufallsvariablen Unabhängigkeit von zwei diskreten Zufallsvariablen Zwei diskrete Zufallsvariablen X und Y mit Trägern TX = { a1 , a2 ,K, ak ,K} und
TY = { b1 , b2 ,K, bl ,K} heißen unabhängig, falls für beliebige x ∈ TX und y ∈ TY P( X = x, Y = y ) = P( X = x ) P(Y = y )
gilt.
Analogie zur Unabhängigkeit von zwei Ereignissen? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
411
Diskrete Zufallsvariablen Bemerkung: Sind zwei Zufallsvariablen X und Y gemäß dieser Definition unabhängig, so folgt sogar allgemeiner die Unabhängigkeit von zwei Ereignissen der Form
{X ∈A}
und { Y ∈ B }, wobei A und B zulässige Bereiche auf der Menge der reellen Zahlen sind (vgl. S. 399). Beispiel: Zweimaliger Würfelwurf X = „Augenzahl im ersten Wurf“, Y = „Augenzahl im zweiten Wurf“ Klar:
P( X = 1, Y = 2) = P( X = 1) P(Y = 2) = 1 / 6 ×1 / 6 = 1 / 36.
Es gilt aber auch P( X ≤ 2, Y = 1) = P( X ≤ 2) P(Y = 1) = 1 / 3 ×1 / 6 = 1 / 18,
da
P( X ≤ 2, Y = 1) = P( X = 1, Y = 1) + P( X = 2, Y = 1) = P( X = 1) P(Y = 1) + P( X = 2) P(Y = 1) = [P( X = 1) + P( X = 2)] P(Y = 1) = P( X ≤ 2) P(Y = 1) . Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
412
Diskrete Zufallsvariablen Unabhängigkeit von mehreren diskreten Zufallsvariablen Die diskreten Zufallsvariablen X1, X2, ..., Xn heißen unabhängig, falls für beliebige Werte x1, x2, ..., xn aus den jeweiligen Trägern
P( X 1 = x1 , X 2 = x2 ,K, X n = xn ) = P( X 1 = x1 ) P( X 2 = x2 ) ⋅K⋅ P( X n = xn ) gilt.
Analogie zur Unabhängigkeit von mehreren Ereignissen?
Bemerkung: Beachte: Aus der Unabhängigkeit gemäß dieser Definition lässt sich wiederum die Unabhängigkeit von mehreren Ereignissen ableiten. Beispiel: Dreimaliger Würfelwurf Xi = „Augenzahl im i-ten Wurf“, i = 1, 2, 3.
Dann gilt z.B.: P( X 1 ≤ 2, X 2 = 1) = P( X 1 ≤ 2) P( X 2 = 1) = 1 / 3 ×1 / 6 = 1 / 18, da Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
413
Diskrete Zufallsvariablen 6
6
i =1
i =1
P( X 1 ≤ 2, X 2 = 1) = ∑ P( X 1 = 1, X 2 = 1, X 3 = i ) + ∑ P( X 1 = 2, X 2 = 1, X 3 = i ) 6
6
i =1
i =1
= ∑ P( X 1 = 1)P( X 2 = 1)P( X 3 = i ) + ∑ P( X 1 = 2)P( X 2 = 1)P( X 3 = i ) 6
6
i =1
i =1
= P( X 1 = 1)P( X 2 = 1)∑ P( X 3 = i ) + P( X1 = 2)P( X 2 = 1)∑ P( X 3 = i ) = P( X 1 = 1) P( X 2 = 1) + P( X 1 = 2) P( X 2 = 1)
= [P( X1 = 1) + P( X1 = 2)]P( X 2 = 1) = P( X 1 ≤ 2) P( X 2 = 1) . „Unabhängige Zufallsvariablen erzeugen unabhängige Ereignisse“.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
414
Diskrete Zufallsvariablen Berechnung von Lageparametern Berechnung von Erwartungswerten Erwartungswert einer diskreten Zufallsvariablen Der Erwartungswert E ( X ) einer diskreten Zufallsvariable X ist gegeben durch
E ( X ) = a1 p1 + K + ak pk + K = ∑ a j p j = ∑ a j P(X = a j ) = ∑ a j f (a j ). j ≥1
j ≥1
j ≥1
Anstelle von E ( X ) wird auch häufig das Symbol µ X oder einfach µ verwendet. Analogie in deskriptiver Statistik? Interpretation?
!
Erwartungswert kann bereits vor Ablauf des Zufallsvorgangs berechnet werden. Die Berechnung beruht also nicht auf vorliegenden Daten!
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
!
415
Wie ist der Erwartungswert zu interpretieren?
416
Was unterscheidet arithmetisches Mittel und Erwartungswert?
417
Diskrete Zufallsvariablen Beispiel: Würfelwurf Sei X = „Augenzahl“ beim einmaligen Würfelwurf. 1 1 1 1 1 1 E( X ) = a1 p1 + K + a6 p6 = 1⋅ + 2 ⋅ + 3 ⋅ + 4 ⋅ + 5 ⋅ + 6 ⋅ = 3.5 6 6 6 6 6 6 Angenommen, ein Würfel werde fünfmal unabhängig voneinander geworfen. Sei nun X i die Augenzahl beim i-ten Würfelwurf für i = 1, ..., 5. Dann sind die Zufallsvariablen X 1 , X 2 ,K, X 5 stochastisch unabhängig und identisch verteilt wie X. Lauten die Ergebnisse der Zufallsexperimente (Realisationen)
x1 = 4, x2 = 3, x3 = 1, x4 = 3, x5 = 6, so ergibt sich für das arithmetische Mittel der Realisationen (Beobachtungswerte) 1 5 x = ∑ xi = 3.2. n i =1 Was ist bei einer 1000-maligen Wiederholung des Experiments zu erwarten?
!
Beachte: Zufallsvariablen werden i.d.R. groß, Realisationen klein geschrieben. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
418
Diskrete Zufallsvariablen Transformationsregel für Erwartungswerte Sei X eine diskrete Zufallsvariable und g(x) eine reelle Funktion. Dann gilt für Y = g(X):
E(Y ) = E (g ( X )) = ∑ g (a j ) p j = ∑ g (a j ) f (a j ). j ≥1
Beispiel:
j ≥1
Sei X = „Augenzahl“ beim einmaligen Würfelwurf
( )= ∑ j 6
EX
2
j =1
2
1 1 1 1 1 1 1 ⋅ = 12 ⋅ + 22 ⋅ + 32 ⋅ + 42 ⋅ + 52 ⋅ + 66 ⋅ = 15.167 6 6 6 6 6 6 6
Erwartungswert bei Lineartransformation Sei X eine diskrete Zufallsvariable. Dann gilt für Y = a + bX:
E (Y ) = a + b E ( X ) .
Analogie in deskriptiver Statistik?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
419
Diskrete Zufallsvariablen Beachte:
E (Y ) = ∑ b j p j = ∑ (a + ba j ) p j = ∑ ap j + b∑ a j p j j
j
j
j
= a∑ p j + bE( X ) = a + bE( X ) j
für b j = a + ba j . Erwartungswert der Summe von Zufallsvariablen Für zwei diskrete Zufallsvariablen X und Y gilt:
E( X + Y ) = E( X ) + E (Y ) . Für n diskrete Zufallsvariablen X 1 , X 2 ,K, X n und n Konstanten c1 , c2 ,K, cn gilt:
E(c1 X1 + c2 X 2 + K + cn X n ) = c1E( X1 ) + c2 E( X 2 ) + K + cn E( X n ) . Ohne formalen Beweis Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
420
Diskrete Zufallsvariablen Produktregel für unabhängige Zufallsvariablen Für zwei unabhängige(!) diskrete Zufallsvariablen X und Y gilt:
E( X ⋅ Y ) = E( X ) E(Y ) . Ohne formalen Beweis Beispiel: Beim zweimaligen Würfeln gilt für das Produkt der Augenzahl X und Y
E( X ⋅Y ) = 3.5 ⋅ 3.5 = 12.25 . Wie würden Sie ohne Produktregel E( X ⋅ Y ) berechnen?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
421
Diskrete Zufallsvariablen Berechnung von Quantilen Quantile und Median einer diskreten Zufallsvariable Sei X eine diskrete Zufallsvariable mit Verteilungsfunktion F(x). Dann heißt qα mit 0 < α < 1 α-Quantil von X, falls
F (qα ) = P( X ≤ qα ) ≥ α und
F (qα − ε ) < α für ε > 0 .
Interpretation?
Analogie in deskriptiver Statistik? Für α = 0.5 heißt q0.5 Median. Beispiel: Einmaliger Würfelwurf
aj
1
f (a j ) 1/6
F (a j ) 1/6
2
3
4
5
6
1/6
1/6
1/6
1/6
1/6
2/6
3/6
4/6
5/6
1
Fortsetzung auf Folgeseite ...
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
422
Diskrete Zufallsvariablen Übung: Zeichnen Sie die Verteilungsfunktion der diskreten Zufallsvariablen X, wobei X = „Augensumme beim einmaligen Würfelwurf“. Bestimmen Sie anschließend das 0.25-, das 0.5- und das 0.75-Quantil von X.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
423
Diskrete Zufallsvariablen Aufgabe 48 Gegeben sei die Situation des viermaligen Münzwurfs (vgl. S. 395 und 405). Die Zufallsvariable X gebe die Anzahl von „Zahl“ an. R
F Der Erwartungswert von X ist gleich 2. Der Median von X ist gleich 2.5. Das 0.25-Quantil ist gleich 1.5. Das 0.75-Quantil ist gleich 3. Der Erwartungswert von X3 ist gleich 8. Der Erwartungswert von Y mit Y = 2X2 - 8 ist gleich 0. Würde die Münze 5 mal geworfen, so wäre der Erwartungswert für die Anzahl von „Zahl“ gleich 2.5.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
424
Diskrete Zufallsvariablen Berechnung von Streuungsparametern Varianz und Standardabweichung einer diskreten Zufallsvariable Die Varianz Var( X ) einer diskreten Zufallsvariable X ist gegeben durch
(
) ( )
Var( X ) = E ( X − µ ) = E X 2 − µ 2 2
= ∑ (a j − µ ) f (a j ) 2
j ≥1
2
= ∑ a 2j f (a j ) − ∑ a j f (a j ) . j ≥1 j ≥1 Anstelle von Var( X ) wird auch häufig das Symbol σ X2 oder einfach σ 2 verwendet. Die Standardabweichung ist σ = σ 2 = Var( X ) . Analogie in deskriptiver Statistik? Interpretation? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
425
Diskrete Zufallsvariablen Beachte:
(
) (
E ( X − µ ) = E X 2 − 2 Xµ + µ 2 2
( ) = E ( X ) − 2µ = E (X ) − µ
)
( )
= E X 2 − 2µ E ( X ) + E µ 2 2 2
2
+ µ2
2
Die anderen Gleichungen in der Definition folgen aus den Rechenregeln für Erwartungswerte. Beispiel: Würfelwurf Sei X = „Augenzahl“ beim einmaligen Würfelwurf.
( )
Var( X ) = E X 2 − µ 2 1 1 1 1 1 1 = 12 ⋅ + 22 ⋅ + 32 ⋅ + 42 ⋅ + 52 ⋅ + 62 ⋅ − 3.52 6 6 6 6 6 6 = 15.167 − 12.25 = 2.917 Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
426
Diskrete Zufallsvariablen Angenommen, ein Würfel werde fünfmal unabhängig voneinander geworfen. Sei nun X i die Augenzahl beim i-ten Würfelwurf für i = 1, ..., 5. Dann sind die Zufallsvariablen X 1 , X 2 ,K, X 5 stochastisch unabhängig und identisch verteilt wie X. Lauten die Ergebnisse der Zufallsexperimente (Realisationen) x1 = 4, x2 = 3, x3 = 1, x4 = 3, x5 = 6, so ergibt sich für die (empirische) Varianz der Realisationen (Beobachtungswerte) 1 5 1 5 2 2 2 s = ∑ (xi − x ) = ∑ xi − x 2 = 14.2 − 3.22 = 3.96 . n i =1 n i =1 Was ist bei einer 1000-maligen Wiederholung des Experiments zu erwarten? Weitaus schwierigere Frage: Angenommen, der fünfmalige Würfelwurf werde 1000 mal wiederholt und jedes mal die empirische Varianz berechnet. Würde das arithmetische Mittel der einzelnen Varianzen dann der Varianz von X (nahezu) entsprechen? Problemfeld der schließenden Statistik: „Erwartungstreue Schätzung“ der Parameter von Verteilungen durch endliche Stichproben. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
427
Diskrete Zufallsvariablen Varianz bei Lineartransformation Sei X eine diskrete Zufallsvariable. Dann gilt für Y = a + bX:
Var(Y ) = b 2Var( X ) und σ Y = b σ X .
Analogie in deskriptiver Statistik?
(
) (
Beweis: Var(Y ) = σ Y2 = Var(a + bX ) = E (a + bX − E (a + bX )) = E (a + bX − a − bµ )
(
)
(
2
)
= E b 2 ( X − µ ) = b 2 E ( X − µ ) = b 2Var( X ) = b 2σ X2 2
2
2
)
Varianz der Summe von unabhängigen Zufallsvariablen Für unabhängige diskrete Zufallsvariablen X und Y bzw. X 1 , X 2 ,K, X n gilt:
Var( X + Y ) = Var( X ) + Var(Y ) und mit beliebigen Konstanten c1 , c2 ,K, cn
Var(c1 X 1 + c2 X 2 + K + cn X n ) = c12Var( X 1 ) + c22Var( X 2 ) + K + cn2Var( X n ) . Ohne formalen Beweis Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
428
Diskrete Zufallsvariablen Übung: Berechnen Sie die Varianz für X, falls X einer Bernoulli-Verteilung genügt. Wahrscheinlichkeitsfunktion der Bernoulli-Verteilung
x = 1, p, f ( x ) = P( X = x ) = 1 − p, x = 0, 0, sonst
Var ( X ) =
Für welchen Wert von p ist die Varianz von X maximal?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
429
Diskrete Zufallsvariablen Aufgabe 49 Gegeben sei eine diskrete Zufallsvariable X. Dann gilt stets: R
F
Var ( X ) = 0, falls E ( X ) = 0,
( )
E X 2 ≥ (E ( X )) = µ X2 , 2
Var ( X + a ) = Var ( X ) für jede beliebige Konstante a, Var (− X ) = − Var ( X ) . Aufgabe 50 Gegeben sei die Situation des viermaligen Münzwurfs (vgl. S. 395 und 405). Die Zufallsvariable X gebe die Anzahl von „Zahl“ an. R
F Die Varianz von X ist gleich 2. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
430
Diskrete Zufallsvariablen Aufgabe 51 Für zwei unabhängige diskrete Zufallsvariablen X und Y gilt stets: R
F
Var ( X − Y ) = Var ( X + Y ) , Var ( X − Y ) = Var ( X ) − Var (Y ) , Var (2 X + 2Y ) = 4 Var ( X + Y ) .
Aufgabe 52 Seien X 1 , X 2 ,K, X n stochastisch unabhängig und identisch verteilt mit
E ( X i ) = µ und Var ( X i ) = σ 2 für i = 1, ..., n. Dann gilt: R
F
1 n E ∑ X i = µ n i =1 1 n σ2 Var ∑ X i = n i =1 n Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
431
Diskrete Zufallsvariablen Spezielle diskrete Verteilungsmodelle Ziel: Lösung bestimmter Problemstellungen durch parametrische Verteilungen. Parametrische Verteilung: Wahrscheinlichkeitsfunktion wird durch einen oder mehrere Parameter bestimmt, z.B. Bernoulli-Verteilung und Geometrische Verteilung (jeweils einparametrige Verteilungen mit Parameter p) Binomialverteilung Urnenmodell: Aus einer Urne mit N Kugeln, darunter M schwarze und N-M weiße Kugeln, werden n Kugeln mit Zurücklegen gezogen. Die Zufallsvariable X gebe gerade die Anzahl der schwarzen Kugeln in der Stichprobe an. Wie sieht die Verteilung von X aus? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
432
Diskrete Zufallsvariablen Realisation könnte z.B. so aussehen:
x=2
Wie groß ist die Wahrscheinlichkeit für dieses Ergebnis? Wahrscheinlichkeit für Ereignis A = „schwarze Kugel“ ist bei jedem Zug p = M/N = 1/3. Die Wahrscheinlichkeit für dieses spezielle Ergebnis errechnet sich dann durch
1 1 1 1 4 P ( A ∩ A ∩ A ∩ A ) = P ( A) P ( A ) P ( A ) P ( A ) = ⋅ 1 − ⋅ ⋅ 1 − = . 3 3 3 3 81 Allerdings folgt daraus nicht
P( X = 2) = 4 / 81 , da z.B. auch das Ergebnis
{X =2}
A ∩ A ∩ A ∩ A das Ereignis
impliziert.
4 Nach kombinatorischen Überlegungen (vgl. S. 363) gibt es hier genau = 6 2 mögliche Ergebnisse (Elementarereignisse) , die das Ereignis { X = 2 } implizieren. Damit gilt:
4 1 P( X = 2) = ⋅ 2 3
2
2
4 24 1 ⋅ 1 − = 6 ⋅ = = 0.2963 . 81 81 3
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
433
Diskrete Zufallsvariablen Binomialverteilung Eine Zufallsvariable X heißt binomialverteilt mit den Parametern n und p, kurz X ~ B(n, p), wenn sie die Wahrscheinlichkeitsfunktion
f (x ) =
n x p (1 − p )n− x , x = 0, 1, K, n x Bedeutung? 0, sonst
besitzt. Die Verteilung heißt Binomialverteilung oder kurz B(n, p)-Verteilung. Binomialverteilung und Bernoulli-Verteilung Die B(1, p)-Verteilung entspricht gerade einer Bernoulli-Verteilung mit Parameter p. Sind X 1 , X 2 ,K, X n stochastisch unabhängig B(1, p)-verteilt, so ist die Summe n
X = ∑ Xi
B(n, p)-verteilt.
i =1
Damit folgt unmittelbar: Sind X ~ B(n, p) und Y ~ B(m, p) unabhängig, so ist X + Y ~ B (n+ m, p). Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
434
Diskrete Zufallsvariablen Betrachte nochmals das vorige Urnenmodell. Das Ereignis A = „schwarze Kugel“ wird nun mit der Zahl 1 kodiert und das Gegenereignis mit 0. Dann ist X bernoulliverteilt mit Parameter p = 1/3, falls nur einmal gezogen wird. Da nun aber n mal unabhängig (mit Zurücklegen) gezogen wird, entspricht X gerade der Summe von n unabhängigen Bernoulli-Variablen. x1=0 x2=1 x3=0 x4=1 x = x1 + x2 + x3 + x4 = 2
Erwartungswert und Varianz der Binomialverteilung a) Falls X ~ B(1, p)-verteilt, so gilt:
E ( X ) = p, Var ( X ) = p (1 − p ) .
b) Falls X ~ B(n, p)-verteilt, so gilt:
E( X ) = n p, Var ( X ) = n p (1 − p ) .
Beweis von a) ist klar (vgl. auch Übung S. 429). Teil b) folgt aus dem Zusammenhang von Binomial- und Bernoulli-Verteilung. Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
435
Diskrete Zufallsvariablen Beispiele :Wahrscheinlichkeitsfunktionen der Binomialverteilung für n = 10
Schief oder symmetrisch?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
436
Diskrete Zufallsvariablen Beispiele :Wahrscheinlichkeitsfunktionen der Binomialverteilung für p = 0.1
Bedeutung?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
437
Diskrete Zufallsvariablen Hypergeometrische Verteilung
Urnenmodell: Aus einer Urne mit N Kugeln, darunter M schwarze und N-M weiße Kugeln, werden n Kugeln ohne Zurücklegen gezogen. Die Zufallsvariable X gebe gerade die Anzahl der schwarzen Kugeln in der Stichprobe an.
4 5 1
2 6
3
Wie sieht die Verteilung von X aus?
Realisation könnte z.B. so aussehen:
1
6
3
5
x=2
Wie groß ist die Wahrscheinlichkeit für dieses Ergebnis? Klar: Die Ergebnisse der einzelnen Züge sind nicht mehr unabhängig voneinander. Weshalb? Was passiert, falls n/N (Auswahlsatz) sehr klein ist? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
438
Diskrete Zufallsvariablen Verteilung von X durch rein kombinatorische Überlegungen ermitteln Wir beachten folgende „kombinatorischen Fakten“ für das Ziehen ohne Zurücklegen und ohne Berücksichtigung der Anordnung.
6 1. Es gibt genau = 15 Möglichkeiten, 4 Kugeln aus 6 Kugeln zu ziehen. 4 2
2. Es gibt genau = 1 2
Möglichkeit, aus den 2 schwarzen Kugeln 2 zu ziehen.
4 3. Es gibt genau = 12 Möglichkeiten, aus den 4 weißen Kugeln 2 zu ziehen. 2 Die Wahrscheinlichkeit aus einer Urne mit 4 weißen und 2 schwarzen Kugeln in vier Zügen genau 2 schwarze und 2 weiße Kugeln zu ziehen beträgt damit
2 4 P( X = 2 ) = ⋅ 2 2
6 12 = = 0.75 . 4 15
Weshalb?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
439
Diskrete Zufallsvariablen Hypergeometrische Verteilung Eine Zufallsvariable X heißt hypergeometrisch verteilt mit den Parametern n, M und N, kurz X ~ H(n, M, N), falls sie die Wahrscheinlichkeitsfunktion
f (x ) =
M N − M x n x − , N n
x ∈T
0,
sonst
Bedeutung? Was soll denn das?
besitzt. Dabei ist T durch T = { max(0, n − ( N − M )), K, min (n, M ) } gegeben. Es gilt:
E(X ) = n
M M , Var ( X ) = n N N
M N −n . 1 − N N −1
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
Interpretation? Beweis?
440
Diskrete Zufallsvariablen Poisson-Verteilung Eine Zufallsvariable X, die zählt, wie oft ein relativ seltenes Ereignis in einem festen, vorgegebenen Zeitintervall auftritt, kann oft als poissonverteilt angenommen werden. Ebenso erhält man die Poisson-Verteilung als Grenzverteilung der B(n, p)-Verteilung, falls p sehr klein und n sehr groß ist (vgl. Seite 443). Poisson-Verteilung Eine Zufallsvariable X heißt poissonverteilt mit Parameter λ > 0, kurz X ~ Po(λ), falls sie die Wahrscheinlichkeitsfunktion
λx − λ e , x ∈ { 0, 1, 2, K } f (x ) = x ! 0, sonst
Bedeutung?
besitzt. Es gilt: E ( X ) = λ , Var ( X ) = λ . Sind X ~ Po(λ1) und Y ~ Po(λ2) unabhängig, so ist X + Y ~ Po (λ1+λ2). Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
441
Diskrete Zufallsvariablen Beispiele :Wahrscheinlichkeitsfunktionen der Poisson-Verteilung
Bedeutung?
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
442
Diskrete Zufallsvariablen Verteilungskonvergenz der Binomialverteilung gegen die Poisson-Verteilung Sei X binomialverteilt mit Parametern n und p. Für np = λ gilt dann:
n x n λ λ λ n− x ( ) ( ) = 1 − 1 − P X = x = p 1− p x x n n n x
n
−x
n ⋅ (n − 1) ⋅K ⋅ (n − x + 1) λx λ λ = ⋅ ⋅ 1 − 1 − . x n x! n n −x
n
Damit folgt für festes x und festes λ für n → ∞
n−x+ j → 1, n
1 ≤ j ≤ x,
λ 1 − → 1 n x
Daraus folgt
P( X = x ) →
Bedeutung?
λ −λ 1 − → e . n n
und
λx x!
e −λ für n → ∞ .
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
443
Diskrete Zufallsvariablen Beispiel: Anzahl von Schadensmeldungen bei einer Sachversicherung Die Wahrscheinlichkeit für einen Versicherungsfall eines Versicherungsnehmers bei einer Sachversicherung bezogen auf einen Zeitraum von einem Jahr beträgt p = 0.0001. Angenommen, die Anzahl der Versicherungsnehmer ist n = 10000. Im Falle von mehr als 30 Versicherungsfällen wäre das Versicherungsunternehmen ruiniert. Es interessiert nun die Frage, mit welcher Wahrscheinlichkeit mehr als 30 Versicherungsfälle eintreten. Zur Vereinfachung sei angenommen, dass die einzelnen Versicherungsfälle stets unabhängig voneinander eintreten. Für X = „Anzahl der Versicherungsfälle“ gilt X ~ B(10000, 0.0001). Weshalb?
n n− x 1 − P( X ≤ 30) = 1 − ∑ p x (1 − p ) x =0 x 30
Exakte Lösung wäre also:
Probleme?
Da nun p „klein“ und n „groß“, kann X ~ Po(λ) mit λ = np = 1 angenommen werden. 30
Damit gilt:
1 − P( X ≤ 30 ) ≈ 1 − ∑ x =0
λx x!
e
−λ
30
1 −1 1 30 1 = 1− ∑ e = 1− ∑ ≈ 0 e x =0 x ! x =0 x !
Wann ist p „klein“ und wann ist n „groß“? Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
444
Diskrete Zufallsvariablen Diskrete Verteilungen im Überblick Verteilung
Wahrscheinlichkeitsfunktion
X ~ B(n, p )
f (x ) =
n x p (1 − p )n − x , x = 0, 1, K, n x 0, sonst
X ~ H (n, M , N )
f (x ) =
M N − M x n− x 0,
(n, M, N „sinnvoll“)
N , x ∈ T n sonst
E(X)
Var(X)
np
np(1 − p )
M N
siehe Seite 440
n
X ~ Po(λ )
λx − λ f ( x ) = x ! e , x ∈ { 0, 1, 2, K }, 0, sonst
λ
λ
X ~ G (λ )
(1 − p )x −1 p, x = 1, 2, K , f (x ) = 0, sonst
1 p
1− p p2
(λ > 0)
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
445
Diskrete Zufallsvariablen Diskrete Verteilungsmodelle und Approximationsregeln Anzahl des Eintretens von A in n Versuchen (n mal Ziehen) B(n, p) Modell mit Zurücklegen unabhängige Wiederholungen
n/N klein p = M/N
p klein, n groß np = λ
G(p) Anzahl der Versuche bis zum Eintreten von A
Po(λ) Anzahl der beobachteten Ereignisse in einem Zeitintervall
H(n, M, N) Modell ohne Zurücklegen
n/N klein, M/N klein, N groß nM/N = λ Approximationsregeln n/N klein:
< 0.05
p bzw. M/N klein: < 0.05 n bzw. N groß:
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
> 30 446
Diskrete Zufallsvariablen Aufgabe 53 Beim Lotto 6 aus 49 (Ziehen ohne Zurücklegen und ohne Berücksichtigung der Anordnung) ist die Wahrscheinlichkeit R
F für 6 gerade Zahlen größer als 2%, für mindestens 1 Richtige größer als 50%, für genau 1 Richtige größer als 40%, für mindestens 3 Richtige größer als 2%,
Aufgabe 54 Ein Versicherungsvertreter schließt mit 5 Kunden, die alle das gleiche Alter besitzen, Lebensversicherungsverträge ab. Nach der Sterbetafel beträgt die Wahrscheinlichkeit, die nächsten 30 Jahre zu überleben, für jeden Versicherungsnehmer 0.65. Die Wahrscheinlichkeit dafür, dass nach 30 Jahren Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
447
Diskrete Zufallsvariablen R
F alle Kunden noch leben, ist größer als 0.1, wenigstens 3 Kunden noch leben, ist größer als 0.8, genau 2 Kunden noch leben, ist kleiner als 0.2, höchstens 1 Kunde noch lebt, ist kleiner als 0.05,
Aufgabe 55 Folgende Verteilungsapproximationen sind zulässig: R
F H(4, 50, 100)-Verteilung durch B(4, 0.5)-Verteilung, B(0.03, 100)-Verteilung durch Po(3)-Verteilung, H(4, 10, 100)-Verteilung durch Po(0.4)-Verteilung.
Eindimensionale Zufallsvariablen - Diskrete Zufallsvariablen
448