Zufallsvariablen Diskret Binomial Hypergeometrisch Poisson
Stetig Normal Lognormal Exponential
Verteilung der Stichprobenkennzahlen
Zufallsvariable Erinnerung: Merkmal, Merkmalsausprägung Deskriptive Statistik: Beschreibt Häufigkeit der Ausprägungen eines speziellen Experiments Weitergehende Annahme: Ausprägungen werden mit einer gewissen Wahrscheinlichkeit angenommen (Modell!) Wahrscheinlichkeitsraum
Zufalls
Beobachtete Daten:
variable
Spezielle Realisierung
Diskrete Zufallsvariable Zum Modellieren von diskreten Merkmalen Ereignisraum Ω mit abzählbar vielen Ereignissen ω Zufallsvariable:
ω → X (ω )
Bei diskreter ZV kann man Ω mit der Menge aller Ausprägungen xi der Zufallsvariable identifizieren. Beispiel: Augenzahl eines Würfels Ω = {1,2,3,4,5,6},
X ( xi ) = xi
Also zum Beispiel X(3) = 3
Wahrscheinlichkeitsfunktion: xi → P( X = xi ) Jedem Wert der Zufallsvariable (entspricht der Merkmalsausprägung) wird seine Wahrscheinlichkeit zugeordnet. Damit ist im diskreten Fall die Zufallsvariable vollständig charakterisiert. Beispiel Würfel:
pi = P( X = xi ) = 1 / 6 Die ZV ist gleichverteilt!
Verteilungsfunktion: F ( x) := P( X ≤ x) Es gilt:
lim F ( x) = 0
x → −∞
lim F ( x) = 1 x →∞
F monoton steigend Im diskreten Fall ist F eine Treppenfunktion
F ( x) :=
∑p
i: x i ≤ x
i
Vergleiche mit der kumulativen relativen Häufigkeit!
Verteilungsfunktion des Würfelbeispiels: Beispiel Würfel:
F ( x ) = x 0 < x < 7
1
0.8
0.6
F 0.4
0.2
0 0
1
2
3
4
x
5
6
7
Erwartungswert einer ZV: Zufallsvariable X mit Werten x1,x2,…,xr
E ( X ) := x1 p1 + x2 p2 + + xr pr Beispiel Würfel:
1+ 2 + 3 + 4 + 5 + 6 µ := E ( X ) = = 3.5 6
Beachte, dass auch gilt:
P ( X ≤ 3.5) = P ( X ≥ 3.5) = 0.5 Der Mittelwert ist hier gleich dem MEDIAN der ZV
Varianz einer ZV: Zufallsvariable X mit Werten x1,x2,…,xr und E(X) = µ
Var( X ) := ( x1 − µ ) 2 p1 + + ( xr − µ ) 2 pr Beispiel Würfel: 2 2 2 2 2 2 + + + + + 2 . 5 1 . 5 0 . 5 0 . 5 1 . 5 2 . 5 = 2.916 σ 2 := Var ( X ) = 6
Alternative Berechnungsformel für Varianz: r
Var( X ) = ∑ xi p i − [E( X ) ] i =1
2
2
Eigenschaften von Erwartungswert und Varianz einer ZV: Seien X und Y eine ZV und α eine reelle Zahl Dann gilt:
E(αX ) = α E( X ) E( X + Y ) = E( X ) + E(Y )
Var(αX ) = α 2 Var( X )
Var( X + α ) = Var( X )
Unabhängige ZV: Zwei Zufallsvariablen X und Y heißen unabhängig, falls für beliebige Mengen A und B ihres Wertebereiches:
P( X ∈ A und Y ∈ B ) = P( X ∈ A) P(Y ∈ B) Für unabhängige ZV gilt (und zwar NUR für unabhängige):
Var( X + Y ) = Var( X ) + Var(Y ) Bsp 4-8 an der Tafel
Bernoulli Experiment:
Beispiele:
Bsp 4-8 Prozent
Experiment mit nur zwei möglichen Ergebnissen
100 80 60
•Münzwurf (Kopf oder Zahl) •Medizin (krank oder gesund) Codiere Ergebnisse mit X=0 und X=1
40 20 0
X=0
Ergebnis 0 hat Wahrscheinlichkeit p Ergebnis 1 hat Wahrscheinlichkeit q = 1-p
X=1
Binomialverteilung: Führe n unabhängige Bernoulli Experimente durch Bezeichne mit X die Anzahl wie oft Ereignis 0 eintritt, dann ist X binomialverteilt:
Man schreibt:
X~B(n;p)
gibt die Anzahl der Kombinationen mit k Ergebnissen 0 Beachte: Für Bsp. 4-8,c gilt
Z~B(2;0.2)
Bsp. 15: Schadhafte Disketten Disketten funktionstüchtig mit p = 0.8 Packungen der Größe 10 X … Anzahl der guten Disketten pro Packung Wahrscheinlichkeitsfunktion:
Etwa für k=2:
Binomialverteilung: Beispiel 15 (S. 95)
Internet Tip: Statistics Tools for Internet and Classroom Instruction – Tools – Binomial Histogram
Eigenschaften der Binomialverteilung Sei X~B(n;p), dann gilt: Mittelwert: µ = n p Varianz:
σ2 = n p q
Anwendung: Ziehen mit zurücklegen M von N Objekten erfüllen eine gewisse Eigenschaft E Ziehe n mal mit zurücklegen, wir groß ist die Wahrscheinlichkeit k Objekte mit Eigenschaft E zu ziehen? Antwort: X~B(n;M/N)
(Bsp. 4-10 an der Tafel)
Hypergeometrische Verteilung: Bsp 4-13 an der Tafel – Ziehen ohne Zurücklegen Hypergeometrische Verteilung mit Parametern N,M und n
Mittelwert: Varianz:
Bsp. 4-15: Qualitätskontrolle 30 Disketten, davon 10 schadhaft Wähle Stichprobe der Größe 6 a) Mit welcher Wahrscheinlichkeit sind weniger als 2 Disketten der Stichprobe schadhaft?
P(X < 2) = P(X = 0) + P(X = 1) Hypergeom. Verteilung mit N=30, M=10, n=6
Bsp. 4-15: Qualitätskontrolle b) Wie groß sind Erwartungswert und Varianz der entnommenen defekten Disketten? Mittelwert: Varianz:
Poissonverteilung: Diskrete Zufallsvariable mit unendlich vielen Werten: Mittelwert: µ = λ Varianz:
σ2 = λ
Typische Anwendung: Verteilung seltener Ereignisse • Kunden an einem Schalter pro Zeiteinheit • Schadensfälle pro Zeiteinheit (Versicherung) • Pro Zeiteinheit zerfallende Atome (Radioaktivität)
Beispiel 4-16: Bankschalter Im Mittel 3 Kunden pro Minute und Zahl der eintreffenden Kunden X sei Poisson-verteilt, d.h. und µ = λ = 3.
Gegenwahrscheinlichkeit:
Poissonverteilung als Approximation für die Binomialverteilung: Eine binomialverteilte Zufallsvariable X~B(n;p) ist für großes n und kleines k näherungsweise Poissonverteilt mit Parameter λ = n k Wahrscheinlichkeiten der Poissonverteilung sind für große n leichter (schneller) zu berechnen als für die Binomialverteilung Faustregel: n>10 und p