Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Erwartungswert einer Summe von n Zufallsvariablen Xi mit jeweils den Erwartungswert µx

n

Yn = ∑ Xi ⇒ µ(Yn ) = n * µ X i =1

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Varianz einer Summe von n voneinander unabhängigen Zufallsvariablen Xi mit jeweils der Varianz σ2 X

n

Yn = ∑ X i ⇒ σ 2 ( Yn ) = n * σ 2X i =1

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Ist der Stichprobenumfang n hinreichend groß, dann ist die Summe Yn der n Zufallsvariablen Xn annähernd Normalverteilt: n

Yn = ∑ X i ⇒ f ( Yn ) ≈ N(n * µ X ;n * σ 2X ) i =1

mit f(Yn) = Wahrscheinlichkeitsdichte der Summe Yn

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Wird die Summe Yn standardisiert, dann resultiert die z-transformierte Summe Zn als: n

Z

n

=



i=1

X

i

− n * µ

n * σ

X

2 X

Zn = standardisierte Summe von n identisch verteilten, statistisch unabhängigen Zufallsvariablen Xi

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Zn ist standardnormalverteilt, wenn der Stichprobenumfang n gegen unendlich geht: – Mit f(Zn) = Wahrscheinlichkeitsdichte der Variablen Zn ϕ(z) = Dichte der Standardnormal– verteilung • gilt:

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz

n

∑ Xi − n * µ X

Zn = i =1

n * σ 2X

⇒ lim (f ( Z n )) = ϕ( z ) n→∞

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Der Erwartungswert des Mittelwerts von n Zufallsvariablen kann berechnet werden als die durchschnittliche Summe der Zufallsvariablen: n −•

 1  1 Yn = 0 + *  ∑ Xi  = 0 + * (n * µ X ) = n  i =1  n 1 0 + * (n * µ X ) = µ X n

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Die Varianz des Mittelwerts n Zufallsvariablen beträgt: −

1  1 σ 2 ( Yn ) = σ 2  * Yn  = 2 * σ 2 (Yn ) = n  n 2 σ = 2 * (n * σ 2X ) = X n n

1

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Für den Erwartungswert der Kennwerteverteilung eines Stichprobenmittelwerts in einfachen Zufallsauswahlen gilt: • n −

 1 1   µ − = µ( X) = * µ ∑ X i  = * (n * µ X ) = µ X n  i =1  n X −

µ − = µ( X) = Erwartungswert der Zufallsvariablen X

Stichprobenmittelwert

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Die Varianz der Kennwerteverteilung des Stichprobenmittelwerts bei einfachen Zufallsauswahlen mit Zurücklegen: n −   1 2 2 2 σ - = σ ( X) = 2 * σ  Xi  = X n  i =1 



2 σ 2 X σ = * ( n * ) X 2 n n

1

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Die Standardabweichung der Kennwertverteilung beträgt: • Mit Zurücklegen: 2 −

σX σX σ( X) = = n n

• Ohne Zurücklegen:



σX N−n * σ(X) = N −1 n

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Die Kennwertverteilung des Stichprobenmittelwerts ist asymptotisch normalverteilt: •

 1 f ( X ) = f  * n −



 ∑ X i  i=1  n

f( X) = Kennwerteverteilung der Zufallsvariablen „Stichprobenmittelwert“.

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Es gilt: – Mit Zurücklegen:

 f ( X ) ≈ N  µ 

– Ohne Zurücklegen:



X

σ 2X ; n

   

2   σ X N − n  f (X) ≈ N µX; * n N − 1   _

Asymptotische Normalverteilung nach dem zentralen Grenzwertsatz • Zentrale Bedeutung der Kennwertverteilungen: – stellen Verbindung zwischen empirischen Stichprobenkennwerten und unbekanntenPopulationsparamter her.

Überführung einer Binomialverteilung in eine Standardnormalverteilung • Den Realisationen der Binomialverteilung werden Intervalle der Standardnormalverteilung zugeordnet:

n  n1 P(a≤ n1 ≤ b)= ∑   * π1 * (1− π1)n−n1 n1 =an1 b

 b + 0,5 − 50* 0,5   a − 0,5 − (n * π1 )    − φ ≈ φ   n * π * (1 − π )  50 * 0 , 5 * ( 1 0 , 5 ) − 1 1    

Überführung einer Binomialverteilung in eine Standardnormalverteilung • Erklärungen zur Formel: – P(a≤n1≤b) = Wahrscheinlichkeit, dass die Häufigkeit n1 der Ausprägung 1 zwischen a und b liegt. – Φ = Wert der Verteilungsfunktion der Standardnormalverteilung – 0,5 = Anpassungswert, um den diskreten Ausprägungen einer binomialverteilten ZV Intervalle der kontinuierlichen Normalverteilung zuordnen zu können.

Überführung einer Binomialverteilung in eine Standardnormalverteilung • Anwendungsbeispiel: Die Wahrscheinlichkeit, dass eine binomialverteilte ZV X mit den Parametern n = 50 ; π1= 0,5 ; n1 = 25 auftritt:  25 + 0,5 − 50 * 0,5   25 − 0,5 − 50 * 0,5   − Φ  P( 25) ≈ Φ     50 * 0,5 * (1 − 0,5)   50 * 0,5 * (1 − 0,5)  = Φ(0,141) − Φ( −0,141) = 0,1121

Von der hypergeometrischen- in eine Standardnormalverteilung • Die hypergeometrische Verteilung nähert sich asymptotisch der Normalverteilung an. Es gilt: P(a ≤ n 1

  ≤ b) ≈ φ       − φ   

  b + 0 , 5 − 50 * 0 , 5  N − n  50 * 0 , 5 * ( 1 − 0 , 5 ) *  N − 1    a − 0 ,5 − ( n * π 1 )  N − n  n * π 1 * (1 − π 1 ) *  N − 1 

Zentraler Grenzwertsatz für Stichprobenanteile • Bei hinreichend großen Stichprobenumfang gilt: • Mit Zurücklegen:

π1 * (1 − π1 )   f (p1 ) ≈ N π1 ;  n  

• Ohne Zurücklegen:

π 1 * (1 − π 1 ) N − n   f (p 1 ) ≈ N  π 1 ; *  n N −1 

Quantilwertberechnung z =

p 1 − µ (p 1 ) σ (p 1 ) 2

=

p1 − π1 π 1 * (1 − π 1 ) n

Wobei z = Quantilwert der Standardnormalverteilung

Verwandte der Normalverteilung • Zur Varianz: – Der zentrale Grenzwertsatz gilt prinzipiell auch für Varianzen – Varianzen sind daher asymptotisch normalverteilt – Die Annäherung an eine Normalverteilung findet sehr langsam statt.

Chiquadratverteilung

1

• Wenn ein Merkmal in der Population normalverteilt ist, folgt die Kennwerteverteilung der Stichprobenvarianz einer Chiquadratverteilung. • Der Parameter dieser Verteilung ergibt sich aus der Anzahl der Summanden. • Wenn Z1, Z2,...,Zn voneinander unabhängige standardnormalverteilte ZV sind, gilt:

Chiquadratverteilung

2

2 2 2 2 2 2 χdf = χ = + + + + + Z Z ... Z ... Z n 1 2 i n =n • wobei χ2 = Chiquadratverteilung mit n n Freiheitsgraden df = Anzahl der Freiheitsgrade (Zahl der voneinander unabhängigen quadrierten standardnormalverteilten Summanden.)