GESETZE DER GROSSEN ZAHLEN

KAPITEL 17 GESETZE DER GROSSEN ZAHLEN Am Anfang der Wahrscheinlichkeitsrechnung stand der Wunsch, gewisse experimentelle Fakten zu modellieren, die ...
Author: Andrea Schwarz
11 downloads 2 Views 261KB Size
KAPITEL

17

GESETZE DER GROSSEN ZAHLEN Am Anfang der Wahrscheinlichkeitsrechnung stand der Wunsch, gewisse experimentelle Fakten zu modellieren, die man vage als  empirische Gesetze des Zufalls  bezeichnete und die sich in einer erstaunlichen Konstanz der H¨aufigkeiten von Ereignissen manifestierten, wenn man nur eine gen¨ ugend grosse Anzahl von Wiederholungen eines Experiments zuliess. So hat man bereits vor sehr langer Zeit bemerkt, dass sich bei einer grossen Zahl von Wiederholungen des Werfens einer perfekten M¨ unze die H¨ aufigkeit des 1 achlich um den Wert 2 stabilisiert, den man Auftretens von  Zahl  tats¨ ur das Auftreten von von daher versucht war, als die  Wahrscheinlichkeit  f¨  Zahl  anzusprechen. J. Bernoulli (Ars Conjectandi, ) war der erste, der ein Modell f¨ ur dieses Ph¨anomen entworfen hat. Er hat einen Konvergenzbegriff eingef¨ uhrt, welcher dem der Konvergenz in der Wahrscheinlichkeit eng verwandt ist, und er hat gezeigt, dass die H¨ aufigkeit des Auftretens von  Zahl  in diesem 1 Modell tats¨ achlich gegen 2 konvergiert. Die Argumente Bernoullis waren kombinatorischer Art und sehr kompliziert. Sie wurden von Tchebychev erheblich vereinfacht und zwar dank der Ungleichung, die seinen Namen tr¨ agt und die er bei diesem Anlass eingef¨ uhrt hat. Die von J. Bernoulli untersuchte Problemstellung wurde in der Folge betr¨ achtlich ausgeweitet und f¨ uhrte zu den verschiedensten Versionen von Aussagen, die man unter dem Begriff Gesetze der grossen Zahlen zusammenfasst. Es sei nun (Xn ) (n ≥ 1) eine Folge von reellen und zentrierten Zufallsvariablen. Gesucht sind hinreichende Bedingungen daf¨ ur, dass die Folge der Zufallsvariablen n  1 Xk (n ≥ 1) n k=1

gem¨ass einem der in Kapitel 16 behandelten Konvergenzbegriffe gegen 0 konvergiert. Dabei sind nur die Konvergenz in der Wahrscheinlichkeit und die fast-sichere Konvergenz systematisch untersucht worden. Entsprechend ist die Rede von dem schwachen und dem starken Gesetz der grossen Zahlen. ugt dem schwachenGesetz der Definition. — Die Folge (Xn ) (n ≥ 1) gen¨ n grossen Zahlen, wenn die Folge mit dem allgemeinen Glied n1 k=1 Xk in

270

KAPITEL 17: GESETZE DER GROSSEN ZAHLEN

der Wahrscheinlichkeit gegen 0 konvergiert. Die Folge (Xn ) (n ≥ 1) gen¨ ugt dem starken n Gesetz der grossen Zahlen, wenn die Folge mit dem allgemeinen 1 Glied n k=1 Xk fast-sicher gegen 0 konvergiert. 1. Das schwache Gesetz der grossen Zahlen. — Es gibt mehrere hinreichende Bedingungen, die sicherstellen, dass eine Folge (Xn ) (n ≥ 1) von Zufallsvariablen dem schwachen Gesetz der grossen Zahlen gen¨ ugt. Wir geben hier einige dieser Aussagen an, wobei stets die Notation (1.1)

Sn =

n

Xk ,

Yn =

k=1

Sn n

(n ≥ 1)

verwendet wird. ur paarweise Theorem 1.1 (Schwaches Gesetz der grossen Zahlen in L2 f¨ nichtkorrelierte Zufallsvariable). — Es sei (Xn ) (n ≥ 1) eine Folge von sind. F¨ ur Zufallsvariablen aus L2 , die zentriert und paarweise nichtkorreliert n 2 2 2 ur n → ∞ gegen jedes n ≥ 1 sei Var Xn = σn < +∞. Wenn (1/n ) k=1 σk f¨ 2 0 konvergiert, so konvergiert Yn in L gegen 0, und damit gilt auch Yn → 0 in der Wahrscheinlichkeit. ur jedes n ≥ 1 Beweis. — Da die Xn paarweise nichtkorreliert sind, gilt f¨ E[Yn2 ]

n 1 1 2 = Var Yn = 2 Var Sn = 2 σk n n k=1

und somit E[Yn2 ] → 0 f¨ ur n → ∞, d.h. Yn → 0 in L2 . Die Konvergenz von Yn gegen 0 in der Wahrscheinlichkeit ist nun eine unmittelbare Konsequenz der Ungleichung von Bienaym´e-Tchebychev. Bemerkungen. — Die Aussage von Theorem 1.1 gilt nat¨ urlich insbesonangig sind dere dann, wenn die Zufallsvariablen Xn als Gesamtheit unabh¨ oder nur paarweise unabh¨ angig sind. Anwendung 1.2. — Es sei (Xn ) (n ≥ 1) eine Folge von Zufallsvariablen ur jedes n ≥ 1 sei E[Xn ] = µn ; aus L2 , die paarweise nichtkorreliert sind.F¨ n 1 ur n → ∞ die Folge mit dem allgemeinen Glied k=1 µk konvergiere f¨ n n 2 2 gegen µ  und (1/n ) k=1 σk konvergiere gegen 0. Dann konvergiert die n Folge ( n1 k=1 Xk ) in L2 gegen µ, und damit gilt Konvergenz auch in der Wahrscheinlichkeit. Beweis. — Wir wenden Theorem 1.1 auf die Folge (Xn − µn ) (n ≥ 1) von zentrierten Zufallsvariablen an und erhalten aus 1 1 1 (Xk − µk ) = Xk − µk → 0 n n n n

n

n

k=1

k=1

k=1

1. DAS SCHWACHE GESETZ DER GROSSEN ZAHLEN

271

ur die Konvergenz das gew¨ unschte Resultat f¨ ur die L2 -Konvergenz, also auch f¨ in der Wahrscheinlichkeit. Das folgende Korollar betrifft die Situation von identisch verteilten Zufallsvariablen und ist ebenfalls ein Korollar von Theorem 1.1. ur paarweise Theorem 1.3 (Schwaches Gesetz der grossen Zahlen in L2 f¨ nichtkorrelierte Zufallsvariablen mit identischer Verteilung.). — Es sei (Xn ) (n ≥ 1) eine Folge von zentrierten Zufallsvariablen aus L2 , die identisch verteilt und paarweise nichtkorreliert sind. Dann gilt Yn → 0 in L2 , also Yn → 0 in der Wahrscheinlichkeit. Beweis. — F¨ ur jedes n ≥ 1 ist Var Xn = σn2 = σ 2 < +∞. Also gilt n 1 2 σ2 σ = →0 k n2 n k=1

und die Behauptung folgt aus Theorem 1.1. Bemerkung 1. — Die Aussage von Theorem 1.3 gilt nat¨ urlich insbesondere angig oder nur dann, wenn die Zufallsvariablen Xn als Gesamtheit unabh¨ paarweise unabh¨ angig sind. Bemerkung 2. — Die Folge mit dem allgemeinen Glied E[Yn2 ] konvergiert monoton absteigend gegen 0, denn es gilt E[Yn2 ] = σ 2 /n ↓ 0. Anwendung 1.4. — Es sei (Xn ) (n ≥ 1) eine Folge von Zufallsvariablen aus L2 , die identisch verteilt und paarweise nichtkorreliert sind; n dabei sei µ 1 der gemeinsame Erwartungswert der Xn . Dann konvergiert n k=1 Xk gegen µ in L2 , also auch in der Wahrscheinlichkeit. Beweis. — Man wendet Theorem 1.3 auf die Folge (Xn − µ) (n ≥ 1) von zentrierten Zufallsvariablen an und erh¨ alt 1 1 (Xk − µ) = Xk − µ → 0 n n n

n

k=1

k=1

in L2 , also auch in der Wahrscheinlichkeit. Anwendung 1.5. — Es sei (Xn ) (n ≥ 1) eine Folge von unabh¨ angigen, identisch verteilten Zufallsvariablen mit derVerteilung pε1 + qε0 , wobei n 0 ≤ p ≤ 1, p + q = 1. Dann konvergiert n1 k=1 Xk gegen p in L2 , also auch in der Wahrscheinlichkeit. Dies ist das klassische Beispiel des M¨ unzwurfs von Bernoulli. Wie wir gesehen haben, ist der Beweis des schwachen Gesetzes der grossen Zahlen (Theoreme 1.1 und 1.3) besonders einfach f¨ ur Zufallsvariable aus der

272

KAPITEL 17: GESETZE DER GROSSEN ZAHLEN

Klasse L2 . Tats¨achlich kann man sich von dieser Hypothese befreien und atzlich noch lediglich deren Zugeh¨ origkeit zu L1 voraussetzen, wenn man zus¨ annimmt, dass sie paarweise unabh¨ agig und identisch verteilt sind. Der Beweis des schwachen Gesetzes der grossen Zahlen ist in diesem Fall schwieriger und verwendet die Techniken des Stutzens und Zentrierens, was wir jetzt darstellen werden. ur paarweise Theorem 1.6 (Schwaches Gesetz der grossen Zahlen in L1 f¨ unabh¨ angige, identisch verteilte Zufallsvariable). — Es sei (Xn ) (n ≥ 1) eine angig und Folge von zentrierten Zufallsvariablen aus L1 , die paarweise unabh¨ identisch verteilt sind. Mit den Bezeichnungen (1.1) gilt dann Yn → 0 in L1 , also auch Yn → 0 in der Wahrscheinlichkeit. Beweis. — W¨ urden die Xn zu L2 geh¨oren, so folgte die Behauptung aus Theorem 1.3, denn aus Yn → 0 im quadratischen Mittel folgt die Konvergenz auch in L1 . Die Beweisidee besteht darin, sich mit Hilfe der Techniken des uckzuziehen. Das folgende Stutzens und Zentrierens auf den Fall von L2 zur¨ technische Lemma wird dabei helfen. Lemma 1.7. — Zu jedem ε > 0 gibt es eine Borel-messbare und beschr¨ ankte Funktion f auf R derart, dass f ◦ X1 (wie X1 ) zentriert ist und X1 − f ◦ X1 1 < ε gilt. Dabei h¨ angt f nur von der Verteilung von X1 ab. Beweis des Lemmas. a) Sei also ε > 0 vorgegeben; da X1 zu L1 geh¨ort, kann man ein hinreichend grosses c > 0 w¨ahlen, damit f¨ ur die Funktion x, f¨ ur |x| ≤ c; g(x) = x I[−c,+c] = 0, sonst; folgende Gleichung gilt:  |x| dµ(x) < ε. X1 − g ◦ X1 1 = {|x|>c}

b) Die Funktion g leistet nicht notwendigerweise das Gew¨ unschte, da g ◦ X1 nicht zentriert sein muss. Um die Zentrierung zu erreichen, geht man u ¨ber zu der Funktion f (x) = g(x) − m,

wobei m = E[g ◦ X1 ],

also

 f (x) = x I[−c,+c] (x) −

x dµ(x). [−c,+c]

c) F¨ ur hinreichend grosses c erf¨ ullt f die Anforderungen, denn nun ist f ◦ X1 nach Konstruktion zentriert und X1 − f ◦ X1 1 < ε kann man

1. DAS SCHWACHE GESETZ DER GROSSEN ZAHLEN

273

folgendermassen erreichen. Man w¨ahlt c so gross, dass X1 − g ◦ X1 1 < ε gilt, was nach a) m¨oglich ist. Da X1 zentriert ist, gilt |m| = |E[X1 ] − m| = |E[X1 ] − E[g ◦ X1 ]| ≤ X1 − g ◦ X1 1 < ε und somit schliesslich X1 − f ◦ X1 1 ≤ X1 − g ◦ X1 1 + |m| < 2ε. Nun k¨ onnen wir den Beweis von Theorem 1.6 angehen. Es sei Xn = f ◦ Xn , Sn = X1 + · · · + Xn und Yn = Sn /n. Die Zufallsvariablen Xn sind zentriert, paarweise unabh¨ angig und identisch verteilt. Als beschr¨ ankte 2  2 Variablen geh¨ oren sie zu L . Somit folgt aus Theorem 1.3 Yn → 0 in L und somit auch in L1 . Andererseits gilt 1 ≤ Xk − Xk 1 . n n

Yn −

Yn 1

k=1

Aber f¨ ur k = 1, . . . , n h¨ angt der Ausdruck Xk − Xk 1 nur von der gemeinsamen Verteilung der Xn ab; alle diese Glieder sind also gleich und es folgt Yn − Yn 1 ≤ X1 − X1 1 < ε. Schliesslich gilt Yn 1 ≤ Yn − Yn 1 + Yn 1 , ur hinreichend grosses n gilt. Die Folge mit dem so dass Yn 1 < 2ε f¨  ur n → ∞ gegen 0. allgemeinen Glied Yn 1 = E |Yn | konvergiert also f¨ Bemerkung 1. — Die Aussage von Theorem 1.6 gilt nat¨ urlich auch dann, angig sind. wenn die Zufallsvariablen Xn unabh¨ angig sind, Bemerkung 2. — In dem Fall, dass die Variablen  Xn unabh¨ konvergiert die Folge mit dem allgemeinen Glied E |Yn | = Yn 1 monoton absteigend gegen 0. Diese Bemerkung kann man folgendermassen einsehen. Wegen Yn−1 =

n Xn Yn − n−1 n−1

ist E[Yn−1 | Yn ] =

n 1 Yn − E[Xn | Yn ]. n−1 n−1

Andererseits ist E[X1 | Yn ] = · · · = E[Xn | Yn ], da die Zufallsvariablen X1 , angig und identisch verteilt sind. Somit hat man . . . , Xn unabh¨ Yn = E[Yn | Yn ] =

 1 E[X1 | Yn ] + · · · + E[Xn | Yn ] = E[Xn | Yn ], n

274

KAPITEL 17: GESETZE DER GROSSEN ZAHLEN

und damit folgt E[Yn−1 | Yn ] = sowie

n 1 Yn − Yn = Yn n−1 n−1

 |Yn | ≤ E |Yn−1 | | Yn . Nimmt man nun von beiden Seiten den Erwartungswert, so folgt   E |Yn | ≤ E |Yn−1 | . 2. Das starke Gesetz der grossen Zahlen. — Wir beginnen diesen Abschnitt mit einer Version des starken Gesetzes der grossen Zahlen f¨ ur Zufallsvariable aus L2 . (Einen Beweis findet man in dem Buch von FourgeaudFuchs (op. cit.).) Theorem 2.1 (Starkes Gesetz der grossen Zahlen f¨ ur Zufallsvariable aus angigen L ). — Es sei (Xn ) (n ≥ 1) eine Folge von zentrierten und unabh¨ ur n ≥ 1 sei Var Xn = σn2 < +∞ und, wie vorher, Zufallsvariablen aus L2 . F¨ 2

(2.1)

Sn =

n k=1

Wenn die Reihe

 n≥1

Xk ,

Yn =

Sn n

(n ≥ 1).

σn2 /n2 konvergiert, so gilt Yn → 0 fast-sicher.

Theorem 2.2 (Rajchman). — Es sei (Xn ) (n ≥ 1) eine Folge von ur n ≥ 1 sei zentrierten und unabh¨ angigen Zufallsvariablen aus L2 . F¨ 2 Var Xn = σn ; weiter werden die Bezeichnungen wie oben in (2.1) verwendet. Ist supn σn2 < +∞, so gilt a) Yn → 0 fast-sicher; b) Yn → 0 in L2 . Beweis.  1  σn2 2 ≤ σ < ∞ und a) Es sei σ 2 = supn σn2 < +∞; dann gilt 2 2 n≥1 n n≥1 n damit Yn → 0 fast-sicher gem¨ass Theorem 2.1. n 1  σ2 2 2 → 0 und daher Yn → 0 in σ ≤ b) Es gilt E[Yn ] = Var Yn = 2 n k=1 k n L2 gem¨ass Theorem 1.1. Bemerkung 1. — Rajchman hat die entsprechenden Aussagen auch f¨ ur angig  durch  paarweise nichtkorreliert  den Fall gezeigt, bei dem  unabh¨ ersetzt wird. Bemerkung 2. — Man kann also in der Aussage des Satzes von Bernoulli die Konvergenz in der Wahrscheinlichkeit durch die fast-sichere Konvergenz ersetzen (E. Borel).

275

2. DAS STARKE GESETZ DER GROSSEN ZAHLEN

Theorem 2.3 (Starkes Gesetz der grossen Zahlen f¨ ur Zufallsvariable aus L (Kolmogorov)). — Es sei (Xn ) (n ≥ 1) eine Folge von zentrierten, unabh¨ angigen und identisch verteilten Zufallsvariablen aus L1 . Mit den Bezeichnungen wie oben in (2.1) gilt dann Yn → 0 fast-sicher. Beweis (L. Pratelli, unver¨ offentlicht). 1

f.s.

a) Gem¨ ass Theorem 4.2 aus Kapitel 16 ist die Aussage Yn −→ 0 ¨aquivalent zu der Feststellung 

(m → ∞). f¨ ur jedes ε > 0 gilt P sup |Yk | > ε −→ 0 k≥m

b) Folgendes Lemma wird ben¨ otigt: Lemma 2.4. — F¨ ur jedes m ≥ 1 und jedes ε > 0 gilt

 ε P sup |Yk | > ε ≤ Ym 1 , k≥m

d.h. aus Ym → 0 in L1 folgt Ym → 0 fast-sicher. c) Die Behauptung des Theorems folgt nun aus a) und b) und Theorem 1.6 (schwaches Gesetz der grossen Zahlen in L1 ). Beweis des Lemmas. — Man beweist die folgende, zum Lemma ¨aquivalente Aussage: F¨ ur jedes Paar (m, n) von ganzen Zahlen mit 1 ≤ m ≤ n und jedes ε > 0 gilt 

ε P sup |Yk | > ε ≤ Ym 1 . m≤k≤n

Wir betrachten die Menge Tn = sup{k : 1 ≤ k ≤ n, |Yk | > ε } (mit der Konvention sup ∅ = −∞) und setzen A = {supm≤k≤n |Yk | > ε }. Dann ist A = {Tn ≥ m} =



{Tn = k} und

ε P(A) = ε

m≤k≤n



P{Tn = k}.

m≤k≤n

ur jedes k mit m ≤ k ≤ n die Absch¨ atzung Nach Definition der Tn gilt aber f¨    εP{Tn = k} ≤ |Yk | dP = Yk dP + (−Yk ) dP {Tn =k}

{Tn =k, Yk >0}

{Tn =k, Yk 0}

276

KAPITEL 17: GESETZE DER GROSSEN ZAHLEN

Da nun aber die Xn unabh¨ angig und identisch verteilt sind, haben alle Integrale auf der rechten Seite den gleichen Wert. Die rechte Seite ist also auch gleich dem arithmetischen Mittel von k Zahlen, die ihrerseits alle gleich  dem Wert des Integrals {Tn =k, Yk >0} X1 dP sind. Sie ist dann aber auch gleich dem arithmetischen Mittel von m (≤ k) Zahlen mit eben diesem Wert. Folglich kann man  m  1 X1 dP = Ym dP B= m j=1 {Tn =k, Yk >0} {Tn =k, Yk >0} schreiben. Ganz entsprechend geht man f¨ ur C vor und erh¨ alt  (−Ym ) dP. C= {Tn =k, Yk 0, somit ist n≥1 P(An ) = +∞. Aus Teil b) des Lemmas folgt nun, dass mit Wahrscheinlichkeit 1 das Wort A unendlich oft im Verlauf des Spiels auftritt. Ein analoges Argument zeigt, dass ein Affe, der  zuf¨ allig  auf einer Schreibmaschine tippt, mit Wahrscheinlichkeit 1 jeden

278

KAPITEL 17: GESETZE DER GROSSEN ZAHLEN

Text beliebiger endlicher L¨ ange im Verlauf von unendlich vielen Anschl¨ agen 1 einmal schreibt. Das Lemma von Borel-Cantelli hat folgende Konsequenz. Theorem 3.2 ((0, 1)-Gesetz von E. Borel). — Es sei (An ) (n ≥ 1) eine Folge von paarweise unabh¨ angigen Ereignissen und A∗ bezeichne das Ereignis lim supn An . Dann kann P(A∗ ) nur die Werte 0 oder 1 annehmen, und zwar je nachdem, ob die Reihe mit dem allgemeinen Glied P(An ) konvergiert oder divergiert. Dieses Theorem ist ein erstes Beispiel f¨ ur das ber¨ uhmte (0, 1)-Gesetz von Kolmogorov, welches besagt, dass gewisse  terminale  Ereignisse nur mit Wahrscheinlichkeit 0 oder 1 auftreten k¨ onnen. Als Anwendung dieses Theorems werden wir nun zeigen, dass f¨ ur eine angigen Zufallsvariablen, f¨ ur welche die Folge Folge (Xn ) (n ≥ 1) von unabh¨ n  Xk fast-sicher gegen einen Limes Y konvergiert, (Yn ) (n ≥ 1) mit Yn = n1 k=1

dieser Limes fast-sicher konstant sein muss. Um dies zu sehen, stellen wir zun¨ achst fest, dass das System (X1 , . . . , Xk ) f¨ ur jedes k ≥ 1 unabh¨ angig von Y = limn (X1 + · · · + Xn )/n = limn (Xk+1 + · · · + Xk+n )/n ist, und angig von Y . F¨ ur jedes reelle x ist also das Ereignis somit auch Yk unabh¨ angig von dem Ereignis {Y ≤ x}. (Das Ereignis {Y ≤ x} ist {Yk ≤ x} unabh¨ ein typisches  terminales  Ereignis.) Somit gilt P({Yk ≤ x} ∩ {Y ≤ x}) = P{Yk ≤ x}P{Y ≤ x} f¨ ur jedes reelle x. L¨ asst man nun k gegen unendlich gehen, so folgt daraus P{Y ≤ x} = (P{Y ≤ x})2 ; dann kann aber f¨ ur jedes x nur P{Y ≤ x} = 0 oder 1 gelten. Da die Abbildung x → P{Y ≤ x} eine Verteilungsfunktion ist, muss sie notwendigerweise eine Stufe der H¨ ohe 1 sein. Also ist Y = konstant.

¨ ¨ ERGANZUNGEN UND UBUNGEN

1. — Es sei (Xn ) (n ≥ 1) eine Folge von unabh¨ angigen und identisch 2 verteilten Zufallsvariablen aus L . Dabei sei m = E[X1 ] und σ 2 = Var X1 . F¨ ur jedes n ≥ 2 werden die folgenden Zufallsvariablen definiert: 1 Xk , Yn = n n

k=1

1

1 Zn = (Xk − Yn )2 . n−1 n

k=1

´ Borel (Emile). — Le hasard. — Paris, Librairie F´ elix Alcan, .

¨ ¨ ERGANZUNGEN UND UBUNGEN

279

a) Man berechne E[Zn ]. f.s.

b) Man zeige Zn −→ σ 2 f¨ ur n → ∞. 2. — Es sollen nun die Voraussetzungen von Theorem 1.6 gelten, wobei die angig, und nicht etwa nur paarweise Zufallsvariablen Xn als Gesamtheit unabh¨ unabh¨ angig seien. Man zeige auf direktem Weg, und zwar unter Verwendung p von charakteristischen Funktionen, dass Yn −→ 0 gilt. 3. — Es sei (Xn ) (n ≥ 1) eine Folge von unabh¨ angigen und identisch n  f.s. verteilten Zufallsvariablen. Dabei gelte Yn = (1/n) Xk −→ Y . k=1 Man beweise  die folgenden Aussagen: P{|Xn | ≥ n} < +∞; a) n≥1

b) die Xn sind integrierbar; c) Y ist fast-sicher konstant. 4. — Es sei (Xn ) (n ≥ 1) eine Folge von Zufallsvariablen und Sn = √ L p X1 + · · · + Xn . Man zeige, dass aus Sn / n −→ Y dann Sn /n −→ 0 folgt, d.h. ugt dem schwachen Gesetz der grossen Zahlen. die Folge (Xn ) (n ≥ 1) gen¨ 5. — Das Modell des M¨ unzwurfs von Bernoulli kann dazu verwendet werden, um einen bemerkenswerten Beweis des Approximationssatzes von Weierstrass zu liefern. Dieser Satz sagt aus, dass eine auf einem beschr¨ ankten Intervall stetige Funktion dort von Polynomen gleichm¨ assig approximiert werden kann. Dieser Beweis stammt von Bernstein. angigen und mittels pε1 + qε0 Es sei (Xn ) (n ≥ 1) eine Folge von unabh¨ (0 ≤ p ≤ 1, p + q = 1) identisch verteilten Zufallsvariablen. Man setzt n  p wieder Yn = (1/n) Xk ; der Satz von Bernoulli besagt Yn −→ p. Sei nun k=1

h : [0, 1] → R eine stetige und somit beschr¨ ankte Funktion. Wir zeigen assig f¨ ur p ∈ [0, 1] gilt. E[h ◦ Yn ] → h(p) (n → ∞), wobei dies gleichm¨ ur jedes δ > 0 Beweis. — Bezeichnet µ die Verteilung von Yn , so gilt f¨  A=

|E[h ◦ Yn − h(p)]| ≤ E[ |h ◦ Yn − h(p)| ] = A + B, wobei  |h(x) − h(p)| dµ(x) und B = |h(x) − h(p)| dµ(x).

{|x−p|≤δ}

{|x−p|>δ}

Als stetige Funktion auf [0, 1] ist h sogar gleichm¨assig stetig. Zu jedem ε > 0 gibt es also ein δ(ε) > 0 derart, dass |x − p| ≤ δ die Absch¨ atzung |h(x) − h(p)| < ε impliziert. Damit ist A < ε. Halten wir nun ε, und damit auch  δ fest. Es sei M eine obere Schranke f¨ ur |h| auf [0, 1]. Dann gilt B ≤ 2M {|x−p|>δ} dµ(x) = 2M P{|Yn − p| > δ},

280

KAPITEL 17: GESETZE DER GROSSEN ZAHLEN

und dies wird gem¨ ass der Ungleichung von Bienaym´e-Tchebychev majorisiert durch 2M Var Yn /δ 2 ≤ 2M pq/(nδ 2 ) ≤ 2M/(nδ 2 ). Die rechte Seite ist aber von p unabh¨ angig und strebt f¨ ur n → ∞ gegen 0. Dies gilt also auch f¨ ur B, und zwar gleichm¨assig in p. ur n → ∞ gleichm¨assig in p gegen h(p). Folglich konvergiert E[h ◦ Yn ] f¨ Wegen Yn = Sn /n und L(Sn ) = B(n, p) gilt aber E[h ◦ Yn ] =

n k=0

  n k h(k/n) p (1 − p)n−k , k

und dieser Ausdruck konvergiert gleichm¨ assig f¨ ur p ∈ [0, 1] gegen h(p). Dies ist gerade die Aussage des Satzes von Weierstrass, wobei die Polynome sogar noch explizit angegeben werden. Man nennt sie auch Bernstein-Polynome. 6. — Wir betrachten nun die Kugel Bn (0, R) im Rn (n ≥ 1) mit Mittelpunkt 0 und Radius R ≥ 0. Ihr Volumen ist Vn (R) = π n/2 Rn /Γ(1 + n/2) (cf. Aufgabe 12, Kap. 14). Wir projizieren dieses Volumen auf eine der Achsen, etwa die x-Achse; man erh¨ alt eine Massenverteilung auf R, die eine Dichte gn (x, R) besitzt. Mittels geeigneter Normierung wird daraus ahlt man nun eine Wahrscheinlichkeitsdichte fn (x, R) = gn (x, R)/Vn (R). W¨ √ erstaunlicherweise fest, dass die Folge der WahrscheinR = n, so stellt man√ ur n → ∞ punktweise gegen die Dichte der Norlichkeitsdichten fn (x, n) f¨ malverteilung N (0, 1) konvergiert. Anders gesagt, f¨ ur jedes reelle x gilt √ 2 1 fn (x, n ) → √ e−x /2 2π

(n → ∞).

7. — Es sei (un ) (n ≥ 1) eine Folge von reellen Zahlen mit 0 < un ≤ 1 angigen f¨ ur jedes n ≥ 1. Weiter sei (Xn ) (n ≥ 1) eine Folge von unabh¨ ur jedes n ≥ 1 die Verteilung un ε1/un +(1−un )ε0 Zufallsvariablen, wobei Xn f¨ hat. Dann gilt: 1) F¨ ur jedes n ≥ 1 ist E[Xn ] = 1. p 2) Xn −→ 0 genau dann, wenn un → 0.  f.s. un < +∞. 3) Xn −→ 0 genau dann, wenn n≥1

Man beachte: f¨ ur eine Folge (un ) (n ≥ 1) mit der Eigenschaft, dass die Reihe X1 + · · · + Xn f.s. −→ 0 aus mit dem allgemeinen Glied un konvergiert, folgt n dem Resultat 3) und dem Satz von C´esaro, obwohl man E[Xn ] = 1 f¨ ur alle n ≥ 1 hat.

http://www.springer.com/978-3-7643-6169-3