Grundlagen der Mathematik I und II Klaus Ritter TU Kaiserslautern, WS 2014/15 und SS 2015

Literatur Insbesondere H. Amann, J. Escher, Analysis I, Birkh¨auser, Basel, 3. Auflage, 2006. G. Fischer, Lineare Algebra, Vieweg+Teubner, Wiesbaden, 18. Auflage, 2014. O. Forster, Analysis 1, Springer Spektrum, Wiesbaden, 11. Auflage, 2013. O. Forster, Analysis 2, Springer Spektrum, Wiesbaden, 10. Auflage, 2013. K. K¨onigsberger, Analysis 2, Springer, Berlin, 5. Auflage, 2004.

Inhaltsverzeichnis I

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

1 1 3 6 12

reellen Zahlen Angeordnete K¨orper . . . . . . . . Die nat¨ urlichen Zahlen . . . . . . . M¨achtigkeit von Mengen . . . . . . Archimedisch angeordnete K¨orper . Konvergenz von Folgen . . . . . . . Vollst¨andigkeit . . . . . . . . . . . Konvergenz von Reihen . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

. . . . . . .

20 20 23 30 33 34 42 46

. . . . .

54 54 61 65 71 74

IV

Differenzierbare Funktionen in einer Variablen 1 Differenzierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Der Mittelwertsatz der Differentialrechnung . . . . . . . . . . . . .

80 80 86

V

Integrierbare Funktionen in einer Variablen 1 Das Riemann-Integral . . . . . . . . . . . . . . . . . . . . . . . . . 2 Integration und Differentiation . . . . . . . . . . . . . . . . . . . . 3 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . . .

94 94 102 106

VI

Vektorr¨ aume und lineare Abbildungen 1 Vektorr¨aume . . . . . . . . . . . . . . 2 Basen und Dimension . . . . . . . . . 3 Matrizen . . . . . . . . . . . . . . . . 4 Lineare Abbildungen . . . . . . . . . . 5 Lineare Abbildungen und Matrizen . .

111 111 116 121 125 131

II

III

Grundbegriffe 1 Aussagenlogik und Schlußregeln . 2 Mengen und ihre Verkn¨ upfungen 3 Funktionen und Relationen . . . 4 Gruppen und K¨orper . . . . . . . Die 1 2 3 4 5 6 7

Stetige Funktionen in einer Variablen 1 Punktmengen in R . . . . . . . . . . . . . 2 Stetigkeit und Grenzwerte von Funktionen 3 Haupts¨atze u ¨ber stetige Funktionen . . . . 4 Die Exponentialfunktion im Komplexen . 5 Trigonometrische Funktionen . . . . . . .

ii

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

INHALTSVERZEICHNIS 6 7 8

iii

Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . Quotientenvektorr¨aume . . . . . . . . . . . . . . . . . . . . . . . .

136 142 147

VII Determinanten und Eigenwerte 150 1 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 2 Eigenwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 3 Diagonalisierbarkeit . . . . . . . . . . . . . . . . . . . . . . . . . . 163 VIII Euklidische und unit¨ are Vektorr¨ aume 168 1 Skalarprodukt und Orthogonalit¨at . . . . . . . . . . . . . . . . . . 168 2 Orthogonale und unit¨are Abbildungen . . . . . . . . . . . . . . . . 176 3 Selbstadjungierte Abbildungen . . . . . . . . . . . . . . . . . . . . 179 IX

X

XI

A

Metrische und normierte R¨ aume 1 Grundbegriffe . . . . . . . . . . . 2 Konvergenz und Stetigkeit . . . . 3 Kompaktheit . . . . . . . . . . . 4 Funktionenfolgen . . . . . . . . . Differenzierbare Abbildungen in 1 Differenzierbarkeit . . . . . . . 2 Mittelwerts¨atze . . . . . . . . . 3 Taylor-Approximation . . . . . 4 Implizite Funktionen . . . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

mehreren Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Integrierbare Funktionen in mehreren Variablen 1 Vorbereitungen . . . . . . . . . . . . . . . . . . . 2 Das Lebesgue-Integral . . . . . . . . . . . . . . . 3 Grenzwerts¨atze und Integrabilit¨atskriterien . . . 4 Iterierte Integration . . . . . . . . . . . . . . . . 5 Die Transformationsformel . . . . . . . . . . . . . Beispiele in MAPLE 1 Exponential- und Cosinusreihe . . . . . . . . . 2 Lokale Approximation der Exponentialfunktion 3 Monotonie und Konvexit¨at . . . . . . . . . . . 4 Uneigentliche Integration . . . . . . . . . . . . 5 Lineare Gleichungssysteme . . . . . . . . . . . . 6 Eigenwerte . . . . . . . . . . . . . . . . . . . . 7 Taylor-Approximation in einer Variablen . . . . 8 Richtungsableitungen und Stetigkeit . . . . . . 9 Taylor-Approximation in zwei Variablen . . . . 10 Lokale Extrema . . . . . . . . . . . . . . . . . . 11 Lokale Extrema unter Nebenbedingungen . . .

Literaturverzeichnis

. . . .

. . . . . . . . . . .

. . . . .

. . . . . . . . . . .

. . . . .

. . . . . . . . . . .

. . . . .

. . . . . . . . . . .

. . . .

. . . .

. . . . .

. . . . . . . . . . .

. . . .

. . . .

. . . . .

. . . . . . . . . . .

. . . .

. . . .

. . . . .

. . . . . . . . . . .

. . . .

. . . .

. . . . .

. . . . . . . . . . .

. . . .

. . . .

. . . . .

. . . . . . . . . . .

. . . .

. . . .

. . . . .

. . . . . . . . . . .

. . . .

183 183 190 197 203

. . . .

216 216 228 230 240

. . . . .

253 253 259 265 275 278

. . . . . . . . . . .

287 287 290 294 298 300 310 312 316 318 320 323 326

INHALTSVERZEICHNIS

iv

Definitionen

327

Symbolverzeichnis

332

Kapitel I Grundbegriffe In den ersten drei Abschnitten stellen wir mit einigen Grundbegriffen der Logik und der Mengenlehre die Sprache dieser Vorlesung bzw. der Mathematik bereit; wir verweisen dazu insbesondere auf [AE] sowie auf [SS]. Im vierten Abschnitt u ¨ber Gruppen und K¨orper pr¨asentieren wir Definitionen, einfache Beispiele und elementare Eigenschaften; mehr dazu in der Vorlesung Algebraische ” Strukturen“.

1

Aussagenlogik und Schlußregeln

Definition 1. Aussagen sind Zeichenketten, von denen sich entscheiden l¨aßt“, ob ” sie wahr (w) oder falsch (f) sind. Beispiel 2. 1 + 1 ≥ 2 ist eine Aussage, w¨ahrend e∗33− keine Aussage ist. Zur Konstruktion neuer Aussagen aus gegebenen Aussagen betrachtet man folgende Verk¨ upfungen. Definition 3. Die Disjunktion (∨, oder ), Konjunktion (∧, und ), Implikation (⇒) und ¨ Aquivalenz (⇔) von Aussagen A und B und die Negation (¬) von A sind definiert durch folgende Wahrheitswerte: A w w f f

B w f w f

¬A f f w w

A∨B w w w f

A∧B w f f f

A⇒B A⇔B w w f f w f w w

Ferner steht B ⇐ A f¨ ur A ⇒ B. Konvention1 : ¬ bindet st¨arker als ∨, ∧, und ∨, ∧ binden st¨arker als ⇒, ⇔. Im Folgenden bezeichnen A, B und C Aussagen. 1

Nicht einheitlich in der Literatur.

1

I.1. Aussagenlogik und Schlußregeln

2

Bemerkung 4. Stets wahr sind (i) ¬(¬A) ⇔ A, (ii) ¬(A ∨ B) ⇔ ¬A ∧ ¬B sowie ¬(A ∧ B) ⇔ ¬A ∨ ¬B (De Morgansche Regeln), (iii) A ∧ (B ∨ C) ⇔ (A ∧ B) ∨ (A ∧ C) sowie A ∨ (B ∧ C) ⇔ (A ∨ B) ∧ (A ∨ C), (iv) (A ⇒ B) ⇔ ¬A ∨ B, (v) (A ⇒ B) ⇔ (¬B ⇒ ¬A), (vi) (A ⇒ B) ∧ (B ⇒ C) ⇒ (A ⇒ C), (vii) (A ⇔ B) ⇔ (A ⇒ B) ∧ (B ⇒ A), (viii) (A ⇔ B) ∧ (B ⇔ C) ⇒ (A ⇔ C). Beweis jeweils durch Berechnung der Wahrheitswerte in allen 4 bzw. 8 F¨allen. Bemerkung 5. Mathematische Schlußregeln. (i) Zum Beweis von B zeigt man A und A ⇒ B. Dies entspricht den wahren Aussagen A ∧ (A ⇒ B) ⇔ A ∧ (¬A ∨ B), A ∧ (¬A ∨ B) ⇔ (A ∧ ¬A) ∨ (A ∧ B), (A ∧ ¬A) ∨ (A ∧ B) ⇔ A ∧ B, A ∧ B ⇒ B. (ii) Zum Beweis der Implikation A ⇒ B zeigt man die Kontraposition ¬B ⇒ ¬A. Dies entspricht Bemerkung 4.(v). (iii) Zum Beweis der Implikation A ⇒ B nimmt man A und ¬B an und f¨ uhrt dies zu einem Widerspruch. Dies entspricht den wahren Aussagen (A ⇒ B) ⇔ ¬A ∨ B, ¬A ∨ B ⇔ ¬(A ∧ ¬B). ¨ (iv) Zum Beweis der Aquivalenz A ⇔ B zeigt man die Implikationen A ⇒ B und B ⇒ A. Dies entspricht Bemerkung 4.(vii). ¨ (v) Zum Beweis der Aquivalenzen A ⇔ B und B ⇔ C zeigt man die Implikationen A ⇒ B, B ⇒ C und C ⇒ A. Dies entspricht Bemerkung 4.(vi) und (vii). ¨ Schreibweise: f¨ ur Aussagen A1 , . . . , An schreibt man die Aquivalenzen A1 ⇔ A2 , . . . , An−1 ⇔ An

I.2. Mengen und ihre Verkn¨ upfungen

3

wegen Bemerkung 4.(viii) auch in der Form A1 ⇔ · · · ⇔ An . Ebenso wegen Bemerkung 4.(vi) f¨ ur Implikationen. Also etwa in Bemerkung 5.(iii) kurz (A ⇒ B) ⇔ (¬A ∨ B) ⇔ ¬(A ∧ ¬B). Literatur. [AE, I.1] und [SS, 3].

2

Mengen und ihre Verknu ¨ pfungen

Definition 1. Eine Menge ist eine Zusammenfassung wohlunterschiedener Objekte“ ” zu einem Ganzen. Die zu einer Menge geh¨origen Objekte heißen Elemente der Menge. Notation: F¨ ur ein Objekt x und eine Menge X heißt x ∈ X, daß x ein Element von X ist. Ebenso heißt x ∈ / X, daß x kein Element von X ist. Definition 2. Zwei Mengen heißen gleich, wenn2 sie dieselben Elemente enthalten. Notation: F¨ ur Mengen X und Y heißt X = Y , daß X gleich Y ist. Ebenso heißt X 6= Y , daß X nicht gleich (ungleich) Y ist. Bemerkung 3. Definition von Mengen: (i) Durch Auflisten aller Elemente. Zum Beispiel3 X = {2, 3, 11}. Beachte, daß {2, 3, 11} = {11, 2, 3} = {11, 2, 3, 2}. (ii) Durch Angabe einer die Elemente definierenden Eigenschaft. Zum Beispiel X = {x : x Primzahl}. Lies: Menge aller x f¨ ur die gilt . . . Standardbezeichnungen (zun¨achst) als bekannt vorausgesetzter Mengen von Zahlen (i) N = {1, 2, 3, . . .} Menge der nat¨ urlichen Zahlen 4 , (ii) N0 = {0, 1, 2, 3, . . .}, (iii) Z = {0, 1, −1, 2, −2, . . .} Menge der ganzen Zahlen, (iv) Q = {p/q : p ∈ Z und q ∈ N} Menge der rationalen Zahlen. Im Folgenden bezeichnen X, Y, Z Mengen. Definition 4. X ist eine Teilmenge von Y , falls alle Elemente von X Element von Y sind. Notation5 : X ⊆ Y bzw. Y ⊇ X. X ist eine echte Teilmenge von Y , falls X ⊆ Y und X 6= Y gilt. Notation: X ( Y bzw. Y ) X. 2

In Definitionen u ¨blicherweise wenn“ anstelle des korrekten genau dann, wenn“. ” ” Ich vermeide die Notation :=. 4 Notation nicht einheitlich. So N = {0, 1, 2, . . . } bei [Fi, Fo1]. 5 Im Unterschied zu [Fi, Fo1]; dort X ⊂ Y . 3

I.2. Mengen und ihre Verkn¨ upfungen

4

Schreibweise zur Definition von Teilmengen von X oft {x ∈ X : x hat Eigenschaft . . .} statt {x : x ∈ X und x hat Eigenschaft . . .}. Beispiel 5. Es gilt N ( N0 ( Z ( Q und 

x ∈ N : x2 ≤ 5 = {1, 2} .

Trifft man Aussagen u ¨ber die Elemente einer Menge, verwendet man dazu oft ab6 k¨ urzend Quantoren : ∀ x ∈ X : statt f¨ ur alle x ∈ X gilt ∃ x ∈ X : statt es existiert (mindestens) ein x ∈ X mit ∃1 x ∈ X : statt es existiert genau ein x ∈ X mit Bemerkung 6. F¨ ur eine Aussageform A(x), die von der freien Variable x ∈ X abh¨angt, gilt   ¬ ∀ x ∈ X : A(x) ⇔ ∃ x ∈ X : ¬A(x) ,   ¬ ∃ x ∈ X : A(x) ⇔ ∀ x ∈ X : ¬A(x) . Nun: Beziehung zwischen Gleichheit und Inklusion (Teilmengeneigenschaft) von Mengen. Lemma 7. Es gelten (i) X = Y ⇔ (X ⊆ Y ∧ Y ⊆ X), (ii) (X ⊆ Y ∧ Y ⊆ Z) ⇒ X ⊆ Z, (iii) X ( Y ⇔ (X ⊆ Y ∧ (∃ y ∈ Y : y ∈ / X)). Beweis. ad (i): Wir zeigen beide Schlußrichtungen, siehe Bemerkung 1.5.(iv). ⇒“ Gelte ”

X = Y.

F¨ ur jedes x ∈ X folgt x ∈ Y , also gilt X ⊆ Y . Ebenso ergibt sich Y ⊆ X. ⇐“ Gelte ”

X ⊆ Y ∧ Y ⊆ X.

F¨ ur x ∈ X folgt x ∈ Y , und f¨ ur y ∈ Y folgt y ∈ X, d.h. aus x 6∈ X folgt x 6∈ Y , siehe Bemerkung 1.4.(v). Also gilt X = Y . ad (ii): Gelte X ⊆ Y ∧ Y ⊆ Z. Sei x ∈ X. Es folgt x ∈ Y und weiter x ∈ Z aufgrund von Bemerkung 1.5.(i). 6

Anstelle von ∃1 auch ∃!.

I.2. Mengen und ihre Verkn¨ upfungen ad (iii): ⇒“ Gelte ”

5

X ( Y.

Dann folgt X ⊆ Y . Nun Widerspruchsbeweis f¨ ur ∃y ∈ Y : y ∈ / X, siehe Bemerkung 1.5.(iii). Annahme ∀ y ∈ Y : y ∈ X, siehe Bemerkung 6. Also gilt Y ⊆ X und somit X = Y gem¨aß (i), im Widerspruch zu X ( Y . ⇐“ Gelte ” X ⊆ Y ∧ (∃ y ∈ Y : y ∈ / X) . Somit folgt X 6= Y und weiter X ( Y . Zur Konstruktion neuer Mengen aus gegebenen Mengen betrachtet man folgende Verk¨ upfungen. Definition 8. Vereinigung (∪), Durchschnitt (∩) und Differenz (\) von X und Y sind definiert durch X ∪ Y = {z : z ∈ X ∨ z ∈ Y }, X ∩ Y = {z : z ∈ X ∧ z ∈ Y }, X \ Y = {z : z ∈ X ∧ z ∈ / Y }. Beispiel 9. Es gilt Z \ N0 = {−1, −2, . . .}, und N0 \Z enth¨alt keine Elemente. Bemerkung 10. Zwei Mengen, die jeweils keine Elemente enthalten, sind gleich. Definition 11. Die Menge, die kein Element enth¨alt, heißt leere Menge. Notation: ∅. Definition 12. X und Y heißen disjunkt, falls X ∩ Y = ∅. Definition 13. Paare (x, y) und (u, v) von Objekten x, y, u, v heißen gleich, falls x = u und y = v gilt. Beispiel 14. Es gilt (1, 2) 6= (2, 1) und {1, 2} = {2, 1}. Definition 15. Das kartesische Produkt von X und Y ist definiert durch X × Y = {(x, y) : x ∈ X ∧ y ∈ Y }. Beispiel 16. Es gilt {1, 2} × {1} = {(1, 1), (2, 1)}. Rechenregeln f¨ ur Mengenoperationen, siehe ¨ Ubung 1.2. Literatur. [AE, I.1 und I.2], [SS, 4.1 und 4.5] und [Fi, 1.1].

I.3. Funktionen und Relationen

3

6

Funktionen und Relationen

Im Folgenden bezeichnen U, V, W, X, Y, Z Mengen.

Funktionen Definition 1. Eine Funktion (Abbildung) f von X nach Y ist eine Vorschrift, die jedem Element x ∈ X genau ein Element f (x) ∈ Y zuordnet. X und Y heißen Definitions- bzw. Wertebereich 7 von f . Sprechweise: f (x) Wert der Funktion an der Stelle x oder Bild von x unter der Abbildung f . Ebenfalls: x ∈ X Argument von f . Notation: f : X → Y : x 7→ f (x). Beispiel 2. Beispiele f¨ ur Funktionen sind f : Z → Z : x 7→ x2 und g : N → {0, 1}, definiert durch ( 1, falls x Primzahl, g(x) = 0, sonst. Definition 3. Funktionen f : X → Y und g : W → Z heißen gleich, falls8 (i) X = W und Y = Z, (ii) ∀ x ∈ X : f (x) = g(x). Notation: f = g. Bemerkung 4. Es existiert genau eine Abbildung von ∅ nach Y , die sogenannte leere Abbildung von ∅ nach Y . F¨ ur X 6= ∅ existiert keine Abbildung von X nach ∅. Definition 5. Eine Abbildung f : X → Y heißt konstant, falls y ∈ Y existiert, so daß ∀ x ∈ X : f (x) = y. Notation9 : f = y. Definition 6. Der Graph Γf einer Funktion f : X → Y ist definiert durch Γf = {(x, y) ∈ X × Y : y = f (x)}. Bemerkung 7. Γ ⊆ X × Y ist genau dann Graph einer Funktion von X nach Y , wenn ∀ x ∈ X ∃1 y ∈ Y : (x, y) ∈ Γ. Eine Funktion ist eindeutig durch Angabe von Graph und Wertebereich bestimmt. Definition 8. F¨ ur f : X → Y und X 0 ⊆ X ⊆ X 00 heißt (i) f |X 0 : X 0 → Y : x 7→ f (x) die Einschr¨ankung (Restriktion) von f auf X 0 . 7

Terminologie nicht einheitlich. Hier und andernorts unterdr¨ uckt man das (i) und (ii) verbindende und“. ” 9 Mißbr¨auchliche, aber u bliche Verwendung von =“. ¨ ”

8

I.3. Funktionen und Relationen

7

(ii) jede Funktion g : X 00 → Y mit g|X = f eine Fortsetzung von f auf X 00 . Definition 9. F¨ ur f : X → Y , X 0 ⊆ X und Y 0 ⊆ Y heißt f (X 0 ) = {y ∈ Y : ∃ x ∈ X 0 : f (x) = y} das Bild von X 0 (unter f ) und f −1 (Y 0 ) = {x ∈ X : f (x) ∈ Y 0 } das Urbild von Y 0 (unter f ). Beispiel 10. Setze −X = {−x : x ∈ X} f¨ ur X ⊆ Z. F¨ ur f gem¨aß Beispiel 2 gilt −1 −1 f (N0 ) = f (−N0 ) = f (Z), f (N) = Z \ {0} und f (−N) = ∅.

Komposition von Funktionen und Umkehrabbildungen Definition 11. f : X → Y heißt (i) injektiv , falls10 ∀ x, x0 ∈ X : (f (x) = f (x0 ) ⇒ x = x0 ), (ii) surjektiv 11 , falls ∀ y ∈ Y ∃ x ∈ X : f (x) = y, (iii) bijektiv , falls f injektiv und surjektiv ist. Beispiel 12. F¨ ur die Funktionen aus Beispiel 2 gilt: f ist weder injektiv noch surjektiv, und g ist surjektiv, aber nicht injektiv. Bemerkung 13. Zur L¨osbarkeit von Gleichungen f (x) = y, wobei f : X → Y . (i) Surjektivit¨at heißt: f¨ ur alle y ∈ Y existiert mindestens eine L¨osung x ∈ X (Existenz). (ii) Injektivit¨at heißt: f¨ ur alle y ∈ Y existiert h¨ochstens eine L¨osung x ∈ X (Eindeutigkeit). (iii) Bijektivit¨at heißt: f¨ ur alle y ∈ Y existiert genau eine L¨osung x ∈ X (Existenz und Eindeutigkeit). Beispiel 14. F¨ ur f gem¨aß Beispiel 2 gilt: f |N0 ist injektiv. Definition 15. Die Komposition g ◦f von f : W → X und g : Y → Z mit f (W ) ⊆ Y ist definiert durch g ◦ f : W → Z : w 7→ g(f (w)). Beispiel 16. Betrachte f : N → N : x 7→ x2 und g : N → N : x 7→ x + 1. Dann gilt12 f¨ ur alle x ∈ N (g ◦ f )(x) = x2 + 1 und (f ◦ g)(x) = (x + 1)2 = x2 + 2x + 1. Insbesondere gilt f ◦ g 6= g ◦ f . Kurzschreibweise statt ∀ x ∈ X ∀ x0 ∈ X. Man spricht auch von Surjektionen von X auf Y . 12 Die Klammer um g ◦ f dienen nur der besseren Lesbarkeit. 10

11

I.3. Funktionen und Relationen

8

Bemerkung 17. F¨ ur Abbildungen f : U → V , g : W → X und h : Y → Z mit f (U ) ⊆ W und g(W ) ⊆ Y gilt h ◦ (g ◦ f ) = (h ◦ g) ◦ f. Definition 18. Die identische Abbildung (Identit¨at) idX der Menge X ist definiert durch idX : X → X : x 7→ x. Satz 19. f : X → Y ist genau dann bijektiv, wenn g : Y → X existiert, so daß g ◦ f = idX ∧ f ◦ g = idY .

(1)

Ferner ist g durch (1) eindeutig bestimmt. Beweis. ⇒“ Sei f : X → Y bijektiv. Gem¨ass Bemerkung 13 existiert f¨ ur alle y ∈ Y ” genau ein x ∈ X mit f (x) = y. Definiere g : Y → X durch g(y) = x. F¨ ur x ∈ X folgt g(f (x)) = x, und f¨ ur y ∈ Y gilt f (g(y)) = y. ⇐“ Gelte g ◦ f = idX und f ◦ g = idY . F¨ ur x, x0 ∈ X mit f (x) = f (x0 ) folgt ” x = g(f (x)) = g(f (x0 )) = x0 . Somit ist f injektiv. F¨ ur y ∈ Y sei x = g(y). Dann gilt f (x) = f (g(y)) = y. Somit ist f surjektiv. Zur Eindeutigkeit: F¨ ur g, g 0 : Y → X gelte g ◦ f = g 0 ◦ f und f ◦ g = idY . F¨ ur alle 0 0 x ∈ X gilt also g(f (x)) = g (f (x)), und f ist surjektiv. Dies zeigt g = g . Definition 20. In der Situation von Satz 19 heißt g die Umkehrabbildung (Umkehrfunktion) von f . Notation: f −1 = g. Beispiel 21. F¨ ur a, b ∈ Q sei f : Q → Q definiert durch f (x) = ax + b. f ist genau dann bijektiv, wenn a 6= 0, und gegebenenfalls gilt f −1 (y) =

y−b a

f¨ ur alle y ∈ Q.

Folgen und Familien Definition 22. F¨ ur k ∈ Z und I = {i ∈ Z : i ≥ k} heißt f : I → Y Folge in Y mit Indexmenge I. Notation: (fi )i≥k oder (fi )i∈I , wobei fi = f (i) f¨ ur i ∈ I. Notation und Sprechweise: F¨ ur beliebige Mengen I und Abbildungen f : I → Y suggestive Schreibweise (fi )i∈I , wobei fi = f (i) f¨ ur i ∈ I. Bezeichnung: (fi )i∈I Familie in Y mit Indexmenge I. Im Folgenden bezeichnet (Mi )i∈I eine Familie von Mengen Mi , wobei I 6= ∅.

I.3. Funktionen und Relationen

9

Definition 23. Vereinigung und Durchschnitt u ¨ber die Familie (Mi )i∈I sind definiert durch [ Mi = {z : ∃ i ∈ I : z ∈ Mi } i∈I

\

Mi = {z : ∀ i ∈ I : z ∈ Mi } .

i∈I

Bemerkung 24. F¨ ur I = {1, 2} gilt

S

i∈I

Mi = M1 ∪ M2 und

T

i∈I

Mi = M1 ∩ M2 .

Beispiel 25. F¨ ur I = N0 und Mi = {z ∈ Q : −i ≤ z ≤ i} gilt [

Mi = Q

i∈I

und \

Mi = M0 = {0} .

i∈I

F¨ ur I = Q und Mi = {i} gilt

S

i∈I

Mi = Q und

T

i∈I

Mi = ∅.

Im Folgenden gelte ∀ i ∈ I : Mi 6= ∅. Definition 26. Das kartesische Produkt u ¨ber die Familie (Mi )i∈I ist definiert durch [  Mi = m : I → Mi : ∀ i ∈ I : mi ∈ Mi .

× i∈I

i∈I

Bemerkung 27. Sei I = {1, 2}. Wir identifizieren m ∈ ×i∈I Mi mit (m1 , m2 ) ∈ M1 × M2 und unterscheiden dementsprechend nicht zwischen ×i∈I Mi und M1 × M2 . Formal heißt dies, daß ϕ : ×i∈I Mi → M1 × M2 : m 7→ (m1 , m2 ) eine Bijektion ist. Ausblick 28. Das Auswahlaxiom sichert, daß

×i∈I Mi 6= ∅, siehe [AE, S. 54].

Notation und Sprechweise: F¨ ur I = {1, . . . , n} mit n ∈ N suggestive Schreibweise M1 × . . . × Mn statt ×i∈I Mi und (m1 , . . . , mn ) statt (mi )i∈I . Ferner M n statt ×i∈I Mi im Spezialfall M1 = · · · = Mn = M . Sprechweise: (m1, . . . , mn) n-Tupel mit Komponenten mi ∈ Mi .

Relationen Definition 29. Eine Menge R ⊆ X × Y heißt Relation auf X, Y . Im Spezialfall X = Y heißt R ⊆ X × X Relation auf X. Beispiel 30. (i) R = {(x, x0 ) ∈ Z2 : x ≤ x0 }, (ii) R = {(x, x0 ) ∈ N2 : x teilt x0 }, (iii) R = {((p, q), (p0 , q 0 )) ∈ X 2 : p · q 0 = q · p0 }, wobei X = Z × (Z \ {0}), (iv) R = {(A, A0 ) ∈ X 2 : A ⊆ A0 }, wobei X die Menge aller Teilmengen von Z.

I.3. Funktionen und Relationen

10

¨ Aquivalenzrelationen und partielle Ordnungen F¨ ur unsere Zwecke sind neben Graphen, und damit Funktionen, zwei weitere Typen von Relationen von besonderer Bedeutung. Definition 31. R ⊆ X × X heißt (i) reflexiv , falls ∀ x ∈ X : (x, x) ∈ R, (ii) symmetrisch, falls ∀ x, x0 ∈ X : ((x, x0 ) ∈ R ⇒ (x0 , x) ∈ R), (iii) antisymmetrisch, falls ∀ x, x0 ∈ X : ((x, x0 ) ∈ R ∧ (x0 , x) ∈ R ⇒ x = x0 ), (iv) transitiv , falls ∀ x, x0 , x00 ∈ X : ((x, x0 ) ∈ R ∧ (x0 , x00 ) ∈ R ⇒ (x, x00 ) ∈ R) . ¨ Eine Relation mit (i), (ii) und (iv) heißt Aquivalenzrelation auf X. Sprechweise: x und 0 0 x sind ¨aquivalent, falls (x, x ) ∈ R. Notation: x ∼ x0 oder x ∼R x0 . Eine Relation mit (i), (iii) und (iv) heißt partielle Ordnung (Halbordnung) auf X. Sprechweise: x kleiner (oder) gleich (gr¨oßer (oder) gleich) x0 , falls (x, x0 ) ∈ R. Beispiel 32. F¨ ur die Relationen aus Beispiel 30 gilt (i) R ist eine partielle Ordnung und nicht symmetrisch, (ii) R ist eine partielle Ordnung und nicht symmetrisch, ¨ (iii) R ist eine Aquivalenzrelation und nicht antisymmetrisch, vergleiche Gleichheit von Br¨ uchen, (iv) R ist eine partielle Ordnung, die nur im Trivialfall Z = ∅ symmetrisch ist. Definition 33. Eine partielle Ordnung R auf einer Menge X heißt totale Ordnung, falls ∀ x, y ∈ X : ((x, y) ∈ R ∨ (y, x) ∈ R). Beispiel 34. Von den partiellen Ordnungen aus Beispiel 30 sind nur (i) und, falls Z h¨ochstens ein Element enth¨alt, (iv) totale Ordnungen. Beispiel 35. Gelte X 6= ∅ und Y 6= ∅. Betrachte eine Funktion f : X → Y , und definiere  R = (x, x0 ) ∈ X 2 : f (x) = f (x0 ) . ¨ Dann ist R eine Aquivalenzrelation und genau dann eine (triviale) partielle Ordnung, wenn f injektiv ist. Im Folgenden bezeichnet X eine nicht-leere Menge. ¨ Definition 36. Sei R eine Aquivalenzrelation auf X. F¨ ur x ∈ X heißt Ax = AR x = {z ∈ X : (x, z) ∈ R} ¨ die Aquivalenzklasse von x (bez¨ uglich R).

I.3. Funktionen und Relationen

11

Lemma 37. In obiger Situation gilt f¨ ur alle x, x0 ∈ X (i) x ∈ Ax , (ii) Ax = Ax0 ⇔ Ax ∩ Ax0 6= ∅ ⇔ (x, x0 ) ∈ R. Beweis. ad (i): Dies ist die Reflexivit¨at. ad (ii): Wir schließen gem¨aß Bemerkung 1.5.(v). Mit (i) folgt Ax = Ax0 ⇒ Ax ∩ Ax0 6= ∅. Gelte Ax ∩ Ax0 6= ∅. W¨ahle z ∈ Ax ∩ Ax0 . Dann gilt (x, z) ∈ R und (x0 , z) ∈ R. Symmetrie und Transitivit¨at sichern (x, x0 ) ∈ R. Gelte (x, x0 ) ∈ R. Sei z ∈ Ax , d.h. (x, z) ∈ R. Wie oben folgt (x0 , z) ∈ R, d.h. z ∈ Ax0 . Dies zeigt Ax ⊆ Ax0 . Die Symmetrie sichert Ax0 ⊆ Ax .

Partitionen Definition 38. Eine Menge P von Teilmengen von X heißt Partition von X, falls (i) ∀ A ∈ P : A 6= ∅, (ii) ∀ A, B ∈ P : (A 6= B ⇒ A ∩ B = ∅), S (iii) A∈P A = X. Bemerkung 39. F¨ ur jede Partition P von X gilt ∀ x ∈ X ∃1 A ∈ P : x ∈ A. Beispiel 40. (i) Die Partitionen von {1, 2, 3} sind      {1}, {2}, {3} , {1, 2}, {3} , {1, 3}, {2} , {2, 3}, {1} , {1, 2, 3} . (ii) Eine Partition von N ist {G, U } mit G = {x ∈ N : x gerade} und U = {x ∈ N : x ungerade}. Beachte: Durch R = {(x, x0 ) ∈ N2 : x + x0 gerade} R ¨ wird eine Aquivalenzrelation auf N definiert, und es gilt G = AR 2 sowie U = A1 .

¨ Wir formulieren und beweisen, daß die Partitionen von X genau den Aquivalenzrelationen auf X entsprechen. ¨ Satz 41. Sei M die Menge der Aquivalenzrelationen auf X, und sei N die Menge der Partitionen von X. Dann ist ϕ : M → N : R 7→ {AR x : x ∈ X} eine Bijektion.

I.4. Gruppen und K¨orper

12

Beweis. Lemma 37 zeigt: f¨ ur alle R ∈ M gilt {AR x : x ∈ X} ∈ N. Somit ist ϕ wohldefiniert. Mit (i)–(iii) beziehen wir uns im Folgenden auf die Eigenschaften aus Definition 38. Surjektivit¨at“: Sei P ∈ N. Definiere ” R = {(x, x0 ) ∈ X 2 : ∃ A ∈ P : {x, x0 } ⊆ A}. Wir zeigen R ∈ M.

(2)

Wegen (iii) ist R reflexiv. Da {x, x0 } = {x0 , x}, ist R symmetrisch. Gelte (x, x0 ) ∈ R und (x0 , x00 ) ∈ R. Also existieren A, B ∈ P mit {x, x0 } ⊆ A und {x0 , x00 } ⊆ B. Wegen (ii) folgt A = B. Also {x, x00 } ⊆ A, d.h. (x, x00 ) ∈ R. Somit gilt (2). Wir zeigen ∀ A ∈ P ∀ x ∈ A : AR x = A.

(3)

0 ⊆“: F¨ ur A ∈ P und x ∈ A sei x0 ∈ AR x , d.h. (x, x ) ∈ R. Mit Bemerkung 39 folgt ”0 x ∈ A ⊇“: F¨ ur A ∈ P und x ∈ A sei x0 ∈ A. Dann (x, x0 ) ∈ R, d.h. x0 ∈ AR x . Somit ” gilt (3).

Wegen (2) ist ϕ(R) wohldefiniert. Wir zeigen ϕ(R) = P,

(4)

woraus sich die Surjektivit¨at von ϕ ergibt. ⊆“: Sei x ∈ X. W¨ahle A ∈ P mit x ∈ A, siehe (iii). Gem¨aß (3) gilt AR x = A ∈ P. ” R ⊇“: Sei A ∈ P . W¨ahle x ∈ A, siehe (i). Mit (3) folgt A = Ax ∈ ϕ(R). Somit gilt (4). ” Injektivit¨at“: Wir zeigen ”  ∀ R, S ∈ M : ϕ(R) ⊆ ϕ(S) ⇒ R ⊆ S . (5) S Gelte ϕ(R) ⊆ ϕ(S), und sei (x, x0 ) ∈ R. Dann existiert y ∈ X mit AR x = Ay . S Insbesondere folgt x ∈ ASy und weiter ASy = ASx , siehe Lemma 37. Also x0 ∈ AR x = Ax , d.h. (x, x0 ) ∈ S. Somit gilt (5).

Aus ϕ(R) = ϕ(S) f¨ ur R, S ∈ M folgt mit (5), daß R = S. Literatur. [AE, I.3, I.4 und S. 54], [SS, 4.2 und 4.3], [Fi, 1.1] und [H1, 1 und 13].

4

Gruppen und Ko ¨rper

Im Folgenden bezeichnet G eine nicht-leere Menge.

Gruppen Definition 1. Eine Abbildung ∗:G×G→G

I.4. Gruppen und K¨orper

13

heißt Verkn¨ upfung auf G. Diese heißt assoziativ , falls ∀ a, b, c ∈ G : (a ∗ b) ∗ c = a ∗ (b ∗ c), und kommutativ , falls ∀a, b ∈ G : a ∗ b = b ∗ a. Schreibweise: Im Fall der Assoziativit¨at in der Regel keine Klammern bei Verkn¨ upfung mehrerer Elemente. Kontextabh¨angig schreibt man auch a + b, a · b, ab etc. statt a ∗ b. Definition 2. Eine Menge G, versehen mit einer Verkn¨ upfung ∗, heißt Gruppe, falls ∗ assoziativ ist und e ∈ G existiert, so daß ∀a ∈ G : e ∗ a = a

(1)

∀ a ∈ G ∃ a0 ∈ G : a0 ∗ a = e.

(2)

und Notation: gelegentlich (G, ∗). G heißt kommutativ (abelsch), falls ∗ u ¨berdies kommutativ ist. Beispiel 3. Kommutative Gruppen sind G = Z und G = Q mit der Addition, G = Q \ {0} mit der Multiplikation sowie G = {0, 1} mit ∗ 0 1

0 0 1

1 1 0

Permutationen Definition 4. Sei ∗ eine Verkn¨ upfung auf G. F¨ ur ∅ 6= G0 ⊆ G gelte ∀ a, b ∈ G0 : a ∗ b ∈ G0 . Dann heißt ∗0 : G0 × G0 → G0 , definiert durch a ∗0 b = a ∗ b, die auf G0 induzierte Verkn¨ upfung. Fortan in der Regel keine Unterscheidung zwischen ∗ und ∗0 . Notation: F¨ ur Mengen X, Y bezeichnet13 Y X die Menge aller Abbildungen von X nach Y . Satz 5. Sei X 6= ∅. Versehen mit der Komposition ◦ ist G = {f ∈ X X : f bijektiv} eine Gruppe. Diese ist nicht kommutativ, falls X mehr als 2 Elemente besitzt. 13

Abb(X, Y ) bei [Fi].

I.4. Gruppen und K¨orper

14

e = X X . Zun¨achst ist ◦ eine assoziative Verkn¨ e siehe Beweis. Setze G upfung auf G, Bemerkung 3.17. Wir zeigen ∀ f, g ∈ G : g ◦ f ∈ G.

(3)

e surjektiv, so folgt (g ◦ f )(X) = g (f (X)) = g(X) = X. Sind f, g ∈ G e Sind f, g ∈ G 0 0 0 injektiv und x, x ∈ X, so folgt aus (g ◦ f )(x) = (g ◦ f )(x ), daß f (x) = f (x ) und weiter x = x0 . Somit gilt (3), d.h. die Komposition induziert auch eine Verkn¨ upfung auf G. Diese erbt die Assoziativit¨at. Verifikation von (1), (2) aus Definition 2: F¨ ur e = idX gilt e ∈ G. F¨ ur f ∈ G gilt −1 −1 e ◦ f = f und f ◦ f = f ◦ f = e. Satz 3.19 (Umkehrabbildung) sichert f −1 ∈ G. Zur Nicht-Kommutativit¨at: Seien x, y, z ∈ X paarweise verschieden. Definiere f, g ∈ G durch f (x) = y, f (y) = x, f (u) = u f¨ ur u ∈ X \ {x, y} und g(y) = z,

g(z) = y,

g(u) = u f¨ ur u ∈ X \ {y, z}.

Dann folgt (g ◦ f )(x) = g(y) = z und (f ◦ g)(x) = f (x) = y. Definition 6. G aus Satz 5 heißt die symmetrische Gruppe der Menge X. Im Spezialfall X = {1, . . . , n} mit n ∈ N heißt G Permutationsgruppe; deren Elemente heißen Permutationen von 1, . . . , n.

Elementare Eigenschaften von Gruppen Im Folgenden sei G eine Gruppe. Lemma 7. Seien e ∈ G mit (1) und (2) und a, a0 ∈ G. Dann gilt (i) a0 a = e ⇒ aa0 = e, (ii) ae = a. Beweis. ad (i): Gem¨aß14 (2) existiert a00 ∈ G mit a00 a0 = e. Mit (1) folgt aa0 = eaa0 = a00 a0 aa0 = a00 ea0 = a00 a0 = e. ad (ii): Aus (i) ergibt sich f¨ ur a0 a = e, daß ae = aa0 a = ea = a.

Satz 8. Es existiert genau ein e ∈ G mit den Eigenschaften (1) und (2). 14

Fortan in der Regel keine Wiederholung der Voraussetzungen und Annahmen in Beweisen.

I.4. Gruppen und K¨orper

15

Beweis. Gelten (1) und (2) f¨ ur e = e1 und e = e2 . Insbesondere folgt e1 e2 = e2 und e2 e1 = e1 . Lemma 7.(i) zeigt e2 e1 = e2 . Man erh¨alt e1 = e2 . Definition 9. e ∈ G mit den Eigenschaften (1) und (2) heißt das neutrale Element von G. Im Folgenden sei e das neutrale Element von G. Satz 10. F¨ ur alle a ∈ G existiert genau ein a0 ∈ G mit a0 a = e. Beweis. Seien a0 , a00 ∈ G mit a0 a = a00 a = e. Lemma 7 zeigt 00

a = a00 e = a00 aa0 = ea0 = a0 .

Definition 11. F¨ ur a ∈ G heißt a0 ∈ G mit a0 a = e das zu a ∈ G inverse Element. 0 −1 Notation: a = a , a0 = 1/a oder a0 = −a. Lemma 12. F¨ ur a, b, c ∈ G gilt (i) ab = ac ⇒ b = c, (ii) ba = ca ⇒ b = c, (iii) (a−1 )−1 = a, (iv) (ab)−1 = b−1 a−1 , (v) e−1 = e, (vi) ∃1 x ∈ G : ax = b. Beweis. Verwende Lemma 7 und die S¨atze 8 und 10. Details ¨ Ubung.

Untergruppen Definition 13. G0 ⊆ G heißt Untergruppe von G, falls G0 6= ∅ und  ∀ a, b ∈ G0 : ab ∈ G0 ∧ a−1 ∈ G0 . Bemerkung 14. (i) F¨ ur jede Untergruppe G0 von G gilt e ∈ G0 . Zum Beweis w¨ahle man a ∈ G0 . Dann folgt a−1 ∈ G0 und weiter e = aa−1 ∈ G0 . (ii) Bez¨ uglich der Mengeninklusion ist {e} die kleinste und G die gr¨oßte Untergruppe von G, d.h. {e} und G sind Untergruppen von G, und f¨ ur jede Untergruppe G0 0 von G gilt {e} ⊆ G ⊆ G.

I.4. Gruppen und K¨orper

16

Beispiel 15. (i) G0 = Z ist eine Untergruppe von G = Q bez¨ uglich der Addition. (ii) G0 = {g ∈ Q : g > 0} ist eine Untergruppe von G = Q \ {0} bez¨ uglich der Multiplikation. (iii) Sei G die symmetrische Gruppe von X. F¨ ur X0 ⊆ X ist G0 = {f ∈ G : ∀x ∈ X0 : f (x) = x} eine Untergruppe von G. Satz 16. Jede Untergruppe von G, versehen mit der induzierten Verkn¨ upfung, ist eine Gruppe mit neutralem Element e. Beweis. Die auf G0 induzierte Verkn¨ upfung ∗0 erbt die Assoziativit¨at der Verkn¨ upfung 0 ∗ auf G, und gem¨aß Bemerkung 14.(i) gilt e ∈ G . Sei a ∈ G0 . Dann gilt e∗0 a = e∗a = a. Weiter gilt a−1 ∈ G0 und a−1 ∗0 a = a−1 ∗ a = e. T Lemma 17. F¨ ur jede Familie (Gi )i∈I von Untergruppen von G mit I 6= ∅ ist i∈I Gi eine Untergruppe von G. T Beweis. Seien a, b ∈ i∈I Gi . F¨ ur jedes i ∈ I gilt ab ∈ Gi und a−1 ∈ Gi , da Gi T T Untergruppe von G. Dies zeigt ab ∈ i∈I Gi und a−1 ∈ i∈I Gi . Beispiel 18. G1 = {k · 2 : k ∈ Z} und G2 = {k · 3 : k ∈ Z} sind Untergruppe von G = Z bez¨ uglich der Addition. Es gilt G1 ∩ G2 = {k · 6 : k ∈ Z}. Ferner gilt −2, 3 ∈ G1 ∪ G2 , aber (−2) + 3 = 1 ∈ / G1 ∪ G2 . Somit ist G1 ∪ G2 keine Untergruppe von G. Definition 19. Zu G0 ⊆ G sei G = {G0 : G0 Untergruppe von G, G0 ⊆ G0 }. Dann heißt

T

G0 ∈G

G0 die von G0 erzeugte Untergruppe von G. Notation: \ hG0 i = G0 . G0 ∈G

Bemerkung 20. In obiger Situation gilt G0 ⊆ hG0 i ⊆ G und f¨ ur jede Untergruppe G0 von G G0 ⊆ G0 ⇒ hG0 i ⊆ G0 . Bez¨ uglich der Mengeninklusion ist hG0 i also die kleinste Untergruppe von G, die G0 enth¨alt. Beispiel 21. F¨ ur G = Q mit der Addition und G0 = {1} gilt hG0 i = Z. Wir zeigen ⊆“. Es gilt 1 ∈ Z. Beispiel 15.(i) sichert hG0 i ⊆ Z. ” Wir zeigen ⊇“. Es gilt {−1, 0, 1} ⊆ hG0 i. Iterierte Addition von 1 bzw. −1 zeigt ” Z ⊆ hG0 i. Hier versteckt sich ein Induktionsargument, siehe Abschnitt II.2.

I.4. Gruppen und K¨orper

17

K¨ orper Definition 22. Eine Menge K, versehen mit Verkn¨ upfungen +:K ×K →K ·:K ×K →K

Addition Multiplikation

heißt K¨orper , falls folgendes gilt: (i) (K, +) ist eine kommutative Gruppe. (ii) Sei 0 das neutrale Element in (K, +). F¨ ur K ∗ = K \ {0} gilt ∀a, b ∈ K ∗ : a · b ∈ K ∗ , und (K ∗ , ·) ist eine kommutative Gruppe.  (iii) ∀a, b, c ∈ K : a · (b + c) = a · b + a · c ∧ (a + b) · c = a · c + b · c (Distributivit¨at). Notation: Stets 0 f¨ ur das neutrale Element und −a f¨ ur das zu a ∈ K inverse Element in (K, +). Stets 1 f¨ ur das neutrale Element und a−1 oder 1/a f¨ ur das zu a ∈ K ∗ inverse Element in (K ∗ , ·). Oft ab statt a · b. Kurz: a − b statt a + (−b) f¨ ur a, b ∈ K, und a/b statt a · b−1 f¨ ur a ∈ K und b ∈ K ∗ . Konvention: · bindet st¨arker als +. Bemerkung 23. In jedem K¨orper gilt 0 6= 1 per definitionem. Beispiel 24. K¨orper sind (i) Q mit der u ¨blichen Addition und Multiplikation, (ii) K = {0, 1} mit der Addition gem¨aß Beispiel 3 und der Multiplikation · 0 0 0 1 0

1 0 1

Hier gilt 1 + 1 = 0.

Elementare Eigenschaften von K¨ orpern Im Folgenden sei K ein K¨orper. Lemma 25. F¨ ur a, b, c ∈ K gilt (i) 0 · a = a · 0 = 0, (ii) a · b = 0 ⇒ a = 0 ∨ b = 0,

I.4. Gruppen und K¨orper

18

(iii) a · (−b) = (−a) · b = −(ab), (iv) (−a) · (−b) = ab, (v) a · b = a · c ∧ a 6= 0 ⇒ b = c, (vi) a 6= 0 ⇒ (∃1 x ∈ K : a · x = b). Beweis. ad (i): Es gilt 0 + 0 · a = 0 · a = (0 + 0) · a = 0 · a + 0 · a. Lemma 12.(ii) sichert 0 = 0 · a. Ebenso zeigt man 0 = a · 0. ad (ii): Zu zeigen ist a 6= 0 ∧ b 6= 0 ⇒ a · b 6= 0. Dies folgt aus (ii) in Definition 22. ad (iii): Mit (i) ergibt sich a · b + a · (−b) = a · (b + (−b)) = a · 0 = 0. Satz 10 sichert −(a · b) = a · (−b). Ebenso folgt −(a · b) = (−a) · b. ad (iv): Mit (iii) und Lemma 12.(iii) ergibt sich (−a) · (−b) = −(a · (−b)) = −(−(a · b)) = a · b. ad (v): Aus a · b = a · c folgt mittels (iii) a · (b − c) = a · b + a · (−c) = a · b − a · c = 0. Wende (ii) an. ad (vi): Gelte b = 0. Dann ist x = 0 gem¨aß (i) und (ii) die eindeutig bestimmte L¨osung von a · x = b. Gelte b 6= 0. Dann ist x = a−1 b gem¨aß Lemma 12.(vi) die eindeutig bestimmte L¨osung von ax = b in K ∗ . Wegen (i) ist x = 0 keine L¨osung dieser Gleichung. Bemerkung 26. Wegen Lemma 25.(i) ist die Multiplikation assoziativ und kommutativ auf K, und es gilt ∀a ∈ K : 1 · a = a, aber 0 besitzt kein multiplikatives Inverses.

Punktweise Addition und Multiplikation von Funktionen Im Folgenden sei X 6= ∅ eine Menge. Definition 27. Auf K X sind Addition und Multiplikation wie folgt definiert. F¨ ur f, g ∈ K X und x ∈ X gilt (f + g)(x) = f (x) + g(x) und (f · g)(x) = f (x) · g(x). Sprechweise: punktweise Addition bzw. Multiplikation.

I.4. Gruppen und K¨orper

19

Lemma 28. (i) (K X , +) ist eine kommutative Gruppe mit 0 ∈ K X als neutralem Element. (ii) Die Multiplikation ist assoziativ und kommutativ auf K X , und f¨ ur 1 ∈ K X gilt ∀ f ∈ K X : 1 · f = f. (iii) Es gelten die Distributivgesetze. (iv) F¨ ur alle f ∈ K X gilt   ∃ g ∈ K X : g · f = 1 ⇔ ∀ x ∈ X : f (x) 6= 0 . Beweis. Tutorium 2.1. Notation: kurz f − g statt f + (−g) f¨ ur f, g ∈ K X und f /g statt f · h f¨ ur f ∈ K X und g ∈ K X , falls g(x) 6= 0 und h(x) = (g(x))−1 f¨ ur alle x ∈ X. Literatur. [Fi, 1.2 und 1.3] und [Fo1, § 2].

Kapitel II Die reellen Zahlen Im Zentrum dieses Kapitels stehen die axiomatische Beschreibung der reellen und der nat¨ urlichen Zahlen und der Grenzwertbegriff; wir verweisen dazu insbesondere auf [Fo1], [AE] und [H1].

1

Angeordnete K¨ orper

Definition 1. K heißt angeordneter K¨orper , falls K ein K¨orper ist und eine Menge P ⊆ K mit folgenden Eigenschaften existiert: (i) F¨ ur alle x ∈ K gilt genau eine der Aussagen x ∈ P, x = 0, −x ∈ P ,  (ii) ∀ x, y ∈ K : x ∈ P ∧ y ∈ P ⇒ x + y ∈ P ,  (iii) ∀ x, y ∈ K : x ∈ P ∧ y ∈ P ⇒ x · y ∈ P . Ferner heißt x ∈ K positiv (negativ ), falls x ∈ P (−x ∈ P ). Im Folgenden bezeichnet K einen angeordneten K¨orper. Definition 2. Die Relationen gr¨oßer (>), kleiner ( y, falls x − y ∈ P , x < y, falls y > x, x ≥ y, falls x > y ∨ x = y, x ≤ y, falls y ≥ x, f¨ ur x, y ∈ K. Ferner heißt x ∈ K nicht-negativ (nicht-positiv ), falls x ≥ 0 (x ≤ 0). Lemma 3. Seien x, y, z ∈ K. (i) Es gilt genau eine der Aussagen x > y, x = y, x < y. (ii) x < y ∧ y < z ⇒ x < z. 20

II.1. Angeordnete K¨orper

21

Beweis. ad (i): Setze z = x − y. Beachte y − x = −z und wende (i) aus Definition 1 an. ad (ii): Aus y − x > 0 und z − y > 0 folgt z − x > 0 mit (ii) aus Definition 1. Bemerkung 4. Mit Lemma 3 folgt, daß ≤ und ≥ totale Ordnungen auf K sind. Beispiel 5. (i) K = Q ist ein angeordneter K¨orper. (ii) K = {0, 1} mit den Operationen aus Beispiel I.4.24.(ii) ist kein angeordneter K¨orper. Es gilt n¨amlich −1 = 1 6= 0, so daß (i) aus Definition 1 nicht erf¨ ullt ist. Lemma 6. F¨ ur x, y, a, b ∈ K gilt (i) x < y ⇒ a + x < a + y, (ii) x < y ⇒ −x > −y, (iii) x < y ∧ a < b ⇒ x + a < y + b, (iv) x < y ∧ a > 0 ⇒ ax < ay, (v) 0 ≤ x < y ∧ 0 ≤ a < b ⇒ ax < by, (vi) x < y ∧ a < 0 ⇒ ax > ay, (vii) x 6= 0 ⇒ x2 > 0, (viii) x > 0 ⇔ x−1 > 0, (ix) 0 < x < y ⇔ 0 < y −1 < x−1 . Beweis. Siehe [Fo1, S. 26–28]. Wir zeigen hier nur (iii). Mit (i) folgt x + a < y + a und y + a < y + b. Lemma 3.(ii) sichert x + a < y + b. Bemerkung 7. Lemma 6.(ii) und (vii) zeigen insbesondere: (i) 1 > 0. (ii) Die Gleichung x2 = −1 besitzt keine L¨osung in K.

Maximum, Minimum und Betrag Definition 8. Maximum und Minimum von x, y ∈ K und der (Absolut)Betrag von x ∈ K sind definiert durch ( ( x, falls x ≥ y, x, falls x ≤ y, max(x, y) = min(x, y) = y, falls y > x, y, falls y < x, und |x| =

( x, −x,

falls x ≥ 0, falls x < 0.

II.1. Angeordnete K¨orper

22

Satz 9. F¨ ur x, y ∈ K gilt (i) |x| ≥ 0, (ii) |x| = 0 ⇔ x = 0, (iii) |x + y| ≤ |x| + |y| (Dreiecksungleichung), (iv) |x · y| = |x| · |y| Beweis. ad (i), (ii): F¨ ur x = 0 gilt |x| = x = 0, f¨ ur x > 0 gilt |x| = x > 0 und f¨ ur x < 0 gilt |x| = −x > 0, siehe Lemma 6.(ii). Wir bemerken erg¨anzend, daß |x| ≥ x und |x| ≥ −x. ad (iii): Aus x ≤ |x| und y ≤ |y| folgt mit Lemma 6.(iii) x + y ≤ |x| + |y| . Ebenso folgt aus −x ≤ |x| und −y ≤ |y|, daß −(x + y) = −x − y ≤ |x| + |y| . Fazit |x + y| ≤ |x| + |y|. ad (iv): Siehe [Fo1, S. 30]. Korollar 10. F¨ ur x, y ∈ K gilt (i) |−x| = |x|, (ii) |x| − |y| ≤ |x − y|, (umgekehrte Dreiecksungleichung), (iii) y 6= 0 ⇒ |x/y| = |x| / |y|. Beweis. ad (i): Verwende Satz 9.(iv). ad (ii): Mit Satz 9.(iii) ergibt sich |x| = |x − y + y| ≤ |x − y| + |y|, so daß |x| − |y| ≤ |x − y|. Ebenso folgt −(|x| − |y|) = |y| − |x| ≤ |x − y|. ad (iii): Mit Satz 9.(iv) ergibt sich |x| = |x/y · y| = |x/y| · |y|. Multiplikation mit |y|−1 liefert die Behauptung. Wir definieren 2 = 1 + 1.

II.2. Die nat¨ urlichen Zahlen

23

Bemerkung 11. F¨ ur x, y ∈ K gilt (i) |x| = max(x, −x), (ii) max(x, y) = 21 (x + y + |x − y|), (iii) min(x, y) = 21 (x + y − |x − y|), (iv) min(x, y) = − max(−x, −y). Beweis. ¨ Ubung.

Beschr¨ ankte Mengen und Funktionen Definition 12. A ⊆ K heißt1 (i) nach oben beschr¨ankt, falls c ∈ K existiert, so daß ∀ a ∈ A : a ≤ c,

(1)

(ii) nach unten beschr¨ankt, falls c ∈ K existiert, so daß ∀ a ∈ A : a ≥ c,

(2)

(iii) beschr¨ankt, falls A nach oben und nach unten beschr¨ankt ist. Die Menge aller c ∈ K mit (1) bzw. (2) heißt Menge der oberen bzw. unteren Schranken von A. Bemerkung 13. A ⊆ K ist genau dann beschr¨ankt, wenn c ∈ K existiert, so daß ∀ a ∈ A : |a| ≤ c. Definition 14. Sei X eine Menge. Dann heißt f : X → K nach oben beschr¨ankt, (nach unten beschr¨ankt), (beschr¨ankt), falls f (X) diese Eigenschaft besitzt. Literatur. [Fo1, § 3].

2

Die natu ¨ rlichen Zahlen

Im Folgenden sei K ein angeordneter K¨orper. 1

Beschr¨ anktheit nach oben bzw. unten analog f¨ ur Teilmengen partiell geordneter Mengen.

II.2. Die nat¨ urlichen Zahlen

24

Induktive Mengen Definition 1. M ⊆ K heißt induktiv , falls (i) 1 ∈ M , (ii) ∀ x ∈ K : (x ∈ M ⇒ x + 1 ∈ M ). Beispiel 2. Die Mengen K und {x ∈ K : x ≥ 1} sind induktiv. Setze I = {M ⊆ K : M induktiv} und, vergleiche Definition I.4.19, \ N= M. M ∈I

Lemma 3. (i) N ∈ I, (ii) M ∈ I ⇒ N ⊆ M . Beweis. Nach Definition gilt f¨ ur alle x ∈ K x ∈ N ⇔ (∀ M ∈ I : x ∈ M ) . ad (i): F¨ ur alle M ∈ I gilt 1 ∈ M , also 1 ∈ N . Sei n ∈ N . Dann folgt n + 1 ∈ M f¨ ur alle M ∈ I, also n + 1 ∈ N . ad (ii): klar. Bemerkung 4. Lemma 3 zeigt: N ist bez¨ uglich der Mengeninklusion die kleinste induktive Teilmenge von K. Beispiel 2 zeigt ∀ n ∈ N : n ≥ 1.

(1)

F¨ ur y ∈ K sei ]y, y + 1[ = {x ∈ K : y < x < y + 1}. Bemerkung 5. Es gilt (y + (y + 1))/2 ∈ ]y, y + 1[ und insbesondere ]y, y + 1[ 6= ∅. Satz 6. F¨ ur alle n ∈ N gilt ]n, n + 1[ ∩ N = ∅. Beweis. Setze M1 = {1} ∪ {x ∈ K : x ≥ 2}. Wir zeigen N ⊆ M1 ,

(2)

indem wir nachweisen, daß M1 induktiv ist und dann Lemma 3 verwenden. Offenbar gilt 1 ∈ M1 . Sei x ∈ M1 , also x = 1 oder x ≥ 2. F¨ ur x = 1 gilt x + 1 = 2 ≥ 2, und f¨ ur x ≥ 2 gilt x + 1 ≥ 2 + 1 > 2.

II.2. Die nat¨ urlichen Zahlen

25

Wir zeigen ]1, 2[ ∩ N = ∅.

(3)

F¨ ur n ∈ N gilt n = 1 oder n ≥ 2, siehe (2), so daß 1 < n < 2 nicht erf¨ ullt ist. Setze M2 = {n ∈ N : n − 1 ∈ N ∪ {0}}. Wir zeigen M2 = N,

(4)

indem wir nachweisen, daß M2 induktiv ist und dann Lemma 3 und M2 ⊆ N verwenden. Offenbar gilt 1 ∈ M2 . Sei n ∈ M2 . Dann gilt n + 1 ∈ N und n + 1 − 1 = n ∈ N ⊆ N ∪ {0}. Setze M3 = {n ∈ N : ]n, n + 1[ ∩ N = ∅}. Wie oben zeigen wir M3 = N und damit die Behauptung des Satzes. Gem¨aß (3) gilt 1 ∈ M3 . Sei n ∈ M3 . Dann gilt n + 1 ∈ N . Annahme: es existiert m ∈ N mit n + 1 < m < n + 2. Es folgt n 0 ⇒ (∃ n ∈ N : nx > y) .

(1)

Beispiel 2. Q ist archimedisch. Bemerkung 3. Es existieren angeordnete K¨orper, die nicht archimedisch sind, siehe [Fo1, S. 31]. Im Folgenden sei K ein archimedisch angeordneter K¨orper. Bemerkung 4. F¨ ur jedes ε ∈ K mit ε > 0 gilt ∃ n ∈ N : 1/n < ε. Dies folgt aus (1) mit x = 1 und y = 1/ε zusammen mit Lemma 1.6.(iv). Satz 5. Sei b ∈ K. (i) Falls b > 1, gilt f¨ ur alle c ∈ K ∃ n ∈ N : bn > c.

II.5. Konvergenz von Folgen

34

(ii) Falls 0 < b < 1, gilt f¨ ur alle ε ∈ K mit ε > 0 ∃ n ∈ N : bn < ε. Beweis. ad (i): Wir betrachten den nicht-trivialen Fall c > 1. Setze x = b − 1. Dann gilt x > 0, und Satz 2.21 (Bernoullische Ungleichung) sichert bn ≥ 1 + nx f¨ ur alle n ∈ N. Wende (1) mit y = c − 1 an. ad (ii): Verwende bn < ε ⇔ (1/b)n > 1/ε, siehe Lemma 1.6.(ix), und Aussage (i). Satz 6. F¨ ur jedes x ∈ K gilt ∃1 n ∈ Z : n ≤ x < n + 1. Beweis. Existenz“: Per Induktion ergibt sich (in beliebigen angeordneten K¨orpern) ” ∀ m ∈ N ∀ x ∈ K : (0 ≤ x < m ⇒ ∃ n ∈ N0 : n ≤ x < n + 1) . Da K archimedisch ist, folgt die Existenzaussage f¨ ur alle x ≥ 0. F¨ ur x < 0 betrachtet man −x und wendet das bereits Bewiesene an. Eindeutigkeit“: Annahme: Es existieren n, n0 ∈ Z mit n 6= n0 , so daß ” n≤x 1 und m ∈ Z, also m ≥ 2 nach Satz 2.6. Dies zeigt n0 − n ≥ 1. Man erh¨alt n + 1 ≤ n0 ≤ x und schließlich den Widerspruch x < x. Literatur. [Fo1, § 3].

5

Konvergenz von Folgen

Im Folgenden sei K ein archimedisch angeordneter K¨orper. Erinnerung: Folgen in K, kurz K-wertige Folgen, sind Abbildungen a : N → K. Notation u ¨blicherweise (an )n∈N oder (an )n , wobei an = a(n). Die nachstehenden Definitionen und Ergebnisse gelten analog f¨ ur Folgen mit Indexmengen der Form {n ∈ Z : n ≥ k} f¨ ur k ∈ Z.

II.5. Konvergenz von Folgen

35

Beispiel 1. (i) (an )n = (x)n mit x ∈ K (konstante Folge), (ii) (an )n = (1/n)n , (iii) (an )n = (n/2n )n , (iv) (an )n = (xn )n mit x ∈ K. Im Folgenden seien (an )n , (bn )n und (cn )n K-wertige Folgen. Definition 2. (an )n heißt konvergent, falls a ∈ K existiert, so daß ∀ ε > 0 ∃ n0 ∈ N ∀ n ≥ n0 : |an − a| < ε.

(1)

Andernfalls heißt (an )n divergent. Gilt (1), so heißt a Grenzwert der Folge (an )n , und (an )n heißt konvergent gegen a. Satz 3. Jede Folge besitzt h¨ochstens einen Grenzwert. Beweis. Seien a, a0 ∈ K mit a0 < a. Setze ε = |a − a0 |/2 sowie A = {x ∈ K : |x − a| < ε}, A0 = {x ∈ K : |x − a0 | < ε}. Wir zeigen A ∩ A0 = ∅. Annahme: es existiert x ∈ A ∩ A0 . Dann folgt mit Satz 1.9.(iii) (Dreiecksungleichung) 2 · ε = |a − a0 | ≤ |a − x| + |x − a0 | < 2 · ε. Widerspruch, da ε > 0. Annahme: es existieren n0 , n00 ∈ N mit (∀ n ≥ n0 : |an − a| < ε) ∧ (∀ n ≥ n00 : |an − a0 | < ε) . F¨ ur n = max(n0 , n00 ) folgt an ∈ A ∩ A0 . Widerspruch. Notation: Statt (1) schreibt man auch limn→∞ an = a oder lim an = a. n

Bemerkung 4. (an )n ist genau dann divergent, wenn ∀ a ∈ K ∃ ε > 0 ∀ n0 ∈ N ∃ n ≥ n0 : |an − a| ≥ ε. Beispiel 5. Wir betrachten die Folgen (i), (ii) und (iv) aus Beispiel 1. (i) Hier gilt |an − x| = 0 < ε f¨ ur alle n ∈ N und ε > 0, so daß limn x = x.

II.5. Konvergenz von Folgen

36

(ii) Sei ε > 0. Bemerkung 4.4. sichert die Existenz von n0 ∈ N mit 0 < 1/n0 < ε. F¨ ur n ≥ n0 gilt 0 < 1/n ≤ 1/n0 und somit |1/n − 0| < ε. Fazit lim 1/n = 0. n

(iv) Wir betrachten den Fall |x| < 1. Sei ε > 0. Satz 4.5.(ii) sichert die Existenz von n0 ∈ N mit |x|n0 < ε. Per Induktion folgt |x|n < ε f¨ ur alle n ≥ n0 . Fazit: limn xn = 0. Im Fall x = 1 gilt limn xn = 1, siehe (i). Sei x = −1. F¨ ur a ≥ 0 und ungerade n ∈ N gilt |(−1)n − a| = | − 1 − a| = 1 + a ≥ 1. F¨ ur a < 0 und gerade n ∈ N gilt |(−1)n − a| = |1 − a| = 1 − a ≥ 1. Gem¨aß Bemerkung 4 ist (xn )n divergent. Der Fall |x| > 1 wird in Beispiel 12 behandelt. Definition 6. (an )n heißt Nullfolge, falls limn an = 0.

Konvergenz und Beschr¨ anktheit Wir studieren Beziehungen zwischen Konvergenz und Beschr¨anktheit, siehe Definition 1.14 mit X = N, und greifen dies sp¨ater mit Satz 6.18 wieder auf. Lemma 7. Sei (an )n eine Nullfolge, und gelte ∃ c > 0 ∀ n ∈ N : |bn | ≤ c · |an |. Dann ist (bn )n eine Nullfolge. Beweis. Sei ε > 0. Nach Voraussetzung existiert n0 ∈ N, so daß |an | < ε/c f¨ ur alle n ≥ n0 . F¨ ur n ≥ n0 folgt |bn | ≤ c · |an | < ε. Lemma 8. Ist (bn )n beschr¨ankt und (an )n eine Nullfolge, so ist (an ·bn )n eine Nullfolge. Beweis. Sei c > 0, so daß |bn | ≤ c f¨ ur alle n ∈ N. Dann folgt |an · bn | ≤ c · |an | f¨ ur alle n ∈ N. Wende Lemma 7 an.

II.5. Konvergenz von Folgen

37

Beispiel 9. Wir betrachten die Folge aus Beispiel 1.(iii). F¨ ur n ∈ N gilt n/2n = n2 /2n · 1/n. Per Induktion zeigt man ∀ n ≥ 4 : n2 ≤ 2n , woraus die Beschr¨anktheit von (n2 /2n )n folgt. Wende Beispiel 1.(ii) und Lemma 8 an, um limn n/2n = 0 zu erhalten. Satz 10. Jede konvergente Folge ist beschr¨ankt. Beweis. Gelte limn an = a. Folglich existiert n0 ∈ N mit ∀ n ≥ n0 : |an − a| < 1. F¨ ur n ≥ n0 folgt |an | ≤ |an − a| + |a| < 1 + |a|. Setze c = max (|a1 |, . . . , |an0 −1 |, 1 + |a|). Dann folgt |an | ≤ c f¨ ur alle n ∈ N. Bemerkung 11. Beispiel 5.(iv) mit x = −1 zeigt, daß die Beschr¨anktheit nicht hinreichend f¨ ur die Konvergenz ist. Beispiel 12. Wir betrachten die Folge aus Beispiel 4.(iv) im Fall |x| > 1. Satz 4.5.(i) zeigt, daß (xn )n unbeschr¨ankt ist. Nach Satz 10 ist diese Folge somit divergent.

Rechenregeln fu ¨ r konvergente Folgen Wir untersuchen nun Summen, Produkte und Quotienten konvergenter Folgen und behandeln in Satz 15 die geometrische Reihe, siehe Beispiel 7.3. Satz 13. Seien (an )n und (bn )n konvergent. Dann sind (an + bn )n und (an · bn )n konvergent, und es gilt lim(an + bn ) = lim an + lim bn , n

n

n

lim(an · bn ) = lim an · lim bn . n

n

n

Beweis. Seien a = limn an und b = limn bn . F¨ ur n ∈ N gilt |ab − an bn | ≤ |ab − abn | + |abn − an bn | ≤ |a| · |b − bn | + |bn | · |a − an |. Gem¨aß Satz 10 existiert c > 0 mit  ∀ n ∈ N : |bn | < c ∧ |a| < c . Sei ε > 0. Dann existiert n0 ∈ N mit ∀ n ≥ n0 : (|b − bn | < ε/(2c) ∧ |a − an | < ε/(2c)) .

II.5. Konvergenz von Folgen

38

Fazit: F¨ ur n ≥ n0 gilt |ab − an bn | < c · ε/(2c) + c · ε/(2c) = ε. Die Aussage f¨ ur die Summenfolge ist einfacher zu beweisen; Ausgangspunkt ist dazu |a + b − (an + bn )| ≤ |a − an | + |b − bn |.

Korollar 14. Sei (an )n konvergent, und sei α ∈ K. Dann ist (α · an )n konvergent, und es gilt lim(α · an ) = α · lim an . n

n

Beweis. Wende Satz 13 mit bn = α und Beispiel 5.(i) an. Satz 15. F¨ ur x ∈ K und n ∈ N0 sei sn =

n X

xk .

k=0

Falls |x| < 1, konvergiert (sn )n , und es gilt lim sn = n

1 . 1−x

Falls |x| ≥ 1, ist (sn )n divergent. Beweis. Sei x = 1. Dann gilt sn = n + 1. Mit (4.1) und Satz 10 folgt die Divergenz von (sn )n . Sei x 6= 1. Dann gilt sn =

1 · (xn+1 − 1), x−1

siehe Satz 2.12 (geometrische Summe). Satz 13 und Korollar 14 zeigen (sn )n konvergent ⇔ (xn )n konvergent. Konvergenz liegt genau dann vor, wenn |x| < 1, siehe Beispiele 5.(iv) und 12. Im Fall |x| < 1 wenden wir nochmals Satz 13 an und erhalten gem¨aß Beispiel 5.(iv) lim sn = n

1 1 · (lim xn+1 − 1) = . n x−1 1−x

Satz 16. Seien (an )n und (bn )n konvergent, und gelte limn bn 6= 0. Dann existiert n1 ∈ N, so daß ∀ n ≥ n1 : bn 6= 0. Ferner ist (an /bn )n≥n1 konvergent, und es gilt lim(an /bn ) = lim an / lim bn . n

n

n

II.5. Konvergenz von Folgen

39

Beweis. Zun¨achst behandeln wir den Spezialfall an = 1 f¨ ur alle n ∈ N. Setze b = limn bn . Nach Voraussetzung existiert n1 ∈ N, so daß ∀ n ≥ n1 : |b − bn | < |b|/2. F¨ ur n ≥ n1 folgt mit Korollar 1.10.(ii) (umgekehrte Dreiecksungleichung) |bn | ≥ ||b| − |bn − b|| ≥ |b| − |b − bn | > |b|/2 > 0. F¨ ur n ≥ n1 ergibt sich 1 1 2 1 − = b bn |b| · |bn | · |b − bn | ≤ b2 · |b − bn |. Hieraus folgt die Behauptung. Im allgemeinen Fall verwendet man an /bn = an · 1/bn f¨ ur bn 6= 0 und Satz 13.

Vergleichss¨ atze Satz 17. Seien (an )n und (bn )n konvergent mit limn an = limn bn , und gelte ∀ n ∈ N : an ≤ c n ≤ b n . Dann konvergiert (cn )n , und es gilt limn cn = limn an . Beweis. F¨ ur n ∈ N gilt cn = cn − an + an sowie 0 ≤ cn − an ≤ bn − an . Satz 13 sichert limn (bn − an ) = 0, und mit Lemma 7 folgt limn (cn − an ) = 0. Wende nochmals Satz 13 an. Satz 18. Seien (an )n und (bn )n konvergent. Dann gilt (∀ n ∈ N : an ≤ bn ) ⇒ lim an ≤ lim bn . n

n

Beweis. F¨ ur cn = bn − an gilt cn ≥ 0 f¨ ur alle n ∈ N, und (cn )n ist nach Satz 13 konvergent. Annahme: f¨ ur c = limn cn gilt c < 0. F¨ ur ε = −c/2 > 0 existiert dann n ∈ N mit |cn − c| < ε. Es folgt cn ≤ |cn − c| + c < c/2 < 0 im Widerspruch zu cn ≥ 0. Da bn = an + cn , ergibt sich lim bn = lim an + c ≥ lim an n

n

n

wiederum mit Satz 13. Korollar 19. Sei (an )n konvergent. Dann gilt (∃ c1 , c2 ∈ K ∀ n ∈ N : c1 ≤ an ≤ c2 ) ⇒ c1 ≤ lim an ≤ c2 . n

Beweis. Wende Satz 18 und Beispiel 5.(i) an.

II.5. Konvergenz von Folgen

40

Bemerkung 20. Das Konvergenzverhalten von Folgen wird nicht durch endliche ” Anfangsst¨ ucke“ bestimmt. Genauer: f¨ ur Folgen (an )n≥n1 und (bn )n≥n2 in K existiere n3 ≥ max(n1 , n2 ), so daß ∀ n ≥ n 3 : an = b n . Dann konvergiert (an )n genau dann, wenn (bn )n konvergiert, und gegebenenfalls gilt limn an = limn bn . Die Voraussetzungen in Lemma 7, Satz 17, Satz 18 und Korollar 19 k¨onnen entsprechend abgeschw¨acht werden.

Monotone Folgen Definition 21. (an )n heißt (i) monoton wachsend , falls ∀ n ∈ N : an ≤ an+1 , (ii) monoton fallend , falls (−an )n monoton wachsend ist, (iii) monoton, falls (an )n monoton wachsend oder monoton fallend ist. Gilt zus¨atzlich an 6= an+1 f¨ ur alle n ∈ N, so spricht man von strenger (strikter) Monotonie. Beispiel 22. Sei a ∈ K mit a > 0. W¨ahle x0 > 0 und definiere rekursiv ( 1/2 · (xn + a/xn ), falls xn > 0, xn+1 = −1, sonst, f¨ ur n ∈ N0 . Stichwort: Heron-Verfahren. Beachte, daß x + a/x > 0 f¨ ur alle x ∈ K mit x > 0. Per Induktion ergibt sich (i) ∀ n ∈ N0 : xn > 0. Wir zeigen (ii) ∀ n ∈ N : x2n ≥ a, (iii) (xn )n∈N ist monoton fallend. Sei n ∈ N0 . Es gilt x2n+1 − a = 1/4 · (x2n + 2a + a2 /x2n − 4a) = 1/4 · (xn − a/xn )2 ≥ 0, woraus (ii) folgt. Mit (i) und (ii) ergibt sich xn − xn+1 =

1 · (x2n − a) ≥ 0, 2xn

so daß auch (iii) gilt. Setze yn = a/xn f¨ ur n ∈ N0 . Mit (i)–(iii) folgt

II.5. Konvergenz von Folgen

41

(iv) ∀ n ∈ N0 : yn > 0, (v) ∀ n ∈ N : yn2 ≤ a, (vi) (yn )n∈N ist monoton wachsend, (vii) ∀ n ∈ N : yn ≤ xn . Frage: Konvergenz der Folgen (xn )n , (yn )n und (xn − yn )n ? Es gilt  xn + yn 2a 1 − = · (xn + yn )2 − 4a 2 xn + y n 2(xn + yn ) 1 = · (xn − yn )2 . 2(xn + yn )

xn+1 − yn+1 =

Da

xn − yn ≤ 1, x n + yn

folgt 0 ≤ xn+1 − yn+1 ≤ 1/2 · (xn − yn ) f¨ ur alle n ∈ N. Per Induktion erh¨alt man 0 ≤ xn − yn ≤ (1/2)n−1 · (x1 − y1 ) f¨ ur alle n ∈ N. Lemma 7 und Beispiel 5.(iv) sichern lim(xn − yn ) = 0. n

Satz 16 und Korollar 19 zeigen (xn )n konvergent ⇔ (yn )n konvergent, und im Fall der Konvergenz gilt f¨ ur x = limn xn , daß x > 0 und x = 1/2 · (x + a/x), siehe Korollar 19, Satz 13 und Satz 16. Hieraus folgt x2 = a.

(2)

Wir betrachten den Spezialfall K = Q und a = 2. Bekanntlich gilt z 2 6= 2 f¨ ur alle z ∈ Q. Fazit: in diesem Fall ist (xn )n divergent!

II.6. Vollst¨andigkeit

42

Bestimmte Divergenz Definition 23. (an )n heißt bestimmt divergent3 gegen ∞, falls ∀ c ∈ K ∃ n0 ∈ N ∀ n ≥ n0 : an > c, und bestimmt divergent gegen −∞, falls ∀ c ∈ K ∃ n0 ∈ N ∀ n ≥ n0 : an < c, Notation4 : limn an = ∞ bzw. limn an = −∞. Beispiel 24. Durch an = max((−1)n · n, 0) wird eine nach oben unbeschr¨ankte, und damit divergente Folge definiert, die nicht bestimmt divergent ist. Literatur. [Fo1, §4–§6].

6

Vollst¨ andigkeit

Im Folgenden sei K ein archimedisch angeordneter K¨orper. Ferner sei (an )n eine Folge in K. Definition 1. (an )n heißt Cauchy-Folge, falls ∀ ε > 0 ∃ n0 ∈ N ∀ n, m ≥ n0 : |an − am | < ε.

(1)

Satz 2. Jede konvergente Folge ist eine Cauchy-Folge. Beweis. Gelte limn an = a, und sei ε > 0. W¨ahle n0 ∈ N, so daß |an − a| < ε/2 f¨ ur alle n ≥ n0 . Dann folgt f¨ ur n, m ≥ n0 , daß |an − am | ≤ |an − a| + |a − am | < ε.

Beispiel 3. Betrachte die Folge (xn )n gem¨aß Beispiel 5.22 (Heron-Verfahren). F¨ ur n, m ∈ N mit m ≥ n gilt |xn − xm | = xn − xm ≤ xn − ym ≤ xn − yn . Sei ε > 0. Da limn (xn − yn ) = 0, existiert n0 ∈ N, so daß |xn − yn | < ε f¨ ur alle n ≥ n0 . F¨ ur n, m ≥ n0 ergibt sich |xn − xm | < ε. Fazit: (xn )n ist eine Cauchy-Folge. Beachte, daß (xn )n im Fall K = Q und a = 2 nicht konvergiert. Definition 4. K heißt vollst¨andig, falls jede Cauchy-Folge in K konvergiert. Bemerkung 5. Beispiel 3 zeigt, daß Q nicht vollst¨andig ist. 3 4

Terminologie nicht einheitlich; so auch uneigentlich konvergent. Im Rahmen dieser Vorlesung sind ∞ und −∞ keine Zahlen“. ”

II.6. Vollst¨andigkeit

43

Die reellen Zahlen Axiome der reellen Zahlen. Die Menge R der reellen Zahlen, versehen mit Verkn¨ upfungen + und ·, ist ein vollst¨andiger archimedisch angeordneter K¨orper. Korollar 6. Eine Folge in R ist genau dann konvergent, wenn sie eine Cauchy-Folge ist. Beweis. Verwende Satz 2 und die Vollst¨andigkeit von R. ¨ Bemerkung 7. Die reellen Zahlen k¨onnen als Aquivalenzklassen von Cauchy-Folgen rationaler Zahlen konstruiert werden, siehe [S, 2.2]. Die unterstellte Eindeutigkeitsaussage lautet wie folgt: Seien K1 und K2 zwei vollst¨andige archimedisch angeordnete K¨orper. Dann existiert eine Bijektion ϕ : K1 → K2 , so daß f¨ ur alle x, y ∈ K1 ϕ(x + y) = ϕ(x) + ϕ(y), ϕ(x · y) = ϕ(x) · ϕ(y) und x < y ⇒ ϕ(x) < ϕ(y). Siehe [SS, S. 328]. Bis auf weiteres legen wir fortan den K¨orper K = R zugrunde. Beispiel 8. F¨ ur jedes a ∈ R mit a > 0 konvergiert die Folge (xn )n gem¨aß Beispiel 3. F¨ ur x = limn xn gilt x > 0 und x2 = a. F¨ ur y > 0 mit y 2 = a gilt 0 = x2 − y 2 = (x + y) · (x − y), woraus y = x folgt. Fazit: f¨ ur X = {x ∈ R : x ≥ 0} ist die Abbildung f : X → X : x 7→ x2 bijektiv. Die √ Zahl f −1 (a) heißt Quadratwurzel , kurz Wurzel von a ∈ X. Notation: a. Stichworte: Approximation, Konvergenzgeschwindigkeit. Bemerkung 9. Sei a ∈ K mit a > 0 sowie k ∈ N mit k ≥ 2. W¨ahle x0 > 0 und definiere rekursiv xn+1 = 1/k · ((k − 1) · xn + a/xk−1 n ) f¨ ur n ∈ N0 . Dann konvergiert (xn )n , und x = limn xn ist die eindeutig bestimmte L¨osung von xk = a mit x > 0. Fazit: f¨ ur X = {x ∈ R : x ≥ 0} ist die Abbildung k f : X → X : x 7→ x bijektiv. Die Zahl f −1 (a) heißt k-te Wurzel von a ∈ X. Notation: √ k a. Siehe [Fo1, S. 66].

II.6. Vollst¨andigkeit

44

Intervallschachtelungen Definition 10. F¨ ur a, b ∈ R mit a ≤ b heißt [a, b] = {x ∈ R : a ≤ x ≤ b} kompaktes Intervall mit Randpunkten a und b. Definition 11. Eine Folge ([an , bn ])n kompakter Intervalle heißt Intervallschachtelung, falls (i) ∀ n ∈ N : [an , bn ] ⊇ [an+1 , bn+1 ], (ii) limn (bn − an ) = 0. Beispiel 12. In der Situation von Beispiel 5.22 (Heron-Verfahren) ist ([yn , xn ])n∈N eine Intervallschachtelung. Stichwort: Einschlußverfahren. Satz 13. F¨ ur jede Intervallschachtelung ([an , bn ])n existiert genau ein x ∈ R, so daß x ∈ [an , bn ] f¨ ur alle n ∈ N. Ferner gilt limn an = limn bn = x. Beweis. Existenz“: Wie in Beispiel 3 zeigt man, daß (an )n eine Cauchy-Folge ist, so ” daß die Vollst¨andigkeit von R die Konvergenz der Folge sichert. Setze x = limn an . Satz 5.13 (Summenregel) sichert x = limn bn . Mit Korollar 5.19 (Vergleichssatz) folgt x ∈ [an , bn ] f¨ ur alle n ∈ N. Eindeutigkeit“: F¨ ur x, y ∈ R gelte x, y ∈ [an , bn ] f¨ ur alle n ∈ N. Aus |x − y| ≤ bn − an ” und limn (bn − an ) = 0 ergibt sich x = y.

Der Satz von Bolzano-Weierstraß Definition 14. Sei (nk )k eine streng monoton wachsende Folge in N. Dann heißt (ank )k eine Teilfolge von (an )n . a ∈ R heißt5 H¨aufungswert von (an )n , falls eine Teilfolge von (an )n existiert, die gegen a konvergiert. Notation: H((an )n ) Menge der H¨aufungswerte von (an )n . Bemerkung 15. Ist (an )n konvergent, so konvergiert jede Teilfolge von (an )n gegen limn an . Es folgt H((an )n ) = {limn an }. Beispiel 16. (i) F¨ ur an = (−1)n gilt H((an )n ) = {−1, 1}. (ii) F¨ ur an = (−1)n + 1/n gilt H((an )n ) = {−1, 1}. (iii) F¨ ur an = n gilt H((an )n ) = ∅. (iv) F¨ ur an = n, falls n gerade, und an = 1/n, falls n ungerade, gilt H((an )n ) = {0}. 5

Ebenso als H¨ aufungspunkt bezeichnet, siehe [Fo1, S. 56].

II.6. Vollst¨andigkeit

45

Beweis: ⊇“ ist jeweils klar. ” ⊆“: ad (i): Jede Teilfolge enth¨alt eine Teilfolge, die konstant 1 oder konstant −1 ” ist. ad (ii): Aus der Konvergenz von (ank )k folgt die Konvergenz von ((−1)nk )k gegen limk ank . Wende (i) an. ad (iii): Jede Teilfolge von (an )n ist unbeschr¨ankt. ad (iv): Aus der Konvergenz von (ank )k folgt, daß {k : nk gerade} endlich ist. Satz 17 (Bolzano-Weierstraß). F¨ ur jede beschr¨ankte Folge (an )n gilt H((an )n ) 6= ∅. Beweis. Definiere rekursiv eine Intervallschachtelung ([uk , vk ])k , so daß ∀ k ∈ N : {n ∈ N : an ∈ [uk , vk ]} unendlich. Voraussetzungsgem¨aß existieren u1 ≤ v1 mit ∀ n ∈ N : an ∈ [u1 , v1 ]. Sei [uk , vk ] bereits definiert, und sei {n ∈ N : an ∈ [uk , vk ]} unendlich. Setze wk = (uk + vk )/2, und definiere ( [uk , wk ], falls {n ∈ N : an ∈ [wk , vk ]} endlich, [uk+1 , vk+1 ] = [wk , vk ], sonst. Gem¨aß Bemerkung 3.7 folgt {n ∈ N : an ∈ [uk+1 , vk+1 ]} unendlich. Per Induktion erh¨alt man v1 − u1 ∀ k ∈ N : vk − uk = k−1 . 2 Definiere rekursiv eine Teilfolge (ank )k von (an )n , so daß ∀ k ∈ N : ank ∈ [uk , vk ]. Setze n1 = 1. Sei nk bereits definiert. Da {n : an ∈ [uk+1 , vk+1 ]} unendlich, existiert nk+1 > nk mit ank+1 ∈ [uk+1 , vk+1 ]. Sei ε > 0. W¨ahle k0 ∈ N mit

v1 − u1 < ε. 2k0 −1

F¨ ur k, ` ≥ k0 folgt |ank − an` | ≤ vk0 − uk0 < ε. Somit ist (ank )k eine Cauchy Folge und gem¨aß Korollar 6 konvergent.

Beschr¨ ankte monotone Folgen Satz 18. Jede beschr¨ankte monotone Folge ist konvergent. Beweis. Sei (an )n monoton wachsend. Gem¨aß Satz 17 existiert eine konvergente Teilfolge (ank )k von (an )n . Setze a = limk ank . Satz 5.18 (Vergleichssatz) sichert ∀ k ∈ N : ank ≤ a.

II.7. Konvergenz von Reihen

46

Sei ε > 0. W¨ahle k0 ∈ N mit ∀ k ≥ k0 : |a − ank | < ε. Setze n0 = nk0 . F¨ ur n ≥ n0 existiert k ≥ k0 mit nk ≤ n < nk+1 . Also ank ≤ an ≤ ank+1 ≤ a. Fazit |a − an | = a − an ≤ a − ank < ε. Ist (an )n monoton fallend, so wende man das bereits Bewiesene auf (−an )n an. Literatur. [Fo1, §5 und §6].

7

Konvergenz von Reihen

Im Folgenden seien (an )n∈N und (bn )n∈N Folgen in R. Die nachstehenden Definitionen und Ergebnisse gelten analog f¨ ur Folgen mit Indexmengen der Form {n ∈ Z : n ≥ k} f¨ ur k ∈ Z.

Konvergenz Definition 1. F¨ ur n ∈ N heißt sn =

n X

ak

k=1

die n-te Partialsumme von (an )n . Die Partialsummenfolge (sn )n heißt (unendliche) P Reihe mit den Gliedern an . Notation: ∞ k=1 ak = (sn )n . Im Falle der Konvergenz von P∞ (sn )n schreibt man ebenfalls k=1 ak = limn sn f¨ ur den Grenzwert der Reihe. P k Definition 2. F¨ ur x ∈ R heißt ∞ k=0 x geometrische Reihe. P k Beispiel 3. Wir reformulieren Satz 5.15. Falls |x| < 1, konvergiert ∞ k=0 x , und es gilt ∞ X 1 xk = . 1−x k=0 P k Falls |x| ≥ 1, ist ∞ k=0 x divergent. P Beispiel 4. Wir zeigen die Konvergenz von ∞ k=1 1/(k(k + 1)) gegen den Grenzwert ∞ X k=1

1 = 1. k(k + 1)

II.7. Konvergenz von Reihen

47

F¨ ur k ∈ N gilt

1 1 1 = − . k(k + 1) k k+1 Gem¨aß Bemerkung 2.16 folgt f¨ ur n ≥ 2 n X k=1

n

n

n

n+1

X1 X 1 X1 X1 1 = − = − k(k + 1) k=1 k k=1 k + 1 k=1 k k=2 k =1+

n X 1 k=2

k



n X 1

k

k=2



1 1 =1− . n+1 n+1

Lemma 5.7 und Beispiel 5.5.(ii) zeigen limn 1/(n + 1) = 0. Wende Satz 5.13 (Summenregel) an. P∞ P∞ Satz 5. Seien a und k=1 k=1 bk konvergent, und sei α ∈ R. Dann sind auch P∞ P∞k k=1 (ak + bk ) und k=1 (α · ak ) konvergent, und es gilt ∞ ∞ ∞ X X X bk , ak + (ak + bk ) = k=1

k=1

k=1 ∞ X

(α · ak ) = α ·

∞ X

k=1

ak .

k=1

Beweis. Gem¨aß Bemerkung 2.16 gilt f¨ ur jedes n ∈ N n X

(ak + bk ) =

k=1 n X

n X

ak +

k=1

(α · ak ) = α ·

k=1

n X

bk ,

k=1

n X

ak .

k=1

Wende Satz 5.13 und Korollar 5.14 (Summen- und Produktregel) an. P Satz 6 (Cauchy-Kriterium). ∞ k=1 ak ist genau dann konvergent, wenn m X ∀ ε > 0 ∃ n0 ∈ N ∀ m ≥ n ≥ n0 : ak < ε. k=n

Beweis. F¨ ur die zugeh¨origen Partialsummen sn und m ≥ n gilt sm − sn−1 = Wende Korollar 6.6 (Cauchy-Folgen in R) an. P Korollar 7. Aus der Konvergenz von ∞ k=1 ak folgt limn an = 0.

Pm

k=n

ak .

Beweis. Wende Satz 6 mit n = m an. Satz 8. Gelte an ≥ 0 f¨ ur alle n ∈ N. Dann ist die Konvergenz von zur Beschr¨anktheit der Partialsummenfolge.

P∞

k=1

ak ¨aquivalent

Beweis. Nach Voraussetzung ist die Partialsummenfolge monoton wachsend. Verwende die S¨atze 5.10 (Konvergenz und Beschr¨anktheit) und 6.18 (beschr¨ankte monotone Folgen).

II.7. Konvergenz von Reihen Definition 9.

P∞

k=1

48

1/k heißt harmonische Reihe.

Beispiel 10. Die harmonische Reihe ist divergent. F¨ ur n ∈ N gilt n¨amlich n

2 X

1/k = 1 +

Folglich ist g¨anzend, daß

k=1

`

2 X

1/k ≥ 1 +

`=1 k=2`−1 +1

k=1

P∞

n X

n X

2`−1 /2` = 1 + n/2.

`=1

1/k unbeschr¨ankt und damit nicht konvergent. Wir bemerken ern

2 X

1/k ≤ 1 + n.

k=1

Bemerkung 11. Beispiel 10 zeigt, daß limn an = 0 nicht hinreichend f¨ ur die KonverP∞ genz von k=1 ak ist. Satz 12 (Leibniz-Kriterium). Sei (an )n monoton fallend, und gelte an ≥ 0 f¨ ur alle P∞ k−1 n ∈ N sowie limn an = 0. Dann konvergiert k=1 (−1) ak . P ur n ∈ N. Dann gilt Beweis. Setze sn = nk=1 (−1)k−1 ak f¨ s2n+2 − s2n = −a2n+2 + a2n+1 ≥ 0, s2n+3 − s2n+1 = a2n+3 − a2n+2 ≤ 0, s2n+1 − s2n = a2n+1 . Insbesondere gilt limn (s2n+1 − s2n ) = 0. Somit ist ([s2n , s2n+1 ])n eine Intervallschachtelung. Mit Satz 6.13 (Intervallschachtelung) folgt limn s2n = limn s2n+1 . Dies zeigt die Konvergenz von (sn )n mit limn sn = limn s2n . P k−1 /k heißt alternierende harmonische Reihe. Definition 13. ∞ k=1 (−1) Beispiel 14. Satz 12 zeigt die Konvergenz der alternierenden harmonischen Reihe. P k−1 /k = ln 2. Beispiel V.2.11 zeigt ∞ k=1 (−1)

Absolute Konvergenz P P∞ Definition 15. ∞ k=1 ak heißt absolut konvergent, falls k=1 |ak | konvergent ist. P∞ P∞ Satz 16. Sei k=1 ak absolut konvergent. Dann ist k=1 ak konvergent, und es gilt ∞ ∞ X X ak ≤ |ak |. (1) k=1

k=1

Beweis. F¨ ur m ≥ n gilt m m X X ak ≤ |ak |. k=n

k=n

Korollar 6.6 (Cauchy-Folgen in R) und Satz 6 sichern die Konvergenz von Satz 5.18 (Vergleichssatz) zeigt n n ∞ X X X ak ≤ |ak | ≤ |ak |. k=1

k=1

k=1

Wende nochmals diesen Satz an um (1) zu erhalten.

P∞

k=1

ak .

II.7. Konvergenz von Reihen

49

Bemerkung 17. Die alternierende harmonische Reihe belegt, daß die Konvergenz einer Reihe nicht hinreichend f¨ ur die absolute Konvergenz ist. Satz 18 (Majoranten-Kriterium). Gelte ∀ n ∈ N : |an | ≤ bn , und sei

P∞

k=1 bk

konvergent. Dann ist ∞ X

P∞

ak absolut konvergent, und es gilt

k=1

|ak | ≤

k=1

∞ X

bk .

k=1

Beweis. Sei n ∈ N. Dann gilt gem¨aß Satz 5.18 (Vergleichssatz) n X

|ak | ≤

k=1

n X

bk ≤

k=1

∞ X

bk .

k=1

P∞

|ak | beschr¨ankt. Wende Satz 8 und Satz 5.18 an. P P b absolut konvergent, und sei α ∈ R. Dann ak und ∞ Korollar 19. Seien ∞ k=1 P∞ k=1 k P∞ sind auch k=1 (ak + bk ) und k=1 (α · ak ) absolut konvergent.

Somit ist

k=1

Beweis. Verwende die S¨atze 5 und 18. P α ur jedes α ∈ N mit α ≥ 2. Beispiel 20. Wir zeigen die Konvergenz von ∞ k=1 1/k f¨ F¨ ur alle k ∈ N gilt 1 1 2 ≤ 2 ≤ . α k k k(k + 1) P 2 2 Wende Beispiel 4 und die S¨atze 3 und 18 an. Es gilt ∞ k=1 1/k = π /6, siehe [Fo1, S. 267]. Satz 21. Sei b ∈ N mit b ≥ 2. (i) F¨ ur alle m ∈ Z und Folgen (βn )n≥m in {0, . . . , b−1} ist

P∞

k=m

βk ·b−k konvergent.

(ii) F¨ ur alle x ∈ R existieren σ ∈ {−1, 1}, m ∈ Z und eine Folge (βn )n≥m in {0, . . . , b − 1}, so daß ∞ X x=σ· βk · b−k . (2) k=m

Beweis. ad (i): Wende Satz 18 und Beispiel 3 an. ad (ii): Tafelskizze – [Fo1, S. 52]. Definition 22. (2) mit σ, m und (βn )n≥m wie oben heißt eine b-adische Darstellung von x ∈ R. Korollar 23. F¨ ur alle x ∈ R und ε > 0 existiert q ∈ Q mit |x − q| < ε. Beweis. Partialsummen von b-adischen Darstellungen sind rational.

II.7. Konvergenz von Reihen

50

Satz 24. R ist u ¨berabz¨ahlbar. Beweis. Sei ϕ : {0, 1}N → R definiert durch ∞ X

ϕ(β) =

βk · 3−k .

k=1 0 F¨ ur β, β 0 ∈ {0, 1}N und ` ∈ N gelte βm = βm f¨ ur m < ` sowie β` = 0 und β`0 = 1. Dann folgt

0

−`

ϕ(β ) − ϕ(β) = 3

−`

=3

∞ X

(βk0 k=`+1

+

−(`+1)

−3

−k

− βk ) · 3

−`

≥3



∞ X

3−k

k=`+1 −`

/(1 − 1/3) = 3 /2 > 0.

Somit ist ϕ injektiv. Annahme: R ist abz¨ahlbar. Dann existiert eine Injektion von {0, 1}N nach N und somit eine Surjektion von N auf {0, 1}N , im Widerspruch zu Satz 3.15. Satz 25 (Umordnungssatz). P ur jede bijektive Abbildung τ : N → N ist (i) Sei ∞ k=1 ak absolut konvergent. F¨ P∞ P P ∞ dann k=1 aτ (k) absolut konvergent, und es gilt ∞ k=1 ak . k=1 aτ (k) = P F¨ ur jedes c ∈ R existiert (ii) Sei ∞ k=1 ak konvergent, aber nicht absolut konvergent. P∞ eine bijektive Abbildung τ : N → N, so daß k=1 aτ (k) = c. Beweis. ad (i): Sei n ∈ N. W¨ahle m ∈ N mit {τ (1), . . . , τ (n)} ⊆ {1, . . . , m}. Dann

n m ∞ X X X aτ (k) ≤ |ak | ≤ |ak | . k=1

k=1

k=1

P∞

P P∞ aτ (k) ≤ ∞ |ak |. Nach Satz 8 ist k=1 aτ (k) absolut konvergent, und es gilt k=1 k=1 P P∞ Betrachte τ −1 , um hieraus ∞ k=1 |ak | ≤ k=1 aτ (k) zu erhalten. ad (ii): ¨ Ubung, siehe auch ¨ Ubung 6.4.b. P∞

Satz 26 (Cauchy-Produkt). Seien

k=0

ck =

ak und

k X

P∞

k=0 bk

absolut konvergent. Definiere

a` · bk−`

`=0

f¨ ur k ∈ N0 . Dann ist

P∞

k=0 ck

absolut konvergent, und es gilt ∞ X k=0

ck =

∞ X k=0

ak ·

∞ X k=0

bk .

II.7. Konvergenz von Reihen

51

Beweis. Setze An =

n X

ak ,

A∗n

k=0

=

n X

|ak |,

Bn =

n X

k=0

bk ,

Bn∗

=

k=0

n X

|bk |,

Cn =

k=0

n X

ck .

k=0

Sei n ∈ N gerade. F¨ ur In = {(i, j) ∈ {0, . . . , n}2 : i + j > n} gilt X X ai b j ≤ |ai bj | |Cn − An Bn | = (i,j)∈In

(i,j)∈In

X



X

|ai bj | −

(i,j)∈{0,...,n}2

|ai bj |

(i,j)∈{0,...,n/2}2

∗ = A∗n Bn∗ − A∗n/2 Bn/2 .

Als konvergente Folge ist (A∗n Bn∗ )n eine Cauchy-Folge, so daß ∗ lim (A∗n Bn∗ − A∗n/2 Bn/2 ) = 0.

n→∞

Da (An Bn )n konvergent ist, folgt die Konvergenz von (Cn )n mit limn Cn = limn An Bn . Zum Beweis der absoluten Konvergenz verwendet man |ck | ≤

k X

|a` ||bk−` |,

`=0

woraus

Pn

k=0

|ck | ≤ A∗n Bn∗ folgt.

√ P Beispiel 27. F¨ ur n ∈ N0 sei an = bn = (−1)n / n + 1. Dann ist ∞ k=0 ak konvergent, P∞ aber nicht absolut konvergent, und k=0 ck mit ck gem¨aß Satz 26 ist divergent. ¨ Ubung. Satz 28 (Quotienten-Kriterium). Sei an 6= 0 f¨ ur alle n ∈ N. F¨ ur 0 < θ < 1 gelte an+1 ≤ θ. ∀n ∈ N : (3) an P Dann ist ∞ k=1 ak absolut konvergent. Beweis. Per Induktion zeigt man ∀ n ∈ N : |an | ≤ |a1 | · θn−1 . P k−1 Beispiel 3 und Satz 5 sichern die absolute Konvergenz von ∞ . Wende das k=1 a1 θ Majorantenkriterium an. P 2 Bemerkung 29. Die Reihe ∞ k=1 1/k belegt, daß (3) mit 0 < θ < 1 nicht notwendig f¨ ur die absolute Konvergenz ist. Die harmonische Reihe belegt, daß |an+1 /an | < 1 f¨ ur alle n ∈ N nicht hinreichend f¨ ur die Konvergenz ist.

II.7. Konvergenz von Reihen

52

Bemerkung 30. Konvergenz und absolute Konvergenz von Reihen h¨angen nicht von endlichen Anfangsst¨ ucken“ der Folge ihrer Glieder ab. Genauer: f¨ ur Folgen (an )n≥n1 ” und (bn )n≥n2 in R existiere n3 ≥ max(n1 , n2 ), so daß ∀ n ≥ n 3 : an = b n . Dann konvergiert giert.

P∞

k=n1

ak genau dann (absolut), wenn

P∞

k=n2 bk

(absolut) konver-

Die Voraussetzungen in den S¨atzen 8, 12, 18 und 28 k¨onnen entsprechend abgeschw¨acht werden.

Die Exponentialfunktion Definition 31. F¨ ur x ∈ R heißt

P∞

k=0

xk /k! Exponentialreihe.

Beispiel 32. Wir zeigen die absolute Konvergenz der Exponentialreihe f¨ ur jedes x ∈ R. Betrachte den nicht-trivialen Fall x 6= 0. Setze an = xn /n! f¨ ur n ∈ N0 . Dann gilt an+1 |x| an = n + 1 . F¨ ur n ≥ 2|x| − 1 folgt |an+1 /an | ≤ 1/2, so daß mit Satz 28 die absolute Konvergenz P k von ∞ k=0 x /k! folgt. Definition 33. Die durch exp(x) =

∞ X xk k=0

k!

definierte Funktion exp : R → R heißt Exponentialfunktion, und e = exp(1) heißt Eulersche Zahl . Satz 34 (Restgliedabsch¨atzung der Exponentialreihe). F¨ ur alle x ∈ R und n ∈ N0 mit |x| ≤ 1 + n/2 gilt n k X x |x|n+1 . ≤2· exp(x) − k! (n + 1)! k=0 Beweis. Seien x ∈ R und n, m ∈ N0 mit m > n. Dann gilt m n m m−n−1 X k k k k+n+1 X X X x x x x − = = k! k=0 k! k=n+1 k! k=0 (k + n + 1)! k=0 m−n−1 X |x|k · (n + 1)! |x|n+1 ≤ · . (n + 1)! k=0 (k + n + 1)!

Per Induktion zeigt man ∀ k ∈ N0 :

(n + 1)! 1 ≤ . (k + n + 1)! (n + 2)k

II.7. Konvergenz von Reihen

53

Gelte |x| ≤ 1 + n/2. Dann folgt |x|k · (n + 1)! ≤ (k + n + 1)! und weiter



|x| n+2

k

≤ 1/2k

m n m−n−1 X k k X X x x |x|n+1 − · 1/2k . ≤ (n + 1)! k! k! k=0 k=0 k=0

Wende die Beispiele 3 und 32 und Satz 5.18 (Vergleichssatz) an, wobei n fixiert ist und Grenzwerte bez¨ uglich des Parameters m betrachtet werden. Graphiken zu Satz 34 finden sich in Abschnitt A.1. Satz 35 (Funktionalgleichung der Exponentialfunktion). F¨ ur x, y ∈ R gilt exp(x + y) = exp(x) · exp(y). Beweis. Setze yk bk = , k!

xk ak = , k!

ck =

k X

a` · bk−`

`=0

f¨ ur k ∈ N0 . Dann gilt k   1 X k ` k−` (x + y)k ck = · x ·y = , k! `=0 ` k!

siehe Satz II.2.17 (binomische Formel). Satz 26 zeigt ∞ ∞ ∞ X X X bk = exp(x) · exp(y). ak · ck = exp(x + y) = k=0

k=0

k=0

Korollar 36. (i) ∀ x ∈ R : exp(x) > 0, (ii) ∀ x ∈ R : exp(−x) = 1/ exp(x), (iii) ∀ n ∈ Z : exp(n) = en Beweis. ad (ii): Da exp(x) · exp(−x) = exp(0) = 1, folgt exp(x) 6= 0 und 1/ exp(x) = exp(−x). ad (i): F¨ ur x ≥ 0 gilt exp(x) ≥ 1 + x > 0. F¨ ur x < 0 folgt exp(x) = 1/ exp(−x) > 0, siehe (ii). ad (iii): Wir zeigen per Induktion ∀ n ∈ N0 : exp(n) = en . Klar f¨ ur n = 0. Sei n ∈ N0 und gelte en = exp(n). Dann folgt exp(n + 1) = exp(n) · exp(1) = en · e = en+1 . F¨ ur n ∈ Z mit n < 0 ergibt sich exp(n) = 1/ exp(−n) = 1/e−n = en . Literatur. [Fo1, §4–§8] und [H1, IV].

Kapitel III Stetige Funktionen in einer Variablen Die Untersuchung der Stetigkeit von Funktionen f : D → R mit D ⊆ R ist u.a. motiviert durch die Fragen der L¨osbarkeit von Gleichungen f (x) = y und der Existenz sogenannter Extremalstellen von f , d.h. von Punkten x1 , x2 ∈ D mit ∀ x ∈ D : f (x1 ) ≤ f (x) ≤ f (x2 ). Neben die Stetigkeit von f treten dabei sogenannte topologische Eigenschaften des Definitionsbereichs D. Wir verweisen insbesondere auf [Fo1] und [H1].

1

Punktmengen in R

Notation: F¨ ur a, b ∈ R mit a ≤ b setzen wir1 [a, b] = {x ∈ R : a ≤ x ≤ b}, [a, b[ = {x ∈ R : a ≤ x < b}, ]a, b] = {x ∈ R : a < x ≤ b},

(1)

]a, b[ = {x ∈ R : a < x < b} sowie [a, ∞[ = {x ∈ R : a ≤ x}, ]a, ∞[ = {x ∈ R : a < x}, ]−∞, b] = {x ∈ R : x ≤ b},

(2)

]−∞, b[ = {x ∈ R : x < b}. Ferner sei ]−∞, ∞[ = R.

(3)

Im Fall (1) nennen wir a und b die Randpunkte der entsprechenden Menge. Ebenso heißt im Fall (2) a bzw. b der Randpunkt der entsprechenden Menge. Im Folgenden sei A ⊆ R. 1

Vgl. die Notation auf Seite 24 und in Definition II.6.10.

54

III.1. Punktmengen in R

55

Offene und abgeschlossene Mengen Definition 1. F¨ ur x ∈ R und ε > 0 heißt ]x − ε, x + ε[ ε-Umgebung von x. Definition 2. x ∈ R heißt (i) innerer Punkt von A, falls ∃ ε > 0 : ]x − ε, x + ε[ ⊆ A (ii) Ber¨ uhrpunkt von A, falls ∀ ε > 0 : ]x − ε, x + ε[ ∩ A 6= ∅. ˚ Menge der inneren Punkte von A, genannt das Innere von A, A¯ Menge Notation: A der Ber¨ uhrpunkte von A, genannt der Abschluß von A. Lemma 3. F¨ ur x ∈ R gilt x ∈ A¯ genau dann, wenn eine Folge (an )n in A mit limn an = x existiert. Beweis. ⇒“ F¨ ur n ∈ N w¨ahle man an ∈ ]x − 1/n, x + 1/n[ ∩ A. ” ⇐“ F¨ ur ε > 0 w¨ahle man n ∈ N mit an ∈ ]x − ε, x + ε[. ” Bemerkung 4. ˚ ⊆ A ⊆ A, ¯ (i) A ˚⊆ B ˚ ∧ A¯ ⊆ B. ¯ (ii) A ⊆ B ⇒ A ˚ = ]a, b[ und A¯ = [a, b]. Beispiel 5. F¨ ur A = ]a, b] mit a < b gilt A Beweis: Wir zeigen ˚ ]a, b[ ⊆ A. F¨ ur x ∈ ]a, b[ w¨ahlen wir ε = min(x − a, b − x). Dann gilt ε > 0 und ]x − ε/2, x + ε/2[ ⊆ ]a, b[ ⊆ A, ˚ Wir zeigen d.h. x ∈ A. A¯ ⊆ [a, b] und betrachten dazu die Kontraposition. F¨ ur x > b w¨ahlen wir ε = x − b. Dann gilt ε > 0 und ]x − ε, x + ε[ ∩ A ⊆ ]b, ∞[ ∩ A = ∅, ¯ F¨ d.h. x ∈ / A. ur x < a schließt man analog. Zusammenfassend ergibt sich ˚ ⊆ A ⊆ A¯ ⊆ [a, b] ]a, b[ ⊆ A mit Bemerkung 4.(i). ˚ mit Es verbleibt, die Randpunkte a und b zu untersuchen. Da a ∈ / A, folgt a ∈ / A Bemerkung 4, und aus limn (a + (b − a)/(2n)) = a folgt a ∈ A¯ mit Lemma 3. Da b ∈ A, folgt b ∈ A¯ mit Bemerkung 4, und f¨ ur jedes ε > 0 gilt b + ε/2 ∈ ]b − ε, b + ε[ \ A, also ˚ b∈ / A.

III.1. Punktmengen in R

56

Definition 6. A heißt ˚ = A, (i) offen, falls A (ii) abgeschlossen, falls A¯ = A. Beispiel 7. Von den Mengen aus (1) und (2) sind im Fall a < b (i) ]a, b[ , ]−∞, b[ , ]a, ∞[ offen, (ii) [a, b], ]−∞, b] , [a, ∞[ abgeschlossen. Bemerkung 8. (i) A ist genau dann offen, wenn R\A abgeschlossen ist. (ii) Bez¨ uglich der Mengeninklusion gilt: A¯ ist die kleinste abgeschlossenen Menge, ˚ ist die gr¨oßte offene Menge, die in A enthalten ist. die A enth¨alt, und A (iii) A ist genau dann abgeschlossen, wenn limn an ∈ A f¨ ur alle konvergenten Folgen (an )n in A gilt. Beweis ¨ Ubung. Beispiel 9. Q ist weder offen noch abgeschlossen, und Z ist abgeschlossen und nicht offen. Beweis f¨ ur A = Q: Korollar II.7.23 zeigt ¯ = R. Q √ Da Q ( R, ist Q nicht abgeschlossen. F¨ ur x ∈ Q und n ∈ N sei xn = x + 2/n. Dann gilt xn ∈ R \ Q und limn xn = x. Hiermit folgt R \ Q = R. Da Q 6= ∅, ist R \ Q nicht abgeschlossen. Gem¨aß Bemerkung 8 ist Q nicht offen. Beweis f¨ ur A = Z: klar.

H¨ aufungspunkte Definition 10. x ∈ R heißt H¨aufungspunkt von A, falls x ∈ A\{x}. Beispiel 11. Sei A = {1/n : n ∈ N}. Wir zeigen (i) A¯ = A ∪ {0}, (ii) 0 ist der einzige H¨aufungspunkt von A.

III.1. Punktmengen in R

57

Da limn 1/n = 0, ist 0 ein H¨aufungspunkt von A, siehe Lemma 3. Da A ⊆ ]0, 1] folgt weiter mit Bemerkung 4 und Beispiel 5 {0} ∪ A ⊆ A¯ ⊆ ]0, 1] = [0, 1]. Zu untersuchen sind die Punkte aus ]0, 1]. F¨ ur x ∈ A, also x = 1/n mit n ∈ N, sei ε = 1/n − 1/(n + 1). Dann gilt ε > 0 sowie ∀ a ∈ A \ {x} : |a − x| ≥ ε. Also ist x kein H¨aufungspunkt von A. F¨ ur x ∈ ]0, 1] \ A existiert nach Satz II.4.6 ein n ∈ N mit 1/(n + 1) < x < 1/n. Wir setzen ε = min (1/n − x, x − 1/(n + 1)) und erhalten ε > 0 sowie ∀a ∈ A : |a − x| ≥ ε. Also ist x kein Ber¨ uhrpunkt von A.

Supremum und Infimum Notation: O(A) und U (A) bezeichnen die Mengen der oberen bzw. unteren Schranken von A. Definition 12. x ∈ R heißt das2 Maximum von A, Notation3 x = max A, falls (i) x ∈ O(A), (ii) x ∈ A. Beispiel 13. Es gilt max([0, 1]) = 1, w¨ahrend [0, 1[ kein Maximum besitzt. Definition 14. x ∈ R heißt das4 Supremum von A, Notation x = sup A, falls (i) x ∈ O(A), (ii) ∀ y ∈ O(A) : x ≤ y. Bemerkung 15. Die Existenz des Maximums bzw. Supremums setzt voraus, daß A 6= ∅ gilt und A nach oben beschr¨ankt ist. Ggf. ist x = max A ¨aquivalent zu x = sup A und x ∈ A. Beispiel 16. Es gilt sup([0, 1]) = sup([0, 1[) = 1. 2

Eindeutigkeit klar. Ebenso max(A) und maxx∈D f (x), falls A = f (D). 4 Eindeutigkeit und weitere Notation wie in Definition 12.

3

III.1. Punktmengen in R

58

Lemma 17. Sei A 6= ∅ nach oben beschr¨ankt, und sei x ∈ R. Dann gilt (i) O(A) ist abgeschlossen, (ii) x = sup A ⇔ x ∈ A¯ ∩ O(A). Beweis. ad (i): Sei (xn )n eine konvergente Folge in O(A), und sei a ∈ A. Da a ≤ xn f¨ ur alle n ∈ N, folgt a ≤ limn xn gem¨aß Satz II.5.18 (Vergleichssatz). ad (ii): ⇒“ Sei x = sup A. Dann x ∈ O(A), und f¨ ur n ∈ N gilt x − 1/n < x, also ” ¯ x − 1/n 6∈ O(A). W¨ahle an ∈ ]x − 1/n, x] ∩ A. Es folgt limn an = x, also x ∈ A. ⇐“ Sei x ∈ A¯ ∩ O(A), und sei y < x. Dann existiert a ∈ A ∩ ]y, x]. Also folgt ” y 6∈ O(A). Satz 18. Jede nicht leere, nach oben beschr¨ankte Menge A besitzt ein Supremum. Beweis. Seien a ∈ A und y ∈ O(A). Wir definieren rekursiv eine Intervallschachtelung ([an , bn ])n , so daß an ∈ A ∧ bn ∈ O(A) f¨ ur alle n ∈ N. Zun¨achst sei [a1 , b1 ] = [a, y]. F¨ ur n ∈ N sei [an , bn ] wie oben bereits gegeben. Setze cn = (an + bn )/2, und w¨ahle a0n ∈ ]cn , bn ] ∩ A, falls cn 6∈ O(A). Definiere ( [an , cn ], falls cn ∈ O(A), [an+1 , bn+1 ] = [a0n , bn ], falls cn 6∈ O(A). Induktiv folgt ebenfalls 0 ≤ bn − an ≤ (y − a)/2n−1 f¨ ur alle n ∈ N. Satz II.6.13 (Intervallschachtelung) sichert die Existenz von x = limn bn = limn an . Somit gilt ¯ und Lemma 17.(i) zeigt x ∈ O(A). Nun folgt x = sup A mit Lemma 17.(ii). x ∈ A, Bemerkung 19. Sei A 6= ∅ nach oben beschr¨ankt. Dann ist sup A die kleinste obere Schranke von A. Es gilt also O(A) = [sup A, ∞[. Notation: sup A = ∞, falls A nicht nach oben beschr¨ankt ist, und sup A = −∞, falls A = ∅. √ √ 2 2. Beweis: F¨ u r x ≥ 2 gilt Beispiel 20. F¨ ur A = {x ∈ R : x < 2} gilt sup A = √ √ 2 2 x ur xn = 2 − 1/n mit n ∈ N gilt xn < 2. Es folgt √ ≥ 2. Dies zeigt 2 ∈ O(A). F¨ ¯ Wende Lemma 17.(ii) an. 2 ∈ A. Definition 21. x ∈ R heißt das Minimum 5 von A, Notation x = min A, falls (i) x ∈ U (A), (ii) x ∈ A. 5

Hier und in der folgenden Definition Eindeutigkeit und weitere Notation wie in Definition 12.

III.1. Punktmengen in R

59

Definition 22. x ∈ R heißt das Infimum 6 von A, Notation x = inf A, falls (i) x ∈ U (A), (ii) ∀ y ∈ U (A) : y ≤ x. Korollar 23. Jede nicht leere, nach unten beschr¨ankte Menge A besitzt ein Infimum. Beweis. Wende Satz 18 auf −A = {−a : a ∈ A} an. Es ergibt sich inf A = − sup(−A). Bemerkung 24. Sei A 6= ∅ nach unten beschr¨ankt. Dann ist inf A die gr¨oßte untere Schranke von A. Es gilt also U (A) = ]−∞, inf A]. Notation: inf A = −∞, falls A nicht nach unten beschr¨ankt ist, und inf A = ∞, falls A = ∅.

Intervalle Definition 25. A heißt Intervall , falls ∀ x, y, z ∈ R : (x < y < z ∧ x, z ∈ A ⇒ y ∈ A). Satz 26. A ist genau dann ein Intervall, wenn A von der Form (1), (2) oder (3) ist. Beweis. ⇐“: klar. ” ⇒“: Spezialfall: A 6= ∅ beschr¨ankt. Dann gilt ” ]inf A, sup A[ ⊆ A ⊆ [inf A, sup A] , siehe Lemma 17.(ii). Der allgemeine Fall verbleibt als ¨ Ubung.

Kompakte Mengen Definition 27. A heißt kompakt, wenn jede Folge (xn )n in A eine konvergente Teilfolge (xnk )k mit limk xnk ∈ A besitzt. Satz 28. A ist genau dann kompakt7 , wenn A abgeschlossen und beschr¨ankt ist. Beweis. ⇒“ Sei (xn )n eine konvergente Folge in A. Setze x = limn xn . Es existiert ” eine Teilfolge (xnk )k mit limk xnk ∈ A. Da x = limk xnk , folgt x ∈ A. Somit ist A abgeschlossen. Annahme: A unbeschr¨ankt. Dann existiert eine Folge (an )n in A mit limn |an | = ∞. Jede Teilfolge von (an )n ist unbeschr¨ankt und damit divergent. Widerspruch. ⇐“ Sei (xn )n eine Folge in A. Mit Satz II.6.17 (Bolzano-Weierstraß) folgt die Existenz ” einer konvergenten Teilfolge (xnk )k . Die Abgeschlossenheit von A sichert limk xnk ∈ A. 6

Maximum, Minimum, Supremum und Infimum ebenso f¨ ur Teilmengen geordneter Mengen definiert, siehe [AE, S. 27]. 7 Die Begriffsbildung in Definition II.6.10 ist konsistent zu den S¨atzen 26 und 28.

III.1. Punktmengen in R

60

Limes superior und Limes inferior von Zahlenfolgen Im Folgenden sei (an )n eine Folge in R. Bemerkung 29. Sei (an )n nach oben beschr¨ankt. Dann wird durch bn = sup{ak : k ≥ n} eine monoton fallende Folge definiert. Diese ist gem¨aß Satz II.6.18 (beschr¨ankte monotone Folgen) entweder konvergent oder bestimmt divergent gegen −∞. Entsprechendes gilt f¨ ur cn = inf{ak : k ≥ n}, falls (an )n nach unten beschr¨ankt ist. Definition 30. In obiger Situation heißt limn bn Limes superior von (an )n und limn cn Limes inferior von (an )n . Notation8 : lim supn an = limn bn und lim inf n an = limn cn . Notation: lim supn an = ∞, falls (an )n nicht nach oben beschr¨ankt, und lim inf n an = −∞, falls (an )n nicht nach unten beschr¨ankt. Satz 31. Sei (an )n beschr¨ankt. Dann gilt lim sup an = max H((an )n ) n

und lim inf an = min H((an )n ). n

Beweis. Wir beweisen die Aussage f¨ ur x = lim supn an und halten fest, daß (bn )n wegen der Beschr¨anktheit von (an )n gegen x konvergiert. Wir zeigen, daß x ein H¨aufungswert ist. Lemma 17.(ii) sichert die Existenz einer streng monoton wachsenden Folge (nk )k∈N in N0 mit n1 = 0 und ∀ k ∈ N : 0 ≤ bnk +1 − ank+1 < 1/k. Zusammenfassend ergibt sich die Konvergenz von (ank )k mit limk ank = limn bn = x. Wir zeigen, daß x eine obere Schranke von H((an )n ) ist. Annahme: es existiert eine konvergent Teilfolge (ank )k von (an )n mit a > x f¨ ur a = limk ank . F¨ ur ε = (a−x)/2 > 0 gilt a − ε = x + ε, und es existiert k0 ∈ N, so daß ∀ k ≥ k0 : ank > x + ε. Es folgt bn > x + ε f¨ ur alle n ∈ N und weiter limn bn ≥ x + ε. Widerspruch. Beispiel 32. F¨ ur n ∈ N sei an = (−1)n · (1 + 1/n). Dann gilt lim supn an = 1 und lim inf n an = −1. Literatur. [Fo1, §9], [H1, 34 und 35] und [AE, I.10]. 8

Alternativ limn statt lim supn und limn statt lim inf n .

III.2. Stetigkeit und Grenzwerte von Funktionen

2

61

Stetigkeit und Grenzwerte von Funktionen

Im Folgenden seien ∅ 6= D ⊆ R und f : D → R.

Stetigkeit Definition 1. Sei x ∈ D. f heißt stetig in x, falls f¨ ur jede Folge (xn )n in D mit limn xn = x die Folge (f (xn ))n konvergiert. f heißt unstetig in x, falls f in x nicht stetig ist. f heißt stetig (auf D), falls f in jedem Punkt x ∈ D stetig ist. Beispiel 2. Sei D = R. (i) f = idR und f = c mit c ∈ R sind stetig auf R. (ii) f = 1]−∞,0] ist genau in x = 0 unstetig. Bemerkung 3. (i) Sei f stetig in x ∈ D. F¨ ur jede Folge (xn )n in D mit limn xn = x gilt dann limn f (xn ) = f (x). Beweis: Betrachte (yn )n = (x1 , x, x2 , x, . . .). (ii) Sei f stetig, und sei ∅ 6= D0 ⊆ D. Dann ist f |D0 stetig. Beispiel 4. (i) F¨ ur D = R ist f = 1Q unstetig in jedem Punkt x ∈ R. (ii) Jede Funktion mit Definitionsbereich D = Z ist stetig auf D. (iii) F¨ ur D = ]0, ∞[ sei f (x) =

( 0,

falls x ∈ D \ Q,

1/q, falls x = p/q mit p, q ∈ N teilerfremd.

√ Dann ist f in jedem Punkt x ∈ D ∩ Q unstetig. Beweis: F¨ ur n ∈ N sei xn = x + 2/n. Dann gilt limn xn = x, f (xn ) = 0 und f (x) > 0. Ferner ist f in allen Punkten x ∈ D\Q stetig, siehe [H1, S. 213]. Ausblick 5. F¨ ur A ⊆ R sind ¨aquivalent: (i) es existiert eine Funktion f : R → R mit A als Menge der Stetigkeitspunkte. (ii) A ist Durchschnitt u ¨ber eine Folge offener Teilmengen von R. Man kann zeigen, daß A = Q nicht die Eigenschaft (ii) hat. Siehe [A, 1.2]. Satz 6. Sind f, g : D → R stetig in x ∈ D, so sind auch f + g und f · g stetig in x. Beweis. Wende Satz II.5.13 (Summen- und Produktregel) an.

III.2. Stetigkeit und Grenzwerte von Funktionen

62

Satz 7. Sind f, g : D → R stetig in x ∈ D, und gilt g(x) 6= 0, so ist f /g : D0 → R mit D0 = {y ∈ D : g(y) 6= 0} stetig in x. Beweis. Wende Satz II.5.16 (Quotientenregel) an. Definition 8. f heißt Polynomfunktion 9 , falls n ∈ N0 und a0 , . . . , an ∈ R existieren, so daß n X ∀x ∈ D : f (x) = ak x k . k=0

f heißt rationale Funktion, falls Polynomfunktionen g, h : D → R existieren, so daß ∀x ∈ D : h(x) 6= 0 und f = g/h. Beispiel 9. Rationale Funktionen sind stetig. Beweis: Verwende Beispiel 2.(i) und die S¨atze 6 und 7. Satz 10. Seien f stetig in x ∈ D und g : E → R mit f (D) ⊆ E ⊆ R stetig in f (x). Dann ist g ◦ f stetig in x. Beweis. F¨ ur jede Folge (xn )n in D mit limn xn = x gilt limn f (xn ) = f (x) und somit limn g (f (xn )) = g (f (x)). Satz 11. f ist genau dann stetig in x ∈ D, wenn  ∀ ε > 0 ∃ δ > 0 ∀ y ∈ D : |x − y| < δ ⇒ |f (x) − f (y)| < ε . Beweis. ⇐“ Sei (xn )n eine Folge in D mit x = limn xn , und sei ε > 0. W¨ahle δ > 0, ” so daß  ∀ y ∈ D : |x − y| < δ ⇒ |f (x) − f (y)| < ε . W¨ahle n0 ∈ N, so daß ∀ n ≥ n0 : |x − xn | < δ. Dann gilt |f (x) − f (xn )| < ε f¨ ur alle n ≥ n0 . Fazit: (f (xn ))n konvergiert (gegen f (x)). ⇒“ Wir zeigen die Kontraposition. Sei ε > 0, so daß ”  ∀ δ > 0 ∃ y ∈ D : |x − y| < δ ∧ |f (x) − f (y)| ≥ ε . F¨ ur n ∈ N w¨ahle man xn ∈ ]x − 1/n, x + 1/n[ ∩ D mit |f (x) − f (xn )| ≥ ε. Dann gilt limn xn = x, aber (f (xn ))n konvergiert nicht gegen f (x). Beispiel 12. Die Betragsfunktion | · | : R → R ist stetig. Beweis: F¨ ur x, y ∈ R gilt |x| − |y| ≤ |x − y| . Wende Satz 11 mit δ = ε an. 9

Siehe [AE, I.8] und [Fi, 1.3] zur Unterscheidung von Polynomen und Polynomfunktionen.

III.2. Stetigkeit und Grenzwerte von Funktionen

63

Beispiel 13. Die Exponentialfunktion exp : R → R ist stetig. Beweis: Wir betrachten zun¨achst x = 0. Satz II.7.34 (Restgliedabsch¨atzung) zeigt f¨ ur y ∈ R mit |y| ≤ 1, daß | exp(x) − exp(y)| = |1 − exp(y)| ≤ 2 |y| . Wende Satz 11 mit δ = min(ε/2, 1) an. F¨ ur x, y ∈ R gilt |exp(x) − exp(y)| = exp(x) · |1 − exp(y − x)| , siehe Satz II.7.35 (Funktionalgleichung). Wende Satz 11 mit δ = min (ε · exp(−x)/2, 1) an.

Grenzwerte und bestimmte Divergenz Definition 14. Sei x ein H¨aufungspunkt von D. f besitzt einen Grenzwert 10 in x, falls f¨ ur jede Folge (xn )n in D \ {x} mit limn xn = x die Folge (f (xn ))n konvergiert. Bemerkung 15. Besitze f einen Grenzwert in einem H¨aufungspunkt x von D. Dann existiert c ∈ R, so daß c = lim f (xn ) n

f¨ ur jede Folge (xn )n in D \ {x} mit limn xn = x. Vgl. Bemerkung 3.(i). Notation: In obiger Situation schreibt man c = limy→x f (y). Bemerkung 16. f ist genau dann stetig in x ∈ D, wenn (i) x kein H¨aufungspunkt von D ist oder (ii) x ein H¨aufungspunkt von D ist und limy→x f (y) = f (x) gilt. Definition 17. Sei x ein H¨aufungspunkt von D. f ist in x bestimmt divergent gegen ∞ (−∞), falls f¨ ur jede Folge (xn )n in D \ {x} mit limn xn = x die Folge (f (xn ))n bestimmt divergent gegen ∞ (−∞) ist. Notation: limy→x f (y) = ∞ (−∞). Beispiel 18. Sei D = R \ {1}. (i) F¨ ur x ∈ D sei f (x) =

1 − x2 . 1−x

Da f (x) = 1 + x, folgt limy→1 f (y) = 2. (ii) F¨ ur x ∈ D sei f (x) =

1 . (1 − x)2

Dann gilt limy→1 f (y) = ∞. 10

Begriffsbildung nicht einheitlich, vgl. [H1, S. 235] und [Fo1, S. 106].

III.2. Stetigkeit und Grenzwerte von Funktionen

64

(iii) F¨ ur x ∈ D sei 1 . 1−x Dann besitzt f an der Stelle x = 1 keinen Grenzwert und ist dort auch nicht bestimmt divergent. f (x) =

Bemerkung 19. Sogenannte einseitige Grenzwerte k¨onnen durch Restriktion von f auf D ∩ ]x, ∞[ bzw. D ∩ ]−∞, x[ eingef¨ uhrt werden, siehe [Fo1, S. 107].

Grenzwerte und bestimmte Divergenz fu ¨ r x → ±∞ Definition 20. Sei D nicht nach oben beschr¨ankt. f besitzt einen Grenzwert f¨ ur x → ∞ , falls f¨ ur jede Folge (xn )n in D mit limn xn = ∞ die Folge (f (xn ))n konvergiert. Sei D nicht nach unten beschr¨ankt. f besitzt einen Grenzwert f¨ ur x → −∞ , falls f¨ ur jede Folge (xn )n in D mit limn xn = −∞ die Folge (f (xn ))n konvergiert. Bemerkung 21. Besitze f einen Grenzwert f¨ ur x → ∞ bzw. x → −∞. Dann existiert c ∈ R, so daß c = lim f (xn ) n

f¨ ur jede Folge (xn )n in D mit limn xn = ∞ bzw. limn xn = −∞. Vgl. Bemerkung 3.(i). Notation: In obiger Situation schreibt man c = limy→∞ f (y) bzw. c = limy→−∞ f (y). Bemerkung 22. Die Rechenregeln f¨ ur Grenzwerte von Folgen u ¨bertragen sich auf Grenzwerte von Funktionen. Beispiel 23. F¨ ur D = R \ {0}, n ∈ N und f (x) = x−n gilt limx→∞ f (x) = limx→−∞ f (x) = 0. Definition 24. Sei D nicht nach oben beschr¨ankt. f ist f¨ ur x → ∞ bestimmt divergent gegen ∞ (−∞), falls f¨ ur jede Folge (xn )n in D mit limn xn = ∞ die Folge (f (xn ))n bestimmt divergent gegen ∞ (−∞) ist. Sei D nicht nach unten beschr¨ankt. f ist f¨ ur x → −∞ bestimmt divergent gegen ∞ (−∞), falls f¨ ur jede Folge (xn )n in D mit limn xn = −∞ die Folge (f (xn ))n bestimmt divergent gegen ∞ (−∞) ist. Beispiel 25. Sei n ∈ N und seien a0 , . . . , an ∈ R mit an 6= 0. Betrachte die durch f (x) =

n X

ak x k

k=0

definierte Polynomfunktion f : R → R. Sei x 6= 0. Setze g(x) =

n X k=0

ak /an xk−n .

III.3. Haupts¨atze u ¨ ber stetige Funktionen

65

Es gilt f (x) = an xn · g(x) und somit f (x) f (x) = lim = 1, n x→∞ an x x→−∞ an xn lim

siehe Beispiel 23. Ferner gilt lim xn = ∞

x→∞

und lim xn =

( ∞,

falls n gerade,

−∞, falls n ungerade.

x→−∞

Im Fall an > 0 folgt lim f (x) = ∞

x→∞

und lim f (x) =

( ∞,

x→−∞

falls n gerade,

−∞, falls n ungerade.

Im Fall an < 0 betrachte man die Funktion −f . Beispiel 26. F¨ ur alle n ∈ N0 gilt xn =0 x→∞ exp(x) lim

und lim exp(x) · |x|n = 0.

x→−∞

Dies folgt aus exp(x) ≥ xn+1 /(n + 1)! f¨ ur x ≥ 0 und exp(x) = 1/ exp(−x) f¨ ur x ≤ 0. ¨ Details Ubung. Literatur. [Fo1, §10 und §11].

3

Haupts¨ atze u ¨ ber stetige Funktionen

Im Folgenden seien a, b ∈ R mit a < b und ∅ 6= D ⊆ R.

Der Zwischenwertsatz Die S¨atze 1.26 (Intervalle) und 1.28 (Kompaktheit) zeigen, daß [a, b] ein kompaktes Intervall ist. Satz 1 (Zwischenwertsatz). Sei f : [a, b] → R stetig. Setze u = min(f (a), f (b)) und v = max(f (a), f (b)). Dann gilt ∀ y ∈ [u, v] ∃ x ∈ [a, b] : f (x) = y.

III.3. Haupts¨atze u ¨ ber stetige Funktionen

66

Beweis. Stichwort: Bisektionsverfahren. Wir betrachten den Fall f (a) ≤ y ≤ f (b) und definieren rekursiv eine Intervallschachtelung ([an , bn ])n mit der Eigenschaft ∀ n ∈ N : ([an , bn ] ⊆ [a, b] ∧ f (an ) ≤ y ≤ f (bn )). Zun¨achst sei [a1 , b1 ] = [a, b]. F¨ ur n ∈ N setzen wir cn = (an + bn )/2 und definieren ( [an , cn ], falls f (cn ) ≥ y, [an+1 , bn+1 ] = [cn , bn ], falls f (cn ) < y. Offenbar gilt bn − an = (b − a)/2n−1 . Satz II.6.13 (Intervallschachtelung) sichert die Existenz von x = limn bn = limn an . Die Stetigkeit von f und Korollar II.5.19 (Vergleichssatz) sichern f (x) ≤ y ≤ f (x). Im Fall f (a) ≥ y ≥ f (b) wende man das bereits Bewiesene auf −f an. Korollar 2. Sei D ein Intervall, und sei f : D → R stetig. Dann ist auch f (D) ein Intervall. Beweis. Klar. Beispiel 3. Sei n ∈ N ungerade, und seien a0 , . . . , an ∈ R mit an 6= 0. Betrachte die durch n X f (x) = ak x k k=0

definierte Polynomfunktion f : R → R. Wir zeigen, daß f surjektiv ist. Falls an > 0, gilt limx→∞ f (x) = ∞ und limx→−∞ f (x) = −∞, siehe Beispiel 2.25. Satz 1 zeigt die Surjektivit¨at von f . Falls an < 0, wende man das bereits Bewiesene auf −f an.

Stetige Funktionen auf kompakten Mengen Satz 4. Sei D kompakt, und sei f : D → R stetig. Dann ist auch f (D) kompakt. Beweis. Sei (yn )n eine Folge in f (D). F¨ ur n ∈ N w¨ahle man xn ∈ D mit f (xn ) = yn . Dann existiert eine konvergente Teilfolge (xnk )k mit x = limk xnk ∈ D. Aufgrund der Stetigkeit von f folgt f (x) = limk ynk . Korollar 5 (Extremalsatz). Sei D kompakt, und sei f : D → R stetig. Dann ∃ x1 , x2 ∈ D : (f (x1 ) = sup f (x) ∧ f (x2 ) = inf f (x)). x∈D

x∈D

Beweis. Nach Satz 1.28 (Kompaktheit) und Satz 4 ist f (D) abgeschlossen und beschr¨ankt. Satz 1.18 (Supremum) und Korollar 1.23 (Infimum) sichern die Existenz von sup f (D) und inf f (D), und Lemma 1.17 zeigt sup f (D) ∈ f (D) ∧ inf f (D) ∈ f (D).

III.3. Haupts¨atze u ¨ ber stetige Funktionen

67

Beispiel 6. Sei n ∈ N gerade, und seien a0 , . . . , an ∈ R mit an 6= 0. Betrachte die durch n X f (x) = ak x k k=0

definierte Polynomfunktion f : R → R. Wir zeigen, daß f nach unten oder nach oben beschr¨ankt, und damit nicht surjektiv ist. Falls an > 0, gilt limx→∞ f (x) = limx→−∞ f (x) = ∞, siehe Beispiel 2.25. W¨ahle b > 0, so daß ∀ x ∈ R : (|x| > b ⇒ f (x) ≥ 0). Setze a = −b. Satz 4 zeigt, daß f |[a,b] beschr¨ankt ist. Somit folgt f¨ ur alle x ∈ R f (x) ≥ min(0, inf f ([a, b])). Falls an < 0, wende man das bereits Bewiesene auf −f an.

Gleichm¨ aßige Stetigkeit Definition 7. f : D → R heißt gleichm¨aßig stetig falls  ∀ ε > 0 ∃ δ > 0 ∀ x, y ∈ D : |x − y| < δ ⇒ |f (x) − f (y)| < ε . Bemerkung 8. Gleichm¨aßige Stetigkeit impliziert die Stetigkeit. Beispiel 9. (i) Sei f : D → R durch f (x) = x2 definiert. Dann gilt f¨ ur x, y ∈ D |f (x) − f (y)| = |x + y| · |x − y|. Ist D beschr¨ankt, so folgt die gleichm¨aßige Stetigkeit von f . Gilt D = R, so ist f nicht gleichm¨aßig stetig. (ii) Sei D = ]0, 1], und sei f : D → R durch f (x) = 1/x definiert. Dann gilt f¨ ur x, y ∈ D |x − y| . |f (x) − f (y)| = xy Somit ist f nicht gleichm¨aßig stetig. Satz 10. Sei D kompakt, und sei f : D → R stetig. Dann ist f gleichm¨aßig stetig. Beweis. Annahme: f nicht gleichm¨aßig stetig. Dann existieren ε > 0 und Folgen (xn )n und (yn )n in D mit ∀ n ∈ N : (|xn − yn | < 1/n ∧ |f (xn ) − f (yn )| ≥ ε). Aufgrund der Kompaktheit von D existiert eine [sic] streng monoton wachsende Folge (nk )k in N, so daß (xnk )k sowie (ynk )k konvergieren mit x = limk xnk ∈ D und y = limk ynk ∈ D. Es folgt x = y, und aus der Stetigkeit von f ergibt sich limk (f (xnk ) − f (ynk )) = 0. Widerspruch.

III.3. Haupts¨atze u ¨ ber stetige Funktionen

68

Definition 11. F¨ ur n ∈ N heißt (x0 , . . . , xn ) ∈ Rn+1 Zerlegung von [a, b], falls a = x0 < · · · < xn = b. Definition 12. f : [a, b] → R heißt Treppenfunktion, falls eine Zerlegung (x0 , . . . , xn ) von [a, b] existiert, so daß ∀ k ∈ {1, . . . , n} : f |]xk−1 ,xk [ konstant. Satz 13. Sei f : [a, b] → R stetig, und sei ε > 0. Dann existieren Treppenfunktionen g, h : [a, b] → R mit (i) ∀ x ∈ [a, b] : g(x) ≤ f (x) ≤ h(x), (ii) ∀ x ∈ [a, b] : h(x) − g(x) < ε. Beweis. Sei ε > 0. Gem¨aß Satz 10 existiert n ∈ N mit ∀ x, y ∈ [a, b] : (|x − y| ≤ (b − a)/n ⇒ |f (x) − f (y)| < ε).

(1)

Definiere xk = a + k · (b − a)/n f¨ ur k ∈ {0, . . . , n}. Im Folgenden sei k ∈ {1, . . . , n}. Setze Ik = [xk−1 , xk [. Es existieren uk , vk ∈ I¯k mit f (uk ) = inf f (x) x∈I¯k

und f (vk ) = sup f (x), x∈I¯k

siehe Korollar 5. Mit (1) folgt 0 ≤ f (vk ) − f (uk ) < ε. Die Funktionen g=

n X

f (uk ) · 1Ik + f (b) · 1{b}

k=1

und h=

n X

f (vk ) · 1Ik + f (b) · 1{b}

k=1

leisten das Verlangte.

Der Umkehrsatz Definition 14. f : D → R heißt (i) monoton wachsend , falls ∀ x, y ∈ D : (x < y ⇒ f (x) ≤ f (y)),

III.3. Haupts¨atze u ¨ ber stetige Funktionen

69

(ii) monoton fallend , falls ∀ x, y ∈ D : (x < y ⇒ f (x) ≥ f (y)), (iii) monoton, falls f monoton wachsend oder monoton fallend ist. Gilt hier stets f (x) < f (y) bzw. f (x) > f (y), so spricht man von strenger (strikter) Monotonie. Satz 15 (Umkehrsatz). Sei D ein Intervall, und sei f : D → R stetig und streng monoton. Dann besitzt f als Funktion von D nach f (D) eine Umkehrfunktion, die ebenfalls stetig ist und dieselbe strenge Monotonie wie f besitzt. Beweis. Sei f streng monoton wachsend. Zu zeigen bleibt die Stetigkeit von f −1 im nicht-trivialen Fall, daß D mehr als einen Punkt enth¨alt. Sei u ∈ f (D), und sei ε > 0. ˚ Wir setzen Wir betrachten zun¨achst den Fall f −1 (u) ∈ D. A = [f −1 (u) − ε, f −1 (u) + ε] und nehmen oBdA11 A ⊆ D an. Korollar 2 und Satz 4 sichern, daß f (A) ein kompaktes Intervall ist. Aufgrund der strengen Monotonie von f ist u ein innerer Punkt von f (A). W¨ahle δ > 0 mit ]u − δ, u + δ[ ⊆ f (A). Dann folgt f −1 (]u − δ, u + δ[) ⊆ A. Dies zeigt die Stetigkeit von f −1 in u. Wir betrachten nun den Fall f −1 (u) = max D. Wir setzen A = [f −1 (u) − ε, f −1 (u)] und nehmen wiederum oBdA A ⊆ D an. Wie oben ergibt sich, daß f (A) ein kompaktes Intervall ist, daß neben u einen weiteren Punkt enth¨alt. Ferner gilt u = max f (D) = max f (A). W¨ahle δ > 0 mit ]u − δ, u] ⊆ f (A). Dann folgt f −1 (]u − δ, u]) ⊆ A und ]u − δ, u + δ[ ∩ f (D) = ]u − δ, u]. Dies zeigt die Stetigkeit von f −1 in u. Den Fall f −1 (u) = min D behandelt man analog. Ist f streng monoton fallend, wende man das bereits Bewiesene auf −f an. Beispiel 16. F¨ ur k ∈ N mit k ≥ 2 und D = [0, ∞[ sei f : D → R durch f (x) = xk definiert. Beispiel II.6.8 bzw. Bemerkung II.6.9 zeigen f (D) = D. Beispiel 2.9 und √ Satz 15 zeigen, daß x 7→ k x eine stetige Funktion von D nach R definiert. 11

Siehe [SS, S. 39] zur Bedeutung von ohne Beschr¨ankung der Allgemeinheit“. ”

III.3. Haupts¨atze u ¨ ber stetige Funktionen

70

Die Logarithmusfunktion Beispiel 17. F¨ ur u > 0 gilt exp(u) ≥ 1 + u > 1, woraus exp(y) = exp(y − x) · exp(x) > exp(x) f¨ ur x < y folgt, siehe Satz II.7.35 (Funktionalgleichung) und Korollar II.7.36.(i) (Exponentialfunktion). Beispiel 2.26 zeigt lim exp(x) = ∞

x→∞

und lim exp(x) = 0.

x→−∞

Die Korollare 2 und II.7.36.(i) sichern exp(R) = ]0, ∞[. Gem¨aß Satz 15 existiert eine stetige, streng monoton wachsende Funktion g : ]0, ∞[ → R mit exp ◦ g = id]0,∞[ ∧g ◦ exp = idR .

(2)

Durch (2) ist g eindeutig bestimmt, siehe Satz I.3.19 (Umkehrabbildung). Definition 18. Die durch (2) bestimmte Funktion g heißt nat¨ urlicher Logarithmus und wird mit ln bezeichnet. Satz 19 (Funktionalgleichung der Logarithmusfunktion). F¨ ur x, y ∈ ]0, ∞[ gilt ln(x · y) = ln(x) + ln(y). Beweis. Setze u = ln(x) und v = ln(y). Satz II.7.35 (Funktionalgleichung) zeigt ln(x · y) = ln(exp(u) · exp(v)) = ln(exp(u + v)) = u + v = ln(x) + ln(y).

Satz 20. Sei f : R → R stetig, und gelte ∀ x, y ∈ R : f (x + y) = f (x) · f (y). Dann folgt f = 0, oder es gilt f (1) > 0 und ∀ x ∈ R : f (x) = exp(x · ln(f (1))). Beweis. F¨ ur x ∈ R gilt f (x) = f (x/2)2 ≥ 0. Setze a = f (1). Gelte a = 0. Dann folgt f (x) = f (1) · f (x − 1) = 0 f¨ ur alle x ∈ R. Gelte a > 0. Da a = f (1 + 0) = a · f (0), folgt f (0) = 1, und weiter folgt aus f (x) · f (−x) = 1, daß f (x) > 0 sowie f (−x) = 1/f (x) f¨ ur alle x ∈ R. F¨ ur p ∈ Z und q p q ∈ N ergibt sich induktiv f (p/q) = f (p) = a , d.h. √ f (p/q) = q ap ,

III.4. Die Exponentialfunktion im Komplexen

71

da f (p/q) > 0. Setze f˜(x) = exp(x · ln(a)) f¨ ur x ∈ R. Es gilt f˜(1) = a, und mit Satz II.7.35 (Funktionalgleichung) folgt ∀ x, y ∈ R : f˜(x + y) = f˜(x) · f˜(y). Somit ergibt sich mit dem bereits Bewiesenen f (p/q) = exp(p/q · ln(a)). Die Funktionen f und f˜ sind also stetig und stimmen auf Q u ¨berein. Wir zeigen, daß daraus f = f˜ folgt. Sei x ∈ R. Gem¨aß Korollar II.7.23 existiert eine Folge (xn )n in Q mit x = limn xn . Man erh¨alt aufgrund der Stetigkeit f (x) = lim f (xn ) = lim f˜(xn ) = f˜(x). n

n

Definition 21. F¨ ur a > 0 heißt die durch expa (x) = exp(x · ln(a)) definierte Funktion expa : R → R Exponentialfunktion zur Basis a. Notation: ax = expa (x). Bemerkung 22. Sei a > 0. Die Rechenregeln f¨ ur Potenzen ax mit x ∈ Z u ¨bertragen sich auf√den allgemeinen Fall x ∈ R, siehe [Fo1, S. 128]. Der Beweis von Satz 20 zeigt ap/q = q ap f¨ ur p ∈ Z und q ∈ N. Literatur. [Fo1, §11 und §12].

4

Die Exponentialfunktion im Komplexen

Die komplexen Zahlen Auf der Menge C = R2 definieren wir f¨ ur (x1 , y1 ), (x2 , y2 ) ∈ C (x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 ), (x1 , y1 ) · (x2 , y2 ) = (x1 x2 − y1 y2 , x1 y2 + y1 x2 ). Wir erhalten so einen K¨orper, genannt K¨orper der komplexen Zahlen, mit Nullelement (0,0) und Einselement (1, 0). F¨ ur (x, y) 6= (0, 0) gilt  (x, y)−1 = x/(x2 + y 2 ), −y/(x2 + y 2 ) . Siehe [Fo1, S. 136] und vgl. ¨ Ubung 3.4. Das Studium von Funktionen f : D → C mit D ⊆ C ist Gegenstand der Vorlesung Funktionentheorie“. ”

III.4. Die Exponentialfunktion im Komplexen

72

Bemerkung 1. Die durch ϕ(x) = (x, 0) definierte Abbildung ϕ : R → C ist injektiv, und es gilt ϕ(x) + ϕ(y) = ϕ(x + y), ϕ(x) · ϕ(y) = ϕ(x · y) f¨ ur x, y ∈ R. In diesem Sinn fassen wir R als Teilk¨orper von C auf. Im Folgenden sei z = (x, y) ∈ C. Definition 2. (i) ı = (0, 1) ∈ C heißt imagin¨are Einheit. (ii) Re(z) = x und Im(z) = y heißen der Real - bzw. der Imagin¨arteil von z. (iii) z¯ = (x, −y) heißt die zu z konjugiert komplexe Zahl . Bemerkung 3. (i) Es gilt ı2 = (−1, 0) = −1. Gem¨aß Lemma II.1.6.(vii) ist C somit kein angeordneter K¨orper. (ii) Es gilt z = Re(z) + ı Im(z) sowie z¯ = Re(z) − ı Im(z), und aus z = x0 + ıy 0 mit x0 , y 0 ∈ R folgt x0 = Re(z) und y 0 = Im(z). ¯ und z · w = z¯ · w. ¯ (iii) F¨ ur z, w ∈ C gilt z¯ = z, z + w = z¯ + w (iv) Es gilt z · z¯ = (x + ıy) · (x − ıy) = x2 + y 2 . Es folgt z · z¯ ∈ R mit z · z¯ ≥ 0. √ Definition 4. |z| = z · z¯ heißt der12 Betrag von z. Bemerkung 5. Im Fall z 6= 0 gilt z −1 = z¯/|z|2 . Satz 6. F¨ ur z, w ∈ C gilt (i) |z| ≥ 0, (ii) |z| = 0 ⇔ z = 0, (iii) |z + w| ≤ |z| + |w| (Dreiecksungleichung), (iv) |z · w| = |z| · |w|. Beweis. Siehe [Fo1, S. 139]. 12

F¨ ur z ∈ R stimmen die Definitionen 4 und II.5.8 u ¨berein.

III.4. Die Exponentialfunktion im Komplexen

73

Folgen und Reihen komplexer Zahlen Die Definitionen II.5.2 (Konvergenz von Folgen) und II.6.1 (Cauchy-Folgen) u ¨bertragen sich w¨ortlich von K = R auf K = C. Satz 7. Sei (zn )n eine Folge in C. (i) (zn )n ist genau dann konvergent, wenn (Re(zn ))n und (Im(zn ))n konvergieren. Im Fall der Konvergenz gilt lim zn = lim Re(zn ) + lim(ı Im(zn )). n

n

n

(ii) (zn )n ist genau dann eine Cauchy-Folge, wenn (Re(zn ))n und (Im(zn ))n CauchyFolgen sind. Beweis. Verwende max(|Re(z)| , |Im(z)|) ≤ |z| ≤ |Re(z)| + |Im(z)| .

Korollar 8. Eine Folge in C konvergiert genau dann, wenn sie eine Cauchy-Folge ist. Beweis. Verwende Satz 7 und Korollar II.6.6 (Cauchy-Folgen in R). Die S¨atze II.5.13 und II.5.16 und Korollar II.5.14 (Summen-, Produkt- und Quotientenregel) u ¨bertragen sich w¨ortlich von K = R auf K = C. Die Definitionen II.7.1 und II.7.15 (Konvergenz und absolute Konvergenz von Reihen) sowie das Majoranten- und das Quotientenkriterium, Aussage (i) des Umordnungssatzes und der Satz u ¨ber das Cauchy-Produkt u ¨bertragen sich w¨ortlich von K = R auf K = C.

Die Exponentialfunktion Satz 9. F¨ ur jedes z ∈ C ist die Exponentialreihe exp(z) =

∞ X zk k=0

k!

absolut konvergent. Ferner gilt exp(z) = exp(¯ z ). Beweis. Die absolute Konvergenz ergibt sich wie in Beispiel II.7.32. Die zweite Aussage folgt aus n n X z k X z¯k = . k! k! k=0 k=0

III.5. Trigonometrische Funktionen

74

Satz 10 (Funktionalgleichung der komplexen Exponentialfunktion). F¨ ur z, w ∈ C gilt exp(z + w) = exp(z) · exp(w). Beweis. Wie f¨ ur Satz II.7.35 (Funktionalgleichung). Bemerkung 11. Satz 10 zeigt (i) exp(z) 6= 0 f¨ ur alle z ∈ C, (ii) exp(x + ıy) = exp(x) · exp(ıy) f¨ ur alle x, y ∈ R. Definition 2.1 (Stetigkeit) u ¨bertr¨agt sich w¨ortlich von Abbildungen f : R → R auf Abbildungen f : C → C. Satz 12. Die Exponentialfunktion exp : C → C ist stetig. Beweis. Wie in Beispiel 2.13. Literatur. [Fo1, §13].

5

Trigonometrische Funktionen

Im Folgenden sei x ∈ R.

Sinus und Cosinus Bemerkung 1. Die S¨atze 4.9 (Exponentialreihe, K = C) und 4.10 (Funktionalgleichung, K = C) zeigen p |exp(ıx)| = exp(ıx) · exp(−ıx) = 1. Definition 2. Die Cosinus- und die Sinusfunktion cos : R → R und sin : R → R sind definiert durch cos(x) = Re (exp(ıx)) , sin(x) = Im (exp(ıx)) .

Additionstheoreme und die Eulersche Formel Satz 3. Es gilt13 (i) exp(ıx) = cos(x) + ı sin(x) (Eulersche Formel ), (ii) cos(x) = 12 (exp(ıx) + exp(−ıx)), 13

Wir schreiben gelegentlich f n (x) statt (f (x))n .

III.5. Trigonometrische Funktionen (iii) sin(x) =

1 2ı

75

(exp(ıx) − exp(−ıx)),

(iv) cos(−x) = cos(x), (v) sin(−x) = − sin(x), (vi) cos2 (x) + sin2 (x) = 1. Beweis. Klar. Satz 4 (Additionstheoreme). F¨ ur x, y ∈ R gilt (i) cos(x + y) = cos(x) · cos(y) − sin(x) · sin(y), (ii) sin(x + y) = sin(x) · cos(y) + cos(x) · sin(y). Beweis. Aus exp (ı(x + y)) = exp(ıx) · exp(ıy) folgt cos(x + y) + ı sin(x + y) = (cos(x) + ı sin(x)) · (cos(y) + ı sin(y)) = cos(x) · cos(y) − sin(x) · sin(y) + ı (sin(x) cos(y) + cos(x) · sin(y)) . Wende Bemerkung 4.3.(ii) an. Korollar 5. F¨ ur x, y ∈ R gilt   + y) · sin 21 (x − y) ,   (ii) sin(x) − sin(y) = 2 cos 21 (x + y) · sin 12 (x − y) . (i) cos(x) − cos(y) = −2 sin

1 (x 2

Beweis. ad (i): Setze u = (x + y)/2 und v = (x − y)/2. Dann zeigen Satz 3.(iv) und (v) sowie Satz 4.(i) cos(x) − cos(y) = cos(u + v) − cos(u − v) = cos(u) · cos(v) − sin(u) · sin(v) − cos(u) · cos(−v) + sin(u) · sin(−v)   = −2 sin(u) · sin(v) = −2 sin 21 (x + y) · sin 21 (x − y) . ad (ii): analog.

Analytische Eigenschaften Satz 6. Die Funktionen cos und sin sind stetig. Beweis. Sei x ∈ R, und sei (xn )n eine Folge in R mit limn xn = x. Dann folgt limn exp(ıxn ) = exp(ıx) und limn exp(−ıxn ) = exp(−ıx) gem¨aß Satz 4.12 (Stetigkeit der Exponentialfunktion, K = C). Wende Satz 3.(ii) und (iii) an.

III.5. Trigonometrische Funktionen

76

Satz 7. Es gilt ∞ X x2k , cos(x) = (−1)k (2k)! k=0

sin(x) =

∞ X x2k+1 , (−1)k (2k + 1)! k=0

und beide Reihen sind absolut konvergent. Beweis. Die absolute Konvergenz folgt aus Beispiel II.7.32 mit dem Majorantenkriterium. Aus Satz 4.9 (Exponentialreihe, K = C) folgt ∞ ∞ 2k X x2k+1 xk X k x = (−1) +ı (−1)k . exp(ıx) = ı · k! (2k)! (2k + 1)! k=0 k=0 k=0 ∞ X

k

Betrachte Real- und Imagin¨arteil. Satz 8 (Restgliedabsch¨atzung der Cosinus- und Sinusreihe). (i) F¨ ur n ∈ N0 und |x| ≤ 2n + 3 gilt n 2k X x |x|2n+2 k (−1) . cos(x) − ≤ (2k)! (2n + 2)! k=0 (ii) F¨ ur n ∈ N0 und |x| ≤ 2n + 4 gilt n 2k+1 X |x|2n+3 x (−1)k . ≤ sin(x) − (2n + 3)! (2k + 1)! k=0 Beweis. Siehe [Fo1, S.148] und vgl. Satz II.7.34 (Restgliedabsch¨atzung der Exponentialreihe).

Periodizit¨ at Lemma 9. Es existiert genau ein x ∈ [0, 2] mit cos(x) = 0. Beweis. F¨ ur |x| ≤ 5 gilt gem¨aß Satz 8 cos(x) − 1 + x2 /2 ≤ x4 /24. F¨ ur x = 2 ergibt sich |cos(2) − (−1)| ≤ 2/3, so daß cos(2) ≤ −1/3. Da cos(0) = 1, existiert gem¨aß Satz 6 und Satz III.3.1 (Zwischenwertsatz) ein x ∈ ]0, 2[ mit cos(x) = 0. Wie oben zeigt man mit Hilfe von Satz 8, daß sin(w) > 0 f¨ ur alle w ∈ ]0, 2], siehe [Fo1, S. 150]. Korollar 5.(i) zeigt, daß cos auf [0, 2] streng monoton fallend ist. Dies sichert die Eindeutigkeit.

III.5. Trigonometrische Funktionen

77

Definition 10. π ist die eindeutig bestimmte L¨osung von cos(x/2) = 0 mit x ∈ [0, 4]. Satz 11. Es gilt exp(ıπ/2) = ı, exp(ıπ) = −1, exp(ı3/2π) = −ı, exp(ı2π) = 1. Beweis. Es gilt sin2 (π/2) = 1 − cos2 (π/2) = 1. Bereits bekannt ist sin(π/2) > 0. Fazit exp(ıπ/2) = ı sin(π/2) = ı. Die weiteren Aussagen folgen mit Satz 4.10 (Funktionalgleichung, K = C). Bemerkung 12. Satz 11 liefert auch die Werte von sin und cos an den Stellen π/2, π, 3/2π und 2π. Korollar 13. Es gilt (i) cos(x + 2π) = cos(x), sin(x + 2π) = sin(x) (2π-Periodizit¨at), (ii) cos(x + π) = − cos(x), sin(x + π) = − sin(x), (iii) cos(x + π/2) = − sin(x), sin(x + π/2) = cos(x). Beweis. Verwende die S¨atze 4 und 11. Korollar 14. Es gilt (i) {x ∈ R : sin(x) = 0} = {kπ : k ∈ Z}, (ii) {x ∈ R : cos(x) = 0} = {π/2 + kπ : k ∈ Z}. Beweis. ad (i): F¨ ur x ∈ ]−π/2, π/2[ gilt cos(x) > 0, siehe Satz 3.(iv). F¨ ur x ∈ ]0, π[ folgt sin(x) > 0, woraus sin(x) < 0 f¨ ur x ∈ ]π, 2π[ folgt, siehe Korollar 13.(ii) und (iii). Verwende Korollar 13.(i). ad (ii): Verwende (i) und Korollar 13.(iii).

Die Umkehrfunktionen Satz 15. (i) cos bildet [0, π] streng monoton fallend auf [−1, 1] ab. (ii) sin bildet [−π/2, π/2] streng monoton wachsend auf [−1, 1] ab. Beweis. ad (i): Bereits bekannt ist: cos |[0,π/2] ist streng monoton fallend und nichtnegativ. F¨ ur x ∈ ]0, π/2] gilt cos(π/2 + x) = − cos(π/2 − x) < 0, woraus die strenge Monotonie von cos |[0,π] folgt. Da cos(0) = 1 und cos(π) = −1 sichern Satz 6 und Satz 3.1 (Zwischenwertsatz), daß cos([0, π]) = [−1, 1]. ad (ii): Verwende (i) und Korollar 13.(iii).

III.5. Trigonometrische Funktionen

78

Beispiel 16. Gem¨aß Satz 6 und Satz 3.15 (Umkehrsatz) existieren stetige, streng monoton fallende bzw. wachsende Funktion g : [−1, 1] → [0, π] und h : [−1, 1] → [−π/2, π/2] mit cos ◦ g = id[−1,1] ∧ g ◦ cos = id[0,π] , (1) sin ◦ h = id[−1,1] ∧ h ◦ sin = id[−π/2,π/2] . Durch (1) sind g und h eindeutig bestimmt, siehe Satz I.3.19 (Umkehrabbildung). Definition 17. Die durch (1) bestimmten Funktionen g und h heißen Arcus-Cosinus bzw. Arcus-Sinus, und werden mit arccos bzw. arcsin bezeichnet.

Polarkoordinaten Satz 18. F¨ ur alle z ∈ C\{0} existieren eindeutig bestimmte r ∈ ]0, ∞[ und α ∈ [0, 2π[ mit z = r · exp(ıα). (2) Beweis. Seien r ∈ ]0, ∞[ und α ∈ [0, 2π[. Dann ist (2) ¨aquivalent zu r = |z| ∧ z/|z| = exp(ıα). Es gen¨ ugt also den Fall |z| = 1 zu betrachten. Gelte |z| = 1 und Im(z) ≥ 0. Dann z = exp(ıα) ⇔ Re(z) = cos(α) ∧ sin(α) ≥ 0 ⇔ α = arccos(Re(z)). Gelte |z| = 1 und Im(z) < 0. Dann folgt mit dem bereits Bewiesenen z = exp(ıα) ⇔ z¯ = exp(ı(2π − α)) ⇔ α = 2π − arccos(Re(z)).

Definition 19. F¨ ur z ∈ C heißt (2) mit r ∈ [0, ∞[ und α ∈ R Polardarstellung von z. Ferner heißen dann r und α Polarkoordinaten von z. Bemerkung 20. (i) F¨ ur z = r · exp(ıα) und w = q · exp(ıβ) gilt z · w = rq · exp(ı(α + β)). (ii) Es gilt exp(C) = C \ {0}.

Tangens und Cotangens Definition 21. (i) Die Tangensfunktion tan : R \ {π/2 + kπ : k ∈ Z} → R ist definiert durch tan(x) =

sin(x) . cos(x)

III.5. Trigonometrische Funktionen

79

(ii) Die Cotangensfunktion cot : R \ {kπ : k ∈ Z} → R ist definiert durch cot(x) =

cos(x) . sin(x)

Bemerkung 22. Wie oben zeigt man (i) tan(x + π) = tan(x) f¨ ur alle x ∈ R \ {π/2 + kπ : k ∈ Z} (π-Periodizit¨at), (ii) cot(x + π) = cot(x) f¨ ur alle x ∈ R \ {kπ : k ∈ Z} (π-Periodizit¨at), (iii) tan bildet ]−π/2, π/2[ stetig und streng monoton wachsend auf R ab, (iv) cot bildet ]0, π[ stetig und streng monoton fallend auf R ab, (v) die entsprechenden Umkehrfunktionen sind stetig und heißen Arcus-Tangens bzw. Arcus-Cotangens, und werden mit arctan bzw. arccot bezeichnet. Literatur. [Fo1, §14].

Kapitel IV Differenzierbare Funktionen in einer Variablen Die lokale Approximation von Funktionen durch (affin-)lineare Funktionen ist die Grundidee der Differentialrechnung. Wir entwickeln diese Idee hier zun¨achst f¨ ur Funktionen f : D → R mit D ⊆ R und verweisen insbesondere auf [Fo1] und [H1].

1

Differenzierbarkeit

Im Folgenden seien D ⊆ R und f : D → R, und x ∈ D sei ein H¨aufungspunkt von D. Wir definieren m : D \ {x} → R durch m(y) =

f (y) − f (x) . y−x

Bemerkung 1. m(y) ist die Steigung der Gerade durch (x, f (x)) und (y, f (y)). Definition 2. f heißt differenzierbar in x, falls m in x einen Grenzwert besitzt. Ggf. heißt limy→x m(y) die Ableitung von f in x. Notation1 : f 0 (x) = limy→x m(y). f heißt differenzierbar , falls jeder Punkt aus D ein H¨aufungspunkt von D ist und f in allen Punkten aus D differenzierbar ist. Bemerkung 3. (i) f ist genau dann in x differenzierbar, wenn m eine Fortsetzung auf D besitzt, die stetig in x ist. Siehe Bemerkung III.2.16. (ii) Ist f differenzierbar, so definiert x 7→ f 0 (x) eine Abbildung f 0 : D → R, genannt die Ableitung von f . 1

Man schreibt auch

df dx (x)

statt f 0 (x).

80

IV.1. Differenzierbarkeit

81

Beispiel 4. Sei D = R. (i) Mit c0 , c1 ∈ R sei f (x) = c1 x + c0 . Dann gilt m(y) = c1 , so daß f differenzierbar ist und f 0 (x) = c1 f¨ ur alle x ∈ D gilt. (ii) Sei f (x) = x2 . Dann gilt m(y) = y+x, so daß f differenzierbar ist und f 0 (x) = 2x f¨ ur alle x ∈ D gilt. (iii) Sei f (x) = exp(x). Dann gilt exp(y − x) − 1 . y−x Gelte 0 < |y − x| ≤ 3/2. Dann zeigt Satz II.7.34 (Restgliedabsch¨atzung) m(y) = exp(x) ·

|exp(y − x) − (1 + y − x)| ≤ (y − x)2 . Somit gilt exp(y − x) − 1 ≤ |y − x| , − 1 y−x und es folgt limy→x (exp(y − x) − 1) /(y − x) = 1. Fazit: f ist differenzierbar, und f 0 (x) = exp(x) gilt f¨ ur alle x ∈ D. (iv) Sei f (x) = sin(x). Gem¨aß Korollar III.5.5.(i) (zu den Additionstheoremen) gilt  1  sin (y − x) 2 m(y) = cos 12 (y + x) · . 1 (y − x) 2 Wir zeigen sin(δ) = 1. (1) δ Gelte 0 < |δ| ≤ 4. Satz III.5.8 (Restgliedabsch¨atzung) zeigt |sin(δ) − δ| ≤ |δ|3 /6, so daß sin(δ) δ2 ≤ . − 1 δ 6 Hieraus folgt (1). Mit der Stetigkeit der Cosinusfunktion und (1) ergibt sich die Differenzierbarkeit von f und f 0 (x) = cos(x) f¨ ur alle x ∈ D. lim

δ→0

(v) Sei f (x) = |x|. Im Fall x = 0 ergibt sich ( 1, m(y) = −1,

falls y > 0, falls y < 0,

so daß f in x = 0 nicht differenzierbar ist. Im Fall x > 0 ergibt sich m(y) = 1 f¨ ur y ∈ [0, ∞[ \ {x}, so daß f in x differen0 zierbar ist mit f (x) = 1. Im Fall x < 0 ergibt sich m(y) = −1 f¨ ur y ∈ ]−∞, 0] \ {x}, so daß f in x 0 differenzierbar ist mit f (x) = −1. Beispiel 5. Seien D = R \ {0} und f (x) = 1/x. Dann gilt 1 m(y) = − , x·y so daß f differenzierbar ist und f 0 (x) = −1/x2 f¨ ur alle x ∈ D gilt.

IV.1. Differenzierbarkeit

82

Affin-lineare Approximierbarkeit Definition 6. h : R → R heißt affin-linear , falls c0 , c1 ∈ R existieren, so daß ∀ y ∈ R : h(y) = c1 y + c0 . Bemerkung 7. F¨ ur h : R → R sind ¨aquivalent: (i) h ist affin-linear und h(x) = f (x), (ii) es existiert c ∈ R, so daß ∀ y ∈ R : h(y) = f (x) + c(y − x).

(2)

Ferner ist f genau dann stetig in x, wenn f¨ ur eine affin-lineare Funktion (alle affinlinearen Funktionen) h der Form (2) gilt lim (f (y) − h(y)) = 0.

y→x

Satz 8. f ist genau dann in x differenzierbar, wenn eine affin-lineare Funktion h der Form (2) existiert mit f (y) − h(y) = 0. lim y→x y−x Ggf. ist h mit dieser Eigenschaft eindeutig bestimmt, und es gilt ∀ y ∈ R : h(y) = f (x) + f 0 (x)(y − x).

(3)

Beweis. ⇒“ Definiere h : R → R durch (3). F¨ ur y ∈ D \ {x} gilt ” f (y) − h(y) f (y) − f (x) = − f 0 (x), y−x y−x woraus die Behauptung folgt. ⇐“ F¨ ur y ∈ D \ {x} und h von der Form (2) gilt ” f (y) − f (x) f (y) − h(y) = + c, y−x y−x woraus die Differenzierbarkeit von f in x und f 0 (x) = c folgen. Definition 9. Sei f differenzierbar in x. Dann heißt die durch (3) definierte Funktion h : R → R die Tangente an (den Graphen von) f im Punkt (x, f (x)). Bemerkung 10. Sei f differenzierbar in x, und sei h die Tangente an f im Punkt (x, f (x)). Dann besagt Satz 8 ∀ ε > 0 ∃ δ > 0 ∀ y ∈ D : (|y − x| < δ ⇒ |f (y) − h(y)| ≤ ε|y − x|). Graphiken zu dieser Aussage im Fall f = exp und x = 0 finden sich in Abschnitt A.2. Korollar 11. Sei f differenzierbar in x. Dann ist f stetig in x. Beweis. Verwende Satz 8 und Bemerkung 7. Ausblick 12. Es existieren Funktionen f : R → R, die stetig, aber in keinem Punkt x ∈ R differenzierbar sind. Siehe [A, Bsp. 2.9].

IV.1. Differenzierbarkeit

83

Rechenregeln Satz 13 (Summen-, Produktregel). Sind f, g : D → R differenzierbar in x, so sind auch f + g und f · g differenzierbar in x, und es gilt (f + g)0 (x) = f 0 (x) + g 0 (x) sowie (f · g)0 (x) = f 0 (x) · g(x) + f (x) · g 0 (x). Beweis. Es gilt f¨ ur x, y ∈ D mit x 6= y f (y) − f (x) g(y) − g(x) (f (y) + g(y)) − (f (x) + g(x)) = + y−x y−x y−x sowie f (y) · g(y) − f (x) · g(x) f (y) − f (x) g(y) − g(x) = · g(y) + f (x) · . y−x y−x y−x Verwende Bemerkung III.2.22 und Korollar 11. Satz 14 (Quotientenregel). Sind f, g : D → R differenzierbar in x, und gilt g(x) 6= 0, so ist x ein H¨aufungspunkt von D0 = {y ∈ D : g(y) 6= 0}. Ferner ist f /g : D0 → R differenzierbar in x, und es gilt f 0 (x)g(x) − f (x)g 0 (x) (f /g) (x) = . g(x)2 0

Beweis. Gem¨aß Korollar 11 ist g stetig in x. Also existiert δ > 0, so daß f¨ ur alle y ∈ D mit |y − x| < δ |g(y) − g(x)| < |g(x)| /2 und damit insbesondere y ∈ D0 gilt. Da x ein H¨aufungspunkt von D ist, gilt dies auch bez¨ uglich D0 . Im Spezialfall f = 1 gilt f¨ ur x, y ∈ D0 mit x 6= y 1/g(y) − 1/g(x) 1 g(x) − g(y) = · , y−x g(y) · g(x) y−x woraus die Differenzierbarkeit von 1/g in x mit (1/g)0 (x) = −g 0 (x)/g(x)2 folgt. Im allgemeinen Fall kombiniere man das bereits Bewiesene mit Satz 13. Beispiel 15. (i) F¨ ur D = R und n ∈ N sei fn durch fn (x) = xn gegeben. Dann ist fn differenzierbar mit fn0 (x) = n · xn−1 f¨ ur alle x ∈ D. Beweis: Induktion, basierend auf Beispiel 4.(i) und Satz 13. (ii) F¨ ur D = R \ {0} und n ∈ Z \ N0 sei fn durch fn (x) = xn gegeben. Dann ist fn differenzierbar mit fn0 (x) = n · xn−1 f¨ ur alle x ∈ D. Beweis: Verwende (i) und Satz 14.

IV.1. Differenzierbarkeit

84

Die Kettenregel Satz 16 (Kettenregel). Sei f differenzierbar in x, und sei g : E → R mit f (D) ⊆ E ⊆ R differenzierbar in f (x). Dann ist g ◦ f differenzierbar in x, und es gilt (g ◦ f )0 (x) = g 0 (f (x)) · f 0 (x). Beweis. Definiere h : E → R durch ( g(v)−g(f (x)) h(v) =

v−f (x)

falls v 6= f (x),

,

g 0 (f (x)) ,

falls v = f (x).

Dann ist h stetig in f (x), und f¨ ur v ∈ E gilt g(v) − g (f (x)) = h(v) · (v − f (x)) . Somit ergibt sich f¨ ur y ∈ D mit y 6= x f (y) − f (x) g (f (y)) − g (f (x)) = h (f (y)) · y−x y−x und weiter unter Verwendung von Korollar 11 g (f (y)) − g (f (x)) = g 0 (f (x)) · f 0 (x). y→x y−x lim

Beispiel 17. (i) F¨ ur D = R sei f (x) = cos(x). Setze h(x) = x + π/2. Es gilt f = sin ◦ h. Satz 16 und die Beispiele 4.(i) und (iv) zeigen die Differenzierbarkeit von f und f 0 (x) = cos(x + π/2) = − sin(x). (ii) F¨ ur D = R \ {π/2 + kπ : k ∈ Z} sei f (x) = tan(x). Mit Satz 14 und (i) folgt die Differenzierbarkeit von f sowie cos2 (x) + sin2 (x) 1 f (x) = = . 2 cos (x) cos2 (x) 0

Der Umkehrsatz Satz 18 (Differenzierbarkeit der Umkehrfunktion). Sei D ein Intervall, das mehr als einen Punkt enth¨alt, und sei f : D → R stetig und streng monoton. Bezeichne g die Umkehrfunktion von f als Funktion von D nach f (D). Ist f differenzierbar in x und gilt f 0 (x) 6= 0, so ist g differenzierbar in y = f (x), und es gilt g 0 (y) =

1 f 0 (g(y))

.

IV.1. Differenzierbarkeit

85

Beweis. Bekannt ist: f (D) ist ein Intervall, das mehr als einen Punkt enth¨alt, und g ist stetig und streng monoton. Insbesondere ist y = f (x) ein H¨aufungspunkt von f (D). Sei (yn )n eine Folge in f (D) \ {y} mit limn yn = y. Setze xn = g(yn ). Dann gilt xn 6= x und  −1 g(yn ) − g(y) f (xn ) − f (x) = . yn − y xn − x Wende Satz II.5.16 (Quotientenregel) an. Beispiel 19. (i) Gem¨aß Satz 18 ist ln : ]0, ∞[ → R differenzierbar, und es gilt ln0 (y) =

1 1 = exp(ln(y)) y

f¨ ur alle y ∈ ]0, ∞[. (ii) F¨ ur x ∈ ]0, ∞[ und α ∈ R sei f (x) = xα = exp(α · ln(x)). Gem¨aß (i) und Satz 16 ist f differenzierbar mit f 0 (x) = exp(α · ln(x)) · α/x = α · exp((α − 1) · ln(x)) = α · xα−1 . Speziell f¨ ur α = 1/n mit n ∈ N ergibt sich f (x) =

√ n

x und f 0 (x) = 1/n · x1/n−1 .

(iii) Gem¨aß Satz 18 ist arcsin : [−1, 1] → R in y ∈ ]−1, 1[ differenzierbar mit arcsin0 (y) =

1 1 1 p = . =p cos(arcsin(y)) 1 − y2 1 − sin2 (arcsin(y))

(iv) Gem¨aß Satz 18 ist arctan : R → R differenzierbar, und es gilt f¨ ur y ∈ R arctan0 (y) = cos2 (arctan(y)). Setze x = arctan(y). Dann gilt x ∈ ]−π/2, π/2[ und y 2 = tan2 (x) =

1 − 1, cos2 (x)

so daß cos2 (x) = 1/(1 + y 2 ). Fazit: arctan0 (y) =

1 . 1 + y2

H¨ ohere Ableitungen Notation: F¨ ur ∅ 6= D ⊆ R bezeichnet C(D) die Menge der stetigen Funktionen von D nach R. Im Folgenden sei jeder Punkt aus ∅ 6= D ⊆ R ein H¨aufungspunkt von D.

IV.2. Der Mittelwertsatz der Differentialrechnung

86

Definition 20. (i) f heißt nullmal differenzierbar, und f (0) = f heißt die nullte Ableitung von f . F¨ ur k ∈ N heißt f k-mal differenzierbar , falls f (k − 1)-mal differenzierbar und die (k − 1)-te Ableitung f (k−1) von f differenzierbar ist. In diesem Fall heißt f (k) = (f (k−1) )0 die k-te Ableitung von f . Notation: f 00 = f (2) . (ii) F¨ ur k ∈ N heißt f k-mal stetig differenzierbar , falls f k-mal differenzierbar und f (k) ∈ C(D) gilt. Notation: C k (D) Menge der k-mal stetig differenzierbaren Funktionen von D nach R. (iii) f heißt beliebig oft differenzierbar, falls f f¨ ur jedes k ∈ N k-mal differenzierbar T k ist. Notation (und Bemerkung): C ∞ (D) = ∞ k=1 C (D) Menge der beliebig oft differenzierbaren Funktionen von D nach R. Beispiel 21. Sei D = R, und seien n ∈ N und a0 , . . . , an ∈ R mit an 6= 0. Betrachte die durch n X f (x) = ak x k k=0

definierte Polynomfunktion. Per Induktion zeigt man: f ∈ C n (R) und f (n) = n! · an . Es folgt f ∈ C ∞ (R) und f (k) = 0 f¨ ur k > n. Literatur. [Fo1, §15].

2

Der Mittelwertsatz der Differentialrechnung

Im Folgenden seien D ⊆ R, f : D → R und x ∈ D. Ferner seien a, b ∈ R mit a < b. Sprechweise: f ist differenzierbar in D0 ⊆ D, falls f in jedem Punkt aus D0 differenzierbar ist.

Lokale und globale Extrema Definition 1. x heißt (i) lokales Maximum von f , falls ∃ δ > 0 ∀ y ∈ D ∩ ]x − δ, x + δ[ : f (y) ≤ f (x), (ii) lokales Minimum von f , falls ∃ δ > 0 ∀ y ∈ D ∩ ]x − δ, x + δ[ : f (y) ≥ f (x),

IV.2. Der Mittelwertsatz der Differentialrechnung

87

(iii) globales Maximum 2 von f , falls ∀ y ∈ D : f (y) ≤ f (x), (iv) globales Minimum von f , falls ∀ y ∈ D : f (y) ≥ f (x). Ferner steht Extremum f¨ ur Maximum oder Minimum, und lokale Extrema heißen streng (strikt), falls die entsprechende Forderung mit < bzw. > f¨ ur alle y ∈ D mit 0 < |x − y| < δ gilt. Bemerkung 2. Globale Extrema sind lokale Extrema. ˚ ein lokales Extremum von f . Falls f differenzierbar in x ist, gilt Satz 3. Sei x ∈ D 0 f (x) = 0. ˚ ein lokales Maximum von f . W¨ahle δ > 0 mit ]x − δ, x + δ[ ⊆ D Beweis. Sei x ∈ D und ∀ y ∈ ]x − δ, x + δ[ : f (y) ≤ f (x). Sei n ≥ 2. F¨ ur xn = x + δ/n folgt f (xn ) − f (x) ≤ 0, xn − x und f¨ ur xn = x − δ/n folgt f (xn ) − f (x) ≥ 0. xn − x Mit Satz II.5.18 (Vergleichssatz) ergibt sich f 0 (x) = 0. ˚ ein lokales Minimum von f . Dann ist x ein lokales Maximum von −f , und Sei x ∈ D mit dem bereits Bewiesenen ergibt sich f 0 (x) = −(−f )0 (x) = 0. Bemerkung 4. Sei f : [a, b] → R in ]a, b[ differenzierbar. Seien L und G die Mengen der lokalen bzw. globalen Extrema von f . Aus Satz 3 folgt G ⊆ L ⊆ {a, b} ∪ {x ∈ ]a, b[ : f 0 (x) = 0}. Ist f ferner stetig, so zeigt Korollar III.3.5 (Extremalsatz), daß G 6= ∅. Beispiel 5. F¨ ur D = R sei f (x) = x3 . Es gilt f 0 (0) = 0, aber f besitzt als streng monoton wachsende Funktion auf einer offenen Menge keine lokalen Extrema. Beispiel 6. F¨ ur D = [0, ∞[ und α > 0 sei f (x) = exp(−x) · xα . Es gilt (i) f (0) = 0, (ii) f (x) > 0 f¨ ur alle x > 0, 2

Hier und bei (iv) Begriffsbildung analog f¨ ur beliebige Definitionsbereiche D.

IV.2. Der Mittelwertsatz der Differentialrechnung

88

(iii) f ist stetig, (iv) limx→∞ f (x) = 0, siehe Beispiel III.2.26 und beachte xα ≤ xn f¨ ur x ≥ 1 und n ∈ N mit n ≥ α. Aus (i) und (ii) folgt, daß x = 0 das globale Minimum von f ist. Mit L und G bezeichnen wir die Mengen der lokalen bzw. globalen Maxima von f . Gem¨aß (ii) und (iv) existiert x0 > 1 mit (v) f (x) < f (1) f¨ ur alle x ≥ x0 . Korollar III.3.5 (Extremalsatz) und (iii) sichern die Existenz eines globalen Maximum von f |[0,x0 ] , und mit (v) folgt, daß jeder solche Punkt auch ein globales Maximum von f ist. Somit ergibt sich G 6= ∅, und wegen (i) und (ii) gilt 0 6∈ L. F¨ ur x > 0 gilt f 0 (x) = exp(−x) · xα−1 · (α − x), so daß f 0 (x) = 0 genau f¨ ur x = α gilt. Mit Satz 6 ergibt sich ∅ 6= G ⊆ L ⊆ {α}, so daß x = α das globale Maximum von f ist.

Der Mittelwertsatz Satz 7 (Mittelwertsatz der Differentialrechnung). Sei f : [a, b] → R stetig und in ]a, b[ differenzierbar. Dann existiert ξ ∈ ]a, b[ mit f 0 (ξ) =

f (b) − f (a) . b−a

Beweis. Wir betrachten zun¨achst den Spezialfall f (a) = f (b) (Satz von Rolle). Im Fall f = f (a) gilt f 0 = 0. Andernfalls existiert x ∈ ]a, b[ mit f (x) 6= f (a). F¨ ur die Menge G der globalen Extrema von f gilt G \ {a, b} = 6 ∅, siehe Korollar III.3.5 (Extremalsatz). Wende Bemerkung 4 an. Im allgemeinen Fall sei g(x) = f (x) −

f (b) − f (a) (x − a) b−a

f¨ ur x ∈ ]a, b[. Dann gilt g(a) = g(b) = f (a), und der Satz von Rolle sichert die Existenz von ξ ∈ ]a, b[ mit f (b) − f (a) 0 = g 0 (ξ) = f 0 (ξ) − . b−a ˚ F¨ Korollar 8. Sei D ein Intervall, und sei f stetig sowie differenzierbar in D. ur m1 , m2 ∈ R gelte ˚ : m1 ≤ f 0 (z) ≤ m2 . ∀z ∈ D Dann folgt3 ∀ x, y ∈ D : x < y ⇒ m1 ≤ 3

f (y) − f (x) ≤ m2 . y−x

Funktionen mit dieser Eigenschaft heißen Lipschitz-stetig, siehe [H1, S. 212].

IV.2. Der Mittelwertsatz der Differentialrechnung

89

Beweis. Wende Satz 7 auf f |[x,y] an. ˚ Dann Korollar 9. Sei D ein Intervall, und sei f stetig sowie differenzierbar in D. ˚ : f 0 (x) = 0) ⇒ f konstant. (∀ x ∈ D Beweis. Verwende Korollar 8 mit m1 = m2 = 0. Die folgenden beiden S¨atze behandeln sogenannte Differentialgleichungen, deren Studium Gegenstand der Vorlesung Einf¨ uhrung: Gew¨ohnliche Differentialgleichungen“ ” ist. Satz 10. Sei f : R → R differenzierbar, und sei c ∈ R. Dann sind ¨aquivalent: (i) ∀ x ∈ R : f 0 (x) = c · f (x), (ii) ∃ a ∈ R ∀ x ∈ R : f (x) = a · exp(c · x). Ggf. ist a eindeutig durch a = f (0) bestimmt. Beweis. (i) ⇒ (ii)“: Setze g(x) = f (x) · exp(−c · x). Dann gilt ” g 0 (x) = f 0 (x) · exp(−c · x) − c · f (x) · exp(−c · x) = 0. Korollar 9 zeigt, daß g konstant ist. Offenbar gilt g(0) = f (0). (ii) ⇒ (i)“: klar. ” Satz 11. Sei f : R → R zweimal differenzierbar. Dann sind ¨aquivalent: (i) ∀ x ∈ R : f 00 (x) = −f (x), (ii) ∃ a, b ∈ R ∀ x ∈ R : f (x) = a · cos(x) + b · sin(x). Ggf. sind a und b eindeutig durch a = f (0) und b = f 0 (0) bestimmt. Beweis. (i) ⇒ (ii)“: Setze g(x) = f (x) − f (0) · cos(x) − f 0 (0) · sin(x). Dann gilt ” g 00 = −g und g(0) = g 0 (0) = 0. Setze h(x) = g(x)2 + g 0 (x)2 . Dann gilt h0 (x) = 2g(x) · g 0 (x) + 2g 0 (x) · g 00 (x) = 0 und h(0) = 0. Korollar 9 zeigt h = 0, woraus g = 0 folgt. (ii) ⇒ (i)“: klar. ”

√ Bemerkung 12. F¨ ur f gem¨aß Satz 11.(ii) und c = a2 + b2 gelte c > 0. Nach Satz III.5.18 (Polarkoordinaten) existiert α ∈ [0, 2π[ mit a/c = sin(α) und b/c = cos(α). Satz III.5.4.(ii) (Additionstheorem) zeigt f¨ ur x ∈ R f (x) = c · sin(x + α).

IV.2. Der Mittelwertsatz der Differentialrechnung

90

Monotonie- und Konvexit¨ atskriterien ˚ Dann Korollar 13. Sei D ein Intervall, und sei f stetig sowie differenzierbar auf D. gilt: ˚ : f 0 (x) ≥ 0 ⇔ f monoton wachsend, (i) ∀ x ∈ D ˚ : f 0 (x) > 0 ⇒ f streng monoton wachsend. (ii) ∀ x ∈ D Beweis. ⇒“: F¨ ur x, y ∈ D mit x < y existiert ξ ∈ ]x, y[ mit ” f (y) = f (x) + f 0 (ξ) · (y − x), siehe Satz 7. ⇐ in (i)“: Verwende Satz II.5.18 (Vergleichssatz). ” Beispiel 14. Die Funktion aus Beispiel 5 ist streng monoton wachsend, aber es gilt f 0 (0) = 0. Beispiel 15. F¨ ur f gem¨aß Beispiel 6 erlaubt Korollar 13 einen einfacheren Nachweis daf¨ ur, daß x = α das globale Maximum von f ist: f ist streng monoton wachsend auf [0, α] und streng monoton fallend auf [α, ∞[. Entsprechende Graphiken finden sich in Abschnitt A.3. Bemerkung 16. Die Anwendung von Korollar 13 auf −f liefert Aussagen u ¨ber (streng) monoton fallende Funktionen. ˚ und sei δ > 0 mit ]x − δ, x + δ[ ⊆ D. Korollar 17. Sei f differenzierbar, sei x ∈ D Gelte ∀ y ∈ ]x − δ, x[ : f 0 (y) ≥ 0 sowie ∀ y ∈ ]x, x + δ[ : f 0 (y) ≤ 0. Dann ist x ein lokales Maximum von f . Liegen obige Eigenschaften mit > bzw. < vor, ist x ein strenges lokales Maximum. Beweis. Nach Korollar 13 ist f (streng) monoton wachsend auf ]x − δ, x] und (streng) monoton fallend auf [x, x + δ[. ˚ Gelte Korollar 18. Sei f differenzierbar, und sei f 0 differenzierbar in x ∈ D. f 0 (x) = 0 ∧ f 00 (x) < 0. Dann besitzt f in x ein strenges lokales Maximum. Beweis. Da f 00 (x) < 0, existiert δ > 0 mit ]x − δ, x + δ[ ⊆ D und ∀ y ∈ ]x − δ, x[ : f 0 (y) > f 0 (x) sowie ∀ y ∈ ]x, x + δ[ : f 0 (y) < f 0 (x). Beachte f 0 (x) = 0, und wende Korollar 17 an.

IV.2. Der Mittelwertsatz der Differentialrechnung

91

Bemerkung 19. Die Anwendung der Korollare 17 und 18 auf −f liefert Aussagen u ¨ber lokale Minima. Beispiel 20. F¨ ur D = R seien f (x) = x2 und g(x) = x4 . Dann ist x = 0 das globale Minimum von f sowie von g, und es gilt f 0 (0) = g 0 (0) = 0, f 00 (0) = 2, aber g 00 (0) = 0. Definition 21. Sei D ein Intervall. f heißt konvex , falls f¨ ur alle x1 , x2 ∈ D und alle λ ∈ ]0, 1[ f (λ · x1 + (1 − λ) · x2 ) ≤ λ · f (x1 ) + (1 − λ) · f (x2 ). f heißt konkav , falls −f konvex ist. Satz 22. Sei D ein offenes Intervall, und sei f zweimal differenzierbar. Dann sind ¨aquivalent: (i) f konvex, (ii) ∀ x ∈ D : f 00 (x) ≥ 0. Beweis. (i) ⇒ (ii)“: Annahme: es existiert x ∈ D mit f 00 (x) < 0. Setze ” g(y) = f (y) − f 0 (x) · (y − x) f¨ ur y ∈ D. Dann ist g konvex und zweimal differenzierbar mit g 0 (x) = 0 und g 00 (x) = f 00 (x) < 0. Nach Korollar 18 ist x ein strenges lokales Maximum von g. Folglich existiert δ > 0 mit x − δ, x + δ ∈ D und max (g(x − δ), g(x + δ)) < g(x). Da (x − δ + x + δ)/2 = x, ergibt sich ein Widerspruch. (ii) ⇒ (i)“: Seien x1 , x2 ∈ D mit x1 < x2 und λ ∈ ]0, 1[. Setze x = λ · x1 + (1 − λ) · x2 . ” Gem¨aß Satz 7 existieren ξ1 ∈ ]x1 , x[ und ξ2 ∈ ]x, x2 [ mit f 0 (ξ1 ) =

f (x) − f (x1 ) f (x) − f (x1 ) = . x − x1 (1 − λ) · (x2 − x1 )

und f 0 (ξ2 ) =

f (x2 ) − f (x) f (x2 ) − f (x) = . x2 − x λ · (x2 − x1 )

Nach Korollar 13 gilt f 0 (ξ1 ) ≤ f 0 (ξ2 ), woraus f (x) − f (x1 ) f (x2 ) − f (x) ≤ 1−λ λ und weiter f (x) ≤ λ · f (x1 ) + (1 − λ) · f (x2 ) folgt. Definition 23. A ⊆ R heißt Nullmenge, falls f¨ ur alle ε > 0 eine Folge (]an , bn [)n beschr¨ankter offener Intervalle existiert, so daß A⊆

[ n∈N

]an , bn [ ∧

∞ X n=1

(bn − an ) ≤ ε.

IV.2. Der Mittelwertsatz der Differentialrechnung

92

Lemma 24. (i) Teilmengen von Nullmengen sind Nullmengen. (ii) Abz¨ahlbare Vereinigungen von Nullmengen sind Nullmengen. Insbesondere sind abz¨ahlbare Mengen Nullmengen. Beweis. ad (i): klar. ad (ii): Betrachte eine Folge (Ak )k von Nullmengen, und w¨ahle S ε > 0. Nach Voraussetzung existieren Folgen (]an,k , bn,k [)n mit Ak ⊆ n∈N ]an,k , bn,k [ P∞ und n=1 (bn,k − an,k ) ≤ ε/2k . Wende Satz II.3.13.(ii) (Vereinigung abz¨ahlbarer Mengen) und Beispiel II.7.3 an. Bemerkung 25. Es existieren u ¨berabz¨ahlbare Nullmengen, siehe Tutorium (GdM II). Ausblick 26. Seien D ein Intervall und f monoton. Dann ist die Menge aller x ∈ D, f¨ ur die f nicht differenzierbar in x ist, eine Nullmenge. Siehe [A, Satz 4.17].

Die Regeln von de l’Hospital Satz 27 (2. Mittelwertsatz der Differentialrechnung). Seien f, g : [a, b] → R stetig und in ]a, b[ differenzierbar. Dann existiert ξ ∈ ]a, b[ mit (f (b) − f (a)) · g 0 (ξ) = (g(b) − g(a)) · f 0 (ξ). Beweis. Wende Satz 7 auf h(x) = (f (b) − f (a)) · g(x) − (g(b) − g(a)) · f (x),

x ∈ [a, b],

an. Satz 28 (Regeln von de l’Hospital). Seien f, g : ]a, ∞[ → R differenzierbar, und gelte g 0 (x) 6= 0 f¨ ur alle x ∈ ]a, ∞[. Ferner gelte (i) limx→∞ f (x) = limx→∞ g(x) = 0 oder (ii) g ist bestimmt divergent f¨ ur x → ∞, und f 0 /g 0 besitze einen Grenzwert oder sei bestimmt divergent f¨ ur x → ∞. Dann besitzt f /g die entsprechende Eigenschaft mit f (x) f 0 (x) = lim 0 . x→∞ g(x) x→∞ g (x) lim

Beweis. Setze D = ]a, ∞[. Nach Voraussetzung existiert f¨ ur jedes b ∈ R und jedes x ∈ D ein y > x mit g(y) 6= b. Insbesondere ist D0 = {x ∈ D : g(x) 6= 0} unbeschr¨ankt. Wir betrachten den Fall, daß f 0 /g 0 einen Grenzwert f¨ ur x → ∞ besitzt, und setzen 0 0 c = limx→∞ f (x)/g (x). Sei ε > 0. W¨ahle a0 > a, so daß 0 f (x) ∀ x ∈ ]a0 , ∞[ : 0 − c ≤ ε. g (x)

IV.2. Der Mittelwertsatz der Differentialrechnung

93

Sei (xn )n eine Folge in D0 mit limn xn = ∞. Gelte (i). F¨ ur n ∈ N sei (yn,m )m eine Folge in ]xn , ∞[ mit limm yn,m = ∞ und g(yn,m ) 6= g(xn ) f¨ ur alle m ∈ N. Dann f (yn,m ) − f (xn ) f (xn ) = lim . m g(xn ) g(yn,m ) − g(xn ) Gem¨aß Satz 27 existiert f¨ ur alle n, m ∈ N ein ξn,m ∈ ]xn , yn,m [ mit f (yn,m ) − f (xn ) f 0 (ξn,m ) = 0 . g(yn,m ) − g(xn ) g (ξn,m ) F¨ ur alle n ∈ N mit xn > a0 folgt f (xn ) ≤ ε. − c g(xn ) Dies zeigt limn f (xn )/g(xn ) = c. Gelte (ii). Dann existiert n0 ∈ N mit g(xn ) 6= g(a0 ) f¨ ur alle n ≥ n0 . F¨ ur n ≥ n0 gilt weiter   f (xn ) f (xn ) − f (a0 ) g(a0 ) f (a0 ) = · 1− . + g(xn ) g(xn ) − g(a0 ) g(xn ) g(xn ) Mit Satz 27 folgt wie im Fall (i) lim n

f (xn ) − f (a0 ) = c. g(xn ) − g(a0 )

Da limn 1/g(xn ) = 0, ergibt sich hieraus limn f (xn )/g(xn ) = c. Falls f 0 /g 0 f¨ ur x → ∞ bestimmt divergent ist, schließt man ebenso. Weitere Varianten von Satz 28 finden sich in [Fo1, §16]. Beispiel 29. Seien α > 0 und D = ]0, ∞[. Betrachte h(x) = ln(x)/xα f¨ ur x ∈ D. Frage: Besitzt h einen Grenzwert f¨ ur x → ∞? Setze f (x) = ln(x) und g(x) = xα f¨ ur x ∈ D. Es gilt limx→∞ f (x) = ∞. Da xα = exp(α · ln(x)) ≥ 1 + α · ln(x) f¨ ur alle x ∈ D infolge von Satz 7, gilt auch limx→∞ g(x) = 0 ∞. Ferner gilt f (x) = 1/x und g 0 (x) = α · xα−1 , also 1 f 0 (x) = . 0 g (x) α · xα Mit Satz 28 ergibt sich limx→∞ h(x) = 0, d.h. ∀ α > 0 ∀ε > 0 ∃ x0 ≥ 1 ∀x > x0 : 0 < ln(x) < ε · xα . Literatur. [Fo1, §16].

Kapitel V Integrierbare Funktionen in einer Variablen In diesem Kapitel fassen wir die Begriffe des Mittelwertes einer Funktion und des Fl¨acheninhaltes gewisser Teilmengen des R2 . Damit eng verbunden ist die Frage, ob und ggf. wie sich eine Funktion aus ihrer Ableitung rekonstruieren l¨aßt.

1

Das Riemann-Integral

Im Folgenden seien a, b ∈ R mit a < b. Mit B([a, b]), C([a, b]) und T ([a, b]) bezeichnen wir die Mengen der beschr¨ankten Funktionen, der stetigen Funktionen bzw. der Treppenfunktionen von [a, b] nach R.

Integration von Treppenfunktionen Satz 1. F¨ ur f, g ∈ T ([a, b]) und λ ∈ R gilt (i) f + g ∈ T ([a, b]), (ii) λ · f ∈ T ([a, b]). Beweis. ad (i): Seien (x0 , . . . , xn ) und (x00 , . . . , x0n0 ) Zerlegungen von [a, b], so daß die Funktionen f |]xk−1 ,xk [ f¨ ur alle k ∈ {1, . . . , n} konstant und g|]x0 0 ,x0 0 [ f¨ ur alle k 0 ∈ k −1

k

{1, . . . , n0 } konstant sind. Es existiert (genau) eine Zerlegung (z0 , . . . , zm ) von [a, b] mit {z0 , . . . , zm } = {x0 , . . . , xn } ∪ {x00 , . . . , x0n0 }. (1) Sei ` ∈ {1, . . . , m}. Dann existieren (genau ein) k ∈ {1, . . . , n} und (genau ein) k 0 ∈ {1, . . . , n0 }, so daß   ]z`−1 , z` [ ⊆ ]xk−1 , xk [ ∩ x0k0 −1 , x0k0 . Folglich sind f |]zl−1 ,zl [ und g|]zl−1 ,zl [ und somit auch (f + g)|]zl−1 ,zl [ konstant. ad (ii): Klar. 94

V.1. Das Riemann-Integral

95

Lemma 2. F¨ ur f ∈ T ([a, b]) seien (x0 , . . . , xn ) und (x00 , . . . , x0n0 ) Zerlegungen von [a, b] und c1 , . . . , cn , c01 . . . , c0n0 ∈ R mit ∀ k ∈ {1, . . . , n} : f |]xk−1 ,xk [ = ck

(2)

und ∀ k 0 ∈ {1, . . . , n0 } : f |]x0 0

k −1

,x0k0 [

= c0k0 .

Dann gilt n X

0

n X

ck · (xk − xk−1 ) =

 c0k0 · x0k0 − x0k0 −1 .

k0 =1

k=1

Beweis. Im Spezialfall {x0 , . . . , xn } ⊆ {x00 . . . , x0n0 } existieren 0 = k00 < · · · < kn0 = n0 , so daß xk = x0k0 f¨ ur k ∈ {0, . . . , n}. Es folgt k

n X

ck · (xk − xk−1 ) =

k=1

=

n X

0

kk X

ck

(x0` − x0`−1 )

k=1

0 `=kk−1 +1

n X

kk X

0

0

c0`

·

(x0`



x0`−1 )

=

n X

c0k0 · (x0k0 − x0k0 −1 ).

k0 =1

0 k=1 `=kk−1 +1

Im allgemeinen Fall betrachtet man die Zerlegung (z0 , . . . , zm ) von [a, b] mit (1) und wendet zweimal den Spezialfall an. P Definition 3. F¨ ur f ∈ T ([a, b]) mit (2) heißt nk=1 ck · (xk − xk−1 ) das Integral von f . Rb P Notation: a f (x) dx = nk=1 ck · (xk − xk−1 ). Notation: F¨ ur f, g : X → R heißt f ≤ g, daß f (x) ≤ g(x) f¨ ur alle x ∈ X gilt. Ferner steht f ≥ g f¨ ur g ≤ f . Satz 4 (Linearit¨at und Monotonie). F¨ ur f, g ∈ T ([a, b]) und λ ∈ R gilt Rb Rb Rb (i) a (f + g)(x) dx = a f (x) dx + a g(x) dx, Rb Rb (ii) a (λ · f )(x) dx = λ · a f (x) dx, Rb Rb (iii) f ≤ g ⇒ a f (x) dx ≤ a g(x) dx. Beweis. ad (i): W¨ahle eine Zerlegung (x0 , . . . , xn ) von [a, b] und c1 , . . . , cn , d1 , . . . , dn ∈ R mit  ∀ k ∈ {1, . . . , n} : f |]xk−1 ,xk [ = ck ∧ g|]xk−1 ,xk [ = dk , vgl. Beweis Satz 1. Dann Z b n X (f + g)(x)dx = (ck + dk ) · (xk − xk−1 ) a

k=1

=

n X

ck · (xk − xk−1 ) +

k=1 Z b

=

k=1

Z f (x) dx +

a

n X

b

g(x) dx. a

Die Aussagen (ii) und (iii) lassen sich ebenso beweisen.

dk · (xk − xk−1 )

V.1. Das Riemann-Integral

96

Riemann-Integrierbarkeit Bemerkung 5. Sei f ∈ B([a, b]). Dann existieren τ, σ ∈ ur R bT ([a, b]) mitRτb ≤ f ≤ σ. F¨ ϕ, ψ ∈ T ([a, b]) mit ϕ ≤ f ≤ ψ zeigt Satz 4.(iii), daß a ϕ(x) dx ≤ a σ(x) dx sowie Rb Rb ψ(x) dx ≥ τ (x) dx. Beachte Satz III.1.18 und Korollar III.1.23 (Supremum und a a Infimum) mit Blick auf die folgende Definition. Definition 6. Sei f ∈ B([a, b]). Dann heißen Z b  Z b∗ f (x) dx = inf ψ(x) dx : ψ ∈ T ([a, b]), ψ ≥ f a

und Z

a

b

b

Z

 ϕ(x) dx : ϕ ∈ T ([a, b]), ϕ ≤ f

f (x) dx = sup a∗

a

das Ober - bzw. Unterintegral von f . Bemerkung 7. Aus Bemerkung 5 folgt Rb

a∗

f (x) dx ≤

R b∗

f (x) dx f¨ ur alle f ∈ B([a, b]), Rb R b∗ Rb (ii) a∗ f (x) dx = a f (x) dx = a f (x) dx f¨ ur alle f ∈ T ([a, b]). (i)

a

Definition 8. f ∈ B ([a, b]) heißt (Riemann-)integrierbar , falls Z

b

Z a

a∗

In diesem Fall heißt

Rb a∗

b∗

f (x) dx.

f (x) dx =

f (x) dx das Riemann-Integral von f .

Notation: R ([a, b])Rbezeichnet die R b Menge der Riemann-integrierbaren Funktionen von b [a, b] nach R, und a f (x) dx = a∗ f (x) dx f¨ ur f ∈ R([a, b]). R b∗ Rb Beispiel 9. F¨ ur f = 1[a,b]∩Q gilt a f (x) dx = (b − a) und a∗ f (x) dx = 0. Es folgt 1[a,b]∩Q ∈ B([a, b]) \ R ([a, b]). Satz 10 (Integrabilit¨atskriterium). F¨ ur f : [a, b] → R sind ¨aquivalent (i) f ∈ R ([a, b]), (ii) f¨ ur alle ε > 0 existieren ϕ, ψ ∈ T ([a, b]) mit b

Z ϕ≤f ≤ψ∧

Z ψ(x) dx −

a

Ggf. gilt

Rb a

f (x) dx ∈

Beweis. Klar.

R b a

ψ(x) dx − ε,

ϕ(x) dx < ε. a

Rb a

 ψ(x) dx .

b

(3)

V.1. Das Riemann-Integral

97

Korollar 11. F¨ ur f ∈ B([a, b]) seien (ϕn )n und (ψn )n Folgen in T ([a, b]) mit ∀ n ∈ N : ϕn ≤ f ≤ ψn und

b

Z

(ψn − ϕn )(x) dx = 0.

lim Dann folgt f ∈ R([a, b]), und

n

a

R b

 ψn (x) dx ist konvergent mit

a

b

Z lim n

n

Z ψn (x) dx =

b

f (x) dx.

a

(4)

a

Beweis. f ∈ R([a, b]) folgt mit den S¨atzen 4 und 10, und es gilt Z b Z b Z b Z b 0≤ ψn (x) dx − f (x) dx ≤ ψn (x) dx − ϕn (x) dx, a

a

a

a

woraus (4) folgt. Beispiel 12. Sei f (x) = x f¨ ur x ∈ [a, b]. F¨ ur n ∈ N und k ∈ {0, . . . , n} sei xk,n = a + k · Setze ϕn =

n X

b−a . n

(5)

f (xk−1,n ) · 1[xk−1,n ,xk,n [ + f (b) · 1{b}

k=1

und ψn =

n X

f (xk,n ) · 1[xk−1,n ,xk,n [ + f (b) · 1{b} .

k=1

Dann gilt ϕn ≤ f ≤ ψn und ϕn , ψn ∈ T ([a, b]). Ferner b

Z

(ψn − ϕn )(x) dx = a

n X

(f (xk,n ) − f (xk−1,n )) ·

k=1

=

b−a n

(f (b) − f (a)) · (b − a) . n

Mit Korollar 11 folgt f ∈ R([a, b]). Weiter gilt Z a

woraus

Rb a

b

 n  b−a X b−a ψn (x) dx = · a+k· n n k=1   b−a b − a n · (n + 1) = · n·a+ · n n 2 2 (b − a) n + 1 = (b − a) · a + · , 2 n

x dx = (b2 − a2 )/2 folgt, siehe Korollar 11.

V.1. Das Riemann-Integral

98

Satz 13. Jede monotone Funktion f : [a, b] → R ist integrierbar. Beweis. Wie im ersten Teil von Beispiel 12. Satz 14. Jede stetige Funktion f : [a, b] → R ist integrierbar. Beweis. Sei ε > 0. Gem¨aß Satz III.3.13 (Approximation durch Treppenfunktionen) existieren ϕ, ψ ∈ T ([a, b]) mit ϕ ≤ f ≤ ψ und ψ(x) − ϕ(x) < ε f¨ ur alle x ∈ [a, b]. Satz 4 zeigt Z b Z b Z b Z b ψ(x) dx − ϕ(x) dx = (ψ − ϕ)(x) dx ≤ ε dx = ε · (b − a). a

a

a

a

Wende Satz 10 an. Ausblick 15. Das Lebesguesche Integrabilit¨atskriterium, siehe [H1, §84]: F¨ ur f : [a, b] → R sind ¨aquivalent (i) f ∈ R ([a, b]), (ii) f ∈ B ([a, b]) und {x ∈ [a, b] : f unstetig in x} ist eine Nullmenge.

Eigenschaften des Riemann-Integrals Satz 16 (Linearit¨at und Monotonie). F¨ ur f, g ∈ R ([a, b]) und λ ∈ R gilt f + g, λ · f ∈ R([a, b]) sowie Rb Rb Rb (i) a (f + g)(x) dx = a f (x) dx + a g(x) dx, Rb Rb (ii) a (λ · f )(x) dx = λ · a f (x) dx, Rb Rb (iii) f ≤ g ⇒ a f (x) dx ≤ a g(x) dx. Beweis. ad (i): Sei ε > 0. Gem¨aß Satz 10 existieren ϕ1 , ϕ2 , ψ1 , ψ2 ∈ T ([a, b]) mit ϕ1 ≤ f ≤ ψ1 und ϕ2 ≤ g ≤ ψ2 sowie Z b Z b ψi (x) dx − ϕi (x) dx < ε, i = 1, 2. a

a

Es gilt ϕ1 + ϕ2 ≤ f + g ≤ ψ1 + ψ2 , und Satz 1.(i) sichert ϕ1 + ϕ2 , ψ1 + ψ2 ∈ T ([a, b]). Schließlich gilt gem¨aß Satz 4 Z b Z b (ψ1 + ψ2 )(x) dx − (ϕ1 + ϕ2 )(x) dx a a Z b Z b Z b Z b = ψ1 (x) dx − ϕ1 (x) dx + ψ2 (x) dx − ϕ2 (x) dx ≤ 2ε. a

Wende Satz 10 an. ad (ii): Analog. ad (iii): Klar.

a

a

a

V.1. Das Riemann-Integral

99

Definition 17. F¨ ur f : X → R heißen f+ , f− : X → R, definiert durch f− (x) = − min(f (x), 0),

f+ (x) = max(f (x), 0), Positiv- bzw. Negativteil von f .

Bemerkung 18. Es gilt f = f+ − f− und |f | = f+ + f− . Satz 19. F¨ ur f, g ∈ R ([a, b]) und p ≥ 1 gilt R R b b (i) f+ , f− , |f | ∈ R([a, b]) und a f (x) dx ≤ a |f (x)| dx, (ii) |f |p ∈ R([a, b]), (iii) f · g ∈ R([a, b]). Beweis. ad (i): Sei ε > 0. Gem¨aß Satz 10 existieren ϕ, ψ ∈ T ([a, b]) mit (3). Insbesondere gilt ϕ+ , ϕ− , ψ+ , ψ− ∈ T ([a, b]) sowie ϕ+ ≤ f+ ≤ ψ+ und ϕ− ≥ f− ≥ ψ− . Mit Satz 4 folgt Z b Z b ψ+ (x) dx − ϕ+ (x) dx a a Z b Z b Z b Z b = ψ(x) dx − ϕ(x) dx + ψ− (x) dx − ϕ− (x) dx a a a a Z b Z b ϕ(x) dx < ε. ψ(x) dx − ≤ a

a

Satz 10 zeigt f+ ∈ R([a, b]), und mit Satz 16 folgt f− , |f | ∈ R([a, b]). Weiter zeigt Rb R b Satz 16 a f (x) dx ≤ a |f (x)| dx, da f ≤ |f | und −f ≤ |f |. ad (ii): Wir k¨onnen ohne Einschr¨ankung 0 ≤ f ≤ 1 voraussetzen. Sei ε > 0. Gem¨aß Satz 10 existiere ϕ, ψ ∈ T ([a, b]) mit (3) sowie 0 ≤ ϕ ≤ ψ ≤ 1. Es folgt ϕp , ψ p ∈ T ([a, b]) und ϕp ≤ f p ≤ ψ p , und Satz IV.2.7 (Mittelwertsatz der Differentialrechnung) zeigt ψ p − ϕp ≤ p · (ψ − ϕ). Verwende die S¨atze 4 und 10. ad (iii): Verwende (ii), Satz 16 und f ·g =

1 4

 (f + g)2 − (f − g)2 .

Integration auf Teilintervallen Satz 20. Seien f : [a, b] → R und c ∈ ]a, b[. Genau dann gilt f ∈ R([a, b]), wenn f |[a,c] ∈ R([a, c]) und f |[c,b] ∈ R([c, b]), und ggf. gilt Z b Z c Z b f (x) dx = f (x) dx + f (x) dx. a

a

c

Beweis. F¨ ur f ∈ T ([a, b]) ist die Aussage klar; im allgemeinen Fall wende man Satz 10 und Korollar 11 an.

V.1. Das Riemann-Integral

100

Der Mittelwertsatz der Integralrechnung Im Folgenden sei g : [a, b] → [0, ∞[ integrierbar mit

Rb a

g(x) dx > 0. Setze

b

Z

g(x) dx.

cg = a

Definition 21. F¨ ur f ∈ R([a, b]) heißt 1/cg · von f (bzgl. g). Notation: Mg (f ).

Rb a

f (x)·g(x) dx der gewichtete Mittelwert

Satz 22 (Mittelwertsatz der Integralrechnung). F¨ ur alle f ∈ C([a, b]) existiert ξ ∈ [a, b] mit Mg (f ) = f (ξ). Beweis. Die S¨atze 14 und 19 sichern f · g ∈ R([a, b]). Setze m = inf{f (x) : x ∈ [a, b]} und M = sup{f (x) : x ∈ [a, b]}. Es folgt m · g ≤ f · g ≤ M · g und weiter mit Satz 16 Z m · cg =

b

Z

b

m · g(x) dx ≤ a

Z f (x) · g(x) dx ≤

a

b

M · g(x) dx = M · cg . a

Dies zeigt Mg (f ) ∈ [m, M ], und Satz III.3.1 (Zwischenwertsatz) und Korollar III.3.5 (Extremalsatz) sichern die Existenz von ξ ∈ [a, b] mit f (ξ) = Mg (f ).

Riemann-Summen Definition 23. Sei f : [a, b] → R, sei X = (x0 , . . . , xn ) eine Zerlegung von [a, b] und sei Ξ = (ξ1 , . . . , ξn ) ∈ Rn . (i) µ(X) = maxk∈{1,...,n} (xk − xk−1 ) heißt Feinheit von X. (ii) Ξ heißt Zwischenpunktsystem zur Zerlegung X, falls ξk ∈ [xk−1 , xk ] f¨ ur alle k ∈ {1, . . . , n} gilt, (iii) Sei Ξ ein Zwischenpunktsystem zur Zerlegung X. Dann heißt S(X, Ξ, f ) =

n X

f (ξk ) · (xk − xk−1 )

k=1

Riemann-Summe von f zur Zerlegung X mit dem Zwischenpunktsystem Ξ. Satz 24. F¨ ur alle f ∈ R([a, b]) und ε > 0 existiert ein δ > 0, so daß f¨ ur alle Zerlegungen X von [a, b] und alle zugeh¨origen Zwischenpunktsysteme Ξ gilt Z b µ(X) ≤ δ ⇒ f (x) dx − S(X, Ξ, f ) ≤ ε. a

V.1. Das Riemann-Integral

101

Beweis. Wir betrachten den Spezialfall f ∈ T ([a, b]). Sei (z0 , . . . , zm ) eine Zerlegung von [a, b], so daß f |]z`−1 ,z` [ konstant f¨ ur alle ` ∈ {1, . . . , m} ist. Seien X und Ξ wie oben. Dann Z b n Z xk n Z xk X X f (x) dx, S(X, Ξ, f ) = f (ξk ) dx. f (x) dx = a

k=1

xk−1

k=1

xk−1

Ferner  k ∈ {1, . . . , n} : f |[x ,x ] nicht konstant k−1 k ≤ |{k ∈ {1, . . . , n} : [xk−1 , xk ] ∩ {z0 , . . . , zm } = 6 ∅}| ≤ 2m. Setze M = sup{|f (x)| : x ∈ [a, b]}. Dann gilt |f (x) − f (y)| ≤ 2M f¨ ur alle x, y ∈ [a, b] und Z b f (x) dx − S(X, Ξ, f ) ≤ 2m · 2M · µ(X). a

Zu f 6= 0 und ε > 0 leistet δ = ε/(4mM ) das Verlangte, w¨ahrend die Aussage trivialerweise f¨ ur f = 0 gilt. Betrachte den allgemeinen Fall. Sei ε > 0. W¨ahle ϕ, ψ ∈ T ([a, b]) mit (3) sowie δ > 0, so daß Z b   Z b ϕ(x) dx − S(X, Ξ, ϕ) , ψ(x) dx − S(X, Ξ, ψ) ≤ ε. µ(X) ≤ δ ⇒ max a

a

Falls µ(X) ≤ δ, folgt Z b Z b f (x) dx − S(X, Ξ, f ) ≤ ψ(x) dx − S(X, Ξ, ϕ) a a Z b Z b Z b = ϕ(x) dx − S(X, Ξ, ϕ) + ψ(x) dx − ϕ(x) dx a

a

a

≤ 2ε. Ebenso ergibt sich S(X, Ξ, f ) −

Rb a

f (x) dx ≤ 2ε.

Bemerkung 25. Als Umkehrung von Satz 24 gilt: Ist f ∈ B([a, b]), und konvergiert (S(Xn , Ξn , f ))n f¨ ur jede Folge von Zerlegungen Xn mit limn µ(Xn ) = 0 und jede Folge zugeh¨origer Zwischenpunktsysteme Ξn , so folgt f ∈ R([a, b]). Siehe [H1, Kap. X]. Beispiel 26. Sei f ∈ C([a, b]) differenzierbar in ]a, b[, und sei c ≥ 0 mit |f 0 (x)| ≤ c f¨ ur alle x ∈ ]a, b[. Satz 14 sichert f ∈ R([a, b]). F¨ ur xk,n gem¨aß (5) sei ξk,n =

1 2

· (xk−1,n + xk,n )

f¨ ur k ∈ {1, . . . , n}. Dann heißt n n Z xk,n X b−a X S(Xn , Ξn , f ) = · f (ξk,n ) = f (ξk,n ) dx n x k−1,n k=1 k=1

V.2. Integration und Differentiation

102

Mittelpunktregel zur Zerlegung Xn = (x0,n , . . . , xn,n ). Gem¨aß Satz IV.2.7 (Mittelwertsatz der Differentialrechnung) gilt |f (x) − f (ξk,n )| ≤ c · |x − ξk,n | . Es folgt X Z b n Z f (x) dx − S(Xn , Ξn , f ) ≤ a

|f (x) − f (ξk,n )| dx

xk−1,n

k=1

≤c·

xk,n

n Z X k=1

Mit Beispiel 12 ergibt sich Z xk,n Z |x − ξk,n | dx = xk−1,n

xk,n

|x − ξk,n | dx.

xk−1,n

ξk,n

Z

xk−1,n

=

1 2

xk,n

(ξk,n − x) dx +

(x − ξk,n ) dx ξk,n

 (b − a)2 2 . x2k,n − 2ξk,n + x2k−1,n = 4n2

Fazit: f¨ ur den Fehler der Mittelpunktregel gilt Z b c · (b − a)2 ≤ f (x) dx − S(X , Ξ , f ) . n n 4n a

Definition 27. F¨ ur f ∈ R([a, b]) mit f ≥ 0 ist der Fl¨acheninhalt der Menge {(x, y) ∈ [a, b] × R : 0 ≤ y ≤ f (x)} definiert als

Rb a

f (x) dx.

Literatur. [Fo1, §18] und [H1, Kap. X].

2

Integration und Differentiation

Im Folgenden sei D ⊆ R ein Intervall mit mehr als einem Element. Ferner seien f, F : D → R und a, b ∈ D mit a < b. Sprechweise: f integrierbar auf [a, b], falls f |[a,b] ∈ R([a, b]). Notation: Falls f integrierbar auf [a, b], sei Z

a

Z f (x) dx = −

b

Ferner sei

Ra a

b

f (x) dx. a

f (x) dx = 0.

Bemerkung 1. Satz 1.20 (Integration auf Teilintervallen) gilt f¨ ur alle a, b, c ∈ D, falls f auf [min(a, b, c), max(a, b, c)] integrierbar ist.

V.2. Integration und Differentiation

103

Stammfunktionen Definition 2. F heißt Stammfunktion (unbestimmtes Integral ) von f , falls F differenzierbar ist mit F 0 = f . Beispiel 3. Sei D = ]0, ∞[. (i) Seien α ∈ R \ {−1} und f (x) = xα f¨ ur x ∈ D. Dann definiert F (x) = 1/(α + 1) · xα+1 eine Stammfunktion von f . (ii) Sei f (x) = x−1 f¨ ur x ∈ D. Dann definiert F (x) = ln(x) eine Stammfunktion von f . (iii) Sei f = 1[1,∞[ . Annahme: F ist eine Stammfunktion von f . Satz IV.2.7 (Mittelwertsatz der Differentialrechnung) und Korollar IV.1.11 (Differenzierbarkeit und Stetigkeit) zeigen die Existenz von c ∈ R mit ( c, falls 0 < x < 1, F (x) = x + c − 1, falls x ≥ 1, f¨ ur alle x ∈ R. Widerspruch, da F nicht differenzierbar in x = 1. Somit besitzt f keine Stammfunktion. Satz 4. Sei F eine Stammfunktion von f , und sei G : D → R. Dann sind ¨aquivalent (i) G ist eine Stammfunktion von f , (ii) G − F ist konstant. Beweis. (ii) ⇒ (i)“ klar. (i) ⇒ (ii)“ Es gilt (G − F )0 = 0. Wende Korollar IV.2.9 ” ” (zum Mittelwertsatz der Differentialrechnung) an.

Haupts¨ atze Satz 5 (1. Hauptsatz der Differential- und Integralrechnung). Sei f integrierbar auf [a, b]. Ferner besitze f eine Stammfunktion F . Dann gilt Z b f (x) dx = F (b) − F (a). a

Beweis. W¨ahle xk,n gem¨aß (1.5). F¨ ur k ∈ {1, . . . , n} existieren ξk,n ∈ ]xk−1,n , xk,n [ mit f (ξk,n ) =

F (xk,n ) − F (xk−1,n ) , xk,n − xk−1,n

siehe Satz IV.2.7 (Mittelwertsatz der Differentialrechnung). F¨ ur Xn = (x0,n , . . . , xn,n ) und Ξn = (ξ1,n , . . . , ξn,n ) gilt S(Xn , Ξn , f ) = F (b) − F (a). Wende Satz 1.24 (Riemann-Summen) an.

V.2. Integration und Differentiation

104

Bemerkung 6. (i) Es existieren Funktionen, die integrierbar sind, aber keine Stammfunktion besitzen. Vgl. Beispiel 3.(iii). (ii) Es existieren Funktionen, die nicht integrierbar sind, aber eine Stammfunktion besitzen. Siehe Tutorium 9.1. Satz 7 (2. Hauptsatz der Differential- und Integralrechnung). Sei f stetig. F¨ ur a ∈ D sei Fa : D → R definiert durch Z x f (t) dt. (1) Fa (x) = a

Dann ist Fa eine Stammfunktion von f . Beweis. Beachte Bemerkung III.2.3.(ii) und Satz 1.14 (Integrierbarkeit und Stetigkeit). F¨ ur x, y ∈ D mit x 6= y existiert ξ ∈ [min(x, y), max(x, y)] mit Z y Fa (y) − Fa (x) 1 = · f (t) dt = f (ξ) y−x y−x x siehe Satz 1.22 (Mittelwertsatz der Integralrechnung). Es folgt die Differenzierbarkeit von Fa in x mit Fa0 (x) = f (x). Bemerkung 8. Sei f ∈ R([a, b]). Falls f stetig in x ∈ [a, b], ist Fa : [a, b] → R, gegeben durch (1), differenzierbar in x mit Fa0 (x) = f (x). Gem¨aß Ausblick 1.15 ist die Menge der Punkte x ∈ [a, b], in denen Fa nicht differenzierbar ist oder Fa0 (x) 6= f (x) gilt, eine Nullmenge. Korollar 9. Sei f stetig. Dann besitzt f eine Stammfunktion, und f¨ ur jede Stammfunktion F von f gilt Z b f (x) dx = F (b) − F (a). a

Bemerkung 10. Im Sinn der S¨atze 5 und 7 ist die Integration die Umkehrung der Differentiation. Genauer ist {F ∈ C 1 (D) : F (a) = 0} → C(D) : F 7→ F 0 R· eine Bijektion mit Umkehrabbildung1 f 7→ a f (t) dt. Beispiel 11. Sei f (x) = 1/x f¨ ur x ∈ R \ {0}. Als stetige Funktion ist f auf jedem Intervall [a, b] ⊆ R \ {0} integrierbar. F¨ ur 0 < a < b gilt Z b 1/x dx = ln(b) − ln(a), a

siehe Beispiel 3.(ii) und Korollar 9. F¨ ur a < b < 0 gilt Z b 1/x dx = ln(−b) − ln(−a), a 1

Hier wird f eine Funktion zugeordnet; deren Argument wird durch · angedeutet.

V.2. Integration und Differentiation

105

wie aus Korollar 9 und F 0 (x) = 1/x f¨ ur F (x) = ln(−x) mit x < 0 folgt. Betrachte die alternierende harmonische Reihe. Per Induktion zeigt man 2n n X X k−1 (−1) /k = 1/(n + k) k=1

k=1

f¨ ur alle n ∈ N. Mit xk,n = 1 + k/n f¨ ur k ∈ {0, . . . , n} und ξk,n = xk,n f¨ ur k ∈ {1, . . . , n} ergibt sich n n X X 1/(n + k) = 1/ξk,n · (xk,n − xk−1,n ). k=1

k=1

Satz 1.24 (Riemann-Summen) zeigt Z 2n X k−1 lim (−1) /k =

n→∞

k=1

2

1/x dx = ln(2).

1

Die Substitutionsregel Im Folgenden seien D ⊆ R ein Intervall mit mehr als einem Element sowie a, b ∈ R mit a < b. Satz 12 (Substitutionsregel). Seien f ∈ C(D) und ϕ ∈ C 1 ([a, b]) mit ϕ([a, b]) ⊆ D. Dann gilt Z b Z ϕ(b) 0 f (ϕ(x)) · ϕ (x) dx = f (x) dx. a

ϕ(a)

Beweis. Sei F eine Stammfunktion von f , siehe Satz 7. Dann gilt (F ◦ ϕ)0 = f ◦ ϕ · ϕ0 , und Korollar 9 zeigt Z b Z ϕ(b) 0 f (ϕ(x)) · ϕ (x) dx = F (ϕ(b)) − F (ϕ(a)) = f (x) dx. a

ϕ(a)

Beispiel 13. (i) Sei ϕ ∈ C 1 ([a, b]) nicht konstant, und gelte ϕ(x) 6= 0 f¨ ur alle x ∈ [a, b]. Da 0 0 ϕ /ϕ ∈ C([a, b]), folgt ϕ /ϕ ∈ R([a, b]). Ferner ist D = ϕ([a, b]) ein Intervall mit mehr als einem Element. Beachte 0 6∈ D, und setze f (y) = 1/y f¨ ur y ∈ D. Mit Satz 12 und Beispiel 11 folgt Z b 0 Z ϕ(b) ϕ (x) dx = 1/x dx = ln (|ϕ(b)|) − ln (|ϕ(a)|) . a ϕ(x) ϕ(a) (ii) Speziell f¨ ur [a, b] ⊆ ]−π/2, π/2[ und ϕ(x) = cos(x) ergibt sich ϕ0 /ϕ = − tan und weiter Z b Z b 0 ϕ (x) tan(x) dx = − dx = ln (cos(a)) − ln (cos(b)) . a a ϕ(x) Notation: Man setzt F (x)|ba = F (b) − F (a).

V.3. Uneigentliche Integrale

106

Die partielle Integration Satz 14 (Partielle Integration). Seien f, g ∈ C 1 ([a, b]). Dann gilt Z b Z b 0 b f (x) · g (x) dx = (f · g)(x)|a − f 0 (x) · g(x) dx. a

a

Beweis. Korollar 9 zeigt Z b Z b 0 f 0 (x) · g(x) dx = (f · g)(x)|ba . f (x) · g (x) dx + a

a

Beispiel 15. Satz 14, angewandt mit f (x) = cos(x) und g(x) = sin(x), zeigt Z b Z b 2 b cos (x) dx = (cos · sin)(x)|a + sin2 (x) dx. a

a

Es folgt Z

b

cos2 (x) dx =

a

1 2

 · (cos · sin)(x)|ba + x|ba .

√ Beispiel 16. Seien D = [−1, 1] und f (x) = 1 − x2 f¨ ur x ∈ D. Als stetige Funktion ist f auf jedem Intervall [u, v] ⊆ D integrierbar. Setze a = arcsin(u) und b = arcsin(v) sowie ϕ(x) = sin(x) f¨ ur x ∈ [a, b] ⊆ [−π/2, π/2]. Dann gilt ϕ([a, b]) ⊆ D und Z v Z b  f (x) dx = cos2 (x) dx = 12 · (cos · sin)(x)|ba + x|ba , u

a

p siehe Satz 12 und Beispiel 15. Ferner gilt cos(arcsin(y)) = 1 − y 2 f¨ ur y ∈ D, siehe Beispiel IV.1.19.(iii). Fazit: Z v√ p  1 − x2 dx = 12 · ( 1 − y 2 · y)|vu + arcsin(y)|vu . u

Insbesondere Z

1



1 − x2 dx =

−1

1 2

· arcsin(y)|1−1 = π/2.

Literatur. [Fo1, §19] und [H1, Kap. X].

3

Uneigentliche Integrale

Uneigentliche Integrale auf kompakten Intervallen Im Folgenden seien a, b ∈ R mit a < b sowie f : ]a, b] → R, so daß f f¨ ur alle x ∈ ]a, b[ integrierbar auf [x, b] ist. Definiere F : ]a, b[ → R durch Z b F (x) = f (t) dt. x

V.3. Uneigentliche Integrale

107

Definition 1. RFalls F einen Grenzwert in a besitzt, heißt f uneigentlich integrierbar . b Notation: ggf. a f (t) dt = limx→a F (x). Bemerkung 2. (i) f ist genau dann uneigentlich integrierbar, wenn f¨ ur jede Folge (xn )n in ]a, b[ mit limn xn = a die Folge (F (xn ))n eine Cauchy-Folge ist. (ii) Sei f zus¨atzlich beschr¨ankt. Dann ist f uneigentlich integrierbar. F¨ ur M = sup {|f (x)| : x ∈ ]a, b]} und x, y ∈ ]a, b[ gilt n¨amlich Z max(x,y) |f (t)| dt ≤ |x − y| · M. |F (x) − F (y)| ≤ min(x,y)

Rb Rb Im Fall g ∈ R([a, b]) mit f = g|]a,b] gilt u ¨berdies a f (t) dt = a g(t) dt. In der Tat liegt diese Situation f¨ ur jede beschr¨ankte Funktion f vor, wie mit Ausblick 1.15 folgt. (iii) Falls zus¨atzlich f ≥ 0 oder f ≤ 0 gilt, ist f genau dann uneigentlich integrierbar, wenn F beschr¨ankt ist. Beispiel 3. Seien a = 0, b = 1 und α > 0, und sei f (x) = x−α . F¨ ur α = 1 gilt F (x) = ln(t)|1x = − ln(x) = ln(1/x). Da limx→a F (x) = ∞, ist f nicht uneigentlich integrierbar. Sei α > 1. F¨ ur x ∈ ]0, 1] −α −1 gilt x ≥ x . Mit dem bereits Bewiesenen und Satz 1.16.(iii) (Monotonie) folgt, daß f nicht uneigentlich integrierbar ist. F¨ ur α < 1 gilt 1 1 · t−α+1 |1x = · (1 − x1−α ), −α + 1 1−α R1 woraus die uneigentliche Integrierbarkeit von f mit 0 t−α dt = 1/(1 − α) folgt. F (x) =

Analog erkl¨art und behandelt man uneigentliche Integrale Funktionen f : [a, b[ → R.

Rb a

f (t) dt f¨ ur geeignete

Uneigentliche Integrale auf Intervallen [a, ∞[ Im Folgenden seien a ∈ R sowie f : [a, ∞[ → R, so daß f f¨ ur alle x ∈ ]a, ∞[ integrierbar auf [a, x] ist. Definiere F : ]a, ∞[ → R durch Z x F (x) = f (t) dt. a

Definition 4. Falls F einen ur x → ∞ besitzt, heißt f uneigentlich R ∞Grenzwert f¨ integrierbar . Notation: ggf. a f (t) dt = limx→∞ F (x). Bemerkung 5. Bemerkung 2.(i) und (iii) u ¨bertr¨agen sich sinngem¨aß bzw. w¨ortlich auf die Situation von Definition 4.

V.3. Uneigentliche Integrale

108

Beispiel 6. Seien a = 1 und α > 0, und sei f (x) = x−α . F¨ ur α = 1 gilt F (x) = ln(t)|x1 = ln(x). Da limx→∞ F (x) = ∞, ist f nicht uneigentlich integrierbar. Sei α < 1. F¨ ur x ∈ [1, ∞[ gilt x−α ≥ x−1 . Mit dem bereits Bewiesenen und Satz 1.16.(iii) (Monotonie) folgt, daß f nicht uneigentlich integrierbar ist. F¨ ur α > 1 gilt 1 1 · t−α+1 |x1 = · (1 − x1−α ), −α + 1 α−1 R∞ woraus die uneigentliche Integrierbarkeit von f mit 1 t−α dt = 1/(α − 1) folgt. F (x) =

Beispiel 7. Sei a = 0. (i) Seien λ > 0 und f (x) = λ · exp(−λ · x). Dann gilt F (x) = − exp(−λ · t)|x0 = 1 − exp(−λ · x), woraus die uneigentliche Integrierbarkeit von f mit Z ∞ λ · exp(−λ · t) dt = 1 0

folgt. Stichwort: Exponentialverteilung. Ein Graphik und weitere Fakten finden sich in Abschnitt A.4. (ii) Seien σ > 0 und f (x) = 1/σ · exp(−x2 /(2σ 2 )). F¨ ur x ≥ 2σ 2 gilt exp(−x2 /(2σ 2 )) ≤ exp(−x), so daß

Z

2

x

F (x) ≤ F (2σ ) + 1/σ

exp(−t) dt. 2σ 2

Mit Bemerkung 5 und Beispiel (i) folgt die uneigentliche Integrierbarkeit von f . Da Z x/σ F (x) = exp(−t2 /2) dt 0

gem¨aß Satz 2.12 (Substitutionsregel), folgt Z ∞ Z 2 2 1/σ · exp(−t /(2σ )) dt = 0

f¨ ur alle σ > 0. Es gilt Normalverteilung.



exp(−t2 /2) dt

0

R∞ 0

p exp(−t2 /2) dt = π/2, siehe XI.5.16. Stichwort:

Mehr dazu in der Vorlesung Stochastische Methoden“. ” Rb Analog erkl¨art und behandelt man uneigentliche Integrale −∞ f (t) dt f¨ ur geeignete Funktionen f : ]−∞, b] → R sowie Kombinationen der bisher erkl¨arten F¨alle.

V.3. Uneigentliche Integrale

109

Satz 8 (Integralvergleichskriterium). Sei f : [1, ∞[ → [0, ∞[ monoton fallend. Dann sind ¨aquivalent (i) f ist uneigentlich integrierbar, P∞ (ii) k=1 f (k) ist konvergent. Ggf. gilt

∞ X

Z



f (x) dx ≤

f (k) ≤ 1

k=2

∞ X

f (k).

k=1

Beweis. Verwende m X

m

Z f (k) ≤

Z f (t) dt ≤

1

k=2

m+1

f (t) dt ≤ 1

m X

f (k)

k=1

sowie die Monotonie von F .

Die Gamma-Funktion F¨ ur t, x ∈ ]0, ∞[ sei f (t, x) = tx−1 · exp(−t). Bemerkung 9. Es gilt f (t, x) > 0 sowie   0, falls x > 1, lim f (t, x) = 1, falls x = 1, t→0   ∞, falls 0 < x < 1, und limt→∞ f (t, x) = 0 f¨ ur alle x > 0. Lemma 10. F¨ ur alle t0 , x ∈ ]0, ∞[ ist f (·, x) uneigentlich integrierbar u ¨ber [0, t0 ] und [t0 , ∞[. Beweis. Es gilt f (t, x) = 2x−1 · (t/2)x−1 · exp(−t/2), exp(−t/2) so daß

f (t, x) = 0. t→∞ exp(−t/2) lim

Mit Bemerkung 5 und Beispiel 7.(i) folgt die uneigentliche Integrierbarkeit von f (·, x) u ur jedes t0 > 0. Da f (t, x) ≤ tx−1 folgt mit Beispiel 3 die uneigentliche ¨ber [t0 , ∞[ f¨ Integrierbarkeit von f (·, x) u ur jedes t0 > 0. ¨ber [0, t0 ] f¨

V.3. Uneigentliche Integrale

110

Setze Z

t0 x−1

t

Γ(x) =

Z



· exp(−t) dt +

tx−1 · exp(−t) dt,

x > 0,

t0

0

und beachte, daß die rechte Seite nicht von der Wahl von t0 abh¨angt2 . Die so definierte Abbildung Γ : ]0, ∞[ → ]0, ∞[ heißt Gamma-Funktion. Satz 11 (Funktionalgleichung der Gamma-Funktion). F¨ ur alle x ∈ ]0, ∞[ gilt x · Γ(x) = Γ(x + 1). Insbesondere gilt Γ(n + 1) = n! f¨ ur alle n ∈ N0 . Beweis. Seien t0 , t1 ∈ ]0, ∞[ mit t0 < t1 sowie x ∈ ]0, ∞[. Satz 2.14 (partielle Integration) zeigt Z t1 Z t1 t1 x x t · exp(−t) dt = (−t · exp(−t)) |t0 + x · tx−1 · exp(−t) dt, t0

t0

woraus Γ(x + 1) = x · Γ(x) mit Bemerkung 9 folgt. Beispiel 7.(i) zeigt Γ(1) = 1 = 0!, so daß sich Γ(n + 1) = n! f¨ ur alle n ∈ N0 per Induktion ergibt. Ausblick 12. Die Stirlingsche Formel besagt lim √

n→∞

n! = 1, 2πn · (n/e)n

siehe [Fo1, S. 248–250]. Literatur. [Fo1, §20].

2

Man schreibt deshalb Γ(x) =

R∞ 0

tx−1 · exp(−t) dt.

Kapitel VI Vektorr¨ aume und lineare Abbildungen Vektorr¨aume und lineare Abbildungen sind die Grundobjekte der Linearen Algebra, in deren Rahmen wir beispielsweise die L¨osungstheorie f¨ ur lineare Gleichungssysteme entwickeln. Wir verweisen insbesondere auf [Fi].

1

Vektorr¨ aume

Im Folgenden sei K ein K¨orper. Wir verwenden die u ¨blichen Bezeichnungen +, ·, 0 und 1 und die u ¨blichen Konventionen. Definition 1. Eine Menge V zusammen mit Abbildungen ⊕:V ×V →V

Addition

:K ×V →V

skalare Multiplikation

heißt K-Vektorraum (Vektorraum u ¨ber K), falls folgendes gilt: (i) (V, ⊕) ist eine kommutative Gruppe. (ii) F¨ ur alle λ, µ ∈ K und v, w ∈ V gilt (λ + µ) v = λ v ⊕ µ v, λ (v ⊕ w) = λ v ⊕ λ w, λ (µ w) = (λ · µ) w, 1 v = v. Die Elemente von V heißen Vektoren, und die Elemente von K heißen Skalare. Notation: 0 f¨ ur das neutrale Element und v f¨ ur das zu v ∈ V inverse Element in (V, ⊕). Konvention: bindet st¨arker als ⊕.

111

VI.1. Vektorr¨aume

112

Beispiel 2. (i) F¨ ur n ∈ N sei V = K n = {(x1 , . . . , xn ) : xi ∈ K f¨ ur i ∈ {1, . . . , n}}. Definiere (x1 , . . . , xn ) ⊕ (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ), λ (x1 , . . . , xn ) = (λ · x1 , . . . , λ · xn ) f¨ ur λ ∈ K und (x1 , . . . , xn ), (y1 , . . . , yn ) ∈ V . Auf diese Weise erh¨alt man einen K-Vektorraum. Beweis ¨ Ubung. Soweit nichts anderes gesagt, betrachten wir K n stets als K-Vektorraum mit den so definierten Vektorraumoperationen ⊕ und . Insbesondere ist V = K ein K-Vektorraum, und V = C ist auch ein R-Vektorraum; hier ist ⊕ die Addition komplexer Zahlen, und ist die Multiplikation komplexer Zahlen, eingeschr¨ankt auf R × C, siehe Abschnitt III.4. Ebenso ist V = R ein Q-Vektorraum. (ii) Allgemeiner seien M 6= ∅ eine Menge und V ein K-Vektorraum mit den Vektorraumoperationen ⊕V und V . Dann ist V M , versehen mit (ϕ ⊕ ψ)(m) = ϕ(m) ⊕V ψ(m), (λ ϕ)(m) = λ V ϕ(m) ¨bung. Wir f¨ ur ϕ, ψ ∈ V M , λ ∈ K und m ∈ M ein K-Vektorraum. Beweis U M M betrachten V , und insbesondere K , stets als K-Vektorraum mit den so definierten Vektorraumoperationen ⊕ und . Sprechweise: punktweise Addition bzw. skalare Multiplikation, vgl. Definition I.4.27. Spezialf¨alle: F¨ ur K = R und ∅ 6= M ⊆ R ist RM der Vektorraum der Abbildungen von M nach R. Insbesondere ist RN der Vektorraum der reellen Zahlenfolgen. Im Folgenden sei V ein K-Vektorraum. Lemma 3. F¨ ur v ∈ V und λ ∈ K gilt (i) 0 v = 0, (ii) λ 0 = 0, (iii) λ v = 0 ⇒ λ = 0 ∨ v = 0, (iv) (−1) v = v. Beweis. ad (i): Es gilt 0 v = (0 + 0) v = 0 v ⊕ 0 v. ad (ii): Es gilt λ 0 = λ · (0 ⊕ 0) = λ 0 ⊕ λ 0. ad (iii): Aus λ v = 0 und λ 6= 0 folgt v = 1 v = (λ−1 · λ) v = λ−1 0 = 0 mit (ii). ad (iv): Mit (i) folgt v ⊕ (−1) v = 1 v ⊕ (−1) v = (1 + (−1)) v = 0. Fortan 0, + und · statt 0, ⊕ und sowie oft λv statt λ · v f¨ ur λ ∈ K und v ∈ V .

VI.1. Vektorr¨aume

113

Unterr¨ aume Definition 4. U ⊆ V heißt Unterraum (linearer Teilraum) von V , falls (i) U 6= ∅, (ii) ∀ v, w ∈ U : v + w ∈ U , (iii) ∀ λ ∈ K ∀ v ∈ U : λ · v ∈ U . Bemerkung 5. Bez¨ uglich der Mengeninklusion ist {0} der kleinste und V der gr¨oßte Unterraum von V , und f¨ ur jeden Unterraum U von V gilt 0 ∈ U . Vgl. Bemerkung I.4.14. Beispiel 6. (i) F¨ ur a ∈ K n und b ∈ K ist n

n

U = x∈K :

n X

ai · x i = b

o

i=1

genau dann ein Unterraum von K n , wenn b = 0. (ii) Die Mengen der beschr¨ankten, der konvergenten und der Nullfolgen sind Unterr¨aume des Vektorraums RN . (iii) Unterr¨aume von V = R[a,b] mit a, b ∈ R und a < b sind D([a, b]) ⊆ C([a, b]) ⊆ R([a, b]) ⊆ B([a, b]), wobei D([a, b]) die Menge der differenzierbaren Funktionen von [a, b] nach R bezeichnet. Satz 7. Jeder Unterraum von V , versehen mit der induzierten Addition und der induzierten skalaren Multiplikation, ist ein K-Vektorraum. Beweis. Wie f¨ ur Untergruppen, siehe Satz I.4.16. Lemma 8. F¨ ur jede Familie (Ui )i∈I von Unterr¨aumen von V mit I 6= ∅ ist ein Unterraum von V .

T

i∈I

Ui

Beweis. Wie f¨ ur Untergruppen, siehe Lemma I.4.17. Bemerkung 9. Das Analogon zu Lemma 8 f¨ ur Vereinigungen ist falsch. Siehe auch [Fi, S. 79].

VI.1. Vektorr¨aume

114

Erzeugte Unterr¨ aume und Linearkombinationen Definition 10. F¨ ur W ⊆ V sei U = {U : U Unterraum von V , W ⊆ U }. T Dann heißt U ∈U U der von W erzeugte (aufgespannte) Unterraum oder die lineare H¨ ulle von W . Notation: \ span(W ) = U. U ∈U

Bemerkung 11. Bez¨ uglich der Mengeninklusion ist span(W ) der kleinste Unterraum von V , der W enth¨alt, vgl. Bemerkung I.4.20. Insbesondere gilt span(∅) = {0}. Definition 12. Seien n ∈ N und v1 , . . . , vn ∈ V . Dann heißt v ∈ V Linearkombination von v1 , . . . , vn ∈ V , falls ∃ λ1 , . . . , λn ∈ K : v =

n X

λi vi .

i=1

Notation: Wir bezeichnen mit L(v1 , . . . , vn ) die Menge der Linearkombinationen von v1 , . . . , vn . Beispiel 13. (i) F¨ ur V = R2 sowie v1 = (1, 0), v2 = (0, 1) und v3 = (3, 2) gilt L(v1 , v2 ) = L(v1 , v3 ) = L(v2 , v3 ) = L(v1 , v2 , v3 ) = R2 . (ii) Sei V der Vektorraum der zweimal differenzierbaren Funktionen von R nach R (als Unterraum von RR ). Definiere v1 , v2 ∈ V durch v1 (t) = cos(t) und v2 (t) = sin(t) f¨ ur t ∈ R. Dann gilt L(v1 , v2 ) = {f ∈ V : f 00 = −f }, siehe Satz IV.2.11. Satz 14. F¨ ur ∅ 6= W ⊆ V gilt span(W ) = {v ∈ V : ∃ n ∈ N ∃ v1 , . . . , vn ∈ W : v ∈ L(v1 , . . . , vn )}. Beweis. ⊇“: Dies gilt, da span(W ) ein Unterraum von V mit W ⊆ span(W ) ist. ” ⊆“: Wir zeigen zun¨achst, daß L(v1 , . . . , vn ) f¨ ur alle n ∈ N und v1 , . . . , vn ∈ V ein Un” terraum von V ist. Offenbar gilt 0 ∈ L(v1 , . . . , vn ). F¨ ur v, w ∈ L(v1 , . . . , vn ) existieren λ1 , . . . , λn , µ1 , . . . , µn ∈ K mit v=

n X i=1

λi v i ,

w=

n X i=1

µi vi .

VI.1. Vektorr¨aume

115

Es folgt (per Induktion) v+w =

n X (λi + µi )vi ∈ L(v1 , . . . , vn ) i=1

sowie λv =

n X

λλi vi ∈ L(v1 , . . . , vn )

i=1

f¨ ur alle λ ∈ K. Sei U = {v ∈ V : ∃ n ∈ N ∃ v1 , . . . , vn ∈ W : v ∈ L(v1 , . . . , vn )}. Da L(v1 , . . . , vn ) ∪ L(w1 , . . . , wm ) ⊆ L(v1 , . . . , vn , w1 , . . . , wm ) ⊆ U f¨ ur n, m ∈ N und v1 , . . . , vn , w1 , . . . , wm ∈ W , folgt mit dem bereits Bewiesenen, daß U ein Unterraum von V ist. Offenbar gilt W ⊆ U . Korollar 15. F¨ ur n ∈ N und v1 , . . . , vn ∈ V gilt span({v1 , . . . , vn }) = L(v1 , . . . , vn ). Beispiel 16. Seien V = R3 und v1 , v2 ∈ V . Korollar 15 zeigt span({v1 }) = {λv1 : λ ∈ R}, so daß span({v1 }) im Fall v1 6= 0 die Gerade durch 0 und v1 ist. Ebenso gilt span({v1 , v2 }) = {λv1 + µv2 : λ, µ ∈ R}, so daß span({v1 , v2 }) im Fall v1 6= 0 und v2 6∈ span({v1 }) die Ebene durch 0, v1 und v2 ist. Siehe [Fi, 0.3] und Definition 2.20. Beispiel 17. (i) Sei V = RR . Definiere vi ∈ V f¨ ur i ∈ N0 durch vi (t) = ti f¨ ur t ∈ R. Dann ist span({vi : i ∈ N0 }) der Unterraum der Polynomfunktionen. (ii) F¨ ur I 6= ∅ sei V = K I . Definiere ei ∈ V f¨ ur i ∈ I durch ( 1, falls i = j, ei (j) = . 0, sonst. Dann gilt1 span({ei : i ∈ I}) = {v ∈ V : {i ∈ I : v(i) 6= 0} ist endlich}. Insbesondere gilt span({ei : i ∈ I}) = V genau dann, wenn I endlich ist. Literatur. [Fi, 1.4]. 1

F¨ ur I = N0 ist“ span({ei : i ∈ I}) der Vektorraum der Polynome u ¨ber K. ”

(1)

VI.2. Basen und Dimension

2

116

Basen und Dimension

Im Folgenden sei V ein K-Vektorraum, und (vi )i∈I sei eine Familie in V . Setze V0 = {vi : i ∈ I}. Falls I 6= ∅ endlich ist, kann in der Regel ohne Einschr¨ankung I = {1, . . . , n} angenommen werden. Schreibweise: (v1 , . . . , vn ) statt (vi )i∈{1,...,n} , siehe Seite 9.

Lineare Unabh¨ angigkeit Definition 1. Sei I 6= ∅ endlich. Dann ist (vi )i∈I linear unabh¨angig, falls f¨ ur alle I (λi )i∈I ∈ K gilt X λi · vi = 0 ⇒ (∀ i ∈ I : λi = 0). i∈I

Andernfalls ist (vi )i∈I linear abh¨angig. Die leere Familie (vi )i∈∅ ist linear unabh¨angig. Bemerkung 2. (i) Im Fall |I| = 1 ist (vi )i∈I genau dann linear unabh¨angig, wenn (vi )i∈I 6= (0)i∈I . (ii) Gilt vi = 0 f¨ ur ein i ∈ I, so ist (vi )i∈I linear abh¨angig. Beweis: 1 · 0 = 0. (iii) Existieren i, j ∈ I mit i 6= j und vi = vj , so ist (vi )i∈I linear abh¨angig. Beweis: 1 · v + (−1) · v = 0. (iv) F¨ ur J ⊆ I gilt: (vi )i∈I linear unabh¨angig ⇒ (vi )i∈J linear unabh¨angig. Lemma 3. F¨ ur endliche Mengen I mit |I| ≥ 2 sind a¨quivalent (i) (vi )i∈I linear abh¨angig, (ii) ∃ i ∈ I : vi ∈ L((vj )j∈I\{i} ). Beweis. (i) ⇒ (ii)“ Es existieren (λj )j∈I ∈ K I und i ∈ I mit P ” λi 6= 0. Es folgt vi = j∈I\{i} (−λj /λi ) · vj ∈ L((vj )j∈I\{i} ).

P

λj vj = 0 und

(ii) ⇒ (i)“ Es existieren i ∈ I und (λj )j∈I\{i} ∈ K I\{i} mit vi = P ” λi = −1. Dann j∈I λj vj = 0.

P

λj vj . Setze

j∈I

j∈I\{i}

Beispiel 4. (i) Mit den Bezeichnungen aus Beispiel 1.13.(i) sind (v1 , v2 ), (v1 , v3 ) und (v2 , v3 ) linear unabh¨angig, w¨ahrend (v1 , v2 , v3 ) linear abh¨angig ist. (ii) Mit den Bezeichnungen aus Beispiel 1.13.(ii) ist (v1 , v2 ) linear unabh¨angig. Beweis: Gelte λ1 v1 + λ2 v2 = 0 f¨ ur λ1 , λ2 ∈ R. Dann folgt 0 = (λ1 v1 + λ2 v2 )(0) = λ1 und 0 = (λ1 v1 + λ2 v2 )(π/2) = λ2 .

VI.2. Basen und Dimension

117

Satz 5. F¨ ur endliche Mengen I 6= ∅ sind ¨aquivalent (i) (vi )i∈I linear unabh¨angig, (ii) f¨ ur alle v ∈ span(V0 ) existiert eindeutig (λi )i∈I ∈ K I mit X v= λi vi . i∈I

Beweis. (i) ⇒ (ii)“ Die Existenz folgt mit Korollar 1.15 (erzeugter Unterraum). ” Verwende X X X λi vi = µi vi ⇔ (λi − µi )vi = 0 i∈I

i∈I

i∈I

I

f¨ ur (λi )i∈I , (µi )i∈I ∈ K zum Beweis der Eindeutigkeit. (ii) ⇒ (i)“ Betrachte v = 0. ” Definition 6. Sei I unendlich. Dann ist (vi )i∈I linear unabh¨angig, falls (vi )i∈I0 f¨ ur jede endliche Menge I0 ⊆ I linear unabh¨angig ist. Andernfalls heißt (vi )i∈I linear abh¨angig. Bemerkung 7. (i) (vi )i∈I ist genau dann linear unabh¨angig, wenn f¨ ur alle endlichen Mengen ∅ 6= I0 I0 ⊆ I und alle (λi )i∈I0 ∈ K gilt X λi · vi = 0 ⇒ (∀ i ∈ I0 : λi = 0). i∈I0

(ii) Die Aussagen (ii)–(iv) aus Bemerkung 2 gelten f¨ ur beliebige Mengen I. Beispiel 8. F¨ ur V und (ei )i∈I gem¨aß Beispiel 1.17.(ii) ist (ei )i∈I linear unabh¨angig. Falls I 6= ∅ endlich ist, d.h. f¨ ur V = K n mit n ∈ N, gilt ferner span({ei : i ∈ I}) = V . Satz 9. Im Fall span(V0 ) 6= {0} sind ¨aquivalent (i) (vi )i∈I linear unabh¨angig, (ii) f¨ ur alle v ∈ span(V0 ) \ {0} existiert eine eindeutig bestimmte endliche Menge ∅ 6= I0 ⊆ I und eine eindeutig bestimmte Familie (λi )i∈I0 in K \ {0} mit X v= λi vi . i∈I0

Beweis. (i) ⇒ (ii)“ Sei v ∈ span(V0 ) \ {0}. Gem¨aß Satz 1.14 (erzeugter Unterraum) P ” existieren ∅ 6= J ⊆ I und (λi )i∈J ∈ K J mit v = i∈J λi vi . Setze I0 = {i ∈ J : λi 6= 0}. P 0 Dann I0 6= ∅ und v = i∈I0 λi vi . Seien I00 6= ∅ endlich und (µi )i∈I00 ∈ (K \ {0})I0 mit P v = i∈I 0 µi vi . Mit der linearen Unabh¨angigkeit von (vi )i∈I folgt I0 = I00 und λi = µi 0 f¨ ur i ∈ I0 . (ii) ⇒ (i)“ Sei (vi )i∈I linear abh¨angig. Dann existiert eine endliche Menge ∅ 6= I0 ⊆ I, ” so daß (vi )i∈I0 linear abh¨angig ist. Somit existieren eine endliche Menge ∅ 6= I00 ⊆ I0 P 0 und (λi )i∈I00 ∈ (K \ {0})I0 , so daß i∈I 0 λi vi = 0. 0

VI.2. Basen und Dimension

118

Erzeugendensysteme und Basen Sprechweise: Ist I endlich, so heißen (vi )i∈I endlich und |I| die L¨ange von (vi )i∈I . Ist I unendlich, so heißt (vi )i∈I unendlich. Definition 10. (i) (vi )i∈I heißt Erzeugendensystem von V , falls V = span({vi : i ∈ I}). (ii) Ein linear unabh¨angiges Erzeugendensystem von V heißt Basis von V . (iii) V heißt endlich erzeugt, falls V ein endliches Erzeugendensystem besitzt. Beispiel 11. (i) Beispiel 8 zeigt, daß (ei )i∈{1,...,n} mit ei gem¨aß (1.1) eine Basis von K n ist. Diese heißt Standardbasis oder kanonische Basis. Insbesondere ist (1, ı) eine Basis des R-Vektorraums C, und (1) ist eine Basis des C-Vektorraums C. (ii) Die Beispiele 1.13.(ii) und 4.(ii) zeigen, daß (cos, sin) eine Basis des Vektorraums aller zweimal differenzierbaren Funktionen f : R → R mit f 00 = −f ist. (iii) Der Vektorraum {v ∈ K N : {i ∈ N : v(i) 6= 0} endlich} ist nicht endlich erzeugt. Satz 12. Falls I 6= ∅ endlich ist, sind ¨aquivalent: (i) (vi )i∈I ist eine Basis von V . (ii) (vi )i∈I ist ein Erzeugendensystem von V , und f¨ ur alle i ∈ I ist (vj )j∈I\{i} kein Erzeugendensystem von V . P (iii) F¨ ur jedes v ∈ V existiert eindeutig (λi )i∈I ∈ K I mit i∈I λi vi = v. (iv) (vi )i∈I ist linear unabh¨angig, und jede Familie (wj )j∈J in V mit I ⊆ J, |J \I| = 1 und (wi )i∈I = (vi )i∈I ist linear abh¨angig. Beweis. Wir betrachten den nicht-trivialen Fall |I| ≥ 2. (i)⇒ (ii)“ Annahme:Sei i ∈ I, so daß (vj )j∈I\{i} ein Erzeugendensystem von V . Dann ” gilt vi ∈ L (vj )j∈I\{i} , siehe Korollar 1.15 (endlich erzeugter Unterraum). Lemma 3 zeigt die lineare Abh¨angigkeit von (vi )i∈I . Widerspruch. (ii) ⇒ (iii)“ Die Existenz ist klar. Zur Eindeutigkeit: Annahme: Es existieren (λi )i∈I ∈ ” I K , (µi )i∈I ∈ K I und i ∈ I mit λi 6= µi und X X λj vj = µj vj . j∈I

j∈I

  Es folgt vi ∈ L (vj )j∈I\{i} und somit L((vj )j∈I ) = L (vj )j∈I\{i} . Widerspruch. (iii)⇒ (iv)“: Die lineare Unabh¨angigkeit von (vi )i∈I folgt mit Satz 5, die lineare ” Abh¨angigkeit von (wj )j∈J folgt mit Lemma 3.

VI.2. Basen und Dimension

119

(iv) ⇒ (i)“ Zu zeigen bleibt V ⊆ span({vi : i ∈ I}). F¨ ur v ∈ V existieren (λi )i∈I ∈ K I P ” und λ ∈ K, so daß einerseits i∈I λi vi + λv = 0 und andererseits i ∈ I mit λi 6= 0 existiert oder λ 6= 0 gilt. Da (vi )i∈I linear unabh¨angig, folgt λ 6= 0. Fazit X v= (−λi )/λ · vi ∈ span({vi : i ∈ I}). i∈I

Bemerkung 13. Ist V nicht endlich erzeugt, so existiert eine unendliche, linear unabh¨angige Familie in V . Beweis: Satz 12 erlaubt die rekursive Definition einer linear unabh¨angigen Folge in V . Korollar 14 (Basisauswahlsatz). Sei V endlich erzeugt mit einem Erzeugendensystem (vi )i∈I . Dann existiert eine Teilmenge I0 ⊆ I, so daß (vi )i∈I0 eine Basis von V ist. Insbesondere besitzt jeder endlich erzeugte Vektorraum eine endliche Basis. Beweis. Wir betrachten den nicht-trivialen Fall V 6= {0}. Gelte V = L((vi )i∈I ) mit einer endlichen Menge I 6= ∅. Im Fall |I| = 1 ist (vi )i∈I eine Basis, siehe Bemerkung 2.(i). Im Fall |I| ≥ 2 gilt entweder ∀ i ∈ I : L((vj )j∈I\{i} ) 6= V, und dann ist (vi )i∈I gem¨aß Satz 12 eine Basis, oder es existiert ein i ∈ I mit L((vj )j∈I\{i} ) = V. Dann betrachtet man (vj )j∈I\{i} und f¨ahrt wie oben fort.

Dimension eines Vektorraumes Lemma 15 (Austauschlemma). Seien I 6= ∅ endlich und (vi )i∈I eine Basis von V . P Gelte w = j∈I λj vj mit (λj )j∈I ∈ K I , und sei i ∈ I mit λi 6= 0. Dann ist (˜ vj )j∈I mit ( vj , falls j 6= i, v˜j = w, falls j = i, ebenfalls eine Basis von V . Beweis. Siehe [Fi, S. 89]. Satz 16 (Basisaustauschsatz). Seien I 6= ∅ endlich und (vi )i∈I eine Basis von V . Ferner sei (wj )j∈J eine linear unabh¨angige Familie in V mit J 6= ∅. Dann ist J endlich mit |J| ≤ |I|, und es existiert eine Injektion τ : J → I, so daß (˜ vi )i∈I mit ( wj , falls i = τ (j), v˜i = vi , falls i ∈ / τ (J), eine Basis von V ist.

VI.2. Basen und Dimension

120

Beweis. Zun¨achst sei zus¨atzlich gefordert, daß J endlich ist. Wir beweisen dann die Aussage per Induktion nach |J|. P Gelte |J| = 1. Es existiert (λi )i∈I ∈ K I mit wj = i∈I λi vi , und Bemerkung 2.(i) zeigt wj 6= 0. Wende Lemma 15 an. Gelte |J| > 1, also J = J0 ∪ {j ∗ } mit J0 6= ∅ und j ∗ ∈ / J0 . Also |J0 | = |J| − 1. Gem¨aß Induktionsannahme existiert eine Injektion τ : J0 → I, so daß (ˆ vi )i∈I mit ( wj , falls i = τ (j), vˆi = vi , falls i ∈ / τ (J0 ), eine Basis von V ist, und es gilt |J0 | ≤ |I|. Annahme: |J0 | = |I|. Dann ist τ bijektiv, siehe Lemma II.3.4.(i), so daß (wj )j∈J0 eine Basis von V ist. Gem¨aß Satz 12 ist (wj )j∈J linear abh¨angig. Widerspruch. Somit gilt |J| ≤ |I|. Es existieren (λi )i∈I\τ (J0 ) ∈ K I\τ (J0 ) und (µj )j∈J0 ∈ K J0 mit X X wj ∗ = λi vi + µj wj . i∈I\τ (J0 )

j∈J0

Annahme: F¨ ur alle i ∈ I \ τ (J0 ) gilt λi = 0. Dann ist (wi )j∈J linear abh¨angig. Widerspruch. W¨ahle i ∈ I \ τ (J0 ) mit λi 6= 0 und tausche wj ∗ und vi . Gem¨aß Lemma 15 bleibt die Basiseigenschaft erhalten. Annahme: J unendlich. Dann existiert eine endliche Menge J0 ⊆ J mit |J0 | > |I|, und (wj )j∈J0 ist linear unabh¨angig. Widerspruch zum bereits Bewiesenen. Korollar 17. Besitzt V eine endliche Basis, so ist jede Basis von V endlich, und die L¨angen aller Basen von V sind gleich. Beweis. Wir betrachten den nicht-trivialen Fall V 6= {0}. Seien (vi )i∈I eine endliche Basis und (wj )j∈J eine weitere Basis von V . Gem¨aß Satz 16 ist J endlich, und zweimalige Anwendung dieses Satzes sichert |I| = |J|. Definition 18. Besitzt V eine endliche Basis, so heißt die L¨ange einer Basis von V die Dimension von V , und V heißt endlich-dimensional . Notation: dim V . Andernfalls heißt V unendlich-dimensional . Beispiel 19. F¨ ur n ∈ N gilt dim K n = n. F¨ ur den R-Vektorraum C gilt dim C = 2, und f¨ ur den C-Vektorraum C gilt dim C = 1. Definition 20. Ein Unterraum U von K n heißt Gerade durch den Nullpunkt, falls dim U = 1, und Ebene durch den Nullpunkt, falls dim U = 2. Korollar 21. Seien V endlich erzeugt und U ein Unterraum von V . Dann ist auch U endlich erzeugt mit dim U ≤ dim V , und aus dim U = dim V folgt U = V . Beweis. Bemerkung 13 und Satz 16 sichern, daß U endlich erzeugt ist. Korollar 14 zeigt, daß U eine endliche Basis besitzt, und Satz 16 sichert dim U ≤ dim V . Gelte dim U = dim V . Annahme: U 6= V . Dann folgt insbesondere dim V ≥ 1. Seien (u1 , . . . , un ) eine Basis von U und v ∈ V \U . Dann ist (u1 , . . . , un , v) linear unabh¨angig. Widerspruch zu Satz 16.

VI.3. Matrizen

121

Beispiel 22. Beispiel 11.(ii) und Korollar 21 zeigen, daß K N unendlich-dimensional ist. Dies gilt ebenso f¨ ur den echten Unterraum {v ∈ K N : {i ∈ N : v(i) 6= 0} endlich}. Korollar 23 (Basiserg¨anzungssatz). Sei V endlich-dimensional mit dim V = n ≥ 2. Ferner sei (w1 , . . . , wr ) linear unabh¨angig mit r ∈ {1, . . . , n − 1}. Dann existieren wr+1 , . . . , wn ∈ V , so daß (w1 , . . . , wn ) eine Basis von V ist. Beweis. Verwende Satz 16. Ausblick 24. Mit Hilfe des Zornschen Lemmas, das ¨aquivalent zum Auswahlaxiom ist, zeigt man, daß jeder Vektorraum eine Basis besitzt. Siehe [Z, S. 94]. Literatur. [Fi, 1.5].

3

Matrizen

Im Folgenden seien K ein K¨orper und m, n, p ∈ N. Gegeben: v1 , . . . , vm ∈ K n . Gesucht: eine Basis von span({v1 , . . . , vm }). Hier: ein einfacher Algorithmus f¨ ur dieses Problem, vgl. den Beweis von Korollar 2.14 (Basisauswahlsatz). Definition 1. Abbildungen A : {1, . . . , m}× {1, . . . , n} → K heißen m × n-Matrizen 2 (¨ uber K). Die Elemente ai,j = A(i, j) ∈ K heißen die Koeffizienten von A. Notation: A = (ai,j )1≤i≤m, 1≤j≤n sowie K m×n f¨ ur die Menge der m × n Matrizen u ¨ber K. Kurz: m×n A = (ai,j )i,j ∈ K . Wir identifizieren3 fortan K m mit K m×1 . Aus Platzgr¨ unden setzt man (lies transpo” niert“)   x1  ..  > (x1 , . . . , xm ) =  .  ∈ K m xm und

> x1  ..  1×m  .  = (x1 , . . . , xm ) ∈ K xm 

f¨ ur x1 , . . . , xm ∈ K. Siehe auch Definition 6.15.

Zeilenraum und Zeilenrang Definition 2. (i) F¨ ur a1 , . . . , an ∈ K m , A = (a1 , . . . , an ) ∈ K m×n und 1 ≤ j ≤ n heißt aj die j-te Spalte von A. 2 3

Anschaulich: rechteckiges Schema von Elementen aus K. Elemente aus K m sind somit Spaltenvektoren“. ”

VI.3. Matrizen

122

(ii) F¨ ur a1 , . . . , am ∈ K n , 

 a> 1   A =  ...  ∈ K m×n

(1)

a> m

1×n die i-te Zeile von A. und 1 ≤ i ≤ m heißt a> i ∈ K

Definition 3. (i) F¨ ur A gem¨aß (1) heißen ZR(A) = span({a1 , . . . , am }) ⊆ K n der Zeilenraum von A und rang A = dim ZR(A) der Rang 4 von A. (ii) A ∈ K m×n besitzt Zeilenstufenform, falls r ∈ {0, . . . , min(m, n)} mit folgenden Eigenschaften existiert: (a) ∀ 1 ≤ i ≤ r ∃ 1 ≤ j ≤ n : ai,j 6= 0, (b) ∀ r < i ≤ m ∀ 1 ≤ j ≤ n : ai,j = 0, (c) im Fall r ≥ 2 gilt j1 < · · · < jr f¨ ur ji = min{j : ai,j 6= 0}. Bemerkung 4. Sei A von der Form (1) und in Zeilenstufenform, und sei r gem¨aß Definition 3.(ii) bestimmt. Dann gilt r = rang A. Im Fall r > 0 gilt ZR(A) = span({a1 , . . . , ar }), und (a1 , . . . , ar ) ist eine Basis dieses Unterraums. Definition 5. Elementare Zeilenumformungen von A ∈ K m×n sind f¨ ur λ ∈ K \ {0} (i) die Multiplikation einer Zeile von A mit λ (Typ I), (ii) die Addition des λ-fachen einer Zeile von A zu einer anderen Zeile von A (Typ II), (iii) die Vertauschung zweier Zeilen von A (Typ III). Lemma 6. A˜ ∈ K m×n gehe aus A ∈ K m×n durch endlich viele elementare Zeilenum˜ = ZR(A). formungen hervor. Dann gilt ZR(A) Beweis. Wir betrachten zun¨achst den Fall einer Zeilenumformung. Dann gilt offenbar ˜ ⊆ ZR(A). Da sich jede elementare Zeilenumformung durch eine Umformung ZR(A) gleichen Typs r¨ uckg¨angig machen l¨aßt, geht auch A aus A˜ durch eine solche Umfor˜ Im allgemeinen Fall schließt man mung hervor. Wir erhalten also ZR(A) ⊆ ZR(A). induktiv. Satz 7. Jede Matrix aus K m×n kann durch endlich viele elementare Zeilenumformungen in Zeilenstufenform u uhrt werden. ¨berf¨ 4

Bei [Fi, S. 96] zun¨ achst als Zeilenrang bezeichnet.

VI.3. Matrizen

123

Beweis. Gaußsches Eliminationsverfahren f¨ ur A = (a1 , . . . , an ) = (ai,j )i,j ∈ K m×n . (i) Falls A = 0 oder m = 1: Stopp. (ii) Sei j ∗ = min{j ∈ {1, . . . , n} : aj 6= 0}. (iii) W¨ahle i ∈ {1, . . . , m} mit ai,j ∗ 6= 0. (iv) Tausche die Zeilen 1 und i, falls i 6= 1. (v) F¨ ur i = 2, . . . , m: Subtrahiere das ai,j ∗ /a1,j ∗ -fache der Zeile 1 von der Zeile i. (vi) Falls j ∗ = n: Stopp. (vii) Streiche die Zeile 1 und die Spalten 1, . . . , j ∗ , fahre fort mit Schritt 1. Per Induktion folgt, daß dieser Algorithmus f¨ ur jede Matrix A ∈ K m×n eine Matrix in Zeilenstufenform liefert. Beispiel 8. F¨ ur m = n = 3 seien v1 = (0, 0, 1)> , v2 = (0, 1, 0)> Die Gauß-Elimination f¨ ur A mit den Zeilen v1> , v2> , v3> liefert          0 0 1 · · · · · 0 1 0 0 1 0 0 1 0 0 0 1 0 0 1 · · 1  · · · · 0 1 1 0 0 1 · · 1 0 1 1

und v3 = (0, 1, 1)> .  · 1 0



 0 1 0 0 0 1 . 0 0 0

Fazit: rang A = 2, span({v1 , v2 , v3 }) = {x ∈ K 3 : x1 = 0} und ((0, 1, 0)> , (0, 0, 1)> ) ist eine Basis dieses Unterraums. Beispiel 9. Tafelskizze – [Fi, S. 95].

Multiplikation von Matrizen Bemerkung 10. Mit den Operationen aus Beispiel 1.2.(ii) ist K m×n ein K-Vektorraum, siehe Beispiel 1.2.(ii). Es gilt dim K m×n = m · n, siehe Beispiel 2.8. Definition 11. Das Produkt C = (ci,j )i,j ∈ K m×p von Matrizen A = (ai,` )i,` ∈ K m×n und B = (b`,j )`,j ∈ K n×p ist definiert durch ci,j =

n X

ai,` · b`,j ,

1 ≤ i ≤ m, 1 ≤ j ≤ p.

`=1

Notation: C = A · B oder kurz C = AB. Konvention: · bindet st¨arker als +. Bemerkung 12. Die Matrixmultiplikation ist assoziativ, Beweis Tutorium 12.2.a, aber sie ist nicht kommutativ, und aus AB = 0 folgt nicht A = 0 oder B = 0. Beispielsweise gilt       0 1 1 0 0 0 · = 0 0 0 0 0 0 und       1 0 0 1 0 1 · = . 0 0 0 0 0 0

VI.3. Matrizen

124

Bemerkung 13. Gelte 

 a> 1   A =  ...  ∈ K m×n ,

B = (b1 , . . . , bp ) ∈ K n×p .

a> m

Dann



 a> 1 ·B   A · B = (A · b1 , . . . , A · bp ) =  ...  . a> m·B

Im Spezialfall A = (a1 , . . . , an ) = (ai,j )i,j ∈ K m×n und x ∈ K n gilt  Pn  n `=1 a1,` · x`   X . . x ` · a` ∈ K m . Ax =  = . Pn `=1 `=1 am,` · x` Im Spezialfall y ∈ K n und 

 b> 1   B =  ...  = (bi,j )i,j ∈ K n×p b> n gilt y> · B =

n X

y` · b`,1 , . . . ,

`=1

n X

! y` · b`,p

=

`=1

n X

1×p y` · b> . ` ∈ K

`=1

Definition 14. En = (ei,j )i,j ∈ K n×n mit ( 1, falls i = j, ei,j = 0, sonst, heißt n × n-Einheitsmatrix . Lemma 15. F¨ ur A, A1 , A2 ∈ K m×n , B, B1 , B2 ∈ K n×p und λ ∈ K gilt5 (i) (A1 + A2 ) · B = A1 · B + A2 · B, (ii) A · (B1 + B2 ) = A · B1 + A · B2 , (iii) (λ · A) · B = A · (λ · B) = λ · (A · B), (iv) A · En = A und En · B = B. Beweis. Siehe Tutorium 12.2.b. Schreibweise: Aufgrund von Bemerkung 12 und Lemma 15.(iii) k¨onnen gewisse Klammern entfallen. Literatur. [Fi, 1.5, 2.5]. 5

Somit ist (K n×n , +, ·) ein Ring mit dem Einselement En .

VI.4. Lineare Abbildungen

4

125

Lineare Abbildungen

Im Folgenden seien U , V und W K-Vektorr¨aume. Definition 1. Eine Abbildung F : V → W heißt linear , falls (i) ∀ v, w ∈ V : F (v + w) = F (v) + F (w), (ii) ∀ v ∈ V ∀ λ ∈ K : F (λv) = λF (v). F heißt linearer Isomorphismus, falls F u ¨berdies bijektiv ist. V und W heißen isomorph, falls ein linearer Isomorphismus von V auf W existiert. Beispiel 2. (i) F¨ ur A ∈ K m×n definiert FA (v) = Av,

v ∈ K n,

eine lineare Abbildung FA : K n → K m . Siehe Lemma 3.15.(ii) und (iii). (ii) F¨ ur K = R, a, b ∈ R mit a < b definiert Z

b

v(x) dx,

F (v) =

v ∈ R([a, b]),

a

eine lineare Abbildung F : R([a, b]) → R. Siehe Satz V.1.16. (iii) F¨ ur K, a, b wie oben definiert F (v) = v 0 ,

v ∈ C 1 ([a, b]),

eine lineare Abbildung F : C 1 ([a, b]) → C([a, b]). Siehe S¨atze III.2.6 und IV.1.13. (iv) F¨ ur den Vektorraum V der konvergenten Folgen in RN definiert F (v) = lim vn , n

v ∈ V,

eine lineare Abbildung F : V → R. Siehe Satz II.5.13 (Summen- und Produktregel). (v) F¨ ur eine Menge M 6= ∅ und m ∈ M definiert F (ϕ) = ϕ(m),

ϕ ∈ V M,

eine lineare Abbildung F : V M → V , genannt Auswertung an der Stelle m. Siehe Beispiel 1.2.(ii). Spezialfall: K, a, b wie oben, M = [a, b] und V = R. Bemerkung 3. Sei F : V → W linear. Dann gilt (i) F (0) = 0. Beweis: F (0) = F (0 · 0) = 0 · F (0) = 0.

VI.4. Lineare Abbildungen

126

(ii) F ist genau dann injektiv, wenn F (v) 6= 0 f¨ ur alle v ∈ V \ {0} gilt. Beweis: F¨ ur v, w ∈ V gilt F (v) = F (w) ⇔ F (v − w) = 0. P P (iii) F ( ni=1 λi vi ) = ni=1 λi F (vi ) f¨ ur λ1 , . . . , λn ∈ K und v1 , . . . , vn ∈ V . Beweis: Induktion. (iv) Ist (vi )i∈I eine linear abh¨angige Familie in V , so ist (F (vi ))i∈I eine linear abh¨angige Familie in W . Beweis: Verwende (i) und (iii). (v) Sind V 0 ⊆ V und W 0 ⊆ W Unterr¨aume, so sind auch F (V 0 ) und F −1 (W 0 ) Unterr¨aume. Beweis: F¨ ur v, w ∈ V 0 und λ ∈ K gilt v + w ∈ V 0 und λv ∈ V 0 , so daß F (v)+F (w) = F (v+w) ∈ F (V 0 ) und λF (v) = F (λv) ∈ F (V 0 ). F¨ ur v, w ∈ V 0 0 mit F (v), F (w) ∈ W und λ ∈ K gilt F (v) + F (w) ∈ W und λF (v) ∈ W 0 , so daß F (v + w) = F (v) + F (w) ∈ W 0 und F (λv) = λF (v) ∈ W 0 . (vi) Ist V endlich-dimensional, dann ist auch F (V ) endlich-dimensional, und es gilt dim F (V ) ≤ dim V . Beweis: Sei (v1 , . . . , vn ) eine Basis von V . Dann ist (F (v1 ), . . . , F (vn )) gem¨aß (iii) ein Erzeugendensystem von F (V ). Wende Korollar 2.14 (Basisauswahlsatz) an. Bemerkung 4. Sei F : V → W . (i) F ist genau dann linear, wenn F (λv + w) = λF (v) + F (w) f¨ ur alle v, w ∈ V und λ ∈ K gilt. Beweis: Verwende Bemerkung 3.(i). (ii) Ist F ein linearer Isomorphismus, so ist F −1 linear. Beweis: Seien w, w0 ∈ W und λ ∈ K. F¨ ur v = F −1 (w) und v 0 = F −1 (w0 ) gilt F (λv + v 0 ) = λw + w0 , und es folgt λF −1 (w) + F −1 (w0 ) = F −1 (λw + w0 ). Satz 5. Sei F : V → W linear. (i) Ist F injektiv und (vi )i∈I eine linear unabh¨angige Familie in V , so ist (F (vi ))i∈I linear unabh¨angig. (ii) Ist F surjektiv und (vi )i∈I ein Erzeugendensystem von V , so ist (F (vi ))i∈I ein Erzeugendensystem von W . (iii) Ist F ein linearer Isomorphismus, so besitzen V und W dieselbe Dimensionen. Beweis. Wir betrachten den nicht-trivialen Fall I 6= ∅. P ad (i): Sei ∅ 6= I0 ⊆ I endlich, und gelte i∈I0 λi F (vi ) = 0 f¨ ur (λi )i∈I0 ∈ K I0 . Dann P P folgt F ( i∈I0 λi vi ) = 0 und weiter i∈I0 λi vi = 0 aufgrund der Injektivit¨at von F . Die lineare Unabh¨angigkeit von (vi )i∈I sichert λi = 0 f¨ ur alle i ∈ I0 . ad (ii): Sei w ∈ W . Nach Voraussetzung existieren v ∈ V, ∅ 6= I0 ⊆ I und (λi )i∈I0 ∈ P P K I0 mit F (v) = w und v = i∈I0 λi vi . Es folgt w = i∈I0 λi F (vi ). ad (iii): Sei (vi )i∈I eine Basis von V . Dann zeigen (i) und (ii), daß (F (vi ))i∈I eine Basis von W ist.

VI.4. Lineare Abbildungen

127

Konstruktion linearer Abbildungen Im Folgenden sei A = (vi )i∈I eine Basis von V . Setze K I∗ = {(λi )i∈I ∈ K I : {i ∈ I : λi 6= 0} endlich}. Ist I endlich, gilt K I∗ = K I ; insbesondere gilt K I∗ = K n f¨ ur I = {1, . . . , n}. Schreibweise: F¨ ur (λi )i∈I ∈ K I∗ und I0 = {i : λi 6= 0} setzen wir X X λi vi = λi vi , i∈I

falls I0 6= ∅, und

i∈I0

X

λi vi = 0,

i∈I

falls I0 = ∅. Bemerkung 6. Satz 2.9 zeigt: f¨ ur alle v ∈ V existiert genau ein (λi )i∈I ∈ K I∗ mit P v = i∈I λi vi . Satz 7. Sei (wi )i∈I eine Familie in W . Dann existiert genau eine lineare Abbildung F : V → W mit ∀ i ∈ I : F (vi ) = wi . Diese Abbildung ist genau dann injektiv, wenn (wi )i∈I linear unabh¨angig ist, und genau dann surjektiv, wenn (wi )i∈I ein Erzeugendensystem von W ist. P Beweis. Eindeutigkeit“: Sei v ∈ V , und gelte v = λi vi mit (λi )i∈I ∈ K I∗ . i∈IP P ” Aufgrund der Linearit¨at von F gilt F (v) = i∈I λi F (vi ) = i∈I λi wi . P Existenz“: Sei v ∈ V , und gelte v = i∈I λi vi mit (λi )i∈I ∈ K I∗ . Definiere F : V → ” W durch X F (v) = λi wi . i∈I I∗

P F¨ ur w = i∈I µi vi mit (µi )i∈I ∈ K gilt (λi +µi )i∈I ∈ K I∗ und v+w = i∈I (λi +µi )vi . P Es folgt F (v + w) = i∈I (λi + µi )wi = F (v) + F (w). F¨ ur λ ∈ K gilt (λ · λi )i∈I ∈ K I∗ P P und λv = i∈I (λ · λi )vi . Es folgt F (λv) = i∈I (λ · λi )wi = λF (v). Die Aussagen zur Injektivit¨at und Surjektivit¨at sind klar. P

Beispiel 8. Sei V = W = R2 . (i) F¨ ur α ∈ R seien v1 = (cos(0), sin(0))> = (1, 0)> , v2 = (cos(π/2), sin(π/2))> = (0, 1)> , w1 = (cos(α), sin(α))> , w2 = (cos(π/2 + α), sin(π/2 + α))> = (− sin(α), cos(α))> . Dann beschreibt die durch F (v1 ) = w1 und F (v2 ) = w2 eindeutig definierte lineare Abbildung F : R2 → R2 eine Drehung der Ebene entgegen dem Uhrzeigersinn um den Winkel α.

VI.4. Lineare Abbildungen

128

(ii) Seien v1 = (1, 1)> und v2 = (−1, 1)> . Dann beschreibt die durch F (v1 ) = v1 und F (v2 ) = −v2 eindeutig definierte lineare Abbildung F : R2 → R2 eine Spiegelung der Ebene am Unterraum span({v1 }). Korollar 9. Seien V und W endlich-dimensional. V und W sind genau dann isomorph, wenn dim V = dim W . Beweis. ⇒“: Siehe Satz 5.(iii). ⇐“: W¨ahle Basen (vi )i∈I und (wi )i∈I von V bzw. ” ” W , und wende Satz 7 an.

Koordinatensysteme Beispiel 10. Betrachte die durch (1.1) definierte Basis E = (ei )i∈I von K I∗ , und definiere gem¨aß Satz 7 durch ΦA (ei ) = vi einen linearen Isomorphismus ΦA : K I∗ → V. F¨ ur (λi )i∈I ∈ K I∗ gilt ! ΦA ((λi )i∈I ) = ΦA

X i∈I

λi ei

=

X

λi vi .

i∈I

Im Spezialfall I = {1, . . . , n} und V = K n gilt ΦE = idK n . Definition 11. In obiger Situation heißt ΦA das durch A bestimmte Koordinatensystem in V , und Φ−1 A (v) ist die Familie der Koordinaten von v ∈ V bzgl. A. Beispiel 12. Im R-Vektorraum C ist (Re(z), Im(z)) die Familie der Koordinaten von z ∈ C bzgl. (1, i). Korollar 13. Jeder endlich-dimensionale K-Vektorraum V 6= {0} ist isomorph zu K n f¨ ur n = dim V .

Kern und Bild Im Folgenden sei F : V → W linear. Definition 14. ker F = F −1 ({0}) heißt der Kern von F , und Im F = F (V ) heißt das Bild von F . Bemerkung 15. ker F und Im F sind Unterr¨aume von V bzw. W , siehe Bemerkung 3.(v). Ferner ist F genau dann injektiv, wenn ker F = {0}, siehe Bemerkung 3.(ii). Definition 16. Ist Im F endlich-dimensional, so heißt rang F = dim Im F der Rang von F . Beispiel 17. F¨ ur V = W = R2 und A = (a1 , a2 ) ∈ R2×2 mit a1 = (2, 1)> und a2 = (−2, −1)> sei F durch F (x) = Ax f¨ ur x = (x1 , x2 )> ∈ V definiert. Dann gilt Ax = x1 a1 + x2 a2 = (x1 − x2 )a1 , siehe Bemerkung 3.13, so daß Im F = span({a1 }), und damit insbesondere rang F = 1, sowie ker F = span({(1, 1)> }).

VI.4. Lineare Abbildungen

129

Bemerkung 18. F¨ ur u ∈ V beschreibt die durch T (v) = u + v definierte Abbildung T : V → V die Translation (Verschiebung) um u. Notation: F¨ ur u ∈ V und V0 ⊆ V sei u + V0 = {u + v0 : v0 ∈ V0 } = T (V0 ) mit T gem¨aß Bemerkung 18. Sprechweise: Translation von V0 um u. Definition 19. X ⊆ V heißt affiner Unterraum von V , falls X = ∅ oder falls ein Unterraum V0 von V und u ∈ V mit X = u + V0 existieren. Lemma 20. F¨ ur u, u0 ∈ V und Unterr¨aume V0 und V00 von V sind ¨aquivalent (i) u + V0 = u0 + V00 , (ii) V0 = V00 und u − u0 ∈ V0 . Beweis. ⇒“ Da 0 ∈ V0 , existiert v00 ∈ V00 mit u = u0 + v00 , d.h. u0 − u ∈ V00 . F¨ ur ” 0 0 0 0 0 0 0 v0 ∈ V0 existiert v0 ∈ V0 mit u + v0 = u + v0 , d.h. v0 = u − u + v0 ∈ V0 . Ebenso folgt V00 ⊆ V0 . ⇐“: klar. ” Definition 21. Sei X = u + V0 mit u ∈ V und einem Unterraum V0 von V . Falls V0 endlich-dimensional ist, ist dim X = dim V0 die Dimension von X und X heißt endlich-dimensional . Andernfalls heißt X unendlich-dimensional . Definition 22. Ein affiner Unterraum X von K n heißt Gerade, falls dim X = 1, und Ebene, falls dim X = 2. Satz 23. Sei w ∈ W . Dann ist F −1 ({w}) ein affiner Unterraum von V . Im Fall F −1 ({w}) 6= ∅ gilt F −1 ({w}) = u + ker F f¨ ur jedes u ∈ F −1 ({w}). Beweis. Betrachte den nicht-trivialen Fall F −1 ({w}) 6= ∅. Verwende v = u + (v − u) und F (v) = F (u) + F (v − u) f¨ ur u, v ∈ V . Beispiel 24. (i) In der Situation von Beispiel 17 gilt f¨ ur jedes λ ∈ R {v ∈ V : F (v) = λa1 } = λ · (1, 0)> + {µ · (1, 1)> : µ ∈ R} = {λ · (1, 0)> + µ · (1, 1)> : µ ∈ R}. (ii) F¨ ur F gem¨aß Beispiel 2.(iii) ist ker F der Unterraum der konstanten Funktionen, siehe Korollar IV.2.9 (zum Mittelwertsatz der Differentialrechnung), und F ist surjektiv, siehe Satz V.2.7. Satz 23 liefert die Aussage von Satz V.2.4.

VI.4. Lineare Abbildungen

130

Satz 25. Sei V endlich-dimensional, und seien (vi )i∈I eine Basis von ker F und (wj )j∈J eine Basis von Im F , wobei I ∩ J = ∅. Ferner sei vj ∈ F −1 ({wj }) f¨ ur j ∈ J. Dann ist (vk )k∈I∪J eine Basis von V . Insbesondere gilt dim V = dim ker F + dim Im F. Beweis. Falls J = ∅, gilt ker F = V und somit F = 0, woraus die Aussagen des Satzes folgen. Im Folgenden sei J 6= ∅. Zun¨achst sichert Korollar 2.14 (Basisauswahlsatz), daß J endlich ist. P Wir zeigen die lineare Unabh¨angigkeit von (vk )k∈I∪J . Gelte ur k∈I∪J λk vk = 0 f¨ P (λk )k∈I∪J ∈ K I∪J . Anwendung von F zeigt j∈J λj wj = 0, und weiter ergibt sich P λj = 0 f¨ ur alle j ∈ J. Falls I 6= ∅, gilt also i∈I λi vi = 0, woraus λi = 0 f¨ ur alle i ∈ I folgt. Sei v ∈ V . Wir zeigen v ∈ span({vk : k ∈ I ∪ J}). Es existiert (λj )j∈J ∈ K J mit P P ur v 0 = j∈J λj vj ergibt sich F (v) = F (v 0 ), also v ∈ v 0 + ker F , F (v) = j∈J λj wj . F¨ siehe Satz 23. Beispiel 26. In der Situation von Beispiel 17 ist ((1, 1)> , (1, 0)> ) eine Basis von R2 mit den Eigenschaften gem¨aß Satz 25. Korollar 27. Sind V und W endlich-dimensional mit dim V = dim W , so sind die Injektivit¨at, Surjektivit¨at und Bijektivit¨at von F a¨quivalent. Beweis. Sei F injektiv. Dann zeigt Satz 25, daß dim W = dim Im F , woraus W = Im F aufgrund von Korollar 2.21 folgt. Sei F surjektiv. Dann zeigt Satz 25, daß dim ker F = 0, woraus ker F = {0} folgt. Beispiel 28. Die durch F ((x1 , x2 , . . . )) = (x2 , x3 , . . . ) definierte lineare Abbildung F : RN → RN ist surjektiv, aber nicht injektiv. Die durch F ((x1 , x2 , . . . )) = (0, x1 , . . . ) definierte lineare Abbildung F : RN → RN ist injektiv, aber nicht surjektiv.

R¨ aume linearer Abbildungen Notation: L(V, W ) bezeichnet die Menge aller linearen Abbildungen von V nach W . Satz 29. (i) L(V, W ) ist ein Untervektorraum von W V . (ii) F¨ ur F ∈ L(V, W ) und G ∈ L(U, V ) gilt F ◦ G ∈ L(U, W ). (iii) F¨ ur F, F1 , F2 ∈ L(V, W ) und G, G1 , G2 ∈ L(U, V ) gilt6 F ◦ (G1 + G2 ) = F ◦ G1 + F ◦ G2 , (F1 + F2 ) ◦ G = F1 ◦ G + F2 ◦ G. 6

Somit ist (L(V, V ), +, ◦) ein Ring mit dem Einselement idV .

VI.5. Lineare Abbildungen und Matrizen

131

Beweis. ad (i): F¨ ur F = 0 gilt F ∈ L(V, W ). Seien F, G ∈ L(V, W ) und µ ∈ K. F¨ ur u, v ∈ V und λ ∈ K gilt (F + G)(λu + v) = F (λu + v) + G(λu + v) = λF (u) + F (v) + λG(u) + G(v) = λ(F + G)(u) + (F + G)(v), d.h. F + G ∈ L(V, W ). Ferner gilt (µF )(λu + v) = µ(F (λu + v)) = µ(λF (u) + F (v)) = λ(µF )(u) + (µF )(v), d.h. µF ∈ L(V, W ). ad (ii): F¨ ur v, w ∈ U und λ ∈ K gilt F (G(λv + w)) = F (λG(v) + G(w)) = λF (G(v)) + F (G(w)). ad (iii): F¨ ur F ∈ L(V, W ), G1 , G2 : U → V und u ∈ U gilt F ◦ (G1 + G2 )(u) = F ((G1 + G2 )(u)) = F (G1 (u) + G2 (u)) = F ((G1 (u)) + F (G2 (u)) = F ◦ G1 (u) + F ◦ G2 (u) = (F ◦ G1 + F ◦ G2 )(u). Sonst ist nichts zu zeigen. Literatur. [Fi, 2.1, 2.2, 2.4].

5

Lineare Abbildungen und Matrizen

Im Folgenden seien V und W K-Vektorr¨aume mit dim V = n ∈ N und dim W = m ∈ N. Ferner seien A = (v1 , . . . , vn ) und B = (w1 , . . . , wm ) Basen von V bzw. W , und E = (e1 , . . . , en ) und E˜ = (˜ e1 , . . . , e˜m ) seien die Standardbasen von K n bzw. K m , siehe Beispiel 2.11.(i).

Darstellungsmatrizen linearer Abbildungen Bemerkung 1. F¨ ur jede lineare Abbildung F : V → W existiert genau eine Matrix m×n A = (ai,j )i,j ∈ K , so daß ∀ 1 ≤ j ≤ n : F (vj ) =

m X

ai,j wi ,

i=1

siehe Satz 2.12.(iii). F¨ ur 1 ≤ j ≤ n folgt   a1,j  ..  −1  .  = ΦB (F (vj )). am,j

(1)

VI.5. Lineare Abbildungen und Matrizen

132

Definition 2. Die durch Bemerkung 1 definierte Abbildung von L(V, W ) nach K m×n A wird mit MA B bezeichnet, und MB (F ) heißt die Darstellungsmatrix von F ∈ L(V, W ) bzgl. der Basen A und B. Beispiel 3. Sei V = W = R2 . Betrachte die lineare Abbildung F : R2 → R2 sowie v1 , v2 ∈ R2 gem¨aß Beispiel 4.8.(ii). Es gilt F (e1 ) = F (1/2 · (v1 − v2 )) = 1/2 · (v1 + v2 ) = (0, 1)> , F (e2 ) = F (1/2 · (v1 + v2 )) = 1/2 · (v1 − v2 ) = (1, 0)> . Somit MEE (F )

 =

 0 1 . 1 0

F¨ ur A = (v1 , v2 ) gilt MA A (F )

  1 0 = . 0 −1

Satz 4. F¨ ur F ∈ L(V, W ) und v ∈ V gilt  −1 F (v) = ΦB MA B (F ) · ΦA (v) . Beweis. Gem¨aß Beispiel 4.2.(i), Bemerkung 4.4.(ii) und Satz 4.29.(ii) definiert  −1 G(v) = ΦB MA B (F ) · ΦA (v) eine lineare Abbildung G : V → W . Zu zeigen bleibt somit F (vj ) = G(vj ) f¨ ur alle 1 ≤ j ≤ n, siehe Satz 4.7. In der Tat gilt   −1 G(vj ) = ΦB MA B (F ) · ej = ΦB ΦB (F (vj )) = F (vj ).

Bemerkung 5. (i) Das zu Satz 4 geh¨orige kommutative Diagramm ist V  −1  ΦA y

F

−−−→

W x Φ  B

K n −−−−−−−→ K m x7→MA B (F )·x

(ii) F¨ ur A, B ∈ K m×n und alle x ∈ K n gelte A · x = B · x. Dann folgt A = B. Zum Beweis betrachte man die Vektoren x der Standardbasis von K n . (iii) Satz 4, erg¨anzt um eine Eindeutigkeitaussage, besagt: F¨ ur F ∈ L(V, W ) existiert genau ein A ∈ K m×n mit F = ΦB ◦ FA ◦ Φ−1 . A

VI.5. Lineare Abbildungen und Matrizen

133

Bemerkung 6. Sei F : K n → K m linear. Es gilt MEE˜(F ) = (F (e1 ), . . . , F (en )). Satz 4 zeigt F (v) = MEE˜(F ) · v f¨ ur alle v ∈ K n . Insbesondere ist jede lineare Abbildung von K n nach K m von der Form gem¨aß Beispiel 4.2.(i). Satz 7. Sei F : V → W linear, und gelte r = rang F . Falls r = 0, gilt MA B (F ) = 0 f¨ ur alle A und B. Andernfalls existieren Basen A und B, so daß   Er 0 A . MB (F ) = 0 0 Beweis. Wir betrachten den nicht-trivialen Fall r > 0. Gem¨aß Satz 4.25 existieren Basen A = (v1 , . . . , vn ) von V und (w1 , . . . , wr ) von Im F , so daß F (vj ) = wj f¨ ur j = 1, . . . , r gilt und (vr+1 , . . . , vn ) eine Basis von ker F ist, falls r < n. Gem¨aß Korollar 2.23 (Basiserg¨anzungssatz) existieren im Fall r < m Elemente wr+1 , . . . , wm ∈ W , so daß B = (w1 , . . . , wm ) eine Basis von K m ist. Dann leistet MA B (F ) das Verlangte. m×n ist ein linearer Isomorphismus, und dim L(V, W ) = Satz 8. MA B : L(V, W ) → K m · n.

Beweis. Seien F, G ∈ L(V, W ), λ ∈ K, A = (ai,j )i,j = MA B (F ) und B = (bi,j )i,j = A MB (G). Setze C = λA + B. Dann gilt f¨ ur 1 ≤ j ≤ n (λF + G)(vj ) = λF (vj ) + G(vj ) = λ

m X

ai,j wi +

i=1

=

m X

(λai,j + bi,j ) · wi =

m X

i=1

m X

bi,j wi

i=1

ci,j wi .

i=1

A A Dies zeigt MA B (λF + G) = C = λMB (F ) + MB (G). A Aus MA ur A = (ai,j )i,j ∈ K m×n sei B (F ) = 0 folgt F = 0, so daß MB injektiv ist. F¨ F ∈ L(V, W ) durch (1) definiert, siehe Satz 4.7. Dann gilt MA B (F ) = A. Dies zeigt A die Surjektivit¨at von MB . Bemerkung 3.10 und Satz 4.5.(iii) sichern dim L(V, W ) = m · n.

Im Folgenden sei U ein endlich-dimensionaler K-Vektorraum mit dim U = p ∈ N. Ferner sei C = (u1 , . . . , up ) eine Basis von U . Satz 9. F¨ ur F ∈ L(W, U ) und G ∈ L(V, W ) gilt7 B A MA C (F ◦ G) = MC (F ) · MB (G). 7

n×n Somit ist MA ein Ringisomorphismus. A : L(V, V ) → K

VI.5. Lineare Abbildungen und Matrizen

134

Beweis. F¨ ur v ∈ V zeigen Bemerkung 3.12 und Satz 4  −1 F ◦ G(v) = F ΦB (MA B (G) · ΦA (v))    −1 A (G) · Φ (v)) Φ (M = ΦC MBC (F ) · Φ−1 B B A B   −1 = ΦC MBC (F ) · MA B (G) · ΦA (v) . Wende Bemerkung 5.(iii) an. Bemerkung 10. Das zu Satz 9 geh¨orige kommutative Diagramm ist – Tafelskizze–

Polynomfunktionen Notation: mit K bezeichnen wir den K¨orper R oder den K¨orper C. Im Folgenden sei der Vektorraum KK zugrunde gelegt. Ferner sei uj ∈ KK f¨ ur j ∈ N0 definiert durch uj (t) = tj . Diese Funktionen werden als Monome bezeichnet. Lemma 11. (uj )j∈N0 ist linear unabh¨angig. Beweis. Seien n ∈ N0 und λ0 , . . . , λn ∈ K mit zeigt λ0 = 0. Im Fall n > 0 folgt ∀t ∈ K : t ·

n−1 X

Pn

j=0

λj uj = 0. Einsetzen von t = 0

λj+1 · uj (t) = 0,

j=0

so daß aufgrund der Stetigkeit der Funktionen uj n−1 X

∀t ∈ K :

λj+1 · uj (t) = 0.

j=0

Schließe induktiv. Satz 12 (Koeffizientenvergleich). F¨ ur n ∈ N0 und a0 , . . . , an , b0 , . . . , bn ∈ K gelte ∀t ∈ K :

n X

i

ai · t =

i=0

n X

bi · ti .

i=0

Dann folgt ai = bi f¨ ur alle 0 ≤ i ≤ n. Beweis. Verwende Lemma 11 und Satz 2.12. Notation: Wir setzen Πn = span({u0 , . . . , un }) f¨ ur n ∈ N0 sowie Π−1 = {0}.

(2)

VI.5. Lineare Abbildungen und Matrizen

135

Definition 13. F¨ ur n ∈ N0 und v ∈ Πn \ Πn−1 heißt n der Grad von v, und Πn heißt der Vektorraum der Polynomfunktionen von K nach K vom Grad h¨ochstens n. Lemma 14. F¨ ur n ∈ N0 seien t1 , . . . , tn+1 ∈ K paarweise verschieden. Dann ist n+1 F : Πn → K , definiert durch F (v) = (v(t1 ), . . . , v(tn+1 ))> , ein linearer Isomorphismus. Beweis. F ist linear, vgl. Beispiel 4.2.(v). Wir zeigen, daß F surjektiv ist. Falls n = 0, sei v1 = 1 ∈ Π0 . Falls n > 0, seien Ij = {1, . . . , n + 1} \ {j} und Q `∈I (t − t` ) vj (t) = Q j `∈Ij (tj − t` ) f¨ ur 1 ≤ j ≤ n + 1 und t ∈ K. Da u ∈ Π1 ∧ v ∈ Πn ⇒ u · v ∈ Πn+1 f¨ ur alle n ∈ N0 , ergibt sich induktiv, daß vj ∈ Πn f¨ ur alle 1 ≤ j ≤ n + 1. F¨ ur n ∈ N0 n+1 sei E = (e1 , . . . , en+1 ) die Standardbasis von K . F¨ ur alle 1 ≤ j ≤ n + 1 gilt F (vj ) = ej . Somit folgt die Surjektivit¨at von F . Da dim Πn = n + 1, sichert Korollar 4.27 die Bijektivit¨at von F . P Bemerkung 15. Mit obigen Bezeichnungen gilt: F¨ ur alle y ∈ Kn+1 ist v = n+1 j=1 yj ·vj die eindeutig bestimmte Funktion v ∈ Πn mit F (v) = y. Stichwort: polynomiale Interpolation. F¨ ur A = (v1 , . . . , vn+1 ) ergibt sich MA E (F ) = En+1 , und f¨ ur A˜ = (u0 , . . . , un ) gilt  1  .. A˜ ME (F ) =  .

t1 .. .

...

 tn1 ..  . . 

1 tn+1 . . . tnn+1

Satz 16. F¨ ur n ∈ N0 und v ∈ Πn \ {0} enth¨alt {t ∈ K : v(t) = 0} h¨ochstens n Elemente. Beweis. Annahme: F¨ ur v ∈ Πn \ {0} existieren paarweise verschiedene t1 , . . . , tn+1 ∈ K, so daß v(tj ) = 0 f¨ ur 1 ≤ j ≤ n + 1. Widerspruch zur Injektivit¨at von F gem¨aß Lemma 14. Bemerkung 17. Satz 16 erlaubt eine Versch¨arfung von Satz 12: Statt (2) gen¨ ugt die Pn Pn i i Forderung, daß {t ∈ K : i=0 ai · t = i=1 bi · t } mindestens n + 1 Elemente enth¨alt. Beispiel 18. Sei K der K¨orper gem¨aß Beispiel I.4.24.(ii). F¨ ur alle t ∈ K gilt t2 +t = 0. Mehr zu Polynomen (und Polynomfunktionen) in der Vorlesung Algebraische Struk” turen“, siehe auch [Fi, 1.3] und [Z, 7.1] sowie Abschnitt VII.2. Literatur. [Fi, 1.3, 2.4, 2.6].

VI.6. Koordinatentransformationen

6

136

Koordinatentransformationen

Im Folgenden seien n, m ∈ N und K ein K¨orper. Ferner seien V 6= {0} und W 6= {0} endlich-dimensionale K-Vektorr¨aume.

Invertierbare Matrizen Definition 1. A ∈ K n×n heißt invertierbar , falls A0 ∈ K n×n mit A0 A = En existiert. Notation: Gl(n, K) = {A ∈ K n×n : A invertierbar}. Lemma 2. F¨ ur A = (a1 , . . . , an ) ∈ K n×n sind ¨aquivalent (i) A ist invertierbar, (ii) FA : K n → K n ist bijektiv, (iii) (a1 , . . . , an ) ist eine Basis von K n . Beweis. (i) ⇒ (ii)“ Sei x ∈ K n mit FA (x) = 0, und sei A0 ∈ K n×n mit A0 A = En . ” Dann gilt x = En x = A0 Ax = A0 0 = 0. Also ist FA injektiv. Wende Korollar 4.27 an. (ii) ⇒ (i)“. Gem¨aß Bemerkung 4.4.(ii) gilt FA−1 ∈ L(K n , K n ), und Bemerkung 5.6 ” sichert die Existenz von A0 ∈ K n×n mit ∀ x ∈ K n : FA−1 (x) = A0 x. Es folgt En x = x = FA−1 (FA (x)) = A0 Ax f¨ ur alle x ∈ K n . Bemerkung 4.4.(ii) sichert A0 A = En . ¨ Die Aquivalenz von (ii) und (iii) folgt mit Satz 4.7. Satz 3. Sei F : V → W linear. Dann sind ¨aquivalent (i) F ist ein linearer Isomorphismus, (ii) f¨ ur alle Basen A und B von V bzw. W ist MA B (F ) invertierbar, (iii) es existieren Basen A und B von V bzw. W , so daß MA B (F ) invertierbar ist. Beweis. (i)⇒ (ii)“ Gem¨aß Satz 5.4 gilt ” FMAB (F ) = Φ−1 B ◦ F ◦ ΦA . Insbesondere ist FMAB (F ) als Komposition von Bijektionen bijektiv. Wende Lemma 2 an. (ii) ⇒ (iii)“ klar. ” (iii) ⇒ (i)“ Gem¨aß Satz 5.4 gilt ” F = ΦB ◦ FMAB (F ) ◦ Φ−1 A , und FMAB (F ) ist gem¨aß Lemma 2 bijektiv. Schließe wie oben.

VI.6. Koordinatentransformationen

137

Satz 4. (Gl(n, K), ·) ist eine Gruppe mit neutralem Element En . Beweis. Sei S die symmetrische Gruppe der Menge K n . Setze S 0 = {F ∈ S : F ∈ L(K n , K n )}. Gem¨aß Bemerkung 4.4.(ii) und Satz 4.29.(ii) ist S 0 eine Untergruppe von S. Sei E die Standardbasis von K n . Definiere M : S 0 → Gl(n, K) durch M(F ) = MEE (F ), siehe Satz 3. Dann ist M injektiv, siehe Satz 5.8, und surjektiv, da M(FA ) = A f¨ ur A ∈ Gl(n, K), siehe Bemerkung 5.6 und Lemma 2. Ferner gilt M(idK n ) = En und M(F ◦ G) = M(F ) · M(G) f¨ ur alle F, G ∈ S 0 , siehe Satz 5.9. Somit u ¨bertr¨agt sich die Gruppenstruktur von (S 0 , ◦) auf (Gl(n, K), ·). Notation: A−1 bezeichnet die zu A ∈ Gl(n, K) inverse Matrix bzgl. ·. Bemerkung 5. F¨ ur A, B ∈ Gl(n, K) gilt A · A−1 = En , (A−1 )−1 = A und (A · B)−1 = B −1 · A−1 , siehe Lemma I.4.7 und Lemma I.4.12. Bemerkung 6. F¨ ur einen linearen Isomorphismus F : V → W und Basen A und B von V bzw. W gilt −1 MBA (F −1 ) = MA (F ) . B A Beweis: Gem¨aß Satz 5.9 gilt MBA (F −1 ) · MA B (F ) = MA (idV ) = En .

Die Transformationsformel Definition 7. F¨ ur Basen A und B von V heißt MA B (idV ) die Transformationsmatrix A des Basiswechsels von A nach B. Notation: TB = MA B (idV ). Bemerkung 8. (i) Sei n = dim V . Dann gilt in der Situation von Definition 7 f¨ ur x, y ∈ K n ΦA (x) = ΦB (y) ⇔ y = TBA x. (ii) Seien A = (v1 , . . . , vn ) und B = (u1 , . . . , un ) Basen von V = K n . Setze A = (v1 , . . . , vn ) ∈ K n×n und B = (u1 , . . . , un ) ∈ K n×n . Dann gilt f¨ ur x ∈ K n ΦA (x) = Ax,

ΦB (x) = Bx.

−1 −1 −1 Lemma 2 sichert A, B ∈ Gl(n, K), so daß Φ−1 A (y) = A y und ΦB (y) = B y f¨ ur y ∈ K n . Fazit: TBA = B −1 A, TAB = A−1 B.

VI.6. Koordinatentransformationen

138

 Beispiel 9. F¨ ur die Basis A = (1, 1)> , (−1, 1)> und die Standardbasis B = E = (e1 , e2 ) von V = R2 ergibt sich B = B −1 = E2 , so daß   1 −1 A TE = A = . 1 1 Da e1 = 1/2 · (v1 − v2 ) und e2 = 1/2 · (v1 + v2 ) folgt TAE

=

1 2



1 1 −1 1

·



 =

1 −1 1 1

−1 .

Beispiel 10. Sei V = Πn mit den Basen A = (v1 , . . . , vn+1 ),

B = (u0 , . . . , un )

gem¨aß Bemerkung 5.15. F¨ ur alle v ∈ Πn gilt v=

n X

v(tj ) · vj .

j=1

Es folgt > Φ−1 A (v) = (v(t1 ), . . . , v(tn+1 ))

und weiter 

TAB

 1 t1 . . . tn1  . .. ..  . −1 . = Φ−1 . .  A (u0 ), . . . , ΦA (un ) =  . n 1 tn+1 . . . tn+1

Satz 11 (Transformationsformel). Seien A, A0 Basen von V und B, B 0 Basen von W . F¨ ur F ∈ L(V, W ) gilt 0

B A A MA B0 (F ) = TB0 · MB (F ) · TA0 0

−1

. 0

B A A Beweis. Gem¨aß Satz 5.9 gilt MA B0 (F ) = MB0 (idW ) · MB (F ) · MA (idV ). Verwende Bemerkung 6.

Beispiel 12. In der Situation von Beispiel 5.3 und Beispiel 3 setzen wir A = B und A0 = B 0 = E. Dann gilt    0 1 A −1 = MEE (F ) = TEA · MA A (F ) · TE 1 0       1 −1 1 0 1 1 1 = · ·2 . 1 1 0 −1 −1 1 Definition 13. A, B ∈ K m×n heißen ¨aquivalent, falls S ∈ Gl(m, K) und T ∈ Gl(n, K) existieren, so daß B = S · A · T −1 .

VI.6. Koordinatentransformationen

139

Bemerkung 14. ¨ ¨ (i) Die Aquivalenz von Matrizen definiert eine Aquivalenzrelation auf K m×n . (ii) A, B ∈ K m×n sind genau dann ¨aquivalent, wenn Basen A, A0 von K n und B, B 0 von K m und eine lineare Abbildung F : K n → K m mit MA B (F ) = A und A0 MB0 (F ) = B existieren. (iii) F¨ urjede Matrix A ∈ K m×n existiert r ∈ {0, . . . , min(m, n)}, so daß A ¨aquivalent  Er 0 zu ist, siehe Satz 5.7. 0 0

Zeilen- und Spaltenrang Definition 15. F¨ ur A = (ai,j )1≤i≤m,1≤j≤n ∈ K m×n heißt A> = (aj,i )1≤i≤n,1≤j≤m ∈ K n×m die zu A transponierte Matrix . Lemma 16. (i) F¨ ur A ∈ K m×n gilt (A> )> = A. (ii) A 7→ A> definiert einen linearen Isomorphismus von K m×n nach K n×m . (iii) F¨ ur A ∈ K m×n und B ∈ K n×p gilt (AB)> = B > A> . (iv) F¨ ur A ∈ Gl(n, K) gilt A> ∈ Gl(n, K) und (A> )−1 = (A−1 )> . Beweis. ad (i): klar. ad (ii): Aus den Definitionen ergibt sich (A + B)> = A> + B > und (λA)> = λA> f¨ ur m×n A, B ∈ K und λ ∈ K. Die Bijektivit¨at der Transposition folgt mit (i). ad (iii): Folgt direkt aus den Definitionen. ad (iv): Mit (iii) folgt (A−1 )> A> = (AA−1 )> = En> = En . Lemma 17. F¨ ur ¨aquivalente Matrizen A, B ∈ K m×n gilt rang A = rang B,

rang A> = rang B > .

Beweis. Lemma 16 zeigt  rang A> = dim {(x> A> )> : x ∈ K n } = dim ({Ax : x ∈ K n }) . Gelte A = S · B · T mit S ∈ Gl(m, K) und T ∈ Gl(n, K). Dann folgt mit Lemma 2 {Ax : x ∈ K n } = {SBx : x ∈ K n } und weiter mit Korollar 4.9 rang A> = dim ({SBx : x ∈ K n }) = dim ({Bx : x ∈ K n }) = rang B > . Ferner gilt A> = T > · B > · S > und T > ∈ Gl(n, K) sowie S > ∈ Gl(m, K). Aus dem bereits Bewiesenen ergibt sich rang A = rang B.

VI.6. Koordinatentransformationen

140

Satz 18. F¨ ur A ∈ K m×n gilt8 rang A = rang A> . Ferner ist A ∈ K n×n genau dann invertierbar, wenn rang A = n. Beweis. Gem¨aß Bemerkung 14.(iii) existiert r  Er Cr = 0

∈ {0, . . . , min(m, n)}, so daß A und  0 0

¨aquivalent sind. Mit Lemma 17 folgt rang A = rang Cr = rang Cr> = rang A> . Im Fall m = n gilt A ∈ Gl(n, K) genau dann, wenn Cr ∈ Gl(n, K), und letzteres ist ¨aquivalent zu n = r. Korollar 19. Seien A und B Basen von V bzw. W . F¨ ur F ∈ L(V, W ) gilt rang F = rang MA B (F ).  > Beweis. Offenbar gilt rang F = rang MA . Wende Satz 18 an. B (F ) Korollar 20. F¨ ur A, B ∈ K m×n sind ¨aquivalent (i) A und B sind ¨aquivalent, (ii) rang A = rang B. Beweis. (i) ⇒ (ii)“ Siehe Lemma 17. ” (ii) ⇒ (i)“ Mit der Notation aus dem Beweis von Satz 18 ist A ¨aquivalent zu Cr und ” B ¨aquivalent zu Cr0 , wobei r0 ∈ {0, . . . , min(m, n)}. Mit Lemma 17 folgt r = r0 .

Elementarmatrizen und elementare Zeilenumformungen Definition 21. F¨ ur i, j ∈ {1, . . . , m} mit i 6= j und λ ∈ K \ {0} sind die Elementarmatrizen Si (λ) = (sk,` )k,` ∈ K m×m ,

Qji (λ) = (qk,` ) ∈ K m×m ,

Pij = (pk,` ) ∈ K m×m

definiert durch sk,`

qk,`

pk,`

8

  λ, = 1,   0,   λ, = 1,   0,   1, =   0,

falls k = ` = i, falls k = ` 6= i, sonst, falls k = i und ` = j, falls k = `, sonst, falls k = ` ∈ {1, . . . , m} \ {i, j} oder {k, `} = {i, j}, sonst.

rang A> heißt Spaltenrang von A, siehe [Fi, p. 96].

VI.6. Koordinatentransformationen

141

Bemerkung 22. Die Linksmultiplikation mit Elementarmatrizen entspricht den elementaren Zeilenumformungen. (i) Si (λ) · A entsteht aus A durch Multiplikation der i-ten Zeile mit λ (Typ I), (ii) Qji (λ) · A entsteht aus A durch Addition des λ-fachen der j-ten Zeile zur i-ten Zeile (Typ II), (iii) Pij · A entsteht aus A durch Vertauschung der i-ten und j-ten Zeile (Typ III). Ferner gilt Si (λ), Qji (λ), Pij ∈ Gl(m, K) mit (Si (λ))−1 = Si (1/λ),

Qji (λ)

−1

= Qji (−λ),

Pij

−1

= Pij .

Satz 23. Jede invertierbare Matrix ist ein endliches Produkt von Elementarmatrizen. Beweis. Sei A ∈ K n×n . Gem¨aß Satz 3.7 und Bemerkung 22 existieren k ∈ N und Elementarmatrizen C1 , . . . , Ck ∈ K n×n , so daß A˜ = Ck · . . . · C1 · A Zeilenstufenform besitzt. Lemma 17 zeigt rang A˜ = rang A, so daß A ∈ Gl(n, K) ullt, existieren ` ∈ N und ¨aquivalent zu rang A˜ = n ist, siehe Satz 18. Ist letzteres erf¨ n×n Elementarmatrizen Ck+1 , . . . , Ck+` ∈ K , so daß Ck+` · . . . · C1 · A = En −1 und weiter A = C1−1 · . . . · Ck+` .

¨ Bemerkung 24. Der Beweis von Satz 23 liefert einen Algorithmus zur Uberpr¨ ufung, n×n −1 ob A ∈ K invertierbar ist und ggf. zur Berechnung von A . Seien A = (a1 , . . . , an ) und En = (e1 , . . . , en ). Setze (A | En ) = (a1 , . . . , an , e1 , . . . , en ) ∈ K n×2n . Mit der Notation aus dem Beweis von Satz 23 gilt im Fall rang A˜ = n Ck+` · . . . · C1 · (A | En ) = (En | A−1 ). Beispiel 25. Sei 

 0 1 2 A =  0 −2 −2  . 1 1 1

VI.7. Lineare Gleichungssysteme

142

Elementare Zeilenumformungen liefern   0 1 2 1 0 0  0 −2 −2 0 1 0  1 1 1 0 0 1 

 1 1 1 0 0 1  0 −2 −2 0 1 0  2 1 0 0 0 1 

 1 1 1 0 0 1  0 1 2 1 0 0  0 −2 −2 0 1 0 

 1 1 1 0 0 1  0 1 2 1 0 0 . 0 0 2 2 1 0 Dies zeigt A ∈ Gl(n, R). Weitere elementare Zeilenumformungen liefern   1 0 −1 −1 0 1  0 1 1 0 0  2 0 0 2 2 1 0 

 1 0 −1 −1 0 1  0 1 0 −1 −1 0  0 0 2 2 1 0  1 0 −1 −1 0 1  0 1 0 −1 −1 0  1 1/2 0 0 0 1 



 1 0 0 0 1/2 1  0 1 0 −1 −1 0  . 0 0 1 1 1/2 0 Fazit:



A−1

 0 1 2 = 1/2 ·  −2 −2 0  . 2 1 0

Literatur. [Fi, 2.6, 2.7].

7

Lineare Gleichungssysteme

Im Folgenden seien K ein K¨orper, m, n ∈ N und A ∈ K m×n sowie b ∈ K m . Ferner sei r = rang A.

VI.7. Lineare Gleichungssysteme

143

Definition 1. Die Menge L(A, b) = {x ∈ K n : Ax = b} heißt L¨osungsmenge des linearen Gleichungssystems Ax = b. Letzteres heißt homogen, falls b = 0, und inhomogen, falls b 6= 0. Sprechweise: A Koeffizientenmatrix9 , b rechte Seite.

Struktur der L¨ osungsmenge Satz 2. (i) L(A, 0) ist ein Unterraum der Dimension n − r. (ii) L(A, b) ist entweder leer oder ein affiner Unterraum der Dimension n − r. Falls x ∈ L(A, b), folgt L(A, b) = x + L(A, 0). Beweis. Betrachte die lineare Abbildung FA : K n → K m , siehe Beispiel 4.2.(i). Bemerkung 4.15 zeigt, daß ker FA = L(A, 0) ein Unterraum ist. Korollar 6.19 zeigt rang A = rang FA . ad (i): Siehe Satz 4.25 (Dimensionsformel). ad (ii): Siehe Satz 4.23.

Existenz und Eindeutigkeit von Lo ¨sungen Notation: (A, b) = (a1 , . . . , an , b) ∈ K m×(n+1) , falls A = (a1 , . . . , an ). Sprechweise: erweiterte Koeffizientenmatrix. Satz 3. L(A, b) 6= ∅ gilt genau dann, wenn rang(A, b) = rang A.

(1)

Beweis. Nach Korollar 2.21 und Satz 6.18 gilt (1) genau dann, wenn span ({a1 , . . . , an , b}) = span ({a1 , . . . , an }) . Letzteres ist ¨aquivalent zu b ∈ span ({a1 , . . . , an }). Korollar 4. (i) rang A = m ⇔ ∀ b ∈ K m : L(A, b) 6= ∅. (ii) rang A = n ⇔ ∀ b ∈ K m : |L(A, b)| ≤ 1. Bemerkung 5. Zur Anwendung von Satz 3 f¨ uhrt man (A, b) durch endlich viele elementare Zeilenumformungen in Zeilenstufenform u ¨ber, siehe Lemma 3.6 und Satz 3.7. 9¨

Ubliche Notation: ker A = L(A, 0).

VI.7. Lineare Gleichungssysteme

144

Gaußsches Eliminationsverfahren ˜ ˜b) gehe aus (A, b) durch endlich viele elementare Zeilenumformungen Lemma 6. (A, ˜ ˜b) = L(A, b). hervor. Dann gilt L(A, Beweis. Verwende Bemerkung 6.22, und schließe induktiv. Im Folgenden besitze (A, b) Zeilenstufenform, und es gelte r = rang(A, b) 6= 0. F¨ ur 1 ≤ j1 < · · · < jr ≤ n gelte ∀ 1 ≤ i ≤ r ∀ 1 ≤ j < ji : ai,j = 0 und ∀ 1 ≤ i ≤ r : ai,ji 6= 0. Bemerkung 7. F¨ ur A0 = (ai,j )1≤i≤r,1≤j≤n ∈ K r×n , b0 = (bi )1≤i≤r ∈ K r und x ∈ K n gilt Ax = b ⇔ A0 x = b0 . Satz 8. Falls r = n, gilt L(A, b) = {x} f¨ ur x ∈ K n gegeben durch xr = br /ar,r sowie 

x i = bi −

n X

 ai,j · xj /ai,i

j=i+1

f¨ ur i = r − 1, . . . , 1. Beweis. Siehe Bemerkung 7. Beispiel 9. Seien A = (a1 , . . . , an ) und B = (b1 , . . . , bn ) Basen von K n . F¨ ur A = n×n n×n (a1 , . . . , an ) ∈ K und B = (b1 , . . . , bn ) ∈ K gilt rang A = rang B = n. F¨ ur −1 −1 n v ∈ K ergeben sich die Koordinaten x = ΦA (v) und y = ΦB (v) als L¨osung von Ax = v bzw By = v, siehe Bemerkung 6.8. Speziell f¨ ur K = R, n = 3 und     −1 2 2 1 −1 −2 A =  −1 3 3  , B =  2 −3 −7  −2 7 6 2 −3 −6 sowie x = (1, 1, −1)> ergibt sich 

 −1 v = Ax =  −1  . −1 Die eindeutig bestimmte L¨osung von By = v ist   −2 y =  −1  . 0

VI.7. Lineare Gleichungssysteme

145

Beispiel 10. Betrachte die Situation von Bemerkung 5.15. Gegeben seien n ∈ N0 , paarweise verschiedene t1 , . . . , tn+1 ∈ K und y ∈ Kn+1 . Gesucht ist die Darstellung der Polynomfunktion v ∈ Πn mit ∀ 1 ≤ i ≤ n + 1 : v(ti ) = yi

(2)

in der Basis (u0 , . . . , un ) von Πn . P Sei x ∈ Kn+1 . F¨ ur v = n+1 j=1 xj uj−1 ist  1  .. A = .

(2) ¨aquivalent zu Ax = y, wobei  t1 . . . tn1 .. ..  . . .  n 1 tn+1 . . . tn+1

Lemma 5.14 und die S¨atze 6.3 und 6.18 sichern rang A = n + 1. Siehe auch ¨ Ubung 2.4. Graphiken von Interpolationspolynomen werden in Abschnitt A.5 gezeigt. Mehr zur Interpolation und zur numerischen L¨osung linearer Gleichungssysteme in der Vorlesung Einf¨ uhrung in die Numerik“. ” ¨ Bemerkung 11. Der Algorithmus zur Uberpr¨ ufung der Invertierbarkeit von A ∈ n×n −1 K und ggf. zur Berechnung von A , siehe Bemerkung 6.24, entspricht dem simultanen L¨osen von n linearen Gleichungssystemen Ax = ei , wobei (e1 , . . . , en ) die Standardbasis von K n ist. Satz 12. Gelte r < n. Setze J = {j1 , . . . , jr } und N = {1, . . . , n}. (i) F¨ ur λ ∈ K N \J sei x ∈ K n definiert durch xj = λj f¨ ur j ∈ N \ J sowie xjr = br /ar,jr , falls jr = n, 

xjr = br −

n X



ar,j · xj /ar,jr ,

j=jr +1

falls jr < n, und 

x j i = bi −

n X

 ai,j · xj /ai,ji

j=ji +1

f¨ ur i = r − 1, . . . , 1. Dann gilt x ∈ L(A, b). (ii) Die durch (i) definierte Abbildung Ψb0 : K N \J → L(A, b) ist bijektiv. Beweis. ad (i): Siehe Bemerkung 7. ad (ii): Wir zeigen die Surjektivit¨at von Ψb0 . F¨ ur λ ∈ K N \J gilt Ψb0 (λ) = Ψb0 (0) + Ψ0 (λ). Gem¨aß (i) gilt Ψ0 (K N \J ) ⊆ L(A, 0), und Ψ0 ist injektiv und linear, so daß rang Ψ0 = n − r. Satz 2.(i) und Korollar 2.21 sichern Ψ0 (K N \J ) = L(A, 0). Ferner gilt Ψb0 (0) ∈ L(A, b) gem¨aß (i), so daß L(A, b) = Ψb0 (K N \J ), siehe Satz 2.(ii). Die Injektivit¨at von Ψb0 ist klar.

VI.7. Lineare Gleichungssysteme

146

Darstellung affiner Unterr¨ aume Bemerkung 13. F¨ ur n ≥ 2 seien x ∈ K n und ein Unterraum U ⊆ K n der Dimension 1 ≤ p ≤ n − 1 gegeben. Gesucht sind A ∈ K m×n und b ∈ K m mit minimalem m, so daß x + U = L(A, b). Sei (v1 , . . . , vp ) eine Basis von U . Dann ist L(A, 0) = U ¨aquivalent zu ∀ 1 ≤ i ≤ p : Avi = 0

(3)

rang A = n − p,

(4)

und siehe Korollar 2.21 und Satz 2.(i). W¨ahle m = n−p und setze B = (v1 , . . . , vp ) ∈ K n×p . Dann ist (3) ¨aquivalent zu B > A> = 0, und es gilt dim L(B > , 0) = m. Fazit: (3) und (4) gilt genau dann, wenn die Zeilen von A eine Basis von L(B > , 0) bilden. F¨ ur A mit (3) und (4) definiert man b durch Ax = b. Spezialf¨alle: Darstellung von Geraden und Ebenen. Beispiel 14. In der Situation von Bemerkung 13 gelte K = R, n = 5 und U = span({(1, 0, 1, 1, 1)> , (1, 2, 0, 2, 0)> , (3, 1, 1, 1, 1)> }). Es ergibt sich   1 0 1 1 1 B > = 1 2 0 2 0  3 1 1 1 1 Elementare Zeilenumformungen f¨ ur B > f¨ uhren auf   1 0 1 1 1  0 2 −1 1 −1  , 0 0 −3 −5 −3 woraus sich dim U = rang B > = 3 und ((0, 0, −1, 0, 1)> , (2, −4, −5, 3, 0)> ) als Basis von L(B > , 0) ergibt. Fazit: im Fall x = 0 leistet   0 0 −1 0 1 A= 2 −4 −5 3 0 das Verlangte. Bemerkung 15. Betrachte die Situation von Bemerkung 13 im Extremfall p = n−1, also m = 1. Dann ergeben sich die Koeffizienten von A = (a1 , . . . , an ) ∈ K 1×n als eine von Null verschiedene L¨osung des linearen Gleichungssystems   a1 >  ..  B ·  .  = 0. an Spezialf¨alle: Darstellungen von Geraden in K 2 bzw. Ebenen in K 3 . Literatur. [Fi, 0.4, 2.3].

VI.8. Quotientenvektorr¨aume

8

147

Quotientenvektorr¨ aume

Im Folgenden seien V ein K-Vektorraum und U ⊆ V ein Unterraum. Definition 1. v, w ∈ V heißen ¨aquivalent modulo U , falls v − w ∈ U . Notation: v ∼U w oder kurz v ∼ w. Bemerkung 2. ¨ (i) ∼U ist eine Aquivalenzrelation auf V . ¨ (ii) Die Aquivalenzklasse von v ∈ V bez¨ uglich ∼U ist der affine Unterraum v + U . (iii) Im Fall U = V gilt v ∼U w f¨ ur alle v, w ∈ V . Im Fall U = {0} gilt v ∼U w genau dann, wenn v = w. Beispiel 3. Seien W ein K-Vektorraum und F : V → W linear. Setze U = ker F . F¨ ur v, w ∈ V gilt v ∼U w genau dann, wenn F (v) = F (w). Beispiel 4. F¨ ur a, b ∈ R mit a < b sei V = R([a, b]) der R-Vektorraum der Riemannintegrierbaren Funktion von [a, b] nach R. Die Mengen b

Z

|f (x)| dx = 0}

U1 = {f ∈ V : a

und Z U2 = {f ∈ V :

b

f (x) dx = 0} a

sind unendlich-dimensionale Unterr¨aume von V , siehe S¨atze V.1.16 und V.1.19, und es gilt U1 ⊆ U2 . F¨ ur f, g ∈ V gilt Z b f ∼U1 g ⇔ |f (x) − g(x)| dx = 0 a

sowie Z f ∼U2 g ⇔

b

Z f (x) dx =

a

b

g(x) dx, a

vgl. Beispiel 3. Sprechweise: f und g sind fast u ¨berall gleich statt f ∼U1 g. ¨ Ubung 3.3 zeigt, daß U2 viel gr¨oßer“ als U1 ist. ” Setze V 0 /U = {v + U : v ∈ V 0 } f¨ ur ∅ 6= V 0 ⊆ V , und betrachte die durch ρ(v) = v + U definierte kanonische Abbildung ρ : V → V /U . Bemerkung 5. Es gilt: ρ ist surjektiv, und ρ ist genau dann injektiv, wenn U = {0}.

VI.8. Quotientenvektorr¨aume

148

Satz 6. Es existieren eindeutig bestimmte Abbildungen ⊕ : V /U × V /U → V /U, : K × V /U → V /U, so daß V /U ein K-Vektorraum und ρ linear ist. Beweis. F¨ ur v, w ∈ V und λ ∈ K gilt notwendigerweise (v + U ) ⊕ (w + U ) = (v + w) + U, λ (v + U ) = (λv) + U.

(1) (2)

Lemma 4.20 zeigt f¨ ur v 0 , w0 ∈ V mit v ∼U v 0 und w ∼U w0 (v 0 + w0 ) + U = (v + w) + U, (λv 0 ) + U = (λv) + U. Durch (1) und (2) werden also Abbildungen ⊕ und von V /U × V /U bzw. K × V /U nach V /U definiert. Auf diese Weise erh¨alt man eine K-Vektorraum, dessen neutrales Element U ist. Beweis ¨ Ubung. Die Abbildung ρ ist offenbar linear. Fortan sei V /U stets mit ⊕ und gem¨aß (1) bzw (2) versehen, und wir schreiben + und · statt ⊕ bzw. . Definition 7. V /U heißt Quotientenvektorraum von V nach U . Satz 8. (i) ker ρ = U . (ii) Falls V endlich-dimensional ist, gilt dim V /U = dim V − dim U . Beweis. ad (i): F¨ ur v ∈ V gilt v ∈ ker ρ ⇔ v + U = U ⇔ v ∈ U. ad (ii): Satz 4.25 (Dimensionsformel), Bemerkung 5 und (i) zeigen dim V = dim U + dim V /U . Bemerkung 9. V 0 /U ist ein Unterraum von V /U , falls V 0 ein Unterraum von V ist. Beweis Tutorium 2.2.

Der Faktorisierungssatz Im Folgenden sei W ein K-Vektorraum und F : V → W sei linear. Satz 10. Gelte U ⊆ ker F . Dann exististiert genau eine lineare Abbildung Fˆ : V /U → W , so daß F = Fˆ ◦ ρ. Ferner gilt ker Fˆ = ker F/U , und Fˆ ist injektiv, falls U = ker F .

VI.8. Quotientenvektorr¨aume

149

Beweis. F¨ ur v ∈ V gilt notwendigerweise Fˆ (v + U ) = F (v).

(3)

Aus v + U = w + U f¨ ur w ∈ V folgt v − w ∈ ker F , d.h. F (v) = F (w), weshalb durch (3) eine Abbildung Fˆ : V /U → W definiert wird. Diese ist offenbar linear und erf¨ ullt ˆ F = F ◦ ρ. Ferner gilt v ∈ ker F , falls v + U ∈ ker F/U , und hiermit folgt Fˆ (v + U ) = 0 ⇔ F (v) = 0 ⇔ v + U ∈ ker F/U. Schließlich gilt U/U = {U }. Rb ur Beispiel 11. In der Situation von Beispiel 4 seien W = R und F (f ) = a f (x) dx f¨ R b Rb f ∈ V . Da a f (x) dx ≤ a |f (x)| dx, ist Satz 10 f¨ ur U = U1 und U = U2 anwendbar, und Fˆ (f ) ist in beiden F¨allen der gemeinsame Wert des Integrals aller Funktionen g ∈ V mit g ∼Ui f . Literatur. [Fi, 2.2].

Kapitel VII Determinanten und Eigenwerte Zu linearen Abbildungen F : V → V auf endlich-dimensionalen Vektorr¨aumen V uhren. suchen wir Basen A, die auf m¨oglichst einfache Darstellungsmatrizen MA A (F ) f¨ Als wichtiges Hilfsmittel kommen erstmals Determinanten zum Einsatz. Wir verweisen insbesondere auf [Fi].

1

Determinanten

Symmetrische Gruppen Notation: F¨ ur n ∈ N sei Sn , versehen mit der Komposition, die symmetrische Gruppe der Menge {1, . . . , n}. Wir pr¨asentieren einige Eigenschaften von Sn ; mehr dazu in der Vorlesung Algebrai” sche Strukturen“. Definition 1. τ ∈ Sn heißt Transposition, falls k, ` ∈ {1, . . . , n} mit k 6= ` und τ (k) = `, τ (`) = k sowie τ (i) = i f¨ ur i ∈ {1, . . . , n} \ {k, `} existieren. Lemma 2. F¨ ur n ≥ 2 ist jede Permutation aus Sn die Komposition von endlich vielen Transpositionen. Beweis. Siehe Tutorium 1.2 zum Beweis einer st¨arkeren Aussage. Definition 3. F¨ ur σ ∈ Sn heißt (k, `) ∈ {1, . . . , n}2 ein Fehlstand von σ, falls k < ` und σ(k) > σ(`). Beispiel 4. F¨ ur1 die Transpositionen     1 2 3 1 2 3 τ1 = , τ2 = , 1 3 2 3 2 1



 1 2 3 τ3 = 2 1 3

gilt   1 2 3 τ2 ◦ τ1 = = τ3 ◦ τ2 = τ1 ◦ τ3 3 1 2 1

Notation: in der unteren Zeile stehen die jeweiligen Bilder der Eintr¨age der oberen Zeile.

150

VII.1. Determinanten und

151

  1 2 3 τ3 ◦ τ1 = = τ2 ◦ τ3 = τ1 ◦ τ2 . 2 3 1

Die Permutationen τi ◦ τj mit i 6= j besitzen jeweils 2 Fehlst¨ande. Ferner gilt S3 = {τ1 , τ2 , τ3 , τ2 ◦ τ1 , τ3 ◦ τ1 , id{1,2,3} }. Definition 5. F¨ ur σ ∈ Sn sei k ∈ N0 die Anzahl der Fehlst¨ande. Dann heißt2 sign(σ) = (−1)k das Vorzeichen von σ, und σ heißt (un)gerade, falls sign(σ) = 1 (sign(σ) = −1). Satz 6. F¨ ur σ, τ ∈ Sn gilt sign(τ ◦ σ) = sign(τ ) · sign(σ) und insbesondere sign(σ −1 ) = sign(σ). Beweis. Siehe [Fi, S. 190]. Korollar 7. Sei σ = τk ◦ . . . ◦ τ1 mit Tranpositionen τ` ∈ Sn . Dann gilt sign σ = (−1)k . Beweis. F¨ ur jede Transposition τ` gilt sign τ` = −1. Wende Satz 6 an. Notation: Setze An = {σ ∈ Sn : σ gerade} und An τ = {σ ◦ τ : σ ∈ An } f¨ ur τ ∈ Sn . Lemma 8. F¨ ur τ ∈ Sn mit sign τ = −1 gilt Sn = An ∪ An τ und An ∩ An τ = ∅. Beweis. Satz 6 zeigt An τ = {σ ∈ Sn : σ ungerade}. 2

Schreibweise auch sign σ.

VII.1. Determinanten

152

Parallelotope und ihr Volumen Bemerkung 9. F¨ ur n ∈ N und a1 , . . . , an ∈ Rn sei P (a1 , . . . , an ) =

n nX

o λi ai : λ1 , . . . , λn ∈ [0, 1]

i=1

das von 0, a1 , . . . , an aufgespannte Parallelotop, und Vol (P (a1 , . . . , an )) bezeichne das elementargeometrische Volumen“ von P (a1 , . . . , an ). ” Es gilt3 Vol (P (e1 , . . . , en )) = 1 f¨ ur die Standardbasis (e1 , . . . , en ) von Rn , Vol (P (a1 , . . . , ak−1 , λak , ak+1 , . . . , an )) = |λ| · Vol (P (a1 , . . . , an )) f¨ ur alle k ∈ {1, . . . , n} und λ ∈ R,  Vol P (aσ(1) , . . . , aσ(n) ) = Vol (P (a1 , . . . , an )) f¨ ur jedes σ ∈ Sn und Vol (P (a1 , . . . , ak−1 , ak + λa` , ak+1 , . . . , an )) = Vol (P (a1 , . . . , an )) f¨ ur alle k, ` ∈ {1, . . . , n} mit k 6= ` und alle λ ∈ R. Damit l¨aßt sich Vol (P (a1 , . . . , an )) durch elementare Spaltenumformungen, d.h. elementarer Zeilenumformungen f¨ ur die transponierte Matrix, berechnen.

Die Weierstraßschen Axiome Im Folgenden seien n ∈ N und K ein K¨orper. Definition 10. Eine Abbildung4 det : K n×n → K mit folgenden Eigenschaften heißt Determinante. (i) F¨ ur alle 1 ≤ i ≤ n, a1 , . . . , an , bi ∈ K 1×n und λ ∈ K gilt       a1 a1 a1  ..   ..   ..   .   .   .         ai−1  ai−1  ai−1         = det  ai  + det  bi  det  a + b i i        ai+1  ai+1  ai+1         ..   ..   ..   .   .   .  an 3

an

an

Hier verlassen wir uns auf unsere Anschauung bzw. unsere Vorkenntnisse. Die weitere Theorie baut nicht auf Bemerkung 9 auf! 4 Schreibweise det A oder det(A).

VII.1. Determinanten und

153



   a1 a1  ..   ..   .   .       ai−1  ai−1         det  λ · ai  = λ · det  ai  . ai+1   ai+1       ..   ..   .   .  an an

(ii) F¨ ur alle A ∈ K n×n mit zwei gleichen Zeilen gilt det A = 0. (iii) Es gilt det En = 1. Satz 11. Jede Determinante det : K n×n → K besitzt folgende Eigenschaften. (i) F¨ ur alle A ∈ K n×n und λ ∈ K gilt det(λ · A) = λn · det A. (ii) F¨ ur alle A ∈ K n×n mit einer Nullzeile gilt det A = 0. (iii) Seien A ∈ K n×n und λ ∈ K. Entsteht B ∈ K n×n durch die Addition des λ-fachen einer Zeile von A zu einer anderen Zeile von A, gilt det B = det A. (iv) F¨ ur alle a1 , . . . , an ∈ K 1×n und σ ∈ Sn gilt     a1 aσ(1)  ..   ..  det  .  = sign σ · det  .  an aσ(n) (v) Sei A ∈ K n×n mit5 ai,j = 0 f¨ ur alle 1 ≤ j < i ≤ n. Dann gilt det A =

Qn

i=1

ai,i .

(vi) F¨ ur A ∈ K n×n gilt genau dann det A = 0, wenn rang A < n. (vii) F¨ ur A, B ∈ K n×n gilt det(A · B) = det A · det B. (viii) F¨ ur A ∈ Gl(n, K) gilt det(A−1 ) = (det A)−1 . Beweis. ad (i), (ii): Dies ergibt sich unmittelbar aus Definition 10.(i). ad (iii): F¨ ur i 6= j gilt   . . . .. .. .. .. .         ai + λaj   ai   aj   ai    . .   .  = det  ..  + λ · det  ..  = det  ...  . . det  .                  aj   aj   aj   aj  .. .. .. .. . . . . 5

Solche Matrizen heißen obere Dreiecksmatrizen; analog f¨ uhrt man untere Dreiecksmatrizen ein.

VII.1. Determinanten

154

ad (iv): F¨ ur 1 ≤ i < j ≤ n sei τ ∈ Sn die Transposition mit τ (i) = j. Dann gilt . .  .   .   .  .. .. .. .. ..            ai   aj   ai   aj   ai + aj  . .  .   .   .           det   ..  + det  ..  = det  ..  + det  ..  = det  ..  = 0            aj   ai   ai + aj   ai + aj   ai + aj  .. .. .. .. .. . . . . . und sign τ = −1. Der allgemeine Fall folgt induktiv mittels Lemma 2 und Korollar 7. Q ad (v): Im Fall ni=1 ai,i 6= 0 zeigen elementare Zeilenumformungen vom Typ II und (iii), daß   a11 0 n n Y Y   . .. det A = det  ai,i · det En = ai,i . = i=1 i=1 0 ann Andernfalls erzeugt man durch elementare Zeilenumformungen vom Typ II eine Nullzeile und wendet (ii) und (iii) an. ad (vi): Verwende elementare Zeilenumformungen der Typen II und III sowie (iii), (iv) und (v). ad (vii): Im Fall rang A < n gilt rang(A·B) < n und mit (vi) ergibt sich det A·det B = 0 sowie det(A · B) = 0. Gelte rang A = n. Gem¨aß Satz VI.6.23 existieren Elementarmatrizen C1 , . . . , Ck ∈ K n×n mit A = Ck · · · C1 . Definition 10.(i) zeigt f¨ ur Elementarmatrizen CI vom Typ I (Multiplikation einer Zeile mit λ ∈ K \ {0}) det(CI · B) = λ · det B. F¨ ur Elementarmatrizen CII und CIII der Typen II und III gilt det(CII · B) = det B siehe (iii), bzw. det(CIII · B) = − det B siehe (iv). Mit Definition 10.(iii) folgt det CI = λ, det CII = 1 und det CIII = −1. Es folgt det(C · B) = det C · det B f¨ ur alle Elementarmatrizen. Schließe induktiv. Bemerkung 12. Definition 10 und Satz 11 erlauben die Berechnung von Determinanten mittels elementarer Zeilenumformungen. Beispiel 13. 

     0 1 2 1 1 1 1 1 1 det  0 −2 −2  = det  0 1 2  = det  0 1 2  = 2. 1 1 1 0 −2 −2 0 0 2

VII.1. Determinanten

155

Existenz und Eindeutigkeit der Determinante Der Beweis von Satz 11 zeigt folgende Eindeutigkeitsaussage. Satz 14. F¨ ur alle n ∈ N und alle K¨orper K existiert h¨ochstens eine Determinante. Satz 15 (Leibniz-Formel). det : K n×n → K, definiert durch det A =

X

sign σ ·

n Y

ai,σ(i)

i=1

σ∈Sn

f¨ ur A = (ai,j )i,j ∈ K n×n , ist eine Determinante. Beweis. Verifiziere die Eigenschaften aus Definition 10. ad (i): klar. ad (ii): F¨ ur 1 ≤ k < ` ≤ n gelte ak,j = a`,j f¨ ur alle 1 ≤ j ≤ n. Sei τ ∈ Sn die Transposition mit τ (k) = `. Dann zeigt Lemma 8 X σ∈Sn

sign σ ·

n Y

ai,σ(i) =

i=1

n X Y σ∈An

ai,σ(i) −

i=1

n Y

 ai,σ(τ (i)) .

i=1

Da ak,σ(τ (k)) = ak,σ(`) = a`,σ(`) und a`,σ(τ (`)) = a`,σ(k) = ak,σ(k) sowie ai,σ(τ (i)) = ai,σ(i) f¨ ur i ∈ {1, . . . , n} \ {k, `} und alle σ ∈ Sn , folgt X

sign σ ·

n Y

ai,σ(i) = 0.

i=1

σ∈Sn

ad (iii): F¨ ur En = (ei,j )i,j und σ ∈ Sn \ {id{1,...,n} } gilt X σ∈Sn

sign σ ·

n Y

Qn

i=1 ei,σ(i)

= 0, so daß

ei,σ(i) = 1.

i=1

Notation und Sprechweise: fortan sei det : K n×n → K gem¨aß Satz 15 definiert6 , und det A heißt die Determinante von A ∈ K n×n . Beispiel 16. F¨ ur a1,1 , a1,2 , a2,1 , a2,2 ∈ K gilt   a1,1 a1,2 det = a1,1 · a2,2 − a1,2 · a2,1 . a2,1 a2,2 6

Dazu ¨aquivalent: die eindeutig durch die Eigenschaften (i)–(iii) aus Definition 10 bestimmte Abbildung von K n×n nach K.

VII.1. Determinanten

156

F¨ ur   a1,1 a1,2 a1,3 A = a2,1 a2,2 a2,3  ∈ K 3×3 a3,1 a3,2 a3,3 gilt det A = a1,1 · a2,2 · a3,3 + a1,2 · a2,3 · a3,1 + a1,3 · a2,1 · a3,2 − a1,3 · a2,2 · a3,1 − a1,2 · a2,1 · a3,3 − a1,1 · a2,3 · a3,2 . Lemma 17. F¨ ur a ∈ K, b ∈ K 1×n und A ∈ K n×n gilt   a b det = a · det(A). 0 A ¨ Beweis. Uberf¨ uhrung in Zeilenstufenform durch elementare Zeilenumformungen und Anwendung von Satz 11. Satz 18. F¨ ur A ∈ K n×n gilt det A = det AT . Beweis. F¨ ur A = (ai,j )i,j ∈ K n×n gilt X

T

det A =

sign(σ) ·

Qn

i=1

T

aσ(i),i =

det A =

X σ∈Sn

Qn

i=1

aσ(i),i .

i=1

σ∈Sn

Ferner gilt

n Y

ai,σ−1 (i) f¨ ur alle σ ∈ Sn . Mit Satz 6 folgt

−1

sign(σ ) ·

n Y

X

ai,σ−1 (i) =

i=1

sign σ ·

n Y

ai,σ(i) = det A.

i=1

σ∈Sn

Bemerkung 19. Satz 18 erlaubt die Verwendung elementarer Spaltenumformungen zur Berechnung von Determinanten. Ausblick 20. Laplacescher Entwicklungssatz, siehe [Fi, S. 203]. Beispiel 21. F¨ ur t1 , . . . , tn+1 ∈ K gilt  1 t1 . . .  .. .. det  . .

 tn1 ..  = . 

1 tn+1 . . . tnn+1

Y

(tj − ti ),

1≤i }). F¨ ur λ = 1 zeigen elementare Zeilenumformungen, daß (A − E3 )x = 0 ¨aquivalent zu   −1 −1 1  0 0 0 x = 0 0 0 0 ist. Es folgt Eig(A, 1) = span({(1, 0, 1)> , (−1, 1, 0)> }). Beispiel 16. F¨ ur 

 −1 0 0 A =  0 0 −1  0 1 0 und λ ∈ K gilt PA (λ) = −(λ + 1) · (λ2 + 1). Sei K = R. Dann gilt σ(A) = {−1} und Eig(A, −1) = span({(1, 0, 0> )}). Sei K = C. Dann gilt σ(A) = {−1, ı, −ı} und Eig(A, −1) = span({(1, 0, 0)> }), Eig(A, ı) = span({(0, ı, 1)> }) sowie Eig(A, −ı) = span({(0, −ı, 1)> }).

VII.2. Eigenwerte

162

Nullstellen von Polynomfunktionen Wir ben¨otigen einige Ergebnisse u ¨ber die Nullstellen von Polynomfunktionen, siehe [Fi, 1.3]; mehr dazu in der Vorlesung Algebraische Strukturen“. ” Bemerkung 17. Sei P : K → K eine Polynomfunktion mit P 6= 0. F¨ ur λ ∈ K gelte P (λ) = 0. Dann existieren r ∈ N und eine Polynomfunktion Q : K → K mit (i) P (t) = (t − λ)r · Q(t) f¨ ur alle t ∈ K, (ii) Q(λ) 6= 0. Ferner sind r und Q durch (i) und (ii) eindeutig bestimmt. Definition 18. In der Situation von Bemerkung 17 heißt λ ∈ K r-fache Nullstelle von P , und r heißt die Vielfachheit der Nullstelle λ. Notation: µ(P, λ) = r. Satz 19. F¨ ur jede Polynomfunktion P ∈ Πn \ {0} mit paarweise verschiedenen Nullstellen λ1 , . . . , λk gilt k X µ(P, λ` ) ≤ n. `=1

Definition 20. P ∈ Πn zerf¨allt in Linearfaktoren, falls λ1 , . . . , λn ∈ K und a ∈ K mit n Y ∀ t ∈ K : P (t) = a · (t − λi ) i=1

existieren. Der Beweis des folgenden Satzes gelingt mit Methoden der Funktionentheorie. Satz 21 (Fundamentalsatz der Algebra). Jede Polynomfunktion P : C → C zerf¨allt in Linearfaktoren. Korollar 22. F¨ ur A ∈ Cn×n gilt σ(A) 6= ∅ und X µ(PA , λ) = n. λ∈σ(A)

Beweis. Verwende die S¨atze 9, 10 und 21.

Die Vielfachheit von Eigenwerten Lemma 23. F¨ ur λ ∈ σ(F ) gilt dim Eig(F, λ) ≤ µ(PF , λ).

VII.3. Diagonalisierbarkeit

163

Beweis. F¨ ur m = dim Eig(F, λ) gilt 1 ≤ m ≤ n. W¨ahle eine Basis A = (v1 , . . . , vn ) von V , so daß F (vi ) = λvi f¨ ur i = 1, . . . , m, siehe Korollar VI.2.23 (Basiserg¨anzungssatz). Dann gilt   D B MA (F ) = 0 C mit B ∈ Km×(n−m) , C ∈ K(n−m)×(n−m) und   λ 0   .. D=  . 0 λ ¨ Ubung 3.1 zeigt f¨ ur t ∈ K PF (t) = PMA (F ) (t) = (λ − t)m · det(C − tEn−m ), so daß µ(PF , λ) ≥ m. Beispiel 24. In der Situation von Beispiel 15 gilt dim Eig(A, λ) = µ(PA , λ) f¨ ur alle λ ∈ σ(A). F¨ ur   1 1 B= 0 1 gilt PB (λ) = (1 − λ)2 und dim Eig(B, 1) = 1 ≤ 2 = µ(PB , 1). Ausblick 25. Markov-Ketten. Literatur. [Fi, 4.1, 4.2].

3

Diagonalisierbarkeit

Im Folgenden sei V ein endlich-dimensionaler K-Vektorraum mit n = dim V ∈ N. Ferner sei F : V → V linear. Definition 1. F heißt diagonalisierbar , falls eine aus Eigenvektoren von F bestehende Basis von V existiert. Bemerkung 2. Aus |σ(F )| = n folgt die Diagonalisierbarkeit von F . Siehe Lemma 2.8. Definition 3. A = (ai,j )i,j ∈ K n×n heißt Diagonalmatrix , falls ai,j = 0 f¨ ur alle i, j ∈ {1, . . . , n} mit i 6= j gilt. Notation: F¨ ur λ1 , . . . , λn ∈ K sei 

λ1

0 ..

 diag(λ1 , . . . , λn ) =  0

  n×n . ∈K

. λn

VII.3. Diagonalisierbarkeit

164

Bemerkung 4. F ist genau dann diagonalisierbar, wenn MA (F ) f¨ ur eine Basis A von V eine Diagonalmatrix ist. Im Folgenden sei A ∈ K n×n . Definition 5. A heißt diagonalisierbar , falls FA diagonalisierbar ist. Lemma 6. Seien A = (v1 , . . . , vn ) eine Basis von K n , S = (v1 , . . . , vn ) ∈ K n×n und λ1 , . . . , λn ∈ K. Dann sind ¨aquivalent (i) MA (FA ) = diag(λ1 , . . . , λn ), (ii) ∀ 1 ≤ i ≤ n : Avi = λi vi , (iii) diag(λ1 , . . . , λn ) = S −1 · A · S. ¨ ¨ von (i) und (ii) ist klar. Die Aquivalenz von (ii) und (iii) folgt Beweis. Die Aquivalenz aus S · diag(λ1 , . . . , λn ) = (λ1 v1 , . . . , λn vn ) und AS = (Av1 , . . . , Avn ). Bemerkung 7. A ∈ K n×n ist genau dann diagonalisierbar, wenn A ¨ahnlich zu einer Diagonalmatrix ist, siehe Lemma 6. Beispiel 8. Betrachte A gem¨aß Beispiel 2.16. Im Fall K = R ist A nicht diagonalisierbar, da alle Eigenvektoren von A in span({(1, 0, 0)> } liegen. Im Fall K = C ist A diagonalisierbar, und ((1, 0, 0)> , (0, ı, 1)> , (0, −ı, 1)> ) ist eine aus Eigenvektoren von A bestehende Basis von C3 , siehe Bemerkung 2. Betrachte B gem¨aß Beispiel 2.24. Wie oben sieht man, daß B nicht diagonalisierbar ist. Beispiel 9. Betrachte die Matrix A ∈ K3 aus Beispiel 2.15, und bilde   1 1 −1 S = (v1 , v2 , v3 ) =  3 0 1  2 1 0 aus den dort bestimmten Eigenvektoren von A. Gem¨aß Lemma 2.8 ist (v1 , v2 , v3 ) linear unabh¨angig, so daß A = (v1 , v2 , v3 ) eine aus Eigenvektoren von A bestehende Basis von K3 ist. Lemma 6 zeigt MA (FA ) = diag(−1, 1, 1) = S −1 · A · S.

Die direkte Summe von Unterr¨ aumen Im Folgenden seien W1 , . . . , Wk Unterr¨aume von V . Bemerkung 10. Betrachte den Vektorraum V k , siehe Beispiel VI.1.2.(ii), sowie seinen Unterraum W1 × · · · × Wk . Durch G(w1 , . . . , wk ) =

k X

w`

`=1

wird eine lineare Abbildung G : W1 × · · · × Wk → V definiert.

VII.3. Diagonalisierbarkeit

165

Definition 11. V heißt die direkte Summe von W1 , . . . , Wk , falls G gem¨aß BemerL kung 10 ein linearer Isomorphismus ist. Notation: k`=1 W` oder W1 ⊕ · · · ⊕ Wk . Vgl. ¨ Ubung 3.2 im Fall k = 2. ¨ Satz 12. Aquivalent sind (i) V =

Lk

`=1

W` ,

(ii) G gem¨aß Bemerkung 10 ist surjektiv (injektiv), und n =

Pk

`=1

dim W` ,

(iii) f¨ ur alle Basen (wi,` )i=1,...,n` von W` mit ` = 1, . . . , k ist (wi,` )i=1,...,n` ,`=1,...,k eine Basis von V , (iv) f¨ ur ` = 1, . . . , k existieren Basen (wi,` )i=1,...,n` von W` , so daß (wi,` )i=1,...,n` ,`=1,...,k eine Basis von V ist. Beweis. F¨ ur ` ∈ {1, . . . , k} und v ∈ V sei v (`) ∈ V k durch ( v, falls j = `, (`) vj = 0, sonst, definiert. Man verifiziert leicht: F¨ ur jede Wahl von Basen (wi,` )i=1,...,n` von W` ist (`) (wi,` )i=1,...,n` ,`=1,...,k eine Basis von W1 × · · · × Wk . Es folgt dim(W1 × · · · × Wk ) =

k X

dim W`

`=1

und weiter dim ker G =

k X

dim W` − rang G.

`=1

¨ Dies zeigt die Aquivalenz von (i) und (ii). Da G(w(`) ) = w f¨ ur w ∈ W` und ` = 1, . . . , k, ergibt sich (i) ⇒ (iii)“ sowie (iv) ⇒ (i)“ mit Satz VI.4.7, und (iii) ⇒ (iv)“ ist ” ” ” trivial.

Charakterisierung der Diagonalisierbarkeit Im Folgenden sei V ein K-Vektorraum, es gilt also K = K ∈ {R, C}. ¨ Satz 13. Aquivalent sind (i) F ist diagonalisierbar, (ii) PF zerf¨allt in Linearfaktoren, und es gilt ∀ λ ∈ σ(F ) : dim Eig(F, λ) = µ(PF , λ),

(1)

VII.3. Diagonalisierbarkeit

166

(iii) σ(F ) 6= ∅ und V =

M

Eig(F, λ).

λ∈σ(F )

Beweis. (i) ⇒ (ii)“: Sei (v1 , . . . , vn ) eine aus Eigenvektoren von F bestehende Basis ” von V . Genauer gelte F (vi ) = λi vi mit λi ∈ K f¨ ur i = 1, . . . , n. Dann X X dim Eig(F, λ) ≥ |{i ∈ {1, . . . , n} : vi ∈ Eig(F, λ)}| ≥ n. λ∈σ(F )

λ∈σ(F )

Mit Satz 2.19 und Lemma 2.23 folgt (1). F¨ ur A = (v1 , . . . , vn ) gilt MA (F ) = diag(λ1 , . . . , λn ), so daß ∀ t ∈ K : PF (t) =

n Y (λi − t). i=1

(ii) ⇒ (iii)“: Aus (ii) ergibt sich ” X X dim Eig(F, λ) = µ(F, λ) = n, λ∈σ(F )

λ∈σ(F )

P und Lemma 2.8 zeigt, daß die durch G((wλ )λ∈σ(F ) ) = λ∈σ(F ) wλ definierte Abbildung G : ×λ∈σ(F ) Eig(F, λ) → V injektiv ist. Wende Satz 12 an. (iii) ⇒ (i)“: Wende Satz 12 an. ” ¨ Bemerkung 14. Zur Uberpr¨ ufung der Diagonalisierbarkeit und ggf. zur Bestimmung einer aus Eigenvektoren von A bestehenden Basis von Kn kann man prinzipiell folgendermaßen vorgehen: 1. Bestimme PA und seine Nullstellen. P 2. Falls σ(A) = ∅ oder λ∈σ(A) µ(PA , λ) < n: Stopp – A ist nicht diagonalisierbar. 3. Bestimme (jeweils durch elementare Zeilenumformungen) dim Eig(A, λ) f¨ ur λ ∈ σ(A). Falls dim Eig(A, λ) < µ(PA , λ) f¨ ur ein λ ∈ σ(A): Stopp – A ist nicht diagonalisierbar. 4. Bestimme (jeweils durch L¨osen des entsprechenden homogenen linearen Gleichungssystems) Basen von Eig(A, λ) f¨ ur alle λ ∈ σ(A), und setze diese zusammen. Beispiel 15. In Beispiel 9 ist n = 3, PA zerf¨allt in Linearfaktoren, und es gilt dim Eig(A, −1) = 1 = µ(PA , −1) sowie dim Eig(A, 1) = 2 = µ(PA , 1). Also ist A, wie bereits in Beispiel 9 erkannt, diagonalisierbar.

VII.3. Diagonalisierbarkeit

167

Ausblick 16. Seien k ∈ N, λ1 , . . . , λk ∈ K paarweise verschieden und µ1 , . . . , µk ∈ N, so daß k Y ∀ t ∈ K : PF (t) = (−1)n (t − λ` )µ` . `=1

Die Unterr¨aume W` = ker(F − λ` idV )µ` ,

` = 1, . . . , k,

heißen die Hauptr¨aume von F . Der Satz u ¨ber die Hauptraumzerlegung besagt dim W` = µ` , und V =

k M

` = 1, . . . , k,

W` ,

`=1

siehe [Fi, S. 259]. F¨ ur v ∈ W` gilt F (v) − λ` v ∈ W` , woraus F (W` ) ⊆ W` folgt. Betrachte die linearen Abbildungen F` : W` → W` : v 7→ F (v),

G` : W` → W` : v 7→ F (v) − λ` v.

Offenbar gilt Gµ` ` = 0. F¨ ur jede Basis A` von W` gilt MA` (F` ) = λ` Eµ` + MA` (G` ). Tutorium 4.2 liefert eine Basis, f¨ ur die MA` (G` ) von besonders einfacher Gestalt ist. Stichwort: Jordansche Normalform, siehe [Fi, 4.6]. Ausblick 17. Die Resultate dieses Kapitels gelten f¨ ur beliebige K¨orper K; statt Polynomfunktionen sind dabei Polynome zu betrachten. Literatur. [Fi, 1.6, 4.1, 4.3].

Kapitel VIII Euklidische und unit¨ are Vektorr¨ aume Wir betrachten Vektorr¨aume u ¨ber R oder C, die mit einem Skalarprodukt versehen sind. Dies erm¨oglicht die Definition und Untersuchung geometrischer Gr¨oßen wie L¨angen und Winkel. Wir verweisen insbesondere auf [Fi]. Im Folgenden bezeichnet K entweder den K¨orper R oder den K¨orper C, und V sei ein K-Vektorraum. Notation: F¨ ur K = R und x ∈ K sei x = x und Re x = x. F¨ ur K = C und x ∈ C schreiben wir kurz x ≥ 0 oder x > 0, falls Im x = 0 und Re x ≥ 0 bzw. Re x > 0.

1

Skalarprodukt und Orthogonalit¨ at

Definition 1. h·, ·i : V × V → K heißt Skalarprodukt (inneres Produkt) auf V , falls ∀ v, v 0 , w ∈ V : hv + v 0 , wi = hv, wi + hv 0 , wi, ∀ v, w ∈ V ∀ λ ∈ K : hλv, wi = λhv, wi, ∀ v, w ∈ V : hv, wi = hw, vi, ∀ v ∈ V \ {0} : hv, vi > 0.

(1) (2) (3) (4)

Ferner heißt (V, h·, ·i) dann Innenproduktraum und in den F¨allen K = R und K = C euklidischer Vektorraum bzw. unit¨arer Vektorraum. Notation gelegentlich h·, ·iV . Bemerkung 2. Sei (V, h·, ·i) ein Innenproduktraum. (i) Im Fall K = R folgt aus (1)–(3)1 ∀ v, w, w0 ∈ V : hv, w + w0 i = hv, wi + hv, w0 i, ∀ v, w ∈ V ∀ λ ∈ K : hv, λwi = λhv, wi. 1

(5) (6)

Sei V ein K-Vektorraum. Dann heißt h·, ·i : V × V → K mit (1), (2), (5) und (6) Bilinearform auf V . Gilt (1), (2) und ∀ v, w ∈ V : hv, wi = hw, vi, so heißt h·, ·i symmetrische Bilinearform auf V .

168

VIII.1. Skalarprodukt und Orthogonalit¨at

169

(ii) Im Fall K = C folgt aus (1)–(3)2 ∀ v, w, w0 ∈ V : hv, w + w0 i = hv, wi + hv, w0 i, ∀ v, w ∈ V ∀ λ ∈ K : hv, λwi = λhv, wi.

(7) (8)

(iii) Es gilt3  ∀ v ∈ V : hv, vi ≥ 0 ∧ (hv, vi = 0 ⇔ v = 0) .

(9)

Beispiel 3. F¨ ur n ∈ N und K = R sei V = Rn . Durch hx, yi =

n X

xi · yi ,

x, y ∈ V,

i=1

wird ein Skalarprodukt auf V definiert. Bezeichnung: kanonisches Skalarpodukt auf Rn . Es gilt hx, yi = x> y. Beispiel 4. F¨ ur a, b ∈ K = R mit a < b sei V = R ([a, b]). F¨ ur f, g ∈ V gilt f · g ∈ V , siehe Satz V.1.19. Durch Z b hf, gi = f (x) · g(x) dx, f, g ∈ V, a

wird eine Abbildung h·, ·i : V × V → R definiert, die (1), (2) und (3), aber nicht (4) erf¨ ullt, wie f = 1{a} zeigt. Als Ausweg betrachtet man den Quotientenraum V /U Rb mit U = {f ∈ V : a |f (x)| dx = 0}; mehr dazu in der Vorlesung Einf¨ uhrung in die ” Funktionalanalysis“. Sei W = C([a, b]). Dann ist h·, ·i|W ×W ein Skalarprodukt auf W . Beweis ¨ Ubung. Notation: F¨ ur A = (ai,j ) ∈ Cm×n mit m, n ∈ N sei A = (ai,j ) ∈ Cm×n . Beispiel 5. F¨ ur n ∈ N und K = C sei V = Cn . Durch hx, yi =

n X

xi yi

x, y ∈ V,

i=1

wird ein Skalarprodukt auf V definiert. Bezeichnung: kanonisches Skalarprodukt auf Cn . Es gilt hx, yi = x> y. Im Folgenden betrachten wir auf Rn bzw. Cn , soweit nichts anderes gesagt, das mit h·, ·i bezeichnete kanonische Skalarprodukt.

Die Cauchy-Schwarzsche Ungleichung Satz 6 (Cauchy-Schwarzsche Ungleichung). Sei (V, h·, ·i) ein Innenproduktraum. F¨ ur v, w ∈ V gilt |hv, wi| ≤ hv, vi1/2 · hw, wi1/2 . (10) In (10) gilt genau dann Gleichheit, wenn (v, w) linear abh¨angig ist. 2 3

Im Fall K = C heißt h·, ·i : V × V → C mit (1)–(3) hermitesche Sesquilinearform. Diese Eigenschaft heißt positive Definitheit.

VIII.1. Skalarprodukt und Orthogonalit¨at

170

Beweis. Wir betrachten den nicht-trivialen Fall w 6= 0. F¨ ur λ, µ ∈ K gilt 0 ≤ hλv + µw, λv + µwi = λλhv, vi + λµhv, wi + λµhw, vi + µµhw, wi. Setze λ = hw, wi und µ = −hv, wi. Beachte, daß λ > 0. Es folgt  hλv + µw, λv + µwi = λ · hw, wi · hv, vi − hv, wi · hw, vi und somit 0 ≤ hw, wi · hv, vi − |hv, wi|2 . Dies zeigt (10) und die Tatsache, daß aus |hv, wi| = hv, vi1/2 · hw, wi1/2 zun¨achst λv + µw = 0 und damit die lineare Abh¨angigkeit von (v, w) folgt, siehe (9). Sei (v, w) linear abh¨angig. Dann existiert λ ∈ K mit v = λw. Somit |hv, wi| = |λ|hw, wi und hv, vi1/2 · hw, wi1/2 = |λ|hw, wi. Definition 7. k · k : V → R heißt Norm auf V , falls ∀ v, w ∈ V : kv + wk ≤ kvk + kwk

(Dreiecksungleichung),

∀ v ∈ V ∀ λ ∈ K : kλvk = |λ| · kvk ,

(11) (12)

 ∀ v ∈ V : kvk ≥ 0 ∧ (kvk = 0 ⇔ v = 0) .

(13)

Ferner heißt (V, k · k) dann normierter Raum. Notation gelegentlich k · kV . Satz 8. Sei (V, h·, ·i) ein Innenproduktraum. Dann wird durch kvk = hv, vi1/2 ,

v ∈ V,

eine Norm auf V definiert. Bezeichnung: k · k heißt die durch h·, ·i induzierte Norm. Beweis. Bemerkung 2.(iii) sichert, daß k · k wohldefiniert ist und (13) erf¨ ullt. Aus (2) und (6) bzw. (8) folgt kλvk = λλhv, vi

1/2

= |λ| · kvk .

Es gilt kv + wk2 = hv, vi + hv, wi + hw, vi + hw, wi = hv, vi + 2 Rehv, wi + hw, wi ≤ hv, vi + 2 |hv, wi| + hw, wi. Mit Satz 6 folgt kv + wk2 ≤ (kvk + kwk)2 . Im Folgenden betrachten wir, soweit nichts anderes gesagt, die mit k · k bezeichnete induzierte Norm auf einem Innenproduktraum.

VIII.1. Skalarprodukt und Orthogonalit¨at

171

Lemma 9 (Polarisationsformeln). (i) Sei (V, h·, ·i) ein euklidischer Vektorraum. F¨ ur v, w ∈ V gilt hv, wi = 1/4 · (kv + wk2 − kv − wk2 ). (ii) Sei (V, h·, ·i) ein unit¨arer Vektorraum. F¨ ur v, w ∈ V gilt hv, wi = 1/4 · (kv + wk2 − kv − wk2 + ıkv + ıwk2 − ıkv − ıwk2 ). Insbesondere bestimmt die induzierte Norm das Skalarprodukt eindeutig. Beweis. Nachrechnen. Definition 10. Sei X 6= ∅. Dann heißt d : X × X → R eine Metrik auf X, falls ∀ x, y, z ∈ X : d(x, z) ≤ d(x, y) + d(y, z) (Dreiecksungleichung),  ∀ x, y ∈ X : d(x, y) ≥ 0 ∧ (d(x, y) = 0 ⇔ x = y) , ∀ x, y ∈ X : d(x, y) = d(y, x) (Symmetrie). Ferner heißt (X, d) dann metrischer Raum, und d(x, y) heißt der Abstand zwischen x und y. Notation gelegentlich dX . Satz 11. Sei (V, k · k) ein nomierter Raum. Dann wird durch d(v, w) = kv − wk ,

v, w ∈ V,

eine Metrik auf V definiert. Bezeichnung: d heißt die durch k · k induzierte Metrik . Beweis. Klar. Im Folgenden betrachten wir, soweit nichts anderes gesagt, die mit d bezeichnete induzierte Metrik auf einem normierten Raum. Bemerkung 12. Sei (V, h·, ·i) ein euklidischer Vektorraum. F¨ ur v, w ∈ V \ {0} gilt −1 ≤

hv, wi ≤ 1, kvk · kwk

siehe Satz 6. Erinnerung: arccos : [−1, 1] → [0, π] ist stetig und streng monoton fallend. Definition 13. In der Situation von Bemerkung 12 heißt  ](v, w) = arccos hv, wi/(kvk · kwk) der Winkel zwischen v und w.

VIII.1. Skalarprodukt und Orthogonalit¨at

172

Bemerkung 14. (i) Seien (V, h·, ·i) ein euklidischer Vektorraum, v, w ∈ V \ {0} und λ, µ ∈ R \ {0}. Falls λ · µ > 0, gilt ](λv, µw) = ](v, w). Falls λ · µ < 0, gilt  ](λv, µw) = arccos −hv, wi/(kvk · kwk) = π − ](v, w). (ii) F¨ ur α, β ∈ [0, 2π[ und x, y ∈ R2 mit x = (cos(α), sin(α))> ,

y = (cos(β), sin(β))>

gilt hx, yi = cos(α) cos(β) + sin(α) sin(β) = cos(α) cos(−β) − sin(α) sin(−β) = cos(α − β) = cos(|α − β|), siehe S¨atze III.5.3 und III.5.4 (Additionstheorem). Da cos(x) = cos(2π − x) f¨ ur x ∈ R, folgt ( |α − β| , falls |α − β| ≤ π, ](x, y) = 2π − |α − β| , falls π < |α − β| < 2π. Ausblick 15. Empirischer Korrelationskoeffizient. Bemerkung 16. (i) Sei (V, h·, ·i) ein Innenproduktraum oder (V, k · k) ein normierter Raum, und sei U ⊆ V ein Unterraum. Dann ist U , versehen mit der Einschr¨ankung des Skalarproduktes bzw. der Norm, wieder ein entsprechender Raum. (ii) Seien (X, d) ein metrischer Raum und ∅ 6= Y ⊆ X. Dann ist (Y, d|Y ×Y ) wieder ein metrischer Raum.

Orthogonalit¨ at Im Folgenden sei (V, h·, ·i) ein Innenproduktraum. Definition 17. (i) v, w ∈ V heißen orthogonal , falls hv, wi = 0. Notation: v ⊥ w. (ii) Eine Familie (vi )i∈I in V heißt orthogonal , falls vi ⊥ vj f¨ ur alle i, j ∈ I mit i 6= j gilt. Gilt zus¨atzlich kvi k = 1 f¨ ur alle i ∈ I, so heißt (vi )i∈I orthonormal . (iii) Eine Basis von V , die orthonormal ist, heißt Orthonormalbasis.

VIII.1. Skalarprodukt und Orthogonalit¨at

173

Beispiel 18. (i) Die Standardbasis von Kn ist eine Orthonormalbasis. (ii) ((1, 1, 1)> , (0, −1, 1)> , (−2, 1, 1)> ) ist orthogonal in R3 . (iii) Betrachte V = C([0, 2π]) mit dem Skalarprodukt h·, ·i gem¨aß Beispiel 4. Definiere √ √ √ vk (x) = 1/ π · sin(kx), v−k (x) = 1/ π · cos(kx) v0 (x) = 1/ 2π, f¨ ur x ∈ [0, 2π] und k ∈ Z \ {0}. Dann ist (vk )k∈Z orthonormal, siehe [Fo1, §23]. Lemma 19. Sei (vi )i∈I eine orthogonale Familie in V mit I 6= ∅, und gelte vi 6= 0 f¨ ur alle i ∈ I. Dann gilt (i) (1/ kvi k · vi )i∈I ist orthonormal, (ii) (vi )i∈I ist linear unabh¨angig. Beweis. ad (i): F¨ ur i, j ∈ I gilt h1/ kvi k · vi , 1/ kvj k · vj i = hvi , vj i/ (kvi k · kvj k) =

( 1, falls i = j, 0, sonst.

P ad (ii): Seien ∅ 6= I0 ⊆ I endlich und (λi )i∈I0 ∈ KI0 mit i∈I0 λi vi = 0. F¨ ur alle j ∈ I0 gilt X X 0=h λi vi , vj i = λi hvi , vj i = λj · kvj k2 , i∈I0

i∈I0

so daß λj = 0. √ √ √ Beispiel 20. (1/ 3 · (1, 1, 1)> , 1/ 2 · (0, −1, 1)> , 1/ 6 · (−2, 1, 1)> ) ist eine Orthonormalbasis von R3 , siehe Beispiel 18.(ii) und Lemma 19. Im Folgenden seien m ∈ N und v1 , . . . , vm ∈ V . Satz 21 (Pythagoras). Ist (v1 , . . . , vm ) orthogonal, gilt m m

X

2 X

v = kvi k2 .

i i=1

i=1

Beweis. Es gilt m m m m

X

2 X X X

vi = hvi , vj i = hvi , vi i = kvi k2 .

i=1

i,j=1

i=1

i=1

Definition 22. F¨ ur U ⊆ V heißt U ⊥ = {v ∈ V : v ⊥ u f¨ ur alle u ∈ U } das orthogonale Komplement von U .

VIII.1. Skalarprodukt und Orthogonalit¨at

174

Bemerkung 23. (i) F¨ ur U1 ⊆ U2 ⊆ V gilt U2⊥ ⊆ U1⊥ . Insbesondere gilt {0}⊥ = V und V ⊥ = {0}. (ii) F¨ ur U ⊆ V ist U ⊥ ein Unterraum von V , und es gilt U ⊥ = (span U )⊥ . Beweis: Tutorium 3.2. F¨ ur ∅ 6= U ⊆ V und v ∈ V sei ∆U,v : U → R definiert durch ∆U,v (u) = kv − uk,

u ∈ U.

Satz 24. Sei (v1 , . . . , vm ) orthonormal. Setze U = span({v1 , . . . , vm }), und definiere F : V → V durch F (v) =

m X

hv, vi ivi ,

v ∈ V.

i=1

Dann gilt (i) F ist4 linear und erf¨ ullt F 2 = F , Im F = U und ker F = U ⊥ , (ii) f¨ ur v ∈ V nimmt ∆U,v genau in F (v) sein globales Minimum an, P 2 ur alle v ∈ V . (iii) kv − F (v)k2 = kvk2 − m i=1 |hv, vi i| f¨ Beweis. ad (i): Offenbar ist F linear. Lemma 19.(ii) und Bemerkung 23.(ii) zeigen ker F = {v1 , . . . , vm }⊥ = U ⊥ . Da F (vi ) = vi f¨ ur alle i = 1, . . . , m, folgt Im F = U . F¨ ur v ∈ V und j ∈ {1, . . . , m} gilt m m X X hF (v), vj i = hhv, vi ivi , vj i = hv, vi ihvi , vj i = hv, vj i. i=1

i=1

Es folgt 2

F (v) =

m X

hF (v), vj ivj = F (v).

j=1

ad (ii): Sei u ∈ U . Mit (i) folgt F (v − F (v)) = 0 und weiter v − F (v) ∈ U ⊥ sowie F (v) − u ∈ U . Satz 21 sichert kv − uk2 = kv − F (v) + F (v) − uk2 = kv − F (v)k2 + kF (v) − uk2 .

(14)

ad (iii): Gem¨aß (14) gilt kvk2 = kv − F (v)k2 + kF (v)k2 , und Satz 21 zeigt kF (v)k2 =

m X i=1

4

khv, vi ivi k2 =

m X

|hv, vi i|2 .

i=1

Sei V ein K-Vektorraum. Lineare Abbildungen F : V → V mit F 2 = F heißen Projektionen. Siehe auch ¨ Ubung 4.2.

VIII.1. Skalarprodukt und Orthogonalit¨at

175

Korollar 25. Sei (v1 , . . . , vm ) orthonormal. F¨ ur alle v ∈ span({v1 , . . . , vm }) gilt v=

m X

hv, vi ivi

i=1

und 2

kvk =

m X

|hv, vi i|2 .

i=1

Satz 26 (Gram-Schmidtsches Orthonormalisierungsverfahren). Sei (w1 , . . . , wm ) eine linear unabh¨angige Familie in V . Dann existiert eine orthonormale Familie (v1 , . . . , vm ) in V , so daß ∀ 1 ≤ k ≤ m : span({w1 , . . . , wk }) = span({v1 , . . . , vk }). Beweis. Induktion. F¨ ur m = 1 ist die Aussage klar. Sei (w1 , . . . , wm+1 ) eine linear unabh¨angige Familie, und sei (v1 , . . . , vm ) wie oben bereits bestimmt. Definiere w˜m+1 =

m X

hwm+1 , vi ivi .

i=1

Es gilt w˜m+1 6= wm+1 . Setze vm+1 = 1/kwm+1 − w˜m+1 k · (wm+1 − w˜m+1 ). Satz 24 zeigt vm+1 ∈ span({v1 , . . . , vm })⊥ , und zusammen mit der Induktionsannahme folgt, daß (v1 , . . . , vm+1 ) orthonormal ist. Da w˜m+1 , vm+1 ∈ span({v1 , . . . , vm+1 }), folgt zusammen mit der Induktionsannahme span({w1 , . . . , wm+1 }) ⊆ span({v1 , . . . , vm+1 }). Korollar VI.2.21 zeigt, daß hier Gleichheit gilt. Korollar 27. Jeder endlich-dimensionale Innenproduktraum besitzt eine Orthonormalbasis. Beweis. Verwende Satz 26 und Korollar VI.2.14. Korollar 28. Sei U ⊆ V ein endlich-dimensionaler Unterraum. F¨ ur alle v ∈ V existiert eine eindeutig bestimmte Minimalstelle von ∆U,v , und diese h¨angt linear von v ab. Beweis. Verwende Satz 24 und Korollar 27. Definition 29. Seien U ⊆ V ein endlich-dimensionaler Unterraum und v ∈ V . Die eindeutig bestimmte Minimalstelle gem¨aß Korollar 28 heißt die orthogonale Projektion von v auf U . Die entsprechende Abbildung heißt die orthogonale Projektion auf U .

VIII.2. Orthogonale und unit¨are Abbildungen

176

Beispiel 30. In der Situation von Beispiel 18.(iii) sei U = span({v−m , . . . , vm }) f¨ ur m ∈ N. Dann ist Z 2π m Z 2π X F (f ) = 1/(2π) · f (t) dt + 1/π · sin(kt)f (t) dt · sin(k ·) 0

+ 1/π ·

k=1 0 m Z 2π X k=1

cos(kt)f (t) dt · cos(k ·)

0

die orthogonale Projektion von f ∈ C([0, 2π]) auf U . Stichwort: Fourier-Reihen. Bemerkung 31. Seien V endlich-dimensional und U ⊆ V . (i) Es gilt (U ⊥ )⊥ = span U . (ii) Ist U ein Unterraum, gilt V = U ⊕ U ⊥ und somit dim U ⊥ = dim V − dim U . Beweis: ¨ Ubung 5.1. Bemerkung 32. F¨ ur V = Kn und 1 ≤ m ≤ n − 1 sei (v1 , . . . , vm ) linear unabh¨angig. Setze U = span({v1 , . . . , vm }). Bemerkung VI.7.13 kl¨art die Berechnung einer Basis von U ⊥ . Spezialf¨alle: Hessesche Normalform von Geraden in K 2 bzw. Ebenen in K 3 . Beispiel 33. Seien V = R3 , v1 = (0, −1, 1)> , v2 = (1, 0, −1)> und U = {v1 , v2 }. Da dim span U = 2 folgt dim U ⊥ = 1, siehe Bemerkungen 23.(ii) und 31.(ii). Sei v3 = (1, 1, 1)> . Da hv1 , v3 i = hv2 , v3 i = 0, folgt v3 ∈ U ⊥ . Fazit: U ⊥ = span({v3 }) und somit span U = {v3 }⊥ . Literatur. [Fi, 5.1, 5.3, 5.4].

2

Orthogonale und unit¨ are Abbildungen

Im Folgenden seien (V, h·, ·iV ) und (W, h·, ·iW ) zwei euklidische oder zwei unit¨are Vektorr¨aume; entsprechend sei K = R bzw. K = C. Ferner sei F : V → W linear. Definition 1. F heißt im Fall K = R orthogonal und im Fall K = C unit¨ar , falls ∀ v, w ∈ V : hF (v), F (w)iW = hv, wiV . Lemma 2. (i) F ist genau dann orthogonal bzw. unit¨ar, wenn ∀ v ∈ V : kF (v)kW = kvkV . (ii) Jede orthogonale bzw. unit¨are Abbildung ist injektiv. (iii) Ist F bijektiv und orthogonal bzw. unit¨ar, so ist F −1 orthogonal bzw. unit¨ar.

VIII.2. Orthogonale und unit¨are Abbildungen

177

Beweis. ad (i): Verwende Lemma 1.9. ad (ii): Verwende (i) und Bemerkung 1.2.(iii). ad (iii): Klar. Im Folgenden sei (V, h·, ·i) ein endlich-dimensionaler euklidischer oder unit¨arer Vektorraum mit n = dim V ∈ N; entsprechend sei K = R bzw. K = C. Satz 3. Sei A = (v1 , . . . , vn ) eine Orthonormalbasis von V . Dann ist5 ΦA : Kn → V orthogonal bzw. unit¨ar. Beweis. Gem¨aß Satz 1.21 gilt f¨ ur x ∈ Kn kΦA (x)k2V

n n n

X

2 X X

2 = xi v i = kxi vi kV = |xi |2 = kxk2Kn . i=1

V

i=1

i=1

Wende Lemma 2.(i) an. Notation: E = {λ ∈ K : |λ| = 1}. Bemerkung 4. (i) Die orthogonalen bzw. unit¨aren Abbildungen auf V bilden eine Untergruppe der Gruppe der linearen Isomorphismen auf V , versehen mit der Komposition. (ii) Ist F orthogonal bzw. unit¨ar, gilt σ(F ) ⊆ E.

Darstellungsmatrizen orthogonaler bzw. unit¨ arer Abbildungen ur A ∈ Rn×n , vgl. Seite 169. Im Fall K = R setzen wir A = A f¨ Definition 5. A ∈ Gl(n, K) heißt im Fall K = R orthogonal und im Fall K = C > unit¨ar , falls A−1 = A . Bemerkung 6. (i) Ist A orthogonal bzw. unit¨ar, gilt det A ∈ E. Beweis: 1 = det(A) · det(A−1 ) = > det(A) · det(A ) = det(A) · det(A). (ii) F¨ ur A ∈ Kn×n sind ¨aquivalent (a) A ist orthogonal bzw. unit¨ar, (b) die Zeilen von A bilden eine Orthonormalbasis von Kn , (c) die Spalten von A bilden eine Orthonormalbasis von Kn . 5

In diesem Sinn sind endlich-dimensionale Innenproduktr¨aume isomorph zu einem Raum Kn .

VIII.2. Orthogonale und unit¨are Abbildungen

178

Lemma 7. (i) F¨ ur x, y ∈ Kn und A ∈ Kn×n gilt >

hx, Ayi = hA x, yi. (ii) F¨ ur A, B ∈ Kn×n gilt  ∀ x, y ∈ Kn : hAx, yi = hBx, yi ⇒ A = B. >

>

Beweis. ad (i): Es gilt hx, Ayi = x> Ay = x> Ay = (A x)> y = hA x, yi. ad (ii): Betrachte die Standardbasis von Kn . Im Folgenden sei F : V → V linear. ¨ Satz 8. Aquivalent sind (i) F ist orthogonal bzw. unit¨ar, ar, (ii) f¨ ur alle Orthonormalbasen A und B von V ist MA B (F ) orthogonal bzw. unit¨ (iii) es existieren Orthonormalbasen A und B von V , so daß MA B (F ) orthogonal bzw. unit¨ar ist. Beweis. Seien A und B Orthonormalbasen von V sowie v, w ∈ V . Setze A = MA B (F ) −1 −1 und x = ΦA (v) sowie y = ΦA (w). Dann gilt >

hF (v), F (w)iV = hΦB (Ax), ΦB (Ay)iV = hAx, AyiKn = hA Ax, yiKn sowie hv, wiV = hΦA (x), ΦA (y)iV = hx, yiKn , siehe Satz 3 und Lemma 7.(i). >

(i) ⇒ (ii)“: Lemma 7.(ii) zeigt A A = En . ” Die Implikationen (ii) ⇒ (iii)“ und (iii) ⇒ (i)“ gelten offenbar. ” ”

Diagonalisierung unit¨ arer Abbildungen Definition 9. F heißt orthogonal diagonalisierbar , falls eine aus Eigenvektoren von F bestehende Orthonormalbasis von V existiert. Satz 10. (i) Im Fall K = C ist F genau dann unit¨ar, wenn σ(F ) ⊆ E und F orthogonal diagonalisierbar ist. (ii) Im Fall K = R ist F orthogonal, wenn σ(F ) ⊆ E und F orthogonal diagonalisierbar ist.

VIII.3. Selbstadjungierte Abbildungen

179

Beweis. Seien A eine Orthonormalbasis von V und λ1 , . . . , λn ∈ E mit MA (F ) = D > f¨ ur D = diag(λ1 , . . . , λn ). Da DD = diag(|λ1 |2 , . . . , |λn |2 ) = En , ist D orthogonal bzw. unit¨ar. Satz 8 sichert, daß auch F diese Eigenschaft besitzt. ⇒“ in (i): Induktion nach n. F¨ ur n = 1 ist die Aussage trivial. Sei n > 1. Korollar ” VII.2.22 und Bemerkung 4.(ii) sichern die Existenz von λ ∈ σ(F ) \ {0}. W¨ahle v ∈ Eig(F, λ) mit kvk = 1, und setze W = {v}⊥ . F¨ ur w ∈ W gilt 0 = hv, wi = hF (v), F (w)i = λhv, F (w)i, so daß F (w) ∈ W . Mit dem Skalarprodukt von V wird W zu einem unit¨aren Vektorraum, siehe Bemerkung 1.16.(i). Definiere G : W → W durch G(w) = F (w). Dann ist G unit¨ar, und es gilt dim W = n − 1, siehe Bemerkung 1.31.(ii). Nach Induktionsannahme existiert eine aus Eigenvektoren von G, und damit von F , bestehende Orthonormalbasis (w1 , . . . , wn−1 ) von W . Somit leistet (w1 , . . . , wn−1 , v) das Verlangte. Korollar 11. A ∈ Cn×n ist genau dann unit¨ar, wenn S ∈ Cn×n unit¨ar und λ1 , . . . , λn ∈ E existieren, so daß > diag(λ1 , . . . , λn ) = S AS. Beweis. Verwende Satz 10.(i), Bemerkung 6.(ii) und Lemma VII.3.6. Beispiel 12. Seien V = K2 und  A=

cos(α) − sin(α) sin(α) cos(α)



mit α ∈ [0, 2π[ \ {0, π}. Im Fall K = R ist A orthogonal, aber nicht diagonalisierbar, siehe Beispiel VII.2.14 und Satz VII.3.13. Im Fall K = C ist A unit¨ar und es gilt σ(A) = {λ, λ} f¨ ur λ = cos(α) + ı sin(α) sowie > diag(λ, λ) = S AS f¨ ur   √ ı −ı . S = 1/ 2 1 1 Ausblick 13. Normalform orthogonaler Abbildungen, siehe [Fi, S. 308]. Literatur. [Fi, 5.5].

3

Selbstadjungierte Abbildungen

Im Folgenden sei (V, h·, ·i) ein endlich-dimensionaler euklidischer oder unit¨arer Vektorraum mit n = dim V ∈ N; entsprechend sei K = R bzw. K = C. Ferner sei F : V → V linear. Definition 1. F heißt selbstadjungiert falls ∀ v, w ∈ V : hF (v), wi = hv, F (w)i.

VIII.3. Selbstadjungierte Abbildungen

180

Darstellungsmatrizen selbstadjungierter Abbildungen Definition 2. A ∈ Kn×n heißt symmetrisch, falls A = A> , und hermitesch, falls > K = C und A = A . ¨ Satz 3. Aquivalent sind (i) F ist selbstadjungiert, (ii) f¨ ur alle Orthonormalbasen A von V ist MA (F ) im Fall K = R symmetrisch und im Fall K = C hermitesch, (iii) es existiert eine Orthonormalbasis A von V , so daß MA (F ) im Fall K = R symmetrisch und im Fall K = C hermitesch ist. Beweis. Seien A eine Orthonormalbasis von V und v, w ∈ V . Setze A = MA (F ). −1 Satz 2.3 und Lemma 2.7.(i) zeigen f¨ ur x = Φ−1 A (v) und y = ΦA (w) hF (v), wiV = hΦA (Ax), ΦA (y)iV = hAx, yiKn sowie

>

hv, F (w)iV = hΦA (x), ΦA (Ay)iV = hx, AyiKn = hA x, yiKn . >

(i) ⇒ (ii)“: Lemma 2.7.(ii) zeigt A = A. ” Die Implikationen (ii) ⇒ (iii)“ und (iii) ⇒ (i)“ gelten offenbar. ” ” Beispiel 4. Orthogonale Projektionen auf Unterr¨aume von V sind selbstadjungiert.

Diagonalisierung selbstadjungierter Abbildungen Lemma 5. Seien K = C und F selbstadjungiert. Dann gilt ∅ 6= σ(F ) ⊆ R. Beweis. Korollar VII.2.22 sichert σ(F ) 6= ∅. Seien v ∈ V \ {0} und λ ∈ C mit F (v) = λv. Dann λhv, vi = hF (v), vi = hv, F (v)i = λhv, vi, so daß λ ∈ R. Satz 6. F ist genau dann selbstadjungiert, wenn σ(F ) ⊆ R und F orthogonal diagonalisierbar ist. Beweis. ⇐“: Es existieren eine Orthonormalbasis A von V und λ1 , . . . , λn ∈ R mit ” > MA (F ) = D f¨ ur D = diag(λ1 , . . . , λn ). Verwende D = D und Satz 3. ⇒“: Zun¨achst sei K = C. Induktion nach n. F¨ ur n = 1 ist die Aussage trivial. Sei ” n > 1. W¨ahle λ ∈ σ(F ), siehe Lemma 5, sowie v ∈ Eig(F, λ) mit kvk = 1, und setze W = {v}⊥ . F¨ ur w ∈ W gilt hv, F (w)i = hF (v), wi = λhv, wi = 0,

VIII.3. Selbstadjungierte Abbildungen

181

so daß F (w) ∈ W . Mit dem Skalarprodukt von V wird W zu einem unit¨aren Vektorraum, siehe Bemerkung 1.16.(i). Definiere G : W → W durch G(w) = F (w). Dann ist G selbstadjungiert, und es gilt dim W = n − 1, siehe Bemerkung 1.31.(ii). Nach Induktionsannahme existiert eine aus Eigenvektoren von G, und damit von F , bestehende Orthonormalbasis (w1 , . . . , wn−1 ) von W . Somit leistet (w1 , . . . , wn−1 , v) das Verlangte. Sei K = R. W¨ahle eine Orthonormalbasis A von V , und setze B = MA (F ). Gem¨aß Satz 3 ist B symmetrisch. Wir fassen die Koeffizienten von B als Element von C auf, siehe Bemerkung III.4.1, und erhalten so eine hermitesche Matrix A ∈ Cn×n . Da ∀ t ∈ R : PF (t) = PB (t) = PA (t), zeigt Lemma 5, daß σ(F ) 6= ∅. Schließe nun wie oben. Korollar 7. (i) A ∈ Rn×n ist genau dann symmetrisch, wenn λ1 , . . . , λn ∈ R und S ∈ Rn×n orthogonal existieren, so daß diag(λ1 , . . . , λn ) = S > AS. (ii) A ∈ Cn×n ist genau dann hermitesch, wenn λ1 , . . . , λn ∈ R und S ∈ Cn×n unit¨ar existieren, so daß > diag(λ1 , . . . , λn ) = S AS. Beweis. Verwende Satz 6, Bemerkung 2.6.(ii) und Lemma VII.3.6. Ausblick 8. Normale Matrizen, siehe [Fi, 6.2].

Positiv definite Abbildungen Definition 9. (i) F heißt positiv definit, falls F selbstadjungiert ist und ∀ v ∈ V \ {0} : hv, F (v)i > 0.

(1)

(ii) A ∈ Kn×n heißt positiv definit, falls FA positiv definit ist. Satz 10. Sei F selbstadjungiert. Dann gilt F positiv definit ⇔ σ(F ) ⊆ ]0, ∞[ . Beweis. Seien A = (v1 , . . . , vn ) eine Orthonormalbasis von V und λ1 , . . . , λn ∈ R, so daß F (vi ) = λi vi f¨ ur i = 1, . . . , n. ⇒“: F¨ ur i = 1, . . . , n gilt λi = hvi , F (vi )i > 0. ” ⇐“: F¨ ur v und i = 1, . . . , n gilt hvi , F (v)i = λi hvi , vi und weiter ” n n X X hv, F (v)i = hv, vi ihvi , F (v)i = λi |hv, vi i|2 ≥ min λi · kvk2 , i=1

siehe Korollar 1.25.

i=1

i=1,...,n

VIII.3. Selbstadjungierte Abbildungen

182

Wir definieren hv, wiF = hv, F (w)i,

v, w ∈ V.

Satz 11. (i) h·, ·iF ist genau dann ein Skalarprodukt auf V , wenn F positiv definit ist. (ii) Die Zuordnung F 7→ h·, ·iF definiert eine Bijektion zwischen der Menge der positiv definiten Abbildungen F : V → V und der Menge der Skalarprodukte auf V . Beweis. ad (i): Die Linearit¨at von h·, wiF f¨ ur alle w ∈ V ist trivial. Die Symmetrie bzw. Hermitizit¨at von h·, ·iF ist ¨aquivalent zur Selbstadjungiertheit von F , und die positive Definitheit von h·, ·iF ist ¨aquivalent zu (1). ad (ii): Sei (·, ·) ein Skalarprodukt auf V . Ferner seien A = (v1 , . . . , vn ) eine Orthonormalbasis von (V, h·, ·i) und v, w ∈ V . Setze6 A = ((vi , vj ))i,j ∈ Kn×n >

−1 sowie x = Φ−1 A (v) und y = ΦA (w). Dann gilt A = A sowie n X >

−1 −1 · A · (v) Φ (w) = v, Φ (A · Φ (w)) , (v, w) = xi yj (vi , vj ) = Φ−1 A A A A i,j=1

siehe Satz 2.3. Seien u, u0 ∈ V und gelte hv, ui = hv, u0 i f¨ ur alle v ∈ V . Es folgt hv, u − u0 i = 0 f¨ ur 0 0 alle v ∈ V , und die Wahl von v = u − u zeigt u = u . Fazit: (·, ·) = h·, ·iF gilt genau dann, wenn F = ΦA ◦ FA ◦ Φ−1 aß (i) ist diese A . Gem¨ Abbildung positiv definit. Bemerkung 12. Sei A ∈ Rn×n positiv definit. Betrachte das durch hx, yiA = hx, Ayi = x> A y,

x, y ∈ Rn ,

definierte Skalarprodukt auf Rn . Es existieren eine Orthonormalbasis (v1 , . . . , vn ) von Rn bzgl. des kanonischen Skalarproduktes h·, ·i sowie λ1 , . . . , λn ∈ ]0, ∞[, so daß Avi = λi vi f¨ ur i = 1, . . . , n. Da hvi , vj iA = λj · hvi , vj i, i, j = 1, . . . , n, √ ur ist (w1 , . . . , wn ) mit wi = 1/ λi · vi eine Orthonormalbasis von (Rn , h·, ·iA ). F¨ n X x= µi vi i=1

mit µ1 , . . . , µn ∈ R gilt kxk2A =

n X

λi · µ2i .

i=1

Stichwort: Hauptachsentransformation. Literatur. [Fi, 5.4, 5.6]. 6

A heißt Gramsche Matrix zum Skalarprodukt (·, ·).

Kapitel IX Metrische und normierte R¨ aume Wir studieren die Konvergenz, Stetigkeit und Kompaktheit im Kontext metrischer R¨aume und verweisen dazu insbesondere auf [AE, Fo1, Fo2]. Im Folgenden betrachten wir, soweit nichts anderes gesagt, auf R und auf C stets den Betrag als Norm und die so induzierte Metrik auf beliebigen Teilmengen.

1

Grundbegriffe

Beispiel 1. Aus Abschnitt VIII.1 bekannte Beispiele normierter R¨aume sind (i) X = Kn f¨ ur n ∈ N, versehen mit n X

kxk2 =

!1/2 2

|xi |

x ∈ X,

,

i=1

(ii) X = C ([a, b]) f¨ ur a, b ∈ R mit a < b, versehen mit Z

b

kf k2 =

2

1/2

f (x) dx

,

f ∈ X.

a

Diese Normen werden jeweils von einem Skalarprodukt induziert. (iii) Auf einem angeordneten K¨orper induziert die Betragsfunktion eine Metrik, siehe Satz II.1.9. (iv) Seien M 6= ∅ und n ∈ N. Auf X = M n wird durch d(x, y) = |{i ∈ {1, . . . , n} : xi 6= yi }| ,

x, y ∈ X,

eine Metrik definiert. Man nennt d(x, y) den Hamming-Abstand zwischen x und y. Im Fall n = 1 gilt ( 0, falls x = y, d(x, y) = 1, sonst. f¨ ur x, y ∈ M , und d heißt diskrete Metrik auf M . 183

IX.1. Grundbegriffe

184

Offene Mengen Im Folgenden seien (X, d) ein metrischer Raum und Y ⊆ X. Von besonderem Interesse ist der Spezialfall eines normierten Raumes, siehe Satz VIII.1.11 (induzierte Metrik). Definition 2. F¨ ur x ∈ X und r > 0 heißt Br (x) = {y ∈ X : d(x, y) < r} die offene Kugel mit Radius r um den Mittelpunkt x. Definition 3.

1

(i) x ∈ Y heißt innerer Punkt von Y , falls ε > 0 mit Bε (x) ⊆ Y existiert. (ii) Y heißt Umgebung von x ∈ Y , falls x ein innerer Punkt von Y ist. ˚. (iii) Die Menge der inneren Punkte von Y heißt das Innere von Y . Notation: Y ˚ = Y . Notation: O = O(X, d) bezeichnet die Menge der (iv) Y heißt offen, falls Y offenen Teilmengen von X. Lemma 4. (i) F¨ ur x ∈ X und r > 0 gilt Br (x) ∈ O. (ii) F¨ ur x, y ∈ X mit x 6= y existieren ε1 , ε2 > 0 mit Bε1 (x) ∩ Bε2 (y) = ∅. Beweis. ad (i): Sei y ∈ Br (x). Setze ε = r − d(x, y). Dann gilt ε > 0 und f¨ ur alle z ∈ Bε (y) d(z, x) ≤ d(z, y) + d(y, x) < ε + d(y, x) = r, d.h. Bε (y) ⊆ Br (x). ad (ii): W¨ahle ε = d(x, y)/2. Dann gilt ε > 0, und aus z ∈ Bε (x) ∩ Bε (y) folgt d(x, y) ≤ d(x, z) + d(z, y) < 2ε = d(x, y). Widerspruch. Satz 5. (i) ∅, X ∈ O. (ii) F¨ ur U1 , U2 ∈ O gilt U1 ∩ U2 ∈ O. (iii) Sei (Ui )i∈I mit I 6= ∅ eine Familie in O. Dann gilt

S

i∈I

Ui ∈ O.

Beweis. ad (i): klar. ad (ii): F¨ ur x ∈ U1 ∩ U2 w¨ahle man ε1 , ε2 > 0 mit Bε1 (x) ⊆ U1 und Bε2 (x) ⊆ U2 . F¨ ur ε = min(ε1 , ε2 ) folgt ε > 0 und Bε (x) ⊆ U1 ∩ U2 . S ad (iii): F¨ ur x ∈ i∈I Ui existiert j ∈ I mit x ∈ Uj . Somit existiert ε > 0, so daß S S Bε (x) ⊆ Uj . Da Uj ⊆ i∈I Ui , folgt Bε (x) ⊆ i∈I Ui . 1

Im Fall X = R konsistent mit den Definitionen III.1.2 und III.1.6.(i).

IX.1. Grundbegriffe

185

Bemerkung 6. Per Induktion folgt: Der Durchschnitt endlich vieler offener Mengen ist offen. Beispiel 7. F¨ ur X = R und n ∈ N sei Un = ]−1/n, 1/n[. Dann gilt Un ∈ O f¨ ur alle T n ∈ N, aber n∈N Un = {0} 6∈ O. Satz 8. F¨ ur Y = {U ∈ O : U ⊆ Y } gilt [

˚. U =Y

U ∈Y

˚. W¨ahle ε > 0 mit Bε (x) ⊆ Y . Lemma 4.(i) zeigt Bε (x) ∈ Y, Beweis. ⊇“: Sei x ∈ Y ” S so daß x ∈ U ∈Y U . ⊆“: Seien U ∈ Y und x ∈ U . Dann existiert ε > 0 mit Bε (x) ⊆ U . Da U ⊆ Y , folgt ” ˚ x∈Y. ˚ die Bemerkung 9. Die S¨atze 5 und 8 zeigen: Bez¨ uglich der Mengeninklusion ist Y gr¨oßte in Y enthaltene offene Menge.

Abgeschlossene Mengen Definition 10.

2

(i) x ∈ X heißt Ber¨ uhrpunkt von Y , falls Bε (x) ∩ Y 6= ∅ f¨ ur alle ε > 0 gilt. (ii) Die Menge der Ber¨ uhrpunkte von Y heißt der Abschluß von Y . Notation: Y . (iii) Y heißt abgeschlossen, falls Y = Y . Definition 11. Y c = X \ Y heißt das Komplement von Y (in X).  ˚ c = (Y c ). Lemma 12. Es gilt Y Beweis. F¨ ur x ∈ X gilt  ˚ ⇔ ∀ ε > 0 : Bε (x) ∩ Y c 6= ∅ ⇔ x ∈ Y c . x 6∈ Y

Satz 13. Y abgeschlossen ⇔ Y c offen. Beweis. Lemma 12 zeigt c

Y offen ⇔ Y = (Y c ) ⇔ Y c = (Y c ) ⇔ Y c abgeschlossen.

2

Im Fall X = R konsistent mit den Definitionen III.1.2 und III.1.6.(ii).

IX.1. Grundbegriffe

186

Korollar 14. (i) ∅, X sind abgeschlossen. (ii) F¨ ur abgeschlossene Mengen U1 , U2 ist U1 ∪ U2 abgeschlossen. (iii) Sei (Ui )i∈I mit I 6= ∅ eine Familie abgeschlossener Mengen. Dann ist abgeschlossen.

T

i∈I

Ui

Korollar 15. F¨ ur Y = {A ⊆ X : A abgeschlossen, Y ⊆ A} gilt \ A=Y. A∈Y

Beweis. Die S¨atze 8 und 13 zeigen !c \ A∈Y

A

=

[

◦ Ac = Y c .

A∈Y

Wende Lemma 12 an. Bemerkung 16. Die Korollare 14 und 15 zeigen: Bez¨ uglich der Mengeninklusion ist Y die kleinste Y enthaltende abgeschlossene Menge. Definition 17. F¨ ur x ∈ X und r ≥ 0 heißt B r (x) = {y ∈ X : d(x, y) ≤ r} die abgeschlossene Kugel mit Radius r um den Mittelpunkt x. Lemma 18. F¨ ur x, y, z ∈ X gilt d(x, z) ≥ |d(x, y) − d(y, z)|

(umgekehrte Dreiecksungleichung).

Beweis. Aus d(x, y) ≤ d(x, z) + d(z, y) folgt d(x, y) − d(y, z) ≤ d(x, z). Ebenso ergibt sich d(y, z) − d(x, y) ≤ d(x, z). Bemerkung 19. Sei (V, k · k) ein normierter Raum. Lemma 18 und Satz VIII.1.11 (induzierte Metrik) zeigen f¨ ur v, w ∈ V kv − wk ≥ kvk − kwk (umgekehrte Dreiecksungleichung). Lemma 20. F¨ ur x ∈ X und r ≥ 0 ist B r (x) abgeschlossen. c Beweis. Sei y ∈ B r (x) , d.h. d(y, x) > r. Setze ε = d(y, x) − r > 0. Lemma 18 zeigt f¨ ur z ∈ Bε (y) d(z, x) ≥ d(x, y) − d(y, z) > d(x, y) − ε = r, c d.h. z 6∈ B r (x). Fazit: Bε (y) ⊆ B r (x) .

IX.1. Grundbegriffe

187

Randpunkte ˚ heißt der Rand von Y . Die Elemente von ∂Y heißen Definition 21. ∂Y = Y \ Y Randpunkte von Y . Beispiel 22. (i) Sei (V, k · k) ein normierter Raum. F¨ ur v ∈ V und r > 0 gilt Br (v) = B r (v) und ∂Br (v) = ∂B r (v) = {w ∈ V : kv − wk = r}. (ii) F¨ ur X = R gilt ∂ Q = R. Beweis: ¨ Ubung. Bemerkung 23. Es gilt (i) ∂Y = Y ∩ Y c ; insbesondere ist ∂Y abgeschlossen, ˚ = Y \ ∂Y , (ii) Y (iii) Y = Y ∪ ∂Y . Beweis: ¨ Ubung 5.4. Ausblick 24. Sei X 6= ∅. Eine Menge O ⊆ P(X) mit den Eigenschaften gem¨aß Satz 5 heißt Topologie auf X, die Elemente von O heißen offene Mengen und (X, O) heißt topologischer Raum. Ferner heißt Y ⊆ X Umgebung von x ∈ X, falls U ∈ O mit x ∈ U ⊆ Y existiert. Als Satz ergibt sich: Y ⊆ X ist genau dann offen, wenn Y Umgebung aller Punkte aus Y ist. Die Topologie erf¨ ullt das Hausdorffsche Trennungsaxiom, falls alle x, y ∈ X mit x 6= y disjunkte Umgebungen besitzen. Mehr dazu in der Vorlesung Einf¨ uhrung in die Topologie“. ” Im Spezialfall eines metrischen Raumes liefert Definition 3.(iv) eine Topologie, und der oben eingef¨ uhrte Umgebungsbegriff ist konsistent mit Definition 3.(ii). Der o.g. Satz entspricht unserer Definition offener Mengen in metrischen R¨aumen. Lemma 4.(ii) zeigt, daß das Hausdorffsche Trennungsaxiom erf¨ ullt ist. Die Definitionen 3.(i) und (iii), 10 und 21 basieren nur auf dem Umgebungsbegriff und legen somit topologische Begriffe fest.

Beschr¨ ankte Mengen und Funktionen Definition 25.

3

(i) Y ⊆ X heißt beschr¨ankt, falls x ∈ X und r > 0 mit Y ⊆ Br (x) existieren. (ii) F¨ ur eine Menge M heißt f : M → X beschr¨ankt, falls f (M ) beschr¨ankt ist. 3

In der Situation von Beispiel 1.(iii) konsistent mit den Definitionen II.1.12.(iii) und II.1.14.

IX.1. Grundbegriffe

188

Bemerkung 26. Sei (V, k · k) ein normierter Raum. Genau dann ist Y ⊆ V beschr¨ankt, wenn r > 0 mit Y ⊆ Br (0) existiert. Beweis: Br (x) ⊆ Br+kxk (0). Satz 27. Seien M 6= ∅ eine Menge und (V, k · k) ein normierter Vektorraum. Die Menge B(M, V ) = {f ∈ V M : f beschr¨ankt} ist ein Unterraum von V M , und kf k∞ = sup{kf (m)k : m ∈ M } definiert eine Norm auf B(M, V ). Beweis. Seien f, g ∈ B(M, V ), λ ∈ K und m ∈ M . Es gilt k(f + g)(m)k ≤ kf (m)k + kg(m)k ≤ kf k∞ + kgk∞ , so daß f + g ∈ B(M, V ) und kf + gk∞ ≤ kf k∞ + kgk∞ . Ferner gilt k(λf )(m)k = |λ| · kf (m)k ≤ |λ| · kf k∞ , so daß λf ∈ B(M, V ) und kλf k∞ ≤ |λ| kf k∞ . Zu ε > 0 w¨ahle man m ∈ M mit kf (m)k ≥ kf k∞ − ε. Da kλf k∞ ≥ k(λf )(m)k ≥ |λ| · (kf k∞ − ε), folgt kλf k∞ ≥ |λ| · kf k∞ . Es gilt kf k∞ ≥ 0 und k0k∞ = 0. Da kf (m)k ≤ kf k∞ , folgt f = 0 aus kf k∞ = 0. Definition 28. Die Norm gem¨aß Satz 27 heißt Supremumsnorm 4 auf den Vektorraum B(M, V ) der beschr¨ankten Abbildungen von M nach V .

¨ Aquivalenz von Normen Definition 29. Zwei Normen k · k und k · k∗ auf einem Vektorraum V heißen ¨aquivalent, falls ∃ c1 , c2 > 0 ∀ v ∈ V : c1 kvk ≤ kvk∗ ≤ c2 kvk. Beispiel 30. (i) Die Normen k · k2 und k · k∞ auf Kn sind a¨quivalent. Genauer gilt √ kvk∞ ≤ kvk2 ≤ n · kvk∞ , v ∈ V. Ferner gilt kvk∞ = kvk2 genau dann, wenn |{i ∈ {1, . . . , n} : vi 6= 0}| ≤ 1, und √ kvk2 = n · kvk∞ gilt genau dann, wenn |v1 | = · · · = |vn |. 4

Die Supremumsnorm wurde unausgesprochen bereits in den Kapiteln II–V betrachtet, siehe etwa Satz III.3.13.

IX.1. Grundbegriffe

189

(ii) Betrachte den Unterraum V = C([a, b]) von B([a, b], R) f¨ ur a, b ∈ R mit a < b. F¨ ur f ∈ V gilt 1/2 Z b √ 2 kf k∞ dx kf k2 ≤ = b − a · kf k∞ . a

F¨ ur n ∈ N sei fn ∈ V durch fn (x) = ((x − a)/(b − a))n definiert. Dann gilt kfn k∞ = 1 und Z b 2 ((x − a)/(b − a))2n dx = (b − a)/(2n + 1). kfn k2 = a

Also sind die Normen k · k∞ und k · k2 auf V nicht a¨quivalent. Satz 31. Zwei Normen sind genau dann ¨aquivalent, wenn sie dieselben offenen Mengen definieren. Beweis. Zu Normen k · k und k · k∗ auf V betrachten wir die zugeh¨origen offenen Kugeln Br (x) und Br∗ (x) sowie die zugeh¨origen Mengen O bzw. O∗ offener Mengen. Gelte O ⊆ O∗ . Da B1 (0) ∈ O, siehe Lemma 4.(i), existiert ε > 0 mit Bε∗ (0) ⊆ B1 (0). F¨ ur v ∈ V \ {0} und c = 2/ε folgt

kvk = 2 kvk∗ /ε · ε/(2 kvk∗ ) · v ≤ c · kvk∗ . Umgekehrt sei c > 0, so daß ∀ v ∈ V : kvk ≤ c · kvk∗ . ∗ (u) ⊆ Bε (u) f¨ ur ε > 0 und u ∈ V . F¨ ur ∅ 6= U ∈ O und u ∈ U existiert Es folgt Bε/c ∗ ∗ somit ε > 0, so daß Bε∗ (u) ⊆ U . Dies zeigt U ∈ O∗ .

Beispiel 32. In der Situation von Beispiel 30.(ii) seien Br∗ (f ) und O∗ die zu k · k∞ geh¨origen offenen Kugeln bzw. die zugeh¨orige Menge offener Mengen. F¨ ur U = {f ∈ V : ∀ t ∈ [a, b] : f (t) > 0} zeigen wir U ∈ O∗ . Sei f ∈ U . Korollar III.3.5 (Extremalsatz) zeigt min f (t) > 0. t∈[a,b]

F¨ ur ε = mint∈[a,b] f (t), g ∈ Bε∗ (f ) und t ∈ [a, b] gilt |f (t) − g(t)| ≤ kf − gk∞ < ε, so daß g(t) > f (t) − ε ≥ 0. Dies zeigt Bε∗ (f ) ⊆ U . Nun seien Br (f ) und O die zu k · k2 geh¨origen offenen Kugeln bzw. die zugeh¨orige Menge offener Mengen. Wir zeigen U 6∈ O, genauer: f¨ ur alle f ∈ U und ε > 0 existiert g ∈ Bε (f ) \ U . Seien f ∈ U und ε > 0. Setze c = maxt∈[a,b] f (t). F¨ ur fn wie in Beispiel 30 und gn = f − 2c · fn p gilt gn (b) ≤ c − 2c < 0 sowie kgn − f k2 = 2c · (b − a)/(2n + 1). W¨ahle n hinreichend groß. Literatur. [AE, II.3, III.2] und [Fo2, §1].

IX.2. Konvergenz und Stetigkeit

2

190

Konvergenz und Stetigkeit

Im Folgenden sei (X, d) ein metrischer Raum.

Konvergenz und Vollst¨ andigkeit Im Folgenden sei (xn )n∈N eine Folge in X. Notation: (xn )n statt (xn )n∈N . Die nachstehenden Definitionen und Ergebnisse gelten analog f¨ ur Folgen mit Indexmengen der Form {n ∈ Z : n ≥ k} f¨ ur k ∈ Z. Definition 1. (xn )n heißt konvergent 5 , falls x ∈ X existiert, so daß ∀ ε > 0 ∃ n0 ∈ N ∀ n ≥ n0 : xn ∈ Bε (x).

(1)

Andernfalls heißt (xn )n divergent. Gilt (1), so heißt x Grenzwert der Folge (xn )n , und (xn )n heißt konvergent gegen x. Satz 2. Jede Folge besitzt h¨ochstens einen Grenzwert. Beweis. Verwende Lemma 1.4.(ii), und schließe wie im Beweis von Satz II.5.3. Notation: Statt (1) schreibt man limn→∞ xn = x oder limn xn = x. Bemerkung 3. F¨ ur x ∈ X gilt lim xn = x ⇔ lim d(x, xn ) = 0. n

n

Satz 4. F¨ ur Y ⊆ X gilt Y = {lim xn : (xn )n Folge in Y , (xn )n konvergent}. n

Insbesondere ist Y genau dann abgeschlossen, wenn f¨ ur jede Folge (xn )n in Y , die konvergent ist, limn xn ∈ Y gilt. Beweis. Schließe wie im Beweis von Lemma III.1.3. Bemerkung 5. Konvergenz ist ein topologischer Begriff: f¨ ur jede Umgebung U von x ∈ X ist {n ∈ N : xn 6∈ U } endlich. Definition 6.

6

(i) (xn )n heißt Cauchy-Folge, falls ∀ ε > 0 ∃ n0 ∈ N ∀ n, m ≥ n0 : d(xn , xm ) < ε. 5

(2)

In den F¨ allen X = R und X = C konsistent mit den bisherigen Definitionen, siehe Definition II.5.2 und Seite 73. 6 In den F¨ allen X = R und X = C konsistent mit den bisherigen Definitionen, siehe Definitionen II.6.1 und II.6.4 sowie Seite 73.

IX.2. Konvergenz und Stetigkeit

191

(ii) X heißt vollst¨andig, falls jede Cauchy-Folge in X konvergiert. (iii) Ein vollst¨andiger normierter Raum heißt Banach-Raum. Ein vollst¨andiger Innenproduktraum heißt Hilbert-Raum. Satz 7. (i) Jede konvergente Folge ist eine Cauchy-Folge. (ii) Jede Cauchy-Folge ist beschr¨ankt. Beweis. ad (i): Schließe wie im Beweis von Satz II.6.2. ad (ii): Schließe im wesentlichen wie im Beweis von Satz II.5.10 (Konvergenz und Beschr¨anktheit). Bemerkung 8. Sei X ein K-Vektorraum, und seien k · k und k · k∗ ¨aquivalente Normen auf X. Dann ist (xn )n genau dann konvergent in (X, k · k), wenn (xn )n konvergent in (X, k · k∗ ) ist. Ggf. stimmen die Grenzwerte u ur ¨berein. Entsprechendes gilt f¨ Cauchy-Folgen und die Vollst¨andigkeit.

Produktr¨ aume Bemerkung 9. Betrachte metrische R¨aume (Xi , di ) f¨ ur i = 1, . . . , n. Auf X1 ×· · ·×Xn wird durch d((x1 , . . . , xn ), (y1 , . . . , yn )) = max di (xi , yi ) i=1,...,n

eine Metrik definiert. Beweis Tutorium 5.1. Definition 10. In der Situation von Bemerkung 9 heißt d die Produktmetrik auf X = X1 × · · · × Xn , und (X, d) heißt das Produkt der metrischen R¨aume (Xi , di ). Beispiel 11. Im Fall X = Kn wird die Produktmetrik d durch k · k∞ induziert. Satz 12. Sei (X, d) das Produkt der metrischen R¨aume (Xi , di ) f¨ ur i = 1, . . . , n. F¨ ur xk = (xk,1 , . . . , xk,n ) gilt (xk )k konvergent ⇔ ∀ 1 ≤ i ≤ n : (xk,i )k konvergent und ggf. limk xk = (limk xk,1 , . . . , limk xk,n ). Beweis. F¨ ur x = (x1 , . . . , xn ) ∈ X, 1 ≤ i ≤ n und k ∈ N gilt di (xk,i , xi ) ≤ d(xk , x) ≤

n X

di (xk,i , xi ).

i=1

Verwende Bemerkung 3. Satz 13. Das Produkt vollst¨andiger metrischer R¨aume ist vollst¨andig. Beweis. Verwende die Bezeichnungen aus Bemerkung 9. Sei (xk )k eine Cauchy-Folge in X = X1 × · · · × Xn , und gelte xk = (xk,1 , . . . , xk,n ). Da di (xk,i , x`,i ) ≤ d(xk , x` ) f¨ ur k, ` ∈ N und i = 1, . . . , n, ist jede der Folgen (xk,i )k eine Cauchy-Folge in Xi . F¨ ur x = (x1 , . . . , xn ) mit xi = limk xk,i gilt limk xk = x gem¨aß Satz 12.

IX.2. Konvergenz und Stetigkeit

192

Die R¨ aume (Kn , k · k2 ) und (B(M, V ), k · k∞ ) Korollar 14. F¨ ur jedes n ∈ N ist Kn , (i) versehen mit der Norm k · k∞ , ein Banach-Raum, (ii) versehen mit dem kanonischen Skalarprodukt, ein Hilbert-Raum. Beweis. ad (i): Verwende die Vollst¨andigkeit von R bzw. C, Satz 13 und Beispiel 11. ¨ ad (ii): Sei (xk )k eine Cauchy-Folge in (Kn , k · k2 ). Aufgrund der Aquivalenz von k · k2 n und k · k∞ , siehe Beispiel 1.30.(i), ist (xk )k eine Cauchy-Folge in (K , k · k∞ ), und (i) sichert die Existenz von x ∈ Kn mit limk kx−xk k∞ = 0. Es folgt limk kx−xk k2 = 0. Satz 15. Seien M 6= ∅ eine Menge und (V, k · k) ein Banach-Raum. Dann ist auch (B(M, V ), k · k∞ ) ein Banach-Raum. Beweis. Sei (fn )n eine Cauchy-Folge in B(M, V ). F¨ ur n, m ∈ N und x ∈ M gilt kfn (x) − fm (x)k ≤ kfn − fm k∞ , so daß (fn (x))n eine Cauchy-Folge in V ist. Damit ist (fn (x))n nach Voraussetzung konvergent. Definiere f : M → V durch f (x) = lim fn (x), n

x ∈ M.

Sei ε > 0. W¨ahle n0 ∈ N, so daß kfn − fm k∞ < ε f¨ ur n, m ≥ n0 . F¨ ur n, m ≥ n0 und x ∈ M folgt kf (x) − fn (x)k ≤ kf (x) − fm (x)k + kfm (x) − fn (x)k < kf (x) − fm (x)k + ε. Da limm kf (x) − fm (x)k = 0, folgt ∀ n ≥ n0 : kf − fn k∞ ≤ ε. Insbesondere gilt f − fn0 ∈ B(M, V ), woraus f ∈ B(M, V ) folgt, da B(M, V ) ein Vektorraum ist. Die Konvergenz von (fn )n gegen f in B(M, V ) ist jetzt klar. Beispiel 16. Sei M = [0, 1] und V = R. Wir definieren rekursiv eine Folge von Funktionen fn : [0, 1] → R durch  falls 0 ≤ x ≤ 1/3,  3/2 · x, f1 (x) = 1/2, falls 1/3 < x ≤ 2/3,   1/2 + 3/2(x − 2/3), falls 2/3 < x ≤ 1, sowie  falls 0 ≤ x ≤ 1/3,  1/2 · fn (3x), fn+1 (x) = 1/2, falls 1/3 < x ≤ 2/3,   1/2 + 1/2 · fn (3x − 2), falls 2/3 < x ≤ 1.

IX.2. Konvergenz und Stetigkeit

193

Per Induktion folgt f¨ ur alle n ∈ N: fn ist monoton wachsend mit fn (0) = 0, fn (1/3) = fn (2/3) = 1/2 und fn (1) = 1. Insbesondere gilt fn ∈ B([0, 1], R). Sei n ≥ 2. F¨ ur x ∈ [0, 1/3] gilt |fn+1 (x) − fn (x)| = |1/2 · fn (3x) − 1/2 · fn−1 (3x)| ≤ 1/2 · kfn − fn−1 k∞ , und f¨ ur x ∈ [2/3, 1] gilt |fn+1 (x) − fn (x)| = |1/2 · fn (3x − 2) − 1/2 · fn−1 (3x − 2)| ≤ 1/2 · kfn − fn−1 k∞ . Dies zeigt kfn+1 − fn k∞ ≤ 1/2 · kfn − fn−1 k∞ , und per Induktion ergibt sich ∀ n ∈ N : kfn+1 − fn k∞ ≤ 2−n+1 · kf2 − f1 k∞ . F¨ ur m > n ≥ 1 folgt kfm − fn k∞



m−1

X

(fk+1 − fk ) =

k=n

≤ kf2 − f1 k∞ ·





m−1 X

m−1 X

kfk+1 − fk k∞

k=n

2−k+1 ≤ kf2 − f1 k∞ · 2−n+2 .

k=n

Somit ist (fn )n eine Cauchy-Folge, und Satz 15 sichert die Existenz von f ∈ B([0, 1], R) mit limn kf − fn k∞ = 0. Stichwort: Cantor-Funktion.

Stetigkeit Im Folgenden seien (Y, dY ) und (Z, dZ ) metrische R¨aume und f : X → Y und g : Y → Z Abbildungen. Definition 17.

7

(i) f heißt stetig in x ∈ X, falls f¨ ur jede gegen x konvergente Folge (xn )n die Folge (f (xn ))n gegen f (x) konvergiert. Andernfalls heißt f unstetig in x. (ii) f heißt stetig (auf X), falls f stetig in jedem Punkt x ∈ X ist. Notation: C(X, Y ) Menge der stetigen Funktionen von X nach Y . Satz 18. f ist genau dann stetig in x ∈ X, wenn  ∀ ε > 0 ∃ δ > 0 ∀ y ∈ X : d(x, y) < δ ⇒ dY (f (x), f (y)) < ε .

(3)

Beweis. Schließe wie in Satz III.2.11. Bemerkung 19. Beachte, daß (3) ¨aquivalent ist zu ∀ ε > 0 ∃ δ > 0 : f (Bδ (x)) ⊆ Bε (f (x)). Somit ist Stetigkeit ein topologischer Begriff: f¨ ur jede Umgebung U ⊆ Y von f (x) existiert eine Umgebung U 0 ⊆ X von x mit f (U 0 ) ⊆ U . Siehe auch Satz 31 (Charakterisierung stetiger Abbildungen). 7

In den F¨ allen X = R und X = C konsistent mit den bisherigen Definitionen, siehe Definition III.2.1 und Seite 74.

IX.2. Konvergenz und Stetigkeit

194

Satz 20. Ist f stetig in x ∈ X und g stetig in f (x), so ist g ◦ f stetig in x. Beweis. Schließe wie in Satz III.2.10. ¨ Bemerkung 21. Sind X und Y normierte R¨aume, so ¨andert der Ubergang zu ¨aquivalenten Normen im Definitions- und/oder Wertebereich nichts an den Stetigkeitkeitseigenschaften von f . Beispiel 22. Sei (V, k · k) ein normierter Raum. (i) k · k : V → R ist stetig. Beweis: F¨ ur v, w ∈ V gilt |kvk − kwk| ≤ kv − wk. (ii) Betrachte die Produktmetrik d auf V × V . Dann ist + : V × V → V stetig. Beweis: F¨ ur v, v 0 , w, w0 ∈ V gilt k(v + w) − (v 0 + w0 )k ≤ kv − v 0 k + kw − w0 k ≤ 2 · d((v, w), (v 0 , w0 )). (iii) Betrachte die Produktmetrik auf K × V . Dann ist · : K × V → V stetig. Beweis ¨ Ubung, vgl. Beweis von Satz II.5.13 (Produktregel). (iv) Betrachte die Produktmetrik auf K × (K \ {0}). Dann ist / : K × (K \ {0}) → K stetig. Beweis ¨ Ubung, vgl. Beweis von Satz II.5.16 (Quotientenregel). Beispiel 23. (i) Betrachte die Produktmetrik d˜ auf X × X. Dann ist d : X × X → R stetig. Beweis: F¨ ur x, x0 , y, y 0 ∈ X gilt |d(x, y) − d(x0 , y 0 )| ≤ |d(x, y) − d(x0 , y)| + |d(x0 , y) − d(x0 , y 0 )| ˜ ≤ d(x, x0 ) + d(y, y 0 ) ≤ 2 · d((x, x0 ), (y, y 0 )). (ii) F¨ ur ∅ 6= Y ⊆ X und x ∈ X definiert man den Abstand von x zu Y durch d(x, Y ) = inf{d(x, y) : y ∈ Y }. Die Funktion d(·, Y ) : X → R ist stetig. Beweis: F¨ ur x, x0 ∈ X und y ∈ Y gilt d(x, Y ) ≤ d(x, y) ≤ d(x, x0 ) + d(x0 , y). Es folgt d(x, Y ) − d(x, x0 ) ≤ d(x0 , Y ), d.h. d(x, Y ) − d(x0 , Y ) ≤ d(x, x0 ). Ebenso ergibt sich d(x0 , Y ) − d(x, Y ) ≤ d(x, x0 ). Fazit: |d(x, Y ) − d(x0 , Y )| ≤ d(x, x0 ). Ferner gilt d(x, Y ) = 0 genau dann, wenn x ∈ Y . Definition 24. f heißt Lipschitz-stetig, falls ∃ c > 0 ∀ x, y ∈ X : dY (f (x), f (y)) ≤ c · d(x, y). Jedes c mit obiger Eigenschaft heißt eine Lipschitz-Konstante von f .

IX.2. Konvergenz und Stetigkeit

195

Bemerkung 25. Lipschitz-stetige Abbildungen sind stetig. Beispiel 26. (i) Die Abbildungen aus den Beispielen 22.(i) und (ii) und 23 sind Lipschitz-stetig. (ii) Die Abbildungen aus den Beispielen 22.(iii) und (iv) sind nicht Lipschitz-stetig. (iii) F¨ ur a ∈ Kn sei f : Kn → K durch f (x) = hx, ai definiert. Satz 1.6 (CauchySchwarzsche Ungleichung) zeigt |f (x) − f (y)| ≤ kx − yk2 · kak2 f¨ ur x, y ∈ Kn , so daß f Lipschitz-stetig ist.

Stetigkeit und Produktr¨ aume Im Folgenden sei (Y, dY ) das Produkt der metrischen R¨aume (Yi , di ) f¨ ur i = 1, . . . , m. Die Abbildungen πi : Y → Yi : (y1 , . . . , ym ) 7→ yi heißen Koordinatenabbildungen. Setze f i = πi ◦ f : X → Y i . Es gilt also f (x) = (f1 (x), . . . , fm (x)) f¨ ur alle x ∈ X, und f1 , . . . , fm heißen die Komponentenfunktionen von f . Bemerkung 27. Die Koordinatenabbildungen sind Lipschitz-stetig, vgl. Satz 12 und sein Beweis. Satz 28. f ist genau dann stetig (in x ∈ X), wenn f¨ ur i = 1, . . . , m die Abbildungen fi stetig (in x) sind. Beweis. ⇒“: Verwende Satz 20 und Bemerkung 27. ” ⇐“: Gelte limk xk = x. Nach Voraussetzung folgt limk fi (xk ) = fi (x) f¨ ur i = 1, . . . , m. ” Satz 12 sichert die Konvergenz von (f (xk ))k mit lim f (xk ) = (lim f1 (xk ), . . . , lim fm (xk )) = f (x). k

k

k

Der Raum C(X, V ) Korollar 29. (i) Seien (V, k · k) ein normierter K-Vektorraum und f, g : X → V stetig (in x ∈ X). Ferner sei λ ∈ K. Dann sind f + g und λf stetig (in x). Insbesondere ist C(X, V ) ein Unterraum des K-Vektorraums V X . (ii) Seien f, g : X → K stetig (in x ∈ X). Dann ist f · g stetig (in x). (iii) Seien f, g : X → K stetig (in x ∈ X), und gelte g(y) 6= 0 f¨ ur alle y ∈ X. Dann ist f /g stetig (in x).

IX.2. Konvergenz und Stetigkeit

196

Beweis. ad (i): Betrachte die Produktmetrik auf V × V . Satz 28 sichert die Stetigkeit der Abbildung h : X → V × V : x 7→ (f (x), g(x)) (im Punkt x). Gem¨aß Beispiel 22.(ii) ist + : V × V → V stetig. Die Stetigkeit von f + g (in x) folgt mit Satz 20. ad (ii), (iii): analog. Beispiel 30. Betrachte die euklidische Metrik auf X = R2 \ {0}. Definiere h : X → R durch 2xy h(x, y) = 2 , (x, y) ∈ X. x + y2 Wir zeigen die Stetigkeit von h. Die Abbildungen X → R : (x, y) 7→ x und X → R : (x, y) 7→ y sind stetig. Korollar 29 sichert zun¨achst die Stetigkeit der Abbildungen X → R : (x, y) 7→ x2 + y 2 und X → R : (x, y) 7→ 2xy, und nochmalige Anwendung des Korollars liefert die Behauptung. Sei α ∈ [0, 2π[ und r > 0. F¨ ur (x, y) = (r cos(α), r sin(α)) ergibt sich h(x, y) = 2 cos(α) sin(α) = sin(2α). F¨ ur n ∈ N sei rn = 1/n, αn = π/4 + nπ/2 und (xn , yn ) = (rn cos(αn ), rn sin(αn )). Dann gilt k(xn , yn )k2 = 1/n und somit limn (xn , yn ) = (0, 0), aber h(xn , yn ) = (−1)n . Damit existiert keine Fortsetzung von h zu einer stetigen Funktion von R2 nach R.

Charakterisierung stetiger Abbildungen ¨ Satz 31. Aquivalent sind: (i) f ist stetig, (ii) f¨ ur jede offene Menge U ⊆ Y ist f −1 (U ) offen, (iii) f¨ ur jede abgeschlossene Menge U ⊆ Y ist f −1 (U ) abgeschlossen. Beweis. (i) ⇒ (ii)“: Wir betrachten den nicht-trivialen Fall einer offenen Menge ” ∅ 6= U ⊆ Y . Sei x ∈ f −1 (U ). Dann existiert ε > 0 mit Bε (f (x)) ⊆ U . Gem¨aß Satz 18 und Bemerkung 19 existiert δ > 0 mit f Bδ (x) ⊆ Bε (f (x)) ⊆ U , d.h. Bδ (x) ⊆ f −1 (U ). (ii) ⇒ (i)“: Seien x ∈ X und ε > 0. Nach Voraussetzung ist f −1 (Bε (f (x))) offen, ” und es gilt x ∈ f −1 (Bε (f (x))). Somit existiert δ > 0 mit Bδ (x) ⊆ f −1 (Bε (f (x))), d.h. f (Bδ (x)) ⊆ Bε (f (x)). Wende Satz 18 an. (ii) ⇔ (iii)“: klar. ” Bemerkung 32. Seien f : X → R stetig und c ∈ R. Dann ist {x ∈ X : f (x) < c} offen, und {x ∈ X : f (x) ≤ c} ist abgeschlossen. Beweis: Verwende Satz 31 mit U = ]−∞, c[ bzw. U = ]−∞, c]. Beispiel 33. (i) F¨ ur f : R → R : x 7→ arctan(x) ist f (R) = ]−π/2, π/2[ nicht abgeschlossen, w¨ahrend R abgeschlossen ist. (ii) F¨ ur f : R → R : x 7→ x2 ist f (]−1, 1[) = [0, 1[ nicht offen, w¨ahrend ]−1, 1[ offen ist.

IX.3. Kompaktheit

197

Metrische Unterr¨ aume Im Folgenden sei ∅ 6= X0 ⊆ X. Betrachte die Metrik d0 = d|X0 ×X0 auf X0 sowie die Mengen O(X, d) und O(X0 , d0 ) der offenen Teilmengen von X bzw. X0 . Sprechweise: d0 heißt die induzierte Metrik. Lemma 34. Es gilt: (i) γ : X0 → X : x 7→ x ist Lipschitz-stetig, (ii) f ∈ C(X, Y ) ⇒ f |X0 ∈ C(X0 , Y ), (iii) O(X0 , d0 ) = {U ∩ X0 : U ∈ O(X, d)}, (iv) Sei (X, d) vollst¨andig. Dann gilt: (X0 , d0 ) ist vollst¨andig ⇔ X0c ∈ O(X, d). Beweis. ad (i), (ii): klar. ad (iii): F¨ ur U ∈ O(X, d) gilt U ∩ X0 = γ −1 (U ) ∈ O(X0 , d0 ) gem¨aß (i) und Satz 31. Sei U0 ∈ O(X0 , d0 ) 6= ∅. Dann existiert r : U0 → ]0, ∞[, so daß ∀ x ∈ U0 : {y ∈ X0 : d0 (x, y) < r(x)} ⊆ U0 . S F¨ ur U = x∈U0 {y ∈ X : d(x, y) < r(x)} gilt U ∈ O(X, d) und U0 = U ∩ X0 . ¨bung. ad (iv): U Literatur. [AE, III.1] und [Fo2, §2].

3

Kompaktheit

¨ Uberdeckungsund Folgenkompaktheit Im Folgenden sei (X, d) ein metrischer Raum, und O bezeichne die zugeh¨orige Menge offener Mengen. Ferner sei K ⊆ X. S F¨ ur die leere Abbildung U : ∅ → P(X) setzen wir i∈∅ Ui = ∅. Definition 1. ¨ (i) Eine Familie (Ui )i∈I in O heißt offene Uberdeckung von K, falls K ⊆

S

i∈I

Ui .

¨ (ii) K heißt kompakt, falls f¨ ur jede offene Uberdeckung (Ui )i∈I von K eine endliche S Menge I0 ⊆ I mit K ⊆ i∈I0 Ui existiert8 . Bemerkung 2. Die Kompaktheit ist ein topologischer Begriff. Ist X ein normierter ¨ Raum, so ¨andert der Ubergang zu einer ¨aquivalenten Norm nichts an der Kompaktheit von Teilmengen. 8

Sprechweise: Existenz einer endlichen Teil¨ uberdeckung.

IX.3. Kompaktheit

198

Beispiel 3. (i) Jede endliche Teilmenge von X ist kompakt. (ii) Sei (xn )n eine konvergente Folge in X. Dann ist K = {xn : n ∈ N} ∪ {lim xn } n

¨ kompakt. Beweis: Setze x = limn xn . Sei (Ui )i∈I eine offene Uberdeckung von K. Dann existiert i0 ∈ I mit x ∈ Ui0 . W¨ahle ε > 0 mit Bε (x) ⊆ Ui0 . Dann ist N = {n ∈ N : xn ∈ / Bε (x)} endlich, und f¨ ur n ∈ N existiert in ∈ I mit xn ∈ Uin . Die Menge I0 = {in : n ∈ N } ∪ {i0 } leistet das Verlangte. (iii) Seien X = R und K = {1/n : n ∈ N}. Die Mengen Ui = ]2−i , 2−i+2 [ mit i ∈ N ¨ bilden eine offene Uberdeckung von K. F¨ ur n ∈ N und I0 ⊆ {1, . . . , n} gilt S −n , ∞[. Somit ist K nicht kompakt. i∈I0 Ui ⊆ ]2 Der Begriff der Teilfolge u ¨bertr¨agt sich w¨ortlich von reellen Zahlenfolgen, siehe Definiton II.6.14, auf Folgen in beliebigen Mengen. ¨ Satz 4. Aquivalent sind9 (i) K ist kompakt, (ii) jede Folge (xn )n in K besitzt eine konvergente Teilfolge (xnk )k mit limk xnk ∈ K. Beweis. Betrachte den nicht-trivialen Fall K 6= ∅. (i) ⇒ (ii)“: Sei (xn )n eine Folge in K. Annahme: (xn )n besitzt keine konvergente ” Teilfolge mit Grenzwert in K. Dann folgt ∀ x ∈ K ∃ ε > 0 : {n ∈ N : xn ∈ Bε (x)} endlich.  ¨ Betrachte eine entsprechende offene Uberdeckung Bε(x) (x) x∈K von K. Nach Voraussetzung existiert eine endliche Menge K0 ⊆ K mit [ K⊆ Bε(x) (x), x∈K0

so daß N = {n ∈ N : xn ∈ K} endlich ist, siehe Bemerkung II.3.7. Widerspruch. (ii) ⇒ (i)“: Wir zeigen zun¨achst10 ” m [ ∀ ε > 0 ∃ m ∈ N ∃ x1 , . . . , x m ∈ K : K ⊆ Bε (xi ). (1) i=1

Annahme: (1) ist nicht erf¨ ullt. Dann existiert ε > 0 und eine Folge (xn )n in K mit ∀ n ∈ N : xn+1 ∈ /

n [

Bε (xi ).

i=1 9 10

Dies zeigt im Fall X = R die Konsistenz mit Definition III.1.27. Mengen mit dieser Eigenschaft heißen totalbeschr¨ankt, siehe [AE, III.3].

IX.3. Kompaktheit

199

Nach Voraussetzung existiert eine konvergente Teilfolge (xnk )k mit x = limk xnk ∈ K, d.h. es existiert k0 ∈ N, so daß d(x, xnk ) < ε/2 f¨ ur alle k ≥ k0 . F¨ ur k > k0 folgt d(xnk0 , xnk ) ≤ d(xnk0 , x) + d(x, xnk ) < ε, d.h. xnk ∈ Bε (xnk0 ). Widerspruch. ¨ Sei (Ui )i∈I eine offene Uberdeckung von K. F¨ ur n ∈ N existiert gem¨aß (1) eine endliche Menge Xn ⊆ K mit [ K⊆ B1/n (x). x∈Xn

Annahme: F¨ ur jedes n ∈ N existiert xn ∈ Xn , so daß B1/n (xn ) ∩ K nicht durch endlich viele der Ui u ¨berdeckt wird. Nach Voraussetzung existiert eine konvergente Teilfolge (xnk )k von (xn )n mit Grenzwert x ∈ K. Ferner existieren i ∈ I mit x ∈ Ui und ε > 0 mit Bε (x) ⊆ Ui . Gelte nk > 2/ε und d(x, xnk ) < ε/2. F¨ ur jedes y ∈ B1/nk (xnk ) gilt d(y, x) ≤ d(y, xnk ) + d(xnk , x) < 1/nk + ε/2 < ε. Es folgt B1/nk (xnk ) ⊆ Bε (x) ⊆ Ui . Widerspruch. Ausblick 5. Metrische Entropie. Satz 6. Sei K kompakt. Dann ist K abgeschlossen und beschr¨ankt. Beweis. Beschr¨anktheit“: Satz 4 und (1) sichern die Existenz von m ∈ N und S ” ur r = max1≤k≤m d(x1 , xk ) + 1 ergibt sich x1 , . . . , xm ∈ K mit K ⊆ m i=1 B1 (xi ). F¨ K ⊆ Br (x1 ). Abgeschlossenheit“: Sei (xn )n eine Folge in K, die konvergent ist. Setze x = limn xn . ” Dann konvergiert jede Teilfolge von (xn )n gegen x, und Satz 4 sichert x ∈ K. Wende Satz 2.4 (Charakterisierung des Abschlusses) an. Satz 7. Seien K kompakt und A ⊆ X abgeschlossen mit A ⊆ K. Dann ist A kompakt. Beweis. Sei (xn )n eine Folge in A. Gem¨aß Satz 4 existiert eine konvergente Teilfolge (xnk )k . Satz 2.4 sichert limk xnk ∈ A.

Der Satz von Heine-Borel Satz 8 (Heine-Borel). F¨ ur den normierten Raum (Kn , k · k∞ ) sind ¨aquivalent: (i) K ist kompakt, (ii) K ist abgeschlossen und beschr¨ankt. Beweis. (i) ⇒ (ii)“: Dies ist Satz 6. ” (ii) ⇒ (i)“: Sei (xk )k mit xk = (xk,1 , . . . , xk,n ) eine Folge in K. Dann sind (xk,i )k ” mit i = 1, . . . , n beschr¨ankte Folgen in K. Die iterierte Anwendung von Satz II.6.17 (Bolzano-Weierstraß), ggf. auf die Real- und Imagin¨arteile, sichert die Existenz einer Teilfolge (xk` )` , so daß (xk` ,i )` f¨ ur alle i ∈ {1, . . . , n} konvergent ist. Beispiel 2.11 und Satz 2.12 (Konvergenz in Produktr¨aumen) zeigen die Konvergenz von (xk` )` , und Satz 2.4 sichert lim` xk` ∈ K. Wende Satz 4 an.

IX.3. Kompaktheit

200

Beispiel 9. Sei X = B(N, R) versehen mit der Supremumsnorm k · k∞ . Sei B die Menge aller Folgen y = (yi )i reeller Zahlen mit  ∃ i ∈ N : yi = 1 ∧ ∀ j ∈ N \ {i} : yj = 0 . Es gilt B ⊆ X, und B ist beschr¨ankt. Da ky − y 0 k∞ = 1 f¨ ur alle y, y 0 ∈ B mit y 6= y 0 gilt, sind f¨ ur jede Folge (xn )n in B ¨aquivalent: (i) (xn )n ist konvergent, (ii) (xn )n ist eine Cauchy-Folge, (iii) ∃ n0 ∈ N ∀ n ≥ n0 : xn = xn+1 . Damit ist B abgeschlossen, aber nicht kompakt, da B keine endliche Menge ist.

Stetige Abbildungen auf kompakten Mengen Im Folgenden sei (Y, dY ) ein metrischer Raum. Satz 10. Sei K kompakt und sei f : X → Y stetig. Dann ist f (K) kompakt. Beweis. Betrachte den nicht-trivialen Fall K 6= ∅. Sei (yn )n eine Folge in f (K). W¨ahle xn ∈ K mit f (xn ) = yn . Dann existiert eine konvergente Teilfolge (xnk )k von (xn )n , und (ynk )k = (f (xnk ))k ist konvergent. Korollar 11 (Extremalsatz). Sei K 6= ∅ kompakt und sei f : X → R stetig. Dann gilt  ∃ x∗ , x∗ ∈ K : f (x∗ ) = inf f (x) ∧ f (x∗ ) = sup f (x) . x∈K

x∈K

Beweis. Die S¨atze 6 und 10 zeigen, daß f (K) abgeschlossen und beschr¨ankt ist. Mit Lemma III.1.17.(ii) folgt supx∈K f (x) ∈ f (K). F¨ ur das Minumum schließt man analog. Bemerkung 12. Sei ∅ 6= K ⊆ X. Betrachte die Metrik d0 = d|K×K auf K. F¨ ur jede Familie (Ui )i∈I von Teilmengen von X gilt [ [ K⊆ Ui ⇔ K ⊆ (Ui ∩ K). i∈I

i∈I

Lemma 2.34 zeigt: K ist genau dann im metrischen Raum (X, d) kompakt, wenn K im metrischen Raum (K, d0 ) kompakt ist. Satz 10 zeigt: Ist K kompakt und f : K → Y stetig, so ist f (K) kompakt. Definition 13. f : X → Y heißt gleichm¨aßig stetig falls  ∀ ε > 0 ∃ δ > 0 ∀ x, y ∈ X : d(x, y) < δ ⇒ dY (f (x), f (y)) < ε . Bemerkung 14. Aus der Lipschitz-Stetigkeit folgt die gleichm¨aßige Stetigkeit, und hieraus folgt die Stetigkeit. Beide Implikationen sind strikt. Satz 15. Sei X kompakt, und sei f : X → Y stetig. Dann ist f gleichm¨aßig stetig. Beweis. Schließe wie im Beweis von Satz III.3.10.

IX.3. Kompaktheit

201

¨ Aquivalenz der Normen auf endlich-dimensionalen R¨ aumen Im Folgenden seien (V, k · kV ) und (W, k · kW ) normierte K-Vektorr¨aume. Ferner sei f : V → W linear. Lemma 16. Gelte (V, k · kV ) = (Kn , k · k2 ). Dann existiert c > 0 mit ∀ x ∈ Kn : kf (x)kW ≤ c · kxk2 . Pn n Beweis. Sei (ei )i die Standardbasis von Kn . F¨ ur x = i=1 λi ei ∈ K gilt kxk2 = Pn P 1/2 1/2 n ( i=1 |λi |2 ) . Setze c = ( i=1 kf (ei )k2W ) . Satz VIII.1.6 (Cauchy-Schwarzsche Ungleichung) zeigt !1/2 n n n X X X 2 2 kf (x)kW ≤ |λi | · kf (ei )kW ≤ |λi | · kf (ei )kW = c · kxk2 . i=1

i=1

i=1

Satz 17. Je zwei Normen auf einem endlich-dimensionalen K-Vektorraum sind ¨aquivalent. Beweis. Betrachte zun¨achst den Raum (V, k · kV ) = (Kn , k · k2 ) und eine weitere Norm k · k auf Kn . Gem¨aß Lemma 16 existiert c2 > 0 mit ∀ x ∈ Kn : kxk ≤ c2 · kxk2 . In (Kn , k · k2 ) ist die Menge K = {x ∈ Kn : kxk2 = 1} abgeschlossen, siehe Beispiel 2.22.(i) und Bemerkung 2.32, und offenbar beschr¨ankt, also gem¨aß Satz 8 kompakt. Setze c1 = inf x∈K kxk. F¨ ur x, y ∈ Kn gilt |kxk − kyk| ≤ kx − yk ≤ c2 · kx − yk2 . Korollar 11 zeigt c1 > 0, und f¨ ur y ∈ Kn \ {0} ergibt sich kyk = kyk2 · k1/ kyk2 · yk ≥ c1 · kyk2 . Fazit: k · k2 und k · k, und damit beliebige Normen auf Kn , sind a¨quivalent. Sei V = W 6= {0} endlich-dimensional. F¨ ur n = dim V sei F : Kn → V ein linearer Isomorphismus. Durch kxk0 = kF (x)kV ,

kxk00 = kF (x)kW

¨ f¨ ur x ∈ Kn werden zwei Normen auf Kn definiert. Aus der bereits bewiesenen Aqui¨ valenz dieser Normen folgt die Aquivalenz von k · kV und k · kW . Bemerkung 18. Beliebige Normen auf einem endlich-dimensionalen K-Vektorraum V erzeugen damit dieselben offenen Mengen und denselben Stetigkeits- und Kompaktheitsbegriff. Ferner ist V stets vollst¨andig, und die Konvergenz ist ¨aquivalent zur Konvergenz der Koeffizienten in einer beliebigen Basis. Aus diesem Grund ist die explizite Angabe einer Norm oft entbehrlich.

IX.3. Kompaktheit

202

Stetigkeit linearer Abbildungen ¨ Satz 19. Aquivalent sind: (i) ∃ c > 0 ∀ v ∈ V : kf (v)kW ≤ c · kvkV , (ii) f ist Lipschitz-stetig, (iii) f ist stetig in v = 0. Beweis. (i) ⇒ (ii)“: F¨ ur v, w ∈ V gilt ” kf (v) − f (w)kW = kf (v − w)kW ≤ c · kv − wkV . (ii) ⇒ (iii)“: Gilt allgemein, siehe Bemerkung 25. ” (iii) ⇒ (i)“: W¨ahle δ > 0, so daß kf (w)kW < 1 f¨ ur alle w ∈ V mit kwkV < δ. F¨ ur ” v ∈ V \ {0} folgt

kf (v)kW = 2 kvkV /δ · f (δ/(2 kvkV ) · v) W < 2/δ · kvkV .

Beispiel 20. (i) Seien (V, h·, ·i) ein Innenproduktraum und U ⊆ V ein endlich-dimensionaler Unterraum. Die orthogonale Projektion f : V → V auf U ist Lipschitz-stetig. Beweis: F¨ ur v ∈ V gilt kvk2 = kf (v)k2 + kv − f (v)k2 . Dies zeigt kf (v)k ≤ kvk. (ii) Sei V = RR([a, b]) f¨ ur a, b ∈ R mit a < b versehen mit der Supremumsnorm. Durch b f (v) = a v(t) dt wird eine Lipschitz-stetige Abbildung f : V → R definiert. Beweis: F¨ ur v ∈ V gilt Z b ≤ (b − a) · kvk∞ . v(t) dt a

(iii) Betrachte den Unterraum V = {v ∈ RN : {i ∈ N : vi 6= 0} endlich} von B(N, R), P versehen mit der Supremumsnorm. Durch f (v) = ∞ i=1 vi wird eine lineare Abbildung f : V → R definiert. Sei n ∈ N. F¨ ur (vi )i mit v1 = · · · = vn = 1 und vi = 0 f¨ ur i > n gilt v ∈ V , |f (v)| = n sowie kvk∞ = 1. Folglich ist f nicht stetig. Korollar 21. Sei V endlich-dimensional. Dann ist f Lipschitz-stetig. Beweis. Betrachte den nicht-trivialen Fall V 6= {0}. Sei F : Kn → V ein linearer Isomorphismus. Lemma 16 sichert die Existenz von c > 0, so daß kf (v)kW = kf ◦ F (F −1 (v))kW ≤ c · kF −1 (v)k2 f¨ ur alle v ∈ V . Gem¨aß Satz 17 wird durch kvk = kF −1 (v)k2 eine zu k · kV ¨aquivalente Norm auf V definiert. Wende Satz 19 an.

IX.4. Funktionenfolgen

203

Beispiel 22. (i) F¨ ur V = Kn und W = Km , versehen mit beliebigen Normen, sowie A ∈ Km×n definiert f (x) = Ax eine Lipschitz-stetige Abbildung f : V → W . (ii) Die polynomiale Interpolation aus Bemerkung VI.5.15 definiert eine Lipschitzstetige Abbildung zwischen den R¨aumen (Kn+1 , k · k2 ) und (B([a, b], K), k · k∞ ). Ausblick: Lebesgue-Konstante. Im Folgenden seien V und W endlich-dimensional. Satz 23. Durch kf k = sup{kf (v)kW : v ∈ V, kvkV ≤ 1},

f ∈ L(V, W ),

wird eine Norm auf L(V, W ) definiert. F¨ ur f ∈ L(V, W ) gilt kf (v)kW ≤ kf k · kvkV .

(2)

Beweis. Siehe ¨ Ubung 8.4. Definition 24. k · k gem¨aß Satz 23 heißt die von den Normen auf V und W induzierte Abbildungsnorm. Ebenso f¨ ur Matrizen aus Km×n und Normen auf Kn und Km . Bemerkung 25. Sei (U, k·kU ) ein weiterer endlich-dimensionaler K-Vektorraum, und sei g ∈ L(U, V ). F¨ ur die zugeh¨origen Abbildungsnormen zeigt (2) kf ◦ gk ≤ kf k · kgk. Literatur. [AE, III.3] und [Fo2, §2, §3].

4

Funktionenfolgen

Im Folgenden seien M 6= ∅ eine Menge und (V, k · kV ) ein normierter Vektorraum. Ferner sei (fn )n eine Folge in V M . Definition 1. Sei f ∈ V M . (i) (fn )n konvergiert punktweise gegen f , falls ∀ x ∈ M : lim kfn (x) − f (x)kV = 0. n

(ii) (fn )n konvergiert gleichm¨aßig gegen f , falls f − fn ∈ B(M, V ) f¨ ur alle11 n ∈ N und lim kfn − f k∞ = 0. n

11

Es gen¨ ugt hier und andernorts zu fordern: ∃ n0 ∈ N ∀ n ≥ n0 : f − fn ∈ B(M, V ).

IX.4. Funktionenfolgen

204

Bemerkung 2. Aus der gleichm¨aßigen Konvergenz folgt die punktweise Konvergenz gegen dieselbe Funktion. Beispiel 3. Seien c > 0, M = [−c, c], V = R und fn (x) =

n X xk k=0

x ∈ M.

,

k!

Satz II.7.34 (Restgliedabsch¨atzung) zeigt f¨ ur n ≥ 2c − 1 k exp |M − fn k∞ ≤ 2 ·

cn+1 . (n + 1)!

Somit konvergiert (fn )n gleichm¨aßig gegen die Exponentialfunktion, eingeschr¨ankt auf M . Legt man stattdessen den Definitionsbereich M = R zugrunde, konvergiert (fn )n nicht gleichm¨aßig, aber punktweise gegen die Exponentialfunktion. Beweis ¨ Ubung. Bemerkung 4. Gilt fn ∈ B(M, V ) f¨ ur alle n ∈ N, ist die gleichm¨aßige Konvergenz die Konvergenz in (B(M, V ), k · k∞ ). Ggf. gilt f¨ ur den Grenzwert f , daß kf k∞ = limn kfn k∞ . Beweis: Verwende Satz 1.27 und Beispiel 2.22.(i).

Das Weierstraßsche Kriterium P Satz 5. Sei V = K, gelte gk ∈ B(M, V ) f¨ ur alle k ∈ N und sei ∞ k=1 kgk k∞ konvergent. Pn Pn ur jedes x ∈ M absolut. Dann konvergiert ( k=1 gk )n gleichm¨aßig und ( k=1 gk (x))n f¨ Beweis. Wir verweisen auf Ergebnisse f¨ ur K = R; siehe Seite 73 zum Fall K = C. F¨ ur n ∈ N und x ∈ M gilt |gn (x)| ≤ kgn k∞ . Satz II.7.18 (Majoranten-Kriterium) P sichert die absolute Konvergenz von ∞ k=1 gk (x). Definiere f : M → R durch f (x) = P∞ g (x), siehe Satz II.7.16 (Konvergenz und absolute Konvergenz). k=1 k F¨ ur m > n gilt m n m X X X gk (x) − gk (x) ≤ kgk k∞ . k=1

Es folgt

k=1

k=n+1

n ∞ X X f (x) − g (x) ≤ kgk k∞ k k=1

und somit

n

X

f − g

k k=1

Schließlich gilt limn

k=n+1

P∞

k=n+1





∞ X

kgk k∞ .

k=n+1

kgk k∞ = 0, siehe ¨ Ubung 6.4 (GdM I).

Sprechweise: Die Konvergenz gem¨aß Satz 5 heißt absolute und gleichm¨aßige KonverP genz von ∞ k=1 gk .

IX.4. Funktionenfolgen

205

P 2 Beispiel 6. Seien M = R und V = R. Die Reihe ∞ k=1 cos(k ·)/k konvergiert absolut und gleichm¨aßig. Erg¨anzung: F¨ ur 0 ≤ x ≤ 2π gilt ∞ X

cos(kx)/k 2 = (x − π)2 /4 − π 2 /12,

k=1

siehe [Fo1, S. 267].

Konvergenz und Stetigkeit Im Folgenden sei (X, d) ein metrischer Raum, und (fn )n sei eine Folge in V X . Beispiel 7. Seien X = [0, 1] und V = R, und sei fn : X → R f¨ ur n ∈ N gegeben durch fn (x) = xn , x ∈ X. Dann konvergiert (fn )n punktweise gegen f = 1{1} . W¨ahrend alle Funktionen fn beliebig oft differenzierbar sind, ist f nicht stetig auf X. Da kf − fn k∞ = 1 f¨ ur alle n ∈ N, liegt keine gleichm¨aßige Konvergenz vor, siehe Bemerkung 2. Satz 8. Gilt fn ∈ C(X, V ) f¨ ur alle n ∈ N und konvergiert (fn )n gleichm¨aßig gegen X f ∈ V , folgt f ∈ C(X, V ). Beweis. Seien ε > 0 und x ∈ X. W¨ahle n ∈ N mit kf − fn k∞ < ε und δ > 0 mit  ∀ y ∈ X : d(x, y) < δ ⇒ kfn (x) − fn (y)kV < ε . F¨ ur y ∈ X mit d(x, y) < δ folgt kf (x) − f (y)kV ≤ kf (x) − fn (x)kV + kfn (x) − fn (y)kV + kfn (y) − f (y)kV < 3 ε.

Korollar 9. Die Menge C(X, V ) ∩ B(X, V ) ist ein abgeschlossener Unterraum von (B(X, V ), k · k∞ ). Beweis. Die Unterraum-Eigenschaft folgt mit Korollar 2.29.(i). Bemerkung 4 und Satz 8 zeigen, daß C(X, V ) ∩ B(X, V ) abgeschlossen ist. Korollar 10. Sei X kompakt und sei (V, k · kV ) ein Banach-Raum. Dann ist auch (C(X, V ), k · k∞ ) ein Banach-Raum. Beweis. Die S¨atze 3.6 und 3.10 zeigen C(X, V ) ⊆ B(X, V ). Gem¨aß Satz 2.15 ist der Raum (B(X, V ), k · k∞ ) vollst¨andig, so daß die Vollst¨andigkeit von (C(X, V ), k · k∞ ) mit Lemma 2.34.(iv) und Korollar 9 folgt. Beispiel 11. Die Cantor-Funktion aus Beispiel 2.16 ist stetig und monton wachsend.

IX.4. Funktionenfolgen

206

Konvergenz und Integrierbarkeit Im Folgenden seien X = [a, b] f¨ ur a, b ∈ R mit a < b und V = R. Beispiel 12. Sei X = [0, 1]. (i) Seien D = [0, 1] ∩ Q und (xn )n : N → D bijektiv. Setze fn = 1{x1 ,...,xn } und f = 1D . Dann gilt fn ∈ R([0, 1]) f¨ ur alle n ∈ N, und (fn )n konvergiert punktweise gegen f , aber f 6∈ R([0, 1]), siehe Beispiel V.1.9. Es existiert sogar eine Folge von Funktionen fn ∈ C([0, 1]), so daß ∀ n ∈ N : 0 ≤ fn ≤ fn+1 ≤ 1 und f 6∈ R([0, 1]) f¨ ur den punktweisen Grenzwert f von (fn )n . Vgl. Tutorium 6.2 und siehe [A, Bsp. 4.4]. (ii) Setze fn = max(n−n2 ·|x−1/n|, 0) f¨ ur x ∈ [0, 1] und n ≥ 2. Es gilt fn ∈ R([0, 1]) und (fn )n konvergiert punktweise gegen f = 0 ∈ R([0, 1]), aber Z 1 Z 1 f (x) dx. fn (x) dx = 1 6= 0 = 0

0

Satz 13. Gilt fn ∈ R([a, b]) f¨ ur alle n ∈ N und konvergiert (fn )n gleichm¨aßig gegen f : [a, b] → R, folgt f ∈ R([a, b]) und Z b Z b f (x) dx = lim fn (x) dx. n

a

a

Beweis. Setze εn = kf − fn k∞ . Nach Voraussetzung gilt limn εn = 0. Gem¨aß Satz V.1.10 (Integrabilit¨atskrtiterium) existieren ϕn , ψn ∈ T ([a, b]) mit ϕn ≤ fn ≤ ψn und Z b Z b ψn (x) dx − ϕn (x) dx < εn . a

a

Es folgt ϕ n − εn ≤ f n − εn ≤ f ≤ f n + εn ≤ ψ n + εn , und offenbar gilt ϕn − εn , ψn + εn ∈ T ([a, b]). Schließlich gilt Z b Z b (ψn + εn )(x) dx − (ϕn − εn )(x) dx ≤ εn · (1 + 2(b − a)). a

a

Korollar V.1.11 sichert f ∈ R([a, b]). Mit den S¨atzen V.1.16 und V.1.19.(i) ergibt sich |f − fn | ∈ R([a, b]) und weiter Z b Z b f (x) dx − fn (x) dx ≤ (b − a) · kf − fn k∞ . a

a

Bemerkung 14. In der Situation von Satz 13 ergibt sich f ∈ R([a, b]) unter der st¨arkeren Annahme, daß fn ∈ C([a, b]) f¨ ur alle n ∈ N, sofort aus Satz 8.

IX.4. Funktionenfolgen

207

Beispiel 15. (i) Betrachte nochmals Beispiel 3. (ii) F¨ r die Cantor-Funktion f gilt f ∈ R([0, 1]), siehe Bemerkung 14. Setze c = Ru 1 f (x) dx. ¨ Ubung 7.1.d) zeigt 0 Z

1/3

Z

2/3

0

1

(1/2 + f (3x − 2))/2 dx

1/2 dx +

f (3x)/2 dx +

c=

Z

2/3

1/3

= c/3 + 1/3. Es folgt c = 1/2.

Konvergenz und Differenzierbarkeit Im Folgenden sei X ⊆ R ein Intervall mit mehr als einem Element. Beispiel 16. F¨ ur X = R und n ∈ N sei 1 fn (x) = √ · sin(nx), n

x ∈ R.

Dann konvergiert (fn )n gleichm¨aßig gegen f = 0, und fn ist differenzierbar mit √ fn0 (x) = n · cos(nx) x ∈ R. F¨ ur alle x ∈ R ist (fn0 (x))n jedoch divergent. Beweis: Annahme (fn0 (x))n ist konvergent. Dann folgt limn cos(nx) = 0. Da cos(2nx) = 2 cos2 (nx)−1, folgt 0 = −1. Widerspruch. Satz 17. Gilt fn ∈ C 1 (X) f¨ ur alle n ∈ N, konvergiert (fn )n punktweise gegen f : 0 X → R und konvergiert (fn )n gleichm¨aßig, so ist f differenzierbar mit f 0 (x) = lim fn0 (x), n

x ∈ X.

Beweis. F¨ ur den Grenzwert f˜ von (fn0 )n gilt f˜ ∈ C(X), siehe Satz 8. W¨ahle a ∈ X. Dann Z x fn (x) = fn (a) + fn0 (t) dt x ∈ X, a

f¨ ur alle n ∈ N, siehe Korollar V.2.9 (zum Hauptsatz). Satz 13 sichert Z x f (x) = f (a) + f˜(t) dt, x ∈ X, a

woraus die Differenzierbarkeit von f und f 0 = f˜ folgt, siehe Satz V.2.7 (2. Hauptsatz).

IX.4. Funktionenfolgen

208

Potenzreihen Im Folgenden seien c = (ck )k∈N0 eine Folge in K und a ∈ K. Wir setzen D(c, a) = {x ∈ K :

∞ X

ck (x − a)k konvergiert}

k=0

und schreiben gelegentlich kurz D statt D(c, a). Bemerkung 18. Es gilt a ∈ D(c, a) und D(c, a) = D(c, 0) + a. Beispiel 19. P k (i) F¨ ur die Exponentialreihe ∞ k=0 1/k! · x gilt D = K, siehe Satz III.4.9 (Exponentialreihe, K = C). P k 2k gilt D = R sowie (ii) Sei K = R. F¨ ur ∞ k=0 (−1) /(2k)! · x ∞ X (−1)k k=0

F¨ ur

P∞

k=0 (−1)

k

(2k)!

· x2k = cos(x),

x ∈ R.

/(2k + 1)! · x2k+1 gilt D = R sowie ∞ X (−1)k · x2k+1 = sin(x), (2k + 1)! k=0

x ∈ R.

Siehe Satz III.5.7. (iii) Sei K = R. F¨ ur die geometrische Reihe ∞ X k=0

(iv) F¨ ur

P∞

k=0

P∞

xk =

k=0

xk gilt D = ]−1, 1[ sowie

1 , 1−x

x ∈ ]−1, 1[ .

k k · xk gilt D = {0}.

Lemma 20. Gelte D(c, a) 6= {a}, und seien y ∈ D(c, a) \ {a} sowie 0 < ρ < |y − a|. Definiere gk : Bρ (a) → K durch gk (x) = ck (x − a)k , Dann ist

P∞

x ∈ Bρ (a).

gk absolut und gleichm¨aßig konvergent. P∞ Sprechweise: k=0 ck (x − a)k ist absolut und gleichm¨aßig konvergent auf Bρ (a). k=0

Beweis. Es existiert K > 0 mit ∀ k ∈ N0 : |ck (y − a)k | ≤ K. Setze θ=

ρ |y − a|

(1)

IX.4. Funktionenfolgen

209

Dann gilt θ ∈ ]0, 1[ sowie |gk (x)| = |ck (y − a)k | ·

|x − a|k ≤ K · θk |y − a|k

f¨ ur alle k ∈ N0 und x ∈ Bρ (a), d.h. ∀ k ∈ N0 : sup |gk (x)| ≤ K · θk . x∈Bρ (a)

Satz 5 und Beispiel 19.(iii) zeigen die behauptete Konvergenz. Satz 21. Es gilt D(c, a) = {a}, D(c, a) = K oder ∃ r > 0 : Br (a) ⊆ D(c, a) ⊆ Br (a). Beweis. Gelte {a} ( D(c, a) ( K, und sei y ∈ D(c, a) \ {a}. Lemma 20 zeigt B|y−a| (a) ⊆ D(c, a). Zusammen mit D(c, a) ( K folgt hieraus, daß D(c, a) beschr¨ankt ist. Fazit: r(c, a) = sup{|y − a| : y ∈ D(c, a)}

(2)

leistet das Verlangte. Konvention: B0 (a) = ∅ und B∞ (a) = K sowie r < ∞ f¨ ur r ∈ [0, ∞[. Definition 22. (i) Im Fall {a} ( D(c, a) ( K heißt r(c, a) gem¨aß (2) der Konvergenzradius der P k allen D(c, a) = {a} und D(c, a) = K setzt Potenzreihe ∞ k=0 ck (x − a) . In den F¨ man r(c, a) = 0 bzw. r(c, a) = ∞. P k (ii) B(c, a) = Br(c,a) (a) heißt das Konvergenzgebiet der Potenzreihe ∞ k=0 ck (x − a) . (iii) Die durch f (x) =

∞ X

ck (x − a)k ,

x ∈ B(c, a),

k=0

definierte Funktion f : B(c, a) → K heißt Summenfunktion der Potenzreihe P∞ k k=0 ck (x − a) . Bemerkung 23. (i) Die Beweise von Lemma 20 und Satz 21 zeigen r(c, a) = sup{|y − a| : (ck (y − a)k )k beschr¨ankt}. (ii) Satz 8 und Lemma 20 zeigen: die Summenfunktion einer Potenzreihe ist stetig auf ihrem Konvergenzgebiet.

IX.4. Funktionenfolgen

210

P k (iii) Gilt ck ∈ R f¨ ur alle k ∈ N0 , so kann man ∞ ¨ber k=0 ck (x − a) als Potenzreihe u R und u ¨ber C betrachten. Die Konvergenzradien und die Summenfunktion auf B(c, a) ∩ R stimmen u ¨berein. Lemma 24. Die Konvergenzradien der Potenzreihen ∞ X

k−1

kck (x − a)

,

k=1

∞ X ck (x − a)k+1 k + 1 k=0

sind gleich r(c, a). P k−1 Beweis. Sei r der Konvergenzradius von ∞ . Bemerkung 23.(i) zeigt k=1 kck (x − a) r ≤ r(c, a). Seien x, y ∈ K, so daß |x − a| < |y − a| und (ck (y − a)k )k beschr¨ankt. Setze θ = |x − a|/|y − a|. Dann gilt θ ∈ [0, 1[ und |kck (x − a)k−1 | ≤ |ck | · |y − a|k /|y − a| · kθk−1 . Da limk (kθk−1 ) = 0, ist (kck (x − a)k−1 )k beschr¨ankt. Es folgt r(c, a) ≤ r. Hiermit ergibt sich auch die Aussage zur zweiten Potenzreihe. Im Folgenden sei K = R. Ferner gelte r(c, a) > 0, und f sei die Summenfunktion P k von ∞ k=0 ck (x − a) . Satz 25. f ist beliebig oft differenzierbar, und f¨ ur alle n ∈ N gilt f

(n)

(x) =

∞ X

ck ·

k=n

k! · (x − a)k−n , (k − n)!

Insbesondere ∀ n ∈ N0 : cn =

x ∈ B(c, a).

f (n) (a) . n!

Beweis. Seien n = 1, 0 < ρ < r(c, a) und gk : Bρ (a) → R durch (1) definiert. Lemma P P∞ 0 20 und Lemma 24 sichern die gleichm¨aßige Konvergenz von ∞ k=1 gk und k=0 gk auf Bρ (a). Satz 17 zeigt die Differenzierbarkeit von f in x ∈ Bρ (a) und 0

f (x) = lim n

n X k=0

0

gk (x) = lim n

n X

gk0 (x)

=

k=1

∞ X

gk0 (x).

k=1

Schließe nun induktiv. Korollar 26. Sei h die Summenfunktion von die Stammfunktion von f mit h(a) = 0.

P∞

k=0 ck /(k

+ 1)(x − a)k+1 . Dann ist h

Beispiel 27. (i) Sei f (x) = ln(1 + x) f¨ ur x ∈ ]−1, ∞[. Dann ∞

X 1 f (x) = = (−1)k xk , 1 + x k=0 0

x ∈ ]−1, 1[ .

IX.4. Funktionenfolgen

211

Da f (0) = 0, folgt f (x) =

∞ X (−1)k−1

k

k=1

· xk ,

x ∈ ]−1, 1[ ,

siehe Korollar 26. Fazit ln(x) =

∞ X (−1)k−1 k=1

k

· (x − 1)k ,

x ∈ ]0, 2[ .

Diese Gleichheit gilt auch f¨ ur x = 2, siehe [Fo1, S. 287]. (ii) Sei f (x) = arctan(x) f¨ ur x ∈ ]−1, 1[. Dann ∞

X 1 f (x) = = (−1)k x2k , 1 + x2 k=0

x ∈ ]−1, 1[ .

∞ X (−1)k · x2k+1 , arctan(x) = 2k + 1 k=0

x ∈ ]−1, 1[ ,

0

Da f (0) = 0, folgt

siehe Korollar 26. Diese Gleichheit gilt auch f¨ ur |x| = 1, siehe [Fo1, S. 288]. Im Folgenden sei d = (dk )k∈N0 eine Folge in R. Ferner gelte r(d, a) > 0, und g sei P k die Summenfunktion von ∞ k=0 dk (x − a) . Korollar 28. F¨ ur 0 < ρ < min(r(c, a), r(d, a)) gelte ∞ X

k

ck (x − a) =

k=0

∞ X

dk (x − a)k ,

x ∈ Bρ (a).

k=0

Dann folgt ∀ k ∈ N0 : ck = dk . Beweis. Verwende Satz 25. Satz 29. (i) Setze ek = ck + dk f¨ ur k ∈ N0 . Dann gilt r(e, a) ≥ min(r(c, a), r(d, a)) und ∞ X

(ck + dk )(x − a)k = (f + g)(x)

k=0

f¨ ur x ∈ B(c, a) ∩ B(d, a). P (ii) Setze ek = k`=0 c` · dk−` f¨ ur k ∈ N0 . Dann gilt r(e, a) ≥ min(r(c, a), r(d, a)) und ∞ X k X k=0

f¨ ur x ∈ B(c, a) ∩ B(d, a).

`=0

 c` · dk−` (x − a)k = (f · g)(x)

IX.4. Funktionenfolgen

212

Beweis. Verwende die S¨atze II.7.5 und II.7.26 (Cauchy-Produkt). Beispiel 30. Gesucht ist eine differenzierbare Funktion f : R → R mit f 0 (x) = f (x) + x · exp(x), Ansatz: f (x) =

P∞

k=0 ck x

∞ X

k

x ∈ R.

(3)

. F¨ ur x ∈ B(c, 0) folgt mit den S¨atzen 25 und 29.(i)

(k + 1) · ck+1 · xk =

k=0

∞ X

∞ X

ck x k +

k=0

= c0 +

1/(k − 1)! · xk

k=1 ∞ X

(ck + 1/(k − 1)!)xk ,

k=1

und hieraus ergibt sich mit Korollar 28, daß c1 = c0 und ∀ k ∈ N : (k + 1)! · ck+1 = k! · ck + k. Induktiv folgt ∀ k ∈ N : k! · ck = c0 + d.h. f (x) = c0 +

∞ X

k(k − 1) , 2

 c0 /k! + k(k − 1)/(2k!) · xk .

k=1

Satz 29.(i) sichert B(c, 0) = R und f (x) = exp(x) · (c0 + x2 /2). Man verifiziert, daß die so definierte Funktion f eine L¨osung von (3) ist.

Taylor-Polynome und Taylor-Reihen Im Folgenden sei X ⊆ R ein Intervall mit mehr als einem Element. Ferner seien a ∈ X, n ∈ N0 und f : X → R. Setze I(a, x) = [min(a, x), max(a, x)] f¨ ur x ∈ X. Klar: I(a, x) ⊆ X. Definition 31. Ist f n-mal differenzierbar, heißt Tn (f, a) : X → R, gegeben durch Tn (f, a)(x) =

n X f (k) (a) k=0

k!

(x − a)k ,

x ∈ X,

das Taylor-Polynom der Ordnung n von f mit Entwicklungspunkt a. Definiere12 Rn (f, a) : X → R durch Rn (f, a) = f − Tn (f, a). 12

Bei [Fo1] mit Rn+1 bezeichnet.

IX.4. Funktionenfolgen

213

Beispiel 32. F¨ ur x ∈ X = ]−1, ∞[ und f (x) =



1 + x gilt

T2 (f, 0)(x) = 1 + x/2 − x2 /8. Satz 33 (Taylorsche Formel). Falls f ∈ C n+1 (X), gilt Z x 1 (x − t)n · f (n+1) (t) dt, · Rn (f, a)(x) = n! a

x ∈ X.

Beweis. Wir schließen induktiv. Sei x ∈ X. F¨ ur n = 0 gilt Z x f 0 (t) dt R0 (f, a)(x) = f (x) − f (a) = a

gem¨aß Korollar V.2.9 (zum Hauptsatz). F¨ ur n ≥ 1 gilt Rn (f, a)(x) = Rn−1 (f, a)(x) −

f (n) (a) (x − a)n n!

sowie aufgrund der Induktionsannahme Z x 1 Rn−1 (f, a)(x) = · (x − t)n−1 · f (n) (t) dt (n − 1)! a  x  Z x 1 −1 n (n) (x − t)n · f (n+1) (t) dt · (x − t) · f (t) + · = n! n! a a Z x 1 1 = (x − t)n · f (n+1) (t) dt + · · (x − a)n · f (n) (a). n! a n!

Korollar 34. F¨ ur f ∈ C n+1 (X) gilt f (n+1) = 0 ⇔ f ∈ {g|X : g ∈ Πn }. Beweis. ⇒“: folgt mit Satz 33. ⇐“: klar. ” ” Satz 35 (Lagrange-Restglied). F¨ ur f ∈ C n+1 (X) gilt ∀ x ∈ X ∃ ξ ∈ I(a, x) : Rn (f, a)(x) = f (n+1) (ξ) ·

(x − a)n+1 . (n + 1)!

Beweis. Beachte, daß entweder (x − t)n ≥ 0 f¨ ur alle t ∈ I(a, x) oder (x − t)n ≤ 0 f¨ ur alle t ∈ I(a, x). Die S¨atze V.1.22 (Mittelwertsatz der Integralrechung) und 33 zeigen die Existenz von ξ ∈ I(a, x) mit Z x 1 (x − a)n+1 (n+1) Rn (f, a)(x) = f (ξ) · · (x − t)n dt = f (n+1) (ξ) · . n! a (n + 1)!

IX.4. Funktionenfolgen

214

Beispiel 36. In der Situation von Beispiel 32 gilt f (3) (x) = 3/8 · (1 + x)−5/2 . F¨ ur x > 0 folgt 0 < f (x) − T2 (f, 0)(x) ≤ 1/16 · x3 , und f¨ ur −1 < x < 0 folgt 1/16 ·

x3 ≤ f (x) − T2 (f, 0)(x) < 0. (1 + x)5/2

Entsprechende Graphiken finden sich in Abschnitt A.7. Korollar 37. (i) F¨ ur f ∈ C n (X) gilt Rn (f, a)(x) = 0. x→a (x − a)n lim

(ii) F¨ ur f ∈ C n+1 (X) gilt Rn (f, a)(x) f (n+1) (a) = . x→a (x − a)n+1 (n + 1)! lim

Beweis. ad (i): Klar f¨ ur n = 0. Im Fall n ≥ 1 sichert Satz 35 die Existenz von ξ ∈ I(a, x) mit  Rn (f, a)(x) = Rn−1 (f, a)(x) − f (n) (a)/n! · (x − a)n = f (n) (ξ) − f (n) (a) · (x − a)n /n!. ad (ii): klar. Bemerkung 38. Seien f ∈ C n+1 (X) und |f (n+1) (a)| . (n + 1)!

c=

Korollar 37.(ii) zeigt: F¨ ur alle ε > 0 existiert δ > 0, so daß f¨ ur alle x ∈ X mit |x − a| < δ (c − ε) · |x − a|n+1 ≤ |f (x) − Tn (f, a)(x)| ≤ (c + ε) · |x − a|n+1 . Vgl. Bemerkung IV.1.10 im Fall n = 1. Definition 39. Sei f ∈ C ∞ (X). Dann heißt T (f, a)(x) =

∞ X f (k) (a) k=0

k!

· (x − a)k

die Taylor-Reihe von f mit Entwicklungspunkt a. Bemerkung 40. P k (i) F¨ ur ∞ k=0 ck (x − a) mit einer Folge (ck )k∈N0 in R gelte r(c, a) > 0. Dann ist diese Potenzreihe die Taylor-Reihe ihrer Summenfunktion. Beweis: Satz 25.

IX.4. Funktionenfolgen

215

(ii) Sei f ∈ C ∞ (X) mit einer Taylor-Reihe T (f, a) mit Konvergenzradius r > 0. F¨ ur ˜ die Summenfunktion f : Br (a) → R von T (f, a) und x ∈ Br (a) gilt f (x) = f˜(x) ⇔ lim Rn (f, a)(x) = 0. n

Beispiel 41. (i) Sei f : R → R definiert durch f (x) =

( exp(−1/x2 ), falls x 6= 0, 0,

falls x = 0.

Per Induktion zeigt man f¨ ur alle n ∈ N0 , daß f |R\{0} n-mal differenzierbar ist und eine Polynomfunktion pn mit ∀ x ∈ R \ {0} : f (n) (x) = pn (1/x) · f (x) existiert. F¨ ur x 6= 0, y = 1/x und n ∈ N folgt f (n) (x) = y · pn (y) · exp(−y 2 ). x Da limy→±∞ (y · pn (y) · exp(−y 2 )) = 0, folgt induktiv, daß f (n) (0) = 0 f¨ ur alle n ∈ ¨ N. Siehe auch Ubung 9.3 (GdM I). Fazit: T (f, 0) = 0. Diese Taylor-Reihe besitzt den Konvergenzradius ∞, aber es gilt T (f, 0)(x) 6= f (x) f¨ ur alle x ∈ R \ {0}. (ii) Durch f (x) =

∞ X

exp(−k) cos(k 2 x)

k=0

wird eine beliebig oft differenzierbare Funktionen f : R → R definiert. Die Taylor-Reihe von f besitzt den Konvergenzradius null, siehe [GO, Exmp. 6.24]. Literatur. [Fo1, §21, §22] und [AE, II.9, V.1, V.2].

Kapitel X Differenzierbare Abbildungen in mehreren Variablen In der mehrdimensionalen Differentialrechnung studieren wir Funktionen f : D → Rm mit D ⊆ Rn . Die Grundidee ist, wie im Fall n = m = 1, die lokale Approximation solcher Funktionen durch (affin)-lineare Funktionen. Wir verweisen insbesondere auf [Fo2] sowie auf [H2, K].

1

Differenzierbarkeit

Im Folgenden betrachten wir die R¨aume Rn und Rm f¨ ur n, m ∈ N, versehen mit beliebigen Normen, die mitsamt den zugeh¨origen Abbildungsnormen auf Rm×n unter¨ schiedslos mit k · k bezeichnet werden; wir erinnern an Bemerkung IX.3.18 (Aquivalenz von Normen). Ferner seien ∅ 6= D ⊆ Rn offen und f : D → Rm . F¨ ur λ ∈ R \ {0} und x ∈ Rm schreiben wir oft x/λ statt 1/λ · x.

Grenzwerte von Abbildungen Definition 1. F¨ ur x ∈ D besitzt g : D \ {x} → Rm einen Grenzwert 1 in x, falls a ∈ Rm existiert, so daß die Fortsetzung g˜ : D → Rm von g mit ( g(y), y ∈ D \ {x}, g˜(y) = a, y = x, stetig in x ist. Beispiel 2. Die Abbildung h : R2 \ {0} → R : (x, y) 7→ 2xy/(x2 + y 2 ) aus Beispiel IX.2.30 besitzt keinen Grenzwert in 0. 1

Im Fall n = m = 1 wegen der st¨ arkeren Annahme an D ein Spezialfall der bisherigen Definition III.2.14.

216

X.1. Differenzierbarkeit

217

Bemerkung 3. Seien x ∈ D und g, h : D \ {x} → Rm sowie λ : D \ {x} → R. (i) In der Situation von Definition 1 ist a ggf. eindeutig bestimmt. Notation ggf.: a = limy→x g(y). Vgl. Bemerkung III.2.15. (ii) Bemerkung IX.2.3 zeigt lim g(y) = a ⇔ lim kg(y) − ak = 0.

y→x

y→x

(iii) Aus limy→x g(y) = a und limy→x h(y) = b folgt limy→x (g + h)(y) = a + b, und aus limy→x g(y) = a und limy→x λ(y) = c folgt limy→x (λg)(y) = ca. Beweis: Verwende Beispiel IX.2.22.(ii) und (iii) (Stetigkeit der Addition und der skalaren Multiplikation). (iv) g besitzt genau dann einen Grenzwert in x, wenn alle Komponentenfunktionen g1 , . . . , gm : D \ {x} → R von g in x einen Grenzwert besitzen. Ggf. gilt   limy→x g1 (y)   .. lim g(y) =  . . y→x limy→x gm (y) Beweis: Verwende Satz IX.2.12 (Konvergenz in Produktr¨aumen). (v) f ist genau dann stetig in x, wenn f |D\{x} in x den Grenzwert f (x) besitzt.

Totale Differenzierbarkeit Definition 4. (i) f heißt (total) differenzierbar 2 in x ∈ D, falls A ∈ Rm×n existiert mit f (y) − f (x) − A(y − x) = 0. y→x ky − xk lim

(1)

(ii) f heißt (total) differenzierbar , falls f in jedem Punkt x ∈ D differenzierbar ist. Beispiel 5. (i) Jede konstante Abbildung f : Rn → Rm ist differenzierbar. Beweis: W¨ahle A = 0 in (1). (ii) Jede lineare Abbildung f : Rn → Rm ist differenzierbar. Beweis: W¨ahle A = MEE˜(f ) mit den Standardbasen E und E˜ von Rn bzw. Rm in (1). 2

Im Fall m = n = 1 wegen der st¨ arkeren Annahme an D ein Spezialfall der bisherigen Definition IV.1.2, siehe Satz IV.1.8.

X.1. Differenzierbarkeit

218

(iii) F¨ ur C ∈ Rn×n sei f : Rn → R definiert durch f (x) = hx, Cxi. F¨ ur x ∈ Rn , A = x> · (C + C > ) ∈ R1×n und ξ ∈ Rn gilt f (x + ξ) − f (x) = h(C + C > )x, ξi + hξ, Cξi = Aξ + hξ, Cξi. Satz VIII.1.6 (Cauchy-Schwarzsche Ungleichung) und Lemma IX.3.16 sichern die Existenz von c > 0 mit |hξ, Cξi| ≤ kξk2 · kCξk2 ≤ ckξk22 f¨ ur alle ξ ∈ Rn . Somit ist f differenzierbar. Lemma 6. Sei f differenzierbar in x ∈ D. Dann ist A in (1) eindeutig bestimmt. Beweis. Aus

f (y) − f (x) − Ai (y − x) =0 y→x ky − xk lim

f¨ ur i = 1, 2 folgt f¨ ur A = A2 − A1 , daß limξ→0 Aξ/kξk = 0. F¨ ur alle ξ ∈ Rn \ {0} ergibt sich kA(εξ)k kAξk = lim = 0, ε→0 kξk kεξk d.h. A = 0. Definition 7. Sei f differenzierbar in x ∈ D. Dann heißt A ∈ Rm×n mit (1) die (totale) Ableitung von f in x. Notation:3 (Df )(x). Satz 8. Sei f differenzierbar in x ∈ D. Dann ist f stetig in x. Beweis. Setze r(y) = f (y) − f (x) − (Df )(x) · (y − x), Da f (y) = f (x) + (Df )(x) · (y − x) + ky − xk ·

y ∈ D.

r(y) ky − xk

f¨ ur y ∈ D \ {x}, folgt limy→x f (y) = f (x) mit Korollar IX.3.21 (Stetigkeit linearer Abbildungen) und Beispiel IX.2.22.(i) (Stetigkeit der Norm). Satz 9. F¨ ur x ∈ D ist f genau dann differenzierbar in x, wenn alle Komponentenfunktionen f1 , . . . , f m : D → R von f in x differenzierbar sind. Ggf. gilt 

 (Df1 )(x)   .. (Df )(x) =  . . (Dfm )(x) 3

Weiterhin u ¨bliche Bezeichnungen: f 0 (x), Funktionalmatrix oder Jacobi-Matrix Jf (x).

X.1. Differenzierbarkeit

219

Beweis. F¨ ur A = (a1 , . . . , am )> ∈ Rm×n und y ∈ D gilt   f1 (y) − f1 (x) − a> 1 (y − x)   .. f (y) − f (x) − A(y − x) =  . . > fm (y) − fm (x) − am (y − x) Verwende Bemerkung 3.(iv). Bemerkung 10. Ist f : D → Rm differenzierbar, so definiert x 7→ (Df )(x) eine Abbildung Df : D → Rm×n , die als Ableitung von f bezeichnet wird. Statt des Wertebereichs Rm×n kann in gleicher Weise der Raum der linearen Abbildungen von Rn nach Rm zugrunde gelegt werden. Normen auf dem endlich-dimensionalen Vektrorraum Rm×n sind beispielsweise gegeben durch kAk∞ = max{|ai,j | : 1 ≤ i ≤ m, 1 ≤ j ≤ n} oder kAk = sup{kAxk : x ∈ Rn , kxk ≤ 1} f¨ ur A = (ai,j )i,j ∈ Rm×n , siehe Satz IX.3.23. Definition 11. Sei Rm×n versehen mit einer Norm. Dann heißt f stetig differenzierbar , falls f differenzierbar und Df stetig ist. Beispiel 12. In der Situation von Beispiel 5.(iii) gilt (Df )(x) = x> (C + C > ) f¨ ur alle n n 1×n x ∈ R . Also ist Df : R → R linear und damit stetig.

Differenzierbarkeit im Fall n = 1 Lemma 13. Seien n = 1 und t ∈ D. Definiere m : D \ {t} → Rm durch f (s) − f (t) . s−t Dann ist f genau dann in t differenzierbar, wenn m in t einen Grenzwert besitzt. Ggf. gilt (Df )(t) = lims→t m(s). m(s) =

Beweis. F¨ ur s ∈ D \ {t} und A ∈ Rm gilt f (s) − f (t) − A(s − t) = m(s) − A. s−t Beispiel 14. F¨ ur r > 0 sei f (t) = (r cos(t), r sin(t))> ,

t ∈ R.

Satz 9 zeigt die Differenzierbarkeit von f in t mit (Df )(t) = (−r sin(t), r cos(t))> , so daß Df : R → R2 stetig ist. F¨ ur alle t ∈ R gilt: (Df )(t) und f (t) sind orthogonal, und k(Df )(t)k2 = r.

X.1. Differenzierbarkeit

220

Bemerkung 15. F¨ ur Intervalle D beschreiben stetige Abbildungen f : D → Rm Kurven in Rm . Ist f differenzierbar in t ∈ D, heißt die durch ξ 7→ f (t)+(ξ −t)·(Df )(t) definierte Abbildung von R nach Rm die Tangente an f zum Parameterwert t, und (Df )(t) heißt der Tangentialvektor von f zum Parameterwert t.

Richtungsableitungen Bemerkung 16. F¨ ur x ∈ D existiert r > 0 mit Br (x) ⊆ D. F¨ ur ν ∈ Rn \ {0} ist g : ]−r/ kνk , r/ kνk[ → Rm , gegeben durch g(s) = f (x + sν), wohldefiniert. Kurz: falls |s| hinreichend klein, ist g(s) wohldefiniert. Gem¨aß Lemma 13 ist g genau dann in 0 differenzierbar, wenn s 7→ (f (x + sν) − f (x))/s in 0 einen Grenzwert besitzt, und ggf. gilt f (x + sν) − f (x) . s→0 s

(Dg)(0) = lim

Definition 17. Ist g gem¨aß Bemerkung 16 differenzierbar in 0, heißt (Dg)(0) ∈ Rm die4 Richtungsableitung von f in x in Richtung ν. Notation: (∂ν f )(x) = (Dg)(0). Bemerkung 18. Richtungsableitungen sind Ableitungen. Satz 19. Sei f differenzierbar in x ∈ D. Dann existiert f¨ ur jedes ν ∈ Rn \ {0} die Ableitung von f in x in Richtung ν, und es gilt (∂ν f )(x) = (Df )(x) · ν. Beweis. F¨ ur s 6= 0 mit hinreichend kleinem Betrag gilt f (x + sν) − f (x) f (x + sν) − f (x) − (Df )(x) · (sν) |s| · kνk = · + (Df )(x) · ν. s ksνk s Da |s| · kνk/s = kνk, folgt die Behauptung. Beispiel 20. In der Situation von Beispiel 5.(iii) sei C ∈ Rn×n symmetrisch. Dann gilt (Df )(x) = 2(Cx)> ∈ R1×n f¨ ur alle x ∈ Rn . F¨ ur ν ∈ Rn mit kνk2 = 1 folgt (∂ν f )(x) = 2hCx, νi und weiter |(∂ν f )(x)| ≤ 2kCxk2 . Falls Cx 6= 0, gilt f¨ ur ν ∗ = Cx/kCxk2 −2kCxk2 = (∂−ν ∗ f )(x) ≤ (∂ν f )(x) ≤ (∂ν ∗ f )(x) = 2kCxk2 . 4

Bei [Fo2, S. 72] nur im Fall m = 1 eingef¨ uhrt.

X.1. Differenzierbarkeit

221

Bemerkung 21. Seien ν ∈ Rn \ {0}, ν˜ = ν/kνk und x ∈ D. Aus der Existenz der Richtungsableitung (∂ν f )(x) folgt die Existenz der Richtungsableitung (∂ν˜ f )(x) und (∂ν˜ f )(x) = 1/kνk · (∂ν f )(x). Beweis: ¨ Ubung. Es gen¨ ugt deshalb, Richtungsableitungen mit kνk = 1 zu betrachten. Beispiel 22. Definiere f : R2 → R durch5 ( 2 xy falls (x, y) 6= 0, 2 4, f (x, y) = x +y 0, sonst. Wir zeigen, daß in 0 alle Richtungsableitungen von f existieren. F¨ ur ν = (ν1 , ν2 ) ∈ 2 R \ {0} und s 6= 0 gilt f (sν) ν1 · ν22 = 2 . s ν1 + s2 ν24 Im Fall ν1 6= 0 ergibt sich (∂ν f )(0) = ν22 /ν1 , w¨ahrend (∂ν f )(0) = 0 im Fall ν1 = 0. Wir zeigen, daß f in 0 nicht stetig und damit nicht differenzierbar ist. Annahme: f √ ist stetig in 0. Da g : ]0, ∞[2 → R2 , definiert durch g(x, y) = (x, y), stetig ist, folgt die Stetigkeit von f ◦ g. F¨ ur (x, y) ∈ ]0, ∞[2 gilt (f ◦ g)(x, y) =

xy , x2 + y 2

und Beispiel IX.2.30 zeigt, daß f ◦ g in 0 unstetig ist. Widerspruch. Entsprechende Graphiken finden sich in Abschnitt A.8.

Partielle Ableitungen Im Folgenden sei E = (e1 , . . . , en ) die Standardbasis von Rn , und f1 , . . . , fm : D → R seien die Komponentenfunktionen von f . Definition 23. (i) Sei j ∈ {1, . . . , n}. Falls f in x ∈ D in Richtung ej differenzierbar ist, heißt (∂ej f )(x) ∈ Rm die6 j-te partielle Ableitung von f in x. Notation:7 (∂j f )(x). (ii) Falls f in x ∈ D in die Richtungen e1 , . . . , en differenzierbar ist, heißt f in x partiell differenzierbar . (iii) f heißt partiell differenzierbar , falls f in jedem Punkt x ∈ D partiell differenzierbar ist. 5

Solange dies unkritisch ist, werden wir gelegentlich nicht zwischen Zeilen- und Spaltenvektoren“ ” unterscheiden. 6 Bei [Fo2, S. 75] nur im Fall m = 1 eingef¨ uhrt. ∂f ∂ 7 Weiterhin u bliche Bezeichnungen: f (x) oder ∂x (x). ¨ ∂xj j

X.1. Differenzierbarkeit

222

Bemerkung 24. Partielle Ableitungen sind Ableitungen. Bemerkung 25. f ist genau dann in x ∈ D partiell differenzierbar, wenn alle Komponentenfunktionen von f in x partiell differenzierbar sind. Ggf. gilt   (∂j f1 )(x)   .. (∂j f )(x) =  j = 1, . . . , n. , . (∂j fm )(x) Siehe Satz 9. Bemerkung 26. Gelte m = 1, und seien x ∈ D und j ∈ {1, . . . , n}. F¨ ur δ > 0 hinreichend klein sei gj : ]xj − δ, xj + δ[ → R definiert durch gj (ξ) = f (x + (ξ − xj ) · ej ) = f (x1 , . . . , xj−1 , ξ, xj+1 , . . . , xn ). Dann sind ¨aquivalent: (i) f ist in x partiell differenzierbar, (ii) f¨ ur alle j ∈ {1, . . . , n} ist gj in xj differenzierbar. Ggf. gilt (∂j f )(x) = gj0 (xj ) = lim

ξ→xj

f (x1 , . . . , xj−1 , ξ, xj+1 , . . . , xn ) − f (x1 , . . . , xn ) . ξ − xj

Beweis: Verwende Bemerkung 16. Zur Untersuchung der partiellen Differenzierbarkeit und ggf. zur Berechnung der partiellen Ableitungen stehen aufgrund der Bemerkungen 25 und 26 die Ergebnisse aus Kapitel IV zur Verf¨ ugung. Beispiel 27. (i) Sei f : R2 → R2 definiert durch  f (x, y) =

 exp(x2 + y 2 ) . sin(x) · cos(y)

Dann ist f partiell differenzierbar mit (∂1 f1 )(x, y) = 2x exp(x2 + y 2 ), (∂2 f1 )(x, y) = 2y exp(x2 + y 2 ), (∂1 f2 )(x, y) = cos(x) · cos(y), (∂2 f2 )(x, y) = − sin(x) · sin(y). (ii) Betrachte f : Rn → R gem¨aß Beispiel 5.(iii), wobei C = (ck,` )k,` ∈ Rn×n symmetrisch ist. Beispiel 20 zeigt (∂j f )(x) = 2hx, Cej i = 2

n X `=1

cj,` · x` .

X.1. Differenzierbarkeit

223

Satz 28. Sei f in x ∈ D differenzierbar. Dann ist f in x partiell differenzierbar, und es gilt   (∂1 f1 )(x) . . . (∂n f1 )(x)   .. .. (Df )(x) =  . . ... . (∂1 fm )(x) . . . (∂n fm )(x) Beweis. Die S¨atze 9 und 19 sichern die Existenz der partiellen Ableitungen (∂j fi )(x) f¨ ur i ∈ {1, . . . , m} und j ∈ {1, . . . , n} sowie   (∂j f1 )(x)   .. (Df )(x) · ej = (∂j f )(x) =  . . (∂j fm )(x)

Beispiel 29. Sei f : R2 → R die Fortsetzung der Abbildung h : R2 \ {0} → R aus Beispiel IX.2.30 mit f (0) = 0. F¨ ur ν ∈ R2 mit kνk2 = 1 gilt f (sν) 2ν1 ν2 = , s s so daß f in 0 partiell differenzierbar mit (∂1 f )(0) = (∂2 f )(0) = 0 ist, aber f¨ ur kein ν ∈ R2 \ {±e1 , ±e2 } mit kνk2 = 1 eine Richtungsableitung in 0 besitzt. Insbesondere ist f in 0 nicht differenzierbar. Definition 30. (i) f heißt in x ∈ D stetig partiell differenzierbar , falls f partiell differenzierbar ist und die partiellen Ableitungen ∂j f : D → Rm f¨ ur alle j ∈ {1, . . . , n} stetig in x sind. (ii) f heißt stetig partiell differenzierbar , falls f in jedem Punkt x ∈ D stetig partiell differenzierbar ist. Beispiel 31. Die Funktionen aus Beispiel 27 sind stetig partiell differenzierbar. Satz 32. Ist f stetig partiell differenzierbar in x ∈ D, so ist f differenzierbar in x. Beweis. Es gen¨ ugt den Fall m = 1 zu betrachten, siehe Satz 9. Sei Rn versehen mit der euklidischen Norm. W¨ahle r > 0 mit Br (x) ⊆ D. F¨ ur y ∈ Br (x) sei y (k) = x +

k X `=1

(y` − x` ) · e` ,

k = 1, . . . , n,

X.1. Differenzierbarkeit

224

sowie y (0) = x. Dann gilt y (k) ∈ Br (x) f¨ ur k = 0, . . . , n und f (y) − f (x) =

n X

  f y (k) − f y (k−1) .

k=1

F¨ ur alle k = 1, . . . , n existiert gem¨aß Satz IV.2.7 (Mittelwertsatz der Differentialrechnung) ein λk (y) ∈ ]0, 1[ mit    f y (k) − f y (k−1) = (∂k f ) y (k−1) + λk (y)(yk − xk ) · ek · (yk − xk ) . Setze A = ((∂1 f )(x), . . . , (∂n f )(x)) und  B(y) = (∂1 f )(y (0) + λ1 (y)(y1 − x1 ) · e1 ), . . . , (∂n f )(y (n−1) + λn (y)(yn − xn ) · en ) . Dann f (y) − f (x) − A · (y − x) = (B(y) − A)(y − x) = h(B(y) − A)> , y − xi, und somit

kf (y) − f (x) − A(y − x)k2 ≤ (B(y) − A)> 2 ky − xk2

f¨ ur y ∈ Br (x) \ {x}. Schließlich gilt limy→x (y (k) − x) = 0, woraus limy→x B(y) = A wegen der stetigen partiellen Differenzierbarkeit von f in x folgt. Bemerkung 33. Satz 32 gilt analog, wenn man die Existenz und Stetigkeit der partiellen Ableitungen von f nur auf einer Kugel Br (x) ⊆ D mit r > 0 fordert. Korollar 34. f ist genau dann stetig differenzierbar, wenn f stetig partiell differenzierbar ist. Beweis. ⇒“: Verwende die S¨atze 28 und IX.2.28 (Stetigkeit und Komponentenab” bildungen). ⇐“: Vewende die S¨atze 28, 32 und IX.2.28. ” Bemerkung 35. Aus der Differenzierbarkeit folgt nicht die stetige partielle Differen¨ zierbarkeit. Siehe Ubung 9.3.

Rechenregeln Satz 36. Seien f, g : D → Rm differenzierbar in x ∈ D, und sei λ ∈ R. Dann sind f + g und λ · f differenzierbar in x, und es gilt (D(f + g)) (x) = (Df )(x) + (Dg)(x), (D(λf )) (x) = λ · (Df )(x). Beweis. Klar.

X.1. Differenzierbarkeit

225

Satz 37 (Produkt- und Quotientenregel). Seien f, g : D → R differenzierbar in x ∈ D. Dann ist f · g differenzierbar in x, und es gilt (D(f · g)) (x) = f (x) · (Dg)(x) + g(x) · (Df )(x). Gilt ferner g(x) 6= 0 und bezeichnet D0 das Innere von {x ∈ D : g(x) 6= 0}, so ist f /g : D0 → R differenzierbar in x, und es gilt (D(f /g)) (x) =

g(x) · (Df )(x) − f (x) · (Dg)(x) . g 2 (x)

Beweis. Setze l1 (y) = (Df )(x)(y − x), l2 (y) = (Dg)(x)(y − x), r1 (y) = f (y) − f (x) − l1 (y), r2 (y) = g(y) − g(x) − l2 (y) f¨ ur y ∈ D. Dann gilt f (y) · g(y) − f (x) · g(x)   = f (x) + l1 (y) + r1 (y) · g(x) + l2 (y) + r2 (y) −f (x) · g(x) = f (x) · l2 (y) + g(x) · l1 (y) + r(y)  = f (x) · (Dg)(x) + g(x) · (Df )(x) (y − x) + r(y) mit   r(y) = f (x) · r2 (y) + l1 (y) · l2 (y) + r2 (y) + r1 (y) · g(x) + l2 (y) + r2 (y) . F¨ ur i = 1, 2 gilt ri (y) = lim li (y) = 0 y→x ky − xk y→x lim

sowie

l1 (y) · l2 (y) =0 y→x ky − xk lim

aufgrund von Satz VIII.1.6 (Cauchy-Schwarzsche Ungleichung). Beweis der Quotientenregel ¨ Ubung. Satz 38 (Kettenregel). Seien ∅ 6= E ⊆ Rk offen und g : E → Rn , so daß g(E) ⊆ D. Ferner seien g differenzierbar in x ∈ E und f differenzierbar in g(x). Dann ist f ◦ g differenzierbar in x, und (D(f ◦ g)) (x) = (Df ) (g(x)) · (Dg)(x). Beweis. Setze A = (Dg)(x) und A˜ = (Df ) (g(x)) sowie r(y) = g(y) − g(x) − A · (y − x), r˜(z) = f (z) − f (g(x)) − A˜ · (z − g(x))

X.1. Differenzierbarkeit

226

f¨ ur y ∈ E und z ∈ D. Dann (f ◦ g)(y) − (f ◦ g)(x) − A˜ · A · (y − x) = A˜ · (g(y) − g(x)) + r˜ (g(y)) − A˜ · A · (y − x) = A˜ · r(y) + r˜ (g(y)) . Gem¨aß Satz IX.3.23 (Abbildungsnorm) gilt f¨ ur alle y ∈ E ˜ · kr(y)k . kA˜ · r(y)k ≤ kAk Aufgrund der Differenzierbarkeit von g in x folgt A˜ · r(y) = 0. y→x ky − xk lim

Sei ε > 0. Aufgrund der Differenzierbarkeit von f in g(x) existiert δ > 0, so daß f¨ ur alle y ∈ E mit kg(y) − g(x)k < δ k˜ r (g(y))k ≤ ε · kg(y) − g(x)k ≤ ε (kr(y)k + kA · (y − x)k) ≤ ε (kr(y)k + kAk · ky − xk) . Es folgt f¨ ur y ∈ E \ {x} mit kg(y) − g(x)k < δ k˜ r (g(y))k kr(y)k ≤ε· + ε · kAk. ky − xk ky − xk Da

 kr(y)k lim ε · + ε · kAk = ε · kAk, y→x ky − xk 

folgt k˜ r (g(y))k = 0. y→x ky − xk lim

Beispiel 39. Betrachte g : R → R2 und f : R2 → R, gegeben durch g(t) = (cos(t), sin(t))> und f (x) = hx, Cxi, wobei C ∈ R2×2 positiv definit ist. Setze h = f ◦ g. Die Beispiele 14 und 20 und Satz 38 zeigen die Differenzierbarkeit von h und > h0 (t) = 2 C · g(t) · (Dg)(t) = 2hC · g(t), (Dg)(t)i. Da {(Dg)(t)}⊥ = span{g(t)},

X.1. Differenzierbarkeit

227

gilt h0 (t) = 0 genau dann, wenn g(t) ein Eigenvektor von C ist. Gem¨aß Korollar VIII.3.7 (Diagonalisierung symmetrischer Matrizen) und Satz VIII.3.10 (Charakterisierung positiv definiter Abbildungen) existieren eine Orthonomalbasis (u1 , u2 ) von R2 und λ1 ≥ λ2 > 0 mit Cui = λi ui f¨ ur i = 1, 2. Im nicht-trivialen Fall λ1 > λ2 ist M ∗ = {t ∈ R : g(t) = ±u1 } die Menge der globalen Maxima von h und M∗ = {t ∈ R : g(t) = ±u2 } die Menge der globalen Minima von h.

Gradienten Definition 40. Ist f : D → R differenzierbar in x ∈ D, heißt8 (grad f )(x) = ((Df )(x))> ∈ Rn der Gradient von f an der Stelle x. Satz 41. Sei f : D → R differenzierbar in x ∈ D. (i) Falls (grad f )(x) = 0, gilt (∂ν f )(x) = 0 f¨ ur alle ν ∈ Rn \ {0}. (ii) Gelte (grad f )(x) 6= 0, und sei ν∗ =

(grad f )(x) . k(grad f )(x)k2

Dann gilt (∂ν f ) (x) < (∂ν ∗ f ) (x) = k(grad f )(x)k2 n



f¨ ur alle ν ∈ R \ {ν } mit kνk2 = 1. Beweis. Satz 19 zeigt (∂ν f )(x) = h(grad f )(x), νi f¨ ur alle ν ∈ Rn \ {0}, und hiermit folgt (i). Verwende Satz VIII.1.6 (Cauchy-Schwarzsche Ungleichung) um (ii) zu erhalten. Beispiel 42. Betrachte f gem¨aß Beispiel 22. Sei (x, y) ∈ R2 \ {0}. Dann (grad f )(x, y) =

y · (x2 − y 4 ) · (−y, 2x)> . (x2 + y 4 )2

Also gilt (grad f )(x, y) = 0 genau dann, wenn y = 0 oder |y| =

p |x|.

Bemerkung 43. In der Situation von Satz 38 sei m = k = 1, und f und g seien differenzierbar. Dann ergibt sich n X 0 (f ◦ g) (t) = h(grad f )(g(t)), (Dg)(t)i = (∂j f ) (g(t)) · gj0 (t) j=1

f¨ ur alle t ∈ D. Ist f ◦ g konstant, folgt ∀ t ∈ D : (grad f )(g(t)) ⊥ (Dg)(t). Literatur. [Fo2, §4–6], [H2, 162–166] und [K, 1.3.III]. 8

Bei [Fo2, S. 56] als Zeilenvektor“ eingef¨ uhrt. ”

X.2. Mittelwerts¨atze

2

228

Mittelwerts¨ atze

Gebiete in Rn Im Folgenden sei D ⊆ Rn . Definition 1. (i) F¨ ur x, y ∈ Rn heißt9 I(x, y) = {x + λ(y − x) : λ ∈ [0, 1]} die Verbindungsstrecke von x und y. (ii) D heißt konvex , falls ∀ x, y ∈ D : I(x, y) ⊆ D. (iii) F¨ ur k ∈ N und x0 , . . . , xk ∈ Rn heißt P (x0 , . . . , xk ) =

k [

I(x`−1 , x` )

`=1

der Polygonzug durch x0 , . . . , xk . (iv) D heißt Gebiet, falls D offen ist und falls f¨ ur alle x, y ∈ D ein Polygonzug P (x, . . . , y) ⊆ D existiert. Beispiel 2. (i) Die konvexen Mengen in R sind genau die Intervalle. Die Gebiete in R sind genau die offenen Intervalle. (ii) Abgeschlossene und offene Kugeln in Rn sind konvex. Bemerkung 3. Existiert f¨ ur alle x, y ∈ D ein Polygonzug P (x, . . . , y) ⊆ D und ist f : D → R stetig, so zeigt Korollar III.4.2 (zum Zwischenwertsatz): f (D) ist ein Intervall. Ausblick 4. Zusammenh¨angende Mengen, siehe [H2, 160, 161].

Mittelwertsatz im Fall m = 1 Im Folgenden seien ∅ 6= D ⊆ Rn offen und f : D → R differenzierbar. Satz 5. F¨ ur x, y ∈ D mit I(x, y) ⊆ D gilt ∃ λ ∈ ]0, 1[ : f (y) − f (x) = (Df )(x + λ(y − x)) · (y − x). 9

Konsistent mit der Notation auf Seite 212.

X.2. Mittelwerts¨atze

229

Beweis. Betrachte g(λ) = f (x + λ · (y − x)) und verwende die S¨atze 1.38 (Kettenregel) und IV.2.7 (Mittelwertsatz der Differentialrechnung, eindimensional). Korollar 6. Ist D ein Gebiet und gilt Df = 0, so ist f konstant. Beweis. Dies folgt unmittelbar aus Satz 5. Satz 7. Sei f stetig differenzierbar. Ferner seien ∅ 6= I ⊆ R ein offenes Intervall und g : I → Rn stetig differenzierbar, so daß g(I) ⊆ D. F¨ ur a, b ∈ I mit a < b sowie x = g(a) und y = g(b) gilt Z b (Df )(g(t)) · (Dg)(t) dt. f (y) − f (x) = a

Beweis. Verwende die S¨atze 1.38 (Kettenregel) und V.2.5 (1. Hauptsatz): F¨ ur h = f ◦g 0 0 und t ∈ I ist h stetig mit h (t) = (Df )(g(t)) · (Dg)(t). Ausblick 8. Kurvenintegrale zweiter Art, siehe [H2, 180].

Mittelwertsatz im allgemeinen Fall Im Folgenden seien ∅ 6= D ⊆ Rn offen und f : D → Rm stetig differenzierbar. Beispiel 9. Betrachte f : R → R2 : t 7→ (r cos(t), r sin(t))> gem¨aß Beispiel 1.14. F¨ ur alle ξ ∈ R gilt f (2π) − f (0) = 0 6= (Df )(ξ) · 2π. Vgl. Satz 5. Korollar 10. F¨ ur x, y ∈ D mit I(x, y) ⊆ D und i ∈ {1, . . . , m} gilt Z 1 fi (y) − fi (x) = (Dfi )(x + λ(y − x)) · (y − x) dλ. 0

Beweis. Verwende Satz 7 mit g(λ) = x + λ(y − x). Bemerkung 11. Durch kAkF =

m X n X

!1/2 a2i,j

i=1 j=1

f¨ ur A = (ai,j )i,j ∈ R

m×n

wird eine Norm auf Rm×n definiert. F¨ ur alle x ∈ Rn gilt kAxk2 ≤ kAkF · kxk2 ,

siehe ¨ Ubung 8.4. Es folgt kAk ≤ kAkF f¨ ur die durch die euklidischen Normen auf Rn und Rm induzierte Abbildungsnorm. Definition 12. k · kF heißt Frobenius-Norm auf Rm×n . Satz 13. F¨ ur x, y ∈ D mit I(x, y) ⊆ D gilt kf (y) − f (x)k2 ≤ sup k(Df )(z)kF · ky − xk2 . z∈I(x,y)

X.3. Taylor-Approximation

230

Beweis. Beachte, daß z 7→ k(Df )(z)kF eine beschr¨ankte Funktion auf I(x, y) definiert und daß k(Dfi )(z)kF ≤ k(Df )(z)kF f¨ ur z ∈ I(x, y) und i ∈ {1, . . . , m}. Bemerkung 11 zeigt |(Dfi )(z) · (y − x)| ≤ k(Dfi )(z)kF · ky − xk2 , und mit Korollar 10 folgt 1

Z

|(Dfi )(x + λ(y − x)) · (y − x)| dλ Z 1 k(Dfi )(x + λ(y − x))kF dλ. ≤ ky − xk2

|fi (y) − fi (x)| ≤

0

0

Mit Satz VIII.1.6 (Cauchy-Schwarzsche Ungleichung) und Beispiel VIII.1.4 ergibt sich 2 m Z 1 X 2 2 k(Dfi )(x + λ(y − x))kF dλ kf (y) − f (x)k2 ≤ ky − xk2 · ≤ ky − xk22 ·

0 i=1 Z m X 1

k(Dfi )(x + λ(y − x))k2F dλ

0

i=1 1

= ky − xk22 ·

Z

k(Df )(x + λ(y − x))k2F dλ

0

≤ ky −

xk22

· sup k(Df )(z)k2F . z∈I(x,y)

Korollar 14. Seien ∅ 6= D0 ⊆ D konvex und (Df )|D0 beschr¨ankt. Dann gilt ∀ x, y ∈ D0 : kf (y) − f (x)k2 ≤ sup k(Df )(z)kF · ky − xk2 . z∈D0

Beweis. F¨ ur x, y ∈ D0 gilt I(x, y) ⊆ D0 . Verwende Satz 13. Bemerkung 15. Korollar 6 gilt analog im vorliegenden Fall. Literatur. [Fo2, §6], [H2, 167] und [K, 2.2 und 3.2].

3

Taylor-Approximation

Im Folgenden seien ∅ 6= D ⊆ Rn offen und f : D → R.

Partielle Ableitungen h¨ oherer Ordnung Definition 1. (i) f heißt einmal (stetig) partiell differenzierbar, falls f (stetig) partiell differenzierbar ist. Die Funktionen ∂j f : D → R mit j ∈ {1, . . . , n} heißen die partiellen Ableitungen der Ordnung eins von f .

X.3. Taylor-Approximation

231

(ii) F¨ ur k ∈ N heißt f (k + 1)-mal (stetig) partiell differenzierbar , falls f k-mal partiell differenzierbar ist und alle partiellen Ableitungen der Ordnung k von f (stetig) partiell differenzierbar sind. Die Funktionen ∂j g : D → R mit j ∈ {1, . . . , n} und einer partiellen Ableitung g der Ordnung k von f heißen die partiellen Ableitungen der Ordnung k + 1 von f . (iii) f heißt beliebig oft partiell differenzierbar, falls f f¨ ur jedes k ∈ N k-mal stetig differenzierbar ist. Notation: F¨ ur k ∈ N ist C k (D) die Menge der k-mal stetig partiell differenzierbaren T k Funktionen von D nach R. Ferner ist C 0 (D) = C(D) und C ∞ (D) = ∞ k=1 C (D). Bemerkung 2. C k (D) ist ein Vektorraum, und aus f, g ∈ C k (D) folgt f · g ∈ C k (D). Ausblick 3. Die W¨armeleitungsgleichung, siehe [H2, 219]. Lemma 4. F¨ ur r > 0 sei Q = ]−r, r[2 . Die Funktion ϕ : Q → R besitze die partiellen Ableitungen ∂1 ϕ und ∂2 (∂1 ϕ) auf Q. Ferner sei ψ(u, v) = ϕ(u, v) − ϕ(0, v) − ϕ(u, 0) + ϕ(0, 0),

(u, v) ∈ Q.

F¨ ur alle (u, v) ∈ Q mit u, v 6= 0 existiert (ξ, η) ∈ ]min(u, 0), max(u, 0)[ × ]min(v, 0), max(v, 0)[ mit

ψ(u, v) = (∂2 (∂1 ϕ))(ξ, η). u·v

Beweis. Setze g(ξ) = ϕ(ξ, v) − ϕ(ξ, 0) f¨ ur ξ ∈ [min(u, 0), max(u, 0)]. Dann gilt g 0 (ξ) = (∂1 ϕ)(ξ, v) − (∂1 ϕ)(ξ, 0) und ψ(u, v) = g(u) − g(0). Gem¨aß Satz IV.2.7 (Mittelwertsatz der Differentialrechnung, eindimensional) existiert ξ ∈ ]min(u, 0), max(u, 0)[ mit g(u) − g(0) = g 0 (ξ) · u und η ∈ ]min(v, 0), max(v, 0)[ mit g 0 (ξ) = (∂2 (∂1 ϕ))(ξ, η) · v.

Satz 5 (Satz von Schwarz). F¨ ur i, j ∈ {1, . . . , n} mit i 6= j besitze10 f die partiellen Ableitungen ∂i f , ∂j f und ∂j (∂i f ) auf D. Ferner sei ∂j (∂i f ) stetig in x ∈ D. Dann existiert die partielle Ableitung ∂i (∂j f ) in x, und es gilt (∂i (∂j f ))(x) = (∂j (∂i f ))(x). 10

Bei [Fo2, S. 59] unter st¨ arkeren Voraussetzungen pr¨asentiert.

X.3. Taylor-Approximation

232

Beweis. Sei E = (e1 , . . . , en ) die Standardbasis von Rn , und sei Rn mit der Supremumsnorm versehen. W¨ahle r > 0 mit Br (x) ⊆ D. Sei ε > 0. Wir zeigen die Existenz von δ ∈ ]0, r], so daß (∂j f )(x + uei ) − (∂j f )(x) ≤ε − (∂ (∂ f ))(x) j i u

(1)

f¨ ur alle u ∈ R mit 0 < |u| < δ. Definiere dazu ϕ : ]−r, r[2 → R durch ϕ(u, v) = f (x + uei + vej ). Dann gilt gem¨aß Satz 1.38 (Kettenregel) (∂1 ϕ)(u, v) = (∂i f )(x + uei + vej ), (∂2 ϕ)(u, v) = (∂j f )(x + uei + vej ), (∂2 (∂1 ϕ))(u, v) = (∂j (∂i f ))(x + uei + vej ), so daß (1) ¨aquivalent zu11 (∂2 ϕ)(u, 0) − (∂2 ϕ)(0, 0) ≤ε − a u mit a = (∂2 (∂1 ϕ))(0, 0) ist. W¨ahle δ ∈ ]0, r] mit |(∂2 (∂1 ϕ))(ξ, η) − a| < ε f¨ ur alle (ξ, η) ∈ ]−δ, δ[2 , was aufgrund der Stetigkeit von ∂j (∂i f ) in x m¨oglich ist. Sei (u, v) ∈ ]−δ, δ[2 mit u, v 6= 0. Einerseits folgt mit Lemma 4 ψ(u, v) u · v − a < ε. Andererseits gilt ψ(u, v) 1 = · u·v u so daß



ϕ(u, v) − ϕ(u, 0) ϕ(0, v) − ϕ(0, 0) − v v

 ,

(∂2 ϕ)(u, 0) − (∂2 ϕ)(0, 0) ψ(u, v) = lim ∈ [a − ε, a + ε]. v→0 u · v u

Bemerkung 6. Aus der Existenz der partiellen Ableitungen ∂j (∂i f ) und ∂i (∂j f ) in x ∈ D f¨ ur i, j ∈ {1, . . . , n} mit i 6= j folgt nicht ihre Gleichheit. Siehe [H2, S. 253]. Korollar 7. F¨ ur f ∈ C k (D) mit k ≥ 2, σ ∈ Sk und i1 , . . . , ik ∈ {1, . . . , n} gilt   ∂iσ(k) . . . (∂iσ(1) f ) = ∂ik . . . (∂i1 f ) . 11

Eine kurze Version des Beweises startet erst hier mit: oBdA n = 2, x = 0, i = 1 und j = 2.

X.3. Taylor-Approximation

233

Beweis. Verwende Satz 5 und die Tatsache, daß jede Permutation die Komposition von Vertauschungen benachbarter Elemente ist, siehe Tutorium 1.2 und vgl. Lemma VII.1.2. Schließe induktiv. Notation: (i) F¨ ur k ∈ N und i ∈ {1, . . . , n}k ist A(i) = (α1 , . . . , αn ) ∈ Nn0 definiert durch αj = |{` ∈ {1, . . . , k} : i` = j}|. (ii) F¨ ur α ∈ Nn0 ist |α| =

n X

αj .

j=1

Sprechweise: |α| heißt die Ordnung des Multiindex α. (iii) F¨ ur f ∈ C k (D) mit k ∈ N0 und α ∈ Nn0 mit |α| ≤ k definieren wir12 rekursiv, unter Beachtung von Korollar 7, f (0) = f und f (α+β) = (∂i f (α) ), falls |α| < k und β ∈ Nn0 mit |β| = 1 = βi f¨ ur i ∈ {1, . . . , n}. Bemerkung 8. F¨ ur f ∈ C k (D) mit k ∈ N, i ∈ {1, . . . , n}k und α = A(i) gilt gem¨aß Korollar 7  ∂ik . . . (∂i1 f ) = f (α) . Beispiel 9. Sei D = R2 , und sei f : D → R gegeben durch f (x1 , x2 ) = exp(x1 ) · sin(x2 ). Dann gilt f ∈ C ∞ (R2 ), und es ergibt sich f (2,0) (x1 , x2 ) = f (1,0) (x1 , x2 ) = f (x1 , x2 ), f (1,1) (x1 , x2 ) = f (0,1) (x1 , x2 ) = exp(x1 ) · cos(x2 ), f (0,2) (x1 , x2 ) = −f (x1 , x2 ).

Taylor-Formel Notation: F¨ ur α ∈ Nn0 und x ∈ Rn ist α! =

n Y

αj !,

α

x =

j=1

n Y

α

xj j .

j=1

Lemma 10. F¨ ur α ∈ Nn0 mit |α| = k ≥ 1 gilt |{i ∈ {1, . . . , n}k : A(i) = α}| = 12

[Fo2] verwendet die Notation Dα f statt f (α) .

k! . α!

X.3. Taylor-Approximation

234

Beweis. Induktion nach n. F¨ ur n = 1 ist die Aussage evident. Seien n ∈ N und α ∈ Nn+1 mit |α| = k. Falls αn+1 < k, ergibt sich mit Satz II.3.9.(ii) 0 und der Induktionsannahme |{i ∈ {1, . . . , n + 1}k : A(i) = α}| 

k−αn+1

k



: A(i) = (α1 , . . . , αn )}| · = |{i ∈ {1, . . . , n} αn+1   (k − αn+1 )! k k! = · = . α1 ! · · · αn ! αn+1 α! Falls αn+1 = k, ist die Aussage evident. Stichwort: Multinomialkoeffizient. Im Folgenden seien a, x ∈ D mit I(a, x) ⊆ D. F¨ ur δ > 0 hinreichend klein sei g : ]−δ, 1 + δ[ → R definiert durch g(s) = f (a + s(x − a)). Ferner sei k ∈ N0 . Lemma 11. Sei f ∈ C k (D). Dann ist g k-mal stetig differenzierbar mit13 g (k) (s) =

X k! · f (α) (a + s(x − a)) · (x − a)α , α!

s ∈ ]−δ, 1 + δ[ .

|α|=k

Beweis. Klar f¨ ur k = 0. Per Induktion nach k ≥ 1 ergibt sich mit Satz 1.38 (Kettenregel) die k-malige Differenzierbarkeit von g und X  g (k) (s) = ∂ik . . . (∂i1 f ) (a + s(x − a)) · (xi1 − ai1 ) · · · (xik − aik ). i∈{1,...,n}k

Die Stetigkeit von g (k) ist jetzt evident, und Bemerkung 8 zeigt X X g (k) (s) = f (α) (a + s(x − a)) · (x − a)α |α|=k A(i)=α

=

X

 f (α) (a + s(x − a)) · (x − a)α · |{i ∈ {1, . . . , n}k : A(i) = α}| .

|α|=k

Wende Lemma 10 an. Bemerkung 12. Sei f ∈ C k (D). Dann gilt Tk (g, 0)(1) =

k X g (`) (0) `=0

`!

=

X f (α) (a) · (x − a)α α!

|α|≤k

f¨ ur das Taylor-Polynom Tk (g, 0) der Ordnung k von g mit Entwicklungspunkt 0. 13

Die Kurzschreibweise

P

|α|=k

steht f¨ ur die Summation u ¨ber alle α ∈ Nn0 mit |α| = k.

X.3. Taylor-Approximation n)

F¨ ur α ∈ Nn0 sei uα ∈ R(R

235

definiert durch uα (x) = xα .

Wir setzen Πk,n = span({uα : α ∈ Nn0 , |α| ≤ k}) sowie Π−1 = {0}. Definition 13. (i) Die Elemente von span({uα : α ∈ Nn0 }) heißen multivariate Polynomfunktionen. (ii) F¨ ur v ∈ Πk,n \ Πk−1,n heißt k der Grad von v. Bemerkung 14. Es gilt Πk,n = span({uα (· − a) : α ∈ Nn0 , |α| ≤ k}). Definition 15. Sei f ∈ C k (D). Dann heißt Tk (f, a) : Rn → R, gegeben durch X f (α) (a) Tk (f, a)(ξ) = · (ξ − a)α , α!

ξ ∈ Rn ,

|α|≤k

das Taylor-Polynom der Ordnung k von f mit Entwicklungspunkt a. Beispiel 16. In der Situation von Beispiel 9 gilt T0 (f, 0)(ξ) = f (0) = 0, T1 (f, 0)(ξ) = T0 (f, 0)(ξ) + f (1,0) (0) · ξ1 + f (0,1) (0) · ξ2 = ξ2 , T2 (f, 0)(ξ) = T1 (f, 0)(ξ) +

f (2,0) (0) 2 f (0,2) (0) 2 · ξ1 + f (1,1) (0) · ξ1 · ξ2 + · ξ2 2 2

= ξ2 + ξ1 · ξ2 . Entsprechende Graphiken finden sich in Abschnitt A.9. Setze Rk (f, a)(x) = f (x) − Tk (f, a)(x). Satz 17 (Lagrange-Restglied). Sei f ∈ C k+1 (D). Dann existiert λ ∈ [0, 1] mit Rk (f, a)(x) =

X f (α) (a + λ(x − a)) · (x − a)α . α!

|α|=k+1

Beweis. Es gilt Rk (f, a)(x) = g(1) − Tk (g, 0)(1). Satz IX.4.35 (Lagrange-Restglied) und Lemma 11 zeigen die Existenz von λ ∈ [0, 1] mit Rk (f, a)(x) =

X f (α) (a + λ(x − a)) g (k+1) (λ) = · (x − a)α . (k + 1)! α! |α|=k+1

X.3. Taylor-Approximation

236

Korollar 18. (i) Sei f ∈ C k (D). Dann gilt Rk (f, a)(x) = 0. x→a kx − akk lim

(ii) Sei f ∈ C k+1 (D). F¨ ur ε > 0 existiert δ > 0, so daß   X |f (α) (a)| |Rk (f, a)(x)| ≤  + ε · kx − akk+1 ∞ α! |α|=k+1

f¨ ur alle x ∈ D mit kx − ak∞ < δ. Beweis. Beachte, daß |ξ α | = |ξ1 |α1 · · · |ξn |αn ≤ kξkk∞ f¨ ur ξ ∈ Rn und |α| = k ∈ N0 . ad (i): Betrachte den nicht-trivialen Fall k > 0. Es gilt Rk (f, a)(x) = Rk−1 (f, a)(x) −

X f (α) (a) · (x − a)α , α!

|α|=k

und Satz 17 zeigt f¨ ur ein λ ∈ [0, 1] Rk (f, a)(x) =

X f (α) (a + λ(x − a)) − f (α) (a) · (x − a)α . α!

|α|=k

F¨ ur x ∈ D \ {a} folgt X |f (α) (a + λ(x − a)) − f (α) (a)| |Rk (f, a)(x)| ≤ . kx − akk∞ α! |α|=k

ad (ii): Verwende wiederum Satz 17. Bemerkung 19. Seien f ∈ C k (D) und g ∈ Πk,n . Falls lim

x→a

f (x) − g(x) = 0, kx − akk

folgt g = Tk (f, a), siehe ¨ Ubung 10.1. In diesem Sinn ist Tk (f, a) die optimale lokale Approximation von f um a durch Funktionen aus Πk,n .

X.3. Taylor-Approximation

237

Lokale Extrema Im Folgenden seien ∅ 6= D ⊆ Rn und f : D → R. Definition 20. x ∈ D heißt (i) lokales Maximum von f , falls ∃ δ > 0 ∀ y ∈ D ∩ Bδ (x) : f (y) ≤ f (x), (ii) lokales Minimum von f , falls ∃ δ > 0 ∀ y ∈ D ∩ Bδ (x) : f (y) ≥ f (x), (iii) globales Maximum von f , falls ∀ y ∈ D : f (y) ≤ f (x), (iv) globales Minimum von f , falls ∀ y ∈ D : f (y) ≥ f (x). Ferner steht Extremum f¨ ur Maximum oder Minimum, und lokale Extrema heißen streng (strikt), falls die entsprechende Forderung mit < bzw. > f¨ ur alle y ∈ D mit 0 < kx − yk < δ gilt. Bemerkung 21. Globale Extrema sind lokale Extrema. ˚ ein lokales Extremum von f . Falls f in x partiell differenzierbar Satz 22. Sei x ∈ D ist, gilt14 (∂j f )(x) = 0 f¨ ur j = 1, . . . , n. Beweis. F¨ ur δ > 0 hinreichend klein sei gj : ]xj − δ, xj + δ[ → R definiert durch gj (ξ) = f (x1 , . . . , xj−1 , ξ, xj+1 , . . . , xn ). Dann ist xj ein lokales Extremum von gj , und es gilt gj0 (xj ) = (∂j f )(x). Wende Satz IV.2.3 (notwendige Bedingung f¨ ur lokales Extremum) an. Im Folgenden sei D offen, und es gelte f ∈ C 2 (D). Definition 23. Die Hesse-Matrix von f an der Stelle x ∈ D ist definiert durch (Hf )(x) = ((∂i (∂j f ))(x))1≤i,j≤n ∈ Rn×n . Bemerkung 24. (i) Gem¨aß Satz 5 ist (Hf )(x) symmetrisch. 14

Solche Punkte x heißen kritische Punkte von f .

X.3. Taylor-Approximation

238

(ii) F¨ ur ξ ∈ Rn gilt T2 (f, x)(x + ξ) = f (x) + (Df )(x) · ξ +

1 > · ξ · (Hf )(x) · ξ. 2

Beispiel 25. In der Situation von Beispiel 16 gilt (Df )(0) = (0, 1) und

  0 1 (Hf )(0) = . 1 0

Definition 26. A ∈ Rn×n heißt (i) negativ definit, falls −A positiv definit ist, (ii) indefinit, falls ∃ η, ξ ∈ Rn : (η > Aη > 0 ∧ ξ > Aξ < 0). Bemerkung 27. Sei A ∈ Rn×n symmetrisch. Satz VIII.3.10 (Charakterisierung positiv definiter Abbildungen) zeigt A negativ definit ⇔ σ(A) ⊆ ]−∞, 0[ , und ebenso zeigt man A indefinit ⇔ (σ(A) ∩ ]0, ∞[ 6= ∅ ∧ σ(A) ∩ ]−∞, 0[ 6= ∅) . Satz 28. Sei x ∈ D mit (Df )(x) = 0. (i) Ist (Hf )(x) positiv definit, so ist x ein strenges lokales Minimum von f . (ii) Ist (Hf )(x) negativ definit, so ist x ein strenges lokales Maximum von f . (iii) Ist (Hf )(x) indefinit, so besitzt f in x kein lokales Extremum. Beweis. Betrachte die euklidische Norm auf Rn , setze A = (Hf )(x) und w¨ahle δ > 0 mit Bδ (x) ⊆ D. Gem¨aß Korollar VIII.3.7 (Diagonalisierung symmetrischer Matrizen) existieren λ1 ≤ . . . ≤ λn und eine orthogonale Matrix S ∈ Rn×n mit A = SΛS > f¨ ur Λ = diag(λ1 , . . . , λn ). F¨ ur ξ ∈ Bδ (0) folgt f (x + ξ) − f (x) = R2 (f, x)(x + ξ) +

1 > · ξ Aξ. 2

ad (i): In diesem Fall gilt λ1 > 0, und es folgt ξ > Aξ = S > ξ

>

2  Λ S > ξ ≥ λ1 · S > ξ 2 = λ1 kξk22 .

X.3. Taylor-Approximation

239

Gem¨aß Korollar 18.(i) existiert 0 < δ 0 < δ mit |R2 (f, x)(x + ξ)| ≤ λ1 /4 · kξk22 f¨ ur ξ ∈ Bδ0 (0). Fazit: f¨ ur ξ ∈ Bδ0 (0) \ {0} gilt f (x + ξ) − f (x) ≥ −λ1 /4 kξk22 + λ1 /2 kξk22 = λ1 /4 kξk22 > 0. ad (ii): Wende das bereits Bewiesene auf −f an. ad (iii): In diesem Fall gilt λ1 < 0 < λn , und es existieren ξ1 , ξn ∈ Rn \ {0} mit Aξ` = λ` ξ` f¨ ur ` = 1, n. Es folgt f (x + ξ` ) − f (x) = R2 (f, x)(x + ξ` ) + λ` /2 · kξ` k2 . Schließe wie oben. Beispiel 29. Sei f : R2 → R definiert durch f (x, y) = x3 + y 3 − 3xy. Dann gilt f ∈ C ∞ (R2 ) und (Df )(x, y) = 3 · (x2 − y, y 2 − x) sowie



 2x −1 (Hf )(x, y) = 3 · . −1 2y

Somit (Df )(x, y) = 0 ⇔ x2 = y ∧ y 2 = x. Offenbar gilt (Df )(0, 0) = (Df )(1, 1) = 0, und aus (Df )(x, y) = 0 folgt y ≥ 0∧y 4 = y und weiter y ∈ {0, 1}. Zusammenfassend erh¨alt man {(x, y) ∈ R2 : (Df )(x, y) = 0} = {(0, 0), (1, 1)}. Da



 0 −1 (Hf )(0, 0) = 3 · , −1 0

folgt σ((Hf )(0, 0)) = {−3, 3}, weshalb (0, 0) kein lokales Extremum von f ist. Da   2 −1 (Hf )(1, 1) = 3 · , −1 2 folgt σ((Hf )(1, 1)) = {3, 9}, weshalb (1, 1) ein strenges lokales Minimum von f ist. Entsprechende Graphiken finden sich in Abschnitt A.10. Schließlich gilt limy→∞ f (0, y) = ∞ und limy→−∞ f (0, y) = −∞. Fazit: (i) f besitzt genau ein lokales Extremum, n¨amlich (1, 1), und dieser Punkt ist ein strenges lokales Minimum von f .

X.4. Implizite Funktionen

240

(ii) f besitzt keine globalen Extrema. Beispiel 30. F¨ ur k = 1, 2, 3 sei fk : R2 → R definiert durch f1 (x, y) = x2 + y 4 , f2 (x, y) = x2 , f3 (x, y) = x2 + y 3 . Es gilt (Dfk )(0, 0) = 0 sowie  (Hfk )(0, 0) =

2 0 0 0



f¨ ur k = 1, 2, 3. Damit ist (Hfk )(0, 0) weder positiv oder negativ definit, noch indefinit. Ferner gilt: f1 besitzt in (0, 0) ein strenges lokales Minimum, f2 besitzt in (0, 0) ein lokales Minimum, das nicht streng ist, und f3 besitzt in (0, 0) kein lokales Extremum. Literatur. [Fo2, §7].

4

Implizite Funktionen

Der Banachsche Fixpunktsatz Definition 1. (i) Seien X 6= ∅ und g : X → X. Dann heißt x ∈ X Fixpunkt von g, falls g(x) = x. (ii) Seien (X, d) ein metrischer Raum und g : X → X. Dann heißt g Kontraktion, falls q ∈ ]0, 1[ existiert, so daß ∀ x, y ∈ X : d(g(x), g(y)) ≤ q · d(x, y). Satz 2. Seien (X, d) ein vollst¨andiger metrischer Raum und g : X → X eine Kontraktion. Dann gilt: (i) F¨ ur alle x0 ∈ X ist (xn )n∈N0 , rekursiv definiert durch xn+1 = g(xn ), konvergent, und limn xn ist ein Fixpunkt von g. (ii) g besitzt genau einen Fixpunkt. Beweis. Siehe ¨ Ubung 7.1 oder [Fo2, S. 92]. Bemerkung 3. Seien V ein Vektorraum, ∅ = 6 D ⊆ V und f : D → V . Frage: Existenz, und ggf. Berechnung, von v ∈ D mit f (v) = 0? F¨ ur g : D → V , definiert durch g(v) = v − f (v), und v ∈ D gilt f (v) = 0 ⇔ g(v) = v.

X.4. Implizite Funktionen

241

Ein m¨oglicher L¨osungsweg: Zeige die Existenz von ∅ 6= D0 ⊆ D mit ∀ v ∈ D0 : g(v) ∈ D0 .

(1)

Konstruiere eine Metrik d auf D0 , so daß (D0 , d) vollst¨andig und g|D0 : D0 → D0 eine Kontraktion ist. Gelingt dies, ist Satz 2 anwendbar, und der Fixpunkt v von g|D0 ist die eindeutig bestimmte L¨osung von f (v) = 0 mit v ∈ D0 . Spezialfall: V = Rm , D ⊆ Rm offen und f stetig differenzierbar. Dann ist g stetig differenzierbar mit Dg = Em − Df . Existiert eine abgeschlossene und konvexe Menge ∅ 6= D0 ⊆ D mit (1) und sup k(Dg)(v)kF < 1, v∈D0

besitzt f |D0 (v) = 0 genau eine L¨osung. Siehe Lemma IX.2.34.(iv) (metrische Unterr¨aume) und Korollar 2.14 (zum Mittelwertsatz).

Implizit definierte Funktionen Im Folgenden seien k, m ∈ N, ∅ 6= D1 ⊆ Rk und ∅ 6= D2 ⊆ Rm offen sowie F : D1 × D2 → Rm . Definition 4. Seien U1 ⊆ D1 und U2 ⊆ D2 Umgebungen von a ∈ D1 bzw. b ∈ D2 , und gelte F (a, b) = 0. (2) Dann heißt g : U1 → U2 mit g(a) = b und15 ∀ x ∈ U1 : F (x, g(x)) = 0 eine durch (2) implizit definierte Funktion. Beispiel 5. (i) Gelte D1 = R2 und D2 = R, und sei F : R3 → R gegeben durch F (x1 , x2 , y) = x21 + x22 + y 2 − 1. Ferner gelte (2) f¨ ur a ∈ R2 und b ∈ R. Sei b 6= 0. Dann gilt kak2 < 1. Definiere g : {x ∈ R2 : kxk2 ≤ 1} → R durch

q g(x) = 1 − kxk22 ,

falls b > 0, und durch q g(x) = − 1 − kxk22 , falls b < 0. Dann ist g eine durch (2) implizit definierte Funktion. Falls b = 0, existiert keine solche Funktion. 15

g beschreibt lokal eine Aufl¨ osung“ der Gleichung F (x, y) = 0 nach y. ”

X.4. Implizite Funktionen

242

(ii) Gelte D1 = D2 = R, und sei F gegeben durch F (x, y) = min(|x − y|, |x + y|). Dann liefern g(x) = |x|, g(x) = −|x|, g(x) = x und g(x) = −x implizit durch F (0, 0) = 0 definierte Funktionen g : R → R. (iii) F¨ ur A ∈ Rm×m und a, b ∈ Rm gelte Ab = a. Setze D1 = D2 = Rm , und definiere F durch F (x, y) = x − Ay. F¨ ur jede Umgebung U1 von a gilt: Die Existenz einer durch (2) implizit definierten Funktion g : U1 → Rm ist a¨quivalent zu A ∈ Gl(m, R). Beweis: ⇒“ ” rang A = m, ⇐“ g(x) = A−1 x. ”

Existenz, Eindeutigkeit und Stetigkeit Im Folgenden sei F stetig differenzierbar. Notation: ∂ (2) F : D1 × D2 → Rm×m sei definiert durch   ∂k+1 F1 . . . ∂k+m F1   .. ∂ (2) F =  ... . . ∂k+1 Fm . . . ∂k+m Fm Satz 6. F¨ ur (a, b) ∈ D1 × D2 gelte (2) und (∂ (2) F )(a, b) ∈ Gl(m, R). Dann existieren eine offene Umgebung U1 ⊆ D1 von a und eine abgeschlossene Umgebung U2 ⊆ D2 von b sowie eine stetige Abbildung g : U1 → U2 , so daß ∀ (x, y) ∈ U1 × U2 : F (x, y) = 0 ⇔ y = g(x). Beweis. OBdA gelte16 (a, b) = (0, 0). Setze B = (∂ (2) F )(0, 0) und definiere G : D1 × D2 → Rm durch G(x, y) = y − B −1 F (x, y). Offenbar ist F (x, y) = 0 ¨aquivalent zu G(x, y) = y. Ferner gilt (∂ (2) G)(x, y) = Em − B −1 · (∂ (2) F )(x, y). 16

Andernfalls betrachtet man F˜ (x, y) = F (x + a, y + b).

(3)

X.4. Implizite Funktionen

243

Wir zeigen zun¨achst die Existenz U1 und U2 wie oben, so daß G(x, ·) : U2 → U2 f¨ ur alle x ∈ U1 wohldefiniert und eine Kontraktion ist. (`) Mit Bδ (0) bezeichnen wir die offene Kugel mit Radius δ > 0 um 0 ∈ R` bzgl. der euklidischen Norm. Da (∂ (2) G)(0, 0) = 0 und ∂ (2) G stetig ist, existiert δ2 > 0 mit (k) (m) Bδ2 (0) ⊆ D1 , Bδ2 (0) ⊆ D2 und

(2)

(∂ G)(x, y) ≤ 1/2. sup F (k) 2

(m) (0) 2

(x,y)∈Bδ (0)×Bδ

Mit Satz 2.13 (Mittelwertsatz) folgt (k)

(m)

∀ x ∈ Bδ2 (0) ∀ y, z ∈ Bδ2 (0) : kG(x, y) − G(x, z)k2 ≤ ky − zk2 /2.

(4)

Da G(0, 0) = 0 und G stetig ist, existiert 0 < δ1 ≤ δ2 mit sup (k) 1

kG(x, 0)k2 ≤ δ2 /4.

x∈Bδ (0)

Setze (k)

U1 = Bδ1 (0), (k)

(m)

U2 = Bδ2 /2 (0).

(m)

F¨ ur x ∈ U1 ⊆ Bδ2 (0) und y ∈ U2 ⊆ Bδ2 (0) folgt kG(x, y)k2 ≤ kG(x, y) − G(x, 0)k2 + kG(x, 0)k2 ≤ kyk2 /2 + δ2 /4 ≤ δ2 /2,

(5)

d.h. G(x, y) ∈ U2 . Satz 2 zeigt die Existenz einer Abbildung g : U1 → U2 mit (3), vgl. Bemerkung 3. Wir zeigen nun17 die Stetigkeit von g, und wir betrachten dazu den Banach-Raum (B(U1 , Rm ), k · k∞ ), wobei Rm mit der euklidischen Norm versehen ist, siehe Satz IX.2.15. Setze X = {f ∈ B(U1 , Rm ) : f stetig, kf k∞ ≤ δ2 /2}. Gem¨aß Korollar IX.4.9 und Beispiel IX.2.22.(i) (Stetigkeit der Norm) ist X abgeschlossen, und damit nach Lemma IX.2.34.(iv) als metrischer Unterraum vollst¨andig. F¨ ur f ∈ X und x ∈ U1 sei h(x) = G(x, f (x)). Dann gilt h ∈ C(U1 , Rm ) und khk∞ ≤ δ2 /2, siehe (5). Somit wird durch f 7→ h eine Abbildung Φ:X→X definiert. F¨ ur f, h ∈ X und x ∈ U1 gilt k(Φf )(x) − (Φh)(x)k2 ≤ kf (x) − h(x)k2 /2 ≤ kf − hk∞ /2, siehe (4), d.h. kΦf − Φhk∞ ≤ kf − hk∞ /2. Gem¨aß Satz 2 besitzt Φ einen eindeutig bestimmten Fixpunkt g˜ ∈ X. Nach Definition ist Φ˜ g = g˜ ¨aquivalent zu F (x, g˜(x)) = 0 f¨ ur alle x ∈ U1 , und mit (3) folgt g = g˜. 17

Dieser Beweisteil gen¨ ugt f¨ ur die Existenzaussage, w¨ahrend der erste Teil nur zum Beweis der Eindeutigkeit ben¨ otigt wird.

X.4. Implizite Funktionen

244

Stetige Differenzierbarkeit Lemma 7. Sei Gl(m, R) versehen mit der durch eine Norm auf Rm×m induzierten Metrik. Dann definiert A 7→ A−1 eine stetige Abbildung auf Gl(m, R). Beweis. Gem¨aß Satz IX.3.17 (Normen auf endlich-dimensionalen R¨aumen) gen¨ ugt es m×m eine Abbildungsnorm auf R zu betrachten. F¨ ur A, B ∈ Gl(m, R) gilt kB −1 − A−1 k = kA−1 · (B − A) · B −1 k  ≤ kA−1 k · kB − Ak · kA−1 k + kB −1 − A−1 k . Falls kB − Ak ≤ 1/(2 · kA−1 k), ergibt sich kB −1 − A−1 k ≤ 2 kA−1 k2 · kB − Ak.

Notation: ∂ (1) F : D1 × D2 → Rm×k sei definiert durch   ∂1 F1 . . . ∂k F1  ..  . ∂ (1) F =  ... .  ∂1 Fm . . . ∂k Fm Lemma 8. Sei U1 ⊆ Rk offen, und sei g : U1 → U2 eine differenzierbare, implizit durch (2) gegebene Funktion. Falls ∀ x ∈ U1 : (∂ (2) F )(x, g(x)) ∈ Gl(m, R),

(6)

ist g stetig differenzierbar mit −1 (Dg)(x) = − (∂ (2) F )(x, g(x)) · (∂ (1) F )(x, g(x)).

(7)

Beweis. F¨ ur x ∈ U1 sei h(x) = F (x, g(x)). Einerseits gilt h = 0, andererseits zeigt Satz 1.38 (Kettenregel)   Ek (Dh)(x) = (DF )(x, g(x)) · . (Dg)(x) Da  (DF )(x, y) = (∂ (1) F )(x, y) | (∂ (2) F )(x, y) f¨ ur (x, y) ∈ D1 × D2 , ergibt sich (∂ (1) F )(x, g(x)) + (∂ (2) F )(x, g(x)) · (Dg)(x) = 0, und hieraus folgt (7). Wende Lemma 7 an, um aus (7) die stetige Differenzierbarkeit von g zu erhalten.

X.4. Implizite Funktionen

245

Satz 9. F¨ ur (a, b) ∈ D1 × D2 gelte (2) und (∂ (2) F )(a, b) ∈ Gl(m, R). Dann existieren eine offene Umgebung U1 ⊆ D1 von a und eine abgeschlossene Umgebung U2 ⊆ D2 von b sowie eine stetig differenzierbare Abbildung g : U1 → U2 mit (3). Beweis. Betrachte g : U1 → U2 gem¨aß Satz 6, und beachte, daß det : Rn×n → R stetig ist, siehe Satz VII.1.15 (Leibniz-Formel). Indem man U1 ggf. verkleinert, erreicht man (6). Gem¨aß Lemma 8 bleibt die Differenzierbarkeit von g zu zeigen. F¨ ur x ∈ U1 seien (1) (2) A = (∂ F )(x, g(x)) und B = (∂ F )(x, g(x)). Setze   ξ−x r(ξ, η) = F (ξ, η) − (DF )(x, g(x)) · η − g(x) = F (ξ, η) − A · (ξ − x) − B · (η − g(x)) f¨ ur (ξ, η) ∈ D1 × D2 . Insbesondere f¨ ur ξ ∈ U1 gilt r(ξ, g(ξ)) = −A · (ξ − x) − B · (g(ξ) − g(x)), und hieraus folgt g(ξ) − g(x) = −B −1 · A · (ξ − x) − B −1 · r(ξ, g(ξ)).

(8)

r(ξ, g(ξ)) = 0. ξ→x kx − ξk

(9)

Zu zeigen bleibt lim

Betrachte dazu Normen auf Rm und Rk und die zugeh¨origen Abbildungsnormen auf Rm×m und Rm×k , die unterschiedslos mit k · k bezeichnet werden. Sei 0 0, so daß  kr(ξ, η)k ≤ ε · kξ − xk + kη − g(x)k f¨ ur (ξ, η) ∈ D1 × D2 mit kξ − xk + kη − g(x)k < δ.

(10)

Aufgrund der Stetigkeit von g in x existiert eine Umgebung U10 ⊆ U1 von x, so daß (10) f¨ ur alle ξ ∈ U10 gilt. Sei ξ ∈ U10 . Dann sichert (8), daß  kg(ξ) − g(x)k ≤ kB −1 k · kAk · kξ − xk + kr(ξ, g(ξ))k  ≤ kB −1 k · (kAk + ε) · kξ − xk + εkg(ξ) − g(x)k ,

X.4. Implizite Funktionen

246

woraus sich kg(ξ) − g(x)k ≤ c · kξ − xk mit c = 2 · kB −1 k · kAk + 1 ergibt. Fazit: F¨ ur alle ξ ∈ U10 gilt kr(ξ, g(ξ))k ≤ ε · kξ − xk · (1 + c). Dies zeigt (9). Bemerkung 10. (i) Seien n, m ∈ N mit n > m, ∅ 6= D ⊆ Rn offen und F : D → Rm stetig differenzierbar. Ferner sei c ∈ D mit F (c) = 0 und  rang (DF )(c) = m. Dann sind Satz 9 und (7) ggf. nach einer Permutation der Variablen von F anwendbar. (ii) Betrachte die Situation von Satz 9. Dann beschreibt (7) ein lineares Gleichungssystem mit L¨osung (Dg)(x), das die Berechnung von (Dg)(a) ohne explizite Kenntnis von g erm¨oglicht. Stichwort: implizites Differenzieren. Sei p ∈ N mit p ≥ 2. Sind die Komponentenfunktionen von F p-mal stetig partiell differenzierbar, gilt dies auch f¨ ur die Komponentenfunktionen von g. Beweis: Induktion unter Verwendung von (7). Beispiel 11. Sei F : R3 → R2 definiert durch  3  u + v 3 + w3 − 7 F (u, v, w) = . uv + vw + wu + 2 Es gilt F (2, −1, 0) = 0. Offenbar ist F stetig differenzierbar mit   3u2 3v 2 3w2 . (DF )(u, v, w) = v+w u+w v+u Insbesondere gilt  (DF )(2, −1, 0) =

 12 3 0 . −1 2 1

Satz 9 zeigt: Es existieren ein offenes Intervall I ⊆ R mit 2 ∈ I, eine abgeschlossene Umgebung J von (−1, 0) und eine stetig differenzierbare Abbildung g : I → J, so daß {(x, y) ∈ I × J : F (x, y) = 0} = {(x, g(x)) ∈ R3 : x ∈ I}. Mit (7) folgt 

  0    3 0 g1 (2) −12 · 0 = , 2 1 g2 (2) 1

und man erh¨alt g10 (2) = −4 und g20 (2) = 9 als eindeutig bestimmte L¨osung dieses linearen Gleichungssystems.

X.4. Implizite Funktionen

247

Die durch h : I → R3 mit h(x) = (x, g(x))> beschriebene Kurve besitzt also den Tangentialvektor (1, −4, 9)> zum Parameterwert 2. Da je zwei Spalten von (DF )(2, −1, 0) linear unabh¨angig18 sind, kann man analog f¨ ur die Wahl der zweiten oder dritten Komponenten von (2, −1, 0) vorgehen und nach den jeweils verbleibenden Variablen aufl¨osen“. ”

Lokale Umkehrbarkeit Im Folgenden seien n ∈ N, ∅ 6= D, D0 ⊆ Rn offen sowie f : D → D0 . Definition 12. f heißt Diffeomorphismus, wenn f bijektiv ist und f und f −1 stetig differenzierbar sind. Bemerkung 13. (i) Sei f ein Diffeomorphismus. F¨ ur x ∈ D0 , g = f −1 und y = g(x) gilt (Df )(y) ∈ Gl(n, R) und (Dg)(x) = ((Df )(y))−1 , siehe Satz 1.38 (Kettenregel). (ii) Seien n = 1, D ein offenes Intervall und f : D → R stetig differenzierbar. Ferner gelte ∀ y ∈ D : f 0 (y) 6= 0. Dann definiert f einen Diffeomorphismus zwischen D und f (D). Dies folgt aus Satz III.3.1 (Zwischenwertsatz), Korollar IV.2.13.(ii) (Monotonie-Kriterium) und Satz IV.1.18 (Differenzierbarkeit der Umkehrfunktion). Beispiel 14. Betrachte die Gebiete D = ]0, ∞[×R und D0 = R2 \{0}. Sei f : D → D0 definiert durch f (r, α) = (r · cos(α), r · sin(α))> . Gem¨aß Satz III.5.18 (Polarkoordinaten) ist f surjektiv. Ferner ist f stetig differenzierbar mit   cos(α) −r · sin(α) (Df )(r, α) = . sin(α) r · cos(α)  Es folgt det (Df )(r, α) = r > 0, so daß (Df )(r, α) ∈ Gl(2, R) f¨ ur alle (r, α) ∈ D. Dennoch ist f nicht injektiv. 18

Wir verwenden hier erstmals(?) eine nachl¨assige Sprechweise.

X.4. Implizite Funktionen

248

Bemerkung 15. Betrachte die durch eine beliebige Norm auf Rn induzierte Metrik d0 auf D sowie die Mengen O und O(D, d0 ) der offenen Teilmengen von Rn bzw. D. Da D ∈ O, gilt O(D, d0 ) = {U ∈ O : U ⊆ D}, siehe Lemma IX.2.34.(iii) (metrische Unterr¨aume). Definition 16. f heißt lokaler Diffeomorphismus in b ∈ D, falls offene Umgebungen U ⊆ D von b und U 0 ⊆ D0 von f (b) existieren, so daß f |U : U → U 0 ein Diffeomorphismus ist. Bemerkung 17. In der Situation von Definition 16 gilt Bemerkung 13.(i) analog f¨ ur −1 0 x ∈ U mit g = (f |U ) . Satz 18. Seien f stetig differenzierbar und b in D. Dann sind ¨aquivalent: (i) f ist ein lokaler Diffeomorphismus in b, (ii) (Df )(b) ∈ Gl(n, R). Beweis. (i) ⇒ (ii)“: Siehe Bemerkung 17. ” (ii) ⇒ (i)“: Definiere F : D0 × D → Rn durch ” F (x, y) = x − f (y), und setze a = f (b). Offenbar ist F stetig differenzierbar mit F (a, b) = 0 und  ∂ (2) F (a, b) = −(Df )(b). Satz 9 sichert die Existenz einer offenen Umgebung U1 ⊆ D0 von a, einer abgeschlossenen Umgebung U2 ⊆ D von b und einer stetig differenzierbaren Abbildung g : U1 → U2 mit ∀ (x, y) ∈ U1 × U2 : f (y) = x ⇔ y = g(x). (11) F¨ ur x ∈ U1 zeigt ⇐“ in (11) ”

f (g(x)) = x,

insbesondere ist g injektiv und U1 ⊆ f (U2 ). Aufgrund der Stetigkeit von f existiert eine offene Umgebung U ⊆ U2 von b mit f (U ) ⊆ U1 . Setze U 0 = f (U ). F¨ ur y ∈ U zeigt ⇒“ in (11) ” g (f (y)) = y, Somit definiert f |U eine Bijektion zwischen U und U 0 mit Umkehrabbildung g|U 0 , und a ∈ U 0 gilt offenbar. Da g injektiv ist, folgt g −1 (U ) = U 0 , so daß U 0 aufgrund der Stetigkeit von g offen ist, siehe Satz IX.2.31 (Charakterisierung stetiger Abbildungen).

X.4. Implizite Funktionen

249

Beispiel 19. Die Funktion f aus Beispiel 14 ist gem¨aß Satz 18 in jedem Punkt (r, α) ∈ D ein lokaler Diffeomorphismus. Es gilt   −1 cos(α) sin(α) (Df )(r, α) = . −1/r · sin(α) 1/r · cos(α) p F¨ ur (x, y) = f (r, α) sei g eine lokale Umkehrfunktion. Da r = x2 + y 2 , cos(α) = x/r und sin(α) = y/r, folgt p  p  x/ x2 + y 2 y/ x2 + y 2 (Dg)(x, y) = . −y/(x2 + y 2 ) x/(x2 + y 2 ) Satz 20. Sei f stetig differenzierbar, und gelte ∀ y ∈ D : (Df )(y) ∈ Gl(n, R).

(12)

Dann gilt: (i) F¨ ur jede offene Menge U ⊆ D ist f (U ) offen. (ii) Ist f injektiv, so definiert f einen Diffeomorphismus zwischen D und f (D). Beweis. ad (i): Betrachte im nicht-trivialen Fall U 6= ∅ die Abbildung f |U . Gem¨aß Satz 18 besitzt jedes y ∈ U eine offene Umgebung Uy ⊆ U , so daß f (Uy ) offen ist. Da S f (U ) = y∈U f (Uy ), ist f (U ) offen, siehe Satz IX.1.5.(iii). ad (ii): Gem¨aß (i) ist f (D) offen. Sei x ∈ f (D). Wie Satz 9 zeigt, ist f ein lokaler Diffeomorphismus in f −1 (x) und somit f −1 : f (D) → D ein lokaler Diffeomorphismus in x. Insbesondere ist f −1 stetig differenzierbar in x.

Lokale Extrema unter Nebenbedingungen Im Folgenden seien n, m ∈ N mit m < n, ∅ 6= D ⊆ Rn offen und f :D→R sowie g : D → Rm stetig differenzierbar. F¨ ur N = {x ∈ D : g(x) = 0} gelte N 6= ∅. Satz 21. Sei x ∈ N ein lokales Extremum von f |N , und gelte rang((Dg)(x)) = m. Dann existieren λ1 , . . . , λm ∈ R mit19 (grad f )(x) =

m X i=1

19

Die λi heißen Lagrange-Multiplikatoren.

λi · (grad gi )(x).

X.4. Implizite Funktionen

250

Beweis. Setze k = n − m. F¨ ur stetig differenzierbare Funktionen h : D → Rp seien   ∂1 h1 . . . ∂k h1  ..  . ∂ (1) h =  ... .  ∂1 hp . . . ∂k hp sowie



 ∂k+1 h1 . . . ∂n h1  ..  . ∂ (2) h =  ... .  ∂k+1 hp . . . ∂n hp

Ferner seien x(1) = (x1 , . . . , xk ) und x(2) = (xk+1 , . . . , xn ). Wir nehmen an, daß (∂ (2) g)(x) ∈ Gl(m, R), was ggf. durch Permutation der Variablen von g erreicht wird. Gem¨aß Satz 9 existieren eine offene Umgebung U1 von x(1) , eine abgeschlossene Umgebung U2 von x(2) und eine stetig differenzierbare Funktion h : U1 → U2 mit folgenden Eigenschaften (i) U1 × U2 ⊆ D, (ii) h(x(1) ) = x(2) , (iii) ∀ z ∈ U1 : g(z, h(z)) = 0. Nach Voraussetzung existiert δ1 > 0, so daß f (x) ≥ f (y) f¨ ur alle y ∈ Bδ1 (x) ∩ N oder f (x) ≤ f (y) f¨ ur alle y ∈ Bδ1 (x) ∩ N . Aufgrund der Stetigkeit von h in x(1) existiert δ2 > 0, so daß (z, h(z)) ∈ Bδ1 (x) ∩ N f¨ ur alle z ∈ Bδ2 (x(1) ). Somit ist x(1) ein lokales Extremum der durch f˜(z) = f (z, h(z)) definierten, stetig differenzierbaren Funktion f˜ : U1 → R. Gem¨aß Satz 3.22 (notwendige Bedingung f¨ ur lokales Extremum) gilt   Ek (1) ˜ 0 = (Df )(x ) = (Df )(x) · (Dh)(x(1) ) = (∂ (1) f )(x) + (∂ (2) f )(x) · (Dh)(x(1) ), und (7) zeigt (Dh)(x(1) ) = − (∂ (2) g)(x)

−1

· (∂ (1) g)(x).

Setze a = (∂ (1) f )(x),

b = (∂ (2) f )(x)

A = (∂ (1) g)(x),

B = (∂ (2) g)(x).

sowie Man erh¨alt a = b · B −1 · A, und trivialerweise gilt b = b · B −1 · B, was zusammen (Df )(x) = (a, b) = b · B −1 · (A, B) = b · B −1 · (Dg)(x) ergibt.

X.4. Implizite Funktionen

251

Beispiel 22. Sei f : R2 → R definiert durch f (x, y) = 4x2 − 3xy, und sei N = {(x, y) ∈ R2 : x2 + y 2 ≤ 1}. Offenbar ist f zweimal stetig differenzierbar. Da N kompakt und f |N stetig ist, besitzt f |N ein globales Minimum und ein globales Maximum. Setze G = {(x, y) ∈ N : (x, y) globales Extremum von f |N }, L = {(x, y) ∈ N : (x, y) lokales Extremum von f |N }. F¨ ur (x, y) ∈ R2 gilt (grad f )(x, y) = (8x − 3y, −3x)> sowie

 (Hf )(x, y) =

 8 −3 . −3 0

Sei g : R2 → R definiert durch g(x, y) = x2 + y 2 − 1. Offenbar ist g stetig differenzierbar mit (grad g)(x, y) = 2 · (x, y)> f¨ ur (x, y) ∈ R2 , und es gilt ∂N = {(x, y) ∈ R2 : g(x, y) = 0}. F¨ ur (x, y) ∈ ∂N gilt (grad g)(x, y) 6= 0. ˚. Aus (grad f )(x, y) = 0 folgt x = y = 0. Da Sei (x, y) ∈ N  det (Hf )(0, 0) − λ · E2 = −λ · (8 − λ) − 9 = (λ − 9) · (λ + 1), ist (Hf )(0, 0) indefinit, und (0, 0) ist kein lokales Extremum von f , siehe S¨atze 3.22 und 3.28.(iii) (notwendige bzw. hinreichende Bedingung f¨ ur lokales Extremum). Dies zeigt ˚=∅ L∩N und weiter ∅ 6= G ⊆ L ∩ ∂N.

X.4. Implizite Funktionen

252

Gelte (x, y) ∈ L ∩ ∂N . Dann ist (x, y) ein lokales Extremum von f |∂N , und gem¨aß Satz 21 existiert λ ∈ R mit (8 − λ)x − 3y = 0,

(13)

3x + λy = 0,

(14)

2

2

x + y = 1.

(15)

Es gilt   8 − λ −3 det = λ · (8 − λ) + 9 = −(λ − 9) · (λ + 1). 3 λ Falls λ 6∈ {−1, 9}, folgt x = y = 0 aus (13) und (14), und (15) ist nicht erf¨ ullt. Falls λ = −1, folgt y = 3x aus (14) und weiter (x, y) ∈ {(c, 3c), (−c, −3c)} √ mit (15), wobei c = 1/ 10. Falls λ = 9, folgt x = −3y aus (13) und weiter (x, y) ∈ {(−3c, c), (3c, −c)} mit (15). Damit ist ∅ 6= G ⊆ {(c, 3c), (−c, −3c), (−3c, c), (3c, −c)} gezeigt. Es gilt f (x, y) = f (−x, −y) f¨ ur (x, y) ∈ R2 sowie f (c, 3c) = −1/2, f (3c, −c) = 9/2. Fazit: die globalen Maxima von f |N sind (3c, −c) und (−3c, c) und die globalen Minima von f |N sind (c, 3c) und (−c, −3c). Entsprechende Graphiken finden sich in Abschnitt A.11. Literatur. [Fo2, §8, §9], [H2, 169–171, 174] und [K, 3.3–3.6].

Kapitel XI Integrierbare Funktionen in mehreren Variablen Wir behandeln das Lebesgue-Integral f¨ ur Funktionen von Rn nach R. Dieser Integralbegriff ist einfacher zu verstehen als das mehrdimensionale (eigentliche bzw. uneigentliche) Riemann-Integral und zugleich viel leistungsf¨ahiger. Wir folgen der Darstellung in [K, 7–9] und stellen dabei einige Ergebnisse, die in der Vorlesung Maß- und Inte” grationstheorie“ allgemeiner behandelt werden, ohne Beweise vor. Im Folgenden sei n ∈ N.

1

Vorbereitungen

Beschr¨ ankte Quader und ihr Volumen Definition 1. Q ⊆ Rn heißt beschr¨ankter (achsenparalleler nicht-leerer) Quader1 , falls Q = I1 × · · · × In (1) f¨ ur beschr¨ankte, nicht-leere Intervalle I1 , . . . , In ⊆ R. Notation: Qn ist die Menge der beschr¨ankten Quader in Rn . Bemerkung 2. F¨ ur Q ∈ Qn sind I1 , . . . , In ∈ Q1 mit (1) eindeutig bestimmt. Definition 3. F¨ ur Q gem¨aß (1) heißt2 n Y λ (Q) = (sup Ij − inf Ij ) n

j=1

das (n-dimensionale) Volumen von Q. Bemerkung 4. (i) F¨ ur Q gem¨aß (1) gilt λn (Q) =

Qn

j=1

λ1 (Ij ).

˚ 6= ∅. (ii) F¨ ur Q ∈ Qn gilt λn (Q) > 0 genau dann, wenn Q 1 2

Diese Mengen heißen auch beschr¨ ankte, nicht-leere Intervalle in Rn . [K] schreibt v statt λn . Statt λ1 schreibt man auch λ.

253

XI.1. Vorbereitungen

254

Der Vektorraum der Treppenfunktionen Definition 5. f : Rn → R heißt Treppenfunktion, falls k ∈ N und Q1 , . . . , Qk ∈ Qn existieren, so daß (i) Q1 , . . . , Qk paarweise disjunkt, (ii) ∀ ` ∈ {1, . . . , k} : f |Q` konstant, S (iii) f |Ac = 0 f¨ ur A = k`=1 Q` . Notation: T (Rn ) ist die Menge der Treppenfunktionen von Rn nach R. Definition 6. F¨ ur ∅ 6= D ⊆ Rn , f : D → R und A ⊆ D heißt3 f |A : Rn → R, definiert durch ( f (x), falls x ∈ A, f |A (x) = 0, sonst, die triviale Fortsetzung von f |A auf Rn . Bemerkung 7. F¨ ur f ∈ T (R) ist f |[a,b] f¨ ur alle a, b ∈ R mit a < b eine Treppenfunktion im Sinne von Definition III.3.12. Ist umgekehrt f : [a, b] → R eine Treppenfunktion im Sinne von Definition III.3.12, so gilt f |[a,b] ∈ T (R). Lemma 8. F¨ ur k ∈ N und Q1 , . . . , Qk ∈ Qn existieren m ∈ N und P1 , . . . , Pm ∈ Qn , so daß S S (i) k`=1 Q` = m `=1 P` , (ii) P1 , . . . , Pm paarweise disjunkt,  (iii) ∀ ` ∈ {1, . . . , k} ∀ `0 ∈ {1, . . . , m} : P`0 ⊆ Q` ∨ P`0 ∩ Q` = ∅ ,  (iv) ∀ `0 ∈ {1, . . . , m} : P`0 offen ∨ λn (P`0 ) = 0 . Beweis. Gelte Q` = I1,` ×· · ·×In,` mit Ij,` ∈ Q1 . Die aufsteigend geordneten Elemente S von Zj = k`=1 ∂Ij,` definieren eine Zerlegung von [inf Zj , sup Zj ], und hieraus gewinnt S man eine Darstellung von k`=1 Q` als Vereinigung endlich vieler P`0 ∈ Qn mit den Eigenschaften (ii)–(iv). Satz 9. (i) F¨ ur f : Rn → R gilt f ∈ T (Rn ) genau dann, wenn ∃ k ∈ N ∃ Q1 , . . . , Qk ∈ Qn ∃ c1 , . . . , ck ∈ R : f =

k X `=1

n

(ii) T (Rn ) ist ein Unterraum von R(R ) . (iii) f ∈ T (Rn ) ⇒ |f | ∈ T (Rn ). 3

[K] verwendet die Notation fA .

c` · 1Q` .

XI.1. Vorbereitungen

255

Beweis. ad (i): ⇒“ gilt offenbar. Verwende die Eigenschaften (i)–(iii) aus Lemma 8 ” zum Beweis von ⇐“. ” ad (ii): Verwende (i). ad (iii): klar. Bemerkung 10. Sei M 6= ∅ und sei V ein Unterraum von RM , so daß |f | ∈ V f¨ ur alle f ∈ V . F¨ ur f, g ∈ V folgt max(f, g), min(f, g), f+ , f− ∈ V . Beweis: Bemerkung II.1.11.

Das Integral von Treppenfunktionen Lemma 11. F¨ ur k, m ∈ N, c1 , . . . , ck , d1 , . . . , dm ∈ R und Q1 , . . . , Qk , P1 , . . . , Pm ∈ Qn gelte m k X X d` · 1P` . c` · 1Q` = `=1

`=1

Dann folgt k X

n

c` · λ (Q` ) =

m X

d` · λn (P` ).

`=1

`=1

Beweis. Induktion nach n. F¨ ur n = 1 folgt die Aussage mit Bemerkung 7 und Lemma V.1.2. Sei n > 1, und gelte Q` = Q0` × I` sowie P` = P`0 × J` mit Q0` , P`0 ∈ Qn−1 und I` , J` ∈ Q1 . F¨ ur y ∈ R gilt k X

c` · 1I` (y) · 1Q0` =

m X

d` · 1J` (y) · 1P`0 ,

`=1

`=1

und mit der Induktionsannahme folgt k X

c` · 1I` (y) · λ

n−1

(Q0` )

=

`=1

d.h.

m X

d` · 1J` (y) · λn−1 (P`0 ),

`=1

k X

c` · λn−1 (Q0` ) · 1I` =

`=1

m X

d` · λn−1 (P`0 ) · 1J` .

`=1

Wende die Aussage f¨ ur n = 1 an, und beachte Bemerkung 4.(i). Definition 12. F¨ ur f=

k X

c` · 1Q`

`=1

mit k ∈ N, c1 , . . . , ck ∈ R und Q1 , . . . , Qk ∈ Qn heißt Z

f dλn =

k X

c` · λn (Q` )

`=1

das Integral von f . Notation auch

R Rn

f dλn ,

R

f (x) dλn (x) oder

R Rn

f (x) dλn (x).

XI.1. Vorbereitungen

256

Satz 13. (i) Das Integral ist eine lineare Abbildung von T (Rn ) nach R. R R (ii) F¨ ur f, g ∈ T (Rn ) mit f ≤ g gilt f dλn ≤ g dλn . R R (iii) F¨ ur f ∈ T (Rn ) gilt f dλn ≤ |f | dλn . (iv) F¨ ur f ∈ T (R) und a, b ∈ R mit a < b und {x ∈ R : f (x) 6= 0} ⊆ [a, b] gilt Z

Z

1

b

f |[a,b] (x) dx.

f dλ = a

Beweis. ad (i): klar. R ad (ii): Es gilt f dλn ≥ 0 f¨ ur f ∈ T (Rn ) mit f ≥ 0, und hieraus folgt mit (i) die Behauptung. R R R R ad (iii): Mit (i) und (ii) folgt f dλn ≤ |f | dλn sowie − f dλn ≤ |f | dλn . ad (iv): Verwende Bemerkung 7 und λ1 ({x}) = 0 f¨ ur x ∈ R.

Die L1 -Halbnorm Definition 14. Sei V ein K-Vektorraum. Dann heißt k · k : V → R mit ∀ v, w ∈ V : kv + wk ≤ kvk + kwk

(Dreiecksungleichung),

∀ v ∈ V ∀ µ ∈ K : kµvk = |µ| · kvk Halbnorm auf V . Bemerkung 15. Sei k · k : V → R eine Halbnorm auf V . Dann gilt (i) kvk ≥ 0 f¨ ur alle v ∈ V , (ii) kvk − kwk ≤ kv − wk f¨ ur v, w ∈ V , (iii) k · k ist genau dann eine Norm auf V, wenn ∀ v ∈ V : (kvk = 0 ⇒ v = 0). Beispiel 16. Seien a, b ∈ R mit a < b. Dann definiert Z b kf k = |f (x)| dx,

f ∈ R ([a, b]) ,

a

eine Halbnorm auf R ([a, b]), die keine Norm ist. Notation: Wir erweitern die Menge R um ∞ und definieren x < ∞ f¨ ur x ∈ R. F¨ ur eine P∞ P∞ Folge (dk )k∈N in [0, ∞[ definieren wir k=1 dk = ∞, falls die Reihe k=1 dk divergiert.

XI.1. Vorbereitungen

257

Definition 17. Eine Folge (ck )k∈N in [0, ∞[ und eine Folge (Qk )k∈N offener Quader aus Qn definieren eine H¨ ullreihe 4 zu f : Rn → R, falls ∀ x ∈ Rn : |f (x)| ≤

∞ X

ck · 1Qk (x)

k=1

und

∞ X

ck · λn (Qk ) < ∞.

k=1 n

Notation: H(R ) ist die Menge der Funktionen von Rn nach R, die eine H¨ ullreihe besitzen. Beispiel 18. (i) Seien f : Rn → R sowie {x ∈ Rn : f (x) 6= 0} beschr¨ankt. Dann gilt f ∈ H(Rn ). Insbesondere gilt T (Rn ) ⊆ H(Rn ). (ii) Gelte n = 1. F¨ ur α > 1 und x ∈ R sei ( x−α , falls x > 1, fα (x) = 0, sonst. F¨ ur ε > 0 gilt |fα (x)| ≤

∞ X

1/k α · 1]k,k+1+ε[ (x).

k=1

Da

P∞

k=1

α

1/k < ∞, folgt fα ∈ H(R).

(iii) Gelte n = 1. F¨ ur 0 < α < 1 und x ∈ R sei ( |x|−α , falls 0 < |x| < 1, fα (x) = 0, sonst. Es gilt |fα (x)| ≤ 1]−1,1[ +

∞ X

1]−1/k1/α ,1/k1/α [ (x).

k=1

Da

P∞

k=1

1/k

1/α

< ∞, folgt fα ∈ H(R).

Definition 19. Die L1 -Halbnorm von f ∈ H(Rn ) ist X  ∞  n kf k1 = inf ck · λ (Qk ) : (ck )k∈N , (Qk )k∈N definiert H¨ ullreihe zu f . k=1

Lemma 20. n

(i) H(Rn ) ist ein Unterraum von R(R ) , und k · k1 ist eine Halbnorm auf H(Rn ). (ii) F¨ ur f : Rn → R und g ∈ H(Rn ) mit |f | ≤ |g| folgt f ∈ H(Rn ) und kf k1 ≤ kgk1 .

(iii) F¨ ur f ∈ H(Rn ) gilt |f | ∈ H(Rn ) und |f | 1 = kf k1 . 4

Im Unterschied zu [K, S. 237] wird hier auch

P∞

k=1 ck

· λn (Qk ) < ∞ gefordert.

XI.1. Vorbereitungen

258

Beweis. Wir zeigen f + g ∈ H(Rn ) f¨ ur f, g ∈ H(Rn ). Sei ε > 0. Betrachte H¨ ullreihen zu f und g, die durch (ck )k und (Qk )k bzw. (dk )k und (Pk )k gegeben sind und ∞ X

ck · λn (Qk ) ≤ kf k1 + ε

k=1

sowie

∞ X

dk · λn (Pk ) ≤ kgk1 + ε

k=1

erf¨ ullen. F¨ ur x ∈ Rn gilt |(f + g)(x)| ≤

∞ X

ck · 1Qk (x) +

k=1

∞ X

dk · 1Pk (x),

k=1

so daß kf + gk1 ≤ kf k1 + kgk1 + 2ε. Die weiteren Behauptungen gelten offenbar. Lemma 21. Sei A ∈ Qn abgeschlossen. Dann gilt k1A k1 = λn (A). Beweis. ≤“: Zu ε > 0 w¨ahle man Q ∈ Qn offen mit A ⊆ Q und λn (Q) ≤ λn (A) + ε. ” Dann liefert 1Q eine H¨ ullreihe zu 1A , woraus k1A k1 ≤ λn (A) + ε folgt. ≥“: Betrachte eine Folge (ck )k∈N in [0, ∞[ und eine Folge (Qk )k∈N offener Quader aus ” Qn , die eine H¨ ullreihe zu 1A definieren. F¨ ur ε > 0 sei Ak = {x ∈ A :

k X

c` 1Q` (x) ≥ 1 − ε},

k ∈ N.

`=1

Betrachte A als metrischen Raum mit der von der euklidischen Norm auf Rn induzierten Metrik. Dann ist Ak offen, siehe Lemma IX.2.34.(iii), und A ist kompakt, siehe S Bemerkung IX.3.12, und es gilt A = ∞ k=1 Ak . Folglich existiert k0 ∈ N, so daß k0 X

c` · 1Q` ≥ (1 − ε) · 1A .

`=1

Mit Satz 13.(ii) folgt ∞ X

n

c` · λ (Q` ) ≥

`=1

k0 X

c` · λn (Q` ) ≥ (1 − ε) · λn (A).

`=1

Fazit: k1A k1 ≥ (1 − ε) · λn (A). Satz 22. F¨ ur f ∈ T (Rn ) gilt Z kf k1 =

|f | dλn .

XI.2. Das Lebesgue-Integral

259

Beweis. Es gen¨ ugt den Fall f ≥ 0 zu betrachten. ≤“: Gelte ” k m X X f= c` · 1Q` + d` · 1R` `=1

`=1

mit c1 , . . . , ck , d1 , . . . , dm ≥ 0, Q1 , . . . , Qk ∈ Qn offen und R1 , . . . , Rm ∈ Qn mit Volumen null, siehe Lemma 8. F¨ ur ε > 0 gilt kf k1 ≤

k X

c` · λn (Q` ) + ε,

`=1

R

n

woraus kf k1 ≤ f dλ folgt. ≥“: Sei A ∈ Qn abgeschlossen mit f |Ac = 0. Setze c = supx∈Rn f (x) sowie ” g = c · 1A − f. Dann gilt g ∈ T (Rn ) und g ≥ 0, und mit dem bereits Bewiesenen sowie Satz 13.(i), Lemma 20.(i) und Lemma 21 folgt Z Z Z Z n n n kgk1 ≤ g dλ = c · 1A dλ − f dλ = kc · 1A k1 − f dλn . Dies zeigt Z

f dλn ≤ kc · 1A k1 − kgk1 ≤ kf k1 .

Literatur. [K, 7.1, 7.2].

2

Das Lebesgue-Integral

Lebesgue-integrierbare Funktionen Im Folgenden sei ∅ 6= D ⊆ Rn . Definition 1. (i) f ∈ H(Rn ) heißt (Lebesgue-)integrierbar (¨ uber Rn ), falls eine Folge (fk )k in T (Rn ) mit limk kf − fk k1 = 0 existiert. (ii) f : D → R heißt (Lebesgue-)integrierbar (¨ uber D), falls f |D integrierbar ist. Notation: L1 (D) ist die Menge der integrierbaren Funktionen von D nach R. Bemerkung 2. (i) Es gilt T (Rn ) ⊆ L1 (Rn ) ⊆ H(Rn ). Diese Inklusionen sind strikt: Satz 5 zeigt T (R) ( L1 (R), und es existieren Mengen A ⊆ [0, 1] mit 1A 6∈ L1 ([0, 1]), siehe Tutorium 13.3. (ii) Gilt f − g ∈ H(Rn ) f¨ ur f : Rn → R und g ∈ T (Rn ), folgt f ∈ H(Rn ).

XI.2. Das Lebesgue-Integral

260

Satz 3. (i) L1 (D) ist ein Unterraum von RD . (ii) F¨ ur f ∈ L1 (D) gilt |f | ∈ L1 (D). (iii) F¨ ur f, g ∈ L1 (D) gilt f · g ∈ L1 (D), falls g u ¨berdies beschr¨ankt ist. Beweis. Wir behandeln zun¨achst den Fall D = Rn . ad (i): Seien f, g ∈ L1 (Rn ). W¨ahle Folgen (fk )k und (gk )k in T (Rn ) mit lim kf − fk k1 = lim kg − gk k1 = 0. k

k

Satz 1.9.(ii) (Abschlußeigenschaften von T (Rn )) zeigt fk + gk ∈ T (Rn ), und Lemma 1.20.(i) sichert f + g − fk − gk ∈ H(Rn ). Ferner |f + g − fk − gk | ≤ |f − fk | + |g − gk |, so daß kf + g − fk − gk k1 ≤ kf − fk k1 + kg − gk k1 , siehe Lemma 1.20.(ii). Analog zeigt man cf ∈ L1 (Rn ) f¨ ur f ∈ L1 (Rn ) und c ∈ R. ad (ii): Verwende Satz 1.9.(iii) sowie Lemma 1.20.(ii) und (iii), und schließe wie in (i). ad (iii): Sei ε > 0. W¨ahle c ∈ ]0, ∞[ mit |g| ≤ c sowie f˜ ∈ T (Rn ) mit kf − f˜k1 ≤ ε. W¨ahle ferner c˜ ∈ ]0, ∞[ mit |f˜| ≤ c˜ sowie g˜ ∈ T (Rn ) mit kg − g˜k1 ≤ ε/˜ c. Dann |f · g − f˜ · g˜| ≤ |(f − f˜) · g| + |f˜ · (g − g˜)| ≤ |f − f˜| · c + c˜ · |g − g˜|, und somit kf · g − f˜ · g˜k1 ≤ c · kf − f˜k1 + c˜ · kg − g˜k1 ≤ (c + 1) · ε. Der Beweis des allgemeinen Falles ergibt sich sofort aus dem bereits Bewiesenen. Korollar 4. F¨ ur f : D → R gilt f ∈ L1 (D) ⇔ f+ , f− ∈ L1 (D). Beweis. ⇒“: Verwende Satz 3.(ii) und Bemerkung 1.10. ” ⇐“: Verwende Bemerkung V.1.18 zusammen mit Satz 3.(i). ” Satz 5. F¨ ur a, b ∈ R mit a < b gilt R([a, b]) ( L1 ([a, b]).

XI.2. Das Lebesgue-Integral

261

Beweis. Sei f ∈ R([a, b]). Gem¨aß Satz V.1.10 (Integrabilit¨atskriterium) existieren Folgen (fk )k und (gk )k in T ([a, b]) mit fk ≤ f ≤ gk , und

Z

Z

b

gk (x) dx −

lim k

b

a

k ∈ N, 

fk (x) dx

= 0.

a

Andererseits gilt f |[a,b] , fk |[a,b] , gk |[a,b] ∈ H(R), siehe Beispiel 1.18.(i), und mit den S¨atzen 1.13.(iv) und 1.22 und Lemma 1.20.(ii) folgt

[a,b]



f | − fk |[a,b] 1 ≤ gk |[a,b] − fk |[a,b] 1 = (gk − fk )|[a,b] 1 Z Z b [a,b] 1 = (gk − fk )| dλ = (gk − fk )(x) dx. a

Fazit: f |[a,b] ∈ L1 (R), d.h. f ∈ L1 ([a, b]). Betrachte speziell f = 1[a,b]∩Q . Dann gilt f |[a,b] 6∈ R([a, b]), siehe Beispiel V.1.9. Seien x : N → [a, b] ∩ Q bijektiv  ullreihe zu f und ε > 0. Durch ck = 1 und Qk = xk − ε/2k , xk + ε/2k wird eine H¨ definiert, und es gilt ∞ X (xk + ε/2k − (xk − ε/2k )) = 2ε. k=1

Es folgt f ∈ H(R) mit kf k1 = 0 und somit f ∈ L1 (R). Da f (x) = 0 f¨ ur x 6∈ [a, b], 1 folgt f |[a,b] ∈ L ([a, b]). Beispiel 6. Sei Q = ×j=1 [aj , bj ] ∈ Qn mit aj < bj , und sei f : Q → R stetig. Es gilt f |Q ∈ H(Rn ), siehe Beispiel 1.18.(i). W¨ahle k ∈ N, und setze n

yi,j,k = aj + i · (bj − aj )/k,

i = 0, . . . , k,

Ii,j,k = [yi−1,j,k , yi,j,k [ ,

i = 1, . . . , k − 1,

sowie

und Ik,j,k = [yk−1,j,k , yk,j,k ] f¨ ur 1 ≤ j ≤ d. Ferner seien Mk = {1, . . . , k}n und n

Qm,k =

×I

mj ,j,k ,

m ∈ Mk .

j=1

W¨ahle xm,k ∈ Qm,k , und definiere fk (x) =

X m∈Mk

f (xm,k ) · 1Qm,k (x),

x ∈ Rn .

XI.2. Das Lebesgue-Integral

262

Offenbar gilt fk ∈ T (Rn ), und Satz IX.3.15 (gleichm¨aßige Stetigkeit) zeigt lim sup |f (x) − fk (x)| = 0. k

x∈Q

Da kf |Q − fk k1 ≤ sup |f (x) − fk (x)| · λn (Q), x∈Q

folgt f ∈ L1 (Q). Vgl. ¨ Ubung 12.1.b und Satz III.3.13 (Approximation durch Treppenfunktionen).

Das Lebesgue-Integral Satz 7. Es existiert genau eine Abbildung I : L1 (Rn ) → R, so daß Z I(f ) = f dλn

(1)

f¨ ur alle f ∈ T (Rn ) und I(f + g) = I(f ) + I(g), I(c · f ) = c · I(f ), |I(f )| ≤ kf k1

(2) (3) (4)

f¨ ur alle f, g ∈ L1 (Rn ) und alle c ∈ R. Beweis. Eindeutigkeit“: Sei I wie oben. F¨ ur f ∈ L1 (Rn ) sei (fk )k eine Folge in T (Rn ) ” mit lim kf − fk k1 = 0. (5) k

F¨ ur k ∈ N gilt |I(f ) − I(fk )| = |I(f − fk )| ≤ kf − fk k1 . R

Es folgt I(f ) = limk fk dλn . Existenz“: Sei f ∈ L1 (Rn ). W¨ahle eine Folge (fk )k in T (Rn ) mit (5). Die S¨atze 1.13 ” und 1.22 und Lemma 1.20.(i) zeigen f¨ ur k, ` ∈ N Z Z Z fk dλn − f` dλn = (fk − f` ) dλn ≤ kfk − f` k 1 ≤ kf − fk k1 + kf − f` k1 .  R Also ist fk dλn k eine Cauchy-Folge in R und somit konvergent. Sei (f˜k )k eine weitere Folge in L1 (Rn ) mit limk kf − f˜k k1 = 0. Wie oben folgt Z Z n n fk dλ − f˜k dλ ≤ kf − fk k + kf − f˜k k1 , 1 so daß limk

R

fk dλn = limk

R

f˜k dλn . Somit wird durch Z I(f ) = lim fk dλn k

XI.2. Das Lebesgue-Integral

263

eine Abbildung I : L1 (Rn ) → R definiert. Diese erf¨ ullt offenbar (1). Neben f und (fk )k wie oben betrachten wir g ∈ L1 (Rn ) und eine Folge (gk )k in L1 (Rn ) mit lim kg − gk k1 = 0. k

Dann gilt lim k(f + g) − (fk + gk )k1 = 0, k

und (2) ergibt sich aus Z Z Z n n I(f + g) = lim (fk + gk ) dλ = lim fk dλ + lim gk dλn = I(f ) + I(g). k

k

k

Ebenso zeigt man (3). Da kf k − kfk k ≤ kf − fk k , 1 1 1 R siehe Bemerkung 1.15.(ii), folgt limk kfk k1 = kf k1 . Da |I(f )| = limk fk dλn und R fk dλn ≤ kfk k zeigt dies (4). 1 Bemerkung 8. Satz 7 korrespondiert mit einem abstrakten Fortsetzungssatz. Betrachte dazu einen K-Vektorraum V und eine Halbnorm k · k auf V . Eine Menge V0 ⊆ V heißt dicht in V , falls f¨ ur jedes v ∈ V eine Folge (vk )k in V0 mit limk kv − vk k = 0 existiert. Sei V0 ⊆ V ein dichter Unterraum von V , und sei I0 : V0 → R linear mit ∀ v ∈ V0 : |I0 (v)| ≤ kvk. Dann existiert genau eine lineare Abbildung I : V → R mit I|V0 = I0 und ∀ v ∈ V : |I(v)| ≤ kvk. Der Beweis dieser Aussage entspricht dem von Satz 7. Definition 9. (i) Die eindeutig bestimmte lineare Abbildung I : L1 (Rn ) → R gem¨aß Satz 7 heißt das n-dimensionale Lebesgue-Integral . 1 n (ii) F¨ von f . Notation statt I(f ): R ur f n∈ RL (R ) nheißt R I(f ) das Lebesgue-Integral R f dλ , Rn f dλ , f (x) dλn (x) oder Rn f (x) dλn (x).

Satz 10. Seien f, g ∈ L1 (Rn ). Dann gilt R

|f | dλn , R R (ii) f ≤ g ⇒ f dλn ≤ g dλn . (i) kf k1 =

XI.2. Das Lebesgue-Integral

264

Beweis. ad (i): Sei (fk )k eine Folge in T (Rn ) mit limk kf − fk k1 = 0. Lemma 1.20.(ii) und (iii) zeigen

lim |f | − |fk | 1 = 0 k

sowie lim kfk k1 = kf k1 . k R R n n Es folgt limk |fk | dλ = |f | dλ und limk |fk | dλn = kf k1 mit Satz 1.22. R R R ad (ii): Es gilt g dλn − f dλn = |g − f | dλn = kg − f k1 ≥ 0. R A n A 1 n Definition 11. F¨ ur f : D → R und A ⊆ D mit f | ∈ L (R ) heißt f | dλ das R R n n Lebesgue-Integral von f u ¨ber A. Notation auch: A f dλ oder A f (x) dλ (x). R

Bemerkung 12. F¨ ur f : D → R und A ⊆ D sind f |A ∈ L1 (Rn ) und 1A · f ∈ L1 (D) ¨aquivalent, und ggf. gilt Z Z n f dλ = 1A · f dλn . A

D

Satz 13. F¨ ur a, b ∈ R mit a < b und f ∈ R([a, b]) gilt Z b Z f (x) dx = f dλ1 . a

[a,b]

Beweis. Mit den Bezeichnungen aus dem Beweis von Satz 5 gilt Z b Z b f (x) dx = lim fk (x) dx, k

a

a

siehe Korollar V.1.11. Andererseits gilt Z Z 1 f dλ = lim [a,b]

k

[a,b]

Schließlich sichert Satz 1.13.(iv), daß Z b Z fk (x) dx = a

fk dλ1 .

fk dλ1 .

[a,b]

Beispiel 14. In der Situation von Beispiel 6 gilt Z λn (Q) X f dλn = lim · f (xm,k ). k kn Q m∈M k

Vgl. Satz V.1.24 (Riemann-Summen) und Beispiel V.1.26. Speziell f¨ ur Q = [0, 1]2 und f (x, y) = x · y erh¨alt man k k 1 X X (m1 − 1/2) · (m2 − 1/2) · = 1/4, k 2 m =1 m =1 k2 1

so daß

2

Z [0,1]2

Literatur. [K, 7.3].

x · y dλ2 (x, y) = 1/4.

XI.3. Grenzwerts¨atze und Integrabilit¨atskriterien

3

265

Grenzwerts¨ atze und Integrabilit¨ atskriterien

Im Folgenden sei ∅ 6= D ⊆ Rn . Beispiel 1. Seien D = R und fk = k ·1]0,1/k] ∈ T (R) f¨ ur k ∈ N. Dann gilt limk fk (x) = 0 f¨ ur alle x ∈ R, aber Z Z 1 0 = lim fk dλ 6= lim fk dλ1 = 1. k

k

Monotone Konvergenz Satz 2 (B. Levi). Seien (fk )k eine Folge in L1 (D) und f : D → R, so daß (i) limk fk (x) = f (x) f¨ ur alle x ∈ D, (ii) ∀ k ∈ N : fk ≤ fk+1 . Dann gilt Z

1

fk dλn < ∞

f ∈ L (D) ⇔ sup k

D

und ggf. Z

Z

n

f dλ = lim k

D

fk dλn .

D

Beweis. Siehe Vorlesung “Maß- und Integrationstheorie“ sowie ¨ Ubung 12.3.b. Bemerkung 3. Vergleiche Satz 2 und Beispiel IX.4.12. Beispiel 4. F¨ ur α > 0 und x ∈ ]0, ∞[ sei f (x) = x−α . Gem¨aß Satz 2.5 (Riemann- und Lebesgue-Integrierbarkeit) gilt5 f ∈ L1 ([1, k]) f¨ ur alle k ≥ 2, und Satz 2.13 (Riemann- und Lebesgue-Integral) zeigt Z Z Z k 1 1 f · 1[1,k] dλ = f dλ = x−α dx. [1,∞[

Falls α = 1, folgt

R

[1,k]

1

f · 1[1,k] dλ1 = ln(k), und andernfalls gilt Z  1 f · 1[1,k] dλ1 = · k −α+1 − 1 . 1−α [1,∞[

[1,∞[

Satz 2 zeigt, daß f ∈ L1 ([1, ∞[) a¨quivalent zu α > 1 ist und daß in diesem Fall Z 1 f dλ1 = α−1 [1,∞[ gilt. Analog zeigt man, daß f ∈ L1 (]0, 1]) ¨aquivalent zu 0 < α < 1 ist und daß in diesem Fall Z 1 f dλ1 = 1−α ]0,1] gilt. 5

Wir schreiben nachl¨ assigerweise f ∈ L1 ([1, k]) statt f |[1,k] ∈ L1 ([1, k]).

XI.3. Grenzwerts¨atze und Integrabilit¨atskriterien

266

Satz 5. Seien (Dk )k eine Folge von Teilmengen von D und f : D → R, so daß (i) Dk ⊆ Dk+1 f¨ ur alle k ∈ N und D =

S∞

Dk ,

k=1

(ii) f ∈ L1 (Dk ) f¨ ur alle k ∈ N. Dann gilt Z

1

|f | dλn < ∞

f ∈ L (D) ⇔ sup k

Dk

und ggf. Z

Z

n

f dλn .

f dλ = lim k

D

Dk

1 Beweis. Gelte f ∈ L1 (D). Es folgt |f | ∈ L1 (D), und wegen (ii) gilt R auch |f |n ∈ L (Dk ), siehe Satz 2.3.(ii). Satz 2, angewandt auf (1Dk · |f |)k , zeigt supk Dk |f | dλ < ∞. R Gelte supk Dk |f | dλn < ∞. Aus (ii) folgt |f |, f+ , f− ∈ L1 (Dk ), siehe Satz 2.3.(ii) und R R Bemerkung 1.10. Ferner gilt supk Dk f+ dλn < ∞ und supk Dk f− dλn < ∞. Satz 2, angewandt auf (1Dk · f+ )k und (1Dk · f− )k , zeigt f+ , f− ∈ L1 (D) sowie Z Z n f+ dλn f+ dλ = sup k

D

und

Z

Dk

Z

n

f− dλ = sup D

k

f− dλn .

Dk

Wende Korollar 2.4 (Integrierbarkeit von Positiv- und Negativteil) an, um f ∈ L1 (D) und Z Z Z Z Z n n n n f dλ = f+ dλ − f− dλ = lim f+ dλ − lim f− dλn k k D D D Dk Dk Z = lim f dλn k

Dk

zu erhalten.

Integrierbare Mengen Bemerkung 6. F¨ ur A ∈ Qn gilt λn (A) =

R

1A dλn .

Definition 7. A ⊆ Rn heißt6 integrierbar , falls 1A ∈ L1 (Rn ). Ggf. heißt Z n λ (A) = 1A dλn das Lebesgue-Maß von A. Notation: I(Rn ) bezeichnet die Menge der integrierbaren Teilmengen von Rn . 6

[K] spricht von meßbaren Mengen, was nicht der u ¨blichen Terminologie der Maßtheorie entspricht.

XI.3. Grenzwerts¨atze und Integrabilit¨atskriterien

267

Satz 8. F¨ ur A, B ∈ I(Rn ) gilt A ∩ B, A ∪ B, A \ B ∈ I(Rn ) sowie λn (A ∪ B) = λn (A) + λn (B) − λn (A ∩ B). Falls u ¨berdies B ⊆ A, gilt λn (A \ B) = λn (A) − λn (B). Beweis. Verwende 1A∩B = 1A ·1B , 1A∪B = 1A +1B −1A∩B und 1A\B = 1A −1A∩B sowie Satz 2.3 (Abschlußeigenschaften von L1 (Rn )) zum Nachweis der Integrierbarkeit. Die weiteren Aussagen folgen mit der Linearit¨at des Integrals. Satz 9. Sei (Ak )k eine Folge in I(Rn ) mit ∀ k ∈ N : Ak ⊆ Ak+1 . F¨ ur A =

S∞

k=1

Ak ist supk λn (Ak ) < ∞ ¨aquivalent zu A ∈ I(Rn ), und ggf. gilt λn (A) = lim λn (Ak ). k

Beweis. Verwende Satz 2 mit f = 1A und fk = 1Ak . Korollar 10. Sei (Ak )k eine Folge paarweise disjunkter Mengen in I(Rn ). F¨ ur A = S P∞ n n ¨quivalent zu A ∈ I(R ), und ggf. gilt k=1 λ (Ak ) a k∈N Ak ist die Konvergenz von n

λ (A) =

∞ X

λn (Ak ).

k=1

S Beweis. Setze Bk = k`=1 A` , Induktiv folgt mit Satz 8, daß Bk ∈ I(Rn ) mit λn (Bk ) = Pk n `=1 λ (A` ) ist. Wende Satz 9 auf (Bk )k an. Bemerkung 11. Seien ∅ 6= D ⊆ Rn , A ∈ I(Rn ) mit A ⊆ D und f ∈ L1 (D). Dann gilt 1A · f ∈ L1 (D), siehe Satz 2.3.(iii). R (i) Falls λn (A) > 0, bezeichnet man 1/λn (A) · A f dλn als den Mittelwert von f u ¨ber A. R (ii) FallsRf ≥ 0 und D f dλn = 1, bezeichnet man f als Wahrscheinlichkeitsdichte und A f dλn als Wahrscheinlichkeit von A bzgl. f .

Integrabilit¨ atskriterien Satz 12. Sei D ⊆ Rn offen und beschr¨ankt, und sei f : D → R beschr¨ankt und stetig. Dann gilt f ∈ L1 (D). Insbesondere gilt D ∈ I(Rn ). Beweis. Es gen¨ ugt den Fall f ≥ 0 zu betrachten, siehe Korollar 2.4 (Integrierbarkeit von Positiv- und Negativteil).

XI.3. Grenzwerts¨atze und Integrabilit¨atskriterien

268

Betrachte die Supremumsnorm auf Rn . Sei M die Menge aller abgeschlossenen Kugeln B r (x) mit r ∈ ]0, ∞[ ∩ Q und x ∈ Qn , die B r (x) ⊆ D erf¨ ullen. Da M abz¨ahlbar ist, existiert eine Bijektion M : N → M. Sei k ∈ N. Definiere gk ∈ T (Rn ) durch gk = min f (x) · 1Mk x∈Mk

und fk : Rn → R durch fk = max(g1 , . . . , gk ). Da fk+1 = max(fk , gk+1 ), gilt offenbar fk ≤ fk+1 , und ∀ k ∈ N : fk ∈ T (Rn ) ergibt sich per Induktion aus Bemerkung 1.10. Sei x ∈ D. Offenbar gilt fk (x) ≤ f (x). Wir zeigen limk fk (x) ≥ f (x) − ε f¨ ur alle ε > 0. W¨ahle δ > 0, so daß B δ (x) ⊆ D und7 f (z) ≥ f (x) − ε f¨ ur alle z ∈ B δ (x). W¨ahle r ∈ Q mit 0 < r < δ/2 und y ∈ Qn , so daß x ∈ B r (y). Dann folgt B r (y) ⊆ B δ (x) und weiter min f (z) ≥ f (x) − ε. z∈B r (y)

W¨ahle Q ∈ Qn mit RD ⊆ Q und setze c = supx∈D f (x). Da fk (x) = 0 f¨ ur x ∈ Dc , gilt fk ≤ c · 1Q , woraus D fk dλn ≤ c · λn (Q) folgt. Wende Satz 2 an. Satz 13. Sei D ⊆ Rn kompakt, und sei f : D → R stetig. Dann gilt f ∈ L1 (D). Insbesondere ist D integrierbar. Beweis. Da D abgeschlossen ist, existiert eine stetige Funktion g : Rn → R mit g|D = f , siehe [K, S. 24] oder Tutorium 9.3. Sei Q ∈ Qn offen mit D ⊆ Q. Setze h = g|Q . Dann ist h beschr¨ankt, und Satz 12 sichert h|Q , 1Q\D ∈ L1 (Rn ). Schließlich gilt f |D = h|Q − h|Q · 1Q\D . Wende Satz 2.3 (Abschlußeigenschaften von L1 (Rn )) an.

Majorisierte Konvergenz Satz 14 (Lebesgue). Seien f : D → R und g ∈ L1 (D), und sei (fk )k eine Folge in L1 (D), so daß (i) limk fk (x) = f (x) f¨ ur alle x ∈ D, (ii) ∀ k ∈ N : |fk | ≤ g.  R Dann konvergiert D fk dλn k , und es gilt f ∈ L1 (D) sowie Z Z n f dλ = lim fk dλn . D

k

D

Beweis. Siehe Vorlesung “Maß- und Integrationstheorie“. Bemerkung 15. Vergleiche Satz 14 und Beispiel IX.4.12. 7

Diese Eigenschaft heißt Unterhalbstetigkeit von f in x; sie gen¨ ugt zum Beweis des Satzes.

XI.3. Grenzwerts¨atze und Integrabilit¨atskriterien

269

Parameterabh¨ angige Integrale Im Folgenden seien ∅ 6= D ⊆ Rn und ∅ 6= U ⊆ Rm sowie f : U × D → R, und es gelte ∀ x ∈ U : f (x, ·) ∈ L1 (D). (1) Definiere F : U → R durch8 Z F (x) =

f (x, y) dλn (y).

D

Beispiel 16. F¨ ur g ∈ L1 (Rn ) und x, y ∈ Rn sei f (x, y) = g(y) · cos(hx, yi). Wir zeigen (1). Setze Bk = {y ∈ Rn : kyk2 ≤ k} sowie hk (x, y) = cos(hx, yi) · 1Bk (y) f¨ ur k ∈ N. Satz 13 sichert hk (x, ·) ∈ L1 (Rn ), und mit Satz 2.3.(iii) ergibt sich g · hk (x, ·) ∈ L1 (Rn ). Da limk g(y) · hk (x, y) = f (x, y) und |g · hk (x, ·)| ≤ |g| ∈ L1 (Rn ), folgt f (x, ·) ∈ L1 (Rn ) mit Satz 14. Analog zeigt man g · sin(hx, ·i) ∈ L1 (Rn ). Die durch  Z Z 1 n n g(y) · sin(hx, yi) dλ (y) g(y) · cos(hx, yi) dλ (y) − ı · F (x) = (2π)n/2 Rn Rn definierte Funktion F : Rn → C heißt die9 Fourier-Transformierte von g und wird mit gˆ bezeichnet. Es gilt insbesondere 1 gˆ(0) = · (2π)n/2

Z

g(y) dλn (y).

Rn

F¨ ur n = 1 und g = 1[−1,1] ergibt sich im Fall x 6= 0 Z Z 1 1 1 1 gˆ(x) = √ · 1[−1,1] (y) · cos(x · y) dλ (y) = √ · cos(x · y) dy 2π R 2π −1 p sin(x) = 2/π · . x Satz 17. Gelte ∀ y ∈ D : f (·, y) ∈ C(U ) sowie ∃ h ∈ L1 (D) ∀ (x, y) ∈ U × D : |f (x, y)| ≤ h(y). Dann ist F stetig. 8 9

Integrale dieser Form heißen parameterabh¨angige Integrale, kurzRParameterintegrale. Als Integral einer komplexwertigen Funktion ist gˆ(x) = (2π)1n/2 · Rn g(y) · exp(−ıhx, yi) dy.

XI.3. Grenzwerts¨atze und Integrabilit¨atskriterien

270

Beweis. F¨ ur x ∈ U sei (xk )k eine Folge in U mit limk xk = x. Definiere fk : D → R durch fk (y) = f (xk , y). Dann gilt limk fk (y) = f (x, y) f¨ ur alle y ∈ D sowie |fk | ≤ h. Satz 14 zeigt Z Z n F (x) = lim fk (y) dλ (y) = lim fk (y) dλn (y) = lim F (xk ). D

k

k

D

k

Bemerkung 18. Satz 17 zeigt die Stetigkeit der Fourier-Transformierten jeder Funktion aus L1 (Rn ). Satz 19. Sei U offen, und gelte ∀ y ∈ D : f (·, y) ∈ C 1 (U ) sowie ∃ h ∈ L1 (D) ∀ (x, y) ∈ U × D ∀ j ∈ {1, . . . , m} : |(∂j f )(x, y)| ≤ h(y). Dann ist F stetig differenzierbar, und es gilt (∂j f ) (x, ·) ∈ L1 (D) sowie Z (∂j f ) (x, y) dλn (y) (∂j F ) (x) = D

f¨ ur j ∈ {1, . . . , m} und x ∈ U . Beweis. Seien x ∈ U und U 0 ⊆ U eine offene konvexe Umgebung von x, und sei (e1 , . . . , em ) die Standardbasis von Rm . Betrachte eine Folge (ξk )k in R \ {0} mit limk ξk = 0 und x + ξk · ej ∈ U 0 . Definiere fk : D → R durch fk (y) =

f (x + ξk · ej , y) − f (x, y) . ξk

Dann gilt fk ∈ L1 (D) und limk fk (y) = (∂j f ) (x, y) f¨ ur alle y ∈ D. Ferner gilt |fk | ≤ h, siehe Satz IV.2.7 (Mittelwertsatz der Differentialrechnung), sowie Z F (x + ξk · ej ) − F (x) fk (y) dλn (y) = . ξk D Satz 14 zeigt die Existenz der j-ten partiellen Ableitung von F in x sowie (∂j f ) (x, ·) ∈ L1 (D) und Z Z n (∂j f ) (x, y) dλ (y) = lim fk (y) dλn (y) = (∂j F )(x). D

k

D

Die Stetigkeit von ∂j F folgt nun mit Satz 17, angewandt auf ∂j f .

XI.3. Grenzwerts¨atze und Integrabilit¨atskriterien

271

Beispiel 20. In der Situation von Beispiel 16 gilt (∂j f )(x, y) = −g(y) · yj · sin(hx, yi) f¨ ur x, y ∈ Rn . Gelte u ur j ∈ {1, . . . , n}, wobei ¨berdies gj ∈ L1 (Rn ) f¨ gj (y) = yj · g(y). ¨ Satz 19 und die Uberlegungen aus Beispiel 16 zeigen: gˆ ist stetig differenzierbar, und es gilt ∂j gˆ = −i · gbj . Beispiel 21. F¨ ur x, y ∈ ]0, ∞[ sei sin(y) y

h(y) = sowie

f (x, y) = exp(−x · y) · h(y). Wir zeigen (1). Da h stetig ist und limy→0 h(y) = 1 sowie limy→∞ h(y) = 0, ist h beschr¨ankt, so daß |f (x, y)| ≤ c · exp(−x · y) mit c = supy∈]0,∞[ |h(y)|. Sei k ∈ N. Satz 12 zeigt f (x, ·) · 1]0,k[ ∈ L1 (]0, ∞[), und wie in ¨ Ubung 12.2 zeigt man exp(−x ·) ∈ L1 (]0, ∞[). Mit Satz 14 folgt (1) und Z Z 1 f (x, y) dλ (y) = lim f (x, y) dλ1 (y). k

]0,∞[

]0,k[

Offenbar ist f stetig differenzierbar mit (∂1 f ) (x, y) = −y · f (x, y) = − exp(−xy) · sin(y). Sei U = ]δ, ∞[ mit δ > 0. Dann gilt |(∂1 f ) (x, y)| ≤ exp(−δ · y) f¨ ur alle x ∈ U und y ∈ ]0, ∞[. Somit ist Satz 19 anwendbar, und man erh¨alt Z 0 F (x) = − exp(−x · y) · sin(y) dλ1 (y) ]0,∞[ Z = − lim exp(−x · y) sin(y) dλ1 (y) k

]0,k[

mittels Satz 14. Schließlich gilt Z Z 1 exp(−x · y) sin(y) dλ (y) = ]0,k[

exp(−x · y) sin(y) dλ1 (y)

[0,k] k

Z

exp(−x · y) · sin(y) dy

= 0

=

 k − exp(−xy) · cos(y) + x sin(y) . 1 + x2 0

XI.3. Grenzwerts¨atze und Integrabilit¨atskriterien

272

Fazit: f¨ ur alle x ∈ ]0, ∞[ gilt 1 . 1 + x2 Somit existiert c ∈ R, so daß f¨ ur alle x ∈ ]0, ∞[ F 0 (x) = −

F (x) = c − arctan(x). Satz 14 zeigt limx→∞ F (x) = 0, d.h. F (x) = π/2 − arctan(x) f¨ ur alle x ∈ ]0, ∞[.

Nullmengen Im Folgenden seien A ⊆ Rn und f, g : Rn → R. Bemerkung 22. f ∈ H(Rn ) ∧ kf k1 = 0 ⇔ f ∈ L1 (Rn ) ∧ Verwende Satz 2.10.(i) und 0 ∈ T (Rn ).

R

|f | dλn = 0. Beweis:

Definition 23. A heißt Nullmenge, falls A ∈ I(Rn ) mit λn (A) = 0. Lemma 24. (i) A Nullmenge ⇔ 1A ∈ H(Rn ) ∧ k1A k1 = 0. (ii) A ist genau dann eine Nullmenge10 , falls f¨ ur alle ε > 0 eine Folge (Qk )k∈N offener Quader aus Qn existiert, so daß A⊆

∞ [

Qk ∧

k=1

∞ X

λn (Qk ) ≤ ε.

k=1

(iii) Teilmengen von Nullmengen sind Nullmengen. (iv) Abz¨ahlbare Vereinigungen von Nullmengen sind Nullmengen. Insbesondere sind abz¨ahlbare Mengen Nullmengen. Beweis. ad (i): Dies ist Bemerkung 22 f¨ ur f = 1A . P P∞ ad (ii): Verwende (i), und beachte, daß 1A ≤ ∞ k=1 1Qk , falls 1A ≤ k=1 ck 1Qk mit ck ≥ 0. ad (iii), (iv): folgt unmittelbar aus (ii). Bemerkung 25. Es existieren u ¨berabz¨ahlbare Nullmengen in R, siehe Tutorium 6.1. Lemma 26. Seien A eine Nullmenge und h : A → Rn Lipschitz-stetig. Dann ist h(A) eine Nullmenge. 10

Dies zeigt im Fall n = 1 die Konsistenz mit Definition IV.2.23.

XI.3. Grenzwerts¨atze und Integrabilit¨atskriterien

273

Beweis. Betrachte die Supremumsnorm k · k∞ auf Rn . Sei ε > 0. Dann existieren eine Folge (xk )k ∈ Rn und eine Folge (rk )k in ]0, ∞[ mit A⊆

∞ [

Qk ∧

k=1

∞ X

λn (Qk ) ≤ ε

k=1

f¨ ur Qk = Brk (xk ). Ferner existiert L > 0 mit ∀ x, y ∈ A : kh(x) − h(y)k∞ ≤ L · kx − yk∞ . Setze Pk = ∅, falls A ∩ Qk = ∅. Andernfalls w¨ahle man yk ∈ A ∩ Qk und setze Pk = B2Lrk (h(yk )). Es folgt h(A ∩ Qk ) ⊆ Pk und λn (Pk ) = (4Lrk )n = (2L)n · λn (Qk ). Fazit: h(A) =

∞ [

h(A ∩ Qk ) ⊆

∞ X

Pk

k=1

k=1

und

∞ [

λn (Pk ) ≤ (2L)n · ε.

k=1

Beispiel 27. Sei A ein affiner Unterraum der Dimension m < n. Wir zeigen, daß A eine Nullmenge ist. Betrachte den nicht-trivialen Fall m ≥ 1. Dann existieren eine linear unabh¨angige Familie (v1 , . . . , vm ) in Rn und u ∈ Rn mit ( m ) X A=u+ xi v i : x1 , . . . , x m ∈ R . i=1

F¨ ur h : Rn → Rn , definiert durch h(x) = u + m

n−m

A = h(R × {0}

)=

∞ [

Pm

i=1

xi vi , ergibt sich

h([−k, k]m × {0}n−m ).

k=1

Wende die Lemmata 24.(iv) und 26 an. Definition 28. Sei E eine Eigenschaft, die jedem Punkt aus Rn entweder zukommt oder nicht. Dann gilt E fast u ur fast alle Punkte aus Rn ), falls die Menge aller ¨berall (f¨ Punkte aus Rn , die die Eigenschaft E nicht besitzen, eine Nullmenge ist. Satz 29. Es gilt 1

n

f = 0 fast u ¨berall ⇔ f ∈ L (R ) ∧

Z

|f | dλn = 0.

XI.3. Grenzwerts¨atze und Integrabilit¨atskriterien

274

Beweis. ⇒“: Die Mengen ” Ak = {x ∈ Rn : k − 1 < |f (x)| ≤ k} mit k ∈ N sind als Teilmengen von {x ∈ Rn : |f (x)| > 0} Nullmengen. Sei ε > 0. Gem¨aß Lemma 24.(ii) existieren Folgen (Qk,` )`∈N offener Quader aus Qn mit Ak ⊆

∞ [

Qk,` ∧

`=1

Da |f | =

∞ X

1Ak · |f | ≤

k=1

∞ X

λn (Qk,` ) ≤

`=1

∞ X

k · 1Ak ≤

k=1

ε . k · 2k

∞ X

k · 1Qk,` ,

k,`=1

folgt f ∈ H(Rn ) mit kf k1 = 0. Wende Bemerkung 22 an. ⇐“: F¨ ur ”

Ak = {x ∈ Rn : |f (x)| ≥ 1/k}

mit k ∈ N gilt 1Ak ≤ k · |f |, woraus 1Ak ∈ H(Rn ) und k1Ak k1 = 0 mit Lemma 1.20.(ii) Satz 2.10.(i) folgt. Ferner gilt {x ∈ Rn : |f (x)| = 6 0} =

∞ [

Ak .

k=1

Wende Lemma 24.(i) und (iv) an. Sei f ∈ L1 (Rn ) und gelte f = g fast u ¨berall. Dann gilt g ∈ L1 (Rn ) und RSatz 30. R g dλn = f dλn . R Beweis. Satz 29 zeigt f − g ∈ L1 (Rn ) und |f − g| dλn = 0. Es folgt g ∈ L1 (Rn ) sowie Z Z Z f dλn − g dλn ≤ |f − g| dλn = 0.

Ausblick 31. Die Banach-R¨aume Lp (D). Bemerkung 32. Seien h : D → R und A, B ⊆ D. (i) Falls A eine Nullmenge ist, gilt 1A · h ∈ L1 (D) und h|A = 0 fast u ¨berall. Wende Satz 29 an.

R A

h dλn = 0. Beweis: Es gilt

(ii) Falls A ∩ B eine Nullmenge ist und 1A · f, 1B · f ∈ L1 (D), gilt 1A∪B · f ∈ L1 (D) und Z Z Z n n f dλ = f dλ + f dλn . A∪B

A

B

Beweis: Es gilt (1A + 1B ) · f = 1A · f + 1B · f ∈ L1 (D) und 1A + 1B = 1A∪B fast u ¨berall. Wende Satz 30 an.

XI.4. Iterierte Integration

275

Bemerkung 33. Die Integrationstheorie wird in der Regel f¨ ur Funktionen f , die auch den Wert ∞, siehe [K], bzw. die Werte ∞ und −∞ annehmen k¨onnen, entwickelt. F¨ ur integrierbare Funktionen dieser Form gilt: (i) {x ∈ Rn : f (x) ∈ {∞, −∞}} ist eine Nullmenge, (ii) es existiert eine integrierbare Funktion g : Rn → R, so daß f = g fast u ¨berall R R n n und (demzufolge) f dλ = g dλ . Literatur. [K, 7.4–7.6, 8.2–8.4].

4

Iterierte Integration

Bemerkung 1. Sei Q = ×j=1 [aj , bj ] ∈ Qn mit aj < bj , und sei f : Q → R stetig. Die S¨atze 2.13 (Riemann- und Lebesgue-Integral) und 3.17 (Stetigkeit von Parameterintegralen) zeigen, daß durch n

b1

Z (x2 , . . . , xn ) 7→

f (x1 , . . . , xn ) dx1 a1

eine stetige Funktion von [a2 , b2 ] × · · · × [an , bn ] nach R definiert wird. Induktiv folgt, daß das iterierte Integral Z bn Z b1 ... f (x1 , . . . , xn ) dx1 . . . dxn an

a1

wohldefiniert ist. Dies gilt ebenso f¨ ur jede andere Integrationsreihenfolge. Beispiel 2.6 bzw. Satz 3.13 zeigt f ∈ L1 (Q). ¨ Ubung 13.1 zeigt (im Fall Q = [0, 1]2 ) Z Z 1Z 1 2 f dλ = f (x1 , x2 ) dx1 dx2 . [0,1]2

0

0

Beispiel 2. Betrachte die durch f (x, y) = xy + y 2 definierte stetige Funktion f : [0, 1]2 → R. Es gilt f ∈ L1 ([0, 1]2 ) sowie Z 1Z 1 Z 1  f (x, y) dx dy = y/2 + y 2 dy = 7/12 und

0

0

Z 1Z

1

0

Z f (x, y) dy dx =

0

Bemerkung 1 zeigt

0

R [0,1]2

1

(x/2 + 1/3) dx = 7/12. 0

f dλ2 = 7/12.

Im Folgenden seien k, m ∈ N sowie ∅ 6= X ⊆ Rk und ∅ 6= Y ⊆ Rm . Setze n = k+m.

XI.4. Iterierte Integration

276

Satz 3 (Fubini). Sei f ∈ L1 (X × Y ). Dann existiert eine Nullmenge A ⊆ Y mit folgenden Eigenschaften: (i) Es gilt ∀ y ∈ Y \ A : f (·, y) ∈ L1 (X). (ii) F¨ ur F : Y → R, definiert durch (R f (x, y) dλk (x), falls y ∈ Y \ A, X F (y) = 0, falls y ∈ A, gilt F ∈ L1 (Y ) sowie Z

Z

n

f dλ = X×Y

F dλm .

Y

Beweis. Siehe Vorlesung “Maß- und Integrationstheorie“. Bemerkung 4. Satz 3 gilt analog, wenn man zuerst u ¨ber Y integriert. Man verwendet anstelle von (ii) die suggestive Schreibweise Z Z Z n f (x, y) dλk (x) dλm (y) f (x, y) dλ (x, y) = X×Y ZY ZX f (x, y) dλm (y) dλk (x). = X Y

Induktiv erh¨alt man f¨ ur ∅ 6= X1 , . . . , Xn ⊆ R, f ∈ L1 (X1 × · · · × Xn ) und σ ∈ Sn Z Z Z n f (x1 , . . . , xn ) dλ1 (xσ(1) ) . . . dλn (xσ(n) ). ... f dλ = X1 ×···×Xn

Xσ(1)

Xσ(n)

Beispiel 5. F¨ ur D = {(x, y) ∈ R2 : x2 + y 2 ≤ 1} sei f : D → R stetig. Dann gilt f ∈ L1 (D), siehe Satz 3.13. F¨ ur f˜ : [−1, 1]2 → R, definiert durch ( f (x, y), falls (x, y) ∈ D, f˜(x, y) = 0, falls (x, y) ∈ [−1, 1]2 \ D, folgt f˜ ∈ L1 ([−1, 1]2 ). Satz 3 sichert Z Z Z 2 2 ˜ f dλ = f dλ = D

[−1,1]2

F¨ ur x ∈ [−1, 1] sei g(x) = Z [−1,1]



Z

f˜(x, y) dλ1 (y) dλ1 (x).

[−1,1] [−1,1]

1 − x2 . Dann gilt

f˜(x, y) dλ1 (y) =

Z

1

Z

g(x)

f (x, y) dλ (y) = [−g(x),g(x)]

f (x, y) dy. −g(x)

XI.4. Iterierte Integration

277

Speziell f¨ ur f = 1 ergibt sich Z 2 λ (D) =

Z

1

2g(x) dλ (x) = 4 ·

[−1,1]

Da Z

1



1 − x2 dx.

0

b

g(x) dx = 1/2 · x · 0



 b 1 − x2 + arcsin(x) 0

f¨ ur 0 < b < 1, folgt λ2 (D) = π mit Satz 3.14 (majorisierte Konvergenz). Korollar 6. F¨ ur n ≥ 2 sei A ⊆ Rn kompakt. Setze11 Ay = {x ∈ Rn−1 : (x, y) ∈ A},

y ∈ R,

Ax = {y ∈ R : (x, y) ∈ A},

x ∈ Rn−1 .

sowie Dann gilt n

Z

λ (A) =

n−1

λ

1

Z

(Ay ) dλ (y) =

λ1 (Ax ) dλn−1 (x).

Rn−1

R

Beweis. Mit A ist auch Ay f¨ ur jedes y ∈ R kompakt, und Satz 3.13 sichert die Integrierbarkeit dieser Mengen. Ferner gilt 1A (x, y) = 1Ay (x). Wende Satz 3 mit X = Rn−1 , Y = R und f = 1A an. Die zweite Teilaussage zeigt man analog. Beispiel 7. F¨ ur n ≥ 2 seien ∅ 6= D ⊆ Rn−1 kompakt und g : D → R stetig. F¨ ur den Graphen A = {(x, g(x)) ∈ Rn : x ∈ D} von g gilt: A ist kompakt und Ax =

( {g(x)}, falls x ∈ D, ∅,

sonst,

weshalb A eine Nullmenge ist. S S Beispiel 8. Sei A = R × Q. Da A = q∈Q k∈N [−k, k] × {q}, ist A eine Nullmenge und somit integrierbar. Es gilt Ay = R, falls y ∈ Q, sowie Ay = ∅, falls y 6∈ Q, so daß Ay nicht f¨ ur alle y ∈ R integrierbar ist. Beispiel 9. F¨ ur X = Y = ]0, 1] sei f : X × Y → R definiert durch f (x, y) = 11

x−y . (x + y)3

Diese Notation ist weitverbreitet, aber mangelhaft.

XI.5. Die Transformationsformel

278

Die S¨atze 3.12 und 3.30 zeigen f (·, y), f (x, ·) ∈ L1 (]0, 1]) f¨ ur alle x, y ∈ ]0, 1]. F¨ ur 0 < a < 1 gilt Z 1 Z 1 x−y x 1 f (x, y) dλ (x) = dx = − , 3 2 a (x + y) (x + y) a [a,1] so daß

Z

f (x, y) dλ1 (x) = −

]0,1]

1 (1 + y)2

mit Satz 3.14 (majorisierte Konvergenz) folgt. Man erh¨alt Z 1 Z Z 1 1 1 f (x, y) dλ (x) dλ (y) = − dy = −1/2 2 ]0,1] ]0,1] 0 (1 + y) und aus Symmetriegr¨ unden Z Z

f (x, y) dλ1 (y) dλ1 (x) = 1/2.

]0,1] ]0,1]

Definition 10. F¨ ur f : X → R und g : Y → R heißt f ⊗ g : X × Y → R, definiert durch f ⊗ g (x, y) = f (x) · g(y),

x ∈ X, y ∈ Y,

das Tensorprodukt von f und g. Satz 11. F¨ ur f ∈ L1 (X) und g ∈ L1 (Y ) gilt f ⊗ g ∈ L1 (X × Y ) und Z Z Z n k f ⊗ g dλ = f dλ · g dλm . X×Y

X

Y

Beweis. Siehe [K, S. 291] zum Beweis der Integrierbarkeit. Damit ist Satz 3 anwendbar. Literatur. [K, 7.4, 7.5, 8.5].

5

Die Transformationsformel

Translationsinvarianz Im Folgenden sei a ∈ Rn , und g : Rn → Rn sei definiert durch g(x) = x + a. Satz 1. F¨ ur f : Rn → R sind f ∈ L1 (Rn ) und f ◦ g ∈ L1 (Rn ) ¨aquivalent, und ggf. gilt Z Z n f dλ = f ◦ g dλn .

XI.5. Die Transformationsformel

279

Beweis. Die Behauptung gilt offenbar f¨ ur f = 1Q mit Q ∈ Qn , und damit auch f¨ ur n n f ∈ T (R ). Ebenso erh¨alt man khk1 = kh ◦ gk1 f¨ ur alle h : R → R. Sei f ∈ L1 (Rn ). W¨ahle eine Folge (fk )k in T (Rn ) mit limk kf − fk k1 = 0. Es folgt fk ◦ g ∈ T (Rn ) sowie limk kf ◦ g − fk ◦ gk1 = 0. Somit gilt f ◦ g ∈ L1 (Rn ) und Z Z Z n n f ◦ g dλ = lim fk dλ = f dλn . k

Falls f ◦g ∈ L1 (Rn ) folgt mit dem bereits Bewiesenen, daß f = f ◦g◦g −1 ∈ L1 (Rn ). Korollar 2. F¨ ur A ⊆ Rn sind A ∈ I(Rn ) und g −1 (A) ∈ I(Rn ) ¨aquivalent, und ggf. gilt λn (A) = λn (g −1 (A)). Beweis. Es gilt 1A ◦ g = 1g−1 A . Wende Satz 1 mit f = 1A an.

Das Volumen von Parallelotopen Im Folgenden seien ∅ 6= D, D0 ⊆ Rn . Wir w¨ahlen eine Norm auf Rn und betrachten die induzierten Metriken auf D und D0 samt den zugeh¨origen Mengen offener Mengen. Lemma 3. Seien ∅ 6= D, D0 ⊆ Rn und g : D → D0 stetig und bijektiv mit stetiger Inversen g −1 . F¨ ur A ⊆ D gilt ˚ = (g(A))◦ g(A) und g(∂A) = ∂(g(A)). Beweis. Es gilt g(A) = (g −1 )−1 (A). Somit ist g(A) offen, falls A offen ist, siehe Satz ˚ ⊆ g(A), IX.2.31 (Charakterisierung stetiger Abbildungen). Im allgemeinen gilt g(A) woraus ˚ ⊆ (g(A))◦ g(A) folgt. Ebenso ergibt sich  g −1 (g(A))◦ ⊆ A◦ ˚ = (g(A))◦ . Man erh¨alt und zusammenfassend g(A)    ˚ ∪ (Ac )◦ = (g(A))◦ ∪ (g(Ac ))◦ = (g(A))◦ ∪ (g(A))c ◦ = (∂g(A))c . g (∂A)c = g A

Lemma 4. Es existiert h¨ochstens eine Abbildung Λ : Rn×n → R mit folgenden Eigenschaften f¨ ur alle a1 , . . . , an ∈ Rn , c ∈ R und k, j ∈ {1, . . . , n} mit k 6= j: (i) Λ(a1 , . . . , ak−1 , cak , ak+1 , . . . , an ) = |c| · Λ(a1 , . . . , an ), (ii) Λ(a1 , . . . , ak−1 , ak + aj , ak+1 , . . . , an ) = Λ(a1 , . . . , an ), (iii) Λ(e1 , . . . , en ) = 1 f¨ ur die Standardbasis (e1 , . . . , en ) von Rn .

XI.5. Die Transformationsformel

280

Beweis. Schließe wie im Beweis von Satz VII.1.14. Satz 5. Sei g : Rn → Rn linear. F¨ ur Q ∈ Qn gilt g(Q) ∈ I(Rn ) und λn (g(Q)) = | det g| · λn (Q). Beweis. Sei P (a1 , . . . , an ) =

n nX

o cj aj : c1 , . . . , cn ∈ [0, 1]

j=1

das von 0, a1 , . . . , an ∈ Rn aufgespannte Parallelotop. Diese Menge ist kompakt und somit integrierbar. Man zeigt, daß die durch (a1 , . . . , an ) 7→ λn (P (a1 , . . . , an )) definierte Abbildung die Eigenschaften (i)–(iii) aus Lemma 4 besitzt, siehe [K, S. 261]. Dies gilt ebenso f¨ ur (a1 , . . . , an ) 7→ | det(a1 , . . . , an )|. Lemma 4 sichert λn (P (a1 , . . . , an )) = | det(a1 , . . . , an )|

(1)

f¨ ur alle a1 , . . . , an ∈ Rn . Vgl. Bemerkung VII.1.9. Sei Q ∈ Qn . Im Fall det g = 0 ist g(Q) in einem Unterraum der Dimension n − 1 enthalten, so daß λn (g(Q)) = 0, siehe Beispiel 3.27. Betrachte den Fall det g 6= 0. Der Rand ∂Q ist in der Vereinigung von endlich-vielen affinen Unterr¨aumen der Dimension n − 1 enthalten und somit eine Nullmenge, Die Lemmata 3.26 und 3 sichern, daß auch ∂g(Q) = g(∂(Q)) eine Nullmenge ist. Es gen¨ ugt also einen kompakten Quader Q zu n betrachten. Wir k¨onnen dar¨ uber hinaus Q = ×j=1 [0, bj ] annehmen, wie Satz 1 zeigt. Sei (e1 , . . . , en ) die Standardbasis von Rn . Dann gilt g(Q) = P ((b1 g(e1 ), . . . , bn g(en ))), woraus mit (1) die Behauptung folgt.

Der allgemeine Fall Im Folgenden seien ∅ 6= D, D0 ⊆ Rn offen und g : D → D0 ein Diffeomorphismus. Lemma 6. F¨ ur jede Nullmenge A ⊆ D ist g(A) eine Nullmenge. Beweis. Fixiere eine Norm auf Rn , und betrachte die Menge M aller abgeschlossenen Kugeln B r (x) mit r ∈ ]0, ∞[ ∩ Q und x ∈ Qn , die B r (x) ⊆ D erf¨ ullen. Diese Menge S ist abz¨ahlbar, und es gilt D = M ∈M M . Sei M ∈ M. Dann ist g|M Lipschitz-stetig, siehe Korollar X.2.14 (zum Mittelwertsatz), so daß g(A ∩ M ) eine Nullmenge ist, siehe S Lemma 3.26. Beachte, daß g(A) = M ∈M g(A ∩ M ). Lemma 7. Sei A ⊆ D kompakt, und sei12 ∂A eine Nullmenge. Dann gilt   min det (Dg)(x) · λn (A) ≤ λn (g(A)) ≤ max det (Dg)(x) · λn (A). x∈A

x∈A

˚ = ∅, siehe [A, Bsp. 4.2] und Es existieren kompakte Mengen A ⊆ [0, 1] mit λ1 (A) > 0 und A vgl. Tutorium6.1. 12

XI.5. Die Transformationsformel

281

Beweis. Siehe [K, S. 301]; hier geht Satz 5 ein. Lemma 8. F¨ ur Q ∈ Qn mit Q ⊆ D0 gilt | det(Dg)| ∈ L1 (g −1 (Q)) und Z n λ (Q) = | det(Dg)| dλn . g −1 (Q)

Beweis. Setze B = Q \ Q. Offenbar gilt Q = Q ∪ B und Q ∩ B = ∅. Da B ⊆ ∂Q und ∂Q eine Nullmenge ist, ist B eine Nullmenge, und es gilt λn (Q) = λn (Q). Ferner ist auch g −1 (B) eine Nullmenge, siehe Lemma 6, und es folgt | det(Dg)| ∈ L1 (g −1 (B)) sowie Z | det(Dg)| dλn = 0 g −1 (B)

siehe Bemerkung 3.32.(i). Da g −1 (Q) kompakt ist, siehe Satz IX.3.10, folgt | det(Dg)| ∈ L1 (g −1 (Q)) mit Satz 3.13. Zusammenfassend erh¨alt man | det(Dg)| ∈ L1 (g −1 (Q)) und Z Z n | det(Dg)| dλ = | det(Dg)| dλn , g −1 (Q)

g −1 (Q)

weshalb wir im Folgenden annehmen k¨onnen, daß Q kompakt ist. Setze

1  , ϕ(x) = det (Dg −1 )(x)

x ∈ D0 ,

 ϕ(g(y)) = det (Dg)(y) ,

y ∈ D.

und beachte, daß

Sei ε > 0. Da die Einschr¨ankung von ϕ auf Q gleichm¨aßig stetig ist, existieren k ∈ N und kompakte Quader Q1 , . . . , Qk ∈ Qn mit (i) Q =

Sk

`=1

Q` ,

(ii) λn (Q` ∩ Q`0 ) = 0 f¨ ur `, `0 ∈ {1, . . . , k} mit ` 6= `0 , (iii) maxx∈Q` ϕ(x) − minx∈Q` ϕ(x) ≤ ε. Die Mengen A` = g −1 (Q` ) sind kompakt, also integrierbar, und es gilt λn (A` ∩A`0 ) = 0 f¨ ur `, `0 wie oben, siehe Lemma 6. Man erh¨alt n

λ (Q) =

k X

λn (Q` )

`=1

und Z

n

| det(Dg)| dλ = g −1 (Q)

k Z X `=1

A`

| det(Dg)| dλn ,

XI.5. Die Transformationsformel

282

siehe Bemerkung 3.32.(ii). Ferner gilt Z n | det(Dg)| dλn ≤ λn (A` ) · max ϕ(x). λ (A` ) · min ϕ(x) ≤ x∈Q`

x∈Q`

A`

Lemma 7 sichert λn (A` ) · min ϕ(x) ≤ λn (Q` ) ≤ λn (A` ) · max ϕ(x). x∈Q`

x∈Q`

Es folgt Z

A`

und weiter

Z

| det(Dg)| dλ − λ (Q` ) ≤ ε · λn (A` ) n

g −1 (Q)

n

| det(Dg)| dλn − λn (Q) ≤ ε · λn (g −1 (Q)).

Satz 9. (i) F¨ ur f : D0 → R gilt f ∈ L1 (D0 ) ⇔ f ◦ g · | det(Dg)| ∈ L1 (D) sowie ggf. Z

n

Z

f dλ = D0

f ◦ g · | det(Dg)| dλn .

D

(ii) F¨ ur A ⊆ D0 gilt A ∈ I(Rn ) ⇔ | det(Dg)| ∈ L1 (g −1 (A)) sowie ggf. n

Z

λ (A) =

| det(Dg)| dλn .

g −1 (A)

Beweis. Die Behauptungen folgen aus Lemma 8 mit allgemeinen Resultaten der Vorlesung “Maß- und Integrationstheorie“. Im Folgenden sei Kn (r) = {x ∈ Rn : kxk2 ≤ r} f¨ ur r ≥ 0 sowie κn = λn (Kn (1)) . Beispiel 10. Es gilt κ1 = 2 und κ2 = π, siehe Beispiel 4.5, und f¨ ur n ≥ 3 zeigt Korollar 4.6 (zum Satz von Fubini) Z p  κn = λn−1 Kn−1 1 − y 2 dλ1 (y). [−1,1]

p Definiere g : Rn−1 → Rn−1 durch g(x) = 1 − y 2 · x. Sei y ∈ [−1, 1]. Es gilt p g −1 (Kn−1 ( 1 − y 2 )) = Kn−1 (1),

XI.5. Die Transformationsformel

283

und Satz 9.(ii) zeigt λn−1 Kn−1

p

1 − y2



= (1 − y 2 )(n−1)/2 · κn−1 .

Man erh¨alt κn = cn · κn−1 mit Z

1 2 (n−1)/2

(1 − y )

cn =

Z

π

dy =

−1

sinn (y) dy.

0

F¨ ur k ∈ N gilt c2k = π

k Y 2` − 1 `=1

2`

,

c2k+1 = 2

k Y `=1

2` , 2` + 1

siehe [Fo1, S. 227]. Es folgt cn · cn−1 = 2π/n und damit κn =

2π · κn−2 , n

n ≥ 3.

Beispiel 11. F¨ ur r > 0 und K = K3 (r) sei ρ : [0, r] → R stetig. Ferner sei x ∈ R3 \K. Dann definiert y 7→ ρ(kyk2 )/kx − yk2 eine stetige und somit integrierbare Funktion auf K. Setze Z ρ(kyk2 ) u(x) = dλ3 (y). kx − yk 2 K Dann zeigt Satz 9.(i) f¨ ur jede orthogonale Abbildung g : R3 → R3 Z ρ(kg −1 (y)k2 ) u(g(x)) = dλ3 (y) = u(x). −1 K kg(x) − g(g (y))k2

Polarkoordinaten Im Folgenden sei n ≥ 2. Definiere P2 : R2 → R2 durch   r · cos(α) P2 (r, α) = r · sin(α) sowie Pn : Rn → Rn f¨ ur n ≥ 3 rekursiv durch   cos(αn−1 ) · Pn−1 (r, α1 , . . . , αn−2 ) Pn (r, α1 , . . . , αn−1 ) = . r · sin(αn−1 ) Beispiel 12. F¨ ur r, α1 , α2 ∈ R gilt 

 cos(α1 ) · cos(α2 ) P3 (r, α1 , α2 ) = r ·  sin(α1 ) · cos(α2 )  . sin(α2 ) Hier beschreiben α1 und α2 die geographische L¨ange bzw. Breite.

XI.5. Die Transformationsformel

284

Konvention: F¨ ur Mengen A und B sei A × B 0 = A; ferner sei Setze n−2 Πn = ]−π, π[ × ]−π/2, π/2[

Qk−1 j=k

aj = 1 f¨ ur k ∈ N.

sowie Sn = {(x1 , 0, x3 , . . . , xn ) ∈ Rn : x1 ≤ 0}. Ferner seien hn (r) = rn−1 , und Cn (α) =

n−1 Y

r ∈ [0, ∞[ ,

cosj−1 (αj ),

α ∈ Rn−1 .

j=2

Lemma 13. (i) F¨ ur r ∈ [0, ∞[ und α ∈ Rn−1 gilt kPn (r, α)k2 = r.  (ii) F¨ ur r ∈ [0, ∞[ und α ∈ Rn−1 gilt det (DPn )(r, α) = hn (r) · Cn (α). (iii) Pn bildet ]0, ∞[ × Πn diffeomorph auf Rn \ Sn ab. Beweis. ad (i): Induktion. ad (ii): Induktion, siehe [K, S. 94]. ad (iii): Wir zeigen zun¨achst induktiv, daß die Einschr¨ankung von Pn auf ]0, ∞[ × Πn eine Bijektion zwischen dieser Menge und Rn \ Sn definiert. F¨ ur n = 2 folgt dies aus Satz III.5.18 (Polarkoordinaten) und cos(x−π) = − cos(x) sowie sin(x−π) = − sin(x) f¨ ur x ∈ R. Seien n ≥ 3 und x ∈ Rn \ Sn . F¨ ur r = kxk2 gilt r > 0 sowie |xn | /r < 1. Setze αn−1 = arcsin(xn /r) ∈ ]−π/2, π/2[ sowie x0 = (x1 , . . . , xn−1 ). Dann gilt cos(αn−1 ) > 0 und kx0 k22 r2 − x2n = = r2 . cos2 (αn−1 ) 1 − sin2 (αn−1 ) Nach Induktionsannahme existiert α0 ∈ Πn−1 mit Pn−1 (r, α0 ) =

1 · x0 . cos(αn−1 )

Fazit: (r, α0 , αn−1 ) ∈ ]0, ∞[ × Πn und Pn (r, α0 , αn−1 ) = x. Ebenso zeigt man die Injektivit¨at von Pn |]0,∞[×Πn . Gem¨aß (ii) gilt (Dg)(r, α) ∈ Gl(n, R) f¨ ur (r, α) ∈ ]0, ∞[ × Πn . Satz X.4.20.(ii) zeigt, daß Pn einen Diffeomorphismus zwischen ]0, ∞[ × Πn und Rn \ Sn definiert. Im Folgenden seien I ⊆ [0, ∞[ ein Intervall und K(I) = {x ∈ Rn : kxk2 ∈ I} die entsprechende Kugelschale.

XI.5. Die Transformationsformel

285

Satz 14. F¨ ur f : K(I) → R gilt13 f ∈ L1 (K(I)) ⇔ f ◦ Pn · hn · Cn ∈ L1 (I × Πn ) und ggf. Z

Z Z

n

f (Pn (r, α)) · Cn (α) dλn−1 (α) · hn (r) dλ1 (r).

f dλ = K(I)

I Πn

Beweis. Beispiel 4.7 zeigt, daß K(I)\K(˚ I) eine Nullmenge ist, weshalb wir im Folgenden annehmen k¨onnen, daß I offen ist. Dann bildet Pn die Menge I × Πn diffeomorph auf K ∗ (I) = K(I) \ Sn ab, siehe Lemma 13.(iii). Satz 9.(i) zeigt f ∈ L1 (K ∗ (I)) ⇔ f ◦ Pn · hn · Cn ∈ L1 (I × Πn ) und ggf. Z

n

Z

f ◦ Pn · hn · Cn dλn .

f dλ = K ∗ (I)

I×Πn

Mit Satz 4.3 (Fubini) folgt dann Z Z Z n f dλ = K ∗ (I)

f ◦ Pn · Cn dλn−1 · hn dλ1 .

I Πn

Beachte, daß K(I) \ K ∗ (I) = K(I) ∩ S eine Nullmenge ist. Satz 15. F¨ ur g : I → R sei f : K(I) → R durch f (x) = g(kxk2 ) definiert. Dann gilt f ∈ L1 (K(I)) ⇔ g · hn ∈ L1 (I) und ggf. Z

Z

n

f dλ = n · κn ·

g(r) · rn−1 dλ1 (r).

I

K(I)

Beweis. Offenbar gilt f (Pn (r, α)) = g(r). Sei f ∈ L1 (K(I)). Dann zeigt Satz 14, daß g · hn · Cn ∈ L1 (I × Πn ). Satz 4.3 (Fubini) sichert g · hn · Cn (α) ∈ L1 (I) f¨ ur fast alle α ∈ Πn , d.h. g · hn ∈ L1 (I). Satz 14 zeigt auch Z Z Z n f dλ = Cn (α) dλn−1 (α) · g(r) · hn (r) dλ1 (r) K(I) I Π Z n Z n−1 = Cn (α) dλ (α) · g(r) · hn (r) dλ1 (r). Πn

I

Speziell f¨ ur g = 1[0,1] ergibt sich Z κn = 1/n ·

Cn (α) dλn−1 (α).

Πn

Sei g · hn ∈ L1 (I). Da Cn ∈ L1 (Πn ) folgt g · hn · Cn ∈ L1 (I × Πn ) mit Satz 4.11 (Integration von Tensorprodukten). 13

Wir betrachten hn und Cn auch als Funktionen von [0, ∞[ × Rn−1 nach R.

XI.5. Die Transformationsformel

286

 Beispiel 16. Sei g(r) = exp(−r2 ). F¨ ur c = supr≥0 exp(−r2 + r) · r gilt c < ∞ und g(r) · r ≤ c · exp(−r),

r ≥ 0.

Da exp(− ·) ∈ L1 ([0, ∞[), zeigt Satz 3.14 (majorisierte Konvergenz), daß g · h2 ∈ L1 ([0, ∞[). Die S¨atze 15 und 3.14 zeigen Z Z 2 2 exp − kxk2 dλ (x) = 2π exp(−r2 ) · r dλ1 (r) R2

[0,∞[

Z = 2π lim

R→∞

0

R

0 exp(−r2 ) · r dr = 2π lim exp(−r2 )/2 R = π. R→∞

Mit Satz 4.3 (Fubini) folgt Z

exp(−x2 ) dλ1 (x) =



π,

R

und schließlich erh¨alt man mit Satz 9.(i) Z 1 √ exp(−x2 /2) dλ1 (x) = 1. 2π R Stichwort: Standard-Normalverteilung. Literatur. [K, 1.3, 3.1, 9].

Anhang A Beispiele in MAPLE Auf der Webseite zur Vorlesung finden sich Maple-Programme in einer Archivdatei sowie eine kurze Anleitung zum Start der Programme. Wir pr¨asentieren im Folgenden die entsprechenden Maple-Worksheets und separat die zugeh¨origen Graphiken.

1

Exponential- und Cosinusreihe

Es gilt exp(x) =

∞ X xk

k!

k=0

und cos(x) =

∞ X

(−1)k

k=0

x2k (2k)!

f¨ ur alle x ∈ R, siehe Definition II.7.33 und Satz III.5.7. Die S¨atze II.7.34 und III.5.8 liefern Restgliedabsch¨atzungen, d.h. Absch¨atzungen der Form |f (x) − pn (x)| ≤ gn (x) f¨ ur n ∈ N und gewisse x ∈ R mit den Partialsummen pn (x) =

n X xk k=0

k!

im Fall f = exp und pn (x) =

n X

(−1)k

k=0

im Fall f = cos. Siehe auch Bemerkung IX.4.38.

287

x2k (2k)!

A.1. Exponential- und Cosinusreihe

288

> restart; read("satz_II.7.12"); > > n := 5; > > p := sum(x^k/k!,k=0..n);

> > g := 2 * abs(x)^(n+1) / (n+1)!;

> > b := 1 + n/2;

> a := -b;

> > plot([p,p+g,p-g],x=a..b);

Abbildung 1.1: Maple-Worksheet zur Exponentialreihe

Abbildung 1.2: Partialsumme pn sowie pn ± gn f¨ ur n = 5 zur Exponentialreihe

A.1. Exponential- und Cosinusreihe

> restart;read("satz_III.5.5"); > > n := 5; > > p := sum((-1)^k*x^(2*k)/(2*k)!,k=0..n);

> > g := abs(x)^(2*n+2) / (2*n+2)!;

> > c := 7; > b := min(2*n+3,c); > a := 0; > > plot([p,p+g,p-g],x=a..b); > > F := h -> max(min(h,1),-1); > > plot([F(p),F(p+g),F(p-g)],x=a..b);

Abbildung 1.3: Maple-Worksheet zur Cosinusreihe

Abbildung 1.4: Partialsumme pn sowie pn ± gn f¨ ur n = 5 zur Cosinusreihe

289

A.2. Lokale Approximation der Exponentialfunktion

290

Abbildung 1.5: Partialsumme pn sowie pn ± gn f¨ ur n = 5, beschr¨ankt auf [−1, 1], zur Cosinusreihe

2

Lokale Approximation der Exponentialfunktion

Wir illustrieren Bemerkung IV.1.10 f¨ ur f = exp und x = 0. Die Tangente h an den Graphen der Exponentialfunktion in (0, 1) ist gegeben durch h(y) = 1 + y f¨ ur y ∈ R, und die Bemerkung zeigt: F¨ ur ε > 0 existiert δ > 0, so daß | exp(y) − h(y)| ≤ ε|y| f¨ ur alle y ∈ ]−δ, δ[. Korollar IX.4.37 bzw. Bemerkung IX.4.38 liefert die st¨arkere Aussage: F¨ ur ε > 0 existiert δ > 0, so daß (1/2 − ε) · y 2 ≤ | exp(y) − h(y)| ≤ (1/2 + ε) · y 2 f¨ ur alle y ∈ ]−δ, δ[.

A.2. Lokale Approximation der Exponentialfunktion

291

> restart; read("bem_IV.1.4"); > > f := exp(y); > h := 1 + y; > > plot([f,h],y=-3..3); > > limit((f-h)/y,y=0); 0 > > epsilon := 0.4; > > a := 1; > plot([f-h,epsilon*y,-epsilon*y],y=-a..a); > plot([f,h+epsilon*y,h-epsilon*y],y=-a..a); > > r := y^2/2;

> > limit((f-h)/r,y=0); 1 > > a := 0.2; > plot([f-h,r],y=-a..a); >

Abbildung 2.1: Maple-Worksheet zur lokalen Approximation der Exponentialfunktion

A.2. Lokale Approximation der Exponentialfunktion

Abbildung 2.2: Exponentialfunktion und Tangente h

Abbildung 2.3: exp −h sowie Geraden mit Steigung ±2/5

292

A.2. Lokale Approximation der Exponentialfunktion

Abbildung 2.4: exp sowie Geraden mit Steigung 1 ± 2/5

Abbildung 2.5: Ein Ausblick auf Korollar IX.4.37

293

A.3. Monotonie und Konvexit¨at

3

294

Monotonie und Konvexit¨ at

F¨ ur α > 0 und x ≥ 0 sei f (x) = exp(−x) · xα . Wir untersuchen die Monotonie und Konvexit¨at dieser Funktion, siehe Beispiele IV.2.6 und IV.2.15 sowie Satz IV.2.22. Beachte, daß   0, falls α > 1, lim f 0 (x) = 1, falls α = 1, x→0   ∞, falls 0 < α < 1, sowie

00

lim f (x) =

x→0

 0,       2,

falls α > 2, falls α = 2,

∞, falls 1 < α < 2,     −2, falls α = 1,    −∞, falls 0 < α < 1.

A.3. Monotonie und Konvexit¨at

295

> restart; read("bsp_IV.2.2"); > > f := x^alpha * exp(-x); > > limit(f,x=infinity); 0 > > g := diff(f,x);

> h := diff(g,x);

> > g := simplify(factor(g)); > h := simplify(factor(h)); > > solve(g=0,x); > solve(h=0,x); > > alpha := 4; > plot([f,g,h],x=0..15); > > alpha := 1; > plot([f,g,h],x=0..4); > > alpha := 0.95; > plot(f,x=0..5); > plot([f,g,h],x=0..5);

Abbildung 3.1: Maple-Worksheet zur Monotonie und Konvexit¨at

A.3. Monotonie und Konvexit¨at

Abbildung 3.2: f , f 0 und f 00 im Fall α = 4

Abbildung 3.3: f , f 0 und f 00 im Fall α = 1

296

A.3. Monotonie und Konvexit¨at

Abbildung 3.4: f im Fall α = 0.95

Abbildung 3.5: f , f 0 und f 00 im Fall α = 0.95

297

A.4. Uneigentliche Integration

4

298

Uneigentliche Integration

Sei D ⊆ R ein abgeschlossenes Intervall. (Uneigentlich) integrierbare Funktionen f : D → [0, ∞[ mit1

Z f (t) dt = 1 D

werden in der Stochastik als Dichten bezeichnet. Liegt einem Zufallsexperiment die Dichte f zugrunde, und ist A ⊆ D ein abgeschlossenes Intervall, ist Z P (A) = f (t) dt A

die Wahrscheinlichkeit daf¨ ur, daß das Zufallsexperiment einen Wert in A liefert. Sind auch id ·f sowie id2 ·f (uneigentlich) integrierbar, heißen Z t · f (t) dt m= D

und

Z

2

σ =

(t − m)2 f (t) dt

D

der zugeh¨orige Erwartungswert bzw. die zugeh¨orige Varianz. Seien λ > 0 und t ≥ 0. Die durch f (t) = λ · exp(−λt) definierte Funktion f : [0, ∞[ → R ist die Dichte der Exponentialverteilung zum Parameter λ. In Beispiel V.3.7 wurde die uneigentliche Integrierbarkeit von f sowie Z ∞ f (t) dt = 1 0

gezeigt. Ferner sind auch id ·f und id2 ·f uneigentlich integrierbar, und es gilt Z ∞ t · f (t) dt = 1/λ 0

sowie

Z



(t − 1/λ)2 · f (t) dt = 1/λ2 .

0

F¨ ur 0 < a < b gilt Rb Z b−a f (t) dt P ([a, b] ∩ [a, ∞[) a = R∞ = 1 − exp(−λ(b − a)) = f (t) dt = P ([0, b − a]). P ([a, ∞[) f (t) dt 0 a Die linke Seite ist die Wahrscheinlichkeit daf¨ ur, daß das Zufallsexperiment unter der Bedingung einen Wert in [a, ∞[ zu liefern einen Wert in [a, b] liefert. 1

Die Schreibweise

R D

steht je nach der Form von D f¨ ur

R∞ Rb R∞ Rb , a , −∞ oder −∞ . a

A.4. Uneigentliche Integration

299

> restart; read("bsp_V.3.3"); > with(plots): > > f := lambda * exp(-lambda*t); > > F := int(f,t=0..x); > > assume(lambda>0); > int(f,t=0..infinity); 1 > > lambda := 3/2;

> > > > >

p1 := plot(f,t=0..3,y=0..lambda,color=blue): p2 := plot(F,x=0..3,y=0..1,color=red): p3 := plot(1,x=0..3,color=green,linestyle=dash): display([p1,p2,p3]);

> > lambda := 'lambda'; > > int(t*f,t=0..x);

> int(t^2*f,t=0..x);

> > assume(lambda>0); > m := int(t*f,t=0..infinity);

> int((t-m)^2*f,t=0..infinity); 1 >

Abbildung 4.1: Maple-Worksheet zur uneigentlichen Integration

A.5. Lineare Gleichungssysteme

300

Abbildung 4.2: Dichte der Exponentialfunktion mit einer Stammfunktion im Fall λ = 3/2

5

Lineare Gleichungssysteme

Wir setzen MAPLE zur L¨osung linearer Gleichungssysteme ein. Zun¨achst betrachten wir ein Gleichungssystem zu einer Koordinatentransformation im Vektorraum R3 , siehe Beispiel VI.7.9. Auch die polynomiale Interpolation f¨ uhrt auf lineare Gleichungssysteme, siehe Beispiel VI.7.10. Wir betrachten hier die Knoten ti = (i − 1)/4,

i = 1, . . . , 5,

und dementsprechend Polynomfunktionen vom Grad h¨ochstens 4. Wir arbeiten mit der Basis (u0 , . . . , u4 ) von Π4 , siehe Lemma VI.5.11, und berechnen f¨ ur y ∈ R5 die Polynomfunktion v ∈ Π4 mit (v(t1 ), . . . , v(t5 ))> = y. Die Vektoren y der Standardbasis von R5 f¨ uhren auf die sogenannte Lagrange-Basis von Π4 zu den gew¨ahlten Knoten ti , deren Berechnung hier durch Invertieren der Vandermonde-Matrix A geschieht. Anschließend betrachten wie die Interpolation der Sinus- und der Wurzelfunktion f an den Knoten ti sowie die zugeh¨origen Interpolationsfehler f − v, die sich in ihrer Gr¨oßenordnung stark unterscheiden. Im dritten Beispiel betrachten wir den von den Spalten von B ∈ R5×3 erzeugten Unterraum U ⊆ R5 . Gesucht ist ein homogenes lineares Gleichungssystem, dessen L¨osungsmenge der gegebene Unterraum U ist. Dazu wird eine Basis von L(B > , 0) berechnet und spaltenweise zu einer Matrix C ∈ R5×2 zusammengefaßt. Wie Bemerkung VI.7.13 zeigt, gilt L(A, 0) = U f¨ ur A = C > . Als Zwischenschritt ist das Ergebnis der Gauß-Elimination f¨ ur B > angegeben.

A.5. Lineare Gleichungssysteme

301

> restart; read ("bsp_VI.7.9"); > > A := Matrix([[-1,2,2],[-1,3,3],[-2,7,6]]);

> B := Matrix([[1,-1,-2],[2,-3,-7], [2,-3,-6]]);

> x := Vector([1,1,-1]);

> > v := MatrixVectorMultiply(A,x);

> > y := LinearSolve(B,v); (1)

Abbildung 5.1: Maple-Worksheet zur Koordinatentransformation

A.5. Lineare Gleichungssysteme

> restart; read("bsp_VI.7.10"); > > T := Vector([0,1/4,1/2,3/4,1]);

> A := VandermondeMatrix(T);

> > y := Vector([0,1,0,0,0]);

> x := LinearSolve(A,y);

>

302

A.5. Lineare Gleichungssysteme

> v := FromCoefficientVector(Vector(x),t);

> plot(v,t=0..1); > > B := MatrixInverse(A);

> > v1 := FromCoefficientVector(Column(B,1),t);

> v2 := FromCoefficientVector(Column(B,2),t);

> v3 := FromCoefficientVector(Column(B,3),t); > v4 := FromCoefficientVector(Column(B,4),t);

> v5 := FromCoefficientVector(Column(B,5),t);

> > plot([v1,v2,v3,v4,v5],t=0..1); > > f := sin; > y := map(f,T);

303

A.5. Lineare Gleichungssysteme

> y := map(evalf,y);

> x := LinearSolve(A,y);

> > v := FromCoefficientVector(Vector(x),t);

> plot([f(t),v],t=0..1); > plot(f(t)-v,t=0..1); > > f := sqrt; > y := map(f,T);

304

A.5. Lineare Gleichungssysteme

> y := map(evalf,y);

> x := LinearSolve(A,y);

> > v := FromCoefficientVector(Vector(x),t);

> plot([f(t),v],t=0..1); > plot(f(t)-v,t=0..1); >

Abbildung 5.2: Maple-Worksheet zur polynomialen Interpolation

305

A.5. Lineare Gleichungssysteme

Abbildung 5.3: Interpolationspolynom zu den Daten (0, 1, 0, 0, 0)>

Abbildung 5.4: Lagrange-Basis von Π4

306

A.5. Lineare Gleichungssysteme

Abbildung 5.5: Interpolation von f = sin

Abbildung 5.6: Interpolationsfehler f − v f¨ ur f = sin

307

A.5. Lineare Gleichungssysteme

Abbildung 5.7: Interpolation von f =

308

√ ·

Abbildung 5.8: Interpolationsfehler f − v f¨ ur f =

√ ·

A.5. Lineare Gleichungssysteme

309

> restart; read("bsp_VI.7.14"); > > B := Matrix([[1,1,3],[0,2,1],[1,0,1],[1,2,1],[1,0,1]]);

> B1 := Transpose(B);

> GaussianElimination(B1);

> > C := NullSpace(B1): > C := Matrix([C[1],C[2]]);

> A := Transpose(C); (1)

Abbildung 5.9: Maple-Worksheet zur Darstellung linearer Unterr¨aume

A.6. Eigenwerte

6

310

Eigenwerte

Wir illustrieren die Bestimmung von Eigenwerten und zugeh¨origen Eigenvektoren in den Schritten: Berechnung des charakterischen Polynoms, Berechnung der Nullstellen dieses Polynoms und Berechnung von Basen der entsprechenden Eigenr¨aume. Alternativ kommen die Befehle Eigenvalues“ und Eigenvectors“ zum Einsatz. ” ”

A.6. Eigenwerte

311

> restart; read("bsp_VII.2.15"); > > A := Matrix([[0,-1,1],[-3,-2,3],[-2,-2,3]]);

> P := - CharacteristicPolynomial(A,lambda); > P := factor(P); > solve(P=0,lambda); > NullSpace(A - IdentityMatrix(3));

> NullSpace(A + IdentityMatrix(3));

> > Eigenvalues(A);

> Eigenvectors(A);

(1)

Abbildung 6.1: Maple-Worksheet zur Berechnung von Eigenwerten und -r¨aumen

A.7. Taylor-Approximation in einer Variablen

312

> restart; read("bsp_VII.2.16"); > > A := Matrix([[-1,0,0],[0,0,-1],[0,1,0]]);

> P := -CharacteristicPolynomial(A,lambda); > P := factor(P); > > Eigenvalues(A);

> Eigenvectors(A); (1)

Abbildung 6.2: Maple-Worksheet zur Berechnung von Eigenwerten und -r¨aumen

7

Taylor-Approximation in einer Variablen

Wie in Beispiel IX.4.36 betrachten wir f (x) =



1 + x,

x > −1,

mit dem zugeh¨origen Taylor-Polynom T2 (f, 0)(x) = 1 + x/2 − x2 /8

x > −1,

der Ordnung zwei mit Entwicklungspunkt null. Es gilt f (3) (0) = 3/8. F¨ ur ε > 0 sei g(x) = (1/16 + ε) · x3 ,

x > −1.

Bemerkung IX.4.38 zeigt insbesondere folgende Restgliedabsch¨atzung: Es existiert δ > 0, so daß |f (x) − T2 (f, 0)(x)| ≤ |g(x)| f¨ ur alle x ∈ ]−δ, δ[.

A.7. Taylor-Approximation in einer Variablen

> restart; read("bsp_IX.4.36"); > > f := sqrt(1+x); > > n := 2; > > t := convert(taylor(f,x=0,n+1),polynom);

> r := f - t;

> > plot([f,t],x=-1..3); > plot([f,t],x=-0.5..0.5); > plot(r,x=-0.5..0.5); > > g := diff(f,x$(n+1));

> eps := 1/100;

> h := (abs(subs(x=0,g)/(n+1)!) + eps) * abs(x^(n+1));

> > plot([r,h,-h],x=-0.1..0.1); > plot([r,h,-h],x=-0.5..0.5); > plot([f,t+h,t-h],x=-0.2..0.2); > plot([f,t+h,t-h],x=-1..1); >

Abbildung 7.1: Maple-Worksheet zur Taylor-Approximation

313

A.7. Taylor-Approximation in einer Variablen

Abbildung 7.2: f und Taylor-Polynom T2 (f, 0)

Abbildung 7.3: Restglied R2 (f, 0) = f − T2 (f, 0)

314

A.7. Taylor-Approximation in einer Variablen

Abbildung 7.4: Restglied R2 (f, 0) und Schranken ±g

Abbildung 7.5: Restglied R2 (f, 0) und Schranken ±g

315

A.8. Richtungsableitungen und Stetigkeit

316

Abbildung 7.6: f sowie T2 (f, 0) ± g

8

Richtungsableitungen und Stetigkeit

F¨ ur f : R2 → R, gegeben durch ( f (x, y) =

xy 2 , x2 +y 4

falls (x, y) 6= 0,

0,

sonst,

gilt gem¨aß Beispiel X.1.22: f besitzt in null Ableitungen in alle Richtungen, ist aber dort unstetig. F¨ ur c, t ∈ R und g1 (t) = (t, c · t) gilt n¨amlich f (g1 (t)) =

c2 · t , 1 + c4 · t2

w¨ahrend f (g2 (t)) = √ f¨ ur c, t > 0 und g2 (t) = (t, c · t).

c 1 + c2

Da f (−x, y) = −f (x, y) und f (x, −y) = f (x, y) f¨ ur x, y ∈ R, zeigen wir der besseren ¨ Ubersichtlichkeit halber in Abbildung 8 den Graphen der Funktion ( 2 xy falls x · y > 0, 2 4, f (x, y) = x +y 0, sonst, zusammen mit den Kurven t 7→ (g1 (t), f (g1 (t)) f¨ ur c = 1 und c = 10 sowie t 7→ (g2 (t), f (g2 (t)) f¨ ur c = 1.

A.8. Richtungsableitungen und Stetigkeit

Abbildung 8.1: f mit drei ausgezeichneten Kurven

Abbildung 8.2: g1 f¨ ur c = 1 bzw. c = 10

317

A.9. Taylor-Approximation in zwei Variablen

318

Abbildung 9.1: f und Taylor-Polynom T0 (f, 0)

9

Taylor-Approximation in zwei Variablen

Die durch f (x1 , x2 ) = exp(x1 ) · sin(x2 ) definierte Funktion f : R2 → R ist beliebig oft stetig differenzierbar, und ihre TaylorPolynome bis zur Ordung zwei zum Entwicklungspunkt null sind gegeben durch T0 (f, 0)(ξ) = 0, T1 (f, 0)(ξ) = ξ2 , T2 (f, 0)(ξ) = ξ2 + ξ1 · ξ2 f¨ ur ξ ∈ R2 . Siehe Beispiel X.3.16. Wir zeigen neben diesen Funktionen auch den Graphen des Restgliedes R2 (f, 0) = f − T2 (f, 0) und verweisen auf Korollar X.3.18.

A.9. Taylor-Approximation in zwei Variablen

Abbildung 9.2: f und Taylor-Polynom T1 (f, 0)

Abbildung 9.3: f und Taylor-Polynom T2 (f, 0)

319

A.10. Lokale Extrema

320

Abbildung 9.4: Restglied R2 (f, 0)

10

Lokale Extrema

F¨ ur f : R2 → R, gegeben durch f (x, y) = x3 + y 3 − 3xy, gilt gem¨aß Beispiel X.3.29: Die Ableitung von f verschwindet genau in den Punkten (0, 0) und (1, 1), und nur (1, 1) ist ein lokales Extremum von f . Wir zeigen die H¨ohenlinien von f in zwei verschiedenen Ausschnitten. Die Hesse-Matrix



 0 −1 (Hf )(0, 0) = 3 · −1 0

von f an der Stelle null besitzt den Eigenvektor ξ1 = (1, 1)> zum Eigenwert λ1 = −3 und den Eigenvektor ξ2 = (−1, 1)> zum Eigenwert λ2 = 3. Wir zeigen deshalb den Graphen der Funktion f zusammen mit den Kurven t 7→ (t · ξ` , f (t · ξ` )) f¨ ur ` = 1, 2 wiederum in zwei Ausschnitten.

A.10. Lokale Extrema

321

Abbildung 10.1: H¨ohenlinien von f

Abbildung 10.2: f mit zwei ausgezeichneten Kurven

A.10. Lokale Extrema

322

Abbildung 10.3: H¨ohenlinien von f

Abbildung 10.4: f mit zwei ausgezeichneten Kurven

A.11. Lokale Extrema unter Nebenbedingungen

323

Abbildung 11.1: H¨ohenlinien von f und alle globalen Extrema von f |N

11

Lokale Extrema unter Nebenbedingungen

F¨ ur f : R2 → R, definiert durch f (x, y) = 4x2 − 3xy, und N = {(x, y) ∈ R2 : x2 + y 2 ≤ 1} gilt gem¨aß Beispiel X.4.22: Die globalen Maxima von f |N sind (3c, −c) und√(−3c, c), und die globalen Minima von f |N sind (c, 3c) und (−c, −3c), wobei c = 1/ 10. Wir zeigen in drei Ausschnitten die H¨ohenlinien von f , den Rand der Menge N und alle vier bzw. eines der globalen Extrema.

A.11. Lokale Extrema unter Nebenbedingungen

324

√ √ Abbildung 11.2: H¨ohenlinien von f und das globale Minumum (1/ 10, 3/ 10)

A.11. Lokale Extrema unter Nebenbedingungen

325

√ √ Abbildung 11.3: H¨ohenlinien von f und das globale Maximum (3/ 10, −1/ 10)

Literaturverzeichnis [AE] H. Amann, J. Escher, Analysis I, Birkh¨auser, Basel, 3. Auflage, 2006. [A] J. Appell, Analysis in Beispielen und Gegenbeispielen, Springer-Verlag, Berlin, 2009. [Fi] G. Fischer, Lineare Algebra, Vieweg+Teubner, Wiesbaden, 18. Auflage, 2014. [Fo1] O. Forster, Analysis 1, Springer Spektrum, Wiesbaden, 11. Auflage, 2013. [Fo2] O. Forster, Analysis 2, Springer Spektrum, Wiesbaden, 10. Auflage, 2013. [G] A. Gathmann, Grundlagen der Mathematik 1 und 2, Skript, Kaiserslautern, 2011/12. [GO] B. R. Gelbaum, J. M. H. Olmsted, Counterexamples in Analysis, Holden-Day, San Francisco, 1964. [H1] H. Heuser, Lehrbuch der Analysis, Teil 1, Vieweg+Teubner, Wiesbaden, 17. Auflage, 2009. [H2] H. Heuser, Lehrbuch der Analysis, Teil 2, Vieweg+Teubner, Wiesbaden, 14. Auflage, 2008. [K] K. K¨onigsberger, Analysis 2, Springer, Berlin, 5. Auflage, 2004. [SS] H. Schichl, R. Steinbauer, Einf¨ uhrung in das mathematische Arbeiten, Springer, Berlin, 2. Auflage, 2012. [S] R. Schindler, Logische Grundlagen der Mathematik, Springer, Berlin, 2009. [So] T. Sonar, 3000 Jahre Analysis, Springer, Berlin, 2011. [Z] H. Zieschang, Lineare Algebra und Geometrie, Teubner, Stuttgart, 1997.

[AE, Fi, Fo1, Fo2, SS, S, So] sind auch als e-books u ¨ber http://www.ub.uni-kl.de/dienstleistungen/e-books/ verf¨ ugbar; auf [G] besteht Zugriff u ¨ber http://www.mathematik.uni-kl.de/~gathmann/ 326

Definitionen Abbildung, siehe auch Funktion, 6 Addition, 18 bijektiv, 7 identisch, 8 injektiv, 7 konstant, 6 linear, 125 Multiplikation, 18 surjektiv, 7 Abbildungsnorm, 203 Ableitung, 80 h¨oherer Ordnung, 86 partiell, 221 total, 218 Abschluß, 55, 185 Absolutbetrag, siehe Betrag Abstand, 171 ¨ Aquivalenz, 1 ¨ Aquivalenzklasse, 10 ¨ Aquivalenzrelation, 10 Arcus-Cosinus, 78 Arcus-Cotangens, 79 Arcus-Sinus, 78 Arcus-Tangens, 79 Aussage, 1 Aussageform, 4 Auswahlaxiom, 9 b-adische Darstellung, 49 Banach-Raum, 191 Basis, 118 Bernoullische Ungleichung, 30 Ber¨ uhrpunkt, 55, 185 Beschr¨anktheit von Funktionen, 23, 187 von Mengen, 23, 187 Betrag im Komplexen, 72

in angeordnetem K¨orper, 21 Bild, 7, 128 Binomialkoeffizient, 28 binomische Formel, 29 Bisektionsverfahren, 66 Cauchy-Folge, 42, 190 charakteristische Funktion, siehe Indikatorfunktion charakteristisches Polynom, 160 Cosinus, 74 Cotangens, 79 Darstellungsmatrix, 132 De Morgansche Regeln, 2 Definitionsbereich, 6 Determinante, 152, 157 Diagonalisierbarkeit, 163, 164 orthogonal, 178 Diagonalmatrix, 163 Diffeomorphismus, 247 lokal, 248 Differenz, 5 Differenzierbarkeit, 80 mehrfach, 86 mehrfach partiell, 231 partiell, 221 stetig, 86, 219 stetig partiell, 223 total, 217 Dimension, 120, 129 direkte Summe, 165 disjunkte Mengen, 5 Disjunktion, 1 Divergenz, 35, 190 bestimmt, 42, 63, 64 Dreiecksungleichung, 22, 72, 170, 171, 256 umgekehrt, 22, 186 Durchschnitt, 5, 9 327

DEFINITIONEN Ebene, 120, 129 Eigenraum, 158 Eigenvektor, 158 Eigenwert, 158 Einheitsmatrix, 124 Einschr¨ankung, 6 Element, 3 Elementarmatrizen, 140 ε-Umgebung, 55 Erzeugendensystem, 118 euklidischer Vektorraum, 168 Eulersche Formel, 74 Eulersche Zahl, 52 Exponentialfunktion, 52 zur Basis a, 71 Exponentialreihe im Komplexen, 73 im Reellen, 52 Extremum, 87, 237 Fakult¨at, 28 Familie, 8 fast u ¨berall, 273 Fehlstand, 150 Feinheit, 100 Fixpunkt, 240 Fl¨acheninhalt, 102 Folge, 8 Fortsetzung, 7 trivial, 254 freie Variable, 4 Frobenius-Norm, 229 Funktion, siehe auch Abbildung, 6 affin-linear, 82 implizit definiert, 241 konkav, 91 konvex, 91 Lebesgue-integrierbar, 259 Riemann-integrierbar, 96 Gamma-Funktion, 110 ganze Zahlen, 3, 26 Gebiet, 228 geometrische Summe, 27 Gerade, 120, 129 Gleichheit

328 von Funktionen, 6 von Mengen, 3 von Paaren, 5 Gleichm¨achtigkeit, 32 Grad, siehe Polynomfunktion Gradient, 227 Graph, 6 Grenzwert, 35, 46, 63, 64, 190, 216 gr¨oßer, 20 gr¨oßer gleich, 10, 20 Gruppe, 13 kommutativ, 13 H¨aufungspunkt, 56 H¨aufungswert, 44 Halbnorm, 256 Hauptraum, 167 Heron-Verfahren, 40 Hesse-Matrix, 237 Hilbert-Raum, 191 H¨ ullreihe, 257 imagin¨are Einheit, 72 Imagin¨arteil, 72 Implikation, 1 indefinit, 238 Indexmenge, 8 Indikatorfunktion, 33 Induktionsanfang, 27 Induktionsannahme, 27 Induktionsschluß, 27 Infimum, 59 Innenproduktraum, 168 innerer Punkt, 55, 184 Inneres, 55, 184 inneres Produkt, siehe Skalarprodukt Integral, 95, 255 unbestimmt, 103 uneigentlich, 107 Intervall, 59 kompakt, 44 Randpunkt, 54 Intervallschachtelung, 44 inverses Element, 15 invertierbar, 136 Isomorphie, 125

DEFINITIONEN Isomorphismus linear, 125 Jordansche Normalform, 167 kanonische Basis, siehe Standardbasis kartesisches Produkt, 5, 9 Kern, 128 kleiner, 20 kleiner gleich, 10, 20 K¨orper, 17 angeordnet, 20 archimedisch, 33 vollst¨andig, 42, 191 Komplement, 185 komplexe Zahlen, 71 Komponentenfunktionen, 195 Komposition, 7 konjugiert komplexe Zahl, 72 Konjunktion, 1 Kontraktion, 240 Kontraposition, 2 Konvergenz, 35, 190 gleichm¨aßig, 203 punktweise, 203 Koordinaten, 128 Koordinatenabbildungen, 195 Koordinatensystem, 128 k-te Wurzel, 43 Kugel abgeschlossen, 186 Mittelpunkt, 184, 186 offen, 184 Radius, 184, 186 L1 -Halbnorm, 257 Lagrange-Multiplikatoren, 249 Lebesgue-Integral, 263, 264 Lebesgue-Maß, 266 leere Abbildung, 6 leere Menge, 5 Limes inferior, 60 Limes superior, 60 lineare Abbildung orthogonal, 176 positiv definit, 181

329 selbstadjungiert, 179 unit¨ar, 176 lineare Abh¨angigkeit, 116, 117 lineare H¨ ulle, siehe erzeugter Unterraum lineare Unabh¨angigkeit, 116, 117 linearer Teilraum, siehe Unterraum lineares Gleichungssystem, 143 (in)homogen, 143 L¨osungsmenge, 143 Linearkombination, 114 Lipschitz-Konstante, 194 Lipschitz-Stetigkeit, 194 Logarithmusfunktion, 70 M¨achtigkeit, 31 Matrix, 121 ¨ahnlich, 157 ¨aquivalent, 138 hermitesch, 180 inverse, 137 Koeffizient, 121 positiv definit, 181 Spalte, 121 symmetrisch, 180 transponiert, 139 Zeile, 122 Matrixprodukt, 123 Maximum, 21, 57 global, 87, 237 lokal, 86, 237 streng, 87, 237 Menge, 3 abgeschlossen, 56, 185 abz¨ahlbar, 32 abz¨ahlbar unendlich, 32 dicht, 263 endlich, 30 induktiv, 24 integrierbar, 266 kompakt, 59, 197 konvex, 228 offen, 56, 184 u ¨berabz¨ahlbar, 32 unendlich, 30 Metrik, 171

DEFINITIONEN induziert, 171 metrischer Raum, 171 Minimum, 21, 58 global, 87, 237 lokal, 86, 237 streng, 87, 237 Mittelpunktregel, 102 Mittelwert, 100 Monom, 134 Monotonie, 40, 68, 69 Nachfolgerfunktion, 25 nat¨ urliche Zahlen, 3, 26 Negation, 1 negativ, 20 negativ definit, 238 Negativteil, 99 neutrales Element, 15 nicht-negativ, 20 nicht-positiv, 20 Norm, 170 ¨aquivalent, 188 induziert, 170 normierter Raum, 170 Nullfolge, 36 Nullmenge, 91, 272 Nullstelle, 162 Vielfachheit, 162 Oberintegral, 96 ¨ offene Uberdeckung, 197 Ordnung partiell, 10 total, 10 orthogonal, 172 orthogonale Matrix, 177 orthogonale Projektion, 175 orthogonales Komplement, 173 orthonormal, 172 Orthonormalbasis, 172 Partialsumme, 46 Partition, 11 Pascalsches Dreieck, 28 Peano-Axiome, 26 Periodizit¨at, 77

330 Permutation, 14 (un)gerade, 151 Permutationsgruppe, 14 Polardarstellung, 78 Polarkoordinaten, 78 Polygonzug, 228 Polynomfunktion, 62 Grad, 135, 235 Linearfaktoren, 162 multivariat, 235 positiv, 20 Positivteil, 99 Potenz, 27, 30 Potenzmenge, 32 Potenzreihe Konvergenzgebiet, 209 Konvergenzradius, 209 Summenfunktion, 209 Produktmetrik, 191 Quader beschr¨ankt, 253 Quadratwurzel, 43 Quantor, 4 Quotientenvektorraum, 148 Rand, 187 Rang lineare Abbildung, 128 Matrix, 122 rationale Funktion, 62 rationale Zahlen, 3 Realteil, 72 reelle Zahlen, 43 Reihe, 46 absolut konvergent, 48 alternierend harmonisch, 48 geometrisch, 46 harmonisch, 48 konvergent, 46 rekursive Definition, 26 Relation, 9 antisymmetrisch, 10 reflexiv, 10 symmetrisch, 10 transitiv, 10

DEFINITIONEN Restriktion, 6 Richtungsableitung, 220 Riemann-Integral, 96 Schranke, 23 Sinus, 74 Skalar, 111 Skalarprodukt, 168 Stammfunktion, 103 Standardbasis, 118 Stetigkeit, 61, 193 gleichm¨aßig, 67, 200 Supremum, 57 Supremumsnorm, 188 symmetrische Gruppe, 14 Tangens, 78 Tangente, 82 Taylor-Polynom, 212, 235 Taylor-Reihe, 214 Teilfolge, 44, 198 Teilmenge, 3 echt, 3 Tensorprodukt, 278 Transformationsmatrix, 137 Translation, 129 Transposition, 150 Treppenfunktion, 68, 254 Tupel, 9 Umgebung, 184 Umkehrabbildung, 8 unit¨arer Vektorraum, 168 unitare Matrix, 177 Untergruppe, 15 erzeugt, 16 Unterintegral, 96 Unterraum, 113 affin, 129 endlich-dimensional, 129 unendlich-dimensional, 129 erzeugt, 114 Urbild, 7 Vektor, 111 ¨aquivalent, 147 Vektorraum, 111

331 endlich erzeugt, 118 endlich-dimensional, 120 unendlich-dimensional, 120 Verbindungsstrecke, 228 Vereinigung, 5, 9 Verkn¨ upfung, 13 assoziativ, 13 distributiv, 17 induziert, 13 kommutativ, 13 vollst¨andige Induktion, 26 Volumen Quader, 253 Vorzeichen, 151 Wertebereich, 6 Winkel, 171 Wurzel, 43 Zeilenraum, 122 Zeilenstufenform, 122 Zeilenumformung, 122 Zerlegung, 68 Zwischenpunktsystem, 100

Symbolverzeichnis Vektorr¨ aume und lineare Abbildungen Kn VM span(W ) L(v1 , . . . , vn ) dim V K m×n A> ZR(A) rang A En FA ΦA ker F Im F rang F u + V0 dim X L(V, W ) MA B (F ) K Πn Gl(n, K) A−1 TBA L(A, b) V /U

Vektorraum der n-Tupel von Elementen aus dem K¨orper K, 112 Vektorraum der Abbildungen von M in den Vektorraum V , 112 von W erzeugter Unterraum, 114 Unterraum der Linearkombinationen von v1 , . . . , vn , 114 Dimension des Vektorraums V , 120 Vektorraum der m × n Matrizen u ¨ber dem K¨orper K, 121 Transponierte der Matrix A, 121 und 139 Zeilenraum der Matrix A, 122 Rang der Matrix A, 122 n × n-Einheitsmatrix, 124 Linksmultiplikation mit der Matrix A, 125 durch die Basis A bestimmtes Koordinatensystem, 128 Kern der linearen Abbildung F , 128 Bild der linearen Abbildung F , 128 Rang der linearen Abbildung F , 128 Translation von V0 um u, 129 Dimension des affinen Unterraums X, 129 Vektorraum der linearen Abbildungen des Vektorraums V in den Vektorraum W , 130 Darstellungsmatrix der linearen Abbildung F bzgl. der Basen A und B, 132 K¨orper R oder K¨orper C, 134 Vektorraum der Polynomfunktionen vom Grad h¨ochstens n bzw. Π−1 = {0}, 134 Gruppe der invertierbaren n × n-Matrizen u ¨ber dem K¨orper K, 136 inverse Matrix zu A, 137 Transformationsmatrix des Basiswechsels von A nach B, 137 L¨osungsmenge des linearen Gleichungssystems Ax = b, 143 Quotientenvektorraum von V nach U , 148

332

SYMBOLVERZEICHNIS

333

Determinanten und Eigenwerte Sn sign(σ) det(A) MA (F ) det(F ) Eig(F, λ) σ(F ) Eig(A, λ) σ(A) PA PF µ(P, λ) diag(λ1 , . . . , λn ) Lk `=1 W`

symmetrische Gruppe von {1, . . . , n}, 150 Vorzeichen der Permutation σ, 151 Determinante der Matrix A, 155 Darstellungsmatrix der linearen Abbildung F bzgl. der Basen A und A, 157 Determinante der linearen Abbildung F , 157 Eigenraum der linearen Abbildung F bzgl. λ, 158 Menge der Eigenwerte der linearen Abbildung F , 158 Eigenraum der Matrix A bzgl. λ, 158 Menge der Eigenwerte der Matrix A, 158 charakteristisches Polynom der Matrix A, 159 charakteristisches Polynom der linearen Abbildung F , 160 Vielfachheit der Nullstelle λ der Polynomfunktion P , 162 Diagonalmatrix mit den Diagonalelementen λ1 , . . . , λn , 163 direkte Summe der Unterr¨aume W1 , . . . , Wk , 165

Euklidische und unit¨ are Vektorr¨ aume hv, wi A kvk d(x, y) ](v, w) v⊥w U⊥

Skalarprodukt von v und w, 168 konjugiert-komplexe Matrix zu A, 169 Norm von v, 170 Abstand zwischen x und y (bzgl. der Metrik d), 171 Winkel zwischen v und w, 171 Orthogonalit¨at von v und w, 172 orthogonales Komplement von U , 173

SYMBOLVERZEICHNIS

334

Metrische und normierte R¨ aume kxk2 Br (x) ˚ Y O(X, d) Y Yc B r (x) ∂Y B(M, V ) kf k∞ limn xn C(X, Y ) kf k r(c, a) B(c, a) I(a, x) Tn (f, a)

2-Norm von x, 183 offene Kugel mit Radius r um Mittelpunkt x, 184 Inneres von Y , 184 Menge der offenen Teilmengen von (X, d), kurz O, 184 Abschluß von Y , 185 Komplement von Y , 185 abgeschlossene Kugel mit Radius r um Mittelpunkt x, 186 Rand von Y 187 Raum der beschr¨ankten Abbildungen von M nach V , 188 Supremumsnorm von f , 188 Grenzwert der Folge (xn )n , 190 Menge der stetigen Funktionen von X nach Y , 193 Abbildungsnorm von f , 203 Konvergenzradius der Potenzreihe mit Koeffizientenfolge c und Entwicklungspunkt a, 209 Konvergenzgebiet der Potenzreihe mit Koeffizientenfolge c und Entwicklungspunkt a, 209 Intervall mit den Randpunkten a und x, 212 Taylor-Polynom der Ordnung n von f mit Entwicklungspunkt a, 212

SYMBOLVERZEICHNIS

335

Differenzierbare Abbildungen in mehreren Variablen limy→x g(y) (Df )(x) Df (∂ν f )(x) (∂j f )(x) ∂j f I(x, y) P (x0 , . . . , xk ) kAkF C k (D) C ∞ (D) |α| f (α) α! xα Πk,n Tk (f, a) (Hf )(x)

Grenzwert von g in x, 217 Ableitung von f in x, 218 Ableitung von f , 219 Richtungsableitung von f in x in Richtung ν, 220 j-te partielle Ableitung von f in x, 221 j-te partielle Ableitung von f , 223 Verbindungsstrecke von x und y, 228 Polygonzug durch x0 , . . . , xk , 228 Frobenius-Norm von A, 229 Raum der k-mal stetig partiell differenzierbaren reellwertigen Funktionen auf D, 231 Raum der beliebig oft stetig partiell differenzierbaren reellwertigen Funktionen auf D, 231 Ordnung von α, 233 partielle Ableitung von f in Multiindex-Notation, 233 α1 ! · · · αn !, 233 xα1 1 · · · xαnn , 233 Vektorraum der Polynomfunktionen vom Grad h¨ochstens k in n reellen Variablen, bzw. Π−1,n = {0}, 235 Taylor-Polynom der Ordnung k von f mit Entwicklungspunkt a, 234 Hesse-Matrix von f in x, 237

Integrierbare Funktionen in mehreren Variablen Qn λn (Q) T (Rn ) fR |A f dλn kvk H(Rn ) kf k1 L1 (D) R n R f dλ n f dλ A I(Rn )

Menge der beschr¨ankten Quader in Rn , 253 (n-dimensionales) Volumen von Q, 253 Raum der Treppenfunktionen von Rn nach R, 254 triviale Fortsetzung von f |A auf Rn , 254 Integral von f , 255 (auch) Halbnorm von v, 256 Raum der Funktionen von Rn nach R mit einer H¨ ullreihe, 257 L1 -Halbnorm von f , 257 Raum der Lebesgue-integrierbaren Funktionen von D nach R, 259 Lebesgue-Integral von f , 263 Lebesgue-Integral von f u ¨ber A, 263 Menge der integrierbaren Teilmengen von Rn , 266