Mathematische Methoden der Physik Wintersemester 2013/14 Karl-Henning Rehren
Die Vorlesung soll mit den mathematischen Ideen vertraut machen, die vielen Methoden zur L¨osung von Problemen der fortgeschrittenen Physik zugrundeliegen. Es sollen Verbindungen aufgezeigt werden, die – etwa durch Wechsel der Betrachtungsweise – neue L¨osungswege erschließen. Dabei liegt das Schwergewicht auf der praktischen Verwendbarkeit und der Bereitstellung der wichtigsten S¨atze, auch auf dem Aufzeigen von m¨oglichen Fallstricken, aber weniger auf der letzten mathematischen Exaktheit mit vollst¨andigen Beweisen. Insbesondere ist das Skript kein Lehrbuch! Das folgende Inhaltsverzeichnis ist vorl¨aufig (wahrscheinlich eher zu umfangreich).
Inhaltsverzeichnis 0 Vorbemerkungen 0.1 Literaturvorschl¨age . . . . . . . . . . . . . . . . . . . . . . . . . .
2 4
1 Konvergenz 1.1 Konvergenz in Funktionenr¨aumen . . . . . . . . . . . . . . . . . . 1.2 Potenzreihen, Taylor-Reihe . . . . . . . . . . . . . . . . . . . . . . 1.3 Der Banach’sche Fixpunktsatz . . . . . . . . . . . . . . . . . . . .
5 5 10 12
2 Gew¨ ohnliche Differentialgleichungen ¨ 2.1 Ubersicht, Motivation und Erinnerung . . . . 2.2 Existenz und Eindeutigkeit von L¨osungen . . . 2.3 Lineare Differentialgleichungen . . . . . . . . . 2.4 Randwertprobleme, Eigenwerte, Quantisierung
. . . .
13 13 14 16 21
. . . .
25 25 28 31 36
3 Fourier-Analyse 3.1 Fourier-Reihe . . . . . 3.2 Unit¨are R¨aume . . . . 3.3 Fourier-Integral . . . . 3.4 Oszillierende Integrale
. . . .
. . . .
. . . .
. . . .
. . . . 1
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
2
4 Theorie komplex-analytischer Funktionen 4.1 Komplexe Differenzierbarkeit, Analytizit¨at 4.2 Komplexe Integration . . . . . . . . . . . . 4.3 Analytizit¨at und Fourier-Transformation . 4.4 Analytische Fortsetzung . . . . . . . . . . 4.5 Laplace- und inverse Laplace-Trafo . . . .
. . . . .
38 38 39 43 44 45
5 Distributionen 5.1 Die δ-Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Distributionen als lineare Funktionale . . . . . . . . . . . . . . . .
46 46 47
6 Partielle Differentialgleichungen der Physik 6.1 Lineare PDGn erster Ordnung . . . . . . . . . . . . . . . . 6.2 Lineare PDGn zweiter Ordnung . . . . . . . . . . . . . . . 6.2.1 Laplace- und Poisson-Gleichung (elliptische PDGn) 6.2.2 Wellengleichung (hyperbolische PDG) . . . . . . . . 6.2.3 Diffusionsgleichung (parabolische PDG) . . . . . . .
. . . . .
53 53 54 56 59 63
. . . . . . . .
65 65 69 71 73 75 75 78 78
7 Funktionalanalysis 7.1 Zust¨ande . . . . . . . . . . . . . . 7.2 Operatoren . . . . . . . . . . . . 7.3 Hilbertr¨aume . . . . . . . . . . . 7.4 Tensorprodukt . . . . . . . . . . . 7.5 Operatoren auf Hilbertr¨aumen . . 7.5.1 Beschr¨ankte Operatoren . 7.5.2 Unbeschr¨ankte Operatoren 7.5.3 Der adjungierte Operator
0
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
. . . . . . . .
. . . . .
. . . . .
. . . . . . . .
Vorbemerkungen
“Mathematische Physik” ist ein weites Feld. Mathematik braucht man an allen Ecken und Enden der Physik: Allein schon die Mechanik braucht Vektoren, Ableitungen und Integrale, Differentialgleichungen, komplexe Zahlen und Matrizen. H¨ohere Physik braucht auch h¨ohere Mathematik: Systeme mit N Freiheitsgraden brauchen statt des R3 den RN . Beispielsweise kann N ≈ 1023 sein: dann ist es sinnvoller, gleich von unendlich-dimensionalen Vektorr¨aumen zu sprechen. Ein solcher ist zB der Konfigurationsraum im Kontinuumslimes N → ∞. In der Quantenphysik wird die mechanische Idealisierung eines Punktteilchens durch Wellenfunktionen und Felder ersetzt, die ebenfalls als Elemente eines unendlichdimensionalen Vektorraums zu verstehen sind. Ein großer Teil dieser Vorlesung
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
3
befasst sich mit unendlich-dimensionalen Vektorr¨aumen (deren Elemente typi¨ scherweise Funktionen sind), und mit der Ubertragung bekannter Methoden der endlich-dimensionalen Analysis und linearen Algebra. Ein Paradebeispiel ist die elastische Saite: statt von den Auslenkungen (A1 , . . . , AN ) von N Atomen l¨angs der Saite zu sprechen, ist es zweckm¨aßig, den Zustand der Saite durch eine Amplitudenfunktion A(x) zu beschreiben, die die Auslenkung desjenigen Atoms angibt, das im Ruhezustand an der Stelle x s¨aße. Die resultierende Wellengleichung f¨ ur die Dynamik der Auslenkung A(x, t): ∂t2 A(x, t) = c2 ∂x2 A(x, t) hat unendlich viele L¨osungen, zB die Wellen A(x, t) = A0 sin(kx − ωt − ϕ0 ) mit ¨ beliebigen k, ω = ±ck und beliebigen A0 , ϕ0 ; sowie beliebige Uberlagerungen (Schwebungen, Wellenpakete) dieser speziellen L¨osungen. An diesem Beispiel kann man auch andere Ziele dieser Vorlesung veranschaulichen: Fourier-Theorie befasst sich mit der Frage, wie man eine beliebige Ampli¨ tudenfunktion A(x) als Uberlagerung von den ebenen Wellen, die gewissermaßen eine Basis des L¨osungsraums bilden, darstellen kann. Oft trifft man auf ¨ahnlich gelagerte Probleme: man hat eine Klasse von speziellen Funktionen, und m¨ochte eine beliebige Funktion durch eine Linearkombination der speziellen Funktionen ausdr¨ ucken. Beispielsweise ist die Taylor-Entwicklung der Versuch, eine komplizierte Funktion durch Polynome zu approximieren. Hier stellt sich sofort die Frage, was “approximieren” eigentlich heißt. Wann ist eine Funktion eigentlich “nahe bei” einer anderen Funktion? Daher werden wir uns auch mit den verschiedenen Konvergenzbegriffen befassen m¨ ussen. Das ist etwa f¨ ur die Frage nach der Existenz von L¨osungen von Differentialgleichungen wichtig. Wenn man mit ebenen Wellen arbeitet, merkt man schnell, dass es viel einfacher ist, die komplexen Zahlen zu verwenden: sin x und cos x kann man immer durch eix und e−ix ausdr¨ ucken, und umgekehrt; beide Bescheibungen sind daher austauschbar, aber die komplexe Methode ist meistens u ¨bersichtlicher. Die Funktionentheorie (Theorie der analytischen Funktionen in einer komplexen Variablen) stellt weitere sehr n¨ utzliche Eigenschaften von komplexen Zahlen bereit. Die Differentiation einer Funktion ist ein Beispiel f¨ ur eine lineare Operation, die eine Funktion in eine andere u berf¨ u hrt, a hnlich wie eine Matrix eine lineare ¨ ¨ Abbildung von Vektoren ist. Wir werden Operatoren auf unendlichdimensionalen Vektorr¨aumen kennenlernen und untersuchen, inwieweit sie dieselben Eigenschaften haben wie Matrizen im endlichdimensionalen Fall. Die Wellengleichung ist ein Prototyp einer linearen partiellen Differentialgleichung. Solche Gleichungen finden sich u ¨berall in der Physik: Maxwell-Gleichungen, W¨armeleitungsgleichung, Quantenmechanik, . . . . Der L¨osungsraum ist meistens ein unendlichdimensionaler Vektorraum. Wir werden allgemeine und spezifische Methoden der Behandlung solcher Gleichungen kennenlernen. Zumindest als technisches Hilfsmittel ist dabei ist auch der Begriff der “Distribution” n¨ utzlich: Die Theorie der Distributionen (oder auch “verallgemeinerte Funktionen”) erlaubt es
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
4
beispielsweise, “nichtdifferenzierbare Funktionen zu differenzieren”. Sie erlaubt es auch, einen Differentialoperator, wie etwa den Wellenoperator ∂t2 − c2 ∂x2 zu “invertieren”, um damit die inhomogene Wellengleichung zu l¨osen. Die unendlichdimensionalen Vektorr¨aume in dieser Vorlesung sind zwar (fast) alle als R¨aume von Funktionen gegeben; es gibt unter ihnen jedoch sehr viele verschiedene: zB die Polynome, die stetigen Funktionen, die analytischen Funktionen, die glatten Funktionen, die quadratintegrablen Funktionen. Die entsprechenden Vektorr¨aume besitzen sehr unterschiedliche Eigenschaften: manche sind vollst¨andig im Sinne der Konvergenz von Funktionen; manche besitzen eine Basis; manche sind sogar Algebren; etc; und andere wiederum besitzen diese Eigenschaften nicht. Entsprechend werden auch die verf¨ ugbaren mathematischen Methoden jeweils sehr unterschiedlich sein.
0.1
Literaturvorschl¨ age
• ∗∗ H. Fischer, H. Kaul: Mathematik f¨ ur Physiker (Band 1 und 2, Teubner Studienb¨ ucher), u ¨bersichtlich, “enzyklop¨adisch”, nur die n¨otigsten Beweise, viele physikalische Anwendungen. • ∗∗ R. W¨ ust: H¨ohere Mathematik f¨ ur Physiker (Teil 2, de Gruyter Lehrbuch), vielseitig, Integration, Funktionentheorie, aber nur elementare partielle DGln (ca 50 EUR). • ∗∗ H. Triebel: Analysis und mathematische Physik (Birkh¨auser), sehr umfassend (Physik und Mathematik), viele Fakten, kaum Beweise (ca 30 EUR). • ∗ H. Heuser: Lehrbuch der Analysis (Band 1+2, Teubner), gut lesbar, aber im Stoffumfang eher “Maphy 1”. • W. Fischer, I. Lieb: nur Funktionentheorie (vieweg studium) (ca 30 EUR).
• S. Grossmann: Mathematischer Einf¨ uhrungskurs f¨ ur die Physik (Teubner Studienbuch), Vektoranalysis und gew. DGln, elementar (ca 30 EUR).
• S. Grossmann: Funktionalanalysis (Aula Studien-Text), anspruchsvoll, geht u ¨ber diese Vorlesung hinaus (ca 20 EUR). • M. Reed, B. Simon: Methods of Modern Mathematical Physics I+II (+III+IV) (Acad. Press), f¨ ur anspruchsvolle mathematische PhysikerInnen “was f¨ ur’s Leben” (ca 120 EUR). • Ein Handbuch wie zB I.N. Bronstein et al: Taschenbuch der Mathematik (ca 30 EUR) sollte jeder besitzen. • zum Nachschlagen von Definitionen etc.: Wikipedia, mathepedia • n¨ utzliches Computeralgebra-Programm: Xmaple (CIP!)
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
1
5
Konvergenz
Erinnerung: Approximation von Zahlen durch Folgen Eine Folge von Zahlen (xn )n∈N konvergiert gegen einen Grenzwert x, wenn es f¨ ur jedes noch so kleine ε > 0 ein N gibt, sodass jenseits von N alle Folgenglieder xn (n > N ) weniger als ε von dem Grenzwert entfernt sind: |xn − x| < ε. Bemerkungen: (1) Eine Folge besitzt h¨ochstens einen Grenzwert. (2) Wichtig f¨ ur “Konvergenz” ist die Existenz eines Abstandsbegriffes, hier |x−y|. (3) Wenn man zB nur die rationalen Zahlen kennt, kann man die reellen Zahlen ¨ als Aquivalenzklassen von Cauchy-Folgen definieren: Eine Folge ist eine CF, wenn es f¨ ur jedes ε > 0 ein N gibt, sodass jenseits von N je zwei Folgenglieder sich um weniger als ε unterscheiden: |xn − xm | < ε f¨ ur alle n, m > N . Zwei CF sind ¨aquivalent, wenn ihre Differenz gegen Null konvergiert. zB bilden die abgebrochen Dezimaldarstellungen einer reellen Zahl eine (von vielen) rationalen Cauchy-Folgen, die dieselbe reelle Zahl approximieren. Gewissermaßen “f¨ ullen diese Konstruktion die L¨ ucken”, die die Konvergenz rationaler Folgen gegen rationale Zahlen verhindern. Dieselbe Art von “Abschluss” und dessen physikalische Relevanz werden wir auch bei unendlich-dimensionalen Vektorr¨aumen kennenlernen.
1.1
Konvergenz in Funktionenr¨ aumen
Norm, Topologie In der Physik muss man h¨aufig approximieren, weil eine exakte L¨osung nicht m¨oglich ist; etwa der zeitliche Verlauf einer Bewegung ~r(t). Man versucht dann, eine Funktion f (x) durch leichter zu berechnende Fn fn (x) zu approximieren, sodass fn mit wachsendem n immer n¨aher an die gesuchte Fn f herankommt. Was heißt das aber: zwei Funktionen f und g sind “nahe beieinander”? Wann ist eine Fn “groß” oder “klein”? Was heißt “fn konvergiert gegen f ”? Sinnvollerweise ist f “nahe bei” g, wenn die Differenz f − g “klein” ist. Ebenso sollte 2f “doppelt so groß” sein wie f . Offenbar verwenden wir hier, dass man Funktionen addieren und vervielf¨altigen kann. MaW: Funktionen bilden unendlich-dimensionale Vektorr¨ aume (mit punktweiser Addition). Auch Folgen bilden einen unendlich-dim VR (mit elementweiser Addition). Je nachdem, ob man Linearkombinationen mit reellen oder mit komplexen Koeffizienten erlauben will, spricht man von einem reellen oder komplexen VR. Es gibt zahllose ∞-dim Vektorr¨aume, zB die Polynome, die stetigen Funktionen, die Funktionen mit kompaktem Tr¨ager1 , die periodischen Funktionen; die unendlichen Folgen, die Nullfolgen (limn |xn | = 0), die abbrechenden Folgen, jeweils reell oder komplex, oder auch Folgen von Vektoren ~xn ∈ R3 , . . . 1
Der Tr¨ ager einer Funktion ist der Abschluss der Menge der Punkte x, bei denen f (x) 6= 0. “Kompakter Tr¨ ager” einer Fn auf R bedeutet, dass f außerhalb eines Intervalls verschwindet.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
6
Um Konvergenz (von Approximationen) untersuchen zu k¨onnen, ben¨otigt man eine “Topologie”, dh einen Abstandsbegriff. Eine Norm ist eine Abbildung f 7→ ||f || auf einem Vektorraum V mit Werten in R+ mit den Eigenschaften: • positiv-definit: ||f || ≥ 0; und ||f || = 0 ⇒ f = 0 • multiplikativ: ||λf || = |λ| · ||f || • Dreiecks-Ungleichung: ||f + g|| ≤ ||f || + ||g||. Ein normierter Vektorraum ist ein (reeller oder komplexer) VR mit einer Norm. Er ist dann ein topologischer Raum mit dem Abstand d(f, g) := ||f − g||. Es gibt daf¨ ur viele verschiedene Optionen. F¨ ur Funktionen f : R → C (oder f : R → R) sind die wichtigsten: • die Supremumsnorm R ||f ||∞ = supx∈R |f (x)|, • die L1 -Norm ||f ||1 = R dx |f (x)|, und 1 R • die L2 -Norm ||f ||2 = R dx |f (x)|2 2 . 1 R (Es gibt Lp -Normen ||f ||p = R dx |f (x)|p p f¨ ur alle p > 0.) Die qualitativen Unterschiede zwischen den drei angegeben Normen erkennt man am Beispiel einer Kastenfunktion f (x) = H falls 0 < x < B, sonst = 0. Die Sup-Norm “sieht” nur die H¨ohe ||f ||∞ = H; die beiden anderen √ gewichten auch die Breite in unterschiedlichem Maße: ||f ||1 = BH, ||f ||2 = BH. Analog f¨ ur Folgen (zn )n∈N : • die Supremumsnorm ||(znP )n∈N ||∞ = supn∈N |zn |, 1 • die L -Norm ||(zn )n∈N ||1 = n∈N |zn |, und 1 P 2 2 • die L2 -Norm ||(zn )n∈N ||2 = |z | . n n∈N
Nat¨ urlich sind diese Normen immer nur in solchen VR anwendbar, in denen sie definiert sind, zB die Sup-Normen nur auf beschr¨ankten Fn oder Folgen; Fn oder Folgen mit endlicher L1 -Norm (L2 -Norm) heißen “absolut-integrierbar” bzw “-summierbar” (“quadrat-integrierbar” bzw “-summierbar”). Die Polynome besitzen keine dieser Eigenschaften; sie lassen sich aber mit den Normen 1 R R 2 2 2 supx∈R e−x |f (x)| oder R dx e−x |f (x)| oder R dx e−x |f (x)|2 2 ausstatten, oder mit einer der obigen Normen f¨ ur die Folge der Koeffizienten des Polynoms. Entsprechend gibt es viele verschiedene Konvergenz-Begriffe: Eine Folge von Funktionen (fn )n∈N konvergiert gegen eine Funktion f . . . (1) punktweise, wenn f¨ ur jedes x ∈ R die Folge von Zahlen (fn (x))n∈N gegen f (x) konvergiert. (2) gleichm¨ aßig, wenn ||fn − f ||∞ gegen Null konvergiert. (3) im L1 -Sinne, wenn ||fn − f ||1 gegen Null konvergiert. (4) im L2 -Sinne, wenn ||fn − f ||2 gegen Null konvergiert. (Analog f¨ ur Folgen von Folgen.)
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
7
Wir vergleichen diese Konvergenzbegriffe anhand von verschiedenen Folgen von Funktionen, die alle nur unterschiedliche Streckungen, Stauchungen und Ver1 schiebungen der Lorentz-Funktion 1+x 2 sind: 1 (a) fn (x) = n(1+x n3 2) (e) f (x) = n 4 +x2 n n 1 2 (b) fn (x) = 1+nx 2 oder fn (x) = 1+n6 x2 (f) fn (x) = n4n+x2 n (c) fn (x) = 1+n3 x2 1 (g) fn (x) = 1+(x−n) 2. (d) fn (x) = 1+nn2 x2 Die folgende Tabelle gibt an, ob diese Funktionen im Sinne von (1)–(4) gegen Null konvergieren: (a) (b) (c) (d) (e) (f) (g) (1) punktweise ja nein nein nein ja ja ja (2) gleichm¨aßig ja nein nein nein ja ja nein ja ja ja nein nein nein nein (3) L1 (4) L2 ja ja nein nein nein ja nein In den Zeilen (2), (3), und (4) kommt fast jede Kombination vor. Auch die fehlende Kombination “(2) nein, (3) nein, (4) ja” l¨asst sich realisieren, etwa durch die Summe der Funktionen (b) und (f); nur die Kombination “(2) ja, (3) ja, (4) nein” gibt es nicht: diese drei Konvergenzbegriffe sind also fast komplett unabh¨angig voneinander. Dagegen folgt aus gleichm¨aßiger Konvergenz (2) immer auch die punktweise Konvergenz (1), aber nicht umgekehrt. Bemerkenswert sind die Eintr¨age (b),(c) in den Zeilen (3),(4): obwohl die Funktionswerte fn (0) sogar gegen ∞ divergieren, k¨onnen die Folgen im L1 - oder L2 -Sinne konvergieren, wenn nur gleichzeitig die Breite schnell genug klein wird.
Keiner dieser Konvergenzbegriffe ist tauglich f¨ ur Approximationen wie ex ≈ 2 1+x+ x2 +. . . , dh, die Approximation von Funktionen durch Polynome. Denn alle nicht-konstanten Polynome sind unbeschr¨ankt. (Zur Taylor-Reihe → Kap. 1.2.) Man kann aber alle diese Konvergenzbegriffe auch f¨ ur Teilmengen von R, etwa Intervalle definieren, indem man u ¨berall x ∈ R durch x ∈ I ersetzt. Dann kann auch eine abgebrochene Taylor-Reihe eine gute Approximation sein: je nach Gr¨oße des Intervalls und gew¨ unschter Genauigkeit kann man die TR nach wenigen Termen abbrechen, und erh¨alt ggf sogar gleichm¨aßige Konvergenz in I. Ob unsere Beispielfolgen gegen Null konvergieren, h¨angt dann von dem Intervall I ab: zB konvergieren die Funktionen (b) gleichm¨aßig im Intervall [1, 2], aber nicht im Intervall [−1, 1], und bei manchen der L1 - und L2 -Konvergenzen h¨angt es davon ¨ ab, ob das Intervall endlich ist oder nicht (Ubung: warum? Finden Sie Beispiele!). Ebenso kann man auch R durch Rn ersetzen, also die Konvergenz von Funktionen f : Rn → C in mehreren Variablen studieren. Wir schreiben B(X) und C(X) f¨ ur die beschr¨ankten bzw die stetigen Funktionen auf einer Teilmenge X ⊂ Rn , C∞ (X) f¨ ur die beschr¨ankten stetigen Funkn tionen, C0 (R ) f¨ ur die beschr¨ankten stetigen Funktionen mit lim|x|→∞ = 0, und C00 (X) f¨ ur die stetigen Funktionen mit kompaktem Tr¨ager (falls X selber kompakt ist, dann ist nat¨ urlich C∞ (X) = C(X) = C00 (X)).
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
8
Jede der Normen || · ||∞ , || · ||1 , || · ||2 ist auf C00 (R) definiert. Damit erh¨alt C00 (R) verschiedene Strukturen als normierter Raum. Der jeweilige Abstand d(f, g) = ||f − g||(·) definiert eine Topologie auf dem Vektorraum. Wie wir gesehen haben, h¨angt die Antwort auf die Frage, ob eine Folge von Funktionen konvergiert, von der Wahl der Topologie ab. Vollst¨ andigkeit Ein normierter Vektorraum V ist vollst¨ andig, wenn jede Cauchy-Folge in V einen Grenzwert in V besitzt. Einen vollst¨andigen nVR bezeichnet man auch als Banachraum. B(R), C(R) und C0 (R) sind bez¨ uglich der Supremumsnorm vollst¨andig (man nehme den punktweisen Grenzwert). Dagegen ist C00 (R) mit keiner der Topologien (1)–(4) vollst¨andig. Man kann insbesondere in den L1 - und L2 -Topologien unstetige Funktionen durch stetige Funktionen approximieren. Dies ist zB dann von physikalischem Interesse, wenn man sich nicht so sehr f¨ ur die Werte einer Funktion an einzelnen Stellen, als vielmehr f¨ ur den Verlauf als Ganzen interessiert: so ist bei den Schwingungsmoden einer Saite die Amplitude A(x) an einer bestimmten Stelle x viel weniger interessant als etwa die Anzahl der Schwingungsknoten, also die Wellenzahl. Unstetige Funktionen beschreiben physikalische Idealisierungen, etwa Wellenfronten oder Phasen¨ uberg¨ange. (Mehr dazu → Kap. 3.) Weitere Beispiele: Der VR der stetigen Funktionen R → C mit Tr¨ager in einem festen Intervall uglich R ist bzgl der Sup-Norm || · ||∞ vollst¨andig, aber bez¨ der Norm || · ||22 = |f (x)|2 dx nicht vollst¨andig. Denn man kann leicht CauchyFolgen (bzgl || · ||2 ) von stetigen approximativen Stufenfunktionen angeben, zB fn (x) = 1 + tanh(n(x2 − 1)), aber ihr Limes (2χ[−1,1] ) ist unstetig. C und CN (N ∈ N) sind automatisch vollst¨andig bzgl allen p-Normen (p > 0) XN 1/p ||z||p := |zn |p . n=1
F¨ ur N = ∞ erh¨altP man die Vektorr¨aume ℓp aller komplexen Folgen z = (zn )n∈N , f¨ ur die die Summe n |zn |p (und damit die p-Norm) endlich ist (“p-summierbar”). Alle ℓp sind vollst¨andig in ihrer jeweiligen Norm, und der Limes einer Cauchy(N ) Folge (z (N ) )N ∈N in ℓp ist der komponentenweise Limes z = (limN →∞ zk )k∈N . Es gilt aber zB ℓ1 ⊂ ℓ2 , wobei ℓ1 in der Norm || · ||2 nicht vollst¨andig ist.
Um zu verstehen, welche Art von Funktionen man in einer gegebenen Topologie approximieren kann, ist der folgende Sachverhalt n¨ utzlich: Man kann einen normierten Vektorraum immer vervollst¨andigen, also erg¨anzen um weitere Elemente so dass jede Cauchy-Folge konvergiert, analog zur Vervollst¨andigung der rationalen Zahlen zu den reellen Zahlen. zB ist C0 (R) der Abschluss von C00 (R) unter der Supremums-Norm || · ||∞ . Satz 1.1: Sei V ein normierter Vektorraum. Dann gibt es einen eindeutigen vollst¨andigen normierten Vektorraum V und eine isometrische lineare Abbildung (“Einbettung”) ϕ : V → V , sodass ϕ(V ) in V dicht liegt.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
9
“Isometrisch” bedeutet ||ϕ(v)|| = ||v||. “Dicht” bedeutet, dass jedes Element von V Grenzwert einer Folge in dem Unterraum ϕ(V ) ist, dh durch Elemente des urspr¨ unglichen Vektorraumes approximiert werden kann. “Eindeutig” bedeutet, dass es f¨ ur jeden anderen Raum W mit denselben Eigenschaften eine lineare isometrische Bijektion zwischen W und V gibt, die die eingebetteten Elemente von V miteinander identifiziert. W und V sind also strukturell ununterscheidbar, auch wenn sie mglw unterschiedlich realisiert sind. Der Beweis von Satz 1.1 ist konstruktiv, aber reichlich abstrakt. Die Idee besteht darin, das “asymptotisches Verhalten von Cauchy-Folgen” als Element von V zu betrachten, wobei verschiedene CF dasselbe asymptotische Verhalten haben k¨onnen. F¨ ur zwei Cauchy-Folgen in V definiert man ||(fn )n − (gn )n || := limn ||fn − gn ||. Dies ist zun¨achst keine Norm, weil ||(fn )n − (gn )n || Null sein kann, ohne dass (fn )n = (gn )n w¨are. In diesem Fall kommen sich aber die beiden Cauchy-Folgen asymptotisch immer n¨aher. Man u ¨berzeugt sich, dass die Eigen¨ schaft ||(fn )n − (gn )n || = 0 eine Aquivalenzrelation ist. Definitionsgem¨aß ist V ¨ die Menge aller Aquivalenzklassen [(fn )n ]. V ist ein Vektorraum mit α[(fn )n ] + β[(gn )n ] := [(αfn + βgn )n ], und V ist normiert mit ||[(fn )n ]|| := ||(fn )n ||. Auf diese Weise geh¨ort jede CF mit ||(fn )n || = 0 zu derselben Klasse wie die konstante Folge (0)n , und repr¨asentiert den Null-Vektor in V . Die Einbettung ϕ von V in V erfolgt zB durch die konstanten Folgen: ϕ(f ) := [(f )n ]. Ist [(fn )n ] ein Element von V , so ist (ϕ(fn ))n eine Cauchy-Folge in ϕ(V ) mit Grenzwert [(fn )n ]. (Alle diese Aussagen sind eigentlich nur Anwendungen der Dreiecks-Ungleichung der Norm.) Der schwierigste Teil der Konstruktion ist der Nachweis, dass V vollst¨andig ist, und wird hier weggelassen, ebenso wie die Eindeutigkeit. In vielen F¨allen gibt es auch eine einfache konkrete Realisierung der Vervollst¨andigung. zB kann man den Vektorraum V der nach endlich vielen Folgengliedern abbrechenden Folgen mit jeder der obigen p-Normen ausstatten. Die zugeh¨orige Vervollst¨andigung ist dann jeweils der Banachraum ℓp . Insbesondere ist V ein gemeinsamer dichter UR aller ℓp . Im Falle der Supremums-Topologie besteht die Vervollst¨andigung eines Raumes stetiger Funktionen immer aus stetigen Funktionen, zB C00 (R) = C0 (R). Im Falle der L1 - und L2 -Topologien kann man auch unstetige Funktionen durch Folgen von stetigen Funktionen approximieren (zB Stufenfunktionen); allerdings ist der Grenzwert als Funktion nicht immer eindeutig bestimmt: Dieselbe CF kann gegen zwei verschiedene Funktionen f und g konvergieren, wenn sich diese an h¨ochstens abz¨ahlbar vielen Stellen unterscheiden. (Typische Situation: f und g sind an einer Stelle unstetig, wobei die eine an der Unstetigkeitsstelle den “oberen” Wert hat, die andere den “unteren”.) Das spiegelt die Tatsache wider, dass Integrale sich nicht ¨andern, wenn man die Funktion an einzelnen Stellen ab¨andert. In der Topologie des vervollst¨andigten Raumes ist dann ||f − g|| = 0, also repr¨asentieren f und g in V denselben Vektor (vgl 7.3), obwohl es verschiedene Fn sind.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
1.2
10
Potenzreihen, Taylor-Reihe
Bei der Approximation einer Funktion durch eine Taylor-Reihe sind die relevanten Vergleichsgr¨oßen nicht die Funktionswerte an verschiedenen Stellen, wie im vorigen Abschnitt, sondern vielmehr die Ableitungen der Funktionen an einer festen Stelle x0 . (Wir w¨ahlen hier oBdA immer x0 = 0.) Man versucht also, zu einer gegebenen Funktion f (x) eine Folge von Polynomen fn n-ter Ordnung (“TaylorPolynome”) zu finden, die mit f (x) in allen Ableitungen f (k) (0) ≡ (∂ k f )(0) (k = 0, . . . , n) u ¨bereinstimmt. Ein Polynom ist immer von der Form Xn P (x) = ak x k , k=0
und dabei ist
1 (k) P (0). k! ¨ Die Bedingung der Ubereinstimmung der ersten n Ableitungen mit denen einer gegebenen Funktion f legt damit die Taylor-Polynome fn fest: ak =
fn (x) =
Xn
k=0
ak x k
mit ak =
1 (k) f (0). k!
Nat¨ urlich ist diese Konstruktion nur m¨oglich, wenn die Funktion f wenigstens n-mal stetig differenzierbar ist. Die Fragen, die sich stellen, sind: (1) Konvergiert die Taylor-Reihe, dh, die Folge der Polynome fn (x), wenn wir n → ∞ gehen lassen, punktweise gegen irgendeine Funktion? Und wenn ja: (2) Stimmt die resultierende Limes-Funktion fTaylor (x) =
X∞
k=0
ak x k
mit ak =
1 (k) f (0) k!
mit der urspr¨ unglichen Funktion f u ¨berein? Die Antwort auf (2) ist sicherlich “nein” in allen F¨allen, in denen die Funktion f außerhalb einer Umgebung von x = 0 “per Hand” abgewandelt wird, etwa cos x, falls |x| < π2 f (x) = ; denn die Ableitungen bei x = 0 merken nichts von 0 sonst der Abwandlung. Es gibt aber auch Funktionen, die nicht von dieser Art sind, 2 und trotzdem nichts mit ihrer Taylor-Reihe zu tun haben. Beispiel: f (x) = e−1/x . Alle Ableitungen dieser Funktion bei x = 0 sind Null. Also ist die Taylor-Reihe identisch = 0. Um zu verstehen, was hier passiert, betrachten wir zun¨achst (formale) Potenzreihen, also Ausdr¨ ucke der Art X∞ ak x k k=0
(mit beliebigen Koeffizienten ak ). F¨ ur welche x konvergiert diese Reihe?
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
11
Man definiert anhand der Folge der Koeffizienten ak zun¨achst die Gr¨oßen bn := supk≥n |ak |1/k . Sie bilden eine nichtnegative, monoton fallende Folge von Zahlen, die auch ∞ sein k¨onnen. Dann setzt man −1 r := lim bn . n→∞
Falls dieser Limes nicht existiert, weil alle bn = ∞ sind, dann setzt man r := 0. Falls der Limes Null ist, setzt man r := ∞. Dann kann man die Folgenglieder absch¨atzen durch C · |xk |/rk , wobei C eine Konstante ist. Es gilt der Satz 1.2: F¨ ur alle x mit |x| < r konvergiert die Potenzreihe absolut. F¨ ur |x| > r divergiert die Reihe. Die Gr¨oße r nennt man den Konvergenzradius der Reihe.
Wenn die Koeffizienten also ungef¨ahr exponentiell ak ∼ B k anwachsen (oder kleiner werden), dann konvergieren P die bn gegen B, und der Konvergenzradius ist k 1/B. Bsp: die geometrische Reihe ∞ k=0 x , ak = 1, B = 1, r = 1, konvergiert ¨ gegen − x) fallsP |x| < 1. Ahnlich: ak = kB k , bn = n1/n B → B. Tats¨achlich ist P∞ 1/(1 ∞ k 2 k k k=0 (Bx) = x∂x 1/(1−Bx) = Bx/(1−Bx) , falls |x| < 1/B. k=0 kB x = x∂x Ein Beispiel f¨ ur eine Potenzreihe mit Konvergenzradius ∞ ist die Exponenti1/k 1 alreihe (ak ≈ k ): sie konvergiert gegen ex f¨ ur alle x. Ein Beispiel f¨ ur r = 0 ist P∞ 1/k k ≈ k. Diese Reihe konvergiert u ¨berhaupt nur mit x = 0. k=0 k!x mit ak Der Restterm der Taylor-Reihe Wir kommen zu der obigen Frage (2) zur¨ uck: wie groß ist der “Restterm”
Rn (x) ≡ f (x) − fn (x), P also der Fehler der Taylor-Approximation fn (x) = nk=0 gibt der
f (k) (0) k x ? k!
Eine Antwort
Satz 1.3 (Taylor): Wenn die Funktion f in einer Umgebung U von x = 0 wenigstens (n + 1)-mal stetig differenzierbar ist, dann gibt es f¨ ur jedes x ∈ U eine (von n und x abh¨angende) Stelle y zwischen 0 und x, sodass der Restterm gegeben ist durch f (n+1) (y) n+1 ·x . Rn (x) = (n + 1)! Korollar: Wenn f (n+1) in einer Umgebung U von 0 beschr¨ankt ist: |f (n+1) (x)| < Cn Cn f¨ ur x ∈ U , dann ist der Restterm |Rn (x)| < (n+1)! |x|n+1 f¨ ur x ∈ U . Offenbar konvergiert die Taylor-Reihe (fn (x))n∈N genau dann gegen f (x), wenn der Restterm mit n → ∞ gegen Null geht. Dank dem Korollar ist das zB dann der Fall, wenn Cn nicht von n abh¨angt, oder wenn die n-ten Ableitungen von f (x) in der N¨ahe von x = 0 nicht zu schnell mit n anwachsen und x klein genug ist. Die Konvergenz ist innerhalb des Konvergenzradius punktweise, aber ¨ in der Regel nicht gleichm¨aßig (Beispiel zur Ubung: geometrische Reihe).
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
12
Funktionen, die f¨ ur alle x innerhalb eines Intervalls mit ihrer TR um irgendeinen Punkt des Intervalls u ¨bereinstimmen, heißen “(reell-)analytisch”. Um also zu wissen, ob man eine Funktion durch ihre TR ersetzen darf, muss man wissen, welche Funktionen analytisch sind. Dazu geh¨oren trivialerweise alle Polynome, und sicher auch alle Funktionen, die als Potenzreihen definiert sind, wie die Exponential- und trigonometrischen Funktionen, aber auch rationale Funktionen wie 1/(1 − x), die f¨ ur kleine x mit der geometrischen Reihe u ¨bereinstimmt. Satz 1.4: Die Ableitung einer reell-analytischen Fn ist reell-analytisch. Eine reell-analytische Fn besitzt eine reell-analytische Stammfunktion. Summe und Produkt zweier in demselben Intervall reell-analytischen Fn sind wieder reellanalytisch. Ist f (x) bei x = 0 reell-analytisch, und liegt f (0) im Analytizit¨atsintervall von g, dann ist g ◦ f in einer Umgebung von x = 0 reell-analytisch. Hiermit kennt man bereits so viele analytische Funktionen, dass die TaylorEntwicklung ziemlich universell einsetzbar ist. zB ist die Funktion 1/ 1− 12 sin(1+ √ ex + 1 + e2x ) bei x = 0 analytisch. Der Konvergenzradius ist dadurch bestimmt, √ ¨ dass der KR von 1 + y gleich 1 ist, also muss e2x kleiner als 3 sein (Ubung: 2x 2x warum “3”?? Tipp: e = 1+(e −1)). Innerhalb des Analytizit¨atsintervalls wird der Restterm mit wachsendem n gegen Null konvergieren. (Man weiß allerdings nicht apriori, wie schnell die Konvergenz ist, also wieviele Terme man f¨ ur eine zuverl¨assige Approximation mitnehmen sollte.)
1.3
Der Banach’sche Fixpunktsatz
. . . kontrolliert gewisse systematische Approximationsverfahren in unendlichdimensionalen Vektorr¨aumen, zB → Kap. 2.2. Eine (nicht notwendig lineare) Funktion T : V → V ist eine Kontraktion, wenn es eine Konstante C < 1 gibt, sodass f¨ ur alle f, g ||T (f ) − T (g)|| ≤ C · ||f − g|| ist. Eine Kn verringert also den Abstand mindestens um den Faktor C. Es gilt Satz 1.5 (Banach’scher Fixpunktsatz): Sei B ein vollst¨andiger normierter Raum, und T : B → B eine Kontraktion. Dann gibt es ein eindeutiges Element f ∈ B sodass T (f ) = f . Beweis: Die Eindeutigkeit ist wegen der Kontraktionseigenschaft offensichtlich. F¨ ur die Existenz muss man zeigen, dass die rekursive Definition fn+1 := T (fn ) eine Cauchy-Folge liefert, wobei man mit einem beliebigen f0 ∈ V anfangen kann. Dann existiert n¨amlich dank der Vollst¨andigkeit ein Grenzwert, und dieser ist automatisch ein Fixpunkt. Zum Beweis Pn2 −1 der Cauchy-Eigenschaft sch¨atzt man ab (oBdA n1 < n2 ): ||fn1 − fn2 || ≤ k=n1 ||fk+1 − fk || dank der DreiecksPn2 −1 k ungleichung, und ≤ k=n1 C ||f1 − f0 || dank der Kontraktionseigenschaft. Diese Summe ist als Teilsumme einer geometrischen Reihe ≤ C n1 /(1−C)·||a0 ||, was mit n2 > n1 > N beliebig klein gemacht werden kann. Hieraus folgt die Behauptung.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
2 2.1
13
Gew¨ ohnliche Differentialgleichungen ¨ Ubersicht, Motivation und Erinnerung
Eine gew¨ohnliche Differentialgleichung ist eine funktionale Abh¨angigkeit zwischen einer (gesuchten) Funktion und ihren Ableitungen. Die h¨ochste vorkommende Ableitung nennt man die Ordnung der DGl. L¨ost man sie nach der h¨ochsten Ableitung auf, so nimmt etwa eine DGl der dritten Ordnung die Form an: y ′′′ = F (y, y ′ , y ′′ , x)
(2.1)
mit irgendeiner vorgegebenen Abh¨angigkeit F . Bei mehreren gesuchten Funktionen yi (x) (und entsprechend ebenso vielen Fi ) spricht man von Systemen von gekoppelten DGln; bei mehreren (gemeinsamen) Variablen, also yi = yi (x1 , . . . , xn ) von partiellen DGln: Prototyp einer gew¨ohnlichen DGl: Newton’sche Bewegungsgleichung m ~r¨ = F~ (~r, ~r˙, t).
(2.2)
Prototyp einer partiellen DGl: Wellen-Gleichung ∂t2 A(~x, t) = c2 ∆ A(~x, t).
(2.3)
¨ Schematische Uberlegung f¨ ur gew¨ohnliche DGln (hier: Newton): ~r(t0 ) und ~v (t0 ) bestimmen u ¨ber die BG die Beschleunigung zum Zeitpunkt t0 . Dann ergibt ~v (t0 + δt) ≈ ~v (t0 ) + δt · ~a(t0 ) und ~r(t0 + δt) ≈ ~r(t0 ) + δt · ~v (t0 ) Ort und Geschwindigkeit zu einem um δt sp¨ateren Zeitpunkt. Aus diesen Werten bestimmt man wieder die Beschleunigung zur Zeit t+δt, und so weiter. Man erh¨alt so ~r(t) zu allen Zeitpunkten. Dieses Argument verwendet N¨aherungen, die bei großen Zeitschritten unzuverl¨assig sind; im Limes infinitesimal kleiner Zeitschritte sollte die Aussage jedoch exakt werden. Satz 2.2 gibt an, unter welchen (zum Gl¨ uck sehr schwachen) Voraussetzungen der Limes existiert. In der Praxis wird man DGln aber nicht auf diese Art l¨osen. Die Kunst des L¨osens von Differentialgleichungen besteht darin, sie auf “elementare Integrationen” zur¨ uckzuf¨ uhren, dh, das Auffinden von Stammfunktionen. Dies ist nicht immer systematisch m¨oglich. Einige Standard-Techniken, die Sie bereits kennen und beherrschen sollten: – Separation der Variablen bei gew¨ohnlichen DGln erster Ordnung. – Ausnutzen von Erhaltungss¨atzen zur Reduzierung der Ordnung der DGl. – Substitution der Unbekannten y, zB w = 1 + y ′2 in y ′′ = f (x)(1 + y ′2 )/y ′ . – Exponentialansatz f¨ ur lineare DGln mit konstanten Koeffizienten.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
2.2
14
Existenz und Eindeutigkeit von L¨ osungen
Satz 2.1: Jedes System von N Differentialgleichungen n-ter Ordnung ist ¨aquivalent zu einem System von N · n DGln erster Ordnung. ~ x) + ~x˙ × B(~ ~ x)) ⇔ ~x˙ = ~v und m~v˙ = q(E(~ ~ x) + ~v × B(~ ~ x)). Bsp: m~x¨ = q(E(~ ′ Beweis: OBdA N = 1. Man setze y2 := y ′ , y3 := y2′ , . . . yn := yn−1 . (Also ist (k−1) ′ yk = y .) Zusammen mit yn = F (y, y2 , . . . , yn ) sind dies n DGln 1. Ordnung, a¨quivalent zu der DGl y (n) = F (y, y ′ , . . . , y (n−1) ). Analog f¨ ur N > 1. Wir betrachten also ein System von DGln erster Ordnung y1′ = F1 (y1 (x), . . . , yn (x); x), ... ⇔ y ′ (x) = F (y(x); x). (2.4) ′ yn = Fn (y1 (x), . . . , yn (x); x)
Die DGl (2.4) soll mit dem Anfangswert y(x0 ) = y 0 gel¨ost werden. Ein approximatives L¨osungsverfahren ist das Folgende. Man “r¨at” als nullte Approximation irgendeine Funktion, die der Anfangsbedingung gen¨ ugt, etwa die konstante Funktion y (0) (x) = y 0 . Diese setzt man in die rechte Seite der DGl ein und l¨ost die DGl y ′(1) (x) = F (y (0) (x); x) durch direkte Integration: y (1) (x) = y 0 +
Z
x
x0
dt F (y (0) (t); t).
Das ergibt die erste Approximation y (1) . Durch Iteration des Verfahrens: y ′(n+1) (x) = F (y (n) (x); x), erh¨alt man eine Folge von Approximationen. Die Frage ist, ob diese gegen eine exakte L¨osung der DGl konvergieren. Der Beweis der Konvergenz der Iteration ist unter relativ schwachen Voraussetzungen an die Funktionen F m¨oglich: Satz 2.2 (Picard-Lindelo ¨f ): Die Funktionen Fi (y; x) seien in einer Umgebung I eines Anfangspunktes x = x0 stetig bzgl x, und Lipschitz-stetig bzgl y ∈ RN . Dann gibt es eine Umgebung I ′ ⊂ I von x0 , in der die DGln (2.4) mit den Anfangsbedingungen y(x0 ) = y 0 f¨ ur x ∈ I ′ eine eindeutige L¨osung besitzen. Lipschitz-Stetigkeit ist eine Absch¨atzung |F (y, x) − F (w, x)| ≤ K · |y − w| f¨ ur alle x ∈ I und y, w ∈ RN mit einer Konstanten K. Sie ist st¨arker als Stetigkeit, √ da sie etwa F (y) = 3 y und “schnell oszillierende” Funktionen wie y sin(1/y) (bei y0 = 0) ausschließt, aber schw¨acher als stetige Differenzierbarkeit, da sie etwa F (y) = |y| zul¨asst.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
15
√ Die Funktion F (y) = 3 y ist nicht Lipschitz-stetig. Tats¨achlich hat die DGl √ y ′ = 32 3 y mit y0 = 0 zwei L¨osungen: y(x) = x3/2 und y(x) = 0. Der Grund ist, dass F (y) bei y = 0 beliebig steil ist, sodass y ′ in der infinitesimalen Umgebung von x = 0 “beliebig sensibel” von y abh¨angt. Zum Beweis verwenden wir den Banach’schen Fixpunkt-Satz (Satz 1.5), wobei die Bedingung der Lipschitz-Stetigkeit die Kontraktions-Eigenschaft sicherstellt. Beweis des Satzes 2.2 (oBdA N = 1): Wir betrachten die Abbildung T : f 7→ T f , gegeben durch Z x
(T f )(x) := y0 +
dtF (f (t); t).
x0
Es ist klar, dass T f die eindeutige Stammfunktion von F (f (x); x) mit dem geforderten Anfangswert ist: (T f )′ (x) = F (f (x); x),
T f (x0 ) = y0 .
Die oben beschriebene Iterationsvorschrift y(n+1) ′ (x) = F (y(n) (x); x) zur L¨osung der DGl y ′ = F (y; x) ist also nichts anderes als die wiederholte Anwendung der Abbildung T auf irgendeine nullte Approximation y(0) , die der Anfangsbedingung gen¨ ugt. Die gesuchte L¨osung der DGl ist ein Fixpunkt: T y = y. Um Satz 1.5 (Existenz eines Fixpunktes) anwenden zu k¨onnen, sch¨atzen wir f¨ ur beliebige stetige Funktionen f und g ab: Z x Z x dt|f (t) − g(t)| dt|F (f (t); t) − F (g(t); t)| ≤ K · |T f (x) − T g(x)| ≤ x0
x0
dank der Lipschitz-Eigenschaft von F . Weil |f (t) − g(t)| ≤ ||f − g||∞ , k¨onnen wir weiter absch¨atzen: |T f (x) − T g(x)| ≤ K|x − x0 |||f − g||∞ . Damit ist auch ||T f − T g||∞ ≤ K|x − x0 |||f − g||∞ .
W¨ahlen wir das abgeschlossene Intervall I ′ ⊂ I so klein, dass K|x−x0 | ≤ 21 f¨ ur x ∈ ′ ′ I , so erf¨ ullt die Iterationsabbildung T innerhalb von I die Bedingung des Satzes 1.5 bez¨ uglich der Sup-Norm. Der Raum V = C(I ′ ) der stetigen Funktionen in I ′ ist aber vollst¨andig bzgl || · ||∞ , also sagt uns Satz 1.5, dass es einen eindeutigen Fixpunkt gibt. Dieser ergibt sich als Limes der Iteration der Abbildung T . Also gibt es eine L¨osung der DGl, sie ist eindeutig, und man erh¨alt sie mit dem beschriebenen Iterationsverfahren (mit gleichm¨aßiger Konvergenz in I ′ .) Das Existenzintervall I ′ in Satz 2.2 ist offenbar von der Gr¨oßenordnung 1/K. Durch Zusammensetzen von eindeutigen L¨osungen in sich u ¨berlappenden Intervallen der Gr¨oße 1/K erh¨alt man dann auch Eindeutigkeit in gr¨oßeren Intervallen. Eine Variante des Satzes fordert Lipschitz-Stetigkeit nur in einer Teilmenge U ⊂ RN . Man muss dann aber zus¨atzlich verlangen, dass die iterierten L¨osungen diese Teilmenge nicht verlassen. Das wird zB dadurch erreicht, dass man verlangt, dass |F | in U beschr¨ankt ist, und das Existenzgebiet ggf noch weiter verkleinert, sodass das Integral in der Formel f¨ ur T f klein bleibt, und damit auch T f innerhalb U bleibt.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
16
Bsp: Die DGl y ′ = F (y) = y 2 mit Anfangswert y(0) = 1/a (l¨osbar mit Separation der Variablen). F ist Lipschitz-stetig bzgl y innerhalb eines Intervalles U = [−L, +L], mit K = 2L. Unabh¨angig von der Gr¨oße von L h¨ort die L¨osung y(x) = 1/(a − x) aber schon bei x = a auf zu existieren. Denn wenn x sich dem Wert a n¨ahert, w¨achst F (y) u ¨ber alle Grenzen. Die Forderung, dass y die Umgebung U nicht verlassen darf, erzwingt also, dass das Existenzgebiet nicht bis an x = a heranreichen kann.
2.3
Lineare Differentialgleichungen
Lineare DGln sind von dem Typ Df (x) = g(x)
(2.5)
D = an (x)∂xn + an−1 (x)∂xn−1 + · · · + a1 (x)∂x + a0 (x)
(2.6)
wobei ein (linearer) Differentialoperator ist. Die Funktion g(x) ist gegeben, die Funktion f (x) ist gesucht. Falls g = 0, nennt man die DGl homogen, anderenfalls inhomogen. Man sieht sofort, dass D(αf1 + βf2 ) = αDf1 + βDf2 gilt (α, β ∈ R oder C: Linearit¨at von D). Die folgenden S¨atze sind elementare Schlussfolgerungen aus dieser Beobachtung. Satz 2.3: Jede Linearkombination von L¨osungen einer homogenen linearen DGl ist wieder eine L¨osung. Satz 2.4: Sind f1 und f2 L¨osungen derselben inhomogenen linearen DGl, dann ist f1 − f2 L¨osung der zugeh¨origen homogenen DGl. Sind fi L¨osungen von Dfi = gi , so ist f = αf1 + βf2 L¨osung von Df = g mit g = αg1 + βg2 . Satz 2.5: Die allgemeine L¨osung einer inhomogenen DGl Df = g ist f (x) = h(x) + f0 (x) wobei h die allgemeine L¨osung der zugeh¨origen homogenen DGl Dh = 0, und f0 irgendeine L¨osung der inhomogenen DGl (“Partikularl¨osung”) ist. Weniger offensichtlich ist Satz 2.6: Die allgemeine Lsg einer homogenen DGl n-ter Ordnung Dh = 0 ist h(x) = α1 h1 (x) + · · · + αn hn (x) wobei hi n linear unabh¨angige L¨osungen und αi freie Parameter sind. Dieser Satz folgt aus der Existenz und Eindeutigkeit von L¨osungen (Kap. 2.2): (i−1) zB k¨onnen hi die (eindeutigen) L¨osungen mit den Anfangswerten hi (x0 ) = 1
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
17
(j−1)
(x0 ) = 0 sein; dann sind offenbar f¨ ur die allgemeine L¨osung und alle anderen hi die Koeffizienten αi mit den Anfangswerten h(i−1) (x0 ) gleichzusetzen. Weitere L¨osungen kann es wegen der Eindeutigkeit nicht geben. Jedes andere System von n linear unabh¨angigen L¨osungen besteht dann aus n linear unabh¨angigen Linearkombinationen dieser speziellen hi , dh, die Koeffizienten αi transformieren sich wie die Komponenten von Vektoren beim Basiswechsel in einem endlichdimensionalen Vektorraum. Einige L¨osungsverfahren: Allgemeine lineare DGln erster Ordnung Die homogene DGl a1 (x)h′ (x) + a0 (x)h(x) = 0 l¨asst sich durch Trennung der Variablen l¨osen. Eine Partikularl¨osung einer inhomogenen DGl a1 (x)f ′ (x) + a0 (x)f (x) = g(x) erh¨alt man mit der Methode der Variation der Konstanten: Ansatz f (x) = λ(x) h(x)
(2.7)
in die inhomogene DGl a1 (x)f ′ (x) + a0 (x)f (x) = g(x) einsetzen, wobei h(x) irgendeine vorher bestimmte L¨osung der homogenen DGl ist. Dies f¨ uhrt auf λ′ (x) =
g(x) . a1 (x)h(x)
was im Prinzip durch Integration gel¨ost werden kann. Homogene lineare DGln mit konstanten Koeffizienten (bel. Ordn.) Prototypen: harmonischer Oszillator mit linearer Reibung m¨ x = −Rx˙ − kx, elektrischer Schwingkreis ¨ + RI(t) ˙ + I(t) = 0, LI(t) C
oder gekoppelte Schwingung m1 x¨1 = −k1 x1 − κ(x1 − x2 ), m2 x¨2 = −k2 x2 − κ(x2 − x1 ). Allgemeine Form (n-te Ordnung, N gekoppelte Gr¨oßen) n X
Mi f (i) (x) = 0,
i=0
wobei Mi N × N Matrizen sind, und f (i) die i-ten Ableitungen.
(2.8)
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
18
Solche Gleichungen kann man stets mit einem Exponential-Ansatz l¨osen: f (x) = A · eλx ,
λ =?, A =?
(2.9)
Setzt man den Exp-Ansatz in die DGl ein, so “verwandeln” sich die Ableitungen in Faktoren: f (i) = λi · A · eλx , und es bleibt das lineare System n X i=0
λ i Mi A = 0
(2.10)
zu l¨osen. Anders ausgedr¨ uckt: der “Amplitudenvektor” A ist ein Eigenvektor der P Matrix M (λ) = ni=0 λi Mi zum Eigenwert 0. Dass eine Matrix einen Eigenwert Null hat, ist aber ¨aquivalent dazu, dass ihre Determinante verschwindet: det M (λ) = 0.
(2.11)
Diese S¨ akular-Gleichung ist eine Bestimmungsgleichung f¨ ur die gesuchten Werte von λ: Jedes Matrixelement von M (λ) ist ein Polynom der Ordnung n in λ, und die Determinante ein Polynom der Ordnung N in den Matrixelementen, also ist die S¨akulargleichung eine Nullstellen-Gleichung f¨ ur ein Polynom der Ordnung n · N (“charakteristisches Polynom”). Fazit: Satz 2.7: Zu jeder Nullstelle λ des charakteristischen Polynoms det M (λ) gibt es eine L¨osung A der Eigenwertgleichung (2.10), und damit eine L¨osung der homogenen DGl (2.8) durch den Exponentialansatz (2.9). Jedes solche Polynom besitzt n · N Nullstellen. Diese k¨onnen “entartet” sein (mehrfache Nullstellen: ein Fall, den wir zun¨achst ausschließen wollen); im allgemeinen werden die Nullstellen komplex sein. Wenn aber die DGl reell gewesen ist, dann ist auch das charakteristische Polynom reell, und alle echt komplexen Nullstellen treten immer paarweise mit ihrer komplex-konjugierten auf. Damit ist mit Aeλx immer auch die komplex-konjugierte Funktion (Aeλx )∗ eine L¨osung, und man erh¨alt zu jedem komplexen λ ein Paar von zwei reellen L¨osungen, n¨amlich den Realteil und den Imagin¨arteil von Aeλx . H¨aufig hat die Variable x die Bedeutung “Zeit”. Dann schreibt man u ¨blicherweise λ = −1/τ + iω. Der komplexe Amplitudenvektor A habe die Komponenten Ai = |Ai |e−iϕi . Dann lauten die beiden reellen L¨osungen fi (t) = |Ai |e−t/τ cos(ωt − ϕi ) bzw
. . . sin(ωt − ϕi ).
Also sind die Imagin¨arteile der λ die Frequenzen, die Realteile geben D¨ ampfungen an, |Ai | sind die Amplituden der verschiedenen Schwingungsmoden, und ϕi sind die relativen Phasenverschiebungen zwischen den gekoppelten Komponenten. Falls x die Bedeutung “Strecke” hat, sind diese Begriffe entsprechend umzudeuten: Wellenzahl und Eindringtiefe. F¨ ur die Berechnung der Schwingungsfrequenzen muss man also die m¨oglichen Imagin¨arteile der Nullstellen des charakteristischen Polynoms bestimmen.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
19
Wenn es Nullstellen λ mit positivem Realteil gibt, dann sind die entsprechenden L¨osungen nicht ged¨ampft, sondern sie wachsen exponentiell schnell an. Da die allgemeine L¨osung eine beliebige Superposition der speziellen L¨osungen ist (Satz 2.6), wird diese immer exponentiell anwachsen, außer wenn die Anfangswerte gerade so eingestellt sind, dass der Koeffizient dieser L¨osungen pr¨azise Null ist. Das System ist instabil in dem Sinne, dass die kleinste Abweichung von einer solchen Vorgabe die anwachsenden L¨osungen “reaktivieren” wird. Die Stabilit¨atsanalyse eines (linearen oder linear gen¨aherten) Systems besteht also zuallererst in der Bestimmung der Vorzeichen der Realteile der Nullstellen des charakteristischen Polynoms. Der Prototyp des oben ausgeschlossenen Falls mehrfacher Nullstellen ist der “aperiodische Grenzfall” eines Resonators. InPdiesem Fall gibt es außer der Expon−1 nentiall¨osung auch noch L¨osungen der Form k=0 Ak ·xk eλx , wobei n die Ordnung der Nullstelle ist. Inhomogene lineare DGln mit konstanten Koeffizienten Der Prototyp einer inhomogenen linearen DGl mit konstanten Koeffizienten ist zB der Oszillator mit ¨außerer Kraft, m¨ x(t) + Rx(t) ˙ + kx(t) = F (t), oder der Wechselstromkreis mit angelegter Spannung. Ein allgemeines System von Gleichungen dieses Typs hat die Form n X Mi f (i) (x) = g(x),
(2.12)
i=0
wobei Mi wieder N × N Matrizen sind. Die rechte Seite sei vorgegeben, die Funktionen f sind gesucht. Im einfachsten Fall nehmen wir an, dass g(x) von der Form g(x) = B eκx ist. In diesem Fall f¨ uhrt der Exponential-Ansatz f (x) = A eκx ,
A =?
(diesmal mit dem vorgegebenen κ!) auf die lineare Bestimmungsgleichung f¨ ur A M (κ)A = B. Satz 2.8: Es sei g(x) = B eκx . Wenn κ keine Nullstelle des charakteristischen Polynoms det M (λ) ist, dann ist f (x) = A eκx eine spezielle L¨osung der inhomogenen Differentialgleichung (2.12) mit A = M (κ)−1 B. Beweis: det M (κ) 6= 0, also ist M (κ) invertierbar. Dass f eine L¨osung ist, sieht man dann durch Einsetzen.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
20
Zu dieser Partikular-L¨osung der inhomogenen Gleichung ist noch die allgemeine L¨osung der homogenen Gleichung zu addieren, die wir im vorigen Abschnitt gefunden haben. Wenn das System ged¨ampft ist (alle λ haben negativen Realteil), dann werden diese Terme exponentiell abklingen und daher (bei großen x) vernachl¨assigbar sein. Wenn aber κ eine Nullstelle des charakteristischen Polynoms ist, dann ist M (κ) nicht invertierbar, und eine L¨osung wird in der Regel nicht existieren. Dies ist die “Resonanz-Katastrophe”. Im Allgemeinen ist die rechte Seite g(x) der inhomogenen Gleichung nat¨ urlich κx nicht von der einfachen angegebenen Form ∼ e . Man wird dann versuchen, diese ¨ als Summe (Uberlagerung) von Funktionen der Form X g n (x) = B n eκn x , g(x) = g n (x) n
¨ zu schreiben, undP den Satz 2.4 verwenden: die L¨osung ist die entsprechende Uberlagerung f (x) = n f n (x) der L¨osungen f¨ ur die einzelnen g n . Wenn das gelingt, dann weiß man schon folgendes qualitative Resultat: diejenigen Beitr¨age, f¨ ur die κn nahe bei einer Nullstelle λ liegen, werden typischerweise mit “großen” Amplituden An beitragen, weil die inverse Matrix M (κn )−1 große Eigenwerte besitzt. Man kann also die inhomogene lineare DGl als ein “Input-Output-System” auffassen, bei dem der Output A linear vom Input B abh¨angt; der Input wird κabh¨angig verst¨arkt oder unterdr¨ uckt, je nachdem wie die inverse Matrix M (κ)−1 aussieht. Durch Wahl von κ (oder der Systemparameter, die die urspr¨ unglichen Matrizen Mi bestimmen) kann man dieses Muster beeinflussen. Falls die rechte Seite g(x) periodisch ist, dann f¨ uhrt das Problem ihrer Zerle¨ gung auf die Fourier-Zerlegung (= Uberlagerung von harmonischen Funktionen mit Vielfachen der Grundfrequenz; λn = iωn = inω0 imagin¨ar). Falls sie nichtperiodisch ist, hilft uU das Fourier-Integral weiter (Kap. 3). Allgemeine lineare DGln zweiter Ordnung F¨ ur das L¨osen der homogenen DGl zweiter Ordnung mit nicht-konstanten Koeffizienten gibt es kein universelles Verfahren. Eine M¨oglichkeit ist ein Potenzreihen-Ansatz, den wir nur am folgenden Beispiel diskutieren wollen: z(1 − z) f ′′ (z) + (c − (1 + a + b)z) f ′ (z) − ab f (z) = 0,
(2.13)
wobei a, b, c konstante Parameter sind. Wir nehmen an, dass sich eine L¨osung in der Form f (z) = z p (1 + A1 z + A2 z 2 + . . . ) finden l¨asst. Bei kleinen z sind die f¨ uhrenden Beitr¨age der DGl (2.13) z f ′′ (z) ≈ p(p − 1)z p−1 (alle anderen Terme ∼ z ≥p ).
und
c f ′ (z) ≈ cp z p−1 ,
(2.14)
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
21
Dies ergibt zun¨achst die Bedingung p(p − 1) + cp = 0, also zwei M¨oglichkeiten p = 0 oder p = 1 − c. Wir betrachten die erste: Setzen wir die Potenzreihe in die DGl (2.13) ein und sortieren alle Potenzen z n , so erhalten wir X∞ ! Df = − (a + n)(b + n)An + (c + n)(1 + n)An+1 z n = 0. (2.15) n=0
Dies erlaubt die rekursive Bestimmung der Koeffizienten aus A0 = 1: An+1 =
(a + n)(b + n) An (c + n)(1 + n)
⇒
An =
(a)n (b)n , (c)n n!
(2.16)
wobei (a)n = a(a + 1) . . . (a + n − 1) ist (“Pochhammer-Symbol”, (1)n ≡ n!). Die resultierende Potenzreihe hat Konvergenzradius 1. Die f¨ ur |z| < 1 konvergente Summe heißt hypergeometrische Funktion: f (z) =
X∞ (a)n (b)n n=0
(c)n n!
z n =: 2 F1 (a, b; c; z)
(c ∈ / −N0 ).
(2.17)
F¨ ur b = c ist dies gerade die Taylor-Reihe von (1 − z)−a (= geometrische Reihe, falls a = 1), f¨ ur negative ganze a oder b erh¨alt man Polynome, und andere Werte von a, b, c f¨ uhren auf eine Vielzahl von speziellen Funktionen, die auch in der Physik in vielen verschiedenen Zusammenh¨angen auftreten, zB Kap. 2.4. Die zweite L¨osung mit p = 1 − c kann man sich im Prinzip ebenso verschaffen. Das Ergebnis ist z 1−c 2 F1 (a − c + 1, b − c + 1; 2 − c; z) (Probe durch Einsetzen!).
2.4
Randwertprobleme, Eigenwerte, Quantisierung
Vor allem bei Differentialgleichungen in einer r¨aumlichen Variablen (statt t) hat man es oft nicht mit vorgegebenen Anfangswerten, sondern mit vorgegebenen Randwerten zu tun, etwa bei x = 0 und x = L, wenn das System auf einen “Kasten” der Breite L eingeschr¨ankt ist (elektrisches Feld im Kondensator, Welle im Hohlleiter, . . . ). Als elementares Beispiel betrachten wir die DGl f¨ ur die Auslenkung l¨angs einer eingespannten Saite oder einer Schallwelle in einem geschlossenen Rohr: c2 ξ ′′ (x) = −ω 2 ξ(x),
(2.18)
wobei ω = 2πν die Kreisfrequenz ist und c die Geschwindigkeit einer Welle. Offenbar ist die allgemeine L¨osung der DGl ξ(x) = a sin(kx) + b cos(kx)
mit
ck = ω.
Wir verlangen nun zus¨atzlich die Randbedingung ξ(0) = ξ(L) = 0 (DirichletRB). ξ(0) = 0 erfordert b = 0, die Bedingung ξ(L) erfordert sin(kL) = 0. Also sind nur diskrete Wellenzahlen erlaubt: π k =n· (n ∈ N). (2.19) L
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
22
Man kann (f¨ ur dieselbe DGl) auch andere, zB periodische Randbedingungen fordern, dh ξ(L) = ξ(0) und ξ ′ (L) = ξ ′ (0). Dann sind nur noch die Wellenzahlen π (n ∈ N) k = 2n · L zul¨assig; daf¨ ur gibt es f¨ ur jeden dieser Werte zwei linear unabh¨angige L¨osungen sin(kx) und cos(kx) (zuz¨ uglich k = 0, ξ(x) = 1). W¨ahlt man im Fall periodischer RB anstelle der L¨osungen sin(kx), cos(kx) die Linearkombinationen cos(kx) ± i sin(kx) = e±ikx , so erh¨alt man die Basis von 2π L¨osungen eim L , m ∈ Z. Diese sind u ¨brigens auch Eigenfunktionen des Differen¨ . Ubung: Der Operator D besitzt tialoperators D = −i∂x mit Eigenwerten m · 2π L mit Dirichlet-RB u berhaupt keine Eigenfunktionen. ¨ Die Existenz von L¨osungen nur f¨ ur bestimmte Werte eines Parameters (hier k) nennt man Quantisierung. In diesen Beispielen sind zusammen mit den Wellenzahlen auch die Frequenzen ω = ck quantisiert. Manche lineare DGln k¨onnen als Eigenwertprobleme f¨ ur einen Differential2 2 operator (hier: D = c ∂x ) aufgefasst werden. Erst die Spezifikation von Randbedingungen legt die m¨oglichen Eigenwerte fest (Quantisierung). So wie in der linearen Algebra die Eigenwerte Charakteristika einer Matrix sind, sind hier die Eigenwerte Charakteristika eines Diffoperators plus Randbedingungen. Als weiteres Beispiel betrachten wir die partielle DGl (→ Kap. 6) f¨ ur eine Funktion f (ϑ, ϕ) auf der Kugeloberfl¨ache, die zB stehende Wellen auf der Kugel beschreibt: 1 cos ϑ ∂ϕ2 f + ∂ϑ2 f + ∂ϑ f = µ f. (2.20) 2 sin ϑ
sin ϑ
Der Differentialoperator auf der linken Seite ist der Laplace-Operator der Kugel, dh, der Winkelanteil des dreidimensionalen Laplace-Operators. Die “Randbedingung” in diesem Fall fordert, dass f eine stetige Funktion auf der Kugel sein soll, also periodisch in ϕ und bei ϑ → 0, π (“Nord- und S¨ udpol”) endlich und unabh¨angig von ϕ ist. Wir suchen diejenigen Eigenwerte µ, f¨ ur die eine solche L¨osung existiert. Wir machen einen Ansatz f (ϑ, ϕ) = g(ϑ)h(ϕ), und erhalten g(ϑ) · Dϕ h(ϕ) + h(ϕ) · Dϑ g(ϑ) = 0,
wobei Dϕ = ∂ϕ2 und Dϑ = sin2 ϑ∂ϑ2 + sin ϑ cos ϑ∂ϑ − µ sin2 ϑ. Es folgt Dϕ h(ϕ) Dϑ g(ϑ) =− . h(ϕ) g(ϑ)
Offenbar h¨angt die linke Seite nur von ϕ ab und die rechte Seite nur von ϑ. Dies ist nur m¨oglich, wenn beide Seiten konstant sind. Also erhalten wir zwei gew¨ohnliche DGln (mit einer weiteren zu bestimmenden Konstanten C) Dϕ h(ϕ) = −C, h(ϕ)
Dϑ g(ϑ) = C. g(ϑ)
(Partielle DGln, die auf diese Art auf gew¨ohnliche DGln zur¨ uckf¨ uhrbar sind, heißen separierbar.)
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
23
Die erste dieser beiden Gleichungen h′′ = −C h ist von demselben Typ wie unser erstes Beispiel (2.18), mit periodischen RB. Die L¨osungen sind hm (ϕ) = Aeimϕ
(oder
sin mϕ, cos mϕ)
mit m ∈ Z
⇒
C = m2 .
Die zweite Gleichung wird zu sin2 ϑ g ′′ (ϑ) + sin ϑ cos ϑ g ′ (ϑ) − µ sin2 ϑ g(ϑ) = m2 g(ϑ).
(2.21)
F¨ uhrt man u = cos ϑ als Variable ein, so erh¨alt man die Legendre’sche DGl m2 g(u). (2.22) ∂u (1 − u2 )∂u g(u) = µ + 2 1−u
Diese homogene lineare DGl besitzt zwei linear unabh¨angige L¨osungen (Satz 2.6). Zun¨achst m = 0: umgeschrieben in der Variablen z = 21 (1 − u) erweist sich die Legendre’sche DGl als Spezialfall der hypergeometrischen DGl (2.13) mit den beiden L¨osungen Pl (u) = 2 F1 (−l, l + 1; 1; 21 (1 − u)) und P˜l (u) = 2 F1 (−l, l + 1; 1; 12 (1+u)), wobei l(l+1) = −µ. Die erstere ist bei u = +1 (Nordpol ϑ = 0, z = 0) regul¨ar, wird aber im Allgemeinen bei u = −1 (S¨ udpol ϑ = π, z = 1) singul¨ar (Konvergenzradius der hyperg Fn ist 1). Umgekehrt mit der zweiten L¨osung. Einzige Ausnahme: Wenn l ∈ N0 , dann bricht die Potenzreihe (2.17) bei n = l ab, und Pl ist ein Polynom vom Grade l (Legendre-Polynom). Ein Polynom ist nat¨ urlich u ¨berall regul¨ar. In diesem Fall ist P˜l (u) = Pl (−u) = (−1)l Pl (u). F¨ ur m 6= 0 kann sich u ¨berzeugen, dass 1
glm (u) = (1 − u2 ) 2 |m| ∂u|m| Pl (u) die Legendre’sche DGl (2.22) mit µ = −l(l + 1) l¨ost und wieder nur dann an beiden Polen u = ±1 regul¨ar ist, wenn l ∈ N0 . Weil dann Pl ein Polynom vom Grade l ist, sind diese L¨osungen = 0 wenn |m| > l. Die gesuchten L¨osungen der urspr¨ unglichen DGl (2.20), die auf der ganzen Kugelfl¨ache regul¨ar sind, sind also die Kugelfl¨ achenfunktionen (Clm sind Normierungsfaktoren, siehe (3.16)) (l ∈ N0 , m ∈ Z, |m| ≤ l). Ylm (ϑ, ϕ) = Clm · (sin ϑ)|m| ∂u|m| Pl (u) u=cos ϑ · eimϕ (2.23) Fazit: der Laplace-Operator der Kugel ist ebenfalls quantisiert, seine Eigenwerte sind µ = −l(l + 1), l ∈ N0 , und die zugeh¨origen L¨osungen sind die Kugelfl¨achenfunktionen mit m = −l, −l + 1, . . . , l − 1, l. Diese Funktionen sind zB die Schwingungsmoden einer Kugelschale (mit Frequenzen ω 2 ∼ l(l + 1)). Sie beschreiben aber auch die quantenmechanischen Orbitale von Elektronen im Atom. In der linearen Algebra gilt: Die Eigenvektoren einer symmetrischen reellen oder hermiteschen komplexen Matrix mit verschiedenen Eigenwerten stehen senkrecht aufeinander. Etwas ¨ahnliches gilt auch f¨ ur Differential-Operatoren, wenn wir Funktionen als Vektoren auffassen! Um von Orthogonalit¨at zu sprechen, brauchen wir ein
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
24
Skalarprodukt. F¨ ur den VR der komplexen stetigen Funktionen auf dem Intervall [0, 2π] definieren wir Z 2π
f (ϕ)g(ϕ) dϕ.
(f, g) :=
0
P Dieses Skp hat dieselben Eigenschaften wie das Skalarprodukt (a, b) = i ai bi des komplexen Vektorraumes Cn (oder wie das Standard-Skp auf Rn , falls die Funktionen reell sind): es ist linear im zweiten Eintrag, anti-linear im ersten Eintrag, (g, f ) = (f, g), und (f, f ) = ||f ||2 2 ≥ 0 und = 0 genau dann wenn f = 0. Man kann damit also “Geometrie” treiben wie im Rn oder Cn : zwei Funktionen heißen orthogonal, wenn (f, g) = 0. Ein DiffOp heißt hermitesch, falls (f, Dg) = (Df, g) f¨ ur alle (f¨ ur die Anwendung von D hinreichend oft diffbaren) f, g gilt. Dann gelten dieselben Argumente wie in der linearen Algebra f¨ ur einen hermiteschen Differentialoperator: Df = λf impliziert λ · (f, f ) = (f, Df ) = (Df, f ) = λ · (f, f ), also ist λ reell. Dg = µg impliziert dann µ · (f, g) = (f, Dg) = (Df, g) = λ · (f, g), also ist entweder µ = λ oder das Skalarprodukt (f, g) = 0. Satz: 2.9 Die Eigenwerte eines hermiteschen Differentialoperators sind reell. Zwei Eigenfunktionen zu verschiedenen Eigenwerten sind orthogonal. . Bsp: Der Differentialoperator D = −i∂ϕ mit periodischen Randbedingungen (wie oben, mit ϕ statt x, und L = 2π). Zun¨achst u ¨berzeugen wir uns, dass D hermitesch ist. Beweis: partielle Integration, wobei die Randterme dank der Periodizit¨at wegfallen. Das −-Zeichen der partiellen Integration wird durch das −-Zeichen bei der komplexen Konjugation kompensiert. Tats¨achlich: f¨ ur die Eigenfunktionen fm (ϕ) := eimϕ von D = −iϕ berechnen wir explizit: Z 2π
ei(n−m)ϕ dϕ = 2πδmn .
(fm , fn ) =
0
In der linearen Algebra bilden s¨amtliche Eigenvektoren einer Matrix eine Basis, dh, man kann jeden Vektor als Linearkombination von Eigenvektoren schreiben. Die analoge Fragestellung f¨ ur periodische Funktionen ist die FourierZerlegung → Kap. 3.1. Auch mit Dirichlet-RB (dh f (0) = f (2π) = 0) ist der DiffOp D = −i∂ϕ hermitesch, weil die Randterme wieder wegen der RB wegfallen. Allerdings besitzt letzterer u ¨berhaupt keine Eigenvektoren (siehe oben), also ist die Schlussfolgerung von Satz 2.9 eine leere Aussage. Damit es wieder “genug Eigenvektoren” gibt, muss ein DiffOp eine st¨arkere Eigenschaft besitzen als “hermitesch” zu sein → Kap. 7.5. Zuguterletzt ist D = −i∂ϕ mit Neumann-RB (dh f ′ (0) = f ′ (2π) = 0) nicht einmal hermitesch, weil die Randterme bei der partiellen Integration nicht wegfallen.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
3 3.1
25
Fourier-Analyse Fourier-Reihe
Ziel: “m¨oglichst viele” periodische Funktionen f (t) mit Periode T = 2π/ω0 in die speziellen Funktionen einω0 t zu zerlegen, dh, darzustellen als Fourier-Reihe X f (t) = fn einω0 t (ω0 = 2π/T ). (3.1) n∈Z
Anstelle der komplexen Exponentialfunktionen einω0 t (n ∈ Z) k¨onnte man auch die harmonischen Funktionen sin nω0 t und cos nω0 t (n ∈ N; zuz¨ uglich der konstanten Funktion 1) verwenden, da man die ersteren und die letzteren mit Euler’s Formel sofort ineinander umrechnen kann. Die komplexen Funktionen einω0 t sind aber meistens zweckm¨aßiger, solange man nur im Auge beh¨alt, ob die Funktion f (t) reell sein soll. Man sieht sofort, dass (3.1) reell ist, wenn fn = f−n . Anwendung: die inhomogene lineare DGl mit konstanten Koeffizienten Af¨ + B f˙ + Cf = g(t) kann f¨ ur jede periodische Inhomogenit¨at g gel¨ost werden: wir schreiben g(t) = P inω0 t g (mit aus g zu berechnenden Koeffizienten gn ) und machen einen n∈Z n e P Ansatz f (t) = n∈Z fn einω0 t (mit gesuchten Koeffizienten fn ). Eingesetzt in die DGl, ergibt der Koeffizientenvergleich [(inω0 )2 A + (inω0 )B + C]fn = gn , und damit eine Bestimmungsgleichung f¨ ur fn , vgl Kap. 2.3. Zur Bestimmung der gesuchten Fourier-Koeffizienten fn einer gegebenen Funktion, (3.1), verwendet man die Orthogonalit¨at der Funktionen einω0 t , vgl Kap. 2.4. Man muss also nur mit e−imω0 t multiplizieren und u ¨ber Reine Periode integrieren. T Dann ergeben alle Terme der Summe mit n 6= m Null: 0 ei(n−m)ω0 t dt = 0. Nur RT der Term mit n = m ergibt fm 0 dt = fm T , sodass Z T 1 fm = f (t) e−imω0 t dt. (3.2) T
0
Damit haben wir bereits die Eindeutigkeit der Zerlegung (3.1) bewiesen! Kritischer ist die Frage, ob (und in welchem Sinne) die Summe auf der rechten Seite von (3.1), mit den Koeffizienten (3.2) gebildet, tats¨achlich gegen die urspr¨ ungliche Funktion konvergiert. Der optimale Fall wird erfasst durch Satz 3.1: Ist f (t) eine stetige periodische Funktion, so konvergiert die FourierReihe (3.1) fast u ¨berall punktweise gegen die Funktion f . Ist f (t) zus¨atzlich stetig differenzierbar außer an h¨ochstens endlich vielen Punkten im Intervall [0, T ], so konvergiert die Fourier-Reihe u ¨berall, und sogar gleichm¨aßig gegen f . “Fast u ¨berall” heißt “an allen Punkten t außer h¨ochstens abz¨ahlbar vielen”. (F¨ ur praktische Zwecke ist “fast u ¨berall” v¨ollig ausreichend.)
zB Fischer-Kaul Bd 2, § 6
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
26
Im stetigen Fall sind die Integrale (3.2) wohldefiniert, Bei gleichm¨aßiger Konvergenz darf man auch die Summe u ¨ber n und das Integral u ¨ber t vertauschen (was wir bei der Bestimmung der fn stillschweigend getan haben). Dass die Koeffizienten der Zerlegung eindeutig sind, ist der leichte Teil des Satzes (s.o.). Die nichttriviale Kernaussage des Satzes 3.1 ist aber die Tatsache, dass man außer den periodischen harmonischen Funktionen einϕ bzw sin(nϕ) und cos(nϕ) keine weiteren zur Darstellung periodischer Funktionen ben¨otigt. Diese bilden also eine vollst¨ andige Basis des unendlich-dimensionalen Vektorraumes (stetiger) periodischer Funktionen. Genaueres dazu → Kap. 3.2. Tats¨achlich ist die Fourier-Zerlegung (3.1) auch f¨ ur st¨ uckweise stetige Funktionen (mit endlich vielen Sprungstellen) m¨oglich, zB die (physikalisch wichtige) “S¨agezahnfunktion”. Auch f¨ ur diese sind die Fourier-Koeffizienten wohldefiniert, und die Fourier-Reihe konvergiert “fast u ¨berall” gegen die Funktion; bei Sprungstellen mit endlichen Ableitungen zu beiden Seiten konvergiert sie gegen den Mittelwert. Insbesondere ist die Fourier-Darstellung (3.1) “blind” gegen¨ uber der Wahl des Funktionswertes f (t) an einer Unstetigkeitsstelle. Regel: Hat f (t) die Fourier-Koeffizienten fk , so hat f˙(t) die FKn iω0 · kfk . Mit anderen Worten: Ableitung nach t wird zu Multiplikation mit iωk = iω0 k. Beweis: Ersetzung von f in (3.2) durch f˙, und partielle Integration. Oder: Ableiten von (3.1). Zusammenhang zwischen Diff ’barkeit und Abfall-Verhalten: Je “glatter” eine periodische Funktion ist, desto schneller fallen ihre FourierKoeffizienten mit k → ∞ ab: Satz 3.2: Ist f beschr¨aP nkt und st¨ uckweise stetig (endlich viele Sprungstellen pro Periode), so ist k∈Z |fk |2 < ∞. Ist f differenzierbar mit beschr¨ankP 2 ter und st¨ uckweise stetiger Ableitung, so gilt sogar k∈Z |kfk | < ∞ und P ankter und uckweise stetik∈Z |fk | < ∞. Ist f m-fach diffbar P mitmbeschr¨ P st¨ 2 ger m-ter Ableitung, so gilt sogar k∈Z |k fk | < ∞ und k∈Z |k m−1 fk | < ∞.
NB: damit eine Summe konvergiert, sollten asymptotisch P die Summanden −1 m 2 schneller als |k| abfallen. Also bedeutet zB k∈Z |k fk | < ∞ qualitativ, dass |fk | schneller als ∼ 1/|k|m+1/2 abfallen. Multiplikation und Faltung: Die Fourier-Koeffizienten f¨ ur das Produkt zweier Funktionen f , g mit FKn fn , gn sind durch die “Faltungssummen” (=Cauchy-Summen) gegeben: X X f (t)g(t) = hn einω0 t mit hn = fm gn−m . (3.3) n∈Z
m∈Z
(Beweis durch Einsetzen der F-Reihen auf der linken Seite und Umsortieren der Doppelsumme). Spezialfall: g(t) = f (t), also gm = f−m , und n = 0: ⇒
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
27
Satz 3.3 (Parseval’sche Gleichung): Es gilt 1 T
Z
T 0
|f (t)|2 =
X n∈Z
|fn |2 .
(3.4)
Anwendungen: (1) Die Intensit¨at einer Schwingungsmode einωt ist das Absolutquadrat |fn |2 der Amplitude. Also ist die Gesamtintensit¨at gleich 1/T mal dem Quadrat der L2 -Norm der Funktion f (t). (2) Wie groß ist der Klirrfaktor eines Verst¨arkers? (KF = Anteil der durch Verzerrung erzeugten Oberschwingungen an der Gesamt-Intensit¨at des Ausgangssignals, wenn der Eingang eine reine Sinusschwingung ist.) (3) Ein Tiefpass-Filter schneidet alle Frequenzen oberhalb einer Grenzfrequenz ab. Wie verformt sich ein Eingangssignal, das etwa durch eine periodische Stufenoder S¨ gegeben ist? Um wieviel wird dabei die Signalintensit¨at RaTgezahnfunktion 1 2 (= T 0 |f (t)| dt) reduziert? P 1 π2 (Die Parseval’sche Gleichung f¨ ur die S¨agezahnfunktion ergibt ∞ n=1 n2 = 6 .) Anwendung bei der L¨ osung von linearen Differentialgleichungen: Die N¨ utzlichkeit bei der L¨osung inhomogener linearer DGln mit konstanten Koeffizienten haben wir schon am Anfang dieses Kapitels festgestellt. Dank der Regel, dass die Ableitung zu einer Multiplikation wird, verwandelt sich die DGl in eine lineare Gleichung zur Bestimmung der Fourier-Koeffizienten.
Die folgenden Beispiele verwenden die Fourier-Zerlegung von Funktionen, die in einer Winkelvariablen periodisch sind. (1) Die Laplace-Gleichung in zwei Dimensionen: ∆f (x, y) ≡ (∂x2 + ∂y2 )f (x, y) = g(x, y); wird in ebenen Polarkoordinaten zu 1 1 ∂r2 + ∂r + 2 ∂ϕ2 f (r, ϕ) = g(r, ϕ). r
r
(3.5)
(3.6)
Nat¨ urlich sind f und g periodisch in ϕ. F¨ ur jeden festen Radius zerlegen wir X fn (r) einϕ (3.7) f (r, ϕ) = n∈Z
und ¨ahnlich g(r, ϕ) mit Koeffizienten gn . Es folgt durch Koeffizientenvergleich (Eindeutigkeit der Fourier-Reihe) n2 1 (3.8) ∂r2 + ∂r − 2 fn (r) = gn (r). r
r
Wir haben eine partielle auf viele gew¨ohnliche DGln zur¨ uckgef¨ uhrt. (2) Die Gleichung f¨ ur stehende Wellen in einer kreisf¨ormigen Membran (Trommel) lautet ∆f = −k 2 f. (3.9)
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
28
¨ Dies wird durch Ubergang zu Polarkoordinaten und Fourier-Zerlegung bzgl ϕ zur¨ uckgef¨ uhrt auf die Bessel’sche DGl n2 1 2 2 (3.10) ∂r + ∂r − 2 + k fn (r) = 0. r
r
Die L¨osungen heißen fn (r) = Jn (kr), Jn (z) = Bessel-Funktionen = (z/2)n /n! · P∞ (−z2 /4)k oglichen k=0 (n+1)k k! . Eine Randbedingung, etwa ∂r f (r)|r=R quantisiert die m¨ 2 Werte von k und damit die Frequenzen.
Sinus-Reihen und Kosinus-Reihen: Ist f eine (st¨ uckweise stetige) Funktion auf einem Intervall [0, T ], so kann man sie periodisch fortsetzen, und nach Funktionen einω0 t bzw sin nω0 t und cos nω0 t entwickeln (ω0 = 2π/T ). Man kann sie aber auch zun¨achst entweder symmetrisch oder anti-symmetrisch auf das Intervall [−T, T ] fortsetzen, und dann periodisch mit Periode 2T fortsetzen. Die Fourier-Reihe der resultierenden Funktion wird dann nur cos nω0 t/2 oder nur sin nω0 t/2 enthalten. Sowohl die ersteren als auch die letzteren (jeweils mit der halben Grundfrequenz!) bilden also ebenfalls eine Basis der stw stetigen Funktionen auf einem Intervall, und man erh¨alt verschiedene F-Darstellungen derselben (innerhalb [0, T ]) Funktion! Die Randbedingungen k¨onnen der einen oder anderen Wahl den Vorzug geben.
3.2
Unit¨ are R¨ aume
Die abstrakte Idee, die der Fourier-Zerlegung zugrunde liegt, besteht darin, spe√ zielle Funktionen (hier die komplexen Exponentialfunktionen ek (t) = eikω0 t / T mit Frequenzen mω0 ) als Basis eines linearen Raumes von Funktionen verwenden, und “beliebige” Funktionen nach den Basisfunktionen zu entwickeln. Der Schritt (3.2) zur Bestimmung der Fourier-Koeffizienten ist ganz analog zu der Bestimmung der Koeffizienten der Basis-Zerlegung eines Vektors im Rn : X ak ~ek ⇒ ak = (~ek · ~v ), ~v = k
wenn die Basis {~ek } eine Orthonormalbasis ist. Das Skalarprodukt ist hier die Integration mit der komplex-konjugierten Funktion in (3.2), vgl Kap. 2.4. Diese Idee ist in vielen Zusammenh¨angen n¨ utzlich und l¨asst sich auch auf andere Systeme von Basisfunktionen anwenden. Was man allerdings immer ben¨otigt, ist ein Skalarprodukt (= inneres Produkt) mit ¨ahnlichen Eigenschaften wie P das komplexe Skalarprodukt (a, b) = i ai bi = (b, a) auf dem endlich-dimensionalen Vektorraum Cn : also sesquilinear (linear im zweiten und anti-linear im ersten Eintrag), hermitesch ((f, g) = (g, f )) und positiv-definit ((f, f ) = 0 ⇔ f = 0). Dann ist p ||f || := (f, f ) (3.11) die Norm eines Vektors (“L¨ange”). f heißt normiert, wenn ||f || = 1. Zwei Vektoren heißen orthogonal zueinander, wenn (f, g) = 0.
(3.12)
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
29
Aus den definierenden Eigenschaften folgen die Dreiecks-Ungleichung ||f + g|| ≤ ||f || + ||g||
(3.13)
|(f, g)| ≤ ||f || · ||g||.
(3.14)
und die Cauchy-Schwarz’sche Ungleichung
Ein komplexer Vektorraum V mit einem Skalarprodukt heißt unit¨ arer Raum. Dann ist ||f ||2 := (f, f ) eine Norm; aber umgekehrt r¨ uhrt nicht jede Norm von einem Skalarprodukt her. Skalarprodukte lassen sich u ur kom¨ber Integrale definieren: wir definieren f¨ plexwertige Funktionen auf einem Raum X Z (f, g) := f (x)g(x)dµ(x), (3.15) X
wobei dµ(x) ein (der jeweiligen Situation angepasstes) Integralmaß ist. F¨ ur X = 3 3 R oder X = R ist in der Regel dµ(x) = dx bzw dµ(x) = d x das Lebesgue-Maß (das Lebesgue-Integral stimmt mit dem Riemann-Integral (“Stammfunktion”) u ur mehr Funktionen definiert). ¨berein, wenn letzteres existiert, ist aber noch f¨ In diesem Fall ist die zugeh¨orige Norm gerade die L2 -Norm aus Kap. 1. Das 1 2 Gauß’sche Maß auf R w¨are zB dµ(x) = e− 2 x dx. Auf der Kugeloberfl¨ache ist zB das Raumwinkelelement dµ(ϑ, ϕ) = sin ϑ dϑ dϕ ein geeignetes Maß. Das Skalarprodukt (3.15) ur alle Funktionen, aber zumindest R R 2existiert nicht f¨ 2 dann, wenn |f | dµ und |g| dµ existieren (⇔ beide Funktionen haben endliche Norm, zB f, g ∈ C00 (X) oder ∈ C0 mit hinreichend schnellem Abfall). Wir nennen solche Funktionen quadrat-integrabel bzgl dµ. Durch (3.15) werden Funktionen zu Vektoren in einem unendlich-dimensionalen unit¨aren Raum V , in dem die Begriffe “normiert” und “orthogonal” definiert sind. Ist {en } irgendein orthonormales System von Basisfunktionen, und f (x) = P an en (x) die gesuchte Zerlegung, so sind die Koeffizienten an = (en , f ).
Einige Beispiele: (1) Die periodischen Funktionen betrachten wir als Funktionen auf dem (durch die Bogenl¨ange t parametrisierten) Kreis vom Umfang T . Dann sind die Funktionen en (t) = (T )−1/2 einω0 t (n ∈ Z, ω0 = 2π/T ) orthonormal (bez¨ uglich des Maßes 1/2 dt). (en , f ) = T · Fourier-Koeffizienten fn . Die Fourier-Zerlegung (3.1) einer periodischen Funktion ist also nichts anderes als die Zerlegung eines Vektors X f= an e n , an = T 1/2 fn = (en , f ) n∈Z
nach einer Basis. Die Parseval’sche Gl (Satz 3.3) besagt, dass die Norm des Vektors – wie im endlich-dimensionalen Fall – durch die quadratische Summe der Komponenten der Basis-Zerlegung ausgedr¨ uckt werden kann. (2) Auf dem Intervall [−1, 1] sind die Legendre-Polynome Pn (x) (n ∈ N0 , s. Kap. 2.4) orthogonal (bez¨ uglich des Maßes dx), und ||Pl ||2 = 2/(2l + 1).
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren (3) Auf der Einheitskugel sind die Kugelfl¨achen-Funktionen r 2l + 1 l − |m| · · sin|m| ϑ · ∂ |m| Pl (cos ϑ) · eimϕ Ylm (ϑ, ϕ) = 4π
l + |m|
30
(3.16)
(l ∈ N0 , m ∈ Z, |m| ≤ l, siehe (2.23)) orthonormal bzgl des Raumwinkel-Maßes. Die Zerlegung von beliebigen Funktionen auf der Kugelfl¨ache nach Kugelfl¨achen-Funktionen hat (als Verallgemeinerung der Fourier-Zerlegung periodischer Funktionen) viele n¨ utzliche Anwendungen: die Schwingungsmoden von kugelf¨ormigen K¨orpern (vom Wassertropfen bis zum Erdbeben), die Multipol-Entwicklung in der E-Dynamik, die Orbitale der Elektronenbahnen im H-Atom, die Strukturuntersuchung der kosmischen Hintergrundstrahlung. Vollst¨ andigkeit . . . eines orthonormierten Funktionensystems ist P die Eigenschaft, dass jeder Vektor f als (ggf unendliche) Linearkombination f = n an en der Basis-Funktionen dargestellt werden kann. Wenn die P {en } orthonormal sind, P so muss an = (en , f ) sein. Dann berechnet man ||f − n an en ||2 = ||f ||2 − n |an |2 . Das Verschwinden der rechten Seite ist die (verallgemeinerte) Parseval’sche Gleichung. Weil die Norm positiv definit ist, erhalten wir: P Die Parseval’sche Gleichung garantiert, dass f als n an en darstellbar ist, wobei an = (en , f ). Das Standard-Skalarprodukt in CN kann man auch schreiben als (v, w) = v † w, indem man w als Spaltenvektor und v † als komplex-konjugierten Zeilenvektor aufgefasst. Ist en irgendeine eine Orthonormalbasis,P so besagt die Identit¨at P † v = n en (en , v) (v beliebig), dass die N × N -Matrix N n=1 en en jeden Vektor PN reproduziert, also n=1 en e†n = N × N -Einheitsmatrix. Analog in einem unit¨aren Raum von Funktionen: Vollst¨andigkeit ⇔ X XZ f (x) = en (x) · (en , f ) = en (x) en (y)f (y) dy n
n
X
f¨ ur beliebige Funktionen f . Die Vollst¨andigkeit eines orthonormalen Funktionensystems {en } kann also auch dadurch charakterisiert werden dass die Gr¨oße X en (x) en (y) δX (x, y) := (3.17) n
(wie die Einheitsmatrix im endlichdimensionalen Fall) die Eigenschaft hat, dass sie beliebige Vektoren “reproduziert”: Z δX (x, y) f (y) dy = f (x). X
Allerdings ist δX (x, y) keine Funktion: einerseits ist δX (x, y) = 0 wenn x 6= y, weil das Integral gar nicht vom Verlauf der Funktion f an Punkten y 6= x abh¨angt.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
31
R Andererseits ist X δX (x, y)dy = 1. Also kann δX (x, x) keine endliche Zahl sein. (Das ist der “Preis” daf¨ ur, dass wir bei der Herleitung Summe und Integral vertauscht hatten!) Mit “verallgemeinerten Funktionen” wie δX (x, y) befasst sich Kap. 5. Alle in (1)–(3) angegeben Beispiele von Funktionensystemen sind tats¨achlich vollst¨andig. Dies h¨angt damit zusammen, dass man sie als L¨osungen der Eigenwertgleichungen zu allen m¨oglichen Eigenwerten gefunden hat. Methoden der linearen Algebra lassen sich auf Funktionenr¨aume u ¨bertragen. Insbesondere wird die Fourier-Zerlegung dadurch zu einer Zerlegung nach einer Basis von Eigenvektoren eines Differentialoperators (n¨amlich −i∂ϕ ). Schmidt’sches Orthonormierungs-Verfahren Manchmal ist ein System S von Funktionen gegeben, das jedoch nicht orthogonal bzgl des relevanten Skalarproduktes sind. Bsp: die Polynome pn (x) = xn (n ∈ N0 ) bzgl des Lebesgue-Maßes auf dem Intervall [−1, 1]. Man kann dann aber immer ein orthonormales Funktionensystem gewinnen: Man w¨ahlt irgendeine Funktion 0 6= f1 ∈ S und setzt e1 := f1 /||f1 ||. Dann w¨ahlt man eine zweite Funktion f2 ∈ S, die kein Vielfaches von f1 ist. Dann ist fˆ2 = f2 − (e1 , f1 )f1 orthogonal zu e1 und 6= 0. Man setzt e2 := fˆ2 /||fˆ2 ||. So geht es weiter: hat man die ersten n orthonormalen Basisvektoren, so w¨aP hlt man sich fn+1 ∈ S linear unabh¨angig von e1 , . . . , en , definiert fˆn+1 = fn+1 − ni=1 (ei , fi )ei und setzt en+1 := fˆn+1 /||fˆn+1 ||. Wenn es keine weiteren linear unabh¨angigen Funktionen mehr gibt, so hat man eine Orthonormalbasis des von S aufgespannten n-dimensionalen unit¨aren Raumes gefunden. Ist dieser dagegen unendlichdimensional, so bricht das Verfahren nie ab. Bsp: Polynome pn (x) = xn auf [−1, 1] ⇒ en = Legendre-Polynome (Kap. 2.4; bis auf Normierung und Vorzeichen).
3.3
Fourier-Integral
¨ Ziel: Darstellung von Funktionen f (x) auf der gesamten reellen Achse als “Uberikx lagerung” von Exponentialfunktionen e . Strategie: Man ersetze f (x) durch Hilfsfunktionen f (L) (x), die im Intervall (−L/2, L/2) mit f (x) u ¨bereinstimmen und außerhalb periodisch fortgesetzt werden. Mit L → ∞ konvergieren diese Fn f (L) punktweise gegen f . (L) Die Fourier-Reihe von f (L) mit Fourier-Koeffizienten fn gibt also f in dem Intervall richtig wieder. Indem man L → ∞ gehen l¨asst, wird f in einem immer gr¨oßeren Intervall und schließlich in ganz R richtig dargestellt. Frage: Wie ist der Grenzwert der Fourier-Reihen zu verstehen? Die in der Fourier-Reihe auftretenden Wellenzahlen kn (L) = 2πn/L “r¨ ucken mit L → ∞ immer dichter zusammen”. Wir erwarten, dass die diskreten F-Koeffizienten zu einer kontinuierlichen Funktion werden.
zB Fischer-Kaul Bd 2, § 12
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
32
Wir nehmen zun¨achst an, dass die Funktion f stetig ist und mit x → ±∞ schnell genug abf¨allt, sodass die folgenden Integrale existieren: Z +L/2 1 fˆ(k, L) = √ f (x)e−ikx dx, 2π
und mit L → ∞ konvergieren: 1 fˆ(k) = √ 2π
Z
−L/2 +∞
f (x)e−ikx dx.
(3.18)
−∞
(L) Nach den Ergebnissen aus √ Kap. 3.1 sind die Fourier-Koeffizienten von f gerade die Funktionswerte ( 2π/L) fˆ(kn (L), L). Daher wird die Fourier-Reihe (3.1) zu X 1 X 2π ˆ f (L) (x) = fn(L) e2πinx/L = √ f (kn (L), L) eikn (L)x .
2π
n∈Z
n∈Z
L
Im Limes L → ∞ d¨ urfen wir einerseits fˆ(·, L) durch fˆ(·) ersetzen, andererseits = ∆k → wird aus der Summe gerade die Riemann’sche Approximation (mit 2π L dk) f¨ ur das Integral, also Z +∞ 1 f (x) = √ fˆ(k)eikx dk. (3.19) 2π
−∞
Die Zuordnung f 7→ fˆ, (3.18), bezeichnet man als Fourier-Transformation, und fˆ 7→ f , (3.19), als inverse Fourier-Tr, oder Fourier-Darstellung von f . Satz 3.4: Wenn f : R → C stetig ist (oder endlich viele Sprungstellen hat) R 1 und L -integrierbar ist (dh, das Integral ||f ||1 = |f (x)|dx ist wohldefiniert und < ∞), dann existieren die Fourier-Amplituden fˆ(k), (3.18), die Funktion fˆ ist stetig und beschr¨ankt, und es gilt die Fourier-Darstellung (3.19) von f (im Sinne gleichm¨aßiger Konvergenz, wenn das Integral bei |k| < Λ abgeschnitten wird, und Λ → ∞). Wie in Kap. 3.2 bringt die “Vollst¨andigkeitsrelation” der Fn ek (x) = eikx Z 1 dk eik(x−y) = δ(x − y) ≡ δR (x, y) (3.20) 2π R zum Ausdruck, dass (3.18) und (3.19) zueinander inverse Transformationen sind (dh, man kann die urspr¨ ungliche Funktion f aus der FT fˆ zur¨ uckgewinnen). Verallgemeinerung der Fourier-Tr in mehreren Variablen: Z Z 1 1 ~ ~ i k·~ x n f (~x) = f (~x)e−ik·~x dn x. fˆ(~k)e d k mit fˆ(~k) = n/2 n/2 (2π)
Rn
(2π)
Rn
In der Physik hat man es auch oft mit Funktionen von Ort und Zeit zu tun, die man in beiden (oder jeder einzelnen) Fourier-transformieren m¨ochte. Alle Eigenschaften der Fourier-Tr in einer Variablen u ¨bertragen sich mutatis mutandis auf mehrere Variablen.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
33
Anwendungen: Beugung am Spalt Beugung einer ebenen Welle am Spalt der Breite D. Nach dem Huygens’schen Prinzip geht von jedem Punkt innerhalb des Spaltes eine “Elementarwelle” aus. Alle EW sind in Phase bei gleicher Amplitude. Auf einem entfernten Schirm in Richtung α unterscheiden sich aber die Laufwege der EW vom Durchtrittspunkt y ∈ I = (−D/2, D/2) um y sin α ⇒ Phasenverschiebung ky sin α (wobei k = 2π/λ = ω/c). Die Amplitude ergibt sich durch Addition der phasenverschobenen EW: Z +D/2
A(α) ∼
dy e−ik sin αy .
−D/2
Dies ist die Fourier-Transformierte χˆI (k sin α), wenn χI die charakteristische Funktion des Spalt-Intervalls I = [− D2 , D2 ] ist. Die Berechnung ergibt 1 2 sin(Dk/2) k 2π
χˆI (k) = √
⇒
A∼
sin( 12 Dk sin α) . k sin α
Die Position auf dem Schirm in der Entfernung R ist x = R sin α, sodass A(x) ∼
D sin( 2R · kx) kx
Die k-abh¨angige Skalierung des Beugungsbildes f¨ uhrt zu “Beugungsfarben”. Das Argument verallgemeinert sich auf Mehrfach-Spalte (man ersetze nur χI durch die charakteristische Funktion aller Spalte), und auf L¨ocher der Form L: die Amplitude ist dann (bis auf Skalierung) die zweidimensionale FT von χL . Elementare Regeln Einige elementare Regeln: fa (x) := f (x − a)
⇒
fλ (x) := f (λx)
⇒
f b (x) := eibx f (x)
fba (k) = e−ika fˆ(k) fbb (k) = fˆ(k − b)
⇒
fbλ (k) = |λ|−1 fˆ(k/λ).
(3.21) (3.22) (3.23)
Die Fourier-Tr f¨ uhrt Differentiation in Multiplikation mit dem Argument u ¨ber: n f (k) = (ik)n · fˆ(k) ∂d
und
n f )(k) = (i∂ )n fˆ(k). \ (x k
(3.24)
Anwendung: Differentialgleichungen Man macht sich zunutze, dass die Fourier-Tr Ableitungen in Multiplikation umwandelt. So reduziert sich die Wellengleichung ∂t2 f (t; x) − c2 ∆x f (t; x) = 0 durch Fourier-Tr bzgl der Zeit auf c2 ∆x fˆ(ω; x) = −ω 2 fˆ(ω, t) (vgl (2.18)), und die W¨armeleitungs-Gleichung ∂t f (x; t) = C · ∆f (x; t) durch Fourier-Tr bzgl x in die gew¨ohnliche DGl ∂t fˆ(k; t) = −Ck 2 fˆ(k, t) (mehr dazu in Kap. 6).
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
34
Parseval’sche Gleichung Die Parseval’sche Gleichung (3.4) f¨ ur die Hilfsfunktionen f (L) lautet Z −L/2 X 2π 1 |f (L) (x)|2 dx = |fˆ(kn (L), L)|2 . 2 L
−L/2
n∈Z
L
Im Limes L → ∞ erh¨alt man die kontinuierliche Parseval’sche Gleichung Z ∞ Z ∞ 2 |f (x)| dx = |fˆ(k)|2 dk. (3.25) −∞
−∞
Diese Identit¨at kann man auch so ausdr¨ ucken: Satz 3.5: Falls f : R → C L2 -integrierbar ist (dh, das Integral ||f ||22 ist wohldefiniert und < ∞), dann ist auch fˆ L2 -integrierbar, und es gilt ||f ||2 = ||fˆ||2 . Anwendung: “Unsch¨ arfe”
R Sei f eine L2 -integrierbare Funktion, oBdA |f (x)|2 dx = ||f ||22 = 1. Man erh¨alt ein Maß f¨ ur die “Breite” der Funktion f , indem man p(x) = |f (x)|2 als statistische Verteilung der Variablen x auffasst (also gewichtete Mittelwerte bilR det: zB hxif = x·p(x) dx), und dann die Streuung (Schwankungsbreite, Varianz) dieser Verteilung berechnet: (∆x)2 := h(x − hxif )2 if = hx2 if − hxi2f . Je gr¨oßer ∆x, desto breiter ist die Funktion f . Dank Satz 3.5 (Parseval) ist fˆ ebenfalls normiert, und man kann |fˆ(k)|2 als Verteilungsfunktion der Variablen k auffassen, um die “Breite” von fˆ zu messen. Behauptung: je sch¨arfer f , desto unsch¨arfer fˆ. Genauer: es gilt immer 1 4
(∆x)2 · (∆k)2 ≥ .
(3.26)
Wenn zB zur optischen Abbildung eines Objektes nur Licht mit einer maximalen Wellenzahl zur Verf¨ ugung steht (obere Grenze an ∆k), dann gibt es eine untere Grenze f¨ ur ∆x, dh das Bild wird unscharf. Beweis: Wir k¨onnen ohne Beschr¨ankung der Allgemeinheit annehmen, dass die Mittelwerte hxif und hkifˆ Null sind, denn durch die Ersetzung f (x) 7→ eik0 x f (x − x0 ), fˆ(k) 7→ e−i(k−k0 )x0 f (k − k0 ) kann man die Mittelwerte um x0 bzw k0 verschieben, ohne die Streuungen zu ver¨andern. Mit a(x) = xf (x) und b(x) = f ′ (x) ist (∆x)2 = hx2 if = ||a||22 und (∆k)2 = hk 2 ifˆ = ||b||22 (vgl (3.11), (3.15) und (3.24)). Nun betrachten wir die Norm der Funktionen g(x) = a(x) + λb(x), λ ∈ R: ||g||22 = ||a||22 + λ((a, b) + (b, a)) + λ2 ||b||22 . R R R Hier ist (a, b) + (b, a) = (xf ∗ f ′ + f ′∗ xf )dx = (xf ∗ f )′ dx − f ∗ f dx. Das erste Integral ist = 0, das zweite = 1. Es folgt ||a||22 − λ + λ2 ||b||22 ≥ 0
∀ λ ∈ R.
Das Minimum wird bei λ = 1/(2||b||22 ) angenommen, also ||a||22 − 1/(4||b||22 ) ≥ 0.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
35
Asymptotische Eigenschaften Z
Aus (3.24) und der Parseval’schen Gleichung folgt, dass Z ∞ Z ∞ Z ∞ 2n 2 2n ˆ 2 n 2 |∂kn fˆ(k)|2 dk. (3.27) x |f (x)| dx = k |f (k)| dk, |∂x f (x)| dx =
∞
−∞
−∞
−∞
−∞
Hieran erkennt man einen Zusammenhang zwischen Differenzierbarkeit von f und Abfallverhalten von fˆ: wenn die linke Seite endlich ist, ist auch die rechte Seite endlich. Umgekehrt: fehlende Differenzierbarkeit von f (x) entspricht einem schlechten vonR fˆ(k) (und umgekehrt). R p Abfall-Verhalten −x2 Bsp: |x| · e . Offenbar ist |f (x)|2 dx < ∞ w¨ahrend |f ′ (x)|2 dx bei x = 0 R R divergiert. Daher konvergiert |fˆ(k)|2 dk, w¨ahrend k 2 |fˆ(k)|2 dk divergiert, dh, |fˆ(k)|2 f¨allt schneller als |k|−1 , aber nicht schneller als |k|−3 ab. In (3.19) muss die Fn fˆ hinreichend schnell abfallen, damit das Integral konvergieren kann. Eine etwas weitergehende Aussage ist Satz 3.6 (Riemann-Lebesgue): fˆ L1 -integrierbar ⇒ limx→±∞ |f (x)| = 0. Intuitiv: je schneller die komplexe PhaseR eikx mit k oszilliert (x groß), desto kleiner ist das “phasen-gemittelte” Integral dk fˆ(k)eikx (f (x) klein). Beweis: Falls fˆ stetig differenzierbar ist und kompakten Tr¨ager hat, kann man partiell integrieren: Z Z −1 Z cst 1 ′ ikx ikx ˆ ˆ . dk f (k)e ≤ dk |fˆ′ (k)| = dk f (k)e = ix |x| |x| Dann f¨allt f (x) sogar mindestens wie 1/|x| ab. Anderenfalls kann man fˆ durch Fn gn mit den genannten Eigenschaften approximieren sodass ||fˆ − gn ||1 < 1/n, und sch¨atzt die beiden Terme Z Z Z ikx ikx ˆ ˆ dk f (k)e = dk (f (k) − gn (k))e + dx gn (k) eikx getrennt ab: F¨ ur jedes n ist dann limx→∞ |
R
dk fˆ(k) eikx | ≤ n1 , also = 0.
Eine beliebig oft stetig differenzierbare Funktion heißt glatt. Eine Funktion, die schneller als jede negative Potenz abf¨allt (limx→±∞ |xN f (x)| = 0 f¨ ur alle N ∈ N), heißt schnell-abfallend. Eine glatte Funktion, die zusammen mit allen ihren 2 Ableitungen schnell abf¨allt, heißt Schwartz-Funktion. (Bsp: e−x · Polynom(x).) Der lineare Raum der Schwartz-Funktionen heißt Schwartz-Raum S(R). Eine Versch¨arfung von Satz 3.6 ist Satz 3.7: Die Fourier-Transformierte einer Schwartz-Funktion ist wieder eine Schwartz-Funktion. Beweis: Weil f Schwartz ist, sind auch alle Funktionen xn f (x) Schwartz, also sind deren Ableitungen ∂xm (xn f (x)) Schwartz und insbesondere quadratintegrabel. Dank (3.25) sind dann die Funktionen k m ∂kn fˆ(k) qu-int, also ist fˆ beliebig oft diffbar und die Ableitungen fallen schnell ab. Also ist fˆ Schwartz.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
36
Faltung Die FT eines Produktes f (x)g(x) ist das Faltungsintegral Z 1 1 c f g(k) = √ dk ′ fˆ(k ′ )ˆ g (k − k ′ ) ≡ √ (fˆ ∗ gˆ)(k). 2π
2π
(3.28)
(Beweis: Fourier-Darstellung von f und g als Integrale u ¨ber k ′ und k ′′ und Ersetzen der Integrationsvariablen k ′′ durch k = k ′′ + k ′ .) Ebenso: √ (3.29) f[ ∗ g(k) = 2π fˆ(k) · gˆ(k) Anwendung: “Gl¨ atten durch Falten”: Sei f (x) eine nicht-glatte Funktion (oder Distribution, Kap. 5), deren FT polynomial beschr¨ankt ist. Wir “mitteln” f (x) in der N¨ahe von x mit einer Schwartz2 2 Funktion g, zB g(a) ∼ e−a /a0 : Z ˜ f (x) = g(a) f (x − a) da ≡ (g ∗ f )(x). R
Dann ist f˜ glatt. Denn weil g glatt ist, f¨allt gˆ schnell ab. Weil fˆ polynomial √ beschr¨ankt ist, f¨allt auch 2π fˆ · gˆ = f[ ∗ g schnell ab, also ist f ∗ g glatt.
3.4
Oszillierende Integrale
Der Satz 3.6 l¨asst sich auch auf Integrale der Art Z I(t) = dk f (k) e−itg(k) u ¨bertragen, wenn g eine streng monoton wachsende (oder fallende) reelle Funktion ist: durch Substitution ω = g(k) mit Umkehrfunktion k = γ(ω) wird das Integral zu Z I(t) =
dω h(ω)e−iωt ,
wobei h(ω) = γ ′ (ω) · f (γ(ω)). Dies ist die FT von h. Sofern h die Voraussetzung von Satz 3.6 erf¨ ullt, also L1 -integrierbar ist, folgt wieder, dass limt→±∞ I(t) = 0. In vielen F¨allen kann man dann durch partielle Integration zeigen, dass auch ′ −itg(k) R e , was tn I(t) f¨ ur große t gegen Null geht. zB n = 1: tI(t) = −i dk gf′(k) (k) R −iωt man wieder auf die Form = −i dω h1 (ω)e transformieren kann. Ist auch h1 absolut-integrierbar, so f¨allt I(t) schneller als 1/t ab. Geht dies f¨ ur alle n (zB weil f und g reell-analytisch sind und f schnell genug abf¨allt, sodass die so produzierten Fn hn (ω) alle absolut-integrierbar sind), so f¨allt I(t) sogar schneller als jede Potenz ab, vgl Satz 3.7 f¨ ur g(k) = k, g ′ (k) = 1. ¨ Zeigen Sie auf diese Weise, dass das oszillierende Integral I(t) = R ∞ Ubung: −k −itk2 dk ke e wie ∼ const./t abf¨allt. Es reicht hier aus, dass g(k) = k 2 auf 0 dem Tr¨ager R+ von f (k) monoton ist und f (k) bei k = 0 linear gegen Null geht!
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
37
Oszillierende Integrale mit nicht-monotonen Funktionen g(k) im Exponenten haben dagegen ein charakteristisch langsameres Abfallverhalten: g m¨oge einen station¨aren Punkt k0 besitzen mit g ′ (k0 ) = 0 und g ′′ (k0 ) 6= 0: Dann entwickelt ur t > 0) man g(k) ≈ g0 + 12 (k −k0 )2 g ′′ (k0 )+. . . (Taylor) und substituiert (oBdA f¨ √ y = t · (k − k0 ). Dann wird Z √ √ e−itg0 2 ′′ dyf k0 + y/ t e−iy g (k0 )+O(1/ t) . I(t) = √ t Dieses Integral ergibt im Limes t → ∞ den Wert Z √ f (k0 ) 2 ′′ I0 = dyf (k0 )e−iy g (k0 )/2 = e−iπ/4 2π · p g ′′ (k0 ) p √ falls g ′′ (k0 ) > 0 (anderenfalls e+iπ/4 2πf (k0 )/ −g ′′ (k0 )). Das Integral I(t) weist √ also asymptotisch bei t → ∞ den oszillierenden langsamen Abfall I0 · e−itg0 / t auf. Bei mehreren station¨aren Punkten erh¨alt man eine Summe solcher Beitr¨age. Approximation der station¨ aren Phase: Schnell oszillierende Integrale werden durch die station¨aren Punkte der Phasenfunktion dominiert. Interpretation: Alle anderen Beitr¨age werden durch die Interferenz der schnell oszillierenden Integranden unterdr¨ uckt. Anwendung: Gruppengeschwindigkeit von Wellenpaketen ¨ Ein Wellenpaket sei als Uberlagerung von ebenen Wellen gegeben: Z A(x, t) = dkF (k)ei(kx−ω(k)t) . Hier wird nur u ¨ber die Wellenzahl k integriert, weil die Frequenz ω(k) durch das Medium der Wellenausbreitung festgelegt sei, zB Licht: ω = c|~k|; Hohlleiter: p 2 2 2 ω = ω0 + c k ; uU sehr kompliziert in polarisierbaren Medien! Wir interessieren uns f¨ ur die Amplitude A(x, t) am Ort x = vt mit einer vorgegebenen Geschwindigkeit v, im Limes großer Zeiten t; gesucht sind diejenigen v, f¨ ur die die Amplitude nicht schnell abf¨allt: dies sind die Gruppengeschwindigkeiten (= tats¨achliche Ausbreitungsgeschwindigkeiten) des Wellenpakets. Die Amplitude ist ein oszillierendes Integral Iv (t) wie oben, wobei die osz Fn im Exponenten gv (k) = ω(k) − vk ist. Die Approx der statPh besagt, dass die Amplitude mit großem t sehr schnell gegen Null geht, es sein denn es gibt einen ¨ station¨aren Punkt ∂k gv (k0 ) = 0. Aquivalent: d ω ! (k0 ) = v. dk Die Amplitude |A(x, √ t)| verh¨alt sich also l¨angs der Trajektorie x = vt wie ∼ F (k0 )ei(k0 v−ω(k0 ))t / t, wobei k0 durch Aufl¨osen dieser Bedingung als Fn von v bestimmt ist. Wenn aber F (k0 ) = 0 ist, f¨allt das Integral sehr schnell ab (denn im Bereich des Tr¨agers von F ist gv monoton). MaW: Die Gruppengeschwindigkeiten sind diejenigen Geschw v = dω(k)/dk mit F (k) 6= 0. Diese sind iA verschieden von den Phasengeschwindigkeiten ω(k)/k.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
4
38
Theorie komplex-analytischer Funktionen
zB Fischer-Lieb Kap. I-VI
Der Cauchy’sche Integralsatz (Satz 4.1) und der Residuensatz (Satz 4.7) sind zur Berechnung von Integralen und Fourier-Transfn außerordentlich n¨ utzlich.
4.1
Komplexe Differenzierbarkeit, Analytizit¨ at
Im folgenden ist G immer ein Gebiet ≡ eine offene Teilmenge G ⊂ C. Eine Funktion f : G → C kann man auch als ein Paar von reellen Funktionen in zwei reellen Variablen auffassen: mit z = x + iy ist f (z) = g(x, y) + ih(x, y). f heißt an der Stelle z ∈ G komplex differenzierbar, wenn der Grenzwert lim
zn →z
f (zn ) − f (z) =: f ′ (z) zn − z
f¨ ur alle gegen z konvergierenden Folgen zn (innerhalb G) existiert und unabh¨angig von der gew¨ahlten Folge ist. Beispielsweise kann man z aus der reellen oder aus der imagin¨aren Richtung ann¨ahern, dh, z = (x + δx) + iy oder z = x + i(y + δy) mit reellen δx, δy → 0. Dr¨ ucken wir die jeweiligen Limiten durch die Real- und Imagin¨arteile g und h aus, so finden wir in den beiden F¨allen g(x + δx, y) − g(x, y) h(x + δx, y) − h(x, y) + i lim = ∂x g + i∂x h, δx δx δx→0 δx→0 g(x, y + δy) − g(x, y) h(x, y + δy) − h(x, y) bzw lim + i lim = ∂y h − i∂y g. iδy iδy δy→0 δy→0
lim
Damit f also komplex differenzierbar ist, m¨ ussen die reellen Funktionen g und h partiell differenzierbar sein, und die Cauchy-Riemann’sche DGln gelten: ∂x g(x, y) = ∂y h(x, y)
und
∂y g(x, y) = −∂x h(x, y).
(4.1)
Die CR-DGln sind notwendig und auch hinreichend f¨ ur komplexe Diff’barkeit. f (z) ist in einem Gebiet G ⊂ C (komplex) analytisch (auch: holomorph), falls f (z) f¨ ur alle z ∈ G komplex differenzierbar ist. Eine bessereP Charakterisierung analytischer Fn gibt allerdings Satz 4.4 (s.u.): Potenzreihen n an (z − z0 )n (an ∈ C) sind innerhalb des Konvergenzradius (Kap. 1) um z0 analytisch. Bsp: alle Polynome in z; ez in G = C; 1/z in C \ {0}; 1/ sin(πz) in C \ Z; Gegenbeispiele: z¯, |z|, Re z, “alles, wof¨ ur man die komplexe Konjugation braucht”. Bemerkung: Aus den CR-DGln folgt, dass (∂x2 + ∂y2 )g = (∂x2 + ∂y2 )h = 0, dh, Real- und Imagin¨arteil einer analytischen Funktion sind harmonische Funktionen. (Daher ist komplexe Analytizit¨at viel st¨arker als die reelle Analytizit¨at in Kap. 1.2!) Man kann sich das zunutze machen, um Potentialprobleme ∆φ(x, y, z) = 0 (zB in der Elektrodynamik) mit Zylindersymmetrie (∂z φ = 0) zu l¨osen. Summen und Produkte von (in demselben Gebiet) analytischen Funktionen sind analytisch. g ◦ f ist in G analytisch, wenn f in G und g in f (G) analytisch sind. 1/f (z) ist in G analytisch, wenn f in G analytisch und 6= 0 ist.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
39
Eine Funktion, die auf ganz C analytisch ist, heißt ganz. Bsp: Alle Polynome sind ganz. ez , sin z und cos z sind ganz. 1/z und log z (vgl Kap. 4.4) sind nicht ganz. Punkte, an denen eine Fn f (z) nicht analytisch (oder gar nicht definiert) ist, heißen (analytische) Singularit¨ aten. Eine Singularit¨at z0 heißt isoliert, wenn f (z) in einer Umgebung von z0 mit Ausnahme des Punktes z0 analytisch ist, zB 1/z bei z = 0. Eine isolierte Singularit¨at heißt behebbar, wenn man der Funktion an der Stelle z0 einen Wert zuweisen kann, sodass die so “fortgesetzte” Fn auch bei z0 analytisch ist (Bsp: f (z) = z/z, f (0) := 1). Eine isolierte Singularit¨at z0 ist ein Pol der Ordnung n, wenn (z −z0 )n f (z) bei z0 eine behebbare Singularit¨at hat; maW: in einer Umgebung von z0 ist f (z) = g(z)/(z − z0 )n mit einer analytischen ¨ Funktion g, g(z0 ) 6= 0. Aquivalent: 1/f (z) hat eine Nullstelle der Ordnung n. Bsp: f (z) = sinz z ist u ¨berall definiert und analytisch außer bei z = 0. Die Singularit¨at ist behebbar: durch f (0) := 1 wird f zu einer Funktion P ganzen n 2n fortgesetzt. (Beweis der Analytizit¨at bei z = 0: Potenzreihe (−1) z /(2n+1)!) f (z) = ez /(1 − z)2 hat eine isolierte Singularit¨at bei z = 1. Multipliziert man mit (1 − z)2 , so ist z = 1 eine behebbare Singularit¨at, und die Fortsetzung durch g(1) := e ist auch bei z = 1 analytisch, dh, z = 1 ist ein Pol zweiter Ordnung.
f (z) = tan z hat bei allen z = (n + 12 )π (n ∈ Z, cos z = 0) Pole erster Ordnung.
4.2
Komplexe Integration
Eine Kurve C in C ist durch eine Parametrisierung z(t) = x(t)+iy(t) mit stetigen und st¨ uckweise glatten Funktionen x und y : T → R definiert, wobei T ⊂ R ein Intervall ist. Die “Richtung wachsenden t” bestimmt die Orientierung der Kurve. Dieselbe Kurve besitzt viele Parametrisierungen. Eine Kurve mit umgekehrter Orientierung betrachtet man allerdings als eine andere Kurve, die man C −1 nennt. Kurven kann man in offensichtlicher Weise “aneinanderst¨ uckeln”, vorausgesetzt der Anfangspunkt der zweiten Kurve ist der Endpunkt der ersten Kurve: C2 ◦ C1 . Eine geschlossene Kurve hat denselben Anfangs- wie Endpunkt. Sei f : G → C eine stetige Funktion mit Definitionsbereich G, und C eine Kurve innerhalb G. Dann definiert man Z Z f (z)dz := f (z(t))z(t) ˙ dt. C
T
Der Integrand ist eine komplexe Funktion von t, deren Real- und Imagin¨arteil separat integriert werden. An den m¨oglichen “Knicken” der Kurve ist z(t) ˙ nicht definiert; man versteht das Integral dann als die Summe der glatten Teilst¨ ucke. Das Integral h¨angt nicht von der gew¨ahlten Parametrisierung ab, aber sehr wohl von der Orientierung, mit der C durchlaufen wird: Z Z f (z)dz = − f (z)dz. (4.2) C −1
C
Das Integral ist additiv beim Zusammenst¨ uckeln von Kurven.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
40
Kurvenintegrale u ¨ber analytische Fn besitzen bemerkenswerte Eigenschaften: Satz 4.1 (Cauchy I): Ist f in G analytisch und C eine geschlossene Kurve in G, die innerhalb G stetig zu einem Punkt kontrahiert werden kann, so ist I f (z)dz = 0. C
R
¨ Aquivalent: f (z)dz ¨andert sich nicht, wenn man die Kurve bei festgehaltenen C Anfangs- und Endpunkten innerhalb des Analytizit¨atsgebietes stetig deformiert. Zum Beweis schreiben wir z = x1 + ix2 und f (z) = f1 (x1 , x2 ) − if2 (x1 , x2 ). H H Dann ist f dz = f1 dx2 + f2 dx2 + i(f1 dx2 − f2 dx1 ), also C f (z)dz = C f~(~x) · H d~x + i C ~g (~x) · d~x, wobei f~ ∈ R3 und ~g = ~e3 × f~ keine 3-Komponente haben und nicht von x3 ∈ R3 abh¨angen, und die Kurve ganz in der 1-2-Ebene verl¨auft. Dann ~ f~ = 0 und rot ~g = 0 an. Satz 4.1 ist also nur nehmen die CR-DGln die Form rot R H ~ = ~ f~ · d~a (C = Rand von A)! rot ein Spezialfall des Satzes von Stokes: C f~ · dx A
Die Bedingung, dass C innerhalb G kontrahierbar ist, ist essentiell: w¨ahlen wir etwa f (z) = 1/z und parametrisieren denH Einheitskreis C1 durch z = eit = R 2π cos t + i sin t, dz = iz dt, so ist das Integral C dz = 0 i dt = 2πi nicht Null. z Auch der Satz von Stokes macht ja diese Voraussetzung! Ein Gebiet G heißt einfach-zusammenh¨ angend, wenn jede geschlossene Kurve in G zu einem Punkt kontrahierbar ist. Ist G nicht einfach-zusammenh¨angend (wie C\{0} im vorigen Beispiel), und sind aber C1 und C2 zwei geschlossene Kurven, die innerhalb G ineinander deformierbar (“homotop”) sind (etwa zwei konzentrische Kreise mit Mittelpunkt 0 in C\{0}), so gilt I I f (z)dz = f (z)dz. C1
C2
Denn man kann sich eine innerhalb G kontrahierbare geschlossene Kurve C konstruieren, indem man erst C1 folgt, dann l¨angs einem beliebigen Verbindungsst¨ uck V zu einem Punkt auf C2 l¨auft, dann C2 in umgekehrter Richtung durchl¨auft und auf V in umgekehrter Richtung wieder zum Anfangspunkt zur¨ uckkehrt. Dann ist nach Satz 4.1 und (4.2) I Z Z Z Z 0= f (z)dz = f (z)dz + f (z)dz − f (z)dz − f (z)dz. C
C1
V
C2
V
In dem genannten Beispiel kann also der Einheitskreis sogar durch jede beliebige geschlossene Kurve ersetzt werden, die den Pol bei z = 0 einmal in positivem Umlaufsinn uml¨auft! Das Integral hat immer den Wert 2πi. Sei nun f in einem einfach-zusammenh¨angenden Gebiet G analytisch, und z0 ∈ G. Sei C eine geschlossene Kurve in G, die z0 einmal in positivem Umlaufsinn uml¨auft. Wir betrachten das Integral I f (z) dz. C
z − z0
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
41
Der Integrand ist analytisch in G\{z0 }. Nach Satz 4.1 h¨angt das Integral nicht von der Wahl von C (mit den genannten Eigenschaften) ab. Wir d¨ urfen also C als einen beliebig kleinen Kreis um z0 w¨ahlen. Dann d¨ urfen wir aber f (z) im Z¨ahler mit beliebig guter Genauigkeit durch f (z0 ) ersetzen und vor das Integral ziehen: Satz 4.2 (Cauchy II): Unter den genannten Voraussetzungen gilt I I f (z) dz dz = f (z0 ) = 2πi · f (z0 ). C
z − z0
C
z − z0
Eine erste Konsequenz dieses Satzes ist, dass die Werte einer analytischen Funktion l¨angs einer beliebigen im Analytizit¨atsgebiet kontrahierbaren Kurve die Werte der Funktion im Inneren der Kurve festlegen. Durch Ableiten nach z0 : I f (z) (n) 2πi · f (z0 )/n! = dz n+1 C
(z − z0 )
erhalten wir auch das folgende bemerkenswerte Resultat. Satz 4.3: Ist f (z) in G analytisch, so ist auch f ′ (z) in G analytisch. Also ist eine einmal komplex diff’bare Fn automatisch beliebig oft komplex diff’bar! Damit sind auch Re f (z) = g(x, y) und Im f (z) = h(x, y) beliebig oft partiell diff’bar. Die reellen Taylor-Reihen von g, h lassen sich komplex zusammenfassen: ∞ X an (z − z0 )n mit an = (∂zn f )(z0 ). (4.3) fTaylor (z) = n=0
n!
F¨ ur Kreiskurven um z0 in Satz 4.2 erh¨alt man |f (n) (z0 )| ≤ n!M/Rn (M = Maximum von |f (z)| l¨angs C), und kann damit sowohl den Konvergenzradius der Taylor-Reihe absch¨atzen: r ≥ R, als auch den Rest-Term (→ 0). Also konvergiert die TR mindestens in KR (z0 ) := {z : |z − z0 | < R} ⊂ G absolut gegen f (z): Satz 4.4: Jede analytische Funktion ist lokal als Potenzreihe (4.3) darstellbar, und umgekehrt ist jede absolut konvergente Potenzreihe innerhalb ihres Konvergenzkreises eine analytische Funktion. Mit n = 0 folgt dass |f (z0 )| ≤ M = Maximum von |f (z)| l¨angs jeder Kreislinie um z0 innerhalb G, und bei Gleichheit ist f konstant. Daraus folgen: Satz 4.5 (Maximumsprinzip): Ist f in G analytisch und nicht konstant, so kann |f (z)| innerhalb G kein Maximum annehmen. Wenn ein Maximum in G (=G inklusive Rand) existiert, dann muss es auf dem Rand von G liegen. Satz 4.6 (Liouville): Ist f (z) in ganz C analytisch und |f (z)| beschr¨ankt, dann ist f (z) konstant. Auch der Fundamentalsatz der Algebra (“Alle nicht-konstanten komplexen Polynome P (z) besitzen eine komplexe Nullstelle” oder “Die komplexen Zahlen sind algebraisch abgeschlossen”) l¨asst sich hiermit beweisen.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
42
Die wichtigste Schlussfolgerung ist aber Satz 4.7, mit dessen Hilfe sich viele Integrale “ohne zu integrieren” ausrechnen lassen: Wir definieren zun¨achst das Residuum. f (z) besitze einen Pol der Ordnung p an der Stelle z0 , dh, f (z) = g(z)/(z −z0 )p mit einer bei z0 analytischen Funktion g(z), g(z0 ) 6= 0. Dann ist Resz0 f :=
∂zp−1 g(z0 ) (p − 1)!
≡ lim (z − z0 )f (z) falls p = 1 . z→z0
(4.4)
Satz 4.7 (Residuensatz): G ⊂ C sei ein einfach-zhg Gebiet, und z0 ∈ G. f (z) sei in G\{z0 } analytisch und besitze bei z0 einen Pol der Ordnung p. C sei eine geschlossene Kurve in G, die den Punkt z0 einmal im positiven Umlaufsinn uml¨auft. Dann ist I f (z)dz = 2πi · Resz0 f. C
Hat f in G endlich viele Pole zk (eine solche Fn heißt meromorph), und uml¨auft C jeden von diesen nk -mal (mit der Konvention “negativer Umlaufsinn ⇒ n < 0”), so kann man C aus vielen Kurven zusammenst¨ uckeln (mit vorw¨arts und r¨ uckw¨arts durchlaufen Verbindungsst¨ ucken), die jeweils einen Pol einmal in positiver oder negativer Richtung umlaufen, und erh¨alt die allgemeine Formel I X f (z)dz = 2πi nk Reszk f. (4.5) C
k
Zum Beweis des Residuensatzes f¨ ur p = 1 wendet man nur Satz 4.2 auf die analytische Funktion g(z) = (z − z0 )f (z) und g(z0 ) := Resz0 f an. F¨ ur p > 1 p schreibt man f (z) = g(z)/(z − z0 ) und verwendet partielle Integration. Der Residuensatz erlaubt die schnelle Berechnung von Integralen von meromorphen Funktionen u ¨ber geschlossene Kurven.
Man kann aber auch Integrale u ¨ber R berechnen, indem man die reelle Achse in C “durch einen unendlich fernen Halbkreis” in der oberen oder unteren Halbebene C± zu einer geschlossenen Kurve C+ oder C− komplettiert. Voraussetzung ist, dass dieser Halbkreis “nichts beitr¨agt”, dh, dass die zu integrierende Funktion in C+ oder C− schnell genug abf¨allt. Insbesondere hilft ein Faktor eikz , um f¨ ur k > 0 (k < 0) den Weg in C+ oder C− zu schließen. R Bsp: (1) Die FT von f (x) = 1/(1 + x2 ) ergibt sich aus e−ikx /(x + i)(x − i). Falls k ≥ 0, kann man den Integrationsweg in C− schließen (der rationale Faktor stellt den Abfall auch f¨ ur k = 0 sicher). Dann umschließt C− den Pol bei z = −i Rmit negativem Umlaufsinn. Das Residuum ist e−ik(−i) /(−i − i) = 2i e−k , also ist eikx /(x2 + 1) = πe−k . Falls k ≤ 0, w¨ahlt man C+ ; diese Kurve uml¨auft den Polp bei z = +i im positiven Umlaufsinn. Das Residuum ist ek /2i. Damit ist fˆ(k) = π/2 e−|k| .
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
43
R (2) R sinx x e−ikx dx: da der Integrand auch bei z = 0 analytisch ist, darf man zun¨achst den Integrationsweg von der reellen Achse zu, sagen wir, R + i verschieben, wo Z¨ahler und Nenner einzelnR analytisch sind. Dann zerlegt man den Sinus R iz −iz i(1−k)z −i(1+k)z in (e − e )/2i und erh¨alt (1/2i) R+i e dz/z − (1/2i) R+i e dz/z. Je nach Vorzeichen von k + 1 bzw k − 1 schließt man den Integrationsweg in der um i verschobenen oberen oder unteren Halbebene. Da der einzige Pol bei z = 0 liegt und das Residuum = 1 ist, erh¨alt man im ersteren FallRf¨ ur das Integral den Wert 0, und im letzteren Fall −2πi (Umlaufsinn!). Damit ist R sinx x e−ikx dx = πχ[−1,1] (k). (3) Durch Verschieben des Integrationsweges in imagin¨arer Richtung (sowie qua2 dratischer Erg¨anzung und Variablen-Subst) berechnet man auch die FT von e−x .
4.3
Analytizit¨ at und Fourier-Transformation
Viele Funktionen f : R → C lassen sich leicht Fourier-transformieren, wenn sie Einschr¨ankungen von analytischen Funktionen sind, deren Analytizit¨ atsgebiet 1 1 1 die reelle Achse enth¨alt. Beispiel: 1+x2 = 1+z2 z∈R = (z+i)(z−i) z∈R und andere Beispiele zu Satz 4.7. Der folgende Satz beschreibt den Zusammenhang zwischen dem Tr¨ ager einer Funktion und den Analytizit¨ ats- und Wachstumseigenschaften ihrer FT: Satz 4.8 (Paley-Wiener): Sei f (x) eine stetige L1 -integrierbare Funktion. Dann gilt: f hat Tr¨ager in R− ⇔ fˆ ist in die obere komplexe Halbebene C+ analytisch fortsetzbar und fˆ(w) ist in C+ beschr¨ankt. Korollar: Ist f (x) = 0 f¨ ur x < a, so ist fˆ analytisch in C− und e−a Im (w) fˆ(w) ist in C− beschr¨ankt. Ist f (x) = 0 f¨ ur x > b, so ist fˆ analytisch in C+ und −b Im (w) ˆ e f (w) ist in C+ beschr¨ankt. Ist umgekehrt g(w) in einer Halbebene analytisch und durch C · ec Im (w) beschr¨ankt (C > 0, c ∈ R), so ist g|R die FT einer Fn (oder Distribution, Kap. 5), die bei x < c bzw bei x > c verschwindet. √ R Beweisidee: F¨ ur komplexe w = k+il definiert man 2π fˆ(w) := dxf (x)e−i(k+il)x R∞ ur jedes feste l > 0 ist also fˆl (k) = fˆ(w)Rdie FT der schnell = 0 dxf (x)elx e−ikx . F¨ abfallenden Funktion f (x)elx (x < 0!), und beschr¨ankt durch |f (x)|dx = ||f ||1 . Als Integral u ¨ber in w analytische Funktionen e−iwx ist fˆ(w) analytisch in w. √ R Umgekehrt verschwindet die inverse FT 2πf (x) = R dk fˆ(k)eikx f¨ ur x > 0 ˆ dank Satz 4.7, weil f in der oberen Halbebene analytisch ist und der Integrationsweg dort geschlossen werden kann: denn |eiwx fˆ(w)| = |fˆ(w)| · e−lx , wobei der erste Faktor beschr¨ankt ist und der zweite mit l → ∞ schnell abf¨allt. Das Korollar folgt (dank (3.21)) durch Ersetzung von x durch a − x bzw x − b.
Hat f Tr¨ager in einem Intervall [a, b], so hat die FT beide Eigenschaften des Korollars. fˆ ist also in ganz C analytisch (also ganz), und fˆ(w) ist in beiden imagin¨aren Richtungen exponentiell beschr¨ankt (durch ∼ ea Im w in C− und durch ∼ eb Im w in C+ ).
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
4.4
44
Analytische Fortsetzung
Ist f (z) in einem Gebiet G definiert und dort analytisch, und ist g(z) in einem gr¨oßeren Gebiet G′ ⊃ G analytisch und stimmt in G mit f (z) u ¨berein, so nennt man g analytische Fortsetzung von f . P n Bsp: Betrachten wir die Potenzreihe ∞ n=0 z . Diese definiert (Satz 4.4) innerhalb des Konvergenzkreises K1 (0) eine analytische Funktion f (z), die mit g(z) = 1/(1 − z) u ¨bereinstimmt. Offenbar ist g(z) eine analytische Fortsetzung der Potenzreihe f (z). W¨ahlen wir einen Punkt innerhalb K1 (0), etwa z0 = 21 (1+i), so k¨onnen wir Potenzreihe um z0 darstellen: f (z) = 1/((1 − z0 ) − Pf∞(z) auch als n n+1 (z − z0 )) = n=0 √(z − z0 ) /(1 − z0 ) . Der Konvergenzradius dieser Reihe ist r = |1 − z0 | = 1/ 2. Der Konvergenzkreis Kr (z0 ) liegt teilweise außerhalb K1 (0): dh, wir haben f (z) auf die Vereinigungsmenge K1 (0) ∪ Kr (z0 ) analytisch fortgesetzt. Auf diese Weise kann man f (z) in immer mehr Kreisgebiete fortsetzen (die alle den Pol z = 1 ber¨ uhren) und erh¨alt schließlich die Funktion 1/(1 − z) auf ganz C \ {1}. Wir k¨onnen dasselbe f¨ ur die Funktion log z versuchen, die zun¨achst in den Konvergenzkreisen um reelle z0 = r > 0 mit Radius r durch die Potenzreihe ∞ X z−r (−1)n+1 (z − r)n log z = log r + log 1 + = log r + n r
n=1
n
r
= eiϕ − 1. Die Summe ist = iϕ als Potenzreihe in ϕ. definiert ist, wobei z−r r Die Vereinigung all dieser Kreise ist die ganze “rechte Halbebene” Re z > 0, und dort gilt log z = log(reiϕ ) = log r + iϕ f¨ ur − 12 π ≤ ϕ < 21 π. Setzt man diese Funktion mithilfe weiterer Konvergenzkreise in der oberen Halbebene Im z > 0 fort, so findet man log z = log r+iϕ auch f¨ ur 0 ≤ ϕ < π. Setzt man dies schließlich durch Konvergenzkreise in der linken Halbebene fort, so erreicht man auch Werte 1 π < ϕ < 32 π, und so weiter. Insbesondere findet man so log(−1) = iπ. Setzt man 2 dagegen “durch die untere Halbebene hindurch” zu negativen ϕ fort, so findet man stattdessen log(−1) = −iπ. Die beiden so in der N¨ahe der negativen reellen Achse gefundenen analytischen Fortsetzungen unterscheiden sich gerade um 2πi. Die analytische Fortsetzung “um eine Singularit¨at herum” ist iA nicht eindeutig! Um dennoch von einer Funktion zu sprechen, denkt man sich die komplexe Ebene etwa l¨angs der negativen imagin¨aren Achse “aufgeschnitten” und u ¨ber den Schnitt hinaus in ein neues “Blatt” fortgesetzt; l¨auft man einmal um z = 0 herum, so gelangt man ins n¨achste Blatt, wo die Funktion einen anderen Wert hat als im ersten Blatt. So etwas nennt man eine Riemann’sche Fl¨ ache. Da jeder Umlauf den Logarithmus log z um √ 2πi erh¨oht, hat die RF des Logarithmus unendlich viele Bl¨atter. Die Funktion z ¨andert bei einem Umlauf nur ihr Vorzeichen; daher schließt das zweite Blatt nach den zweiten Umlauf wieder an p das erste Blatt an: diese RF hat nur zwei Bl¨atter. Andere Funktionen (zB (z − a)(z − b) mit reellen b > a) haben endliche Schnitte zwischen zwei Punkten, oder mehrere Schnitte . . . .
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
4.5
45
Laplace- und inverse Laplace-Trafo
Bei Problemen mit Dissipation (Reibung, Diffusion, W¨armeleitung) ist der typische zeitliche Verlauf ein exponentieller Abfall, und es ist nicht sinnvoll (und iA auch gar nicht m¨oglich), den Verlauf zu negativen Zeiten hin r¨ uckzurechnen. Die Laplace-Transformation einer Funktion f : R+ → C erlaubt die Analyse der beteiligten “Zerfallskonstanten” (dh, Beitr¨age der Art e−λt ). Wir definieren die Laplace-transformierte Funktion durch Z ∞ F (z) := e−tz f (t)dt.
(4.6)
0
Da e−tz f¨ ur t ≥ 0 in der rechten Halbebene Re z > 0 eine beschr¨ankte analytische Funktion ist, ist auch F (z) in der rechten Halbebene analytisch (man darf die Ableitung nach z im Integranden vornehmen!), vorausgesetzt √ f (t) w¨achst nicht selber exponentiell an. Setzen wir z = µ + iω, so ist F (z)/ 2π nichts anderes als die Fourier-Transformierte der Funktion e−µt f (t) (durch 0 fortgesetzt bei t < 0). Bsp: f (t) = e−λt ⇔ F (z) = 1/(z + λ)
mit einem Pol bei z = −λ.
Die “Zerfallskonstanten” der Funktion f (t) machen sich als Pole der LaplaceTransformierten F (z) bemerkbar. Falls f (t) ein Polynom ist, hat F (z) einen Pol bei z = 0. Falls f (t) selber exponentiell wie eλ0 t anw¨achst, ist F (z) immer noch definiert f¨ ur Re z > λ0 . Da die Laplace-Transformation “eigentlich” eine spezielle Fourier-Tr ist, erhalten wir auch die Funktion f (t) aus F (z) durch die inverse Fourier-Tr zur¨ uck: Z Z 1 1 eiωt F (µ + iω) dω ⇒ f (t) = ezt F (z) dz. (4.7) e−µt f (t) = 2π R 2πi C Hierbei ist C die um µ verschobene imagin¨are Achse (die immer rechts von allen Polen von F (z) verl¨auft) und dz = idω. Der Clou ist nat¨ urlich, dass der Integrand analytisch ist, sodass der Integrationsweg (innerhalb des Analytizit¨atsgebietes) deformiert werden darf. Die Singularit¨atenQvon F (z) ergeben dann die Zerfallskonstanten von f (t). Hat etwa F (z) = 1/ i (z + λi ) Pole bei z = −λi , so kann C in der linken Halbebene P geschlossen werden (Abfall des Faktors ezt ), und der Residuensatz ergibt f (t) = i Ai e−λi t zur¨ uck. Wie die Fourier-Tr kann man auch die Laplace-Tr verwenden, um partielle Differentialgleichungen zu l¨osen (vgl Kap. 6), indem man diese in eine Gleichung f¨ ur die Laplace-transformierte Fn F (z) umwandelt, und aus F (z) auf die eigentliche Fn r¨ uckschließt. Diese Methode wird insbesondere dann interessant, wenn man komplexe Prozesse mit einem Kontinuum von Zerfallskonstanten (Diffusion, W¨armeleitung) studieren will: dann wird die Laplace-Transformierte (statt Polen) Schnitte oder noch wildere Singularit¨aten in der linken Halbebene aufweisen.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
5 5.1
46 zB Fischer-Kaul Bd. 2, § 13
Distributionen Die δ-Funktion
Bereits formal bekannt (Kap. 3.2, Kap. 3.3): die δ-“Funktion” δ(x − y) ≡ δR (x, y) mit der Eigenschaft Z R
δ(x − y) f (x) dx = f (y)
f¨ ur beliebige stetige Funktionen. Kann als Grenzwert von Funktionen δn (x) = ng(nx)
R aufgefasst werden, wenn g irgendeine stetige Funktion mit g(x)dx = 1 ist: Z Z Z u g(u)du → f (y) g(u)du = f (y). ng n(x − y) f (x)dx = f y+ n R R R 2 2
urlich ist der Grenzwert keine Funktion. Zweckm¨aßig zB δn (x) = nπ e−n x . Nat¨ Trotzdem ist der Grenzwert der Integrale mit f (x) wohldefiniert. Man sollte die δ“Funktion” daher als lineares Funktional auffassen, das einer Funktion f eine Zahl δ(f ) zuordnet, n¨amlich den Wert f (0) Das schreibt R (“Evaluationsfunktional”). R man symbolisch als Integral: δ(f ) ≡ δ(x)f (x)dx := lim δn (x)f (x)dx = f (0). Auch die R Evaluation an einer anderen Stelle y ist ein solches Funktional: δy (f ) = f (y) = δ(x − y)f (x)dx. Mehr zum Begriff des Funktionals in Kap. 5.2. Mit Integralen u ¨ber die δ-Funktion kann man rechnen “wie mit einer Funktion” (man kann das jeweils durch Betrachtung des Grenzwertes der δn (x) begr¨ unden), zB Variablen-Substitution: Z Z −1 f (x)δ(λx)dx = |λ| f (x/λ)δ(x)dx = |λ|−1 f (0), R
R
und allgemeiner, wenn h(x) eine differenzierbare Funktion mit einfachen Nullstellen bei xi ist, also streng monoton in Umgebungen Ui von xi : Z X Z XZ dy f (x)δ(h(x))dx = , f (x)δ(h(x))dx = f (h−1 (y))δ(y) ′ −1 i U |h (h (y))| R h(U ) i i i wobei h−1 jeweils die eindeutige Umkehrfunktion innerhalb der Umgebung Ui ist, also insbesondere h−1 (0) = xi . Jedes dieser Integrale ist also = f (xi )/|h′ (xi )|. Man darf daher δ(h(x)) symbolisch als Summe u ¨ber die Nullstellen von h schreiben: X δ(x − xi ) 1 zB δ(h(x)) = δ(x), δ(x) = δ(−x). (5.1) ⇒ δ(λx) = ′ i
|h (xi )|
|λ|
Denn die Integrale mit einer beliebigen stetigen Fn f sind f¨ ur beide Seiten gleich. Die Ableitung der δ-Funktion wird “durch partielle Integration” definiert: Z Z ′ ′ δ (f ) = δ (x)f (x)dx = − δ(x)f ′ (x)dx = −f ′ (x) (ohne Randterme, weil ja δ(x) an den R¨andern verschwindet). Dies ist wohldefiniert, vorausgesetzt f ist stetig differenzierbar. Ebenso h¨ohere Ableitungen δ (n) .
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
47
Man kann die δ-Funktion selber als Ableitung der Heaviside’schen Stufenfunktion θ(x) (= 1 falls x > 0, = 0 sonst) auffassen: denn Z Z ∞ Z ∞ ′ ′ f ′ (x)dx = f (0). f (x)θ (x)dx = f (x)θ(x) −∞ − f (x)θ(x)dx = f (∞) − R
R
0
′
Weil θ (x) = 0 bei x > 0 ist, kann man die obere Integralgrenze auch durch jedes beliebige positive a ersetzen, und kommt zu demselben Ergebnis.
Wir haben also “gelernt”, wie man eine unstetige Funktion (hier: θ(x)) ableitet. Das Ergebnis ist keine Funktion, aber immerhin ein lineares Funktional. R ikx Schreibt man die Vollst¨ a ndigkeits-Relation (3.20) als e dk = 2πδ(x) oder R ikx e dx = 2πδ(k), so kann man sie interpretieren als “die δ-Funktion ist die Fourier-Transformierte der konstanten Funktion” (und umgekehrt). Offenbar gilt hier Satz 3.6 (Riemann-Lebesgue) nicht mehr: weil die δ-Fn keine Fn ist, kann ihre FT konstant sein. Zusammen mit den Ableitungsregeln (3.24) f¨ ur die Fourier-Tr erh¨alt man auch, dass die FT der Ableitungen der δ-Funktion Polynome sind: b = (2π)− 21 · 1 δ(k)
⇒
1 (n) (k) = (2π)− 2 · (ik)n . δd
n Umgekehrt √ n (n) sind die FT der Polynome pn (x) = x Ableitungen der δ-Fn: pbn (k) = 2πi · δ (k).
Wir haben also auch gelernt, wie man nicht-integrierbare Funktionen Fouriertransformiert. Man erh¨alt dabei keine Fn, sondern gewisse lineare Funktionale. In den folgenden Abschnitten wird die Theorie von wesentlich allgemeineren linearen Funktionalen als den δ-Funktionen und ihren Ableitungen entwickelt.
5.2
Distributionen als lineare Funktionale
Es sei D(R) der Vektorraum der glatten komplexen Funktionen mit kompaktem Tr¨ager ⊂ R. Eine stetige Funktion g ∈ C(R) kann man als lineares Funktional Tg : D(R) → C auffassen: Z Tg : f 7→ Tg (f ) := dx g(x)f (x). R
Man sieht leicht, dass Tg1 = Tg2 ⇒ g1 = g2 , weil es anderenfalls immer eine Fn f ∈ D(R) gibt, die den Unterschied “erkennen” kann. (Daher bezeichnet man diese Fn f ∈ D(R) auch als Testfunktionen.) Man kann also Tg bijektiv mit g “identifizieren”: g ist eine Funktion, die Tg realisiert. Auch die δ-Funktion ist ein lineares Funktional auf D(R), n¨amlich das Evaluations-Fl Z δy : f 7→ f (y) = dx δ(x − y)f (x), wobei die letztere Schreibweise nur symbolisch ist, weil ja δ(x − y) als Funktion nicht existiert.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
48
Wir definieren Distributionen als lineare Funktionale auf D(R), die sowohl Tg als auch δy verallgemeinern, und mit denen man genauso arbeiten kann “als w¨aren sie durch Funktionen realisiert”.R Entsprechend verwendet man auch h¨aufig die symbolische Schreibweise T (f ) = dx T (x)f (x) “so als w¨are T (x) eine Fn”. Man kann Distributionen T mit glatten Funktionen h multiplizieren: h(x)T (x) steht f¨ ur die Distribution Z (hT )(f ) := T (hf ) = dx T (x)h(x)f (x) . Dies ist definiert, weil mit f auch hf ∈ D(R) ist. Dagegen kann man zwei Distributionen iA nicht miteinander multiplizieren. F¨ ur differenzierbare Fn g gilt offenbar (durch partielle Integration) Tg′ (f ) = −Tg (f ′ ). F¨ ur beliebige lineare Fle auf D(R) k¨onnen wir definieren: T ′ (f ) := −T (f ′ ). Dann ist offenbar Tg′ dasselbe wie Tg′ , dh, die Identifikation von Tg mit der realisierenden Funktion gilt auch f¨ ur die so definierte Ableitung. Der Punkt ist hier, ′ dass −T (f ) auch dann definiert ist, wenn T zB durch eine unstetige Funktion realisiert ist, oder gar nicht durch eine Fn, wie T = δy . Genauso hatten wir ja die Ableitung der Stufenfunktion oder sogar der δ-Fn (als Funktionale) definiert. Statt auf D(R) kann man Distributionen auf einem etwas gr¨oßeren Fn-Raum definieren: Eine Schwartz-Funktion ist eine ∞ oft differenzierbare Funktion : R → C, die zusammen mit allen ihren Ableitungen schneller als jede Potenz mit |x| → ∞ abf¨allt (vgl Kap. 3.3). S(R) ist der Vektorraum aller Schwartz-Funktionen, D(R) der Unterraum der Schwartz-Funktionen mit kompaktem Tr¨ager. Wir statten S(R) mit einer Topologie aus: Die Schwartz-Topologie ist durch die Supremumsnorm aller Funktionen xk ∂ ℓ f (x) gegeben, k, ℓ ∈ N0 . Eine Folge (fn )n konvergiert also gegen f , wenn f¨ ur k ℓ k ℓ alle k, ℓ die Folgen (x ∂ fn )n in der Supremumsnorm gegen x ∂ f konvergieren. 2 Bsp: Die Funktionenfolge fn (x) = n1 e−(x−n) konvergiert zwar in der Supremumsnorm gegen Null, aber gn (x) = x2 fn (x) konvergiert nicht (weil gn (n) = n). Daher konvergiert die Folge (fn )n nicht in der Schwartz-Topologie. Ein lineares Funktional T : f 7→ T (f ) heißt stetig (bzgl f ), wenn f¨ ur jede Folge von Funktionen fn , die gegen eine Funktion f konvergiert, auch die Werte T (fn ) gegen T (f ) konvergieren. Die Stetigkeitsbedingung stellt sicher, dass der Wert T (f ) des Funktionals nicht von irgendwelchen Artefakten einer Approximation der Funktion f abh¨angt.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
49
Definition: Eine Distribution ist ein in der Schwartz-Topologie stetiges lineares Funktional T : D(R) → C. Die Distribution heißt “temperiert”, wenn sie sogar auf S(R) definiert und stetig ist. (Eine reelle Distribution bildet reellwertige Testfunktionen f auf reelle Werte T (f ) ab.) Bsp: Die Evaluations-Funktionale δy sind temperierte Distributionen. F¨ ur jeR de stetige Funktion g ist das lineare Fl Tg (f ) := R g(x)f (x)dx auf D(R) stetig. Das Integral existiert immer, weil f außerhalb eines Intervalls Null ist. Damit Tg aber auch auf S(R) definiert ist, darf g nicht schneller als eine Potenz von x an√ x − x2 +1/2 wachsen: g(x) = e w¨are bspw mit der Schwartz-Funktion f (x) = e nicht integrierbar, obwohl f schnell abf¨allt. Wenn g h¨ochstens polynomial anw¨achst, dann ist Tg auch stetig in der Schwartz-Topologie auf S(R). Temperiertheit ist also eine Beschr¨ankung an das Wachstum der Funktion g. Die Schwartz-Topologie ist gerade so definiert, dass alle durch polynomial beschr¨ankte stetige Fn realisierten Distributionen temperiert sind. In der Supremums-Topologie allein w¨are zB Tg mit g(x) = x2 nicht stetig, weil Tg (fn ) 2 nicht gegen Null konvergiert, obwohl fn (x) = n1 e−(x−n) (wie oben) in der SupNorm gegen Null konvergieren. Ist T temperiert und g glatt, so ist gT wieder temperiert falls g polynomial beschr¨ankt ist. R P Weitere Bsp: Mittelwerte wie p f (x ) oder f (x) p(x)dx wenn pi bzw i i i p(x)dx Wahrscheinlichkeits-Verteilungen (statistische Gewichte) sind (Namensge1 ber f¨ ur “Distribution”). Die Distribution mit realisierender Fn gk (x) = (2π)− 2 e−ikx “ist” die Fourier-Trafo: Tk (f ) = fˆ(k). Satz 5.1: Jede Distrib T kann durch stetige (sogar Schwartz!) Funktionen approximiert werden, sodass f¨ ur jede Funktion f ∈ D(R) gilt: T (f ) = limn Tgn (f ). 2 2
Bsp: (1) Wir hatten die δ-Fn durch δn (x) = πn e−n x approximiert. R (2) Es sei a(k) stetig, und T (f ) = dx dk eikx a(k)f (x). Das Integral u ¨ber k ergibt die (inverse) Fourier-Trafo g(x) von a(k), also T (f ) = Tg (f ). Diese existiert aber nur dann als Funktion, wenn a(k) schnell genug abf¨allt. Falls a(k) stattdessen h¨ochstens polynomial anw¨achst, kann man es zun¨achst ersetzen durch aε (k) = a(k)e−ε|k| . Dann existiert die FT gε (x) als stetige Fn, und man kann schreiben T (f ) = limεց0 Tgε (f ). Symbolisch schreibt man wieder “T (x) = limεց0 gε (x)”, wobei der Limes nat¨ urlich iA nicht als Fn, sondern nur als Funktional existiert. Von großer Bedeutung zB f¨ ur die Theorie der Differentialgleichungen ist Satz 5.2: Ist T eine (temperierte) Distribution, so ist T ′ : f 7→ −T (f ′ ) ebenfalls eine (temperierte) Distribution. T ′ ist wieder ein stetiges Funktional, weil die Schwartz-Topologie auch die Konvergenz der Ableitungen von f fordert. Damit sind neben den stetigen Fn g auch alle ihre Ableitungen Distributionen. Ableitungen von stetigen Fn k¨onnen aber unstetig sein, und Ableitungen von unstetigen Fn verhalten sich an der Sprungstelle wie die δ-Fn (zB ∂x θ(x) = δ(x)).
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
50
Außer diesen Beispielen gibt es aber noch wesentlich mehr Distributionen, zB oszillierende Integrale (vgl Kap. 3.4) der Form Z f 7→ T (f ) = dk dx eiφ(k,x) a(k, x)f (x) f¨ ur eine große Klasse von Funktionen φ und a, darunter auch das obige Bsp (2) mit φ(k, x) = kx und a(k, x) = a(k). Man k¨onnte hier meinen, dass Z ? g(x) = dk eiφ(k,x) a(k, x) eine realisierende Funktion ist, aber dieses Integral braucht gar nicht zu existieren, vgl Bsp (2) oben. Trotzdem ist es legitim, diesen Ausdruck f¨ ur g(x) zu verwenden, solange man sich nur erinnert dass er “im Sinne von Distributionen” gemeint ist: als symbolische Schreibweise f¨ ur die Distribution T , dh man erst den k-Integranden als k-abh¨angige Distribution Tk : f 7→ Tk (f ) = Rmuss iφ(k,x) dx e a(k, x)f (x) ausf¨ uhren und dann u ¨ber k integrieren.
Wir studieren nun die Fourier-Transformation einer Distribution. zun¨achst gilt ja f¨ ur hinreichend “brave” realisierende Funktionen g Z Z Z 1 Tgˆ(f ) = dx gˆ(x) f (x) = dx gˆ(x) √ (5.2) dk eikx fˆ(k) = 2π Z Z Z 1 ikx ˆ dx e gˆ(x) = dk g(k) fˆ(k) = Tg (fˆ). = dk f (k) √ 2π
Die allgemeine Definition
Tb(f ) := T (fˆ)
(5.3)
stimmt also mit der FT der realisierenden Fn u ¨berein (falls es eine gibt). Andeb rerseits ist T f¨ ur jede temperierte Distribution definiert, weil ja mit f ∈ S(R) auch fˆ ∈ S(R) (Satz 3.7). Es gilt: Satz 5.3: Die FT Tb einer temperierten Distribution T ist wieder eine temperierte Distribution. Die Regeln (3.21)–(3.24) gelten auch f¨ ur die FT von Dist’n. Auf diese Weise sind also auch die FT von polynomial beschr¨ankten stetigen Fn definiert: das Ergebnis sind temperierte Distributionen (wie zB die Ableitungen der δ-Fn, vgl Kap. 5.1). Viele (praktisch vorkommende) Distributionen sind f¨ ur wesentlich mehr Funktionen als die Schwartz’schen Fn f ∈ S(R) definiert (man spricht von einer “Erweiterung”, “Fortsetzung” oder “Ausdehnung des Definitionsbereichs” der Distribution). So ist das Evaluationsfunktional f 7→ f (x0 ) (also die Distribution δ(x − x0 )) f¨ ur alle bei x0 stetigen Funktionen definiert, unabh¨angig von ihren Eigenschaften bei x 6= x0 (insb Abfall-, Wachstums- oder Differenzierbarkeitseigenschaften). Daher definiert man (mit Ausnahme von x0 = a oder x0 = b!) Z b f (x0 ) falls x0 ∈ (a, b) δ(x − x0 ) f (x) dx ≡ Tx0 (χ[a,b] f ) := 0 falls x0 ∈ / [a, b]. a
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
51
Ableitungen der δ-Funktion sind auf allen entsprechend oft differenzierbaren Funktionen definiert; durch stetige schnell abfallende Fn realisierte Distributionen Tg sind auch auf polynomial wachsenden stetigen Funktionen definiert. Mehrdimensionale Distributionen werden analog definiert, indem man Testfunktionen auf Rn betrachtet (oder auf anderen R¨aumen; Testfunktionen auf R¨aumen ohne Rand, wie etwa dem Kreis, brauchen nur glatt zu sein (zuammen mit ihren Ableitungen) – die Abfall-Bedingung entf¨allt). Die n-dimensionale δ-Funktion kann geschrieben werden als Z −n δ(~x) = δ(x1 ) · . . . · δ(xn ) = (2π) dn k eikx . Der Mittelwert der Funktion g ∈ S(R3 ) auf einer Kugel vom Radius R um den Punkt x0 ist die Distribution Z
1 dµ(~e)g(~x0 + R~e) (5.4) g 7→ g ~x0 ,R := 4π (~e ist der Richtungsvektor, und dµ(~e) = sin ϑdϑ dϕ das Raumwinkel-Maß auf der Kugel). Ein zB in der Elektrodynamik wichtiges Beispiel ist die Darstellung der δ-Fn in R3 als X 1 ∂i2 ). (5.5) = −4π δ(~x) (∆ = ∆ |~x|
i
Beweis: Zun¨achst ist ∆(1/|~x|) = 0 bei x 6= 0. Man darf daher die Integration u ¨ber 3 R durch die Integration u ¨ber eine Kugel von beliebigem Radius R > 0 ersetzen: Z Z 1 1 3 d x f (x) ∆ = d3 x f (x) ∆ . (5.6) |~x|
R3
|x| 0) oder dem Innenraum oder Außenraum einer Kugel verschaffen: GD (~x, ~y ) = −
A(|y|) 1 A(|x|) 1 + =− + . 4π|~x − ~y | 4π|~x − S(~y )| 4π|~x − ~y | 4π|S(~x) − ~y |
Hierbei ist im Falle des Halbraums S(~y ) der an der Grenzfl¨ache gespiegelte Punkt, und A(|y|) = 1, und im Falle einer Kugel vom Radius R ist S(~y ) = (R/|~y |)2 ~y und A = R/|~y |. Man u ¨berzeugt sich, dass in beiden F¨allen GD (x, y) = GD (y, x) gilt und GD (x, y) = 0 falls x oder y auf dem Rand liegt. Der Zusatzterm sieht aus wie der Beitrag einer fiktiven Quelle (“Spiegelladung”) am Ort S(~y ) außerhalb des Gebiets. Daher l¨ost GD f¨ ur x und y innerhalb von V dieselbe DGl (6.3). Also ist GD die gesuchte Green’sche Funktion mit Dirichlet-RB. Konstruktion von GF mit Dirichlet-RB via Eigenwert-Problem: Um eine Darstellung der Green’schen Funktion mit Dirichlet-RB f¨ ur ein allgemeines Gebiet V zu konstruieren, betrachten wir das Eigenwert-Problem −∆ f = λf
(6.6)
mit Dirichlet-RB: f (x) = 0 falls x ∈ ∂V (vgl Kap. 2.4). Mit demselben Argument wie im Beweis von Satz 6.1 kann man sich u ¨berzeugen, dass es nur positive Eigenwerte geben kann.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
59
Wir nehmen an, dass wir ein vollst¨andiges Funktionensystem von L¨osungen ei (x) mit Eigenwerten λi > 0 gefunden haben. Die Eigenfunktionen zu verschiedenen Eigenwerten sind orthogonal zu einander, weil ∆ (bzgl des Lebesgue-Maßes auf V ) symmetrisch ist (∆ t = ∆ ; partielle Integration). Falls Eigenwerte mehrfach auftreten, kann man sich eine Orthonormal-Basis mit dem Schmidt’schen Verfahren (Kap. 3.2) verschaffen. (Da die DGl reell ist, kann man sogar auch reelle Eigenfunktionen finden.) Dann ist X ei (x) ei (y) (6.7) GD (x, y) = − λi
i
eine Darstellung der Green’schen Funktion mit Dirichlet-RB. Denn durch Anwenden von ∆ y ergibt sich (vgl Kap. 3.2) X ei (x) ei (y) = δ(x − y). ∆ y GD (x, y) = i
Damit haben wir die L¨osung einer großen Klasse von Differentialgleichungen zun¨achst auf die Bestimmung einer Green’schen Funktion, und diese auf die vollst¨andige L¨osung eines Eigenwertproblems zur¨ uckgef¨ uhrt. Ein technisches Problem ist allerdings die Frage, ob die Eigenfunktionen tats¨achlich ein vollst¨andiges Funktionensystem auf V bilden. Dies h¨angt damit zusammen, ob der LaplaceOperator auf V selbstadjungiert ist – eine Eigenschaft, die etwas st¨arker ist als “symmetrisch” (vgl Kap. 7.5.3). Hierf¨ ur muss man schon etwas tiefer in die Funktional-Analysis eindringen als in dieser Vorlesung beabsichtigt. F¨ ur einfache Geometrien (zB Quader) ist das der Fall. Ein weiteres technisches Problem ist, dass der Laplace-Operator f¨ ur nicht-kompakte Gebiete kontinuierliche Eigenwerte besitzt, sodass die Summe u ¨ber i durch ein Integral zu ersetzen ist. Die Methode der Green’schen Funktion verallgemeinert sich auf viele andere elliptische PDGn, indem man in der Green’schen DGl den Laplace-Operator durch D ersetzt. Modifikationen im Detail ergeben sich vor allem bei den partiellen Integrationen auf dem Weg zu der Verallgemeinerung der Formel (6.5). 6.2.2
Wellengleichung (hyperbolische PDG)
Wir studieren die drei-dimensionale inhomogene Wellengleichung !
(c2 ∆ − ∂t2 )φ(x, t) = χ(x, t) mit φ(x, t0 ) = ϕ0 (x),
!
∂t φ(x, t0 ) = ϕ1 (x) (6.8)
χ(x, t) sind die vorgegebenen Quellen, zB elektrische Ladungen in der EDynamik. ϕ0 (x) und ϕ1 (x) sind vorgegebene Anfangswerte (“Cauchy-Daten”) Man kann die Idee der Green’schen Funktion auch hier anwenden: Z φ(x, t) = dx′ dt′ G(x, t; x′ , t′ ) χ(x′ , t′ ), (6.9) wenn G(x, t; x′ , t′ ) die Green’sche DGl des Wellen-Operators l¨ost: (c2 ∆ − ∂t2 ) G(x, t; x′ , t′ ) = δ(x − x′ )δ(t − t′ ).
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
60
Die wichtigsten L¨osungen sind die retardierte Green’sche Funktion δ(t − t′ − |~x − ~x′ |/c) . 4πc2 |~x − ~x′ |
(6.10)
δ(t − t′ + |~x − ~x′ |/c) = Gret (x′ , t′ ; x, t) 4πc2 |~x − ~x′ |
(6.11)
Gret (x, t; x′ , t′ ) ≡ Gret (x − x′ ; t − t′ ) = − und die avancierte GF Gav (x, t; x′ , t′ ) = −
Diese Namen erkl¨aren sich wie folgt. Bei der Wahl zB der retardierten GF ergibt sich nach Ausf¨ uhrung der t′ -Integration in (6.9) die L¨osung der inhomogenen WG Z Z χ(x′ , t − |x − x′ |/c) 3 ′ ′ ′ ′ ′ ′ . φret (x, t) = d x dt Gret (x − x ; t − t )χ(t , x ) = − d3 x′ ′ 4π|x − x |
(6.12) Hier tragen die Quellen χ(x , t ) zu der Amplitude zu der um die Laufzeit der Wellenausbreitung verz¨ogerten (retardierten) Zeit t = t′ + |x − x′ |/c bei. Diese ¨ L¨osung kann man als Uberlagerung aller von den Punkten x′ in der Vergangenheit ausgegangenen Kugelwellen der Form f (t − |x − x′ |/c)/|x − x′ | interpretieren (Huygens’sches Prinzip). (Die analytischen Eigenschaften von (6.12) sind nicht ganz offensichtlich. Der Ausdruck ist ein Faltungsprodukt G ∗ χ, also die Fourier-Transformierte des Proˆ · χˆ (Kap. 3.3). G ˆ ist, wie G, eine temperierte Distribution. Wenn nun zB duktes G die FT χˆ der Quellfunktion eine beschr¨ankte glatte Fn ist (weil etwa χ stetig ist ˆ · χˆ eine Distribution. und kompakten Tr¨ager hat), dann ist auch das Produkt G Also ist G ∗ χ ebenfalls eine temperierte Distribution. Also ist (6.12) mindestens eine schwache L¨osung der inhomogenen Wellengleichung.) Die L¨osung (6.12) besitzt aber iA nicht die in (6.8) vorgegebenen Anfangswerte φ(x, t0 ) und ∂t φ(x, t0 ). Um auch diese zu erf¨ ullen, muss man noch eine L¨osung f der homogenen Wellengleichung addieren: φ(x, t) = φret (x, t) + f (x, t), deren Anfangswerte gerade den Fehler zwischen den geforderten AW und den AW der L¨osung (6.12) kompensieren. Wir haben also noch ein Cauchy-Problem ′
′
!
(c2 ∆ − ∂t2 )f (x, t) = 0 mit f (x, t0 ) = f0 (x),
!
∂t f (x, t0 ) = f1 (x)
(6.13)
zu l¨osen, wobei f0 (x) = ϕ0 (x)−φret (x, t0 ) und f1 (x) = ϕ1 (x)−∂t φret (x, t0 ) ist. Dies erreicht man mithilfe der Differenz der avancierten und retardierten Green’schen Funktionen K(x − x′ , t − t′ ) = Gav (x, t; x′ , t′ ) − Gret (x, t; x′ , t′ ).
(6.14)
Satz 6.3: f (x, t) ist genau dann eine L¨osung des Cauchy-Problems (6.13), wenn Z Z ′ ′ ′ f (x, t) = dx K(x − x , t − t0 )f1 (x ) + dx′ ∂t K(x − x′ , t − t0 )f0 (x′ ). (6.15) Dann l¨ost φ(x, t) = φret (x, t) + f (x, t) das inhomogene Cauchy-Problem (6.8).
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
61
Aus dem Satz folgt insbesondere, dass die L¨osung eindeutig ist, und dass sie existiert, falls die angegebenen Integrale existieren (was im wesentlichen eine Stetigkeitsbedingung an die Cauchy-Daten f0 und f1 darstellt). Beweis: Wir zeigen zun¨achst die charakteristischen Eigenschaften der Distribution K: (i) (c2 ∆ − ∂t2 )K(x, t) = 0 (ii) K(x, 0) = 0 und
(iii) ∂t K(x, 0) = δ(x).
(6.16)
(i) folgt aus Satz 2.4, da sowohl die retardierte als auch die avancierte GF dieselbe inhomogene DGl l¨osen. F¨ ur (ii) und (iii) kann man nicht einfach in (6.10), (6.11) t = t′ setzen, weil δ(a)/a nicht definiert ist. Stattdessen berechnen wir f¨ ur eine beliebige stetige Funktion g(x) Z Z h i ′ 1 δ(t + |x − x′ |/c) ′ ′ ′ ′ δ(t − |x − x |/c) dx K(x − x , t)g(x ) = − dx g(x′ ). 2 ′ ′ 4πc
|x − x |
|x − x |
Hier ist, dank uδ(u − v) = vδ(u − v) ⇒ δ(u − v) = uv δ(u − v) sowie (5.1), h
i ... =
h
i
δ(ct + |x − x′ |) δ(ct − |x + x′ |) c2 t c2 t + δ(c|t| − |x − x′ |). = |x − x′ | |x − x′ | |x − x′ | |x − x′ |2
F¨ ur die x′ -Integration f¨ uhren wir Polarkoordinaten um den Punkt x herum ein, ′ sodass |x − x | = r, und k¨onnen die r-Integration sofort ausf¨ uhren: Z Z
t ′ ′ ′ dµ(e)g(x + c|t| e) ≡ t · g x,r=c|t| . (6.17) dx K(x − x , t)g(x ) = 4π
Bis auf den Faktor t ist dies der Mittelwert (vgl (5.4)) der Werte von g auf der Kugel vom Radius r = c|t| um den Punkt x. Nun kann man t = 0 setzen bzw erst nach t ableiten und dann t = 0 setzen, und erh¨alt (ii) und (iii). Diese gelten also “im Sinne von Distributionen”, dh, nach Integration mit einer Testfunktion. Wegen (i) ist nun (6.15) eine L¨osung der Wellengleichung. (ii) und (iii) sagen uns, dass auch die Anfangsbedingungen durch (6.15) erf¨ ullt sind. Damit ist eine Richtung von Satz 6.3 (und die Existenz von L¨osungen des Cauchy-Problems) bewiesen. F¨ ur die umgekehrte Richtung nehmen wir an, dass f (x, t) die Wellengleichung mit den richtigen Anfangswerten l¨ost. Wir betrachten das Integral Z I(x, t, s) = dx′ K(x − x′ , t)f (x′ , s). Die Werte von I und seinen Ableitungen bei s = 0 und bei t = 0 haben eine Bedeutung: Offenbar sind f1 (t, x) := ∂s I(x, t, s)|s=0 und f0 (t, x) := ∂t I(x, t, s)|s=0 der erste und zweite Term der rechten Seite von (6.15). Wegen (ii) und (iii) ist außerdem I(x, t, s)|t=0 = 0 und ∂t I(x, t, s)|t=0 = f (x, s).
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
62
Behauptung: Es gilt (∂t2 − ∂s2 ) I(x, t, s) = 0. Beweis: Wir verwenden, dass K die WG l¨ost, dass K nur von x − x′ abh¨angt, und dass f die WG l¨ost. Mit einer partiellen Integration rechnen wir aus Z Z 2 ′ 2 ′ ′ ∂t I(x, t, s) = dx ∂t K(x − x , t) f (x , s) = dx′ c2 ∆ x K(x − x′ , t) f (x′ , s) Z Z ′ 2 ′ ′ = dx c ∆ x′ K(x − x , t) f (x , s) = dx′ K(x − x′ , t) c2 ∆ x′ f (x′ , s) Z = dx′ K(x − x′ , t) ∂s2 f (x′ , s) = ∂s2 I(x, t, s). Daher ist I(x, t, s) von der Form I(x, t, s) = a(x, t + s) + b(x, t − s) (vgl Kap. 6.1). ˙ t) = Die vier eingangs genannten Eigenschaften von I lauten dann a(x, ˙ t) − b(x, ˙ t) = f0 (x, t), a(x, s) + b(x, −s) = 0 ⇒ a(x, ˙ −s) = 0 f1 (x, t), a(x, ˙ t) + b(x, ˙ s) − b(x, ˙ und a(x, ˙ s)+ b(x, −s) = f (x, s). Addition der ersten beiden und der letzten beiden Gleichungen ergibt f (x, t) = 2a(x, ˙ t) = f1 (x, t) + f0 (x, t). Damit ist Satz 6.3 (und insbesondere die Eindeutigkeit der L¨osung) bewiesen. Die Darstellung (6.15) zeigt, dass die Werte von f zur Zeit t am Ort x durch die Cauchy-Daten auf der Kugelfl¨ache um x mit Radius c|t − t0 | bestimmt sind, und dass umgekehrt die Quellen χ(x′ , t′ ) das Feld zur Zeit t > t′ nur auf der Kugelfl¨ache um x′ mit Radius c|t − t0 | beeinflussen (“kausales Einflussgebiet”). Dies ist wieder das Huygens’sche Prinzip, und entspricht gerade der Signalausbreitung mit Geschwindigkeit c. 4 F¨ ur allgemeine hyperbolische PDGn vom Typ (6.2) kann man ¨ahnliche allgemeine Aussagen beweisen, wobei jedoch die retardierten und avancierten Green’schen Funktionen und ihre Differenz mit den Eigenschaften (i–iii) iA nicht bekannt sind. Das kausale Einflussgebiet h¨angt von der quadratischen Form A in (6.2) ab und wird im Allgemeinen nicht nur eine Fl¨ache, sondern ein Volumen sein. Beispiel: die Klein-Gordon-Gleichung (c2 ∆ − ∂t2 − a2 )f (x, t) = 0
(a2 = 0 ist nat¨ urlich die Wellengleichung). Man findet in diesem Fall f¨ ur die Differenz der avancierten und retardierten GF die Fourier-Darstellung Z 3 d k i(kx−ωk t) i −i(kx−ωk t) e − e K(x, t) = 3 √
(2π)
2ωk
wobei ωk = a2 + c2 k 2 . (Beweis von (i-iii) durch direktes Nachrechnen!) Dies ¨ ist zwar eine Uberlagerung von ebenen Wellen mit der Phasengeschwindigkeit ω/|k| > c. Man kann dennoch zeigen, dass K(x, t) = 0, wenn x2 > c2 t2 . (K ist Lorentz-invariant. Daher kann man f¨ ur x2 > c2 t2 oBdA annehmen, dass t = 0 und im Integral ~k durch −~k substituieren.) Daher ist das kausale Einflussgebiet die Vollkugel vom Radius c|t − t0 |, entsprechend den Gruppengeschwindigkeiten ∂ωk /∂k < c. 4
Interessanterweise gilt dies nur in ungeraden Raumdimensionen (zB d = 3). In geraden RD ist das Einflussgebiet die Vollkugel, dh, Lichtstrahlen gen¨ ugen nicht dem Huygens’schen Prinzip.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren 6.2.3
63
Diffusionsgleichung (parabolische PDG)
W¨armeleitung und Diffusion werden durch dieselbe homogene parabolische PDG beschrieben: ∂t − κ ∆ φ(~x, t) = 0 (6.18)
(φ(~x, t) ist etwa die Temperatur oder die Konzentration einer L¨osung). Die Gleichung beschreibt die Ann¨aherung ans Gleichgewicht φ = const. durch Transport von W¨armeenergie bzw von gel¨osten Teilchen aufgrund eines Temperatur- oder Konzentrationsgef¨alles. Zus¨atzliche Zufuhr von W¨arme oder Teilchen wird durch einen zus¨atzlichen inhomogenen Term χ(~x, t) auf der rechten Seite beschrieben. Bei der W¨armeleitung hat man es oft mit einem gemischten Anfangs- und Randwertproblem zu tun: Zur Zeit t0 ist φ(~x, t0 ) = f0 (~x) vorgegeben, und das System wird an den R¨andern auf fester Temperatur gehalten (Dirichlet-RB) oder (w¨arme-)isoliert (Neumann-RB: W¨arme- oder Teilchenstromdichte ∝ Temperatur! oder Konzentrationsgef¨alle = 0 in Normalenrichtung). Cauchy-Problem ohne RB (x ∈ R3 ): L¨osung analog zu Satz 6.3: Z φ(x, t) = dy K(x − y, t − t0 ) f0 (y),
(6.19)
wenn der W¨ armeleitungs- (oder Diffusions-)kern K(x, t) die Eigenschaften (i)
(∂t − κ∆ )K(x, t) = 0
(ii) K(x, 0) = δ(x)
(6.20)
besitzt. Wir bestimmen K durch Fourier-Transformation bzgl x: (i)
ˆ (∂t + κ · k 2 )K(k, t) = 0
ˆ (ii) K(k, 0) = (2π)−3/2 .
(6.21)
Dieses System ist f¨ ur jedes k ∈ R3 elementar l¨osbar: 2 ˆ K(k, t) = (2π)−3/2 e−κk t ,
und die Fourier-R¨ ucktransformation (Gauß-Funktion in k, wie in Kap. 4.2) ergibt K(x, t) = (4πκt)−3/2 e−x
2 /4κt
(6.22)
Zur Zeit t = 0 ist dies nat¨ urlich eine Distribution, w¨ahrend K(x, t) f¨ ur negative t nicht definiert ist (die angegebene Fourier-R¨ ucktransformation ist f¨ ur t < 0 nicht m¨oglich). Interpretation: der W¨armeleitungskern beschreibt die Diffusion wenn die “Anfangskonzentration” durch eine δ-Funktion gegeben√ist: Nach der Zeit t ist die Konzentration Gauß-verteilt, wobei die Breite ∼ κt anw¨achst (Diffusionsgesetz). Im Gegensatz zur hyperbolischen PDG tritt das “Signal” in beliebiger Entfernung von der Quelle ohne Zeitverz¨ogerung auf. Gem¨aß (6.19) entsteht das Konzentrationsprofil zur Zeit t > t0 durch Faltung (Kap. 3.3) des Anfangsprofils f0 (·) mit der glatten Funktion K(·, t − t0 ). Dann ist ˆ t) das Produkt von fˆ0 mit der schnell-abfallenden Fn K(·, ˆ t− (nach FT bzgl x) φ(·,
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
64
t0 ) (Satz 3.2), also ebenfalls schnell-abfallend. Also (nach inverser FT) ist φ(·, t) glatt bzgl x (Satz 3.2). Insbesondere kann ein nicht-glattes Profil (zB Stufen und Knicke) niemals durch Diffusion aus einem “fr¨ uheren” Profil entstanden sein: man kann die Diffusionsgleichung nicht zu negativen Zeiten hin l¨osen; die Diffusion ist ein irreversibles Ph¨anomen. Cauchy-Problem mit homogener Dirichlet-RB (x ∈ V ⊂ R3 , φ(x0 , t) = 0 f¨ ur x0 ∈ ∂V ): Man kann die L¨osung wieder in der Form (6.19) angeben, wobei jetzt aber K(x, y, t) nicht nur von der Differenz x − y abh¨angt. Analog zu (6.20) muss K die WL-Gl in V l¨osen und der Dirichlet-RB auf dem Rand ∂V gen¨ ugen, und es muss K(x, y, t = 0) = δ(x − y) f¨ ur x, y ∈ V gelten (vgl Kap. 6.2.1). Wir nehmen wieder an, dass der Laplace-Operator mit Dirichlet-RB auf V ein vollst¨andiges System von orthonormierten Eigenfunktionen besitzt: −∆ ei (x) = λi ei (alle λi > 0), sodass (3.17) gilt, und erhalten die L¨osung von (6.20) (i): X e−κλi t ei (x)ei (y). K(x, y, t) = i
(6.23)
Ein Vorteil dieser Darstellung besteht zB darin, dass man f¨ ur große Zeiten nur den kleinsten Eigenwert λ1 zu ber¨ ucksichtigen braucht. Das Cauchy-Problem mit inhomogener Dirichlet-RB (x ∈ V , φ(x0 , t) = ϕ(x0 , t) f¨ ur x0 ∈ ∂V ) kann man mithilfe der Laplace-Transformation l¨osen: Wir bezeichnen die Laplace-Transformierte (Kap. 4.5) einer Fn f : R+ → C R ∞ −tz mit (Lf )(z) = 0 e f (t)dt. Die LT der Ableitung f˙ erh¨alt man mit partieller Integration: (Lf˙)(z) = z · (Lf )(z) − f (0). Wir wenden jetzt die LT bzgl der Zeit auf die Diffusionsgleichung an und erhalten (κ∆ − z)(Lφ)(x, z) = −f0 (x) mit vorgegebenen Randwerten (Lϕ)(x0 , z) auf ∂V . f0 (x) ≡ f (x, t = 0) sind die vorgegebenen Cauchy-Daten. Diese l¨ost man, als PDG bzgl x, genauso wie die Poisson-Gleichung in Kap. 6.2.1 mithilfe einer Green’schen Funktion, indem man in (6.3) und (6.5) (Satz 6.2) ∆ durch ∆ − z/κ ersetzt. Die Quellfunktion ist χ = −f0 /κ. Die (z-abh¨angige) Green’sche Funktion f¨ ur den Operator ∆ − z/κ verschafft man sich wieder zB wie in Kap. 6.2.1, indem man in (6.7) die Eigenwerte λi durch λi + z/κ ersetzt. Schließlich erh¨alt man dann φ(x, t) bei t > 0 durch Laplace-R¨ ucktransformation (Kap. 4.5) von Lφ(x, z).
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
7 7.1
65
Funktionalanalysis Zust¨ ande
Ein gemischter Zustand ist ein statistisches Ensemble. Was bedeutet das? Nehmen wir einen Spielw¨ urfel. Wenn er auf einer Seite liegt, hat er einen bestimmten Wert, dh eine ganze Zahl zwischen 1 und 6. Das nennen wir einen “reinen Zustand”. Wenn wir ihn dagegen als Spielger¨at betrachten, mit dem man wiederholt w¨ urfelt, hat er alle Werte zwischen 1 und 6 mit einer gewissen Wahrscheinlichkeit, zB pi = 61 – oder andere Werte, falls er asymmetrisch konstruiert ist. Das nennen wir einen “gemischten Zustand”. Dieser Zustand beschreibt nicht einen individuellen W zu einem bestimmten Zeitpunkt, sondern alle seine Optionen: entweder durch denselben W¨ urfel zu vielen Zeiten (W¨ urfen), oder – was ¨aquivalent ist – durch viele (identisch konstruierte) W¨ urfel, zu einem beliebigen Zeitpunkt (zB nach einem Wurf mit 10.000 W¨ urfeln). Allgemeiner wird die Menge der M¨oglichkeiten zusammen mit ihren W’keiten als statistisches Ensemble bezeichnet, wobei es irrelevant ist, wie das Ensemble physisch realisiert wird (ein W 10.000 mal oder 10.000 W einmal geworfen). In diesem Sinne ist auch ein Gas ein Ensemble, in dem jedes Molek¨ ul einen der m¨oglichen reinen Zust¨ande eines Einzelmolek¨ uls (= Angabe von Ort und Geschwindigkeit) einnimmt. Die Gesamtheit der 1023 Molek¨ ule, oder sehr viele zuf¨allig herausgegriffene M, oder auch ein M im Lauf der Zeit, oder jeweils ein M in verschiedenen Gasbeh¨altern derselben Temperatur: alle repr¨asentieren die m¨oglichen reinen Zust¨ande mit ihren W’keiten = relativen H¨aufigkeiten. Bleiben wir zur mathematischen Modellierung zun¨achst bei dem W¨ urfel. Aus den m¨oglichen Werten ai = 1, . . . , 6 und ihren W’keiten pi kann man den Mittelwert = statistischen Erwartungswert berechnen: X p i ai , hAi = i
oder das mittlere Quadrat der Augenzahl: X pi a2i , hA2 i = i
oder beliebige Mittelwerte hfp (A)i, wenn f irgendeine Funktion ist. Hieraus erh¨alt man zB die Varianz ∆A = hA2 i − hAi2 (vgl Kap. 3.3). Umgekehrt kann man aus der Kenntnis der Werte hf (A)i f¨ ur gen¨ ugend viele Funktionen die W’keiten rekonstruieren. Bsp: Es gilt: ein Zustand ist rein ⇔ alle pi = 0 bis auf eines mit pi0 = 1 ⇔ ∆A = 0 ⇔ hA2 i = hAi2 . Selbst wenn man nicht (wie beim W¨ urfel) weiß, welche m¨oglichen Werte ai eine Gr¨oße u ¨berhaupt A besitzt, kann man diese zusammen mit ihren W’keiten pi rekonstruieren, wenn man zB die Momente hAn i f¨ ur alle n ∈ N kennt.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
66
Allgemeiner: die Kenntnis der Mittelwerte ϕ(f ) ≡ hf (A)i f¨ ur hinreichend viele Funktionen enth¨alt alle Information u ¨ber das Ensemble, dh den gemischten Zustand, der durch die m¨oglichen Werte a und ihre W’keiten gegeben ist. Dabei muss diese Zuordnung f 7→ ϕ(f )
aber einigen Bedingungen gen¨ ugen, damit sie die Bedeutung “Mittelwerte in einem Ensemble” haben kann: Es muss gelten (i) Die Zuordnung ϕ ist linear. (ii) ϕ ist positiv: ϕ(|f |2 ) ≥ 0 f¨ ur alle f . (iii) ϕ ist normiert: ϕ(1) = 1. Denn der Mittelwert eines Vielfachen oder einer Summe muss das Vielfache oder die Summe der Mittelwerte sein, der Mittelwert von 1 ist immer 1, und der Mittelwert einer positiven Funktion ist positiv. Eine solche positives und normiertes lineares (PNL) Funktional bezeichnet man dann auch als Zustands-Funktional, oder nur Zustand. Es gilt Satz 7.1: Jeder Zustand f 7→ ϕ(f ) auf der Algebra C(R) der stetigen FunkR tionen l¨asst sich eindeutig schreiben als ϕ(f ) = f (a) p(a)da, wobei p(a) eine positive W’dichte ist. Interpretation: p(a) ist die W’dichte f¨ ur die Werte a einer statistischen Gr¨oße A. Dabei kann p(a) auch eine Summe von δ-Funktionen sein, etwa X pi δ(a − ai ); p(a) = i P in diesem Fall sind ϕ(f ) = i pi f (ai ) diskrete Mittelwerte, wie vorher. Insbesondere ist auch f 7→ ϕ(f ) = f (a0 )
ein Zustand mit p(a) = δ(a − a0 ): dies ist gerade der reine Zustand, in dem A mit W’keit 1 den Wert a0 annimmt. iA beschreibt ein Zustand aber ein Ensemble, in dem die Gr¨oße A kontinuierliche Werte annehmen kann, sodass p(a)da die W’keit ist, dass A einen Wert in einem Intervall der Gr¨oße da um a herum annimmt. Beweis-Idee: Indem man ϕ(f ) auf Funktionen f auswertet, die charakteristische Funktionen χIRf¨ ur kleine Intervalle I = (a0 − 2ε , a0 + 2ε ) approximieren, erh¨alt man die W’keitenR I p(a)da ≈ p(a0 ) · ε, also das Maß p(a)da. p(a) ist ≥ 0, weil χI = |χI |2 , und p(a)da = 1, weil ϕ(1) = 1. Dass man hiermit dann ϕ(f ) f¨ ur beliebige Fn f zur¨ uckerh¨alt, liegt an der Linearit¨at von ϕ.
Ersetzt man die m¨oglichen Werte a ∈ R durch eine andere Menge, etwa den “Phasenraum” Γ der m¨oglichen Wertepaare (~x, ~v ) f¨ ur Ort und Geschwindigkeit eines Molek¨ uls in einem Gas, so gilt Entsprechendes: jeder Zustand auf C(Γ) l¨asst sich eindeutig durch eine W’keits-Verteilung p(~x, ~v ) d3 x d3 v ausdr¨ ucken: Z ϕ(f ) = f (~x, ~v ) p(~x, ~v ) d3 x d3 v. Hierbei kann f irgendeine Fn von Ort und Geschwindigkeit eines Molek¨ uls sein, also etwa seine Energie oder sein Drehimpuls.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
67
In der obigen Definition eines Zustands-Funktionals ist es wichtig, dass C(R) (oder C(Γ)) eine *-Algebra mit 1 ist (n¨amlich die Funktion f (a) ≡ 1 ist das 1Element der Algebra): (i) verwendet die lineare Struktur, (ii) das Produkt und die komplexe Konjugation, und (iii) die Existenz der 1-Funktion. Daher kann man Zust¨ande auf anderen *-Algebren mit 1 genauso definieren. F¨ ur eine diskrete Menge Γ = {a1 , · · · , aN } (zB die Menge der reinen Zust¨ande des W¨ urfels) ist eine Funktion f ∈ C(Γ) nichts anderes als die Kollektion der N Werte f (ai ). Als *-Algebra ist dann C(Γ) isomorph zu der *-Algebra DN der komplexen diagonalen N × N -Matrizen! Man schreibt einfach die Funktionswerte auf die Diagonale, und verifiziert, dass Produkt, Summe und Konjugaton zweier Matrizen dasselbe sind wie Produkt, Summe und Konjugation der Funktionen. Also kann man einen Zustand auch als lineares Funktional ϕ : DN → C (mit denselben Eigenschaften (i)–(iii)) ansehen. P Als Zustand auf DN kann man den Zustand ϕ(f ) = i f (ai )pi schreiben als ϕ(A) = (e, Ae),
(7.1)
wobei A die der Fn f entsprechende Diagonalmatrix, und e ∈ CN irgendein 2 Vektor mit Komponentenquadraten |e i | = pi ist. (·, ·) ist das Skalarprodukt in P P CN , sodass ||e||2 = (e, e) = i |ei |2 = i pi = 1. MaW: in dieser Umformulierung wird ein Zustand ϕ durch einen Einheits-Vektor e ∈ CN repr¨asentiert! Mathematisch ist dieser neue Zustandsbegriff vollkommen ¨aquivalent zu der bisherigen Beschreibung durch W’keiten und Mittelwerte. Im kontinuierlichen Fall kann man ¨ahnlich vorgehen: Wenn die W’dichte p eine Funktion ist (dh keine δ-Fn enth¨alt), dann kann man genausogut schreiben Z Z ϕ(f ) = f (a) p(a)da ≡ e(a)f (a)e(a) da = (e, f · e), p wobei e(a) irgendeine Fn mit Betrag |e(a)| = p(a) ist, sodass automatisch 2 ||e||2 = 1. Wir haben also den Erwartungswert als “Matrixelement” des “Multiplikations-Operators” e 7→ f · e in L2 (R) realisiert.
Diese ¨aquivalente Umformulierung des Zustandsbegriffes ist wegweisend f¨ ur die Quantenmechanik, wie folgt: Eine Korrelation zwischen zwei Gr¨oßen f und g in einem Zustand ϕ ist die Gr¨oße ϕ(f g)−ϕ(f )ϕ(g) (sodass die mittlere quadratische Abweichung eine Autokorrelation ist). John S. Bell hat gezeigt: Zwischen verschiedenen Korrelationen in Zust¨anden, die (wie oben) als gewichtete Mittelwerte von Funktionen auf einem Phasenraum dargestellt werden k¨onnen, gelten stets gewisse Ungleichungen. Messungen an Quantensystemen verletzen diese Ungleichungen. Daraus folgt, dass Zust¨ande von Quantensystemen eine andere Beschreibung erfordern!
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
68
Die entscheidende Modifikation besteht darin, die kommutative Algebra DN der Diagonal-Matrizen im obigen Beispiel durch die nicht-kommutative Algebra MN aller N × N -Matrizen zu ersetzen. Als *-Operation wird die hermitesche Konjugation A → A∗ = At verwendet. Dann ist eine Matrix “positiv”, wenn sie sich als A = B ∗ B schreiben l¨asst ⇔ A ist hermitesch und alle Eigenwerte ≥ 0. Eine beliebige hermitesche Matrix wird dann als Observable angesehen. Die folgende Diskussion ist ein vereinfachter Vorgriff auf den Zustandsbegriff in der Quantenmechanik, ohne dabei schon die QM selbst erkl¨aren zu wollen. Insbesondere die Kl¨arung der Frage, welche “Matrix” welche physikalische Observable repr¨asentiert, bleibt der Vorlesung “Quantenmechanik” vorbehalten! Als Funktional auf der Algebra MN ist (7.1) immer noch ein PNL Funktional, also ein Zustand. Auch dieser Zustand besitzt eine statistische Interpretation: Jede hermitesche N × N Matrix A besitzt N reelle Eigenwerte ai und N orthonormale Eigenvektoren ei . In dieser Basis ist A diagonal. Schreibt man also P e= ci ei , so wird (7.1) zu X X ϕ(A) = (e, Ae) = |ci |2 ai . |ci |2 (ei , ai ei ) = i
i
Dies ist wieder ein statistischer Mittelwert, dh der Vektor e beschreibt ein Ensemble mit m¨oglichen Werten ai und W’keiten pi = |ci |2 . Es gilt dann auch wieder X X pi f (ai ). pi ani und ϕ(f (A)) = ϕ(An ) = i
i
Im Unterschied zum vorherigen Fall (als wir a priori nur diagonale Matrizen A betrachtet hatten), h¨angen aber die W’keiten pi von der Observablen ab! Denn diese ergeben sich ja aus den Koeffizienten des Vektors e in der Basis von Eigenvektoren von A. Eine andere hermitesche Matrix B hat andere Eigenvektoren, also wird die Zerlegung desselben Vektors e nach den Eigenvektoren von B andere Koeffizienten c′i ergeben, sodass derselbe Zustand die Eigenwerte bi von B mit anderen W’keiten mittelt als die Eigenwerte von A. Zust¨ande der Form (7.1) lassen sich immer durch W’keits-Verteilungen von Eigenwerten von hermiteschen Matrizen interpretieren; jedoch h¨angen die W’keiten desselben Zustandes von der Wahl der Observablen ab! 0 1 1 0 1 , Vektor e = ,B = . Bsp: Hermitesche Matrizen A = 1 0 0 −1 0 Beide Matrizen haben dieselben Eigenwerte ±1, aber verschiedene Eigenvektoren. Wir finden c+ = 1, c− = 0, aber c′+ = c′− = √12 . Ausgewertet auf Observablen der Form f (A) gibt der Zustand eine scharfe Verteilung (p+ = 1, p− = 0, ∆A = 0, der Zustand ist rein), ausgewertet auf Observablen der Art f (B) ist er dagegen eine statistische Verteilung (p′+ = p′− = 12 , der Zustand ist gemischt).
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
69
Solche Zust¨ande auf MN sind also “gleichzeitig rein und gemischt”. Die Abh¨angigkeit der W’keiten von der Wahl der Observablen kann gerade die beobachtete Verletzung der Bell’schen Ungleichungen in der QM erkl¨aren. Auch die Heisenberg’sche Unsch¨arfe-Relation der QM l¨asst sich auf diese Eigenschaft zur¨ uckf¨ uhren. Beide Effekte sind eine Folge der Nichtkommutativit¨at des Produktes von Matrizen (dh, der Algebra der Observablen). Im Matrix-Formalismus sind die beschriebenen Vektorzust¨ande immer noch nicht die allgemeinsten m¨oglichen Zust¨ande. Der allgemeinste Zustand auf der Matrix-Algebra ist von der Form A 7→ Tr (ρA), wobei ρ eine symmetrische Matrix mit Eigenwerten ≥ 0 und der Spur Tr ρ = 1 ist. Eine solche Matrix heißt Dichtematrix. Zur Erinnerung: Die Spur ist die Summe der Matrixelemente auf der Diagonale. Sie erf¨ ullt Tr (AB) = Tr (BA), und daher Tr A = Tr U AU t wenn U eine unit¨are Matrix ist. Daher ist Tr A unabh¨angig von der Basis. Wenn A hermitesch ist, kann man als Basis eine solche w¨ahlen, in der A diagonal ist. Also ist Tr A die Summe der Eigenwerte von A. Wenn wir ρ diagonalisieren: ρ ei = λi ·ei , und die orthonormalen Eigenvektoren als Basis verwenden, dann ergibt sich X X Tr (ρA) = λi (ei , Aei ) = λi ϕi (A).
Ein Dichtematrix-Zustand ist also eine “konvexe Summe” (= Mittelung mit statistischen Gewichten λi = Eigenwerte der Dichtematrix) von Vektorzust¨anden ϕi (A) = (ei , Aei ), die selbst schon Mittelwerte darstellen (durch Diagonalisierung von A wie vorher). Die Schwankungsbreiten in einem solchen Zustand sind immer gr¨oßer als die (mit λi gewichteten) Mittelwerte der SBn in den Zust¨anden (ei , Aei ). Um wirklich zur Mathematik der QM zu kommen, muss man an dem Matrixformalismus noch einige Korrekturen anzubringen. Anstelle eines endlichdimensionalen Vektorraumes CN ben¨otigt man unendlich-dimensionale komplexe VR, und selbstadjungierte Operatoren anstelle von hermiteschen Matrizen. Diese Begriffe sollen in den n¨achsten Abschnitten erkl¨art werden.
7.2
Operatoren
Lineare Abbildungen Sind V1 und V2 zwei Vektorr¨aume, so bildet die Menge der linearen Abbildungen A : V1 → V2 wieder einen Vektorraum.
zB Heuser Bd. 2, §109
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
70
Bsp f¨ ur lineare Abb: Auf Funktionenr¨aumen: Differentialoperatoren, FourierTrafo f 7→ fˆ, Trafo der Variablen f 7→ f ◦ ϕ, FaltungenR f 7→ g ∗ f (vgl (3.28)), Integraloperatoren (zB (6.5)) wie f 7→ Kf , (Kf )(x) = dx′ K(x, x′ ) f (x′ ). Auf Folgenr¨aumen: Faltungsprodukte; Vervielfachen, Umordnen, Weglassen oder Wiederholen von Folgengliedern. Die Fourier-Zerlegung und die Taylor-Reihe kann man als lineare Abb C(S 1 ) → ℓ2 bzw C ∞ (R) → V = Vektorraum aller Folgen (an )n∈N0 auffassen. Lineare Abbildungen A : V1 → V2 bezeichnet man auch als Operatoren. Wir betrachten im Folgenden zwei Banachr¨aume B1 und B2 ; Spezialf¨alle B2 = C oder B1 = B2 . Eine lineare Abbildung A : B1 → B2 ist an einem Punkt g ∈ B1 stetig, wenn ∀ ε > 0 ∃ δ > 0 : ||f − g||B1 < δ ⇒ ||Af − Ag||B2 < ε. Dies ist derselbe Stetigkeitsbegriff wie f¨ ur Funktionen F : R → R, außer dass die Argumente und Bildwerte Vektoren in B1 bzw B2 (also zB selbst Funktionen) statt Zahlen sind, und die jeweiligen Normen an die Stelle von Abst¨anden treten. Allerdings ist A genau dann u ¨berall stetig, wenn A bei g = 0 stetig ist (wegen der Linearit¨at!). Dar¨ uberhinaus gilt Satz 7.2: A : B1 → B2 ist genau dann stetig, wenn A beschr¨ ankt ist, dh, wenn ||Af ||B2 < ∞. (7.2) sup f ∈B1 \{0}
||f ||B1
Wenn ||A|| < 1, so ist A eine Kontraktion im Sinne der Definition in 1.3. Offenbar ist dann fn = An f eine Folge von Vektoren mit ||fn || ≤ ||A||n · ||f0 || → 0. Also konvergiert die Folge gegen 0 ∈ B. Dies ist ein Spezialfall des Banach’schen FPS (Satz 1.5). Das Supremum in (7.2) =: ||A|| definiert eine Norm auf dem Vektorraum L(B1 , B2 ) aller stetigen linearen Abbildungen A : B1 → B2 . Dieser ist also wieder ein normierter Raum. Er ist sogar automatisch vollst¨andig, also: Satz 7.3: Der Vektorraum L(B1 , B2 ) der beschr¨ankten (⇔ stetigen) linearen Abbildungen zwischen zwei Banachr¨aumen ist wieder ein Banachraum. Bsp: Die Norm eines Integraloperators, wie in (6.5) oder (6.15), (bzgl geeigneten Normen auf B1 oder B2 ) ist eine quantitative Aussage dar¨ uber, wie empfindlich die L¨osungen einer Diff-Gl von den Rand- oder Anfangswerten abh¨angen. L(B, C) ist der Raum der beschr¨ankten linearen Funktionale A : B → C. Man nennt ihn auch den dualen Banachraum oder Dualraum B ′ = L(B, C) von B. Ist nun A ∈ B ′ , so stellt wiederum jeder Vektor in B durch die Vorschrift A 7→ A(f ) ein beschr¨anktes Funktional B ′ → C dar, und die Norm dieser Abbildung ist gleich ||f ||; damit kann man B als Unterraum des Dualraums von B ′ auffassen. In der Regel ist aber (B ′ )′ echt gr¨oßer als B.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
71
Der Banach-Raum L(B, B) ist der Raum der stetigen linearen Abbildungen von B in sich selbst. Er ist sogar eine Algebra, und es gilt ||A1 A2 || ≤ ||A1 ||||A2 ||.
7.3
Hilbertr¨ aume
Ein komplexer Vektorraum mit einem positiv definiten Skalarprodukt (s. Kap. 3.2) heißt unit¨ arer Raum. Er ist dann automatisch normiert mit der Norm 1
||f || = (f, f ) 2 , und es gilt die Polarisations-Identit¨ at 4(f, g) = ||f + g||2 − i||f + ig||2 − ||f − g||2 + i||f − ig||2 . (7.3) P P∞ ′ 2 ′ ′ Beispiele: CN mit Skp (z, z ′ ) = N n=1 z n zn . ℓ mit (z, z ) = n=1 z n zn . C00 (X) mit Skp (3.15). uhrt von einem Skalarprodukt her (zB || · ||p f¨ ur p 6= 2): Aber nicht jede Norm r¨ Satz 7.4: Eine Norm r¨ uhrt genau dann von einem Skalarprodukt her, wenn sie die “Parallelogramm-Gleichung” erf¨ ullt: ||f + g||2 + ||f − g||2 = 2 ||f ||2 + ||g||2 .
Beweis: Durch direkte Rechnung sieht man, dass jede von einem Skp herr¨ uhren¨ de Norm die PG erf¨ ullt. Umgekehrt (→ Ubung!) definiert die PI ein hermitesches Skp, wenn eine Norm gegeben ist. Die PI stellt sicher, dass (f, ig) = i(f, g), und die PG, dass (f, g +h) = (f, g)+(f, h). Hieraus kann man die Sesquilinearit¨at des Skp beweisen. Die Definitheit der Norm gew¨ahrleistet die Definitheit des Skp. Ein Hilbertraum ist ein vollst¨andiger unit¨arer Raum (also ein Banachraum, dessen Norm von einem Skalarprodukt herr¨ uhrt). Beispiele: CN und ℓ2 sind vollst¨andig, also Hilbertr¨aume. Wie wir gesehen haben, ist aber der VR der (quadrat-integrablen) stetigen Funktionen bez¨ uglich der 2-Norm nicht vollst¨andig. Daher muss man ihn vervollst¨andigen. Der Abschluss heißt L2 (R). Die abstrakte Konstruktion von Satz 1.1 bedeutet in diesem Falle konkret, dass ein Element von L2 (R) durch CauchyFolgen von quadrat-integrierbaren stetigen Funktionen approximiert werden, die bis auf an abz¨ahlbar vielen Stellen (“fast u ¨berall”) punktweise konvergieren. Die punktweisen Grenzwerte sind aber iA weder stetige Funktionen, noch u ¨berhaupt ¨ an allen Punkten definiert. Repr¨asentanten derselben Aquivalenzklasse von CF haben punktweise dieselben Limiten bis auf abz¨ahlbar viele Punkte. Damit sind die “typischen” Elemente des zugeh¨origen Hilbertraumes unstetige, und nur fast u ¨berall definierte Funktionen, wobei Funktionen, die sich nur an abz¨ahlbar vielen Stellen unterscheiden, denselben Hilbertraum-Vektor darstellen. KonstruktionsR gem¨aß sind Skalarprodukte (f, g) = R f (x)g(x) dx auch f¨ ur solche “Funktionen”
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
72
definiert (n¨amlich als Grenzwerte der Integrale f¨ ur die approximierenden stetigen Funktionen). Allgemeiner: f¨ ur Fn auf einem Raum X, deren Skalarprodukt mit einem Integralmaß dµ(x) definiert ist, schreibt man L2 (X, dµ). Seine Elemente werden als µ-quadrat-integrable Funktionen (oder “L2 -Funktionen bzgl µ”) bezeichnet. Endlich-dimensionale Hilbertr¨aume besitzen eine endliche Orthonormalbasis. Eine abz¨ahlbare Menge von normierten, paarweise orthogonalen Vektoren en in einem unendlich-dimensionalen HR H ist eine Orthonormalbasis, wenn jeder Vektor als norm-konvergente Reihe X∞ zn en mit zn ∈ C (7.4) f= n=1
darstellbar ist. Hilbertr¨aume mit abz¨ahlbarer ONB heißen separabel. Insbesondere ist der HR ℓ2 ist separabel: denn die Folgen ei = (0, . . . , 0, 1, 0, . . . ), die nur an der iten Stelle von Null verschieden sind, bilden eine ONB. Auch der Hilbertraum L2 (S 1 , dµ) der periodischen quadrat-integrablen Funktionen auf einem Intervall I ⊂ R ist separabel: wir haben ja im Kap. 3.1 u ¨ber die Fourier-Reihe eine ONB −1/2 2nπix kennengelernt: etwa en (x) = (2π) e (n ∈ Z), wenn I = (0, 2π). (Insbesondere versagt hier die naive Vorstellung einer “L2 -Funktion f als eines Vektors mit kontinuierlich vielen Komponenten (f (x))x∈X ”.) Die Kugelfl¨achen-Fn sind eine abz¨ahlbare ONB von L2 (S 2 , sin ϑ dϑ dϕ). Zwei HR sind isomorph, wenn es eine lineare Bijektion U : H1 → H2 gibt, die das Skalarprodukt respektiert: (U f, U g)2 = (f, g)1 . U heißt dann unit¨ ar. Insbesondere gilt dann auch ||U f ||2 = ||f ||1 , also ||U || = 1. Satz 7.5: Alle unendlich-dimensionalen separablen HR sind isomorph. Beweis: Weil H separabel ist, gibt es eine ONB (ei ). Jeder Vektor f ∈ H l¨asst sich also eindeutig wie in (7.4) zerlegen, mit zi ∈ C, und es gilt (f (1) , f (2) ) = P (1) (2) i zi zi . Insbesondere ist dann die Folge der Koeffizienten z ≡ (zi )i∈N ein Element von ℓ2 . Umgekehrt definiert jede quadrat-summierbare Folge c mittels (7.4) einen Vektor in H. Daher ist f → z eine Bijektion H → ℓ2 , die das Skp erh¨alt. Also ist jeder unendlich-dim separable HR zu ℓ2 isomorph. Dann sind auch alle solchen HRe untereinander isomorph. (Die Parseval’sche Gleichung (Satz 3.3) ist nichts anderes als die Gleichheit der Normen auf L2 (S 1 ) und auf ℓ2 unter der Fourier-Zerlegung.) Man k¨onnte, durch Vergleich mit dem Argument f¨ ur L2 (S 1 ), meinen, dass L (R) nicht separabel w¨are. Denn es gibt ja u ¨berabz¨ahlbar viele Funktionen, ikx n¨amlich die ebenen Wellen ek (x) = e (k ∈ R), die alle bzgl des Skp des L2 (R) zueinander orthogonal sind (→ Kap. 3.3). Das Argument ist falsch, weil die Funktionen ek nicht quadrat-integrabel sind, also keine Elemente von L2 (R). Vielmehr 2
Satz 7.6: L2 (RN ) ist separabel.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
73
Zum Beweis dieses Satzes (hier nur f¨ ur N = 1) muss man eine abz¨ahlbare Basis von L2 (R) angeben. Eine solche Basis sind zB die Funktionen fn (x) = 2 xn e−x /2 . Um zu sehen, dass sie eine Basis bilden, zeigen wir, dass ein Vektor f , der auf allen fn orthogonal steht, nur der Nullvektor sein kann. Sei f ein solcher Vektor. Dann definieren wir die Funktion Z 2 g(z) := dx eizx e−x /2 f (x) R
f¨ ur z ∈ C. Weil der Integrand f¨ ur jedes x in z analytisch ist, und f¨ ur |Im z| < R Rx −x2 /2 unabh¨angig von z durch eine integrierbare Funktion e e f (x) beschr¨ankt ist, folgt nach einem Satz der Funktionentheorie, dass g(z) analytisch ist. Also stimmt g(z) mit seiner Taylor-Reihe u ¨berein: X (iz)n Z 2 g(z) = dx xn e−x /2 f (x). n! R n Die Integrale sind aber = (fn , f ) = 0 nach Voraussetzung. Also ist g(z) = 0, also 2 verschwindet die Fourier-Transformierte von e−x /2 f (x), also ist f gleich Null. Die fn sind allerdings nicht orthonormal. Mit dem Schmidt’schen ON-Verfahren 2 (Kap. 3.2) gewinnt man aus ihnen die ONB en (x) = cn Hn (x)e−x /2 = cn (x − 2 ∂x )n e−x /2 (n ∈ N), wobei die Hermite’schen Polynome Hn Polynome der Ordnung n sind, und cn Normierungskonstanten. Die Tatsache, dass die fn (oder en ) eine Basis bilden, ist etwas kontra-intuitiv, weil alle fn exponentiell schnell abfallen. Trotzdem sind auch nur langsam wie zB |x|−1 abfallende L2 -Funktionen als Linearkombination von diesen, mit quadratsummierbaren Koeffizienten, darstellbar. 5 Der Isomorphismus ℓ2 ∼ = L2 (R) ∼ = L2 (R3 ) ∼ = . . . zeigt, dass dieselbe abstrakte Struktur eines Hilbertraumes auf unterschiedliche Art und Weise realisiert werden kann (Folgen, Funktionen, . . . ). Da jeder Hilbertraum ein Banachraum ist, besitzt er auch einen Dualraum. Satz 7.7 (Fischer-Riesz): Ist A : H → C ein beschr¨anktes lineares Funktional auf einem Hilbertraum, so gibt es genau einen Vektor a ∈ H sodass A(f ) = (a, f ). Dieser hat dieselbe Norm wie A: ||a||H = ||A||H ′ . Man kann also den Dual-Raum H ′ bijektiv mit H selbst “identifizieren”, und es gilt automatisch (H ′ )′ = H.
7.4
Tensorprodukt
Seien V und W zwei (reelle oder komplexe) Vektorr¨aume. Das Tensorprodukt V ⊗ W ist der Vektorraum aller Linearkombinationen von Objekten v ⊗ w mit 5
Nicht-separable Hilbertr¨ aume sind ziemlich “exotisch” (etwa der Raum der quadratsummierbaren Funktionen fP : R → C, die nur an abz¨ahlbar vielen Punkten von Null verschieden sind, mit dem Skp (f, g) = x f (x)g(x); sie kommen in der Physik zum Gl¨ uck selten vor.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
74
v ∈ V , w ∈ W , wobei definitionsgem¨aß gilt (v1 + v2 ) ⊗ w = (v1 ⊗ w) + (v2 ⊗ w),
v ⊗ (w1 + w2 ) = (v ⊗ w1 ) + (v ⊗ w2 ),
(λv1 ) ⊗ v2 = λ(v1 ⊗ v2 ) = v1 ⊗ (λv2 )
(λ ∈ R bzw ∈ C).
Dann folgt: bilden ei eine Basis von V und fj eine PBasis von W , dann P bilden Eij = ei ⊗ fj eine Basis von V ⊗ W . Denn f¨ ur v = i ai ei und w = j bj fj ist X X X X ai bj (ei ⊗ fj ) (ai ei ) ⊗ (bj fj ) = bj f j = ai e i ⊗ v⊗w = i
j
ij
ij
eine Linearkombination der Eij , und damit auch jede Linearkombination von solchen Vektoren. Hat also V die Dimension n und W die Dimension m, so hat V ⊗ W die Dimension nm (wobei n oder m auch ∞ sein d¨ urfen). Bsp: (1) Als Vektorraum sind die reellen n × m-Matrizen isomorph mit dem Tensorprodukt Rn ⊗ Rm , wenn man zB die Basisvektoren ei ⊗ fj mit der Matrix Eij identifiziert, deren einziges nicht-verschwindendes Matrix-Element eine 1 in der i-ten Reihe und j-ten Spalte ist. Hat dann v die Komponenten ai und w die Komponenten bj , so entspricht (v ⊗ w) die Matrix M mit Eintr¨agen Mij = ai bj . Analog: ein Vektor in Rn ⊗ Rn ⊗ Rn ist ein Tensor dritter Stufe. (2) Sind V und W Vektorr¨aume von Funktionen, so kann man v ⊗ w mit der Funktion F (x, y) = v(x)w(y) identifizieren. V ⊗ W ist also ein VR von Fn in zwei unabh¨angigen Variablen. (3) Ist V ein Vektorraum von Funktionen und W = Cn , so ist V ⊗ W der Vektorraum der Funktionen v(x) = (v1 (x), . . . , vn (x)) mit Werten in Cn . Dies ist auch dasselbe wie der Vektorraum der Zeilen- oder Spaltenvektoren, deren Eintr¨age nicht Zahlen, sondern Funktionen sind. ¨ ¨ Ubung: Uberzeugen Sie sich, dass die beiden definierenden Relationen in allen drei Beispielen erf¨ ullt sind. Sind nun H1 und H2 zwei Hilbertr¨aume, so kann man auch H1 ⊗H2 mit einem Skalarprodukt ausstatten: (v1 ⊗ w1 , v2 ⊗ w2 ) := (v1 , v2 ) · (w1 , w2 ). F¨ ur Linearkombinationen von Vektoren v ⊗ w ist das Skalarprodukt dann durch seine Linearit¨at bzw Anti-Linearit¨at definiert. (Insbesondere ist ei ⊗ fj eine Orthonormalbasis von H1 ⊗ H2 , wenn ei bzw fj ONBn von H1 bzw H2 sind.) Der Hilbertraum H1 ⊗ H2 ist dann die Vervollst¨andigung des so definierten unit¨aren Raumes. 2 2 2 2 Bsp: (1) L2 (R) ⊗ C = L (R, C ) ist der Hilbertraum der C-wertigen Funk0 f (x) 1 , mit ⇔ f = f1 ⊗ e1 + f2 ⊗ e2 , wobei e1 = , e2 = tionen f (x) = 1 1 f2 (x) 0 Norm ||f ||2 = (f1 ⊗e1 +f2 ⊗e2 , f1 ⊗e1 +f2 ⊗e2 ) = (f1 , f1 )·(e1 , e1 )+(f1 , f2 )·(e1 , e2 )+ R (f2 , f1 ) · (e2 , e1 ) + (f2 , f2 ) · (e2 , e2 ) = ||f1 ||2 + ||f2 ||2 = R (|f1 (x)|2 + |f2 (x)|2 )dx. R (2) L2 (R) ⊗ L2 (R) = L2 (R2 ) mit Norm ||f ||2 = |f (x, y)|2 dxdy.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
7.5 7.5.1
75
Operatoren auf Hilbertr¨ aumen Beschr¨ ankte Operatoren
Wir betrachten nun beschr¨ankte (= stetige, Satz 7.2) lineare Abbildungen (= Operatoren) A : H1 → H2 zwischen zwei Hilbertr¨aumen (= Banachr¨aumen mit Skalarprodukt). Es reicht, eine beschr¨ankte Abbildung auf einem dichten Unterraum D ⊂ H1 zu spezifizieren: Denn jeder Vektor f ∈ H1 ist Grenzwert einer Folge von Vektoren fn ∈ D, und die Bildfolge Afn konvergiert ebenfalls, weil ||Afn1 − Afn2 ||H2 ≤ ||A|| · ||fn1 − fn2 ||H1 . Der Grenzwert ist dann Af . Beispiel: Wir haben die Fourier-Trafo zun¨achst nur f¨ ur stetige quadrat-integrable 2 Funktionen definiert, und f¨ ur diese die Parseval’sche Gleichung ||fˆ|| = ||f ||2 bewiesen (Satz 3.5). Daher ist die Abbildung F : f 7→ fˆ auf einem dichten Unterraum von L2 (R) erkl¨art: denn L2 (R) ist ja gerade der Abschluss des Raumes der stetigen q-i Funktionen. Dank Parseval hat der Fourier-Operator F : f 7→ fˆ die Norm 1. Also l¨asst er sich auf den ganzen Hilbertraum L2 (R) fortsetzen. Satz 7.8: Die Fourier-Trafo ist eine unit¨are Abbildung von L2 (R) nach L2 (R). Ein Operator U : H1 → H2 heißt unit¨ ar, wenn er invertierbar ist und ||U f || = ||f || f¨ ur alle f ∈ H1 gilt. Wegen der Polarisationsidentit¨at (7.3) gilt dann automatisch auch die Gleichheit aller Skalarprodukte (U f, U g) = (f, g). Weitere Beispiele: Der Operator L2 (R) ∋ f 7→ U f ∈ L2 (R), (U f )(x) = f (x − a) ist unit¨ar (Verschiebung). Der Operator L2 (R3 ) ∋ f 7→ U f ∈ L2 (R3 ), (U f )(x) = f (Rx) ist unit¨ar, wenn R eine orthogonale Matrix ist (Drehung, Spiegelung). Der Operator L2 (R) ∋ f 7→ U f ∈ L2 (R), (U f )(x) = |λ|1/2 f (λx) ist unit¨ar (Skalierung). Offenbar lassen sich Symmetrie-Gruppen durch unit¨are Operatoren realisieren. (Man nennt die Abbildung G ∋ g 7→ Ug eine unit¨ are Darstellung.)
Im Gegensatz zu endlich-dimensionalen Hilbertr¨aumen ist die Invertierbarkeit von U keine automatische Folgerung aus der Bedingung ||U f || = ||f ||. Ein Operator, der nur die letztere Eigenschaft hat, aber evtl nicht invertierbar ist, heißt isometrisch. Auch f¨ ur isometrische Operatoren gilt (U f, U g) = (f, g). In diesem Fall ist H1 unit¨ar ¨aquivalent zu dem Bildraum U H1 ⊂ H2 . Beispiel (“Hilberts Hotel”): U : en 7→ en+1 (n ∈ N) ist isometrisch. Beschr¨ankte Operatoren auf einem separablen Hilbertraum darf man als “∞× ∞-Matrizen” auffassen. Die Matrixelemente eines Operators A in einer ONB {ei } sind die Koeffizienten der Basis-Zerlegung der Bildvektoren Aej X Aij ei . Aij = (ei , Aej ), dh, Aej = i P Das Matrixprodukt (AB)ij = k Aik Bkj enth¨alt nat¨ urlich eine unendliche Summe, aber diese konvergiert absolut (dank Cauchy-Schwarz und der Beschr¨anktheit von A und B).
Sind Ai Operatoren auf Hilbertr¨aumen Hi , so ist A1 ⊗ A2 der durch f1 ⊗ f2 7→ A1 f1 ⊗ A2 f2 definierte Operator auf H1 ⊗ H2 . zB operiert A ⊗ 1 “nur auf H1 ”.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
76
Ist A ein beschr¨ankter Operator auf H, so ist der adjungierte Operator A∗ derjenige Op, f¨ ur den (A∗ g, f ) = (g, Af ) (7.5) f¨ ur alle f, g ∈ H gilt. Diese Gleichung legt den Operator A∗ eindeutig fest: denn f¨ ur jeden Vektor g ∈ H ist die Abbildung Lg : H ∋ f 7→ (g, Af ) beschr¨ankt (dank Cauchy-Schwarz: |(g, Af )| ≤ ||g||||Af || ≤ ||g||||A||||f || = cst. · ||f ||). Daher gibt es nach dem Satz 7.7 (Fischer-Riesz) einen eindeutigen Vektor h ∈ H, sodass (g, Af ) = (h, f ). Dann ist A∗ g := h. Eigenschaften: (A∗ )∗ = A. (AB)∗ = B ∗ A∗ , (λA + µB)∗ = λA∗ + µB ∗ sowie ||A∗ || = ||A||. In einer ONB gilt (A∗ )ij = Aji . Ein Operator U ist isometrisch, wenn U ∗ U = 1; unit¨ar, wenn auch U U ∗ = 1. Ein beschr¨ankter Operator heißt hermitesch ⇔ selbstadjungiert, wenn A = A∗ . Insbesondere ist A∗ A selbstadj. Alle Eigenwerte eines selbstadj Operators sind reell. Eigenvektoren zu verschiedenen EW sind orthogonal. Beweis w¨ortlich wie f¨ ur Matrizen: Af = λf ⇒ λ ||f ||2 = (f, λf ) = (f, Af ) = (Af, f ) = (λf, f ) = λ ||f ||2 , und (λ1 − λ2 )(f1 , f2 ) = (Af1 , f2 ) − (f1 , Af2 ) = 0. Ein wesentlicher Unterschied zwischen selbstadj endlich-dimensionalen Matrizen und selbstadj beschr¨ankten Operatoren auf einem separablen HR ist aber die Tatsache, dass letztere nicht immer eine ONB von Eigenvektoren besitzen (manche besitzen u ¨berhaupt keinen EV). Es gibt jedoch stets “approximative Eigenwerte” λ: f¨ ur jedes ε > 0 gibt es einen Einheitsvektor f , sodass ||Af − λf || < ε. Dies (und vieles mehr) ist Gegenstand der Spektraltheorie. Beispiel: Der Operator f 7→ Af , (Af )(x) = 21 (f (x − a) + f (x + a)) auf L2 (R) ist selbstadjungiert und ||A|| = 1. Er besitzt keine Eigenvektoren (die formalen Eigenfunktionen f (x) = eikx mit cos ka = λ sind nicht quadrat-integrabel), aber jedes λ ∈ [−1, 1] ist ein approximativer Eigenwert mit approximativen Eigen2 2 funktionen der Form fr (x) = Nr e−x /r eikx , wobei r → ∞ wenn ε → 0. (Der Koeffizient Nr dient nur zur Normierung auf ||fr || = 1.) Matrixelemente der Art (f, Af ) nennt man Erwartungswerte (vgl Kap. 7.1). Alle Erwartungswerte eines selbstadj Operators sind reell. Denn (f, Af ) = (Af, f ) = (A∗ f, f ) = (f, Af ). Hieraus folgt uA, dass alle approximativen Eigenwerte reell sind. Physikalisch ist diese Eigenschaft h¨ochst bedeutsam, weil sie in der Quantenmechanik sicherstellt, dass alle Vorhersagen f¨ ur physikalische Messungen an Quantensystemen reell sind.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
77
Ein selbstadj Operator A ist positiv, wenn (f, Af ) ≥ 0 f¨ ur alle f ∈ H. Insbesondere ist A = B ∗ B positiv, weil (f, B ∗ Bf ) = ||Bf ||22 ≥ 0, und jeder positive Operator ist von dieser Form. Eine Projektion ist ein selbstadj Operator P mit der Eigenschaft P 2 = P . Beispiele: Die Multiplikation mit einer charakteristischen Funktion (P f )(x) = χ(x)f (x) ist eine Projektion in L2 (R). (P f )(x) = 12 (f (x) + f (−x)) projiziert auf den symmetrischen Anteil einer Funktion. Jede Projektion ist positiv, weil P = P ∗ P . Mit P ist auch 1 − P eine Projektion. Eine Projektion besitzt nur Eigenwerte 1 und 0, denn jeder Vektor besitzt eine Zerlegung f = P f + (1 − P )f (Orthogonalzerlegung) und P (P f ) = P f und P ((1 − P )f ) = 0. Eine Projektion zerlegt den Hilbertraum in zwei orthogonale Unterr¨aume P H und (P H)⊥ = (1 − P )H: denn f¨ ur beliebige Vektoren f , g gilt (P f, (1 − P )g) = (f, P (1 − P )g) = (f, (P − P )g) = 0. Die Spur eines Operators A ist die Summe X (ei , Aei ), Tr A = i
wobei (ei )i∈N eine ONB ist, vorausgesetzt die Summe konvergiert absolut (das ist zB nicht der Fall f¨ ur den Einheitsoperator). In diesem Fall h¨angt die Spur nicht von der Wahl der ONB ab. Gilt außerdem, dass AA∗ = A∗ A (zB wenn A selbstadjungiert ist), dann gibt es eine ONB von Eigenvektoren von A, und Tr A ist die Summe der Eigenwerte. Beweis: Falls die Summen konvergieren, gilt Tr (AB) = Tr (BA). Es folgt Tr A = Tr (U ∗ AU ) f¨ ur jeden unit¨aren Operator U . Dieser beschreibt einen WechselP der ONB. Falls U eP ist, dann ist Tr A = Tr (U ∗ AU ) i eine ONB von Eigenvektoren P = i (U ei , AU ei ) = i λi (U ei , U ei ) = i λi . Ein Zustand ist ein positives normiertes lineares Funktional auf der Algebra aller beschr¨ankten Operatoren B(H) ≡ L(H, H): ϕ(A∗ A) ≥ 0, ϕ(1) = 1.
Dazu geh¨oren die Vektorzust¨ ande ϕ(A) = (f, Af ) mit ||f ||2 = 1, und die Dichtematrix-Zust¨ ande ϕ(A) = Tr (ρA), wobei die Dichtematrix ρ ein positiver selbstadj Operator mit Tr A = 1 ist. Vektorzust¨ande (f, Af ) sind Spezialf¨alle der letzteren, mit ρ : g 7→ (f, g) · f ≡ Pf g. (Pf ist eine Projektion, Pf H = C · f .) P Ist (fn )n∈N eine ONB von Eigenvektoren von ρ: ρfn = λn fn , so ist Tr (ρA) = n λn (fn , Afn ), dh der DM-Zustand ist eine konvexe Summe (= statistische Mittelung) von Vektorzust¨anden, mit W’keiten = Eigenwerte λn von ρ. Die Vektorzust¨ande wiederum ergeben, wie in Kap. 7.1, statistische Mittelungen der Eigenwerte ai des Operators A: Falls P es eine ONB (ei )i∈N von Eigenvektoren von A gibt: Aei = ai ei , undP f = i ci ei die Entwicklung von f in diese ONB ist, so ergibt sich (f, Af ) = i |ci |2 ai mit W’keiten = Quadrate |ci |2 der Entwicklungskoeffizienten. (Falls es keine solche ONB gibt ⇒ kontinuierliche Mittelung.)
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren 7.5.2
78
Unbeschr¨ ankte Operatoren
Leider sind die wichtigsten Operatoren in der QM unbeschr¨ankt, und leider sind viele Argumente des letzten Abschnitts f¨ ur unbeschr¨ankte Operatoren nicht richtig (zB die Verwendung von Satz 7.7 bei der Definition von A∗ ). Beispiele: Der Operator N : en 7→ nen (n ∈ N) ist offenbar unbeschr¨ankt, weil P ||N en ||/||en || = n divergiert. Er l¨asst sich P nicht auf alle Linearkombinationen 2 2 f = n cn en ∈ ℓ fortsetzen, weil mit ||f || = n |cn |2 < ∞ nicht notwendig auch P 2 n |(ncn )| < ∞ ist (zB cn = 1/n). PN ist also nur auf dem dichten Unterraum definiert, f¨ ur dessen Elemente f = n cn en sogar die Koeffizienten ncn quadratsummierbar sind. Der Multiplikations-Operator X : f → Xf , (Xf )(x) = xf (x) ist unbeschr¨ankt auf L2 (R), weil ||Xfn ||/||fn || ≥ n f¨ ur supp fn ⊂ (n, ∞). Er ist nur auf solchen Fn definiert, die schnell genug abfallen, dass auch xf (x) noch qu-integrabel ist. Allgemein ist ein unbeschr¨ ankter Operator Q ein Paar: der Definitionsbereich D ⊂ H (ein dichter Unterraum von H) und die Abbildungsvorschrift D ∋ f 7→ Qf ∈ H. Mehr Beispiele: Der Differentialoperator ∂x kann zB auf dem dichten Unterraum von diffbaren Fn mitR komp Tr¨ager in L2 (R) definiert werden, oder auf den L1 -Fn, f¨ ur die ||∂x f ||2 = k 2 |fˆ(k)|2 dk < ∞, vgl (3.24). Die charakteristische Funktion eines Intervalls liegt zwar in L2 (R), kann jedoch nicht im Definitionsbereich von ∂x liegen, weil ihre Fourier-Transformierte nur wie 1/|k| abf¨allt. Unbeschr¨ankte Operatoren sind insbesondere auch unstetig. Daher haben sie einige T¨ ucken, deren Kontrolle fortgeschrittene Methoden der Funktionalanalysis erfordert. Wir wollen im Folgenden nur die Schwierigkeiten andeuten. 7.5.3
Der adjungierte Operator
Bei der Definition des adjungierten Operators war es wichtig, dass das lineare Funktional Lg : f 7→ (g, Qf ) beschr¨ankt ist, um den Satz 7.7 (Existenz des Vektors Q∗ g, der Lg realisiert) anwenden zu d¨ urfen. Falls Q beschr¨ankt ist, ist das automatisch der Fall. Falls Q unbeschr¨ankt ist, wird dies nicht f¨ ur alle g der ∗ Fall sein. Also kann der Operator Q nur auf dem Definitionsbereich D∗ = {g ∈ H : Lg : D → H ist beschr¨ankt} definiert werden. Selbst wenn D konkret gegeben ist, ist jedoch D∗ ziemlich abstrakt definiert und kann meistens nicht wirklich “ausgerechnet” werden. D und D∗ k¨onnen ganz verschiedene (sogar disjunkte!) dichte Unterr¨aume von H sein. Q mit dem Definitionsbereich D heißt hermitesch, falls (f1 , Qf2 ) = (Qf1 , f2 ) f¨ ur alle f1 , f2 ∈ D. Dann ist D ⊂ D∗ und Q∗ stimmt auf D mit Q u ¨berein. Q heißt selbstadjungiert, wenn D∗ = D und Q∗ = Q.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
79
Diese subtile Unterscheidung ist f¨ ur unbeschr¨ankte Operatoren wichtig, denn: Die meisten Aussagen u ¨ber das Spektrum (Eigenwerte und approximative Eigenwerte) von beschr¨ankten Operatoren u ¨bertragen sich zwar auf selbstadjungierte Operatoren, nicht aber auf hermitesche Operatoren. Beispiele: (1) Der Ableitungsoperator i∂x mit D = alle diffbaren Funktionen in L2 (R) ist hermitesch: Z Z Z ′ ′ if1 (x)f2 (x)dx = −i f1 (x)f2 (x)dx = +i f1 (x)f2′ (x)dx = (f1 , i∂x f2 ). (i∂x f1 , f2 ) = R
R
R
Auf einem etwas gr¨oßeren Definitionsbereich ist i∂x sogar selbstadjungiert ist. (2) Dieselbe Rechnung in L2 (R+ ) ergibt aber den Randterm if1 (0)f2 (0) bei der partiellen Integration. Daher ist i∂x hermitesch nur auf dem dichten Unterraum D aller diffbaren Funktion mit der Randbedingung f (0) = 0. Dann enth¨alt aber D∗ alle diffbaren L2 -Funktionen ohne die RB f (0) = 0, weil der Randterm schon verschwindet, wenn nur f2 ∈ D ist. Der adjungierte Operator (i∂x )∗ ist daher nicht mehr hermitesch (beide fi ∈ D∗ )! (3) Der Operator i∂x auf L2 (R+ ) besitzt imagin¨are Eigenwerte, zB i∂x e−x = −ie−x . (In L2 (R) w¨are e−x nat¨ urlich kein Eigenvektor, weil nicht qu-integrabel.) F¨ ur hermitesche Operatoren Q kann man allgemein zeigen, dass der Definitionsbereich von Q∗∗ := (Q∗ )∗ den von Q enth¨alt und in dem von Q∗ enthalten ist: D ⊂ D∗∗ ⊂ D∗ . Wenn Q∗ wieder hermitesch ist, dann ist aber D∗∗ ⊂ D∗ , also folgt D∗∗ = D∗ . Also Satz 7.9: Wenn Q auf D hermitesch ist, und Q∗ auf D∗ ⊃ D ebenfalls hermitesch ist, dann ist Q∗ selbstadjungiert. W¨ahrend die erste Bedingung leicht zu erf¨ ullen ist, ist die zweite sehr schwie∗ rig (denn D h¨angt von der Wahl von D ab). Die Frage, wann ein hermitescher Operator Q auf einem ggf gr¨oßeren Definitionsbereich D ⊃ D selbstadjungiert ist, ist eines der schwierigen Probleme der Funktionalanalysis. Man sieht anhand der Definition, dass D∗ gr¨oßer wird, wenn man den Definitionionsbereich D von Q verkleinert, und umgekehrt. Die Bedingung D = D∗ stellt also ein Problem der “richtigen Balance” bei der Wahl der Definitionsbereiche unbeschr¨ankter Operatoren dar: der Definitionsbereich eines selbstadjungierten Operators, der auf D mit Q u ur manche ¨bereinstimmt, muss irgendwo zwischen D und D∗ liegen. F¨ hermitesche Operatoren Q gibt es mehrere, oder u ¨berhaupt keinen selbstadjungierten Operator, der auf D mit Q u bereinstimmt. ¨ Es gibt aber ein anderes n¨ utzliches (hinreichendes, aber nicht notwendiges) Kriterium: Satz 7.10: Wenn Q eine ONB von Eigenvektoren in H besitzt, dann ist Q (auf einem geeigneten dichten Definitionsbereich D ⊂ H) selbstadjungiert.
Maphy II, Uni G¨ottingen, WS 2013/14, KH Rehren
80
Was man in dieser Vorlesung gelernt haben soll: • Was ist eine Norm? Was bedeutet “Konvergenz” in unendlich-dimensionalen Vektorr¨aumen? • Welche Strategien gibt es zur L¨osung von gew¨ohnlichen Differentialgleichungen erster und zweiter Ordnung? • Welche Strategien gibt es zur L¨osung von (gekoppelten, homogenen und inhomogenen) linearen Differentialgleichungen mit konstanten Koeffizienten? • Was ist die S¨akulargleichung, und was verr¨at sie einem?
• Wie berechnet man die Fourier-Koeffizienten einer periodischen Funktion? • Wie berechnet man die Fourier-Transformierte einer L1 -Funktion? • Wie lautet die Parseval’sche Identit¨at?
• Welcher Zusammenhang besteht zwischen der FT einer Funktion und der FT ihrer Ableitungen? • Welcher Zusammenhang besteht zwischen den Differenzierbarkeits-Eigenschaften einer Funktion und dem Abfall-Verhalten ihrer FT? • Welcher Zusammenhang besteht zwischen dem Tr¨ager einer Funktion und den Analytizit¨ats-Eigenschaften ihrer FT? • Welche Kriterien gibt es f¨ ur (komplexe) Analytizit¨at?
• Wie lautet der Residuensatz, und warum ist er so n¨ utzlich?
• Was ist eine Distribution?
• Wie kann man Distributionen ableiten und Fourier-transformieren?
• Welche Typen von Randbedingungen gibt es im Kontext von partiellen Differentialgleichungen? Was ist das Cauchy’sche Anfangswert-Problem?
• Was ist eine Green’sche Funktion? Was ist ein Integralkern?
• Wie l¨ost man lineare partielle DGln mithilfe von Green’schen Funktionen? • Wie kann man Mittelwerte in einem statistischen Ensemble beschreiben?
• Was sind unit¨are Funktionenr¨aume, Skalarprodukte, orthonormale Basen von Funktionenr¨aumen? • Was ist ein Hilbert-Raum? Was ist ein linearer Operator auf einem HilbertRaum?
• Wie kann man mit einem Vektor in einem Hilbert-Raum einen Zustand auf der Algebra der Operatoren definieren? • Was bedeutet es, dass ein Operator beschr¨ankt / unit¨ar / hermitesch / eine Projektion ist? • Was weiß man a priori u ¨ber die Eigenwerte und Eigenvektoren eines (beschr¨ankten) hermiteschen Operators?