Abstrakcyjne przestrzenie wektorowe

Konspekt wykładów „AFiW” (wydruk 27 października 2009 roku) 11 Wykład II (20 X 2009) Abstrakcyjne przestrzenie wektorowe 1.3 1.3.1 Przestrzenie w...
Author: Sebastian Nowak
0 downloads 4 Views 166KB Size
Konspekt wykładów „AFiW”

(wydruk 27 października 2009 roku)

11

Wykład II (20 X 2009)

Abstrakcyjne przestrzenie wektorowe 1.3 1.3.1

Przestrzenie wektorowe i ich podprzestrzenie Definicja abstrakcyjnej przestrzeni wektorowej

Przypomniane wyżej przestrzenie kartezjańskie są przykładem ogólnego pojęcia przestrzeni wektorowej. Choć są to przykłady ważne, a nawet typowe w przypadku skończenie wymiarowym, to ograniczanie się do badania tylko tych przestrzeni byłoby nieproduktywne i pozbawiałoby nasze rozważania ogólności potrzebnej również w wielu sytuacjach napotykanych w zastosowaniach. Dla wygody czytelnika przedstawimy krótko tę ogólną koncepcję przestrzeni wektorowej, odsyłając po szersze wyjaśnienia i dodatkowe szczegóły do cytowanej literatury, np. podręczników Gelfanda [?], Smirnowa [?] i Sołtysiaka [?]. Definicja 1.6 (Przestrzeń wektorowa nad ciałem K) Niech K będzie ciałem, a V niepustym zbiorem. Będziemy mówili, że V jest przestrzenią wektorową z ciałem skalarów K (krócej: nad ciałem K), jeśli określone są dwa odwzorowania V × V ∋ (v, w)

−→ v + w ∈ V,

dodawanie wektorów;

(1.35)

K × V ∋ (λ, v)

−→ λv ∈ V,

mnożenie wektora przez skalar.

(1.36)

które dla dowolnych elementów u, v, w ∈ V i λ, µ ∈ K spełniają następujące warunki:

Własności dodawania wektorów

Własności mnożenia przez skalary

Łączność

Łączność

u + (v + w) = (u + v) + w.

λ · (µ · v) = (λ · µ) · v.

Przemienność

Unitarność mnożenia przez skalary

v + w = w + v.

Dla każdego v ∈ V zachodzi

Istnienie elementu neutralnego Istnieje 0 ∈ V , że dla każdego v ∈ V

0 + v = v.

Istnienie elementu przeciwnego

1 · v = v.

Dwa prawa rozdzielności mnożenia (λ + µ) · v = λ · v + µ · v; λ · (v + w) = λ · v + λ · w.

Dla każdego v ∈ V istnieje v ′ ∈ V , że v + v ′ = 0. Własności dodawania wektorów można wypowiedzieć krótko mówiąc, że zbiór V jest grupą przemienną względem dodawania. Element przeciwny do v oznacza sie zwykle −v i wykazuje bez trudności,

Konspekt wykładów „AFiW”

(wydruk 27 października 2009 roku)

12

że −v = (−1)v. Prawa łączności i rozdzielności mnożenia gwarantują zgodność działań wykonywanych na wektorach z tymi wykonywanymi na skalarach — w szczególności pokazują one, że dla każdego wektora v 6= 0 zbiór K · v można utożsamić (z zachowaniem obu działań) z osią liczbową K za pomoca odwzorowania λ 7→ λv. Dodajmy jeszcze jedną uwagę o możliwości zawężenia ciała skalarów od ciała liczb zespolonych do ciała liczb rzeczywistych. Załóżmy, że dana jest przestrzeń wektorowa V nad ciałem liczb zespolonych. Korzystając z tego, że liczby rzeczywiste tworzą podciało R ciała liczb zespolonych C, można łatwo przekonać się, że ograniczenie mnożenia (1.36) do odwzorowania R × V ∋ (t, v) −→ tv ∈ V spełnia wszystkie warunki wymagane od mnożenia wektorów przez skalary. W ten sposób z dowolnej przestrzeni wektorowej V nad ciałem C otrzymuje się przestrzeń wektorową nad ciałem R, oznaczaną symbolem VR , z tym samym zbiorem wektorów V , tym samym dodawaniem wektorów i mnożeniem przez skalary otrzymanym przez ograniczenie mnożenia wektorów tylko do liczb (skalarów) rzeczywistych(4 ). Przeprowadźmy dla ilustracji tę konstrukcję dla najprostszej przestrzeni zespolonej V = C. Ponieważ dowolną liczbę zespoloną α = a + bi można zapisać jako a + bi = a · 1 + b · i, to spostrzegamy od razu, że rzeczywistą przestrzeń CR można utożsamić z przestrzenią R2 . Analogicznie, dla V = Cn otrzymamy (z dokładnością do izomorfizmu) (Cn )R = R2n .

1.3.2

Przestrzeń wektorowa funkcji na zbiorze X i wartościach w K

Większość, jeśli nie wręcz wszystkie, przykładów przestrzeni wektorowych omawianych w tych wykładach daje się wyprowadzić z następującej ogólnej konstrukcji przestrzeni wektorowej jako przestrzeni funkcji. Symbolem F(X, K) będziemy oznaczać zbiór funkcji określonych na niepustym zbiorze X i przyjmujących wartości w wybranym ciele liczbowym K (na ogół będzie to jedno z ciał R lub C). W zbiorze F(X, K) rozważamy tak zwane działania punktowe — suma dwóch funkcji określonych na zbiorze X i iloczyn takiej funkcji przez liczbę a ∈ K są określone „punkt po punkcie” zgodnie z następującą definicją. Definicja 1.7 (Przestrzeń wektorowa funkcji) Dla dowolnych f, g ∈ F(X, K) oraz a ∈ K suma f + g i iloczyn af są określone wzorami (f + g)(x) = f (x) + g(x), (af )(x) = af (x),

dla x ∈ X.

(1.37)

Przy tych określeniach mamy f, g ∈ F(X, K), a ∈ K =⇒ f + g ∈ F(X, K), af ∈ F(X, K), a ponadto te działania mają wszystkie własności wymagane w definicji przestrzeni wektorowej. A zatem F(X, K) z działaniami określonymi wzorem (1.37) jest przestrzenią wektorową nad ciałem K. Przypomnijmy, że funkcje, których dziedziną jest zbiór N liczb naturalnych noszą nazwę ciągów, a bardziej szczegółowo mówimy o ciągach o wyrazach ze zbioru X dla określenia funkcji postaci f : N → X. Do ciągów stosujemy tradycyjną notację oznaczając przez fn wartość ciągu f : N → X w punkcie n ∈ N, a sam ciąg zapisujemy w postaci (fn ) lub (fn )∞ n=1 . Jako szczególny przypadek powyższej konstrukcji otrzymujemy więc przestrzeń wektorową S(R) ciągów o wyrazach z ciała R wyposażoną w punktowe działania dodawania ciągów i mnożenia ich przez liczby zgodnie ze wzorami: (xn ) + (yn ) = (xn + yn ); 4

α(xn ) = (αxn ),

dla α ∈ R.

(1.38)

Nieco żartobliwie mówi się czasami, że jest ona otrzymana z przestrzeni zespolonej przez „zapominanie” o jej zespolonej strukturze (mnożeniu przez liczbę urojoną i).

Konspekt wykładów „AFiW”

(wydruk 27 października 2009 roku)

13

W analogiczny sposób z ciągów o wyrazach zespolonych można zbudować przestrzeń S(C) z ciałem liczb zespolonych jako ciałem skalarów — szczegółowe prześledzenie tej konstrukcji pozostawimy zainteresowanym czytelnikom.

1.3.3

Podprzestrzenie wektorowe — nowe konstrukcje i nowe przykłady

Przypomnimy krótko kilka najważniejszych dla nas pojęć algebry liniowej i ich podstawowe własności. Zaczniemy od pojęcia podprzestrzeni. Definicja 1.8 (Podprzestrzeń przestrzeni wektorowej) Podprzestrzenią wektorową przestrzeni wektorowej V nad K nazywamy taki podzbiór W ⊂ V , że dla każdej pary wektorów w1 , w2 ∈ W i każdej pary skalarów α, β ∈ K kombinacja liniowa αw1 + βw2 też jest elementem W (jak mówimy, W jest zamknięta względem brania kombinacji liniowych swoich wektorów z dowolnymi wspólczynnikami). W konsekwencji tej definicji każdą podprzestrzeń wektorową możemy traktować jako samoistną przestrzeń wektorową, z działaniami przeniesionymi z zawierającej ją przestrzeni. Z każdym układem {v1 , . . . , vm } wektorów z przestrzeni V związana jest pewna podprzestrzeń wektorowa w V , zdefiniowana jako lin{v1 , . . . , vm } = {

m X

j=1

tj vj | t1 , . . . , tm ∈ K }

(1.39)

i nazywana podprzestrzenią rozpiętą przez ten układ. Pozostawiając czytelnikowi sprawdzenie, że jest to rzeczywiście podprzestrzeń wektorowa w V , zauważymy, że z samej kostrukcji tej przestrzeni wynika, że jest ona zawarta w każdej podprzestrzeni wektorowej zawierającej układ {v1 , . . . , vm }. Na tej podstawie powiada się, że lin{v1 , . . . , vm } jest najmniejszą podprzestrzenią wektorową w V zawierającą ten zbiór wektorów. Interpretując szerzej tę konstrukcję możemy także rozważać przestrzeń skończonych kombinacji liniowych wektorów należących do danego zbioru E ⊂ V . Tę przestrzeń będziemy także oznaczać symbolem lin{E} i nazywać przestrzenią rozpiętą (generowaną) przez ten zbiór. Ważnym punktem budowy teorii jakiejś struktury algebraicznej jest wyjaśnienie, w jaki sposób wprowadzane w niej pojęcia o charakterze algebraicznym zachowują sie w odniesieniu do czysto mnogościowych operacji — części wspólnej i sumy zbiorów. W odniesieniu do pojęcia podprzestrzeni wektorowej sytuacja jest w pełni zadowalająca dla operacji brania części wspólnej, a dla sumy już nieco bardziej problematyczna. Stwierdzenie 1.6 Niech U, W będą dwiema podprzestrzeniami wektorowymi przestrzeni wektorowej V. (a) Część wspólna U ∩ W jest podprzestrzenią wektorową w V ; (b) Suma mnogościowa U ∪ W jest podprzestrzenią wektorową w V wtedy i tylko wtedy, gdy U ⊂ W lub W ⊂ U . (c) Zbiór U + V = { x = u + w ∈ V | u ∈ U, w ∈ W } jest najmniejszą podprzestrzenią wektorową zawierającą każdą z podprzestrzeni U, W . Nazywa się ją sumą podprzestrzeni U i W . Sformułowanie powyższe można uogólnić rozważając dowolne, niekoniecznie dwuelementowe, rodziny podprzestrzeni wektorowych ustalonej przestrzeni wektorowej V . Stwierdzenie 1.7 Niech {Wj }j∈J będzie rodziną podprzestrzeni wektorowych przestrzeni wektorowej V . Wówczas: T (a) Wj jest podprzestrzenią wektorową przestrzeni wektorowej V ; j∈J

Konspekt wykładów „AFiW”

(wydruk 27 października 2009 roku)

(b) Najmniejszą podprzestrzenią wektorową w V zawierającą sumę mnogościową

14 S

j∈J

lin{

S

j∈J

Wj }. Nazywamy ją sumą wektorową rodziny podprzestrzeni {Wj }j∈J i oznaczamy X

Wj = lin{

S

j∈J

j∈J

1.3.4

Wj jest przestrzeń

Wj }.

Baza i wymiar przestrzeni wektorowej

Bodaj najważniejszą definicją elementarnej algebry liniowej jest definicja bazy przestrzeni wektorowej. Podamy tu takie jej sformułowanie, które naszym zdaniem najjaśniej wydobywa związek tego pojęcia z teorią układów równań liniowych i dzięki temu wiedzie najkrótszą drogą do praktycznych zastosowań. Definicja 1.9 (Baza przestrzeni wektorowej) Ciąg wektorów {w1 , . . . , wn } nazywa się bazą uporządkowaną przestrzeni wektorowej V nad K (K = R lub C), jeśli każdy wektor v ∈ V można jednoznacznie przedstawić w postaci kombinacji liniowej wektorów w1 , . . . , wn . Jeśli v=

n X

(1.40)

vj wj

j=1

to liczby vj , j = 1, . . . , n (wyznaczone jednoznacznie) nazywamy współrzędnymi wektora v względem bazy {w1 , . . . , wn }. Przypomnijmy także, że zbiór E ⊂ V nazywamy zbiorem wektorów liniowo niezależnych (krócej, choć nie całkiem poprawnie mówi się, że jest zbiorem liniowo niezależnym), jeśli dla każdego skończonego podzbioru {e1 , . . . , ek } ⊂ E jest prawdziwa implikacja k X

λj ej = 0

=⇒

λ1 = λ2 . . . = λk = 0.

(1.41)

j=1

Wniosek 1.7 Każda baza uporządkowana przestrzeni wektorowej V nad K jest zbiorem wektorów liniowo niezależnych. Ponadto, jeśli {w1 , . . . , wn } jest bazą uporządkowaną w V , a {f1 , . . . , fm } ⊂ V jest zbiorem wektorów liniowo niezależnych, to m ¬ n. Uogólniając ten wniosek możemy powiedzieć, że baza jest maksymalnym zbiorem wektorów liniowo niezależnych w V . Konsekwentnie, wymiarem podprzestrzeni W ⊂ V nazywamy największą liczbę liniowo niezależnych wektorów należących do tej podprzestrzeni. Łatwo zauważyć, że określony w ten sposób wymiar podprzestrzeni jest równy jej wymiarowi, jeśli traktować ją jako samodzielną przestrzeń wektorową. Przykłady 1.3.1 Bazy w przestrzeni kartezjańskiej. (a) Ciąg wektorów {ei }, gdzie e1 = (1, 0, 0, 0, . . . , 0),

e2 = (0, 1, 0, 0, . . . , 0),

e3 = (0, 0, 1, 0, . . . , 0),

... ,

en = (0, 0, 0, . . . , 1) (1.42) n n jest bazą w R (także w C ), nazywaną bazą standardową. Współrzędnymi wektora v = (v1 , v2 , . . . , vn ) względem bazy standardowej są liczby v1 , v2 , . . . , vn . (b) Pozostawiamy czytelnikowi sprawdzenie, że następujący ciąg wektorów f1 = (1, 0, 0, 0, . . . , 0),

f2 = (1, 1, 0, 0, . . . , 0),

f3 = (1, 1, 1, 0, . . . , 0),

... ,

jest także bazą uporządkowaną w Rn .

fn = (1, 1, 1, . . . , 1) (1.43)

Konspekt wykładów „AFiW”

1.3.5

(wydruk 27 października 2009 roku)

15

Menażeria przestrzeni wektorowych

Niżej opiszemy kilka często spotykanych przestrzeni wektorowych. Są one wszystkie, co warto podkreślić, podprzestrzeniami wektorowymi F(R, K) — przestrzeni funkcji określonych na R i przyjmujących wartości w K. Przykłady 1.3.2 (a) Przestrzeń funkcji wielomianowych stopnia ¬ n. Przypomnijmy, ze funkcją wielomianową stopnia n w ciele liczb rzeczywistych R nazywamy funkcję postaci R ∋ t 7→ f (t) = f0 + f1 t + f2 t2 + . . . + fn tn =

n X

k=0

fk tk ∈ R,

gdzie

f0 , f1 , . . . , fn ∈ R,

fn 6= 0.

Dla uproszczenia, choć nie w pełni ściśle, funkcje te będziemy nazywać wielomianami zmiennej t. Rozważmy podzbiór P n [t] ⊂ F(R, R) złożony z wielomianów stopnia nie większego niż n — łatwo sprawdzić, ze kombinacja liniowa takich wielomianów jest znowu wielomianem stopnia nie większego niż n (zauważmy jednak, że stopień kombinacji liniowej może być mniejszy niż stopień każdego ze składników), a więc zbiór ten jest podprzestrzenią wektorową przestrzeni F (R, R). Nazywamy ją przestrzenią wielomianów rzeczywistych stopnia nie większego niż n i zazwyczaj traktujemy jako samodzielną przestrzeń wektorową. Pozostawiamy czytelnikowi sprawdzenie (oparte na wykorzystaniu standardowych własności działań w ciele R), że suma dwóch wielomianów wyraża się za pomocą ich współczynników wzorem f (t) + h(t) =

n X

f k tk +

k=0

n X

h k tk =

k=0

n X

(fk + hk )tk

(1.44)

k=0

Podobnie iloczyn wielomianu przez liczbę wyraża się wzorem af (t) = a

X n k=0

fk t

k



=

n X

(afk )tk

(1.45)

k=0

Stąd wnioskujemy bez trudności, że P n [t] = lin{1, t, t2 , . . . , tn }

(1.46)

(b) Przestrzeń funkcji wielomianowych (dowolnego stopnia). Niech E = {1, t, t2 , . . . , tn , . . .}

(1.47)

będzie zbiorem jednomianów wszystkich stopni zmiennej t. Oznaczmy P[t] = lin E — elementami P[t] są, zgodnie z podaną wyżej definicją, wszystkie skończone kombinacje liniowe jednomianów zmiennej t, a więc funkcje wielomianowe dowolnego stopnia. Mamy tu prosty, ale bardzo ważny przykład przestrzeni wektorowej nieskończonego wymiaru. Oba powyższe przykłady można rozszerzyć rozważając funkcje wielomianowe na R o współczynnikach zespolonych. Czytelnikowi pozostawimy sprawdzenie, że wszystkie wymienione wyżej fakty dotyczące działań na wielomianach pozostają prawdziwe. (c) Przestrzeń wielomianów trygonometrycznych stopnia ¬ n. Wielomianem trygonometrycznym stopnia n o współczynnikach z ciała R nazywamy funkcję R ∋ t 7→ w(t) ∈ R, gdzie w(t)

= =

a0 + a1 sin t + b1 cos t + a2 sin 2t + b2 cos 2t + . . . + an sin nt + bn cos nt n n X X a0 + ak sin kt + bk cos kt, k=1

k=1

współczynniki a0 , a1 , b1 , . . . , an , bn ∈ R oraz |an | + |bn | = 6 0. Wielomiany trygonometryczne tworzą podprzestrzeń wektorową w F (R, R), którą rozpinają funkcje 1, sin t, cos t, sin 2t, cos 2t, . . . , sin nt, cos nt.

(1.48)

Konspekt wykładów „AFiW”

(wydruk 27 października 2009 roku)

16

(d) Przestrzeń zespolonych wielomianów trygonometrycznych stopnia ¬ n. W tym przykładzie rozważamy funkcje o wartościach w ciele liczb C zespolonych i w konsekwencji dopuszczamy mnożenie przez skalary zespolone. Funkcje R ∋ t 7→ w(t) ∈ C postaci w(t)

=

a−n e−int + . . . + a−1 e−it + a0 + a1 eit + . . . + an eint =

n X

ak eikt ,

k=−n

gdzie dla k = −n, . . . , n współczynniki ak ∈ C oraz |an | + |bn | = 6 0, nazywamy zespolonym wielomianem trygonometrycznym stopnia n. Nietrudno się przekonać, że funkcje e−int , . . . , e−it , 1, eit , . . . , eint

(1.49)

są liniowo niezależne nad ciałem C, a zatem rozpatrywana przez nas przestrzeń ma wymiar (zespolony) 2n + 1.

1.4

Ogólne pojęcie iloczynu skalarnego i jego własności

Własności iloczynu skalarnego wymienione w Stwierdzeniu (1.4) przyjmuje się jako własności definiujące iloczyn skalarny w dowolnej przestrzeni wektorowej nad ciałem liczb rzeczywistych R(5 ). Definicja 1.10 (Iloczyn skalarny) Niech V będzie przestrzenią wektorową nad ciałem R, niekoniecznie skończenie wymiarową. Iloczynem skalarnym w przestrzeni V nazywamy odwzorowanie V × V ∋ (v, w) 7→ (v | w) ∈ R spełniające dla każdych v1 , v2 , v, w ∈ V i α, β ∈ R warunki: i)

(v | w) = (w | v);

(symetria)

ii)

(αv1 + βv2 | w) = α(v1 | w) + β(v2 | w);

iii)

(v | v) ­ 0;

(liniowość wzg. pierwszego argumentu)

ponadto (v | v) = 0 ⇐⇒ v = 0;

(dodatnia określoność).

(1.50) Przestrzeń wektorową V nad ciałem R z wyróżnionym iloczynem skalarnym nazywamy (abstrakcyjną) przestrzenią euklidesową, lub rzeczywistą przestrzenią prehilbertowską. Dla podkreślenia, że rozważamy przestrzeń V z wybranym (i ustalonym) iloczynem skalarnym oznaczanym przez (w | v) będziemy pisać (V, (· | ·)). Zauważmy, że z liniowości względem pierwszego czynnika i symetrii wynika, że iloczyn skalarny jest liniowy również jako funkcja drugiego argumentu. Rzeczywiście, mamy (w | αv1 + βv2 ) = (αv1 + βv2 | w) = α(v1 | w) + β(v2 | w) = = α(w | v1 ) + β(w | v2 ) Wniosek 1.8 Dla dowolnych wektorów v, w ∈ V jest spełniona „nierówność Schwarza” |(v | w)| ¬ (v | v)1/2 (w | w)1/2 ,

(1.51)

przy czym obie strony w (1.51) są równe wtedy i tylko wtedy, gdy wektory v i w są współliniowe. 5

Własności iloczynu skalarnego dla przestrzeni wektorowych z ciałem liczb zespolonych C jako ciałem skalarów są nieco inne i w tym miejscu nie będziemy ich omawiać.

Konspekt wykładów „AFiW”

(wydruk 27 października 2009 roku)

17

Podobnie jak w przypadku „kropkowego” iloczynu skalarnego w Rn można wykazać, wykorzystując miedzy innymi powyższą nierówność Schwarza, że funkcja v 7→ (v | v)1/2 ma wszystkie własności normy euklidesowej. Stwierdzenie 1.8 Niech V będzie przestrzenią wektorową nad ciałem K (K = R lub K = C) z iloczynem skalarnym oznaczanym (v | w). Funkcja V ∋ v 7→ kvk = (v | v)1/2 ∈ R

(1.52)

ma własności dodatniej określoności i bezwzględnej jednorodności, a także spełnia nierówność trójkąta (por. Twierdzenie 1.4 (c)). Definicja 1.11 (Norma indukowana przez iloczyn skalarny) Jeśli w przestrzeni V wybrany jest iloczyn skalarny, to funkcję V ∋ v 7→ kvk = (v | v)1/2 ∈ R (1.53) nazywa się normą w przestrzeni V indukowaną przez iloczyn skalarny (v | w).

1.4.1

Przykłady iloczynu skalarnego w przestrzeniach funkcyjnych.

(a) Jako iloczyn skalarny w przestrzeni P n [t] przyjmujemy zazwyczaj wyrażenie n

n

P [t] × P [t] ∋ (p, q) 7→ (p | q) =

Z

1

p(t)q(t) dt,

(1.54)

−1

choć wybór przedziału całkowania po prawej jest sprawą konwencji i może być dopasowywany do konkretnego zastosowania. Pozostawiamy czytelnikowi łatwe sprawdzenie, że tak określona funkcja ma wszystkie wymagane od iloczynu skalarnego własności. (b) Jako iloczyn skalarny w przestrzeni wielomianów trygonometrycznych przyjmujemy zazwyczaj wyrażenie Z 2π

(w1 | w2 ) =

w1 (t)w2 (t) dt

0

choć i tu możliwe są inne wybory. (c) Ogólniej, w przestrzeni funkcji o wartościach rzeczywistych, określonych i ciągłych na odcinku [ a, b ] ⊂ R, jako iloczyn skalarny przyjmuje się wyrażenie (f | g) =

Z

b

f (t)g(t) dt, a

f, g ∈ C([ a, b ]).

(1.55)

Własności algebraiczne (liniowość i symetria) dla tak określonego wyrażenia wynikają wprost z odpowiednich własności funkcji ciągłych i całki Riemanna. Dla wykazania dodatniej określoności formy dwuliniowej zdefiniowanej tym wzorem na przestrzeni C([ a, b ]) potrzeba sprawdzić, że jeśli f ∈ C([ a, b ]), to Z

b

a

f 2 (t) dt > 0 ⇐⇒ f 6≡ 0 (tożsamościowo),

(1.56)

co jest również konsekwencją własności całki Riemanna, choć tym razem już nieco mniej trywialną.

1.4.2

Ortogonalność i ortogonalne dopełnienie w przestrzeniach euklidesowych.

Wprowadzoną dla przypadku przestrzeni kartezjańskiej Rn terminologię będziemy stosować również w szerszym kontekście dowolnych przestrzeni euklidesowych, nie wyłączając przypadku przestrzeni nieskończenie wymiarowych. Przyjmujemy zatem następujące określenia.

Konspekt wykładów „AFiW”

(wydruk 27 października 2009 roku)

18

Definicja 1.12 (Ortogonalność wektorów) Niech (V, (· | ·)) będzie przestrzenią euklidesową. Będziemy mówić, że wektory v, w ∈ V są ortogonalne, jeśli (v | w) = 0. Jeśli F jest podzbiorem przestrzeni V , to zbiór F ⊥ określony równością F ⊥ = { v ∈ V | (v | w) = 0,

w∈F}

(1.57)

będziemy nazywać ortogonalnym dopełnieniem do F . Jeśli F ⊥ = {0}, tj. ortogonalne dopełnienie do F zawiera tylko wektor zerowy, to będziemy mówić, że zbiór F jest kompletny w V . Tak jak w przypadku przestrzeni kartezjańskich relacja ortogonalności wektorów, oznaczana jak poprzednio symbolem „ ⊥ ”, jest symetryczna, a wektor zerowy jako jedyny jest ortogonalny do każdego wektora przestrzeni V . Następujący wynik jest bezpośrednim przeniesieniem do obecnego kontekstu znanego z elementarnej geometrii wzoru Pitagorasa dla kwadratu długości przeciwprostokątnej w trójkącie prostokątnym.. Lemat 1.2 (Wzór Pitagorasa) Jeśli v ⊥ w, to kv + wk2 = kvk2 + kwk2 .

(1.58)

Dla dowodu wystarcza zauważyć, że wobec (v | w) = 0 mamy kv + wk2 = (v + w | v + w) = (v | v) + 2(v | w) + (w | w) = kvk2 + kwk2 . W zastosowaniach, np. w fizyce lub statystyce, ortogonalność wektorów jest zwykle interpretowana jako brak korelacji między wielkościami opisywanymi przez te wektory. W ogólności jako miarę korelacji przyjmuje się w takim kontekście znormalizowany iloczyn skalarny wektorów, tj. wielkość cor(v, w) =

(v | w) |v| |w|

nazywaną w statystyce współczynnikiem korelacji liniowej lub współczynnikiem Pearsona korelacji wektorów v i w. Rozważmy teraz ogólniejszą sytuację ciągu f1 , f2 , . . . , fk takich wektorów przestrzeni V , że dla każdej pary wskaźników i, j mamy (fi | fj ) = 0,

gdy i 6= j.

W takim przypadku będziemy mówić, że f1 , f2 , . . . , fk jest układem ortogonalnym, lub że wektory {fi } są parami ortogonalne. Mogłoby się zdarzyć, że któryś z tych wektorów jest wektorem zerowym, ale jeśli wykluczyć tę sytuację, to można się łatwo przekonać, że współczynniki każdej kombinacji liniowej wektorów takiego układu są jednoznacznie wyznaczone. Istotnie, dla x =

k P

j=1

p ∈ {1, . . . , k} mamy (x | fp ) =

k X

j=1



λj fj | fp =

k X

j=1

λj fj | fp = λp kfp k2 . 

λj fj i dowolnego

(1.59)

Współczynnik przy wektorze fp w tej kombinacji liniowej jest zatem dany wzorem λp =

1 (x | fp ) kfp k2

(1.60)

Konspekt wykładów „AFiW”

(wydruk 27 października 2009 roku)

19

a składowa wektora x w kierunku wektora fp jest dana jako λp fp = (x | ep )ep ,

gdzie

ep =

1 fp kfp k

jest wektorem jednostkowym w kierunku wektora fp . W szczególności wynika stąd, że układ parami ortogonalnych wektorów (po ewentualnym wykluczeniu z układu wektora zerowego) jest liniowo niezależny. Podsumujemy te wnioski w formie następującego lematu. Lemat 1.3 W przestrzeni V z iloczynem skalarnym (v | w) układ ortogonalny {f1 , . . . , fk } nie zawierający wektora zerowego jest bazą podprzestrzeni lin{f1 , . . . , fk }. Dla każdego wektora z tej przestrzeni zachodzi równość k

k X

j=1

λj fj k2 =

k X

j=1

|λj |2 kfj k2 .

Ponadto każdy wektor v ∈ lin{f1 , . . . , fk } ma (jednoznaczne) przedstawienie w postaci v=

k X

(v | fj )kfj k−2 fj .

(1.61)

j=1

Wprowadzimy teraz następującą definicję. Definicja 1.13 (Układy ortogonalne i ortonormalne) Niech (V, (· | ·)) będzie przestrzenią euklidesową. Układ wektorów {f1 , f2 , . . .} ⊂ V (skończony lub nieskończony) będziemy nazywać: układem ortogonalnym, jeśli dowolne dwa wektory tego układu odpowiadające różnym wskaźnikom są ortogonalne, tj. dla każdej pary i, j z i 6= j zachodzi (fi | fj ) = 0; układem ortonormalnym, jeśli jest on ortogonalny i norma każdego z wektorów układu jest równa 1. Jeśli V jest przestrzenią skończenie wymiarową, to powiemy, że układ {f1 , f2 , . . . , fk } ⊂ V jest bazą ortonormalną przestrzeni V , jeśli jest układem ortonormalnym i V = lin{f1 , f2 , . . . , fk }. Przypominając, że symbolem (deltą) Kroneckera nazywamy funkcję δij określoną zależnością δij = 0 gdy i 6= j oraz δij = 0 gdy i = j możemy powyższe wyrazić krótko: {f1 , f2 , . . .}

1.4.3

jest układem ortonormalnym ⇐⇒ (fi | fj ) = δij ,

i, j = 1, 2, . . . .

(1.62)

Ortogonalność funkcji trygonometrycznych.

Podany niżej układ funkcji jest jednym z najważniejszych w matematyce nieskończonych układów ortonormalnych, znajdującym wielorakie zastosowania zarówno w teorii jak i zagadnieniach praktycznych. Stwierdzenie 1.9 W przestrzeni funkcji ciągłych C([0, 2π]) z iloczynem skalarnym danym wzorem (f | g) =

Z



f (t)g(t)dt,

(1.63)

0

układ funkcji 1 1 1 1 1 1 1 √ , √ sin t, √ cos t, √ sin 2t, √ cos 2t, . . . , √ sin nt, √ cos nt, . . . π π π π π π 2π

(1.64)

jest układem ortonormalnym. Układ ten będziemy nazywali (unormowanym) układem trygonometrycznym.

Konspekt wykładów „AFiW”

(wydruk 27 października 2009 roku)

20

W istocie łatwo sprawdzić, że dla k, n ∈ N zachodzą równości Z



Z



sin(kt) cos(nt) dt =

0

Z



Z



sin(nt)dt =

0



Z

cos(nt) dt = 0

(1.65)

0

oraz

0

sin(kt) sin(nt) dt =

cos(kt) cos(nt) dt =

0

  0,

 π,

k 6= n,

Z



dt = 2π,

(1.66)

0

k = n,

a stąd już ortonormalność układu (1.64) jest widoczna.

1.4.4

Bazy ortonormalne w przestrzeniach euklidesowych.

Użyteczność baz ortonormalnych jest w dużym stopniu konsekwencją łatwości, z jaką wyznaczać można współrzędne wektora względem takiej bazy oraz obliczać normę i iloczyny skalarne. Stwierdzenie 1.1 Niech {e1 , e2 , . . . , ek } będzie układem ortonormalnym w przestrzeni euklidesowej V i niech W = lin{e1 , . . . , ek } będzie przestrzenią rozpiętą nad tym układem. Wowczas: (i) każdy wektor v ∈ W wyraża się wzorem w=

k X

(w | ej )ej .

(1.67)

j=1

(ii) Dla każdej pary wektorów w1 , w2 ∈ W mamy (w1 | w2 ) =

k X

(w1 | ej )(ej | w2 ).

(1.68)

j=1

(iii) W szczególności dla każdego w ∈ W zachodzi „uogólniony wzór Pitgorasa” k X

kwk2 =

j=1

|(w | ej )|2

(1.69)

Wzór (1.67) będziemy nazywali rozwinięciem wektora w bazie ortonormalnej. W ogólności, dla dowolnego wektora v ∈ V i układu ortonormalnego {e1 , e2 , . . . , ek } wektor x = v − (v | e1 )e1 − (v | e2 )e2 − . . . − (v | ek )ek = v −

k X

(v | ej )ej

(1.70)

j=1

należy do ortogonalnego dopełnienia przestrzeni W , x ∈ W ⊥ . Rzeczywiście, obliczając kolejno iloczyny skalarne x z wektorami e1 , e2 , . . . otrzymujemy wobec warunku (1.62) (x | ep ) = (v | ep ) −

k X

(v | ej )(ej | ep ) = (v | ep ) − (v | ep ) = 0,

j=1

A zatem x ∈ W ⊥ , lub inaczej, składniki sumy po prawej stronie wzoru v=

k X

(v | ej )ej + x

j=1

są parami ortogonalne. Z wzoru Pitagorasa wynika więc ważny wniosek.

p = 1, . . . , k.

Konspekt wykładów „AFiW”

(wydruk 27 października 2009 roku)

21

Wniosek 1.9 (Nierówność Bessela) Jeśli {e1 , . . . , ek } jest układem ortonormalnym, to dla każdego wektora v ∈ V zachodzi k X

j=1

|(v | ej )|2 ¬ kvk2 .

Stwierdzenie 1.1 pokazuje, jak można sprowadzić obliczenie abstrakcyjnie określonych wielkości iloczynu skalarnego i normy do rachunków wykonywanych za pomocą współrzędnych względem bazy ortonormalnej. W szczególności widać stąd, że wyrażenia dla tych wielkości są dane takimi samymi formalnie wzorami, jakimi zadane są standardowy iloczyn skalarny i norma pitagorejska w przestrzeni kartezjańskiej. Nasuwające się w ten sposób przypuszczenie, że przestrzenie te są w jakimś sensie identyczne można sprecyzować przez wprowadzenie pojęcia „izometrii przestrzeni euklidesowych”, do którego omówienia przechodzimy.

1.4.5

Izometria przestrzeni euklidesowych.

Definicja 1.14 (Izometrie przestrzeni euklidesowych) Mówimy, że dwie abstrakcyjne przestrzenie euklidesowe (V, (· | ·)) i (W, h· | ·i) są izometryczne, jeśli istnieje liniowa bijekcja f : V → W , taka że dla każdej pary wektorów v1 , v2 ∈ V zachodzi hf (v1 ) | f (v2 )i = (v1 | v2 )

(1.71)

Ze Stwierdzenia 1.1 wynika od razu, że dowolna (abstrakcyjna) przestrzeń euklidesowa wymiaru k jest izometryczna z przestrzenią Rk wyposażoną w euklidesowy iloczyn skalarny określony wzorem (1.17). Wniosek 1.10 Niech (V, (· | ·)) będzie przestrzenią euklidesową, a {e1 , e2 , . . . , ek } bazą ortonormalną V . Odwzorowanie, przyporządkowujące każdemu wektorowi z V ciąg jego współrzędnych względem tej bazy dane wzorem V ∋ v 7→ f (v) = ((v | e1 ), (v | e2 ), . . . , (v | ek )) ∈ Rk ,

(1.72)

jest izometrią przestrzeni (V, (· | ·)) z przestrzenią kartezjańską Rk wyposażoną w pitagorejski iloczyn skalarny.

1.4.6

Charakteryzacja baz ortonormalnych

Z teoretycznego punktu widzenia jest bardzo ważne, że własności opisane we Stwierdzeniu 1.1 całkowicie charakteryzują bazy ortonormalne. W tym miejscu podamy sformułowanie odnoszące się jedynie do przypadku przestrzeni skończenie wymiarowych, odkładając na później przypadek przestrzeni nieskończonego wymiaru. Stwierdzenie 1.10 Niech {e1 , . . . , en } będzie zbiorem ortonormalnym w skończenie wymiarowej przestrzeni euklidesowej (V, (· | ·)). Wówczas każdy z następujących warunków jest równoważny stwierdzeniu, że {e1 , . . . , en } jest bazą przestrzeni V : (a) {e1 , . . . , en } jest zbiorem kompletnym w V ; (b) Każdy wektor z V daje się wyrazić w postaci (1.67), tj. (c) Dla każdego wektora v ∈ V mamy

kvk2 =

(d) Dla każdej pary wektorów v, w ∈ V mamy

n P

j=1

v=

n P

(v | ej )ej ;

j=1

|(v | ej )|2 ;

(v | w) =

n P

(v | ej )(ej | w).

j=1

Konspekt wykładów „AFiW”

1.4.7

(wydruk 27 października 2009 roku)

22

Przykład rozwinięć względem układu ortonormalnego — szeregi Fouriera.

Niezwykle ważnym przykładem zastosowania możliwości rozwinięcia wektora względem układu ortonormalnego danego wzorem (1.67) są rozwinięcia względem układu trygonometrycznego (1.64), nazywane na cześć ich odkrywcy rozwinięciami Fourierowskimi. Wprowadźmy oznaczenia 1 φ0 = , 2

φn (t) = cos nt,

ψn (t) = sin nt,

n ∈ N,

(1.73)

dla elementów (nieunormowanego) ortogonalnego układu trygonometrycznego(6 ). W przestrzeni C([0, 2π]) z iloczynem skalarnym danym wzorem (1.63) współczynniki rozwinięcia funkcji f względem układu (1.73), nazywane jej współczynnikami Fouriera, dane są wzorami (por. wzór (1.60)) 1 (f | φn ) = π 1 bn = (f | ψn ) = π

an =

Wyrażenie

1 2π f (t) cos nt dt, π 0 Z 1 2π f (t) sin nt dt, π 0 Z

n = 0, 1, 2, . . . ,

(1.74)

n = 1, 2, . . . .

(1.75)

∞ a0 X + (an cos nt + bn sin nt) 2 n=1

(1.76)

nazywane jest szeregiem Fouriera funkcji f . Badanie własności szeregów Fouriera, w szczególności ustalenie warunków ich zbieżności i wyznaczenie sumy szeregu stanowiło jeden z ważniejszych nurtów badań matematycznych w XIX i pierwszej połowie XX wieku. Na podstawie Wniosku 1.9 otrzymujemy tzw. nierówność Bessela dla szeregów Fouriera: współczynniki Fouriera dowolnej funkcji ciągłej f ∈ C([0, 2π]) określone wzorami (1.74) spełniają nierówność 2 X Z ∞ a0 2 2 2 + (|an | + |bn | ) ¬ kf k = 2

0

n=1

1.4.8



|f (t)|2 dt.

Ortogonalne dopełnienia i ich własności

Dla opisania zależności między zbiorem F ⊂ V i jego ortogonalnym dopełnieniem F ⊥ ⊂ V wykorzystamy dwa proste spostrzeżenia. Jeśli {f1 , f2 , . . . , fk } ⊂ V i v ∈ F ⊥ , to dla dowolnych liczb λ1 , λ2 , . . . , λk zachodzi (v |

k X

λj fj ) =

j=1

k X

j=1

λj (v | fj ) = 0,

a stąd już łatwo wywnioskować, że zbiór F i przestrzeń liniowa rozpięta przez F , lin F , mają to samo ortogonalne dopełnienie, F ⊥ = (lin F )⊥ . Analogicznie, jeśli {v1 , v2 , . . . , vk } ⊂ F ⊥ i f ∈ F , to dla dowolnych liczb λ1 , λ2 , . . . , λk zachodzi (

k X

j=1

λj vj | f ) =

k X

j=1

λj (vj | f ) = 0,

a więc F ⊥ jest podprzestrzenią liniową przestrzeni V . Obserwacje te prowadzą do następującego stwierdzenia. 6

Użycie w tym miejscu bazy ortogonalnej, a nie ortonormalnej jest podyktowane wyłącznie chęcią zachowania tradycyjnego zapisu dla współczynników rozwinięcia (1.76).

Konspekt wykładów „AFiW”

(wydruk 27 października 2009 roku)

23

Stwierdzenie 1.11 Niech (V, (· | ·)) będzie skończenie wymiarową przestrzenią euklidesową i niech F ⊂ V . Ortogonalne dopełnienie F ⊥ do F jest podprzestrzenią liniową w V , taką że F ⊥ ∩ lin F = {0}

oraz

dim F ⊥ + dim lin F = dim V.

(1.77)

W szczególności, zbiór F jest kompletny wtedy i tylko wtedy, gdy F zawiera bazę przestrzeni V . Dla dowodu tego stwierdzenia posłużymy się pojęciem macierzy Grama układu wektorów w dowolnej przestrzeni euklidesowej. Definicja 1.15 (Macierz Grama układu wektorów) Macierzą Grama skończonego układu wektorów {f1 , f2 , . . . , fk } ⊂ V będziemy nazywać macierz kwadratową i symetryczną stopnia k, oznaczaną G(f1 , f2 , . . . , fk ) (w skrócie G), zdefiniowaną jako G(f1 , f2 , . . . , fk ) = [(fi | fj )]. Zauważmy, że {e1 , e2 , . . .} ⊂ V jest układem ortonormalnym wtedy i tylko wtedy, gdy jego macierz Grama [(ei | ej )] jest macierzą jednostkową (być może nieskończoną). Bardziej ogólnie, zachodzi następujący: Lemat 1.4 Układ wektorów {f1 , f2 , . . . , fk } ⊂ V jest liniowo niezależny wtedy i tylko wtedy, gdy jego macierz Grama jest nieosobliwa, tj. det G(f1 , f2 , . . . , fk ) 6= 0. D o w ó d. Dla dowodu rozważmy układ równań o niewiadomych x1 , x2 , . . . , xk , k X

j=1

xj (fj | f1 ) = 0,

k X

j=1

xj (fj | f2 ) = 0,

k X

xj (fj | fk ) = 0.

(1.78)

......................... j=1

Jeśli macierz Grama G jest osobliwa, to ten układ ma rozwiązanie niezerowe, powiedzmy y1 , y2 , . . . , yk . Przyjmując y =

k P

j=1

yj fj i korzystając z liniowości iloczynu skalarnego względem pierwszego czynnika

wyprowadzamy z równań tego układu równości (y | fi ) = 0 dla i = 1, . . . , k. Mnożąc je kolejno przez y1 , y2 , . . . , yk i dodając do siebie otrzymamy 0=

k X i=1

yi (y | fi ) = (y |

k X i=1

yi fi ) = (y | y).

A zatem kombinacja wektorów fj o niezerowych współczynnikach jest wektorem zerowym, co dowodzi liniowej zależności wektorów f1 , f2 , . . . , fk . Z drugiej strony, jeśli macierz Grama G jest nieosobliwa, to powyższy układ ma jedynie rozwiązanie zerowe. Załóżmy, że kombinacja

k P

j=1

λj fj wektorów {f1 , f2 , . . . , fk } jest wektorem zerowym. Ponieważ

wówczas dla każdego i ∈ {1, . . . , k} zachodzi 0=(

k X

j=1

λj fj | fi ) =

k X

j=1

λj (fj | fi )

więc układ liczb λ1 , λ2 , . . . , λk jest rozwiązaniem układu równań (1.78), a zatem każda z tych liczb musi być równa zeru, co dowodzi liniowej niezależności układu {f1 , f2 , . . . , fk }. 2

Konspekt wykładów „AFiW”

(wydruk 27 października 2009 roku)

24

Możemy teraz wykazać Stwierdzenie 1.11. Niech {f1 , f2 , . . . , fn } będzie taką bazą przestrzeni V , że

jej pierwsze wektory {f1 , f2 , . . . , fk } tworzą bazę w przestrzeni lin F . Wówczas x = wtedy i tylko wtedy, gdy spełnione są równości 0 = (fi | x) =

n X

j=1

xj (fi | fj ),

n P

j=1

xj fj ∈ F ⊥

dla i = 1, 2, . . . , k.

(1.79)

A zatem liczby x1 , x2 , . . . , xn są rozwiązaniami układu równań (1.79), którego macierz [(fi | fj )] ma rząd równy k. Ponieważ przestrzeń rozwiązań tego układu ma wymiar dim V − k, a każdemu rozwiązaniu tego układu odpowiada wzajemnie jednoznacznie (z zachowaniem liniowości) wektor przestrzeni F ⊥ , to w ten sposób wykazaliśmy równość dotyczącą wymiarów we wzorze (1.77). Z drugiej strony, wektor należący jednocześnie do F i F ⊥ jest prostopadły do siebie samego, a taki jest tylko wektor zerowy. 2 Wykazaliśmy powyżej, że w skończenie wymiarowej przestrzeni euklidesowej każda baza jest zbiorem kompletnym. W przypadku przestrzeni o nieskończonym wymiarze będziemy często posługiwali się następującym warunkiem dostatecznym kompletności zbioru. Stwierdzenie 1.12 Jeśli F ⊂ V jest takim podzbiorem w przestrzeni euklidesowej (V, (· | ·)), że każdy wektor z V jest skończoną kombinacją liniową wektorów z F , to F jest zbiorem kompletnym. D o w ó d. Rzeczywiście, na mocy założenia dowolny v ∈ F ⊥ można zapisać w postaci v =

k P

j=1

λj fj ,

gdzie fj ∈ F dla j = 1, . . . , k — bez ograniczenia ogólności można przyjąć też, że wektory fj są liniowo niezależne. Mamy zatem 0 = (v | fi ) =

k X

j=1

λj (fj | fi ),

dla i = 1, . . . , k,

co wobec wynikającej z Lematu 1.4 nieosobliwości macierzy Grama układu {f1 , f2 , . . . , fk } pociąga za sobą znikanie wszystkich współczynników λj . 2 Wniosek 1.11 (a) W przestrzeni wielomianów P[t] (bez ograniczenia na stopień) jednomiany {1, t, t2 , . . . , tn , . . .} tworzą układ kompletny. (b) W przestrzeni wielomianów trygonometrycznych T [0, 2π] (bez ograniczenia na stopień) funkcje {1, sin t, cos t, . . . , sin nt, cos nt, . . .} tworzą układ kompletny.