Przestrzenie sygnałów Przestrzenie Przestrzeń metryczna Rozważmy dowolny zbiór P oraz dowolne elementy p1 , p2 , p3 ∈P Jeżeli na parach elementów zbioru P można zdefiniować funkcję (funkcjonał) ρ, taki, że • ρ ( p1 , p2 ) ≥ 0, • ρ ( p1 , p2 ) = ρ ( p2 , p1 ) • ρ ( p1 , p2 ) + ρ ( p2 , p3 ) ≥ ρ ( p1 , p3 ) czyli ρ ( p1 , p2 ) = 0 ⇔ p1 = p2 ρ : P × P ֏ R + ∪ {0} to funkcjonał ρ nazywa się metryką zbioru P, a zbiór P — przestrzenią metryczną P ρ ( p1 , p2 ) ≥ 0, ρ ( p1 , p2 ) = 0 ⇔ p1 = p2 ρ ( p1 , p2 ) = ρ ( p2 , p1 ) ρ ( p1 , p2 ) + ρ ( p2 , p3 ) ≥ ρ ( p1 , p3 ) P=R x1 , x2 , x3 ∈ R ρ ( x1 , x2 ) = x1 − x2 x1 x2 ρ ( x1 , x2 ) x3 ρ ( x2 , x3 ) x1 x3 ρ ( x1 , x3 ) ρ ( x1 , x3 ) ρ ( x2 , x3 ) ρ ( x1 , x2 ) ρ ( x1 , x2 ) + ρ ( x2 , x3 ) = ρ ( x1 , x3 ) ρ ( x1 , x2 ) + ρ ( x2 , x3 ) > ρ ( x1 , x3 ) Zbiór R jest przestrzenią metryczną R1 co zapiszemy x2 1 R , ρ = R ( ) ρ ( p1 , p2 ) ≥ 0, ρ ( p1 , p2 ) = 0 ⇔ p1 = p2 ρ ( p1 , p2 ) = ρ ( p2 , p1 ) ρ ( p1 , p2 ) + ρ ( p2 , p3 ) ≥ ρ ( p1 , p3 ) „nierówność trójkąta” P = R × R — zbiór par liczb rzeczywistych (x, y) y p1 = ( x1 , y1 ) y1 ρ2( p1 , p2 ) ρ2( p1 , p3 ) p2 = ( x2 , y2 ) y2 x2 ρ2 ( p1 , p2 ) = ρ2( p2 , p3 ) x x3 x1 y3 p3 = ( x3 , y3 ) ( x1 − x2 ) + ( y1 − y2 ) 2 2 — metryka euklidesowa y p1 = ( x1 , y1 ) y1 ρ1( p1 , p2 ) x Odległość euklidesowa x2 y2 ρ1( p1 , p2 ) = x1 − x2 + y1 − y2 x1 p2 = ( x2 , y2 ) metryka taksówkowa (miejska, Manhattan) ρ∞ ( p1 , p2 ) = max ( x1 − x2 , y1 − y2 ) metryka szachowa ρ1( p1 , p2 ) = x1 − x2 + y1 − y2 ρ2 ( p1 , p2 ) = ( x1 − x2 ) + ( y1 − y2 ) 2 ρ∞( p1 , p2 ) = max ( x1 − x2 , y1 − y2 2 ) Kula otwarta o środku p0 i promieniu r: ( ρm ( p1 , p2 ) = x1 − x2 + y1 − y2 m ) 1 m m m∈N { p} : ρ ( p, p0 ) < r p0 = ( 0,0 ) , r = 1 ρ2 ρ1 ρ∞ y y y 1 1 1 1 x 1 x 1 Zbiór R × R jest przestrzenią metryczną R 2 = ( R × R, ρ ) x P = R × R × R = R3 p1 = ( x1 , y1 , z1 ) ∈ P p2 = ( x2 , y2 , z2 ) ∈ P ρ1( p1 , p2 ) = x1 − x2 + y1 − y2 + z1 − z2 ρ2 ( p1 , p2 ) = ( x1 − x2 ) + ( y1 − y2 ) + ( z1 − z2 ) 2 2 ρ∞( p1 , p2 ) = max ( x1 − x2 , y1 − y2 , z1 − z2 ) 2 ( ρm ( p1 , p2 ) = x1 − x2 + y1 − y2 + z1 − z2 m m m∈N Zbiór R × R × R jest przestrzenią metryczną R 3 = ( R 3 , ρ ) ) 1 m Ogólnie Zbiór P = R × R × ⋯ × R = R n n razy z określoną metryką ρ jest przestrzenią metryczną x = ( x1 , x2 ,⋯, xn ) ∈ P y = ( y1 , y2 ,⋯, yn ) ∈ P P jest zbiorem n-elementowych ciągów liczbowych n Możliwe metryki: ρ1 ( x, y ) = ∑ xk − yk , k =1 ρ2 ( x, y ) = n ∑ ( xk − yk ) 2 , k =1 ρ∞ ( x, y ) = max { xk − yk } 1≤ k ≤ n ρm ( x, y ) = ∑ xk − yk k =1 n lub ogólnie Rn = ( Rn , ρ ) m 1 m Niech X = ( X , ρ ) oznacza dowolną przestrzeń metryczną z metryką ρ { xn } — dowolny nieskończony ciąg elementów tej przestrzeni xɶ ∈ X — wyróżniony punkt przestrzeni X Definicja 1. Jeżeli ρ ( x , xɶ ) < ε ∧∨ ∧ ε >0 N n > N n to ciąg { xn } jest zbieżny w sensie metryki ρ do xɶ xɶ nazywa się granicą ciągu { xn } co zapisujemy lim xn = xɶ n →∞ Przykład 1. Przestrzeń R1 z metryką ρ ( x1 , x2 ) = x1 − x2 { xn } : xn = 2n + 3 n +1 xɶ = 2 ρ ( xn , xɶ ) = 2n + 3 1 −2 = n +1 n +1 1 1 < ε dla n > N > 1 + n +1 ε Wniosek: Ciąg { xn } jest zbieżny w sensie metryki ρ, a jego granicą jest xɶ = 2, czyli 2n + 3 =2 n →∞ n + 1 lim Definicja 2. Ciąg { xn } elementów przestrzeni metrycznej X = ( X , ρ ) nazywamy ciągiem Cauchy’ego, jeżeli ρ( x ∧∨ ∧ ε >0 N m , n > N m , xn ) < ε Oznacza to, że odległość między elementami ciągu o dostatecznie dużych numerach może być dowolnie mała. Rozważmy ciąg { xn } zbieżny do xɶ ∈ X w sensie definicji 1. Wówczas ρ ( xn , xɶ ) < ε1 dla n > N1 dla m > N2 ρ ( xm , xɶ ) < ε2 Z nierówności trójkąta ρ ( xm , xn ) ≤ ρ( xm , xɶ ) + ρ ( xn , xɶ ) Dla m, n > N = max { N1 , N 2 } : ρ ( xm , xn ) < ε1 + ε2 = ε Wniosek: Każdy ciąg elementów przestrzeni metrycznej X, zbieżny w sensie definicji 1, jest ciągiem Cauchy’ego. Przykład 2. 1 Rozważmy przestrzeń metryczną Q = ( Q, ρ ) z metryką ρ ( q1 , q2 ) = q1 − q2 i ciąg {qn } : qn = q1 = 1, 4 q2 = 1, 41 q3 = 1, 414 q4 = 1, 4142 10n 2 10 x n Jeżeli Q — zbiór liczb wymiernych oznacza część całkowitą liczby x m > n to qn − qm ≤ 10− n < ε q5 = 1, 41421 q6 = 1, 414213 czyli ciąg {qn} jest ciągiem Cauchy’ego q7 = 1, 4142136 Granicą tego ciągu jest liczba 2 ∉ Q, czyli ciąg nie jest zbieżny w przestrzeni Q1 Definicja 3. Jeżeli w przestrzeni metrycznej X = ( X , ρ ) każdy ciąg Cauchy’ego jest zbieżny w sensie metryki ρ, tzn. jego granica jest elementem przestrzeni X, to przestrzeń X = ( X , ρ ) jest nazywana przestrzenią zupełną. Wniosek: przestrzeń Q1 z przykładu 2 nie jest przestrzenią zupełną. Jeżeli zbiór X „rozszerzymy”, w tym sensie, że dołączymy do niego granice wszystkich ciągów Cauchy’ego nie należące do X, wówczas tak powstały zbiór X = X∪ { Granice wszystkich ciągów Cauchy’ego } nazywa się uzupełnieniem zbioru X i z metryką ρ tworzy zupełną przestrzeń metryczną ( X = X, ρ ) nazywaną uzupełnieniem przestrzeni X. Metrykę ρ ( x, y ) , x, y ∈ X definiuje się jako: 1. x, y ∈ X ρ ( x, y ) = ρ ( x, y ) 2. x ∈ X , y ∉ X , ( czyli y∈X \ X ) { yn } , yn ∈ X , ρ ( x, y ) = lim ρ ( x, yn ) n →∞ Wówczas istnieje ciąg taki, że y = lim yn . Wtedy n →∞ 3. x ∉ X , y ∉ X x = lim xn , xn ∈ X , n →∞ y = lim yn , ρ ( x, y ) = lim ρ ( xn , yn ) n→∞ Zagadka: Q1 = ? n→∞ yn ∈ X , Q1 = ( Q, ρ ) Q = Q∪ { ρ = a −b ρ ( ) 1 2 , 3 7 = 2,ln 4, 7 3, ( 2 3 − 7 5 ) } , π,⋯,e ,2 2 ,e 2 3 ,⋯⋯ gdy a, b ∈ Q 1 3 − 2 7 = 1 21 ρ ( a, r ) = ? gdy a ∈ Q ale r ∈ R \ Q r ∈ R \ Q ⇒ r = lim rn , n →∞ ∧ r ∈Q n n ρ ( a, r ) = lim a − rn n →∞ ( ) ρ 2, 2 = lim 2 − qn qn = n →∞ Q1 = R1 10n 2 10n =R Przykłady przestrzeni metrycznych 1. Przestrzeń ciągów skończonych Rn x = ( x1 , x2 ,⋯ , xn ) n x, y ∈ R y = ( y1 , y2 ,⋯ , yn ) ∧ xk , yk ∈ R k n ρ1 ( x, y ) = ∑ xk − yk k =1 ρ2 ( x, y ) = n ∑ ( xk − yk ) k =1 ρ∞ ( x, y ) = max { xk − yk 1≤ k ≤ n 2 } Często wygodnie jest utożsamiać elementy przestrzeni Rn z macierzami kolumnowymi x1 x x = 2 ⋮ xn n ρm ( x, y ) = ∑ xk − yk k =1 Przestrzeń Rn jest przestrzenią zupełną m y1 y y = 2 ⋮ yn 1 m 2. Przestrzeń zespolonych ciągów skończonych Cn C n = ( Cn , ρ ) x = ( x1 , x2 ,⋯ , xn ) n x, y ∈ C y = ( y1 , y2 ,⋯ , yn ) n ρ1 ( x, y ) = ∑ xk − yk k =1 ρ2 ( x, y ) = n ∑x k =1 k − yk 2 ρ∞ ( x, y ) = max { xk − yk 1≤ k ≤ n } ∧ x ,y k k ρm ( x, y ) = ∑ xk − yk k =1 n Przestrzeń Cn jest przestrzenią zupełną k ∈C m 1 m 3. Zbiór sygnałów analogowych (rzeczywistych lub zespolonych) o skończonej energii Ex = ∞ ∫ x (t ) 2 dt < ∞ −∞ z metryką ∞ ρ ( x1 , x2 ) = ∫ x (t ) − x (t ) 1 2 2 dt −∞ jest przestrzenią metryczną zupełną, oznaczaną L2 lub L2( −∞, ∞ ) Podobnie, zbiór sygnałów przyczynowych x ( t ) ≡ 0 dla t < 0, takich, że ∞ E x = ∫ x ( t ) dt < ∞ 2 0 z metryką ρ ( x1 , x2 ) = ∞ ∫ x (t ) − x (t ) 1 2 2 dt 0 jest przestrzenią metryczną zupełną, oznaczaną L2( 0, ∞ ) 4. Zbiór sygnałów okresowych (rzeczywistych lub zespolonych) o skończonej mocy x ( t ) = x ( t − kT ) , k ∈ Z 1 Px = T t0 +T ∫ x ( t ) dt < ∞ 2 t0 z metryką 1 ρ ( x1 , x2 ) = T t0 +T ∫ x1 ( t ) − x2 ( t ) dt 2 t0 jest przestrzenią metryczną zupełną, oznaczaną L2T 5. Zbiór nieskończonych ciągów (rzeczywistych lub zespolonych) o skończonej energii Ex = ∞ ∑ x[k ] < ∞ 2 k =−∞ z metryką ρ ( x1 , x2 ) = ∞ ∑ k =−∞ x1 [ k ] − x2 [ k ] jest przestrzenią metryczną zupełną, oznaczaną 2 l 2 lub l 2( −∞, ∞ ) Podobnie, zbiór nieskończonych ciągów przyczynowych x [ n ] = 0 dla n < 0 ∞ Ex = ∑ x [ k ] < ∞ 2 k =0 z metryką ρ ( x1 , x2 ) = ∞ ∑ k =0 x1 [ k ] − x2 [ k ] 2 jest przestrzenią metryczną zupełną, oznaczaną l 2( 0, ∞ ) Przestrzeń liniowa (wektorowa) Rozważmy zbiór V o elementach u, v, w, … itd. Zbiór ten nazywamy przestrzenią liniową V, jeżeli na elementach zbioru V A. można określić operację dodawania, nie wyprowadzającą poza zbiór V u, v ∈ V ⇒ u + v = s ∈ V o własnościach: 1. Przemienność: 2. Łączność: u+ v = v+u u + ( v + w ) = (u + v ) + w 3. Istnieje element neutralny dodawania 0 ∈ V taki, że dla dowolnego v ∈ V v+ 0 = 0 +v = v 4. Dla każdego v ∈ V istnieje element przeciwny − v ∈ V taki, że v + (−v ) = ( −v) + v = 0 grupa abelowa addytywna B. można zdefiniować mnożenie przez skalar, nie wyprowadzające poza zbiór V α v ∈ V, α ∈ R o własnościach 1. rozdzielność względem dodawania elementów α (u + v ) = α u + α v 2. rozdzielność względem dodawania skalarów (α + β ) v = α v + β v 3. mnożenie skalarów α ( β v) = (α β ) v 4. elementem neutralnym mnożenia przez skalar jest liczba 1, czyli 1v = v W przypadku przestrzeni zespolonych powyższe warunki obowiązują dla α, β ∈ C Przestrzenią liniową jest więc zbiór, którego elementy można, według określonych reguł, dodawać i mnożyć przez liczbę, a wyniki tych operacji są również elementami tego zbioru. Przykłady: 1. Nie jest przestrzenią liniową np. zbiór figur na szachownicy 2. Zbiór wektorów na płaszczyźnie jest przestrzenią liniową u+v v u u −u u v u αu αu αu α >1 0 < α <1 −1 < α < 0 3. Zbiór wektorów w przestrzeni trójwymiarowej jest przestrzenią liniową Reguły dodawania i mnożenia przez skalar są prostym uogólnieniem reguł na płaszczyźnie 4. Zbiór ciągów n-elementowych Rn jest przestrzenią liniową u1 u u = 2 ⋮ u n v1 v v = 2 ⋮ vn u1 −u1 u −u −u = − 2 = 2 ⋮ ⋮ u − u n n ⇒ u1 v1 u1 + v1 u v u + v u+ v = 2+ 2 = 2 2 ⋮ ⋮ ⋮ u v u + v n n n n 0 0 0 = ⋮ 0 u1 α u1 u α u αu = α 2 = 2 ⋮ ⋮ u α u n n Analogicznie dla zespolonych ciągów w przestrzeni liniowej Cn 5. Zbiory sygnałów o ograniczonej energii x (t ) : ∞ ∫ x ( t ) dt < ∞ lub 2 −∞ ∞ ∫ x ( t ) dt < ∞ 2 0 uzupełnione sygnałem zerowym x ( t ) ≡ 0 są przestrzeniami liniowymi L2 ( −∞, ∞ ) i L2 ( 0, ∞ ) 6. Zbiór sygnałów okresowych o skończonej mocy 1 x ( t ) = x ( t − kT ) : T t0 +T ∫ x (t ) 2 dt < ∞ t0 uzupełniony sygnałem zerowym x ( t ) ≡ 0 jest przestrzenią liniową L2T 7. Zbiory sygnałów dyskretnych o skończonej energii x [ n] : ∞ ∑ k =−∞ x [ n ] < ∞ lub 2 ∞ ∑ k =0 x [ n] < ∞ 2 uzupełnione sygnałem zerowym x [ n ] ≡ 0 są przestrzeniami liniowymi l 2 ( −∞, ∞ ) i l 2 ( 0, ∞ ) Definicja 1. Zbiór elementów przestrzeni liniowej V {v1 , v 2 ,⋯, v n } , ∧ v k ∈V k nazywamy liniowo niezależnym jeżeli jedynym rozwiązaniem równania α1 v1 + α2 v 2 + ⋯ + αn v n = 0 jest α1 = α2 = ⋯ = αn = 0 Wnioski: 1. Liniowa niezależność elementów v1 , v 2 ,⋯ , v n oznacza, że żaden z tych elementów nie może być przedstawiony jako kombinacja liniowa pozostałych. 2. Element v = 0 nie należy do żadnego zbioru elementów liniowo niezależnych. Definicja 2. Jeżeli każdy zbiór elementów liniowo niezależnych w przestrzeni V zawiera nie więcej niż n elementów, to przestrzeń V nazywa się przestrzenią n-wymiarową. Przykład 1. Zbiór wektorów na płaszczyźnie v2 v1 α2 v 2 α1 v1 u = α1 v1 + α2 v 2 Wniosek: Zbiór wektorów na płaszczyźnie jest przestrzenią liniową dwuwymiarową Przykład 2. Przestrzeń Rn i zbiór elementów z tej przestrzeni v1(1) v2(1) (2) ( 2) v v v1 = 1 , v 2 = 2 , ⋮ ⋮ v( n ) v( n ) 1 2 ⋯ vm(1) (2) v , vm = m ⋮ v( n ) m Utwórzmy macierz V = [ v1 v2 v1(1) ( 2) v1 ⋯ vm ] = ⋮ v( n) 1 o wymiarach n × m v2( ) 1 v2( ) ⋮ 2 v2( n) ⋯ vm( ) ( 2) ⋯ vm ⋱ ⋮ n ⋯ vm( ) 1 Przypomnienie z algebry Rozważmy macierz A o w wierszach i k kolumnach Rzędem macierzy A nazywamy liczbę liniowo niezależnych wierszy tej macierzy, która jest równa liczbie liniowo niezależnych kolumn. Musi więc zachodzić: rząd A ≤ min ( w, k ) Macierz nazywa się macierzą maksymalnego rzędu, gdy rząd A = min ( w, k ) Jeżeli w < k i macierz A jest macierzą maksymalnego rzędu, to wiersze tej macierzy są liniowo niezależne i w macierzy tej można wybrać dokładnie w kolumn liniowo niezależnych. Jeżeli w = k i macierz A jest kwadratową macierzą maksymalnego rzędu, to zarówno wiersze jak i kolumny tej macierzy są liniowo niezależne i macierz ta jest macierzą nieosobliwą, czyli det A ≠ 0. V = [ v1 v2 v1(1) ( 2) v ⋯ vm ] = 1 ⋮ v( n) 1 v2( ) 1 v2( ) ⋮ 2 v2( n) ⋯ vm( ) ( 2) ⋯ vm ⋱ ⋮ n ⋯ vm( ) 1 Jeżeli m > n i macierz V jest macierzą maksymalnego rzędu, to jej wiersze są liniowo niezależne, a spośród jej m kolumn można wybrać dokładnie n kolumn liniowo niezależnych. Wnioski: 1. Przestrzeń Rn jest przestrzenią n wymiarową. 2. Jeżeli { v1 , v 2 ,⋯, v n } jest zbiorem liniowo niezależnych elementów przestrzeni Rn, to v1(1) v2(1) ⋯ vn(1) ( 2) ( 2) ( 2) v2 ⋯ vn v1 det [ v1 v 2 ⋯ v n ] = det ≠0 ⋮ ⋮ ⋱ ⋮ v ( n ) v( n ) ⋯ v( n ) 2 n 1 Przykład 3. Przestrzeń L2T x ( t ) ∈ LT2 x ( t ) = x ( t − kT ) , k ∈ Z t +T ⇒ 1 0 2 Px = T ∫ x ( t ) dt < ∞ t0 Zbiór elementów tej przestrzeni xn( t ) = sin { x ( t )} n 2nπ t, n ∈ N T jest liniowo niezależny. Zbiór { xn( t )} składa się z nieskończonej liczby elementów, czyli przestrzeń L2T jest przestrzenią nieskończenie wymiarową. Przestrzeń unormowana Rozważmy przestrzeń liniową V o elementach v1, v2, v3, … itd. Przestrzeń tę nazywamy przestrzenią unormowaną V, jeżeli na jej elementach można zdefiniować odwzorowanie i : V ֏ R+ ∪ 0 przyporządkowujące każdemu elementowi v k , v l ∈ V rzeczywistą nieujemną liczbę, oznaczaną v k , v l o własnościach: 1. v k ≥ 0, vk = 0 ⇔ vk = 0 2. α v k = α v k , α ∈ R lub C 3. v k + vl ≤ v k + vl to przestrzeń V nazywa się przestrzenią unormowaną , a liczbę się normą elementu vk . vk nazywa Przykład 1. Przestrzeń wektorów na płaszczyźnie v Normą wektora może być jego długość v v+u v+u v u v v + u > v+u — nierówność trójkąta u Przykład 2. Przestrzenie Rn i Cn Jeżeli v = ( v1 , v2 ,⋯ , vn ) ∈ R n lub C n to możliwe są normy: n v 1 = ∑ vk k =1 v2= v ∞ n ∑v k =1 m = ∑ vk k =1 n 2 k v m 1 m = max {vk } k Jeżeli v interpretujemy jako punkt w przestrzeni n wymiarowej, to norma jest odległością, mierzoną według określonej metryki, tego punktu od początku układu współrzędnych Przykład 3. Przestrzeń L2 (przestrzeń sygnałów o skończonej energii) x ( t ) ∈ L2 ⇔ Ex = ∞ x ( t ) dt < ∞ 2 ∫ −∞ Można zdefiniować normę: ∞ ∫ x = x ( t ) dt 2 −∞ Przykład 4. Przestrzeń l2 (przestrzeń ciągów o skończonej energii) x [ n] ∈ l 2 ⇔ Można zdefiniować normę: Ex = ∞ ∑ k =−∞ x = x [k ] < ∞ 2 ∞ ∑ k =−∞ x[k ] 2 Normą przestrzeni L2 i l2 może być pierwiastek kwadratowy z energii Przykład 5. Przestrzeń L2T (przestrzeń sygnałów okresowych o skończonej mocy) x ( t ) = x ( t − kT ) , k ∈ Z x (t ) ∈ L 2 T ⇔ 1 Px = T t0 + T ∫ x (t ) 2 dt < ∞ t0 Normą tej przestrzeni może być 1 x = T t0 +T ∫ x (t ) 2 dt t0 czyli pierwiastek kwadratowy z mocy sygnału. W elektrotechnice pierwiastek kwadratowy z mocy sygnału nazywa się wartością skuteczną W przestrzeni liniowej unormowanej V z normą v1 , v 2 ∈ V ⇒ i można zdefiniować metrykę ρ ( v1 , v 2 ) = v1 − v 2 Metrykę taką nazywa się metryką indukowaną przez normę Każda przestrzeń liniowa unormowana jest przestrzenią metryczną Definicja Przestrzeń liniową unormowaną normą i , z metryką indukowaną przez tę normę i zupełną w tej metryce, nazywa się przestrzenią Banacha Przestrzenie R n , C n , L2 , LT2 , l 2 są przestrzeniami Banacha Stefan Banach 1892 — 1945 Stefan Banach, prawdziwy geniusz matematyczny, światowej sławy matematyk. Zaczynał jako samouk, a w krótkim czasie został twórcą analizy funkcjonalnej, nowego działu matematyki. Urodził się w 1892 roku w Krakowie, gdzie spędził młodość. Przełomowym wydarzeniem na drodze jego błyskotliwej kariery stało się spotkanie na krakowskich Plantach w 1916 roku z profesorem matematyki, Hugonem Steinhausem, który — uznając później Banacha za swoje największe naukowe odkrycie — pomógł mu otrzymać asystenturę w Katedrze Matematyki na Wydziale Mechanicznym Politechniki Lwowskiej. W 1920 roku, nie mając ukończonych studiów matematycznych, Stefan Banach otrzymał doktorat na Uniwersytecie im. Jana Kazimierza we Lwowie, gdzie po czterech latach został profesorem. W 1935 roku został zaproszony do wygłoszenia plenarnego wykładu na Międzynarodowym Kongresie Matematyków w Oslo. Wkrótce przed wybuchem II wojny światowej Stefana Banacha wybrano na prezesa Polskiego Towarzystwa Matematycznego. Zmarł latem 1945 roku we Lwowie. Iloczyn skalarny Wektory na płaszczyźnie Iloczyn skalarny wektorów u u u i v = u ⋅ v ⋅ cos α α v v u = u x i + u y j, v = vx i + v y j y u = u x2 + u y2 , u uy cos ( αu − αv ) = cos αu cos αv + sin αu sin αv = v vy 1 αu = αv j x i 1 ux v = vx2 + u y2 vx u x vx u y v y ⋅ + ⋅ u v u v u i v = u ⋅ v ⋅ cos ( αu − αv ) = u x vx + u y v y u u v v u ⊥ v ⇔ ui v = 0 u v ⇔ ui v = u ⋅ v uiu = u 2 ⇒ u = uiu y 1 j vx i i, j — wektory bazowe na płaszczyźnie x i i j = 0 — baza ortogonalna 1 v vy i ii = ji j = 1 — baza ortonormalna Dowolny wektor v można przedstawić jako v = vx i + v y j v ii = ( vx i + v y j)ii = vx i ii + v y jii = vx — rzut ortogonalny wektora v na oś x v i j = ( vx i + v y j)i j = vx i i j + v y ji j = v y — rzut ortogonalny wektora v na oś y Wektory w przestrzeni 3D Baza z vz ( i, j, k ) i i j = i ik = jik = 0 i ii = ji j = k ik = 1 i v = vx i + v y j + vz k v k j vy vx x w = wx i + wy j + wz k v iw = v ⋅ w ⋅ cos ∡ ( v, w ) v iw = vx wx + v y wy + vz wz Baza ortonormalna y v x = v ii v y = vi j v = ( vx , v y , vz ) vz = v ik reprezentacja wektora v w bazie (i, j, k) Przestrzeń unitarna P — przestrzeń liniowa x, y , z ∈ P , α, β ∈ C Iloczynem skalarnym, określonym w przestrzeni P nazywamy odwzorowanie •, • : P × P ֏ C przyporządkowujące parze uporządkowanej elementów x, y ∈ P liczbę x, y ∈ C spełniające warunki: ∗ 1. x, y = y, x 2. α x + βy , z = α x , z + β y , z 3. x, x ≥ 0, przy czym * — sprzężenie zespolone x, x = 0 ⇔ x = 0 Przestrzeń z tak zdefiniowanym iloczynem skalarnym nazywa się przestrzenią unitarną Uwaga: spotyka się również oznaczenie ( x, y ) ≡ x, y Jeżeli przestrzeń P jest przestrzenią rzeczywistą, iloczyn skalarny definiuje się jako: •, • : P × P ֏ R 1. x, y = y , x 2. α x + β y , z = α x, z + β y , z , 3. x, x ≥ 0, przy czym α, β ∈ R x, x = 0 ⇔ x = 0 czyli każdej parze elementów x, y ∈ P przyporządkowujemy rzeczywistą liczbę x, y Własności iloczynu skalarnego: • • ∧ x∈P 0,x = 0 x, x spełnia warunki normy, czyli można zdefiniować normę przestrzeni x = • x, y ≤ x, x ⋅ y , y = x ⋅ y x, x (nierówność Schwarza-Buniakowskiego) Definicja Przestrzenią Hilberta nazywamy przestrzeń liniową: — unitarną, z iloczynem skalarnym x, y — unormowaną, z normą x = x, x — metryczną, z metryką indukowaną przez normę, tzn. ρ ( x, y ) = x − y — zupełną w sensie tej metryki Przestrzenią Hilberta jest przestrzeń Banacha, w której określony został iloczyn skalarny x, y , a norma została zdefiniowana jako x = x, x David Hilbert Ur. 23 stycznia 1862 w Królewcu, zm. 14 lutego 1943 w Getyndze — matematyk niemiecki. Był profesorem uniwersytetu w Getyndze, jednego z najważniejszych wówczas ośrodków myśli matematycznej w świecie. W pierwszym okresie swej działalności naukowej pracował nad teorią niezmienników algebraicznych. Udowodnił ważne twierdzenie o istnieniu skończonej bazy dla układu niezmienników. Badania Hilberta w zakresie rachunku wariacyjnego oraz teorii równań całkowych doprowadziły do powstania ważnego pojęcia przestrzeni, nazwanej później przestrzenią Hilberta, David Hilbert oraz innych pojęć analizy funkcjonalnej, w szczegól1862 — 1943 ności aparatu matematycznego mechaniki kwantowej. Na początku lat dwudziestych Hilbert podjął badania w zakresie podstaw matematyki. Jego prace wywarły duży wpływ na rozwój matematyki. W 1900 r., na Międzynarodowym Kongresie Matematyków w Paryżu, Hilbert przedstawił 23 zagadnienia dotyczące podstawowych, według niego, kierunków badań matematycznych, które do dzisiaj przyciągają uwagę matematyków całego świata. Przykłady przestrzeni Hilberta 1. Przestrzeń Cn x = ( x1 , x2 ,⋯, xn ) , y = ( y1 , y2 ,⋯ , yn ) n x, y = ∑ xk yk∗ k =1 Inaczej x1 x x = 2 , ⋮ xn y1 y y = 2 ⋮ yn ⇒ x, y = y ∗ t x Przestrzeń Rn — można pominąć * 2. Przestrzeń L2 { x ( t )} : Ex = x, y = ∞ ∞ x ( t ) dt < ∞ 2 ∫ −∞ x ( t ) y ∗( t ) dt ∫ −∞ 3. Przestrzeń L2T T 2 1 x t : P = x t { ( )} x T ∫ ( ) dt < ∞ 0 T 1 x, y = ∫ x ( t ) y ∗( t ) dt T0 4. Przestrzeń l 2 { x [ n]} : x, y = Ex = ∞ ∑ k =−∞ ∞ ∑ x [k ] k =−∞ x [ k ] y ∗[ k ] 2 <∞ u u⊥v ⇒ u, v = ui v = u ⋅ v ⋅ cos v π =0 2 u + v = u + v , u + v = u, u + u, v + v , u + v , v 2 u u u+v u, v = 0 to jeżeli v u+v = u + v 2 v Udowodniliśmy twierdzenie Pitagorasa u+v X — przestrzeń unitarna x1 , x2 ∈ X Definicja Elementy x1 , x2 nazywa się ortogonalnymi, jeżeli x1 , x2 = 0 x1 , x2 = 0 ⇒ Jeżeli x1 ⊥ x2 x1 , x2 = 0 to x1 + x2 2 2 = x1 + x2 2 2 2 Baza przestrzeni Przestrzeń C n Przestrzeń jest n wymiarowa, więc dowolny liniowo niezależny zbiór elementów tej przestrzeni nie może zawierać więcej niż n elementów. Definicja Dowolny zbiór n liniowo niezależnych elementów przestrzeni C n nazywa się bazą tej przestrzeni, a przestrzeń C n nazywa się przestrzenią rozpiętą na tej bazie. Niech zbiór {xk}, k = 1, 2, … n będzie bazą przestrzeni C n Wówczas dowolny element y ∈ C n może być przedstawiony jako kombinacja liniowa elementów bazy, czyli n y = ∑ αk xk k =1 X n — n wymiarowa przestrzeń unitarna { xk }, y∈ X k = 1,⋯, n — baza tej przestrzeni n ⇒ n y = ∑ αk xk k =1 Oznaczmy α1 α α = 2 ⋮ αn α ∈ R n ( lub C n ) jest reprezentantem elementu y ∈ X n w bazie α1 , α2 ,⋯, αn — składowe (współrzędne) elementu y ∈ X n w bazie Jak wyznaczyć αk ? { xk } { xk } n y ∈ X : y = ∑ αk xk n k =1 n y, x1 = ∑ αk xk , x1 k =1 n y, x2 = ∑ αk xk , x2 k =1 ⋮ y, x1 x1 , x1 y , x x1 , x2 2 = ⋮ ⋮ y , x n x1 , xn x2 , x1 ⋯ x2 , x2 ⋯ ⋮ x2 , xn ⋱ ⋯ n y, xn = ∑ αk xk , xn k =1 α1 x1 , x1 α x , x 2 = 1 2 ⋮ ⋮ αn x1 , xn x2 , x1 x2 , x2 ⋮ x2 , xn ⋯ ⋯ ⋱ ⋯ xn , x1 xn , x2 ⋮ xn , xn −1 y, x1 y , x 2 ⋮ y , x n xn , x1 α1 xn , x2 α2 ⋮ ⋮ xn , xn αn Baza ortogonalna Niech { xk } , k = 1,⋯, n będzie bazą n wymiarowej przestrzeni unitarnej X n, Definicja 1. Bazę { xk } nazywa się bazą ortogonalną gdy gdy l ≠ k 0 xk , xl = ck ≠ 0 gdy l = k Definicja 2. Bazę { xk } nazywa się bazą ortonormalną gdy 0 gdy l ≠ k xk , xl = 1 gdy l = k Baza ortogonalna wyznacza w przestrzeni X n prostokątny układ współrzędnych, zaś baza ortonormalna zakłada dodatkowo xk = 1, k = 1,⋯, n. n y ∈ X : y = ∑ αk xk n k =1 α1 x1 , x1 α x , x 2 = 1 2 ⋮ ⋮ αn x1 , xn Jeżeli { xk } ⋯ x2 , x2 ⋯ ⋮ x2 , xn ⋱ ⋯ xn , x1 xn , x2 ⋮ xn , xn −1 y, x1 y , x 2 ⋮ y , x n jest bazą ortonormalną, to α1 1 α 0 2 = ⋮ ⋮ αn 0 czyli x2 , x1 0 ⋯ 0 1 ⋯ 0 ⋮ ⋱ ⋮ 0 ⋯ 1 α k = y, xk , −1 y , x1 y, x1 y , x y, x2 2 = ⋮ ⋮ y , x n y, xn k = 1, 2,… , n Nie potrzeba odwracać macierzy! y, z ∈ X : n y, z = n ∑α x ,∑ β x k =1 k l =1 n k =1 k =1 y = ∑ αk xk , z = ∑ βk xk n k n l l n n n = ∑∑ αk β xk , xl = ∑ αk βk∗ = α, β k =1 l =1 ∗ l k =1 y , z = α, β Jeżeli baza jest ortonormalna, to iloczyn skalarny elementów przestrzeni X n jest równy iloczynowi skalarnemu ich reprezentantów w przestrzeni R n lub C n Niech { xk } , k = 1,⋯, n będzie dowolną (nieortogonalną) bazą n wymiarowej przestrzeni unitarnej X n Bazę ortogonalną (ortonormalną) można otrzymać stosując algorytm nazywany procedurą ortonormalizacji Grama-Schmidta. Generujemy zbiory { yk } i { zk } , k = 1,⋯, n zgodnie z procedurą rekurencyjną: y1 = x1 z1 = y2 = x2 − x2 , z1 z1 z2 = y3 = x3 − x3 , z1 z1 − x3 , z2 z2 y1 y1 y2 y2 y z3 = 3 y3 ⋮ .............................................................................................. ⋮ k −1 y yk = xk − ∑ xk , z j z j zk = k yk j =1 ⋮ .............................................................................................. ⋮ n −1 y yn = xn − ∑ xn , z j z j zn = n yn j =1 Zbiór { yk } jest bazą ortogonalną przestrzeni X n, a zbiór { zk } — bazą ortonormalną Zbiory nieskończone Zbiory A i B nazywamy równolicznymi, gdy istnieje wzajemnie jednoznaczne przyporządkowanie (bijekcja) elementów tych zbiorów B A • • • • • Zbiory nieskończone też można porównywać 1 2 3 4 5 Zbiór liczb parzystych: 2 4 6 8 10 12 14 16 18 ⋯ Zbiory są równoliczne! 6 7 8 9 ⋯ Zbiór liczb naturalnych: Mocą zbioru A (liczbą kardynalną), oznaczaną A nazywamy: — zbiory skończone A=n gdzie n jest liczbą elementów zbioru — zbiory nieskończone — liczby kardynalne są tzw. liczbami pozaskończonymi N ≜ ℵ0 ℵ litera „alef” Jeżeli A jest równoliczny ze zbiorem N to A = ℵ0 Definicja Zbiór o mocy ℵ0 nazywa się zbiorem przeliczalnym Zbiorami przeliczalnymi są: Zbiór liczb całkowitych 1 2 3 4 5 6 7 8 9 ⋯ 0 −1 1 −2 2 −3 3 −4 4 ⋯ Jeżeli A = ℵ0 i A ∪ B = ℵ0 B = ℵ0 A × B = ℵ0 A × A = ℵ0 Liczby wymierne — klasy abstrakcji na zbiorze Z × Z \ 0 Z = ℵ0 ⇒ Q = ℵ0 Nie jest przeliczalny zbiór R R = c > ℵ0 Zbiór R jest mocy continuum A n = ℵ0 Przestrzenie nieskończenie wymiarowe Niech P będzie nieskończenie wymiarową przestrzenią Hilberta Definicja 1. Przestrzeń P nazywa się przestrzenią ośrodkową, jeżeli istnieje w niej przeliczalny zbiór gęsty, nazywany ośrodkiem. Q ⊆ P nazywa się zbiorem gęstym, gdy ρ ( p, q ) < ε ∧ ∧ ∨ p∈P ε >0 q∈Q Przykład W przestrzeni R2 ośrodkiem jest zbiór Q × Q W przestrzeni R n ośrodkiem jest zbiór Q n Q — zbiór liczb wymiernych Q = ℵ0 ⇒ Qn = ℵ0 Definicja 2. Zbiór {u k : k ∈ N } liniowo niezależnych elementów przestrzeni Hilberta P nazywa się zbiorem domkniętym (zupełnym) jeżeli w przestrzeni P nie istnieje element liniowo niezależny od {uk}. Zbiór taki może stanowić bazę przestrzeni P, tzn. dowolny element tej przestrzeni można przedstawić jako kombinację liniową elementów bazy. Elementy bazy można numerować na różne sposoby. Ogólnie zbiór indeksów elementów stanowiących bazę jest pewnym przeliczalnym zbiorem B Przykładowo: 1, 2,3,⋯ N N ∪ 0 0,1, 2,⋯ {} B= ⋯, −2, −1,0,1, 2,⋯ Z N × N (1,1) , (1, 2 ) , ( 2,1) , ( 2, 2 ) ,⋯ liczby naturalne liczby naturalne i zero liczby całkowite pary liczb całkowitych (podwójne indeksy) B = ℵ0 Definicja 3. Nieskończony przeliczalny zbiór {uk : k ∈ B} elementów przestrzeni Hilberta P nazywa się bazą ortogonalną tej przestrzeni, jeżeli: elementy uk są parami ortogonalne, w przestrzeni P nie istnieje element ortogonalny do wszystkich elementów zbioru {uk} (zbiór jest domknięty). Przykład Przestrzeń L2T : a) zbiór 2kπ { xk } : xk = cos t , k ∈N jest zbiorem ortogonalnym, ale nie jest T bazą tej przestrzeni, bo istnieją w niej elementy ortogonalne do każdego xk , np. sin b) zbiór 2π t T {uk : k ∈ Z} : uk = e j 2 kπ t T jest bazą ortogonalną przestrzeni L2T Definicja 4. Nieskończony przeliczalny zbiór {uk : k ∈ B} elementów przestrzeni Hilberta P nazywa się bazą ortonormalną tej przestrzeni, jeżeli: zbiór {uk} jest bazą ortogonalną, uk = 1 dla każdego k. Twierdzenie W ośrodkowej przestrzeni Hilberta istnieje co najmniej jedna baza. Na podstawie dowolnego domkniętego zbioru liniowo niezależnego {uk} (dowolnej bazy przestrzeni) można wygenerować bazę ortogonalną (ortonormalną) stosując iteracyjną procedurę Grama-Schmidta Uogólniony szereg Fouriera P — ośrodkowa przestrzeń Hilberta sygnałów x {uk : k ∈ B} — baza ortonormalna tej przestrzeni x = x ( t ) , uk = uk ( t ) (argument t na razie pomijamy) Każdy sygnał x ∈ P można przedstawić jako kombinację liniową sygnałów bazowych, czyli w postaci szeregu: x = ∑ αk u k k∈B Równość oznacza, że x − ∑ αk u k = 0 k∈B czyli x − ∑ αk u k = 0 k∈B x = ∑ αk u k k∈B x, u k = Szereg ∑ α u ,u l∈B l l k = ∑ αl ul , uk = αk l∈B x = ∑ αk u k k∈B αk = x , u k nazywa się uogólnionym szeregiem Fouriera elementu (sygnału) x, określonym względem bazy ortonormalnej {uk : k ∈ B}. Zbiór {αk : k ∈ B} nazywa się rzutem sygnału x w przestrzeni P na sygnały bazowe uk Współczynniki αk nazywają się składowymi (współrzędnymi) sygnału x Jean Baptiste Joseph Fourier ur: 21 marca 1768 w Auxerre – Francja zm: 16 maja 1830 w Paryżu – Francja Matematyk fracuski Kierownik katedry analizy w École Polytechnique w Paryżu (od 1826 r.), a od 1827 r. — rektor Ogromnej wagi prace i badania zapewniły mu sławę światową. Jego metody są zupełnie oryginalne, a teoria równań zawdzięcza mu wiele istotnych ulepszeń. Fourier pracował nad teorią ciepła i analizą — szczególnie nad teorią funkcji, rachunkiem całkowym i nad równaniami różniczkowymi. Zasadniczą jednak dziedziną jego zainteresowań była fizyka matematyczna. Już w 1807 i 1811 roku przedstawił Académie des Sciences (paryskiej Akademii Nauk) swoje pierwsze odkrycie, a w 1822 roku opublikował pracę „Analityczna teoria ciepła”. Praca ta była punktem wyjścia do stworzenia teorii szeregów trygonometrycznych i opracowania niektórych zagadnień analizy matematycznej. Szeregi te nazwane jego imieniem (szeregi Fouriera) odegrały wielką rolę i są często stosowane. Wynikiem prac Fouriera nad liczbowymi metodami rozwiązywania równań algebraicznych jest wydana już pośmiertnie (w 1831r.) „Analiza określonych równań”. Przykład Przestrzeń 3-wymiarowa wektorów z bazą ortonormalną v = vx i + v y j + vz k {i, j, k} — dowolny wektor Poszukujemy wektora vɶ = vɶx i + vɶ y j , który będzie najlepszym przybliżeniem wektora v, w sensie minimalizacji normy wektora ε = v − vɶ ε = ( vx − vɶx ) i + ( v y − vɶ y ) j + vz k ε = ( vx − vɶx ) + ( v y − vɶy ) 2 2 + vz2 Minimum będzie osiągnięte gdy vɶx = vx i vɶ y = v y czyli vɶ = vx i + v y j oraz ε = vz k z vz v k ε̂ j i vx ε y vy vɶ v̂ x vɶ rzut ortogonalny wektora v na płaszczyznę (x, y) Własności: dla każdego vˆ ≠ vɶ, vˆ ∈ ( x, y ) zachodzi v − vˆ > v − vɶ wektor ε = v − vɶ jest ortogonalny do każdego wektora na płaszczyźnie (x, y) z v2 k i v1 j vɶ y vy vx x Znacząco różne wektory mogą mieć taki sam rzut ortogonalny Aproksymacja sygnałów szeregami skończonymi P — ośrodkowa przestrzeń Hilberta sygnałów x {uk : k ∈ B = N} — baza ortonormalna tej przestrzeni P n ⊆ P — n wymiarowa podprzestrzeń, rozpięta na bazie {uk : k = 1, 2,… , n} n n Dla zadanego x ∈ P \ P należy znaleźć xɶn ∈ P , takie, aby norma błędu aproksymacji εn = x − xɶn osiągała wartość minimalną: εn = x − xɶn → min ∞ n x = ∑ αk u k , αk = x , u k , xɶn = ∑ βk uk k =1 ∞ k =1 n n εn = x − xɶn = ∑ αk uk − ∑ βk uk = ∑ ( αk − βk ) uk + k =1 εn 2 = x − xɶn = n 2 = ∞ k =1 2 n ∑α u − ∑ β u k =1 ∑ ( α k − βk ) u k k =1 k =1 k k 2 + k =1 k k = n +1 αk u k ∑ (α k =1 2 ∞ ∑ = k n n k ∑αu k = n +1 − βk ) u k + = ∑ α k − βk + k =1 ∞ 2 k 2 ∞ ∑αu k k = n +1 ∞ ∑ k k = n +1 αk 2 k = εn = εn → min n ∑ αk − βk + k =1 ∞ 2 ∑ k = n +1 αk 2 gdy βk = αk = x, uk , k = 1, 2,…, n Twierdzenie o rzucie ortogonalnym Jeżeli P jest nieskończenie wymiarową przestrzenią Hilberta, a P n jej n wymiarową podprzestrzenią, rozpiętą na ortonormalnej bazie {uk : k = 1, 2,… , n} , to dla każdego x ∈ P istnieje jedyny element xɶn ∈ P n n xɶn = ∑ x, uk uk k =1 taki, że dla każdego xˆ ≠ xɶn , xˆ ∈ P n zachodzi x − xˆ > x − xɶn element x − xɶn jest ortogonalny do każdego elementu z podprzestrzeni P n α3 x u3 εɶ u2 u1 α2 ε̂ i α1 x̂ εˆ = x − xˆ > εɶ = x − xɶ xɶ α3( 2 ) α3(1) x2 ε2 x3 u3 u1 α1 x1 u2 ε1 α2 xɶ różne sygnały x1 i x2 są aproksymowane takim samym sygnałem xɶ błędy aproksymacji są znacząco różne każdy sygnał x3, taki, że x3 ⊥ u1 i x3 ⊥ u2 jest aproksymowany sygnałem zerowym Zwiększenie dokładności aproksymacji można uzyskać dodając do skończonej bazy ortonormalnej kolejne elementy, czyli zwiększając n. Powstaje ciąg sygnałów aproksymujących { xɶ1 , xɶ2 ,…, xɶn ,…} , gdzie n-ty sygnał n xɶn = ∑ αk uk , k =1 εn = x − xɶn Dla każdego n: εn xɶn 2 εn = 2 + xɶn 2 2 n ∑ αk u k 2 ⇒ n = ∑ αk u k k =1 2 = x 2 k =1 n = x − ∑ αk ≥ 0 2 εn = x − xɶn n = ∑ αk 2 k =1 ⇒ 2 2 uk n 2 2 n = ∑ αk 2 2 k =1 ∑ αk ≤ x 2 = x − xɶn 2 2 k =1 k =1 n →∞ ∞ ∑α k =1 2 k ≤ x 2 — nierówność Bessela ∞ ∑ αk ≤ x < ∞ 2 2 k =1 Wniosek: Ciąg {α1 , α2 ,…, αn ,…} jest elementem przestrzeni l 2 Nierówność Bessela staje się równością, gdy zbiór sygnałów ortonormalnych {u1 , u2 ,…, un ,…} rozpina całą przestrzeń P, tzn. jest zbiorem domkniętym (stanowi bazę tej przestrzeni). Wówczas ∞ x = ∑ αk 2 2 k =1 Równość Parsevala Uogólniony szereg Fouriera względem wyróżnionej bazy ortonormalnej w przestrzeni Hilberta P jest wzajemnie jednoznacznym odwzorowaniem przestrzeni P w przestrzeń Hilberta l 2 ciągów liczbowych (rzeczywistych lub zespolonych) sumowalnych z kwadratem. χ : P ֏ l2 x ∈ P → α = ( α1 , α2 ,…) ∈ l 2 ⇒ χ ( x) = α y ∈ P → β = ( β1 , β2 ,…) ∈ l 2 ⇒ χ ( y) = β x, y ∈ P : ∞ x = ∑ αk u k , k =1 x, y P = ∞ ∞ ∞ ∞ ∞ y = ∑ βr ur r =1 ∞ ∗ α u , β u = α β u , u = α β ∑ k k ∑ r r ∑∑ k k r ∑ k k = α, β k =1 r =1 ∗ r k =1 r =1 x. y P = α, β l2 k =1 l2 χ ( x + y) = α + β χ ( ax ) = aα, a ∈ R x, y x P P = α, β = α odwzorowanie liniowe l2 l2 Odwzorowanie o takich własnościach nazywa się odwzorowaniem izometrycznym Każda ośrodkowa przestrzeń Hilberta jest izometryczna z przestrzenią l 2