Niniejsza publikacja została przygotowana w ramach realizacji projektu ”Innowacyjne specjalności na kierunku Informatyka w Wyższej Szkole Biznesu w Dąbrowie Górniczej”, Program Operacyjny Kapitał Ludzki, Działanie 4.1, Poddziałanie 4.1.1 Wzmocnienie potencjału dydaktycznego uczelni Matematyka (Materiały dydaktyczne) Aleksander Błaszczyk Spis treści Rozdział I. Struktury liczbowe 1. Wstęp mnogościowy 2. Liczby naturalne. Indukcja Matematyczna 3. Liczby całkowite, wymierne i rzeczywiste 4. Wielomiany 5. Liczby zespolone 6. Grupy, ciała, przestrzenie liniowe 7. Zadania do rozdziału I 3 3 4 12 17 22 26 33 Rozdział II. Macierze i wyznaczniki 1. Macierze 2. Wyznaczniki 3. Macierz odwrotna 4. Zadania do rozdziału II 45 45 51 66 69 Rozdział III. Układy równań liniowych 1. Układy równań liniowych 2. Przekształcenia elementarne macierzy 3. Metoda Gaussa rozwiązywania układów równań 4. Formy kwadratowe 5. Zadania do rozdziału III 77 77 80 85 89 94 Rozdział IV. Przekształcenia liniowe 1. Pojęcie przekształcenia liniowego 2. Postać macierzowa przekształceń liniowych 3. Zmiany baz 4. Wartości i wektory własne 5. Zadania do rozdziału IV 99 99 101 103 104 107 Skorowidz 109 Bibliografia 111 1 ROZDZIAŁ I Struktury liczbowe 1. Wstęp mnogościowy Rozpoczniemy wykład od ustalenia pojęć i zebrania podstawowych faktów, które później wykorzystamy. Pojęciem podstawowym jest zbiór. Przyjmijmy, że pojęcie zbioru jest dla nas intuicyjnie zrozumiałe. Tak więc, jeśli A jest zbiorem, a x należy do zbioru A, czyli x jest elementem zbioru A, to piszemy x ∈ A. W przeciwnym przypadku piszemy x ∈ / A. Często zbiór można opisać wyliczając jego elementy. Na przykład, jeśli zbiór A składa się jedynie z liczb 1, 2 oraz 3, to zapisujemy ten fakt następująco: A = {1, 2, 3}. Niekiedy zbiór można opisać przez podanie formuły, którą spełniają jego elementy. Tak więc jeśli B jest zbiorem wszystkich rozwiązań równania x2 − 3x + 2 = 0, to piszemy B = {x ∈ R : x2 − 3x + 2 = 0}. Wówczas, jak łatwo sprawdzić, B = {1, 2}. W określeniu zbioru B pojawił się symbol R oznaczający zbiór wszystkich liczb rzeczywistych. Ma on znaczenie zasadnicze w matematyce i na jego temat powiemy nieco więcej. Równie ważny jest podzbiór liczb rzeczywistych składający się z liczb naturalnych. W tym miejscu trzeba dodać, że zbiór A jest zawarty w zbiorze B, co zapisujemy symbolicznie A ⊆ B, jeśli każdy element zbioru A jest także elementem zbioru B. Mówimy wtedy, że A jest podzbiorem zbioru B. Mając dwa zbiory A i B możemy mówić o ich sumie i iloczynie. Sumą zbiorów A i B nazywamy zbiór A ∪ B złożony z tych elementów x, że x ∈ A lub x ∈ B. Iloczynem zbiorów A i B nazywamy zbiór A∩B, którego elementami są takie x, że x ∈ A i x ∈ B. Oprócz tego możemy mówić o różnicy A \ B zbiorów A i B. Składa się ona z tych x, że x ∈ A i x ∈ / B. 3 4 I. STRUKTURY LICZBOWE Ważnym pojęciem w matematyce jest iloczyn kartezjański. Aby go zdefiniować trzeba dysponować pojęciem pary uporządkowanej (a, b). Nie wnikając w dokładną jej definicję poprzestaniemy na zasadniczej własności par uporządkowanych. Otóż (a, b) = (c, d) wtedy i tylko wtedy, gdy a = c oraz b = d. Jeśli A i B są zbiorami, to ich iloczynem kartezjańskim jest zbiór A × B = {(a, b) : a ∈ A oraz b ∈ B}. Jeśli mamy dwa zbiory X i Y , i każdemu elementowi x ∈ X przyporządkowany jest dokładnie jeden f (x) ∈ Y , to takie przyporządkowanie f nazywamy funkcją. Stosujemy oznaczenie f : X → Y . Zbiór X, na którym określona jest funkcja f nazywamy dziedziną funkcji f , który oznaczamy też Df , a zbiór Y przeciwdziedziną funkcji f . Zbiór f (X) = {f (x) : x ∈ X} zbiorem wartości funkcji f . Jeśli f : X → Y oraz g : Y → Z, to możemy rozważać złożenie funkcji f i g czyli funkcję, którą oznaczamy symbolem g ◦ f , a definiujemy jako: g ◦ f (x) = g(f (x)). Zbiór Wf = {(x, f (x)) ∈ X × Y : x ∈ Df } nazywamy wykresem funkcji f . Funkcję f nazywamy różnowartościową, jeśli dla dowolnych x1 , x2 ∈ Df zachodzi x1 6= x2 ⇒ f (x1 ) 6= f (x2 ). Jeśli funkcja f : X → Y jest różnowartościowa oraz zbiór wartości funkcji f (X) jest równy Y , to możemy mówić o funkcji odwrotnej f −1 : Y → X zdefiniowanej wzorem f −1 (y) = x, jeśli f (x) = y. 2. Liczby naturalne. Indukcja Matematyczna Liczb naturalnych, podobnie jak pojęcia zbioru, nie będziemy definiować. Zbiór liczb naturalnych będziemy oznaczać symbolem N, tzn. N = {1, 2, 3, . . . }. Trzy kropki następujące po trzecim przecinku oznaczają, że dalej następują kolejne elementy, czyli kolejne liczby naturalne. W zbiorze liczb naturalnych N nie ma liczby największej, a więc zbiór ten jest nieskończony. Jest natomiast liczba najmniejsza. Przyjmuje się jako pewnik (czyli aksjomat) następujące stwierdzenie: (Zasada Minimum). Jeśli zbiór A ⊆ N ma przynajmniej jeden element, to wśród elementów zbioru A jest liczba najmniejsza. 2. LICZBY NATURALNE. INDUKCJA MATEMATYCZNA 5 Powyższa zasada, choć nie można jej udowodnić, wydaje się intuicyjnie jasna, a jej prawdziwość nie budzi wątpliwości. Jednak wynikające z niej wnioski, a w szczególności Zasada Indukcji Matematycznej, już nie zawsze są tak łatwe do zaakceptowania. Twierdzenie 2.1 (Zasada Indukcji Matematycznej). Jeśli A jest takim podzbiorem zbioru liczb naturalnych, że: (I) 1 ∈ A, (II) jeśli n ∈ A, to także n + 1 ∈ A, to wówczas każda liczba naturalna należy do A, tzn. A = N. Twierdzenie to można łatwo uzasadnić przy pomocy Zasady Minimum. Istotnie, gdyby zbiór A zawarty w zbiorze N liczb naturalnych spełniał warunki (I) oraz (II), a był od niego różny, to na mocy Zasady Minimum musiałaby istnieć najmniejsza taka liczba, powiedzmy n0 , która do niego nie należy. Oczywiście n0 > 1, bo 1 ∈ A. Skoro jednak n0 jest liczbą najmniejszą wśród tych, które nie należą do A, to n0 − 1 ∈ A. To jednak przeczy określeniu liczby n0 , bo na mocy warunku (II), n0 = (n0 − 1) + 1 ∈ A. Często wygodniej jest posługiwać się Zasadą Indukcji Matematycznej w wersji uogólnionej: Twierdzenie 2.2 (Zasada Indukcji Matematycznej ∗ ). Niech W będzie własnością przysługującą liczbom naturalnym, a W(n) niech oznacza, że liczba n ma własność W. Wówczas, jeśli spełnione są dwa warunki: (I*) zachodzi W(1), (II*) jeśli zachodzi W(n), to zachodzi również W(n + 1), to własność W zachodzi dla wszystkich liczb naturalnych. Zasada Indukcji Matematycznej jest jednym z najważniejszych narzędzi, przy pomocy których dowodzi się twierdzeń. Zilustrujemy to na kilku przykładach. Przykład 2.1. Dla każdej liczby naturalnej n suma wszystkich kolejnych liczb naturalnych od 1 aż do n włącznie jest równa 21 n(n + 1), tzn. n(n + 1) , 2 przy czym po lewej stronie równości występuje suma n składników, tzn. dokładnie tyle ile wynosi liczba n. Aby udowodnić powyższy wzór rozważmy własność W(n) mówiącą, że zachodzi równość (1). Wówczas oczywiście zachodzi W(1), bo po lewej stronie równości mamy 1, a po prawej ułamek 1(1+1) . Zatem spełniony jest warunek (I*) Zasady Indukcji 2 Matematycznej. Aby sprawdzić warunek (II*) wystarczy do obydwu stron równości (1) dodać liczbę n + 1. Wówczas otrzymujemy 1 + 2 + 3 + ··· + n = (1) 1 + 2 + 3 + · · · + n + (n + 1) = = n(n + 1) n(n + 1) + 2(n + 1) (n + 1)(n + 2) + (n + 1) = = , 2 2 2 6 I. STRUKTURY LICZBOWE co właśnie oznacza, że zachodzi warunek W(n + 1). Ze wzoru (1) wynika w szczególności, że suma liczb od 1 do 100 wynosi 5050. Można to oczywiście sprawdzić dodając do siebie kolejnych 100 liczb, co jest oczywiście dość żmudne. Poza tym nie jesteśmy w stanie wykonać nieskończenie wiele tego typu obliczeń. Na tym właśnie polega siła Indukcji Matematycznej. Jednak sprawdzenie wzoru dla nawet bardzo wielu liczb nie oznacza jeszcze, że jest on prawdziwy dla wszystkich liczb naturalnych. Przykładem może być wielomian Eulera E(n) = n2 + n + 41. Można sprawdzić, że wstawiając w miejsce n kolejno liczby: 0, 1, 2, 3, ..., 39 otrzymane w ten sposób liczby E(n) są liczbani pierwszymi, tzn. jedynymi liczbami naturalnymi, przez które daje się podzielić bez reszty są 1 oraz E(n). Można by więc przypuszczać, że tak jest zawsze. Niestety E(40) = 402 + 40 + 41 = 41 · 41, a więc E(40) nie jest liczbą pierwszą. O liczbach pierwszych powiemy jeszcze nieco później. Przykład 2.2 (Suma wyrazów postępu geometrycznego). Jeśli q jest liczbą rzeczywistą różną od 1, to dla każdej liczby naturalnej n prawdziwy jest wzór: (2) 1 + q + q2 + · · · + qn = 1 − q n+1 , 1−q przy czym po lewej stronie równości występuje suma n+1 składników, z których każdy następny jest kolejną potęgą liczby q. Zauważmy także, że q 0 = 1. Przykład 2.3 (Nierówność Bernoulliego). Dla dowolnej liczby rzeczywistej x > −1 i dla dowolnej liczby naturalnej n zachodzi wzór: (3) (1 + x)n > 1 + nx. Warunek (I*) w dowodzie indukcyjnym tej nierówności jest oczywisty; zachodzi nawet równość. Aby uzasadnić warunek (II*) wystarczy pomnożyć obustronnie wzór 3 przez 1 + x. Nierówność się zachowa bo x > −1 i będziemy mieli (1 + x)n+1 = (1 + x)n (1 + x) > (1 + nx)(1 + x) = = 1 + nx + x + nx2 > 1 + (n + 1)x, bo nx2 > 0 dla każdej liczby rzeczywistej. Indukcji matematycznej możemy także użyć do definiowania nowych pojęć. W takich przypadkach Zasada Indukcji Matematycznej pozwala nam upewnić się, że dane pojęcie określone jest dla wszystkich liczb naturalnych. 2. LICZBY NATURALNE. INDUKCJA MATEMATYCZNA 7 Przykładem takiej sytuacji jest definicja symbolu n! (czytamy „en silnia”). Przyjmujemy więc co następuje: 0! = 1, 1! = 1, (n + 1)! = n! · (n + 1). Innymi słowy n! (dla n > 1) jest to iloczyn wszystkich kolejnych liczb naturalnych licząc od 1 aż do n włącznie, tzn. n! = 1 · 2 · · · · · n. Przy pomocy tego pojęcia możemy policzyć ilość wszystkich możliwych ustawień elementów zbioru n-elementowego. Można odpowiedzieć na przykład na pytanie: na ile sposobów można posadzić 5 osób przy stole prezydialnym? Zanim odpowiemy na to pytanie, sprecyzujemy pojęcie „ustawienia” lub „uszeregowania”. Są to synonimy słowa permutacja. Definicja 2.1. Permutacją elementów zbioru {x1 , . . . , xn } nazywamy każdy układ postaci p = (xi1 , xi2 , . . . , xin ), w którym dla każdego k 6 n element xik stoi na pozycji k. Zatem permutacja elementów zbioru A = {x1 , . . . , xn } polega na tym, że pozycja każdego elementu zbioru A jest w niej ściśle określona. Przestawienie elementów daje nam inną permutację. Na przykład zbiór {x, y, z} jest identyczny ze zbiorem {z, y, x} bo ma te same elementy, a permutacje (x, y, z) oraz (z, y, x) tego samego zbioru elementów są różne. Przykład 2.4. Lista wszystkich permutacji zbioru A = {1, 2, 3} jest następująca: p1 = (1, 2, 3) p2 = (1, 3, 2) p3 = (2, 1, 3) p4 = (2, 3, 1) p5 = (3, 1, 2) p6 = (3, 2, 1). Łatwo zauważyć, że wszystkie te permutacje różnią się między sobą. Natomiast fakt, że wyczerpują one całą listę możliwych permutacji wymaga już zastanowienia lub zastosowania następującego twierdzenia: Twierdzenie 2.3. Dla każdej liczby naturalnej n, każdy zbiór składający się z n elementów ma dokładnie n! permutacji. 8 I. STRUKTURY LICZBOWE Także i to twierdzenie można udowodnić metodą indukcyjną. Jeśli zbiór jest jednoelementowy, to ma oczywiście tylko jedną permutację bo jego elementu nie ma z czym przestawić. Jeśli założymy, że każdy zbiór n-elementowy ma n! permutacji, to nietrudno zauważyć, że zbiór złożony z n + 1 elementów będzie miał ich (n + 1)!. Istotnie, jeśli wybierzemy sobie jeden z elementów tego zbioru, to wszystkie pozostałe można ustawić na n! sposobów. Z drugiej zaś strony pojedyńczy element można w permutacji n + 1-elementowej ustawić na n + 1 sposobów. Zatem wszystkich możliwych ustawień jest (n + 1) · n!, co na mocy definicji symbolu silni daje (n + 1)!, a to kończy dowód. Zbiór wszystkich permutacji zbioru n-elementowego {1, . . . , n} oznaczać będziemy symbolem Pn . Z powyższego twierdzenia wynika, że lista permutacji w przykładzie 2.4 jest kompletna: powinno ich być 3! czyli 6. atwo również odpowiedzieć na wcześniejsze pytanie o ilość możliwości rozmieszczenia 5 osób przy stole: tych możliwości jest 120. Inny przykład: wszystkich możliwych ułożeń talii 52 kart jest 52!, co w przybliżeniu wynosi 807·1065 . Jak więc widać liczby n! rosną bardzo szybko. Świadczy o tym także następny przykład. Przykład 2.5. Dla dowolnej liczby naturalnej n zachodzi nierówność: n! > 2n−1 . (4) Istotnie, dla n = 1 po obydwu stronach nierówności mamy 1. Aby sprawdzić warunek (II*) Zasady Indukcji Matematycznej załóżmy, że n > 1 oraz, że zachodzi nierówność (4). Skoro n + 1 > 2, to mamy (n + 1)! = n!(n + 1) > 2n−1 · 2 = 2n , co kończy dowód. Okazuje się, że liczby postaci n! rosną znacznie szybciej niż liczby 2n ; w istocie stosunek n! 2n rośnie do nieskończoności. Jeśli A = {1, 2, . . . , n}, to z każdą permutacją elementów zbioru A związane jest pojęcie inwersji. Definicja 2.2. Mówimy, że para (xi , xj ) tworzy inwersję w permutacji p = (x1 , x2 , . . . , xn ) zbioru {1, 2, . . . , n}, jeśli xi > xj , a jednocześnie i < j. Mówiąc prościej: inwersja w permutacji ma miejsce wtedy, gdy liczba większa występuje w tej permutacji przed liczbą mniejszą. Ilość inwersji w permutacji p będziemy oznaczali symbolem I(p). 2. LICZBY NATURALNE. INDUKCJA MATEMATYCZNA 9 Przykład 2.6. Permutacje zbioru trójelementowego {1, 2, 3} wyszczególnione w przykładzie 2.4 mają następujące liczby inwersji: I(p1 ) = 0, I(p2 ) = I(p3 ) = 1, I(p4 ) = I(p5 ) = 2 oraz I(p6 ) = 3. Sprawdźmy ostatnią z tych równości. atwo zobaczyć, że w permutacji p6 = (3, 2, 1) mamy trzy inwersje: (3, 2), (3, 1) oraz (2, 1). Z pojęciem permutacji związane są także tzw. współczynniki Newtona nk . Dla dowolnych liczb całkowitych n oraz k większych lub równych 0, przy czym k 6 n, przyjmujemy ! n n! = . k k!(n − k)! Nietrudno sprawdzić, że zachodzą następujące równości: ! ! (5) n n = =1 0 n (6) n =n 1 (7) n n = k n−k (8) n n n+1 + = k k+1 k+1 ! ! ! ! ! ! Wzory (5), (6) i (7) wynikają wprost z definicji, a dla dowodu wzoru (8) wystarczy sprowadzić dwa ułamki do wspólnego mianownika: ! ! n n n! n! + = + = k k+1 k! (n − k)! (k + 1)! [n − (k + 1)]! n! (k + 1) + n! (n − k) n! [(k + 1) + (n − k)] = = = (k + 1)! (n − k)! (k + 1)! (n − k)! ! n! (n + 1) (n + 1)! n+1 = = = . (k + 1)! [(n + 1) − (k + 1)]! (k + 1)! [(n + 1) − (k + 1)]! k+1 Przy pomocy wzoru (8) można obliczać kolejne liczby tablicy zwanej trójkątem Pascala: n k ustawiając je w następującej 10 I. STRUKTURY LICZBOWE 1 1 1 1 1 1 1 2 3 4 5 1 3 1 6 10 4 10 1 5 1 1 6 15 20 15 6 1 ............................................... Liczba znajdująca się w n-tym wierszu tej tablicy na pozycji k odpowiada współn czynnikowi Newtona k ; pamiętać należy jednak, że zarówno wiersze jak i pozycje w wierszach liczymy od 0. Na przykład widoczna powyżej liczba 20 stojąca w szóstym 6 wierszu odpowiada współczynnikowi 3 . Kolejne wiersze powstają w ten sposób, że na początku oraz na końcu każdego wiersza jest liczba 1, a każda inna jest sumą dwóch liczb, które znajdują się nad nią w wierszu poprzednim. Przy pomocy współczynników Newtona można obliczyć ilość tzw. kombinacji kelementowych wybranych ze zbioru n-elementowego, czyli ilość wszystkich możliwych wyborów k elementów spośród n elementów. Kolejność elementów jest dla poszczególnego wyboru nieistotna. Chodzi tu jedynie o ilość podzbiorów k-elementowych zawartych w zbiorze n-elementowym. Oczywiście podzbiór n-elementowy zbioru nelementowego jest z nim identyczny, a więc jest tylko jeden. Także zbiór pusty, czyli taki, który nie ma żadnego elementu jest jeden. Ogólnie prawdziwe jest następujące twierdzenie: Twierdzenie 2.4. Ilość podzbiorów k-elementowych dowolnego zbioru n-elementowego n wynosi k . Uzasadnienie tego twierdzenia przeprowadzimy indukcyjnie ze względu na n. Wpierw jednak przyjmijmy następujące oznaczenia: niech |X| oznacza ilość elementów zbioru X, a [X]k zbiór wszystkich jego k-elementowych podzbiorów. Zatem, gdy n = 0 to także k = 0 i zbiór [X]k jest jednoelementowy, bo składa się jedynie ze zbioru pustego. Z drugiej zaś strony mamy równość ! 0 0! = =1 0! · 0! 0 bo 0! = 1. Załóżmy zatem, że równość n |[Y ] | = k ! k zachodzi dla każdego zbioru n-elementowego Y i każdego k 6 n. Ustalmy zbiór (n + 1)elementowy X i rozważmy zbiór Ck = {(a, A) : a ∈ A, A ⊆ X oraz |A| = k}, 2. LICZBY NATURALNE. INDUKCJA MATEMATYCZNA 11 gdzie k 6 n + 1. Dalsza część dowodu oparta jest na standardowym triku kombinatorycznym: policzymy ilość elementów zbioru Ck na dwa sposoby, a następnie porównamy. Przy każdym ustalonym A ∈ [X]k istnieje dokładnie k elementów a takich, że (a, A) ∈ Ck . Zatem otrzymujemy |Ck | = k · |[X]k |. Z drugiej strony, jeśli ustalimy element a ∈ X oraz para (a, A) ∈ Ck , to pozostałe elementy zbioru A, czyli elementy zbioru A \ {a} są wybrane ze zbioru n-elementowego Y = X \ {a}. Korzystając z założenia indukcyjnego otrzymujemy równość ! n |Ck | = (n + 1) · . k−1 Porównując obydwie równości dostajemy ostatecznie ! ! n+1 n n+1 n! n+1 |[X] | = = , · · = k−1 k k k (k − 1)! · (n − (k − 1))! k co kończy dowód. Przy pomocy współczynników Newtona można także zapisać wzór dwumienny Newtona pozwalający na obliczanie wyrażeń postaci (x + y)n , gdzie n jest dowolną liczbą naturalną. Zanim zapiszemy ten wzór przyjmijmy pewną umowę, tzw. konwencję sumacyjną przyjętą powszechnie nie tylko w matematyce. Wielką literą grecką Σ (czytaj „sigma”) będziemy oznaczać dodawanie liczb, których wartości zależą od elementów należących do danego zbioru. Zatem jeśli A = {1, 2, . . . , n}, to symbol X ak oznacza sumę a1 + a2 + · · · + an . k∈A Na przykład, jeśli A = {1, 2, 3, 4, 5}, to X k 2 = 1 + 22 + 32 + 42 + 52 = 55, k∈A a jeśli A = {2, 4, 6, 7}, to X k 2 = 22 + 42 + 62 + 72 = 105. k∈A Na ogół jednak tym danym zbiorem będzie u nas odcinek zbioru liczb naturalnych postaci {1, 2, . . . , n} lub {m, m + 1, m + 2, . . . , n}. Wtedy piszemy n X ak = a1 + a2 + · · · + an k=1 lub n X ak = am + am+1 + · · · + an . k=m Czasami wygodnie jest założyć, że zbiór A zaczyna się od 0, wtedy X k∈A ak = n X k=0 ak = a0 + a1 + · · · + an . 12 I. STRUKTURY LICZBOWE Dzięki prawom przemienności dodawania oraz rozdzielności mnożenia względem dodawania mamy wzór: α (9) n X k=1 ak + β n X bk = k=1 n X (αak + βbk ). k+1 Z twierdzenia 2.4 wynika następujący ważny wzór: Twierdzenie 2.5 (Wzór dwumienny Newtona). Dla dowolnej liczby naturalnej n oraz dowolnych liczb rzeczywistych x i y zachodzi wzór: n (x + y) = (10) n X k=0 ! n n−k k x y . k Istotnie, skoro (x + y)n = (x + y)(x + y) · . . . (x + y), to, na mocy zasady rozdzielności mnożenia względem dodawania, wyrażenie (x + y)n jest równe sumie wyrażeń postaci xn−k y k . Powstają one w ten sposób, że z każdego spośród n nawiasów wybieramy x lub y, przy czym jeśli wybierać będziemy element y k-krotnie, a w pozostałych przypadkach (czyli n − k-krotnie) wybierzemy element x, to otrzymamy składnik xn−k y k . Ponieważ wyborów takich jest dokładnie nk to współczynnik przy xn−k y k będzie równy właśnie nk . To kończy dowód wzoru Newtona. W szczególności dla n = 2 oraz n = 3 mamy znane wzory: (x + y)2 = x2 + 2xy + y 2 , oraz (x + y)3 = x3 + 3x2 y + 3xy 2 + y 3 . Wstawiając we wzorze (10) x = y = 1 otrzymujemy równość n X k=0 ! n = 2n . k Interpretacja tego wzoru jest oczywista: wszystkich podzbiorów zbioru n-elementowego jest dokładnie 2n . 3. Liczby całkowite, wymierne i rzeczywiste Zbiorem szerszym od zbioru N liczb naturalnych jest zbiór Z liczb całkowitych, który poza elementami zbioru N zawiera jeszcze 0 oraz liczby postaci −n, gdzie n ∈ N. Zatem Z = N ∪ {0} ∪ {−n : n ∈ N}. Inaczej mówiąc zbiór liczb całkowitych składa się z liczb całkowitych dodatnich (czyli liczb naturalnych), zera oraz z liczb całkowitych ujemnych. Ma więc postać: . . . , −3, −2, −1, 0, 1, 2, 3, . . . 3. LICZBY CAŁKOWITE, WYMIERNE I RZECZYWISTE 13 Ogólniejsze od liczb całkowitych są liczby wymierne, które mają postać p , q gdzie p jest dowolną liczbą całkowitą, a q jest liczbą naturalną. Zatem liczby wymierne to nic innego, jak dobrze znane ułamki, przy czym przyjmujemy, że p x = q y jeśli py = xq. W szczególności mamy więc 2 3 1 = = . 2 4 6 Zbiór wszystkich liczb wymiernych oznaczamy symbolem Q. Wiadomo, że w mianowniku ułamka nie może pojawić się zero, lecz może pojawić się jedynka. W takim przypadku liczba wymierna jest liczbą całkowitą. Przypomnijmy także, że ułamki dają się niekiedy uprościć przez podzielenie mianownika i licznika przez wspólny czynnik. Taka procedura ma charakter skończony i prowadzi do ułamka nieskracalnego, np. 30 15 5 = = . 42 21 7 W ułamku nieskracalnym, licznik i mianownik nie mają wspólnego dzielnika różnego od 1 i −1, a więc są względnie pierwsze. Własności działań na liczbach wymiernych są czytelnikowi zapewne dobrze znane. Przypomnijmy oczywiste prawa mnożenia i dodawania ułamków: a c a·c · = , b d b·d a·d+b·c a c + = . b d b·d Liczby wymierne nie wystarczają do mierzenia wielkości występujących w matematyce a także w świecie realnym. Na przykład: jak wynika z twierdzenia Pitagorasa, przekątna kwadratu o boku długości 1 ma długość równą liczbie, która podniesiona do kwadratu daje 2. Nie jest to liczba wymierna, bo w przeciwnym wypadku można by ją przedstawić w postaci ułamka nieskracalnego postaci ab . Mielibyśmy wówczas 2 a = 2. b Jeśliby liczba a była nieparzysta, to była by postaci a = 2k + 1. Mielibyśmy wówczas 2b2 = a2 = (2k + 1)2 = 4k 2 + 4k + 1, co jest niemożliwe, bo z lewej strony powyższej równości mamy liczbę parzystą, a po prawej nieparzystą. Wobec tego liczba a musi być parzysta, a więc a = 2r dla pewnej liczby naturalnej r. To daje równość 2 2r = 2, b 14 I. STRUKTURY LICZBOWE która po przekształceniu ma postać b2 = 2. r2 Rozumując jak poprzednio dochodzimy do wniosku, że także b jest liczbą parzystą, co jednak przeczy nieskracalności ułamka ab . Tak więc, aby √ zmierzyć długość przekątnej kwadratu o boku 1 musimy zgodzić się na istnienie liczby 2, która nie jest wymierna. Fakt ten był już prawdopodobnie znany filozofom z kręgu Pitagorasa, a jest także wspomniany w dziele Euklidesa Elementy. Niewymierność innej ważnej liczby ma także starożytny rodowód: od bardzo dawna było wiadomo, że stosunek długości obwodu koła do długości jego średnicy jest stały niezależnie od wielkości koła. Stosunek ten oznaczamy obecnie symbolem π. Od najdawniejszych czasów próbowano ustalić jego dokładną wielkość. Tak więc Archimedes 8 30 uważał, że wynosi on 22 , Ptolemeusz przyjmował π równe 3 + 60 + 3600 , a matematyk 7 754 hinduski Bhaskara w XII wieku ustalił wielkość π na 240 . Dopiero matematyk holenderski Ludolph van Coolen w roku 1610 wyznaczył przybliżoną wartość π z dokładnością do 35 miejsc po przecinku. Stąd też liczba π nazywana jest także ludolfiną. Nie wchodząc głębiej w naturę liczb rzeczywistych przyjmijmy jedynie, że zbiór R wszystkich liczb rzeczywistych spełnia następujący aksjomat: (Aksjomat Dedekinda). Jeśli R = A ∪ B i zbiory A i B nie są puste oraz dla dowolnego a ∈ A i dowolnego b ∈ B zachodzi nierówność a < b, to wśród liczb należących do zbioru A jest liczba największa albo wśród liczb należących do zbioru B jest liczba najmniejsza. Dzięki temu postulatowi dla każdego zbioru ograniczonego złożonego z liczb rzeczywistych możemy określić jego kres górny (= supremum) oraz kres dolny (= infimum). Definicja 3.1. Mówimy, że zbiór X ⊆ R jest ograniczony z góry, gdy istnieje taka liczba α ∈ R, że nierówność x6α zachodzi dla każdego x ∈ X. Podobnie mówimy, że zbiór A jest ograniczony z dołu, gdy istnieje taka liczba β ∈ R, że nierówność β6x zachodzi dla każdego x ∈ X. Liczby α i β nazywamy, odpowiednio ograniczeniem górnym i ograniczeniem dolnym zbioru A. Nie każdy zbiór liczb jest ograniczony, np. okazuje się, że zbiór n 2 ∈ Q: n ∈ N n nie jest ograniczony z góry ale jest ograniczony z dołu. Natomiast zbiór {a ∈ Q : a2 < 2} 3. LICZBY CAŁKOWITE, WYMIERNE I RZECZYWISTE jest ograniczony z góry na przykład przez liczbę co następuje: 142 . 100 15 Z Aksjomatu Dedekinda wynika Twierdzenie 3.1. Niech X ⊆ R będzie dowolnym zbiorem niepustym. Wówczas: (1) jeśli zbiór X jest ograniczony z góry, to istnieje taka liczba α = sup X, nazywana kresem górnym zbioru X, że α jest najmniejszym ograniczeniem górnym zbioru X, tzn. x 6 α dla każdego x ∈ X oraz jeśli α0 < α, to istnieje takie x ∈ X, że α0 < x. (2) jeśli zbiór X jest ograniczony z dołu, to istnieje taka liczba β = inf X, nazywana kresem dolnym zbioru X, że β jest największym ograniczeniem dolnym zbioru X, tzn. β 6 x dla każdego x ∈ X oraz jeśli β < β 0 , to istnieje takie x ∈ X, że x < β 0 . Istotnie, ustalmy zbiór niepusty X ograniczony z góry. Wówczas zbiór B = {b ∈ R : x < b dla każdego x ∈ X} jest także niepusty. Jeśli zaś jako A przyjmiemy dopełnienie zbioru B, tzn. A = {a ∈ A : a ∈ / B}, to otrzymamy taki zbiór niepusty, że A ∪ B = R. Istotnie, z określenia zbioru B wynika, że żaden element zbioru X nie należy do B, a więc X ⊆ A, przy czym zbiór X jest niepusty. Jeśli w zbiorze A jest liczba największa, powiedzmy a0 , to x 6 a0 , bo X ⊆ A. Wówczas a0 jest elementem największym w X (a więc a0 = sup X), bo w przeciwnym wypadku a0 należałoby do B. Jeśli zaś w B jest liczba najmniejsza, to zgodnie z definicją jest ona kresem górnym zbioru X. Drugiej części twierdzenia 3.1 dowodzi się analogicznie. Można nietrudno sprawdzić, że √ sup{a ∈ Q : a2 < 2} = inf{a ∈ Q : 2 < a2 } = 2. Pojęcie kresu górnego i kresu dolnego należą do najważniejszych w tej części matematyki, którą nazywamy analizą matematyczną. Przy jego pomocy można w szczególności rozszerzyć pojęcie potęgowania liczb na przypadek, gdy wykładnik potęgi jest liczbą niewymierną. Dla liczb wymiernych postaci pq oraz dodatnich x ∈ R mamy √ p x q = q xp ; możemy przy tym zakładać, że q ∈ N. Jeśli α ∈ R oraz x > 0, to przyjmujemy xα = sup{xw : w ∈ Q oraz w 6 α}, 16 I. STRUKTURY LICZBOWE jeśli x > 1. Definicja jest poprawna bo dla x > 1 zbiór {xw : w ∈ Q oraz w 6 α} jest ograniczony z góry przez każdą liczbę postaci xs , gdzie α 6 s oraz s ∈ Q. Jeśli 0 < x < 1, to przyjmujemy xα = inf{xw : w ∈ Q oraz w 6 α}. Wśród podzbiorów zbioru R liczb rzeczywistych będziemy wyróżniali przedziały; zbiór ∆ nazywamy przedziałem, jeśli dla dowolnych liczb x, y, z ∈ R takich, że x < y < z zachodzi warunek: x, z ∈ ∆ pociąga y ∈ ∆. Bywają rozmaite przedziały: z końcami lub bez końców, ograniczone lub nieograniczone. Oto one: (a, b) = {x ∈ R : a < x < b}, [a, b) = {x ∈ R : a 6 x < b}, (a, b] = {x ∈ R : a < x 6 b}, [a, b] = {x ∈ R : a 6 x 6 b}, (−∞, a) = {x ∈ R : x < a}, (−∞, a] = {x ∈ R : x 6 a}, (a, ∞) = {x ∈ R : a < x}, [a, ∞) = {x ∈ R : a 6 x}. Możemy także uważać, że R = (−∞, ∞). Przedziały bez końców postaci (a, b) nazywamy otwartymi, a przedziały wraz z końcami [a, b] przedziałami domkniętymi. Każdej liczbie rzeczywistej x można przyporządkować największą liczbę całkowitą c nie większą od x. Liczbę c nazywamy częścią całkowitą liczby x i oznaczamy symbolem [x]. Na przykład [π] = 3, [ 12 ] = 0, [− 65 ] = −2. Na koniec odnotujmy własności wartości bezwględnej. Przypomnijmy, że wartość bezwględną liczby x (lub inaczej moduł liczby x), którą oznaczamy symbolem |x|, definiujemy wzorem: |x| = x, jeśli x > 0 . −x, jeśli x < 0 Najważniejsze własności wartości bezwzględnej zawarte są w następującym twierdzeniu: 4. WIELOMIANY 17 Twierdzenie 3.2. Dla dowolnych liczb rzeczywistych x, y oraz a > 0 zachodzą następujące wzory: (a) − |x| 6 x 6 |x| (b) |x| 6 a wtedy i tylko wtedy, gdy − a 6 x 6 a (c) |x + y| 6 |x| + |y| (d) |x| − |y| 6 |x − y| (e) |xy| = |x| · |y| Własności (a), (b) oraz (e) wynikają wprost z definicji. Zauważmy, że na mocy własności (a) mamy −|x| 6 x 6 |x| oraz − |y| 6 y 6 |y|. Dodając te nierówności stronami otrzymujemy −(|x| + |y|) 6 x + y 6 |x| + |y|. Zatem na mocy własności (b) mamy |x + y| 6 |x| + |y|. Dysponując już własnością (c) możemy napisać, że |x| = |(x − y) + y| 6 |x − y| + |x| skąd |x| − |y| 6 |x − y|. 4. Wielomiany Omówimy wpierw w skrócie niektóre własności arytmetyczne liczb całkowitych, a więc własności związane z podzielnością. Mówimy, że liczba całkowita a jest podzielna przez liczbę całkowitą b, albo, że liczba b dzieli a (bez reszty), gdy a jest wielokrotnością liczby b, tzn. gdy istnieje taka liczba całkowita c, że a = bc. Fakt, że b dzieli a zapisujemy symbolicznie w następujący sposób: b|a. Z prawa łączności wynika, że jeśli b|a oraz b|c, to także b|a + c. Liczba 1 dzieli każdą liczbę naturalną, a z drugiej strony, jeśli liczba b dzieli a, to nie może być od niej większa. Zatem dla dowolnych dwóch liczb, powiedzmy a oraz b, istnieje największa liczba, która dzieli obydwie. Oznaczamy ją symbolem NWD(a, b) i nazywamy największym wspólnym dzielnikiem liczb a i b. Jeśli NWD(a, b) = 1, to mówimy, że a i b są względnie pierwsze. Na przykład liczby 4 i 9 są względnie pierwsze, a liczby 6 i 9 nie są. Tak więc licznik i mianownik w ułamku nieskracalnym są liczbami względnie pierwszymi. Dla liczb względnie pierwszych zachodzi następujące ważne twierdzenie: 18 I. STRUKTURY LICZBOWE Twierdzenie 4.1. Dla dowolnych liczb całkowitych dodatnich a i b istnieją takie liczby całkowite x i y, że NWD(a, b) = ax + by. W szczególności, jeśli liczby całkowite dodatnie a i b są względnie pierwsze, to istnieją takie liczby całkowite x i y, że ax + by = 1. Aby to twierdzenie uzasadnić rozważmy zbiór S = {ax + by : ax + by > 0 oraz x, y ∈ Z}. Na mocy Zasady Minimum istnieje d = min S. Istnieją wówczas liczby x0 , y0 ∈ Z takie, że d = ax0 + by0 . Pozostaje wykazać, że d = NWD(a, b). Zaważmy wpierw, że d|a. Istotnie, gdyby reszta z dzielenia a przez d była dodatnia, tzn. gdyby dla pewnego z ∈ N oraz 0 < r < d zachodziła równość a = zd + r to mieli byśmy r = a − zd = a − azx0 − by0 = a(1 − zx0 ) + b(−y0 ) ∈ S, co daje sprzeczność z określeniem elementu d jako najmniejszego elementu w zbiorze S. Podobni dowodzi się, że d|b. Zatem d ¬ NWD(a, b). Jeśli zaś przyjmiemy, że NWD(a, b) = d0 , to d0 |a oraz d0 |b, czyli istnieją takie liczby x, y ∈ N, że a = xd0 oraz b = yd0 . Mamy wówczas d = ax0 + by0 = xd0 x0 + yd0 y0 = d0 (xx0 + yy0 ), co w szczególności oznacza, że d ­ d0 . Mamy więc równość d = d0 , co kończy dowód. Teraz już łatwo otrzymujemy następujące twierdzenie: Twierdzenie 4.2 (Zasadnicze Twierdzenie Arytmetyki). Jeśli liczby a i b są względnie pierwsze oraz a dzieli iloczyn bc, to a dzieli c. Istotnie, skoro NWD(a, b) = 1, to z twierdzenia 4.1 wynika, że ax + by = 1 dla pewnych liczb x, y ∈ N, a więc c = acx + bcy. Skoro zaś a|acx oraz a|bcy, to a|c. Metodą indukcji matematycznej twierdzenie to można nieco uogólnić: Wniosek 4.1. Jeśli liczby a oraz b są względnie pierwsze oraz n jest liczbą naturalną, to a|bn c pociąga a|c. 4. WIELOMIANY 19 Istotnie, jeśli a|bn+1 c, to a|b(bn c). Zatem a|bn c, a więc na mocy założenia indukcyjnego, a|c. Przypomnijmy, że liczbę naturalną n > 1 nazywamy liczbą pierwszą, jeśli jedynymi liczbami naturalnymi przez które daje się ona podzielić jest 1 i ona sama. Najmniejszą liczbą pierwszą jest oczywiście 2. Jest to jedyna liczba pierwsza wśród liczb parzystych, ale oczywiście nie każda liczba nieparzysta jest liczbą pierwszą. Przykładem jest 9. Zauważmy także, że każde dwie różne liczby pierwsze są względnie pierwsze. Okazuje się, że każda liczba naturalna większa od 1 jest iloczynem pewnej ilości liczb pierwszych, tzn. zachodzi twierdzenie: Twierdzenie 4.3. Jeśli liczba naturalna a > 1 nie jest liczbą pierwszą, to istnieje liczba naturalna k oraz liczby pierwsze p1 , p2 , . . . , pk takie, że a = p1 · p2 · · · · · pk . Istotnie, gdyby to twierdzenie nie było prawdziwe, to zgodnie z Zasadą Minimum, istniałaby najmniejsza liczba naturalna a0 > 1, która nie jest liczbą pierwszą, a mimo to nie jest iloczynem liczb pierwszych. Wówczas jednak a0 = b · c, przy czym 1 < b < a0 , 1 < c < a0 . Wobec tego każda spośród liczb b jak i c jest liczbą pierwszą lub jest iloczynami liczb pierwszych. W konsekwencji również a0 jest iloczynem liczb pierwszych. To daje sprzeczność. Z tego twierdzenia wynika w szczególności, że liczb pierwszych jest nieskończenie wiele. Mówi o tym następujące twierdzenie, które wykorzystamy później. Twierdzenie 4.4. Dla każdej liczby naturalnej istnieje liczba pierwsza od niej większa. Przypuśćmy, że tak nie jest. Wówczas zbiór P wszystkich liczb pierwszych jest skończony i możemy zapisać go w postaci P = {p1 , p2 , . . . , pn }. Z poprzedniego twierdzenia wynika, że liczba p = p1 · p2 · · · · · pn + 1 jest także pierwsza. Istotnie w przeciwnym wypadku mamy p = q1 · q2 · · · · · qk , przy czym qi ∈ P dla każdego i = 1, 2, . . . , k. W szczególności qi |p dla każdego i = 1, 2, . . . , k. Zatem każda z liczb qi dzieli różnicę p − p1 · p2 · · · · · pn = 1, co nie jest możliwe. To dowodzi, że p jest liczbą pierwszą. Z drugiej strony p jest większe od każdej liczby ze zbioru P , co daje sprzeczność. Przypomnijmy, że wielomianem o współczynnikach rzeczywistych nazywamy wyrażenie a0 + a1 x + · · · + an xn , 20 I. STRUKTURY LICZBOWE gdzie a0 , a1 , . . . , an są liczbami rzeczywistymi, a an 6= 0. Liczbę n nazywamy stopniem tego wielomianu. Przy rozważaniu wielomianów pojawia się naturalny problem znajdywania jego pierwiastków, tzn. takich liczb x ∈ R, że w(x) = 0, gdzie w(x) jest wielomianem. Dla wielomianów stopnia większego od 2 nie zawsze jest to zadanie proste. Okazuje się, że dla wielomianów stopnia większego od 4 nie istnieją ogólne wzory pozwalające obliczyć pierwiastki wielomianu. Oznacza to, że istnieją wielomiany stopnia 5 (takim wielomianem jest na przykład wielomian w(x) = x5 − 4x − 2), których pierwiastki nie dadzą się wyrazić przy pomocy (nawet wielokrotnie powtarzanych) działań arytmetycznych i operacji wyciągania pierwiastków. Istnieje jednak nietrudne kryterium pozwalające sprawdzić czy wielomian o współczynnikach całkowitych ma pierwiastki wymierne. Brzmi ono następująco: Twierdzenie 4.5 (O pierwiastkach wymiernych). Jeśli współczynniki wielomianu w(x) = a0 + a1 x + · · · + an xn są liczbami całkowitymi oraz liczba wymierna pq będąca ułamkiem nieskracalnym jest pierwiastkiem tego wielomianu, to wyraz wolny (czyli a0 ) jest podzielny przez p, a współczynnik przy największej potędze (czyli an ) jest podzielny przez q. W szczególności z tego kryterium wynika, że jeśli an = 1, to każdy pierwiastek wymierny jest od razu liczbą całkowitą. Aby przekonać się, że twierdzenie jest prawdziwe załóżmy, że w( pq ) = 0. Mamy wówczas po wymnożeniu przez q n następującą równość: an pn + an−1 pn−1 q + · · · + a1 pq n−1 + a0 q n = 0. Skoro liczby p i q są względnie pierwsze oraz każdy składnik sumy poza pierwszym zawierają jako czynnik liczbę q (czyli dzielą się przez q), to także an pn jest podzielne przez q. Stąd na mocy wniosku 4.1, q dzieli an . Analogicznie, skoro wszystkie składniki sumy poza być może ostatnim dzielą się przez p, to także a0 q n dzieli się przez p, a więc na mocy tego samego wniosku, a0 jest podzielne przez p. Wnioskiem z przytoczonego wyżej kryterium jest to, że dla każdej liczby naturalnej m pierwiastek n-tego stopnia z m jest albo liczbą naturalną albo jest liczbą niewymierną. Istotnie, rozważmy wielomian f (x) = xn − m. √ √ Oczywiście x = n m jest pierwiastkiem tego wielomianu. Jeśli n m = pq , gdzie p i q są naturalne i względnie pierwsze, to zgodnie z powyższym kryterium q = √ 1, skąd n p − m = 0 czyli m jest n-tą potęgą liczby p. Tak więc na przykład liczba 3 4 jest niewymierna. Wzór z przykładu 2.2 jest szczególnym przypadkiem wzoru występującego w następnym przykładzie. Wystarczy w nim przyjąć x = 1 oraz a = q. 4. WIELOMIANY 21 Przykład 4.1. Jeśli x oraz a są dowolnymi liczbami rzeczywistymi oraz x 6= a, to dla dowolnej liczby naturalnej n zachodzi równość: xn+1 − an+1 (11) xn + xn−1 a + xn−2 a2 + · · · + xan−1 + an = . x−a Zauważmy, że w kolejnych składnikach sumy po lewej stronie znaku równości wykładnik potęgi przy x maleje o 1, zaś wykładnik przy a rośnie o 1. Dowód tego wzoru przeprowadzimy indukcyjnie (tzn. w oparciu o twierdzenie 2.2) przyjmując, że własność W(n) mówi, że wzór (3) zachodzi dla liczby naturalnej n. Wtedy W(1) oznacza oczywistą równość x 2 − a2 . x−a Jeśli zachodzi W(n), to aby sprawdzić W(n + 1) pomnożymy równość (11) obustronnie przez a, a następnie dodamy, do obydwu stron xn+1 . Mamy wówczas x+a= xn+1 + xn a + · · · + xan + an+1 = xn+1 − an+1 xn+1 (x − a) + a(xn+1 − an+1 ) xn+2 − an+2 = = . x−a x−a x−a Wnioskiem ze wzoru (11) jest ważne kryterium podzielności wielomianów: = xn+1 + a Twierdzenie 4.6 (Kryterium Bezoult’a). Wielomian w(x) = a0 + a1 x + · · · + an−1 xn−1 + an xn jest podzielny bez reszty przez dwumian x − a wtedy i tylko wtedy, gdy a jest pierwiastkiem wielomianu w(x), tzn. w(a) = 0. Istotnie, jeśli w(a) = 0, to w(x) = w(x) − w(a) = = (a0 + a1 x + · · · + an−1 xn−1 + an xn ) − (a0 + a1 a + · · · + an−1 an−1 + an an ) = = a1 (x − a) + · · · + an−1 (xn−1 − an−1 ) + an (xn − an ). Z kolei, na mocy wzoru (3), każde z wyrażeń xk −ak dla k = 1, 2, . . . , n daje się podzielić bez reszty przez x − a. Zatem także i w(x) daje się podzielić bez reszty przez x − a. Druga część równoważności w Kryterium Bezoult’a jest oczywista, bo jeśli w(x) dzieli się bez reszty przez x − a, to istnieje taki wielomian q(x), że w(x) = q(x)(x − a). Wówczas w(a) = 0. Zauważmy, że skoro w wyniku dzielenia przez x − a stopień wielomianu zmniejsza się o 1, to wielomian stopnia n ma co najwyżej n pierwiastków. Kryterium Bezoult’a w połączeniu z twierdzeniem 4.5 o znajdywaniu pierwiastków wymiernych wielomianów o współczynnikach całkowitych daje praktyczną możliwość przedstawiania niektórych wielomianów w postaci iloczynów jednomianów i wielomianów nierozkładalnych stopnia drugiego. Zobaczymy to na następującym przykładzie: 22 I. STRUKTURY LICZBOWE Przykład 4.2. Rozważmy wielomian w(x) = x3 + 6x2 + 11x + 6 i zauważmy, że na mocy twierdzenia 4.5 jedynymi pierwiastkami wymiernymi mogą być liczby całkowite ze zbioru {1, 2, 3, −1, −2, −3}. Istotnie, jeśli liczba wymierna jest p Z Kryterium Bezoult’a wiąże się jeszcze inny przykład na to, że sprawdzenie wzoru w nawet bardzo wielu przypadkach nie musi oznaczać jego ogólnej prawdziwości, tzn. prawdziwości dla wszystkich liczb naturalnych. Okazuje się, że rozkładając wielomian xn − 1 na czynniki nierozkładalne o współczynnikach całkowitych (tzn. na takie, które już dalej nie dają się rozłożyć) otrzymujemy często wielomiany o współczynnikach równych 0, 1 oraz −1. Tak więc na przykład x2 − 1 = (x − 1)(x + 1) x3 − 1 = (x − 1)(x2 + x + 1) x4 − 1 = (x − 1)(x + 1)(x2 + 1) x5 − 1 = (x − 1)(x4 + x3 + x2 + x + 1) x6 − 1 = (x − 1)(x + 1)(x2 + x + 1)(x2 − x + 1). Okazuje się jednak, że ta zasada nie jest ogólnie prawdziwa: jeden z elementów rozkładu wielomianu x105 − 1 ma współczynniki równe −2. 5. Liczby zespolone W elementarnym kursie algebry rozważane są równania kwadratowe postaci ax2 + bx + c = 0. Łatwe sprawdzenie pokazuje, że rozwiązania takiego równania są postaci: √ √ −b + ∆ −b − ∆ x1 = oraz x2 = , 2a 2a o ile wyróżnik ∆ = b2 − 4ac jest liczbą nieujemną. Jeśli ∆ < 0, to powyższe równanie nie ma pierwiastków rzeczywistych. Najprostsze takie równanie, to równanie postaci x2 + 1 = 0. Okazuje się, że można zbudować obiekt matematyczny szerszy od zbioru liczb rzeczywistych, w którym dowolne równania kwadratowe mają zawsze pierwiastki. Obiekt ten, to zbiór liczb zespolonych, a konstrukcja tego zbioru jest następująca. Przyjmujemy, że rozwiązaniem powyżej wspomnianego równania x2 + 1 = 0 jest liczba, którą oznaczamy symbolem i. Tak więc i2 = −1. Z uwagi na ostatnią równość, liczbę i przyjęto nazywać jednostką urojoną. Dysponując już jednostką urojoną i tworzymy formalne sumy postaci (12) z = a + bi, 5. LICZBY ZESPOLONE 23 gdzie a, b są liczbami rzeczywistymi. Zbiór wszystkich sum postaci (12) tworzy to co nazywamy zbiorem liczb zespolonych, który oznaczać będziemy symbolem C. Liczbę rzeczywistą a nazywamy częścią rzeczywistą liczby zespolonej z, a liczbę rzeczywistą b częścią urojoną liczby zespolonej z. Części te oznaczamy odpowiednio symbolami re(z) oraz im(z). Tak więc, jeśli z = a + bi, to re(z) = a oraz im(z) = b. Jeśli b = 0, czyli, jeśli część urojona liczby zespolonej z jest równa 0, to z = a, czyli liczba zespolona staje się wtedy liczbą rzeczywistą. Tak więc zbiór liczb zespolonych jest obiektem większym niż zbiór liczb rzeczywistych. Tym bardziej, że podstawowe działania na liczbach zespolonych definiujemy tak samo jak działania na wyrażeniach algebraicznych, pamiętając wszakże, że i2 = −1. Mamy zatem: (a + bi) + (c + di) = (a + c) + (b + d)i, (a + bi)(c + di) = ac + adi + bci + bdi2 = (ac − bd) + (ad + bc)i. Z przyjętych powyżej definicji sumy i iloczynu liczb zespolonych wynika, że liczba 0 jest elementem neutralnym dodawania liczb zespolonych, a liczba 1 elementem neutralnym mnożenia tych liczb. Zauważmy jeszcze, że liczba przeciwna do liczby zespolonej niezerowej z = a + bi ma postać −z = −a − bi, i jak nietrudno sprawdzić liczba odwrotna z −1 do liczby zespolonej z = a + bi, tj. taka liczba, że zz −1 = z −1 z = 1 ma postać a −b + 2 i. z −1 = 2 2 a +b a + b2 Oczywiście liczba odwrotna do liczby z = 0 + 0i nie istnieje. Przykład 5.1. Liczba odwrotna do liczby z =1+i ma postać (1 + i)−1 = 1 1 − i. 2 2 Istotnie, w tym przypadku mamy a = b = 1. Przedstawiony powyżej opis liczb zespolonych, nie jest jedyny. Jest to tak zwana postać algebraiczna liczby zespolonej z = a + bi. Pokażemy teraz jak można liczby zespolone interpretować geometrycznie. Z uwagi na to, że dowolna liczba zespolona z zapisana w postaci algebraicznej, to liczba a + bi, możemy ją umieścić w prostokątnym układzie współrzędnych jako punkt o odciętej równej a i rzędnej równej b. Na odwrót, każdy punkt na płaszczyźnie opisany parą swoich współrzędnych (a, b) można utożsamić z liczbą zespoloną a + bi. Zatem płaszczyzna może być interpretowana jako zbiór liczb zespolonych. Nazywamy ją wtedy płaszczyzną zespoloną lub płaszczyzną Gaussa. Zauważmy, że naturalny układ współrzędnych prostokątnych tej płaszczyzny, to układ wyznaczony przez prostą złożoną z wszystkich punktów postaci (a, 0), gdzie a ∈ R oraz prostą złożoną z punktów postaci (0, b), gdzie b ∈ R. Pierwsza z tych osi odpowiada dokładnie zbiorowi liczb rzeczywistych, dlatego 24 I. STRUKTURY LICZBOWE nazywana jest osią rzeczywistą, a druga oś odpowiada zbiorowi tzw. liczb zespolonych czysto urojonych tj. liczb postaci bi, i dlatego nazywana jest osią urojoną. Umieszczenie liczb zespolonych na płaszczyźnie prowadzi w naturalny sposób do kolejnych pojęć. Pierwsze z nich to pojęcie modułu, znanego już w odniesieniu do liczb rzeczywistych. Jeśli z = a + bi, to modułem liczby zespolonej z nazywamy liczbę rzeczywistą |z| określoną wzorem: √ |z| = a2 + b2 . Zauważmy, że jeśli liczba zespolona z jest liczbą rzeczywistą a, to √ √ |z| = a2 + 0 = a2 = |a|, a więc w tym przypadku moduł liczby zespolonej pokrywa się z wartością bezwzględną liczby rzeczywistej a czyli z modułem liczby a. Moduł liczby zespolonej ma prostą interpretację geometryczną: jest odległością tej liczby od liczby 0, co w oczywisty sposób wynika z twierdzenia Pitagorasa. Rozważmy sytuację bardziej szczegółowo. Niech z = a + bi 6= 0, a r niech będzie odcinkiem na płaszczyźnie zespolonej łączącym 0 z liczbą z. Odcinek r – długości |z| – tworzy z osią rzeczywistą pewien kąt α ∈ [0, 2π). Z elementarnej trygonometrii wiadomo, że b a sin α = oraz cos α = . |z| |z| Zatem z = |z|(cos α + i sin α). Powyższa postać liczby zespolonej nosi nazwę postaci geometrycznej lub postaci trygonometrycznej. Kąt α nazywamy wówczas argumentem głównym liczby zespolonej z, który oznaczamy symbolem arg(z). Tak więc z = |z|(cos(arg z) + i sin(arg(z)). Z uwagi na to, że cos(α + 2kπ) = cos α oraz sin(α + 2kπ) = sin α, gdzie k ∈ Z, dla dowolnego k ∈ Z mamy z = |z|(cos(arg(z) + 2kπ) + i sin(arg(z) + 2kπ)). Element arg(z) + 2kπ, gdzie k ∈ Z, nazywamy ogólnie argumentem liczby zespolonej z. Jeśli k = 0, to taki argument jest argumentem głównym liczby zespolonej z. √ Przykład 5.2. Jeśli z = 1 + i, to arg(z) = π4 . Istotnie, |z| = 2 oraz sin π 1 π = cos = √ 4 4 2. Postać geometryczna liczby zespolonej jest szczególnie dogodna, w przypadku potęgowania liczb zespolonych, a także ich pierwiastkowania. Korzystając ze wzorów trygonometrycznych na sinus i cosinus sumy, a więc wzoru sin(α + β) = sin α cos β + sin β cos α 5. LICZBY ZESPOLONE 25 oraz ze wzoru cos(α + β) = cos α cos β − sin α sin β łatwo sprawdzić, że (13) z1 · z2 = |z1 | · |z2 |(cos(α + β) + i sin(α + β)), jeśli z1 = |z1 |(cos α + i sin α), z2 = |z2 |(cos β + i sin β). Z ostatniego wzoru wynika w szczególności, że 1 z −1 = (cos(−α) + i sin(−α)), |z| jeśli z 6= 0 jest postaci z = |z|(cos α + i sin α . Tak więc iloraz dwóch liczb zespolonych z1 i z2 postaci takiej jak powyżej wyrazić można wzorem: |z1 | z1 = (cos(α − β) + i sin(α − β)) z2 |z2 | przy założeniu, że z2 6= 0. Stosując wzór (13) i zasadę indukcji matematycznej otrzymujemy tzw. wzór de Moivre’a na potęgę liczby zespolonej z = |z|(cos α + i sin α): z n = |z|n (cos(nα) + i sin(nα)). Przykład 5.3. Jeśli z = − 12 + sin 23 π = − 12 oraz cos 23 π = √ 3 . 2 √ 3 i 2 to |z| = q 1 4 + 3 4 = 1, a więc arg(z) = 23 π bo Zatem 2 34 34 2 z 17 = (cos π + i sin π)17 = cos π + i sin π = 3 3 3 3 √ 4 4 4 4 1 3 = cos(10π + π) + i sin(10π + π) = cos π + i sin π = − − i 3 3 3 3 2 2 Operacją odwrotną do potęgowania jest pierwiastkowanie, rozumiane w tym sensie, że jeśli n ∈ N oraz z n = w, to liczbę z nazywamy pierwiastkiem stopnia n z liczby w, co zapisujemy następująco: √ z = n w. Dla liczby zespolonej z 6= 0 pierwiastek stopnia n ­ 2 nie jest określony jednoznacznie. Rozumiemy go jako zbiór wszystkich liczb zespolonych postaci (14) q n ! α + 2kπ α + 2kπ |z| cos + i sin , n n q gdzie z = |z|(cos α + i sin α) oraz k = 0, . . . , n − 1. Pierwiastek n |z| w ostatnim wzorze rozumiemy jako pierwiastek arytmetyczny stopnia n z liczby rzeczywistej |z|. Wzór (14) wynika natychmiast ze wzoru de Moivre’a. Przykład 5.4. Jeśli z = 1 = cos 0 + i sin 0, to pierwiastki n-tego stopnia z z mają postać 2kπ 2kπ (15) k = cos + i sin , n n 26 I. STRUKTURY LICZBOWE gdzie k√= 0, . . . , n − 1. W szczególności dla n = 3 mamy 0 = 1, 1 = cos 2π + i sin 2π = 3 3 √ 4π 4π 1 3 3 1 − 2 + i 2 oraz 2 = cos 3 + i sin 3 = − 2 − i 2 . Na liczbach zespolonych możemy wykonać pewną prostą operację, która nie ma odpowiednika w zbiorze liczb rzeczywistych. Otóż, jeśli z = a + bi, to liczbę zespoloną z = a − bi nazywamy liczbą sprzężoną z liczbą zespoloną z. Geometrycznie operacja sprzężenia na płaszczyźnie zespolonej oznacza symetrię względem osi rzeczywistej. Tak więc z = z dla dowolnej liczby zespolonej z oraz a = a, jeśli a ∈ R. Ponadto dla dowolnych liczb zespolonych z1 , z2 prawdziwe są następujące wzory: z1 z1 z1 ± z2 = z1 ± z2 , z1 · z2 = z1 · z2 , = , z2 z2 przy czym w ostatnim wzorze zakładamy, że z2 6= 0. Zauważmy, że podobnie jak w zbiorze liczb rzeczywistych, w zbiorze liczb zespolonych można także rozważać wielomiany. Jak już wspomniano wyżej, liczby zespolone pozwalają rozwiązywać równania, które w zakresie liczb rzeczywistych nie mają rozwiązania, takie jak na przykład równanie x2 +1 = 0. Prawdziwe jest jednak twierdzenie znacznie ogólniejsze: Twierdzenie 5.1 (Zasadnicze Twierdzenie Algebry). Każdy wielomian stopnia n, o współczynnikach rzeczywistych lub zespolonych, ma dokładnie n pierwiastków zespolonych. Z wymienionych powyżej własności operacji sprzężenia wynika, że jeśli wielomian o współczynnikach rzeczywistych ma pierwiastek równy z, to także liczba z jest pierwiastkiem tego wielomianu. Stąd wynika, że jeśli wielomian o współczynnikach rzeczywistych jest stopnia nieparzystego, to musi mieć pierwiastek rzeczywisty bo dla któregoś z pierwiastków musi zachodzić równość z = z gdyż jest ich nieparzysta ilość. 6. Grupy, ciała, przestrzenie liniowe Jak nietrudno zauważyć operacje w omawianych wyżej zbiorach liczb naturalnych, całkowitych, wymiernych, rzeczywistych i zespolonych, mają pewne wspólne własności. Dla przykładu, działanie dodawania w każdym z wymienionych powyżej zbiorze jest operacją łączną, tzn. dla dowolnych x, y, z zachodzi rowność x + (y + z) = (x + y) + z. Ponad to dodawanie w tych zbiorach jest przemienne tzn. x + y = y + x. Analogiczne własności ma mnożenie liczb. Następną wspólną własnością tych działań jest to, że istnieje dla nich element neutralny. Liczba 0 jest elementem neutralnym dodawania: x + 0 = 0 + x = x, a 1 elementem neutralnym mnożenia x · 1 = 1 · x = x. Jednak z przyjętej przez nas powyżej definicji zbioru liczb naturalnych N = {1, 2, 3, . . . } wynika, że dodawanie w zbiorze liczb naturalnych nie ma elementu neutralnego. Zauważmy 6. GRUPY, CIAŁA, PRZESTRZENIE LINIOWE 27 jeszcze, że dodawanie we wszystkich zbiorach liczbowych z wyjątkiem zbioru liczb naturalnych, ma taką własność, że dla dowolnego elementu x istnieje element przeciwny, tj. taki element y, że x + y = y + x = 0. Analogiczną własność ma mnożenie, ale dopiero w zbiorze liczb wymiernych bez elementu 0: dla każdego x istnieje taki y, że x · y = y · x = 1. Uzasadnia to potrzebę wprowadzenia następującej definicji: Definicja 6.1. Grupą nazywamy każdy zbiór G z wyróżnionym elementem e, w którym określone jest działanie dwuargumentowe „•”, tzn. każdym dwóm elementom x, y ∈ G przyporządkowany jest element z G, który oznaczamy symbolem x • y, w taki sposób, że spełnione są następujące warunki: (1) x • (y • z) = (x • y) • z dla dowolnych x, y, z ∈ G, (2) x • e = e • x = x dla każdego x ∈ G, (3) dla każdego x ∈ G istnieje taki element y ∈ G, że x • y = y • x = e. Jeśli ponadto spełniony jest warunek (4) x • y = y • x dla dowolnych x, y ∈ G to taką grupę nazywamy przemienną (lub abelową). Przykład 6.1. (a) Zbiór liczb całkowitych Z z działaniem dodawania i elementem neutralnym 0 jest grupą przemienną. Podobnie zbiór liczb wymiernych Q, zbiór liczb rzeczywistych R, zbiór liczb zespolonych C, z dodawaniem i wyróżnionym elementem 0 jest grupą przemienną. (b) Zbiór liczb całkowitych Z z działaniem mnożenia nie jest grupą, gdyż dla liczby k ∈ Z, różnej od 1 oraz −1 nie istnieje liczba całkowita l taka, że k · l = 1. (c) Zbiór liczb wymiernych niezerowych Q \ {0} z mnożeniem oraz wyróżnionym elementem 1 jest grupą przemienną. Podobnie zbiór liczb rzeczywistych niezerowych. (d) Rozważmy zbiór Izom złożony ze wszystkich izometrii płaszczyzny. Niech id oznacza izometrię trywialną, tj. taką, że id(x) = x dla każdego punktu x płaszczyzny. Niech „◦” oznacza działanie złożenia w zbiorze Izom. Jest to istotnie działanie w tym zbiorze, gdyż złożenie dwóch izometrii płaszczyzny jest izometrią płaszczyzny. Z elementarnego kursu geometrii wiadomo, że zbiór Izom wraz z działaniem ◦ i z elementem neutralnym id jest grupą. Wiadomo również, że nie jest to grupa przemienna. (e) Rozważmy zbiór Perm(n) wszystkich funkcji różnowartościowych zbioru nelementowego {1, 2, . . . , n} z działaniem składania funkcji. Każdą taką funkcje możemy utożsamić z permutacją zbioru {1, 2, . . . , n}. Istotnie, jeśli f : {1, 2, . . . , n} → {1, 2, . . . , n}, to możemy taką funkcję jednoznacznie opisać jako permutację (f (1), f (2), . . . , f (n)). Składanie funkcji jest wtedy tożsame ze składaniem permutacji. Grupa ta, jak nietrudno zauważyć, nie jest przemienna. Wiemy także, że ma ona n! elementów. Podamy teraz przykłady pewnych grup bliskie grupom liczbowym. Ustalmy liczbę naturalną n ­ 2 i rozpatrzmy zbiór Zn = {0, 1, . . . , n − 1}. 28 I. STRUKTURY LICZBOWE Zdefiniujemy działanie w tym zbiorze w następujący sposób. Jeśli k, l ∈ Zn , to jak wynika z twierdzenia o dzieleniu z resztą, istnieje dokładnie jedna taka liczba r ∈ {0, . . . , n − 1}, że k + l = q · n + r, gdzie q ∈ N ∪ {0}, tj. r jest resztą z dzielenia liczby k + l przez n. Możemy zatem wprowadzić w zbiorze Zn działanie ⊕ w następujący sposób: k ⊕ l = r. Podobnie, jeśli k, l ∈ Zn , to niech k l będzie resztą z dzielenia liczby k · l przez n, czyli k l = r, jeśli k · l = p · n + r, gdzie p ∈ N ∪ {0}. Zauważmy, że 0 jest elementem neutralnym działania ⊕, a 1 elementem neutralnym działania w zbiorze Zn . Zarówno ⊕ jak i jest oczywiście operacją przemienną. Pewnego wysiłku wymaga sprawdzenie, że obie te operacje są łączne. Zauważmy jeszcze, że jeśli k ∈ Zn , k 6= 0, to n − k ∈ Zn oraz k ⊕ (n − k) = 0. Tak więc Zn z działaniem ⊕ i z elementem neutralnym 0 jest grupą przemienną. Pewien kłopot sprawia działanie w kwestii istnienia elementu odwrotnego. Zauważmy, że jeśli n = 4, to: 2 0 = 0, 2 1 = 2, 2 2 = 0, 2 3 = 2. Tak więc element 2 ∈ Z4 nie ma w Z4 elementu odwrotnego, tj. takiego, że 2 k = 1, gdyż Z4 = {0, 1, 2, 3}. Oczywiście 0 też nie ma elementu odwrotnego, ale na to możemy przystać, bo tak jest także w znanych nam zbiorach liczbowych. Oczywiście elementem odwrotnym do 1 jest 1, a odwrotnym do 3 jest też 3, gdyż 3 3 = 1. Sprawę istnienia elementów odwrotnych w zbiorze Zn względem działania wyjaśnia następująca własność: k ∈ Zn \{0} ma element odwrotny w Zn wtedy i tylko wtedy, gdy NWD(k, n) = 1, tj. dokładnie wtedy, gdy liczby k oraz n są względnie pierwsze. Zatem, jeśli n jest liczbą pierwszą, to zbiór Zn \ {0} z działaniem i elementem neutralnym 1, jest grupą przemienną. Dla przykładu, jeśli n = 5, to 2 3 = 1, i elementem odwrotnym do 2 jest 3. Definicja 6.2. Załóżmy, że K jest zbiorem, w którym określone są dwa działania oznaczane symbolem „+” oraz „·”, a ponadto istnieją dwa różne elementy 0, 1 ∈ K i spełnione są następujące warunki: (1) K z działaniem + i wyróżnionym elementem 0 jest grupą przemienną; (2) K \ {0} z działaniem · i wyróżnionym elementem 1 jest grupą przemienną; 6. GRUPY, CIAŁA, PRZESTRZENIE LINIOWE 29 (3) dla dowolnych x, y, z ∈ K zachodzi równość (x + y) · z = x · z + y · z. Wówczas mówimy, że K jest ciałem. Przykład 6.2. (a) Zbiór liczb rzeczywistych R ze zwykłymi działaniami dodawania i mnożenia liczb oraz z wyróżnionymi elementami 0 i 1 jest ciałem. Podobnie ciałem jest zbiór liczb wymiernych Q oraz zbiór liczb zespolonych C z naturalnymi działaniami oraz z elementami wyróżnionymi 0 i 1. (b) Zbiór Zn , o ile n jest liczbą pierwszą, z działaniami ⊕ i oraz z elementami wyróżnionymi 0 i 1 jest ciałem. Omówimy teraz jeszcze jedno pojęcie algebraiczne. Zanim je jednak formalnie zdefiniujemy odwołamy się do wiedzy czytelnika z zakresu elementarnej geometrii i fizyki. Pojęcie wektora jest jednym z podstawowych pojęć, jakim posługuje się właśnie geometria i fizyka. Każdy kto już zapoznał się z wektorami wie, że można je do siebie dodawać i mnożyć przez tak zwane „skalary”, czyli w istocie przez liczby. Wiadomo, że działanie dodawania wektorów wyznacza w zbiorze wektorów grupę. Istotnie, dodawanie wektorów jest działaniem łącznym, istnieje element neutralny dodawania wektorów(jest nim wektor zerowy), a także każdy wektor ma wektor niego przeciwny. Ponadto dodawanie wektorów jest działaniem przemiennym. Definicja 6.3. Załóżmy, że K jest ciałem, a V zbiorem z działaniem „+” i z wyróżnionym elementem 0. Załóżmy ponadto, że jest określona operacja, która elementowi elementowi α ∈ K i każdemu v ∈ V przyporządkowuje element αv. Jeśli spełnione są następujące warunki: (1) V z działaniem + i z elementem 0 jest grupą abelową, (2) α(v + w) = αv + αw dla każdego α ∈ K oraz v, w ∈ V , (3) (α + β)v = αv + βv dla α, β ∈ K oraz v ∈ V ; (4) (αβ)v = α(βv) dla α, β ∈ K oraz v ∈ V ; (5) 1v = v dla x ∈ X, to zbiór V nazywamy przestrzenią liniową lub przestrzenią wektorową nad ciałem K. Elementy przestrzeni liniowej nazywane są wektorami, a elementy ciała K skalarami. Zauważmy, że dodawanie wektorów oznaczamy tym samym znakiem +, którym oznaczane jest dodawanie elementów ciała K. Nie powinno to jednak prowadzić do nieporozumień, bo z kontekstu będzie zawsze jasne, o które działanie chodzi. Oczywiście nie może się pojawić napis postaci α + v, gdzie α ∈ K oraz v ∈ V, bo to nie miało by sensu. Umawiamy się także, że symbol mnożenia w ciele, oznaczany zwykle kropką, w celu uproszczenia zapisu pomijamy, tzn. zamiast α · β piszemy zwykle αβ. Elementu neutralnego w grupie V , czyli wektora zerowego 0 nie należy mylić ze skalarem 0, czyli z elementem neutralnym względem dodawania w ciele K. Zauważmy jednak, że zachodzi między nimi następująca ważna zależność: • α0 = 0 dla każdego α ∈ K, 30 I. STRUKTURY LICZBOWE • 0v = 0 dla każdego v ∈ V. Istotnie, skoro dla każdego v ∈ V zachodzi v = v + 0, to na mocy prawa rozdzielności (prawa (2) ) zachodzi równość αv = α(v + 0) = αv + α0, która po odjęciu αv, czyli po dodaniu do obydwu stron równości elementu przeciwnego do αv, daje pierwszą z równości. Podobnie, na mocy prawa rozdzielności (3) zachodzi równość αv = (α + 0)v = αv + 0v, która po odjęciu αv daje drugą z równości. Rozważmy następujące przykłady: Przykład 6.3. (a) Każdy punkt P przestrzeni 3-wymiarowej R3 możemy utożsamić z wektorem o początku w punkcie 0 = (0, 0, 0) i końcem w punkcie P . Jeśli punkt −→ P = (x1 , x2 , x3 ), to wektor 0P możemy zapisać jako tzw. wektor wierszowy: −→ 0P = [x1 , x2 , x3 ], lub wektor kolumnowy: x −→ 1 0P = x2 . x3 Wektor, którego wszystkie współrzędne są równe 0 nazywamy wektorem zerowym i oznaczamy symbolem 0. Zbiór wszystkich wektorów wierszowych wyznaczonych przez punkty przestrzeni R3 wraz z działaniami: [x1 , x2 , x3 ] + [y1 , y2 , y3 ] = [x1 + y1 , x2 + y2 , x3 + y3 ] oraz α[x1 , x2 , x3 ] = [αx1 , αx2 , αx3 ], gdzie α ∈ R oraz z wyróżnionym elementem 0 jest przestrzenią liniową nad ciałem R. To samo stwierdzenie dotyczy zbioru wektorów kolumnowych. (b) Uogólnieniem przestrzeni liniowej opisanej w punkcie (a) jest przestrzeń Rn , gdzie n ­ 1. Składa się ona z wektorów wierszowych [x1 , . . . , xn ] lub kolumnowych x1 . . . xn Działania na nich określamy w naturalny sposób: [x1 , . . . , xn ] + [y1 , . . . , yn ] = [x1 + y1 , . . . , xn + yn ], α[x1 , . . . , xn ] = [αx1 , . . . , αxn ], gdzie α jest dowolną liczbą rzeczywistą. Wektorem zerowym 0 jest wektor 0 = [0, . . . , 0]. 6. GRUPY, CIAŁA, PRZESTRZENIE LINIOWE 31 Analogicznie definiujemy działania i wektor zerowy, gdy rozpatrujemy Rn jako przestrzeń złożoną z wektorów kolumnowych. Jest rzeczą oczywistą, że zastępując ciało R liczb rzeczywistych innym ciałem K, na przykład ciałem liczb zespolonych lub jakimkolwiek innym, otrzymujemy przestrzeń liniową Kn nad ciałem K. Zauważmy w szczególności, że gdy n = 1, przestrzeń Kn , czyli po prostu ciało K jest przestrzenią liniową nad K. Następne przykłady przestrzeni liniowych mają nieco inną naturę. Przykład 6.4. (a) Rozważmy zbiór R[x] złożony ze wszystkich wielomianów o współczynnikach rzeczywistych. Dodawanie wielomianów definiujemy w następujący sposób. Załóżmy, że stopień wielomianu w1 jest równy n, a wielomianu w2 wynosi m. Wówczas w1 = a0 + a1 x + · · · + an xn oraz w2 = b0 + b1 x + · · · + bm xm , gdzie an 6= 0 6= bm . Załóżmy, że k = max{n, m}. Wówczas w1 + w2 = (a0 + b0 ) + (a1 + b1 )x + · · · + (ak + bk )xk , gdzie dla min n, m < i ¬ k przyjmujemy za ai lub bi wartość 0, w zależności od tego czy n < k, czy m < k. Mnożenie przez skalar α ∈ R określamy w naturalny sposób: αw = αa0 + (αa1 )x + · · · + (αan )xn , jeśli w = a0 + a1 x + · · · + an xn . Przyjmujemy za 0 wielomian zerowy. W ten sposób R[x] staje się przestrzenią liniową nad ciałem R. (b) Uogólnieniem (w pewnym sensie) przestrzeni opisanej w punkcie (a) jest przestrzeń C(R) złożona ze wszystkich funkcji ciągłych f : R → R. Działania dodawania i mnożenia przez skalar określamy następująco: (f + g)(x) = f (x) + g(x), (αf )(x) = αf (x). Wektorem zerowym w tej przestrzeni jest funkcja stała, która każdemu x ∈ R przypisuje liczbę 0. Zbiór liczb rzeczywistych R możemy zastąpić dowolnym podzbiorem A ⊆ R otrzymując przestrzeń liniową C(A). Definicja 6.4. Kombinacją liniową wektorów v1 , . . . , vn nazywamy wektor v postaci v = α1 v 1 + · · · + αn v n , gdzie α1 , . . . , αn ∈ K. Definicja 6.5. Zbiór wektorów A w przestrzeni liniowej V nazywamy liniowo zależnymi, jeśli istnieją elementy α1 , . . . , αn ciała K, nie wszystkie równe 0 oraz taki układ wektorów v1 , . . . , vn ∈ A, że α1 v1 + · · · + αn vn = 0. Jeśli zbiór wektorów A nie jest liniowo zależny, to mówimy, że jest liniowo niezależny. 32 I. STRUKTURY LICZBOWE Przykład 6.5. Wektory [1, 1, 1, 1], [2, 0, 0, 1], [0, 0, 1, 0] w przestrzeni R4 są liniowo niezależne, natomiast wektory [1, 1, 2, 3], [1, 1, 0, 0], [8, 8, 10, 15] są liniowo zależne, gdyż 5[1, 1, 2, 3] + 3[1, 1, 0, 0] + (−1)[8, 8, 10, 15] = [0, 0, 0, 0]. Jeśli A ⊆ X jest takim zbiorem liniowo niezależnym, że każdy wektor z przestrzeni X jest kombinacją liniową pewnych elementów ze zbioru A, to zbiór A nazywamy bazą przestrzeni liniowej X. Przykład 6.6. Zauważmy, że zbiór wektorów {[1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0], [0, 0, 0, 1]} jest bazą przestrzeni R4 . Nietrudno sprawdzić, że bazą przestrzeni R4 jest również zbiór {[1, 4, 3, 4], [1, 5, 2, 3], [1, 5, 2, 2], [0, 2, −1, −1]}. Pierwsza z baz, z uwagi na swoją prostotę, zwana jest bazą kanoniczną przestrzeni R4 . Ogólnie bazą kanoniczną przestrzeni Kn nazywamy zbiór {e1 , e2 , . . . , en }, gdzie e1 = [1, 0, . . . , 0], e2 = [0, 1, . . . , 0],. . . ,en = [0, 0, . . . , 1]. Zasadniczym twierdzeniem o bazach przestrzeni liniowych jest następujące twierdzenie. Twierdzenie 6.1. (1) Każda przestrzeń liniowa ma bazę. (2) Dowolne dwie bazy tej samej przestrzeni liniowej mają taką samę liczbę elementów. Liczba elementów w bazie przestrzeni liniowej X nazywamy wymiarem przestrzeni X i oznaczamy symbolem dim(X). Definicja jest poprawna z uwagi na twierdzenie 6.1 (b). Może się zdarzyć, że przestrzeń liniowa V nie ma bazy o skończenie wielu elementach. Mówimy wówczas, że przestrzeń V ma wymiar nieskończony, co zapisujemy symbolem dim(V ) = ∞. Przykład 6.7. Przestrzeń liniowa Kn ma wymiar n. Istotnie, baza kanoniczna {e1 , . . . , en } przestrzeni Kn ma dokładnie n elementów. Przestrzeń R[x] ma wymiar nieskończony. W tym celu wystarczy zauważyć, że zbiór wielomianów Z = {xn : n ­ 0} jest liniowo niezależny i że każdy wielomian w ∈ R[x] jest kombinacją liniową elementów ze zbioru Z. Ponieważ zbiór Z jest nieskończony, więc dim(R[x]) = ∞. Obok pojęcia bazy przestrzeni liniowej funkcjonuje ważne pojęcie bazy uporządkowanej. Załóżmy, że A jest bazą przestrzeni liniowej V , która jest zbiorem skończonym. Wówczas dowolną permutację elementów bazy A nazywamy bazą uporządkowaną. Tak więc jeśli baza A ma n wektorów, to wyznacza ona n! baz uporządkowanych. Załóżmy, że (v1 , . . . , vn ) jest bazą uporządkowaną przestrzeni liniowej V . Dla każdego wektora v ∈ V , zgodnie z definicją bazy, istnieją takie skalary α1 , . . . , αn ∈ K, że v = α1 v1 + · · · + αn vn . 7. ZADANIA DO ROZDZIAŁU I 33 Gdyby istniały również takie skalary β1 , . . . , βn , że v = β1 v1 + · · · + βn vn , to α1 v1 + · · · + αn vn = β1 v1 + · · · + βn vn . Zatem (α1 − β1 )v1 + · · · + (αn − βn )vn = 0. Z liniowej niezależności wektorów v1 , . . . , vn wynika, że αi − βi = 0, czyli αi = βi dla każdego i = 1, . . . , n. Tak więc Twierdzenie 6.2. Jeśli (v1 , . . . , vn ) jest bazą uporządkowaną przestrzeni liniowej V , to każdy wektor v ∈ V ma jednoznaczne przedstawienie w postaci kombinacji liniowej wektorów v1 , . . . , vn ; ściślej, dla każdego wektora v ∈ V istnieje dokładnie jeden taki układ skalarów α1 , . . . , αn , że v = α1 v1 + · · · + αn vn . Ostatnie twierdzenie pozwala wprowadzić pojęcie współrzędnych wektora w danej bazie uporządkowanej. Definicja 6.6. Jeśli (v1 , . . . , vn ) jest bazą uporządkowaną przestrzeni liniowej V , v ∈ V oraz v = α1 v1 + · · · + αn vn , to dla każdego i = 1, . . . , n, skalar αi nazywamy i-tą współrzędną wektora v w bazie uporządkowanej (v1 , . . . , vn ). Przykład 6.8. Rozważmy przestrzeń R4 z bazą kanoniczną uporządkowaną (e1 , e2 , e3 , e4 ). Wówczas dla dowolnego wektora [x1 , x2 , x3 , x4 ] ∈ R4 liczby xi są i-tymi współrzędnymi w tej bazie dla każdego i = 1, 2, 3, 4. Zauważmy, że w przypadku bazy uporządkowanej ([1, 4, 3, 4], [1, 5, 2, 3], [1, 5, 2, 2], [0, 2, −1, −1]) (p. przykład 6.6) wektor [3, 16, 6, 8] ma współrzędne równe odpowiednio 1, 1, 1 i 1. 7. Zadania do rozdziału I Zadanie 1. Pokazać, że jeśli w permutacji zbioru {1, . . . , n} zmienimy miejscami dwa wyrazy, to ilość inwersji zmieni się o liczbę nieparzystą. Wskazówka: Przeprowadzić dowód indukcyjny ze względu na różnicę pozycji, na których stoją zmieniane elementy. Zadanie 2. Wykazać, że ilość permutacji, w których występuje parzysta ilość inwersji jest równa ilości permutacji, w których jest nieparzysta ilość inwersji. Wskazówka: Zauważyć, że zamiana miejscami dwóch pierwszych elementów permutacji zmienia ilość inwersji w danej permutacji z parzystej na nieparzystą, a nieparzystej na parzystą (patrz poprzednie zadanie). Po takiej zamianie dokonanej w dwóch różnych permutacjach otrzymamy dwie różne permutacje. 34 I. STRUKTURY LICZBOWE Zadanie 3. Wykazać, że w permutacji p = (p1 , . . . , pn ) zbioru {1, . . . , n} dla każdego elementu pi ilość tych inwersji, które zawierają pi jest parzysta wtedy i tylko wtedy, gdy pi + i jest liczbą parzystą. Wskazówka: Przeprowadzić dowód indukcyjny ze względu na i. Aby sprawdzić twierdzenie dla i = 1 zauważyć, że ilość elementów mniejszych od p1 jest parzysta wtedy i tylko wtedy, gdy p1 jest nieparzysta. Zadanie 4. Wykazać indukcyjnie, że dla dowolnej liczby naturalnej n prawdziwe są następujące równości: (a) (b) (c) (d) n(n + 1)(2n + 1) ; 6 n2 (n + 1)2 13 + 23 + 33 + · · · + n3 = ; 4 12 + 22 + 32 + · · · + n2 = n(n + 1)(n + 2)(n + 3) ; 4 1 · 1! + 2 · 2! + 3 · 3! + · · · + n · n! = (n + 1)! − 1. 1 · 2 · 3 + 2 · 3 · 4 + · · · + n(n + 1)(n + 2) = Zadanie 5. Udowodnić wzór dwumienny Newtona, tzn. wykazać, że (x + y)n = n X ! n n−k k x y k k=0 dla dowolnych liczb x, y ∈ R. Wskazówka: Skorzystać z zasady indukcji matematycznej i wzoru (8) ze str. 9. Zadanie 6. Wykazać, że suma liczb stojących w n-tym wierszu trójkąta Pascala na miejscach parzystych jest równa 2n−1 , tzn. wykazać, że ! ! ! n n n + + ··· + = 2n−1 , 0 2 2k gdzie 2k jest największą liczbą parzystą mniejszą od n. Wskazówka: Wykorzystać wzory n X k=0 ! n = 2n k oraz n X ! (−1)k k=0 n = 0. k Zadanie 7. Obliczyć sumę liczb stojących w n-tym wierszu trójkąta Pascala na miejscach nieparzystych. Zadanie 8. Udowodnić następujący wzór ! ! ! ! k k+1 k+r k+r+1 + + ··· + = . k k k k+1 Wskazówka: Przeprowadzić dowód indukcyjny ze względu na r. Wykorzystać tożsamość (8) ze str. 9. 7. ZADANIA DO ROZDZIAŁU I 35 Zadanie 9. Rozważmy następującą (nieskończoną) tablicę złożoną z liczb naturalnych utworzonych w następujący sposób: pierwszy wiersz i pierwsza kolumna składa się z samych jedynek, natomiast liczby ank dla n, k > 1 stojące w n–tym wierszu oraz k–tej kolumnie są sumami pierwszych k wyrazów stojących w n − 1-szym wierszu, tzn. an,k = an−1,1 + an−1,2 + · · · + an−1,k . Otrzymamy w ten sposób następujące liczby: 1 1 1 1 1 1 ... 1 2 3 4 5 6 ... 1 3 6 10 15 21 . . . 1 4 10 20 35 56 . . . 1 5 15 35 70 126 . . . 1 6 21 56 126 252 . . . ........................... Wykazać, że są to wyrazy trójkąta Pascala, tzn. ! an,k n+k−2 = . k−1 Wskazówka: Skorzystać z równości ! n n = k n−k ! oraz z poprzedniego zadania. Zadanie 10. Udowodnić twierdzenie 2.4, tzn. wykazać, że ilość wszystkich podzbiorów k–elementowych zbioru n–elementowego wynosi ! n . k Wskazówka: Przeprowadzić dowód indukcyjny ze względu na n. Wykorzystać wzór (8) ze str. 9. Zadanie 11. (a) Liczby a1 , a2 , . . . , an tworzą postęp arytmetyczny, jeśli a2 − a1 = a3 − a2 = · · · = an − an−1 . Mówimy, że liczby a1 , a2 , . . . , an tworzą postęp arytmetyczny drugiego stopnia, jeśli różnice a2 − a1 , a3 − a2 , . . . , an − an−1 tworzą postęp arytmetyczny. Wykazać indukcyjnie, że jeśli n > 4 oraz a1 , a2 , . . . , an tworzą postęp arytmetyczny drugiego stopnia, to ! (1) ! n−1 n−1 an = a1 + (a2 − a1 ) + (a3 − 2a2 + a1 ). 1 2 36 I. STRUKTURY LICZBOWE Sprawdzić, że liczby 12 , 22 , 32 , . . . , n2 tworzą postęp arytmetyczny drugiego stopnia. Obliczyć sumę 12 + 22 + · · · + n2 wykorzystując wzór (1). Wskazówka: W dowodzie wzoru (1) wykorzystać równość an = 3an−1 − 3an−2 + an−3 . (b) Jeśli mamy liczby a1 , a2 , . . . , an , . . . , to indukcyjnie możemy zdefiniować następujące układy liczb: d11 = a2 − a1 , d21 = a3 − a2 , . . . , dn1 = an+1 − an , . . . złożony z różnic kolejnych liczb a1 , a2 , . . . , układ − dn1 , . . . , d12 = d21 − d11 , d22 = d31 − d21 , . . . , dn2 = dn+1 1 zwany ciągiem jego drugich różnic, i ogólnie mając zdefiniowany ciąg m-tych różnic d1m , d2m , . . . definiujemy ciąg jego m + 1 różnic w następujący sposób: n d1m+1 = d2m − d1m , d2m+1 = d3m − d2m , . . . , dnm+1 = dn+1 m − dm , . . . Mówimy, że liczby a1 , a2 , . . . , an , . . . tworzą postęp arytmetyczny m-tego stopnia, jeśli m − 1-szy ciąg różnic jest postępem arytmetycznym, czyli m-ty postęp jest stały. Wykazać, że jeśli liczby a1 , a2 , . . . tworzą postęp arytmetyczny stopnia m, to ! (2) ! ! n−1 1 n−1 1 n−1 1 an = a1 + d1 + d2 + · · · + dm . 1 2 m Wskazówka: Wykazać najpierw indukcyjnie, że dla dowolnych liczb naturalnych n, k oraz 0 < l < n zachodzi równość ! dnk ! ! l n−l l n−l l n−l = dk+l + dk+l−1 + · · · + d . 0 1 l k Indukcje przeprowadzić ze względu na n, wykorzystując równość dn+1 = dnk + dnk+1 , k prawdziwą dla dowolnych n, k. Zauważyć, że podstawiając w powyższym wzorze za k liczbę 1, a za l liczbę n − 1 otrzymamy dn1 = n−1 X i=0 n X n−1 1 n−1 1 dn−i = di . i i=1 i − 1 ! ! Równość (2) dowodzić indukcyjnie, wykorzystując ostatni wzór wraz z równością an+1 = an + dn1 oraz fakt, że d1k = 0 dla k > m + 1. (c) Pokazać, że liczby 1m , 2m , 3m , . . . tworzą postęp arytmetyczny stopnia m. Wyprowadzić wzór na sumę 14 + 24 + · · · + n4 . Wskazówka: Wykorzystać wzór (2) oraz zadanie 8. 7. ZADANIA DO ROZDZIAŁU I 37 Zadanie 12. Wykazać indukcyjnie, że dla dowolnej liczby naturalnej n prawdziwe są następujące równości: (a) (b) (c) (d) (e) 1 2 n 1 + + ··· + =1− ; 2! 3! (n + 1)! (n + 1)! 1 1 1 n(n + 3) + + ··· + = ; 1·2·3 2·3·4 n(n + 1)(n + 2) 4(n + 1)(n + 2) 1 1 1 n + + ··· + = ; 1·3 3·5 (2n − 1)(2n + 1) 2n + 1 1 1 1 n + + ··· + = ; 1·4 4·7 (3n − 2)(3n + 1) 3n + 1 1 1 1 1 1 1 1 1 1 − + − + ··· + − = + + ··· + . 2 3 4 2n − 1 2n n+1 n+2 2n Zadanie 13. Wykazać indukcyjnie, że dla każdej liczby rzeczywistej a > 0 i dla każdej liczby naturalnej n zachodzi wzór: 1 1 n 1 + + ··· + = . a(a + 1) (a + 1)(a + 2) (a + n − 1)(a + n) a(a + n) Zadanie 14. Znaleźć sumy: (a) n X 1 k=1 k(k + 1) (b) n X k=2 k2 1 . −1 Zadanie 15. Wykazać, że dla każdej liczby naturalnej n > 3 zachodzi nierówność: 1 1 3 1 + + ··· + > . n+1 n+2 2n 5 Wskazówka: Sprwadzić, że 3 1 1 1 + + > 4 5 6 5 oraz zauważyć, że jeśli lewą stronę nierówności oznaczymy an , to an+1 > an , gdyż an+1 = an + 1 1 1 + − . 2n + 1 2n + 2 n + 1 Zadanie 16. Wykazać, że dla każdej liczby naturalnej n > 2 zachodzi nierówność √ 1 1 1 √ + √ + · · · + √ > n. n 1 2 Wskazówka: Wykazać, a następnie zastosować nierówność √ √ 1 n+ √ > n + 1. n+1 38 I. STRUKTURY LICZBOWE Zadanie 17. Wykazać, że jeśli n > 2, to √ n! < ( 2)n(n−1) . Wskazówka: Sprawdzić wpierw, że dla każdego n > 2 zachodzi nierówność n < 2n−1 , a następnie zastosować wzór (1) str. 5. Zadanie 18. Wykazać, że dla każdego n > 2 zachodzi nierówność (2n)! 22n . > (n!)2 n+1 Wskazówka: W dowodzie indukcyjnym wykorzystać nierówność 2n + 1 2 > . (n + 1)2 n+2 Zadanie 19. Wykazać, że jeśli x oraz y są różnymi liczbami rzeczywistymi dodatnimi, to dla każdej liczby naturalnej n > 2 zachodzi nierówność (x + y)n < 2n−1 (xn + y n ). Wskazówka: W dowodzie indukcyjnym skorzystać z nierówności (xn − y n )(x − y) > 0. Zadanie 20. Wykazać, że jeśli x1 , x2 , . . . , xn są dowolnymi liczbami rzeczywistymi dodatnimi spełniającymi warunek x1 · x2 · · · · · xn = 1. to x1 + x2 + · · · + xn > n. Wskazówka: Dowodzić indukcyjnie. Jeśli twierdzenie jest prawdziwe dla dowolnego układu n liczb rzeczywistych dodatnich oraz x1 · x2 · · · · · xn · xn+1 = 1, to istnieją takie wskaźniki i, j 6 n + 1, że xi 6 1 oraz xj > 1. Możemy więc dodatkowo założyć, że xn 6 1 oraz xn+1 > 1. Mamy wówczas x1 + x2 + · · · + xn−1 + xn · xn+1 > n, oraz xn · xn+1 − xn − xn+1 + 1 = (xn − 1)(xn+1 − 1) 6 0, co daje nierówność x1 + x2 + · · · + xn+1 > n + 1. 7. ZADANIA DO ROZDZIAŁU I 39 Zadanie 21. Wykazać, że jeśli a1 , a2 , . . . , an są dowolnymi liczbami rzeczywistymi dodatnimi, to √ a1 + a2 + · · · + an > n a1 · a2 · · · · · an . n Wskazówka: Przyjąć ak xk = √ n a · a · ··· · a 1 2 n dla k = 1, 2, . . . , n i zastosować poprzednie zadanie. Zadanie 22. Dla każdej liczby naturalnej n wypiszmy w porządku rosnącym wszystkie ułamki nieskracalne z przedziału [0, 1], których mianowniki nie przekraczają n. Zbiór wszystkich tych ułamków oznaczmy symbolem An . Zbiór An nazywany jest n– tym ciągiem Farey’a. Dla przykładu wypiszmy ułamki piątego ciągu Farey’a: 0 1 1 1 2 1 3 2 3 4 1 0 = < < < < < < < < < < = 1, 1 5 4 3 5 2 5 3 4 5 1 a więc 0 1 1 1 2 1 3 2 3 4 1 , , , , , , , , , , . A5 = 1 5 4 3 5 2 5 3 4 5 1 (a) Wykazać, że jeśli ab , dc są dwoma kolejnymi ułamkami należącymi do An−1 takimi, że b · c − a · d = 1 oraz jeśli nk ∈ An jest takim ułamkiem, że ab < nk < dc , to n = b + d oraz k = a + c. Wskazówka: Pokazać najpierw, że n = b + d, wykorzystując nierówność c a 1 = − = bd d b ! c k k a − + − d n n b ! > b+d nbd oraz nierówność a a+c c < < , b b+d d prawdziwą dla każdej pary ułamków ab < dc . Następnie wykazać, że (b) Wykazać, że jeśli ab , An , to p q 1 1 − < k − (a + c) < . b d c oraz d są kolejnymi trzema wyrazami dowolnego zbioru p a+c = . q b+d Wskazówka: Udowodnić indukcyjnie, że dla każdego n ∈ N zbiór An ma następujące własności: (i) jeśli ab , pq , dc są kolejnymi ułamkami ciągu An to: p a+c = q b+d 40 I. STRUKTURY LICZBOWE (ii) jeśli rs , ut są kolejnymi ułamkami ciągu An , to: ts − ru = 1. W tym celu załóżmy prawdziwość twierdzenia dla liczby naturalnej n. Zauważyć, że z podpunktu (a) wynika, że wśród trzech kolejnych ułamków z ciągu An+1 nie mogą wystąpić dwa kolejne ułamki z ciągu An+1 , które nie należą do An . Prawdziwości twierdzenia dla n + 1 dowodzić rozpatrując kolejne przypadki. Jeśli ab , pq , dc są kolejnymi ułamkami An+1 przy czym pq ∈ An+1 , to równość p a+c = q b+d wynika z podpunktu (a) i z założenia indukcyjnego. Wobec tego, jeśli rs , ut są kolejnymi ułamkami An+1 oraz jeden z nich, na przykład ut , jest elementem An+1 , to biorąc 0 najmniejszy ułamek rs0 ∈ An spośród większych od ut mamy t = r + r0 oraz u = s + s0 . Dlatego też ts − ru = (r + r0 )s − r(s + s0 ) = rs + r0 s − rs − rs0 = r0 s − rs0 = 1, 0 co wynika z założenia indukcyjnego, gdyż rs , rs0 są kolejnymi ułamkami ciągu An . Jeśli a p c , , są kolejnymi ułamkami ciągu An+1 oraz skrajny, na przykład dc należy do An+1 , b q d to cq − pd = 1 na mocy powyżej wykazanej własności oraz pb − aq = 1 na mocy założenia indukcyjnego. Wobec tego cq + aq = pb + dp, skąd otrzymujemy a+c p = . q b+d Podobnie rozumujemy, gdy ab , dc ∈ An+1 oraz pq ∈ An . W pozostałym przypadku, tzn. kiedy wszystkie ułamki ab , pq , dc są z An oraz rs , ut ∈ An , prawdziwość twierdzenia wynika bezpośrednio z założenia indukcyjnego. Zadanie 23. Wykazać, że jeśli x > 0 liczbą niewymierną, to dla każdej liczby naturalnej n istnieje taka liczba naturalna k, że dokładnie jedna spośród liczb 1 k 1+ x k(1 + x), należy do przedziału (n, n + 1). Wskazówka: Wykazać, że dla dowolnej liczby naturalnej n liczb postaci k(1 + x) n ] oraz, że liczb postaci k(1 + x1 ) mniejszych od n jest [ 1+n 1 ] mniejszych od n jest [ 1+x x (przypomnijmy, że [a] oznacza część całkowitą liczby rzeczywistej a). Następnie wykan zać, że [ 1+x ] + [ 1+n 1 ] = n − 1. W tym celu sprawdzić, że x n n + 1+x 1+ 1 x = n, 7. ZADANIA DO ROZDZIAŁU I 41 oraz zauważyć, że na mocy niewymierności liczby x mamy n n = +ε i 1+x 1+x n 1+ " 1 x n = 1+ # 1 x + η, gdzie ε, η ∈ (0, 1). Zadanie 24. Wykazać, że każda liczba postaci n5 −n, gdzie n jest liczbą naturalną, jest podzielna przez 6. Wskazówka: Rozłożyć wielomian n5 − n i skorzystać z faktu, że wśród trzech kolejnych liczb naturalnych jedna z nich jest podzielna przez 3. Zadanie 25. Wykazać, że liczba n! jest podzielna przez sumę 1 + 2 + · · · + n wtedy i tylko wtedy, gdy liczba n + 1 nie jest liczbą pierwszą większą od 2. Wskazówka: Skorzystać ze wzoru 1 + 2 + · · · + n = n(n+1) . 2 Zadanie 26. Wykazać, że jeśli n jest liczbą nieparzystą, która nie jest podzielna przez 3, to liczba n2 − 1 jest podzielna przez 24. Wskazówka: Skorzystać z równości n2 −1 = (n−1)(n+1). Zauważyć, że spośród dwóch liczb parzystych n − 1 oraz n + 1 jedna z nich jest też liczbą podzielną przez 4, a także że jedna z nich jest liczbą podzielną przez 3. Zadanie 27. Wykazać, że jeśli liczby nieparzyste p, q > 3 nie są podzielne przez 3, to liczba p2 − q 2 jest podzielna przez 24. Wskazówka: Wykorzystać fakt, że zarówno p jak i q są liczbami postaci 3m + n, gdzie n ∈ {1, 2}, przy czym jeśli m = 1, to n jest liczbą parzystą, a jeśli m = 2, to n jest liczbą nieparzystą. Skorzystać z faktu, że jeśli a, b, c są liczbami nieparzystymi, to dla dowolnych liczb całkowitych x, y jedna spośród liczb: x−y lub ax+by +c jest parzysta. Zadanie 28. Wykazać, ze dla każdej liczby naturalnej n, liczba (1 + n)n − 1 jest podzielna przez n2 . Wskazówka: Skorzystać ze wzoru Newtona i zauważyć, że każdy składnik wyrażenia (1 + n)n − 1 jest podzielny przez n2 . Zadanie 29. Niech m, n, p, q będą liczbami naturalnymi. Wykazać, że jeśli m − p dzieli mn + pq, to dzieli także mq + np. Wskazówka: Do wyrażenia mq + np dodać, a następnie odjąć mn + pq. Otrzymane wyrażenia odpowiednio pogrupować. Zadanie 30. Wykazać, że dla każdej liczby naturalnej n > 2 istnieje liczba pierwsza p taka, że n 6 p 6 n! − 1. Wskazówka: Niech {p1 , p2 , . . . , pm } będzie zbiorem wszystkich liczb pierwszych mniejszych od n!. Jeśli wszystkie liczby pi są mniejsze od n, to mamy p1 · p2 · · · · · pm 6 (n − 1)!. 42 I. STRUKTURY LICZBOWE Ponieważ (n − 1)! + 1 < n!, więc p = p1 · p2 · · · · · pm + 1 6 (n − 1)! + 1 < n!. Na podstawie analogicznego rozumowania jak w twierdzeniu 4.4 wnosimy, że p jest liczbą pierwszą, co jest sprzeczne z przypuszczeniem, że wszystkie liczby pi były mniejsze od n. Zadanie 31. W ciele liczb zespolonych rozwiązać równania i układy nierówności: (1) (1 − i)z = (3 − i)z + 2 + 3i; (2) |z| − z = 1 + 2i; (3) z · z + z − z = 3 + 2i; (4) ( (4 − 3i)z + (2 + i)w = 5(1 + i) (2 − i)z − (2 + 3i)w = −(1 + i) ( 2(2 + i)z − i(3 + 2i)w = 5 + 4i (3 − i)z + 2(2 + i)w = 2(1 + 3i) (5) (6) z w + =2 2−i 1+i 2w 5z + =3 2 (2 − i) (1 + i)2 Zadanie 32. Przedstawić w postaci trygonometrycznej następujące liczby zespolone: (a) z = 1; (c) z = 1 + i; √ (e) z = −1 − i 3; (g) z = 1 + i tg α; (i) z = 1 + cos α + i sin α; √ √ √ √ (k) z = 6 + 2 + i( 6 − 2); (b) z = −2i; √ (d) z = 3 + i; (f) z = 1 − i. (h) z = tg α + i. 1 + i tg α (j) z = . 1 − i tg α √ √ √ √ (l) z = 6 − 2 + i( 6 + 2). Zadanie 33. Przedstawić w postaci trygonometrycznej następujące liczby zespolone: 7. ZADANIA DO ROZDZIAŁU I √ (a) (1 + i 3)6 ; (c) (e) √ !20 1+i 3 1+i (b) π π 2 cos + i sin ; 3 6 √ !−11 1 3 − −i ; 2 2 (d) (f) 43 √ 3 i; 1+i √ 1+i 3 !7 . Zadanie 34. Wykazać równości: (a) cos 4x = 8 cos4 x − 8 cos2 x + 1 (b) sin 4x = 4 sin x cos x(1 − 2 sin2 x). Zadanie 35. Podać interpretację geometryczną następujących zbiorów: (a) {z ∈ C : |z| > 3}; (e) {z ∈ C : re(z) = 2}; (b) {z ∈ C : |z − i + 1| ¬ 1}; z − 3 ­1 ; (d) z ∈ C : z + 1 (f) {z ∈ C : im(z 2 ) = 2}, (g) {z ∈ C : |z − 1| + |z + 1| = 2}; (h) {z ∈ C : |z|2 = 2re(z)}, (c) {z ∈ C : |z + 1|2 ¬ |z − 1|2 }; (re(z) oraz im(z) oznaczają odpowiednio część rzeczywistą i zespoloną liczby z). Zadanie 36. W zbiorze liczb zespolonych rozwiązać równania (a) z 2 − 3z + 3 + i = 0; (b) z 2 + (1 + 2i)z + i = 0 (c) z 4 − 2z 2 + 4 = 0; (d) z 4 + (15 + 7i)z 2 + 8 − 15i = 0. Zadanie 37. Znaleźć wszystkie pierwiastki: √ √ √ 4 (a) 3 8 + 8i; (b) i (c) 6 1 − i (d) √ 4 −64. Zadanie 38. Zbadać, czy dane wektory przestrzeni C(R) są liniowo niezależne: (1) 1, sin x, cos x, (2) sin2 x, cos2 x, sin 2x, cos 2x, (3) 1, 5x , 5−x . Zadanie 39. Sprawdzić, że jeśli wektory v1 , . . . , vn są liniowo niezależne, to wektory v1 , v1 + v2 , . . . , v1 + v2 + · · · + vn są liniowo niezależne. Zadanie 40. Sprawdzić czy dane wektory tworzą bazę przestrzeni R3 : (a) [1, 0, −1], [1, 1, 3], [4, 1, 1], (b) [2, 3, 5], [1, 8, 1], [2, 7, 5], (c) [4, 5, 4], [−2, 1, 0], [3, 4, 5]. ROZDZIAŁ II Macierze i wyznaczniki 1. Macierze Jeśli n i m są liczbami naturalnymi, to macierzą o m wierszach i n kolumnach nazywamy układ m · n liczb z ciała K zapisanych w postaci tablicy a11 a 21 A= .. . (1) a12 a22 .. . ... ... am1 am2 . . . a1n a2n .. , . amn Jeśli macierz ma m wierszy i n kolumn, to będziemy też mówić, że jest wymiarów m × n. Macierz A postaci (1) będziemy także zapisywać w następujący sposób: A = [aij ], (2) gdzie 1 6 i 6 m oraz 1 6 j 6 n. Liczby aij tworzące macierz A nazywamy elementami macierzy A. W zapisie aij pierwszy wskaźnik, tzn. i oznacza numer wiersza, a drugi wskaźnik, tzn. j oznacza numer kolumny, w której znajduje się dany element macierzy. Zbiór wszystkich macierzy o m wierszach i n kolumnach oznaczać będziemy symbolem Km×n i nazywać przestrzenią macierzy wymiaru m × n o współczynnikach z ciała K. Przykład 1.1. Oto kilka przykładów macierzy: 1 0 1 2 A = 1 , B = 1 2 3 , C = 3 4 7 , D = 2 , 3 1 6 2 h i h i " # 0 3 0 1 2 i 2 3 + 2i E= , F = 1 5 , G = . 3 5 4 2 i i 2 4 " # Łatwo zauważyć, że A ∈ K1×1 , B ∈ K1×3 , C ∈ K3×3 , D ∈ K3×1 , E ∈ K2×3 , F ∈ K3×2 , przy czym K może być zarówno ciałem liczb wymiernych, rzeczywistych lub zespolonych. Macierz G ∈ C2×3 . Wszystkie macierze w tym przykładzie są różne. Pierwsza z nich ma tylko jeden wiersz i jedną kolumnę i z tego powodu może być utożsamiona z liczbą rzeczywistą. Macierz B ma tylko jeden wiersz (i trzy kolumny), a macierz D jedną kolumnę (i trzy 45 46 II. MACIERZE I WYZNACZNIKI wiersze). Tego typu macierze będziemy nazywali wektorami wierszowymi lub kolumnowymi (por. przykład 6.3 na str. 30). Zatem wektory wierszowe to elementy zbioru K1×n , a wektory kolumnowe to elementy Kn×1 , gdzie n ∈ N. Ponadto macierze B i D są do siebie podobne w tym sensie, że te same liczby, które w macierzy B tworzą wiersz, w macierzy D tworzą kolumnę. Możemy więc powiedzieć, że macierz D powstała z macierzy B przez zamianę wiersza na kolumnę. Taką operację będziemy nazywać transpozycją. Dokładniej: jeśli macierz A = [aij ] jest macierzą wymiarów m × n, to macierz B = [bij ] wymiarów n × m otrzymaną z macierzy A poprzez zamianę wierszy na kolumny z zachowaniem ich kolejności, czyli bij = aji , nazywamy macierzą transponowaną do A. Macierz transponowaną do macierzy A oznaczamy symbolem AT . Tak więc, jeśli A jest postaci (1), to a11 a21 AT = .. . T a12 . . . a22 . . . .. . a1n a11 a21 . . . a2n a12 a22 . . . .. .. = .. . . . amn a1n a2n . . . am1 an2 . . . am1 am2 .. . . amn Oczywiście powtórne zastosowanie operacji transponowania spowoduje powrót do macierzy A. Łatwo zauważyć, że w naszym przykładzie mamy także F T = E oraz E T = F . Macierze, które mają takie same wymiary można do siebie dodawać, tzn. jeśli A = [aij ], B = [bij ] ∈ Km×n , to sumą macierzy A i B nazywamy taką macierz A+B ∈ Km+n , że A + B = [aij + bij ], tzn. a11 + b11 a12 + b12 . . . a1n + b1n a22 + b22 . . . a2n + b2n a21 + b21 . A+B = .. .. .. . . . am1 + bm1 am2 + bm2 . . . amn + bmn Zatem dodawanie macierzy tych samych wymiarów polega na dodaniu do każdego elementu stojącego w w i-tym wierszu i j-tej kolumnie macierzy A elementu stojącego w i-tym wierszu i j-tej kolumnie macierzy B. Macierz można pomnożyć przez dowolny element α ∈ K: iloczynem macierzy A = [aij ] ∈ Km×n przez element α ∈ K nazywamy macierz αA ∈ Km×n daną wzorem αA = [αaij ]. tzn. αa11 αa21 αA = .. . αa12 αa22 .. . ... ... αam1 αam2 . . . αa1n αa2n .. , . αamn 1. MACIERZE 47 a więc każdy element macierzy A mnożymy przez α. Bez trudu stwierdzamy, że zbiór wszystkich macierzy Km×n z działaniem dodawania macierzy i mnożeniem przez elementy z ciała K jest przestrzenią liniową nad ciałem K: A + (B + C) = (A + B) + C, A + 0 = A, gdzie 0 oznacza macierzą zerową, czyli macierz złożoną z samych zer, A + (−1)A = 0, A + B = B + A, α(A + B) = αA + αB, (α + β)A = αA + βA, (αβ)A = α(βA), gdzie A, B, C ∈ K m×n 1A = A, oraz α, β ∈ K. Możemy zatem stwierdzić, że Twierdzenie 1.1. Zbiór Km×n z działaniami dodawania macierzy i działaniem mnożenia przez skalar, z wyróżnioną macierzą zerową jest przestrzenią liniową nad ciałem K. Przykład 1.2. 2 3 7 7 1 1 1 0 1 2 6 7 2 2 12 4 + 2 2 2 2 = 4 4 14 6 3 9 12 7 0 8 1 2 3 1 11 5 8 12 28 28 2 3 7 7 4 4 4 14 6 = 16 16 56 24 . 12 36 48 28 3 9 12 7 Operacja mnożenia macierzy przez macierz jest bardziej złożona a poza tym nie zawsze wykonalna. Aby pomnożyć macierz A przez macierz B musimy założyć, że w wierszach macierzy A jest tyle samo elementów ile ich jest w kolumnach macierzy B. Oznacza to tyle, że macierz A musi mieć tyle kolumn ile macierz B wierszy. Dokładniej, jeśli macierz A jest wymiarów l × m natomiast B jest macierzą wymiarów m × n, to iloczyn macierzy A i B jest macierzą AB = [cij ] wymiarów l × n przy czym (3) cij = ai1 b1j + ai2 b2j + · · · + ail blj dla dowolnego i ∈ {1, . . . , l} oraz j ∈ {1, . . . , n}. Tak więc aby wyznaczyć element, który stoi w i-tym wierszu i j-tej kolumnie macierzy AB mnożymy kolejno elementy i-tego wiersza macierzy A przez odpowiadajace im elementy j-tej kolumny macierzy B (jest ich tyle samo), a następnie dodajemy wszystkie uzyskane w ten sposób iloczyny. Widać z tak postawionej definicji, że mnożenie macierzy nie zawsze jest wykonalne, o czym przekonuje nas następujący przykład: 48 II. MACIERZE I WYZNACZNIKI Przykład 1.3. " " # 2 1 0 1 9 8 8 6 0 2 3 . · 3 1 1 0 = 21 14 13 9 1 5 4 1 2 2 2 # Zauważmy przy tym, że iloczyn # 2 1 0 1 " 0 2 3 3 1 1 0 · 1 5 4 1 2 2 2 nie jest określony. Zauważmy jeszcze, że zamiana kolejności wykonywania mnożenia macierzy (jeśli jest ono wykonalne) może spowodować, że otrzymamy macierz innych wymiarów. Istotnie, mnożenia macierzy E i F z przykładu 1.1 są wykonalne w dowolnej kolejności, jednak EF ∈ K2×2 , a F E ∈ K3×3 . Zatem z konieczności, EF 6= F E. Macierz A nazywamy kwadratową, gdy ma tyle samo wierszy co kolumn. Tak więc macierz kwadratowa jest wymiarów n×n, dla pewnego n ∈ N. O macierzy kwadratowej mówimy wtedy, że jest stopnia n. Macierz C z przykładu 1.1 jest kwadratowa. Mnożenie macierzy kwadratowych tego samego stopnia jest zawsze wykonalne i daje w wyniku macierz tego samego stopnia. Jednak i w tym przypadku nietrudno wskazać takie macierze A, B ∈ Rn×n , że AB 6= BA. Przykład 1.4. Rozważmy następujące macierze stopnia 3: 1 2 0 1 0 2 A = 2 1 0 , B = 2 0 1 . 0 1 2 0 2 1 Posługując się wzorem (3) łatwo obliczyć, że 1 4 4 AB = 4 4 1 , 4 1 2 natomiast 5 2 2 BA = 2 2 5 . 2 5 2 Widzimy więc, że AB 6= BA. Dla macierzy kwadratowej wyróżnia się pojęcie tzw. przekątnej macierzy, tj. zbiór {aii : i ∈ {1, . . . , n}}. Macierz, która ma wszystkie wyrazy zerowe „pod przekątną” lub 1. MACIERZE 49 „nad przekątną” nazywamy macierzą trójkątną. Ściślej, macierz jest trójkątna, jeśli aij = 0 dla i > j lub aij = 0 dla i < j. Tak więc macierz trójkątna jest postaci a11 a12 a13 0 a 22 a23 0 0 a33 .. .. .. . . . 0 0 0 ... ... ... a1n a2n a3n .. . ... ann a11 0 0 a 0 21 a22 a31 a32 a33 .. .. .. . . . an1 an2 an3 lub postaci ... ... ... 0 0 0 .. . ... ann . Macierz kwadratowa, która ma wszystkie elementy zerowe, z wyjątkiem być może wyrazów stojących na przekątnej nazywa się macierzą diagonalną. Tak więc macierz diagonalna jest macierzą postaci: a11 0 0 0 a 0 22 0 0 a33 .. .. .. . . . 0 0 0 ... ... ... 0 0 0 .. . ... ann . Przykład 1.5. Wśród macierzy 1 0 0 1 0 0 1 2 3 A = 0 1 2 , B = 2 5 0 , C = 0 2 0 0 0 3 3 −2 1 0 0 1 macierze A i B są trójkątne, a macierz C jest diagonalna. Wśród macierzy diagonalnych wyróżniamy macierze jednostkowe, tzn. takie, które na przekątnej mają same jedynki, a poza przekatną zera. Macierz jednostkowa stopnia n dana jest wzorem: In = [δij ], przy czym 1, jeśli i = j δij = 0, jeśli i 6= j. Powyżej zdefiniowany symbol δij zwykło się nazywać deltą Kroneckera. Tak więc macierz jednostkowa stopnia n ma postać 1 0 0 In = .. . 0 1 0 .. . 0 ... 0 ... 1 ... .. . 0 0 0 . .. . 0 0 0 ... 1 Macierze jednostkowe odgrywają podobną rolę w mnożeniu macierzy jak liczba 1 w mnożeniu liczb rzeczywistych. Mówi o tym następujące twierdzenie, którego nietrudne uzasadnienie pozostawiamy czytelnikowi. 50 II. MACIERZE I WYZNACZNIKI Twierdzenie 1.2. Jeśli A ∈ Km×n , to Im A = AIn = A. W szczególności, jeśli m = n, to otrzymujemy równość: In A = AIn = A, a więc w tym przypadku mnożenie macierzy jest przemienne. Operacja mnożenia macierzy ma jeszcze trzy dodatkowe własności. Mówi o tym kolejne twierdzenie. (a) Jeśli A ∈ Kk×l , B ∈ Kl×m oraz C ∈ Km×n , to Twierdzenie 1.3. (AB)C = A(BC). (b) Jeśli A ∈ Kl×m oraz B, C ∈ Km×n , to A(B + C) = AB + AC. (c) Jeśli A, B ∈ K l×m oraz C ∈ Km×n , to (A + B)C = AC + BC. Własność zawarta w podpunkcie (a) tego twierdzenia nazywa się łącznością. Zatem mnożąc trzy lub więcej macierzy możemy łączyć je w grupy, pamiętając, że nie możemy zmieniać kolejności wykonywania działań. Własność z podpunktów (b) i (c), to tzw. rozdzielność mnożenia macierzy względem ich dodawania. Pozwala ona, podobnie jak wśród liczb rzeczywistych, wyciągnąć wspólny czynnik przed lub za nawias, co znowu na ogół nie jest tym samym, ze względu na brak przemienności mnożenia macierzy. Możemy również pomyśleć o działaniu, które byłoby działaniem odwrotnym do mnożenia macierzy w podobnym sensie jak działaniem odwrotnym do mnożenia liczb rzeczywistych jest dzielenie. Jeśli a, b, c ∈ R to równość a·b=c pociąga, że c = c · a−1 = a−1 · c, a o ile a 6= 0. Analogiczna operacja dla macierzy może nie mieć sensu chyba, że dla macierzy A będziemy potrafili wyznaczyć macierz A−1 tych samych wymiarów taką, że AA−1 = A−1 A = In , gdzie, przypominamy, In jest macierzą jednostkową stopnia n. Okazuje się, że dla pewnych macierzy działanie analogiczne do dzielenia liczb można wprowadzić. Potrzebować będziemy jednak dodatkowego pojęcia, o którym powiemy w następnym paragrafie. b= 2. WYZNACZNIKI 51 2. Wyznaczniki Pojęciem, o którym mówiliśmy na końcu poprzedniego paragrafu jest wyznacznik (lub inczej wyróżnik lub determinant) macierzy kwadratowej. Niech A będzie macierzą kwadratową stopnia n, tzn. a11 a12 . . . a21 a22 . . . A= .. .. . . an1 an2 . . . (1) a1n a2n .. . . ann Wybierzmy z pierwszego wiersza macierzy A dowolny element. Z drugiego wiersza wybierzmy dowolny element, ale nie z kolumny, z której wybraliśmy pierwszy element. Z trzeciego wiersza wybierzmy element, który nie stoi w kolumnach, z których wybraliśmy dwa poprzednie. Postępujemy tak aż do n–tego wiersza. Po wymnożeniu wybranych elementów możemy na przykład otrzymać iloczyn a11 a22 a33 · · · · · ann , lub iloczyn a12 a21 a33 · · · · · ann . Ogólnie, każdy taki iloczyn jest postaci a1p1 a2p2 · · · · · anpn , (2) gdzie p = (p1 , p2 , . . . , pn ) (3) jest permutacją zbioru {1, 2, . . . , n}. Iloczyn (−1)I(p) a1p1 a2p2 · · · · · anpn , gdzie I(p) jest liczbą inwersji występujących w permutacji p = (p1 , p2 , . . . , pn ), nazywamy składnikiem wyznacznika macierzy A. Sumę wszystkich składników wyznacznika macierzy A nazywamy wyznacznikiem macierzy A. Wyznacznik macierzy A oznaczać będziemy symbolem det A. Tak więc det A = (4) X (−1)I(p) a1p1 a2p2 · · · · · anpn . p∈Pn Wyznacznik det jest więc funkcją określoną w zbiorze wszystkich macierzy kwadratowych wzorem (4) o wartościach w ciele K. Przykład 2.1. Obliczymy wyznaczniki macierzy stopnia 1, 2 oraz 3. 1. Jeśli n = 1, to: det A = det[a11 ] = a11 , 2. Jeśli n = 2, to: " # a a det A = det 11 12 = (−1)0 a11 a22 + (−1)1 a12 a21 = a11 a22 − a12 a21 , a21 a22 52 II. MACIERZE I WYZNACZNIKI gdyż w pierwszym składniku wyznacznika macierzy A permutacja (1, 2) nie ma inwersji, a w drugim składniku permutacja (2, 1) ma dokładnie jedną inwersję. 3. Jeśli n = 3, to: a11 a12 a13 det A = det a21 a22 a23 = (−1)0 a11 a22 a33 + (−1)2 a12 a23 a31 + (−1)2 a13 a21 a32 + a31 a32 a33 + (−1)1 a11 a23 a32 + (−1)1 a12 a21 a33 + (−1)3 a13 a22 a31 = = a11 a22 a33 + a12 a23 a31 + a13 a21 a32 − a11 a23 a32 − a12 a21 a33 − a13 a22 a31 . To, że w poszczególnych składnikach wyznacznika powyższej macierzy występują liczby -1 w takich a nie innych wykładnikach wynika, jak czytelnik zapewne pamięta, z tego, że odpowiednie permutacje zbioru {1, 2, 3} występujące w składnikach wyznacznikach macierzy A mają liczbę inwersji równą 0, 2, 2, 1, 1 oraz 3 (por. Przykład 2.6 str. 9). Wzór na wyznacznik macierzy stopnia 1 oraz 2 nie powinien przedstawiać żadnej trudności w obliczaniu. Natomiast do obliczania wyznacznika stopnia 3 możemy posłużyć się pewnym schematem. Polega on na dopisaniu do macierzy stopnia 3 jego dwóch pierwszych wierszy: +a11F a12 a13 − a21 a22 a23 FFFF FFFF FFFF FFFF F xx xx x xx xx a22 F +a21F a23 − FFFF FFFF xx FFFF xxx FFFFxx Fx FxF xxFFFFFFFF xx FFFFFFF x x x x x a32 G +a31F a33 − G FFFF xx GGGGG ww FFFFxx GGGwGw xF ww GGGGGGG xx FFFFFF w x w x a11 a12 G a13 GGGG ww G G w G G GGGG ww GGGG ww G ww a następnie dodaniu iloczynów elementów stojących na liniach ukośnych z góry do dołu ze znakiem „+”, jeśli zaczynamy od elementu opatrzonego znakiem „+” i ze znakiem „-”, jeśli zaczynamy od elementu opatrzonego znakiem „-”. Ten schemat obliczania wyznacznika macierzy stopnia 3 nazywamy schematem Sarrusa. Wersja równoważna polega na dopisaniu dwóch kolejnych kolumn. Przykład 2.2. Obliczmy dla przykładu następujący wyznacznik 1 2 3 det 5 5 6 . 1 3 3 2. WYZNACZNIKI 53 Podpisujemy pod macierzą dwa pierwsze rzędy: + 1 2 3 − + 5 5 6 − + 1 3 3 − 1 2 3 5 5 6 a następnie dodajemy obliczone składniki wyznacznika tej macierzy: 1 · 5 · 3 + 5 · 3 · 3 + 1 · 2 · 6 − 3 · 5 · 1 − 6 · 3 · 1 − 3 · 2 · 5. Wyznacznik macierzy jest zatem równy 1 2 3 det 5 5 6 = 15 + 45 + 12 − 15 − 18 − 30 = 72 − 63 = 9. 1 3 3 Jest to sposób mnemotechniczny zapamiętywania wyznacznika stopnia trzeciego. Metoda ta nie daje się przenieść bezpośrednio na wyznaczniki wyższych stopni, co nie dziwi, bo jak wiemy, wyznacznik macierzy stopnia czwartego jest sumą 24 składników, a stopnia piątego aż 120 składników, gdyż tyle jak wiemy jest permutacji zbioru {1, 2, 3, 4, 5}. Nietrudno jednak zauważyć, że Twierdzenie 2.1. Wyznacznik macierzy trójkątnej jest równy iloczynowi elementów stojących na przekątnej. Istotnie, w macierzy trójkątnej wszystkie wyrazy pod lub nad przekątną są równe zero. Dlatego też wszystkie składniki wyznacznika macierzy, z wyjątkiem co najwyżej (−1)0 a11 a22 · · · · · ann = a11 a22 · · · · · ann zawierają czynnik równy zero, a więc są równe zero. Wobec tego wyznacznik takiej macierzy jest równy a11 a22 · · · · · ann . Inną, niemal natychmiast zauważalną własnością wyznaczników jest, że Twierdzenie 2.2. Jeśli w jakimś wierszu macierzy kwadratowej występują same zera, to wyznacznik takiej macierzy jest równy zero. Wynika to bezpośrednio z definicji wyznacznika, gdyż zgodnie ze wzorem (4), przynajmniej jeden czynnik każdego z wyrażeń postaci a1p1 a2p2 . . . anpn jest równy zero. Kolejna ważna własność wyznacznika to Twierdzenie 2.3. det A = det AT . Istotnie, niech p = (p1 , . . . , pn ) będzie permutacją zbioru {1, . . . , n} wyznaczającą składnik wyznacznika macierzy B = AT . Składnik ten jest postaci (−1)I(p) b1p1 · · · · · bnpn . 54 II. MACIERZE I WYZNACZNIKI Ponieważ macierz B jest macierzą transponowaną macierzy A, więc (−1)I(p) b1p1 · · · · · bnpn = (−1)I(p) ap1 1 · · · · · apn n . Niech q = (q1 , . . . , qn ) będzie permutacją odwrotną do permutacji p, tj. qi = j wtedy i tylko wtedy, gdy pj = i. W permutacji q występuje tyle samo inwersji co w permutacji p, gdyż liczby pj , pj 0 tworzą inwersję w permutacji p wtedy i tylko wtedy, gdy liczby j = qi oraz j 0 = qi0 tworzą inwersję w permutacji q. Wobec tego po odpowiednim przegrupowaniu czynników możemy napisać, że rozważany składnik wyznacznika jest postaci (−1)I(p) b1p1 · · · · · bnpn = (−1)I(q) a1q1 · · · · · anqn , a więc jest składnikiem wyznacznika macierzy A. Pozostaje zauważyć, że skoro różne permutacje zbioru {1, . . . , n} mają różne permutacje odwrotne, to każdy składnik wyznacznika macierzy A będzie równy dokładnie jednemu składnikowi wyznacznika macierzy B = AT . Z ostatniego twierdzenia wynika, że każda własność wzynacznika odnosząca się do wierszy macierzy będzie także prawdziwa dla kolumn tej macierzy. Na przykład, jeśli w pewnej kolumnie macierzy kwadratowej wszystkie elementy są zerami to wyznacznik takiej macierzy jest równy zero. Załóżmy, że w danej macierzy kwadratowej A = [aij ] stopnia n zmienimy miejscami dwa wiersze; dla ustalenia uwagi załóżmy, że wiersz i-ty zmieniamy z j-tym, gdzie i < j. Tak otrzymaną macierz oznaczmy symbolem B. Oczywiście bik = ajk , bjk = aik (5) oraz alk = blk dla każdego k = 1, . . . , n oraz l 6= i, j. Dowolny składnik wyznacznika macierzy B jest wyznaczony przez pewną permutację p = (p1 , . . . , pn ) zbioru {1, . . . , n} i jest postaci (−1)I(p) b1p1 · · · · · bipi · · · · · bjpj · · · · · bnpn . Uwzględniając wzory (5) i korzystając z przemienności mnożenia możemy napisać, że składnik ten jest postaci (−1)I(p) a1p1 · · · · · ajpi · · · · · aipj · · · · · anpn = (−1)I(p) a1p1 · · · · · aipj · · · · · ajpi · · · · · anpn . W permutacji q = (q1 , . . . , qi , . . . , qj , . . . , qn ) = (p1 , . . . , pj , . . . , pi , . . . , pn ), powstałej z permutacji p w wyniku zamiany elementu pi z elementem pj zmieni się w stosunku do p ilość inwersji o liczbę nieparzystą (patrz zadanie 1 str. 33): I(q) = I(p) ± (2m − 1), m ∈ N. Stąd (−1)I(p) b1p1 · · · · · bipi · · · · · bjpj · · · · · bnpn = −(−1)I(q) a1q1 · · · · · anqn . 2. WYZNACZNIKI 55 Pokazaliśmy zatem, że każdy składnik wyznacznika macierzy B jest przeciwny do pewnego składnika wynacznika macierzy A. Ponieważ dla różnych permutacji zbioru {1, . . . , n} w wyniku zamiany i-tego elementu z j-tym otrzymamy różne permutacje, więc każdy składnik wyznacznika macierzy A będzie przeciwny do dokładnie jednego składnika wyznacznika macierzy B. Stąd otrzymujemy następujące twierdzenie Twierdzenie 2.4. Jeśli w macierzy kwadratowej zamienimy miejscami dwa wiersze (kolumny), to wyznacznik zmieni znak na przeciwny. Bezpośrednią konsekwencją ostatniego twierdzenia jest następujące: Twierdzenie 2.5. Jeśli dwa wiersze (kolumny) w macierzy kwadratowej są takie same, to wyznacznik tej macierzy jest równy zero. Istotnie, jeśli w takiej macierzy zamienimy miejscami identyczne wiersze, to macierz pozostanie taka sama. Z ostatniego twierdzenia mamy jednak, że det A = − det A, a to jest możliwe tylko wtedy, gdy det A = 0. Równie łatwą do uzasadnienia, a użyteczną własność wyznacznika odnotujmy w następnym twierdzeniu: Twierdzenie 2.6. Wspólny czynnik elementów stojących w dowolnym wierszu (kolumnie) macierzy kwadratowej można wyciągnąć przed znak wyznacznika. Aby się o tym przekonać załóżmy, że mamy daną liczbę rzeczywistą β. Zgodnie z definicją X det A = (−1)I(p) a1p1 a2p2 · · · · · anpn . p∈Pn W każdym składniku wyznacznika macierzy A występuje jako czynnik dokładnie jeden element z każdego wiersza, np. z wiersza o numerze i. Dlatego możemy napisać β det A = X (−1)I(p) a1p1 a2p2 · βaipi · · · · · anpn , p∈Pn lub inaczej a11 . .. ... a1n .. . β det A = det βai1 βai2 . . . .. .. . . an1 an2 . . . βain .. . a12 .. . ann 56 II. MACIERZE I WYZNACZNIKI Przykład 2.3. Obliczmy wyznacznik macierzy 12 44 30 6 22 15 . 6 33 35 Bezpośrednie zastosowanie definicji (schematu Sarrusa), powoduje, że musimy mnożyć przez siebie dosyć duże liczby. Natomiast twierdzenie 2.6 pozwala nam znacznie uprościć rachunki. Mamy bowiem, po wyciągnięciu liczby 6 z pierwszej kolumny, liczby 11 z drugiej oraz liczby 5 z ostatniej kolumny, następującą równość: 2 4 6 12 44 30 det 6 22 15 = 6 · 11 · 5 · det 1 2 3 , 1 3 7 6 33 35 Możemy jeszcze wyciągnąć liczbę 2 z pierwszego wiersza. Wtedy wyznacznik naszej macierzy będzie równy liczbie 1 2 3 6 · 11 · 5 · 2 · det 1 2 3 . 1 3 7 Wiemy jednak, że wyznacznik macierzy, w której dwa wiersze są takie same jest równy zero. Stąd mamy równość 12 44 30 det 6 22 15 = 6 · 11 · 5 · 0 = 0. 6 33 35 Ostatnie twierdzenie łącznie z twierdzeniem 2.5 daje nam następujące Twierdzenie 2.7. Jeśli macierz kwadratowa zawiera dwa wiersze (kolumny) proporcjonalne, to wyznacznik takiej macierzy jest równy zero. Omówimy teraz jedną z najczęściej wykorzystywanych własności wyznacznika. Niech B będzie macierzą powstałą z macierzy A = [aij ] w wyniku dodania do k–tego wiersza macierzy A jej i–tego wiersza pomnożonego przez dowolną liczbę rzeczywistą β, gdzie 1 6 k 6 n oraz i 6= k. Wówczas k-ty wiersz macierzy B będzie miał postać ak1 + βai1 , ak2 + βai2 , . . . , akn + βain . Każdy sładnik wyznacznika macierzy B jest wtedy postaci: (−1)I(p) a1p1 a2p2 · · · · · (akpk + βaipk ) · · · · · anpn , gdzie p = (p1 , p2 , . . . , pn ) jest pewną permutacją zbioru {1, . . . , n}, a I(p) ilością inwersji w permutacji p. Składnik ten jest oczywiście równy sumie (−1)I(p) a1p1 a2p2 · · · · · akpk · · · · · anpn + (−1)I(p) a1p1 a2p2 · · · · · βaipk · · · · · anpn . 2. WYZNACZNIKI 57 Wśród składników występujących w powyższej sumie rozpoznajemy postać składnika wyzncznika macierzy A – to ten stojący z lewej strony sumy oraz składnik wyznacznika macierzy C, w której k-ty wiersz jest proporcjonalny do i-tego wiersza – to ten stojący z prawej strony. Z twierdzenia 2.7 wynika, że det C = X (−1)I(p) a1p1 a2p2 · · · · · βai@,pk · · · · · anpn = 0. p∈Pn Dlatego też det B = X (−1)I(p) a1p1 · · · · · (akpk + βaipk ) · · · · · anpn = p∈Pn = X h i (−1)I(p) a1p1 · · · · · akpk · · · · · anpn + (−1)I(p) a1p1 · · · · · βaipk · · · · · anpn = p∈Pn = X (−1)I(p) a1p1 · · · · · akpk · · · · · anpn + p∈Pn X (−1)I(p) a1p1 · · · · · βaipk · · · · · anpn = p∈Pn = det A + det C = det A. Wykazaliśmy więc następujące twierdzenie: Twierdzenie 2.8. Wyznacznik macierzy nie zmieni się, jeśli do dowolnego wiersza (kolumny) dodamy inny wiersz (kolumnę) pomnożony przez dowolną liczbę rzeczywistą. Przykład 2.4. Obliczmy wyznacznik macierzy 1 1 A= 1 1 1 1 1 2 3 4 . 3 6 10 4 10 20 W tym celu pomnóżmy pierwszą kolumnę przez −1 i dodajmy kolejno do kolumny drugiej, trzeciej i czwartej. W ten sposób na mocy twierdzenia 2.8 otrzymujemy, że 1 1 det A = det 1 1 0 1 2 3 0 0 2 3 5 9 9 19 Pomnóżmy teraz drugą kolumnę przez −2 i dodajmy do trzeciej, a następnie pomnóżmy również drugą kolumnę przez −3 i dodajmy do kolumny czwartej. Otrzymujemy wówczas 1 0 0 0 1 1 0 0 det A = det . 1 2 1 3 1 3 3 10 58 II. MACIERZE I WYZNACZNIKI W końcu pomnóżmy trzecią kolumnę przez −3 i dodajmy do czwartej. Otrzymujemy 1 1 det A = det 1 1 0 1 2 3 0 0 1 3 0 0 . 0 1 Otrzymaliśmy wyznacznik macierzy trójkątnej, który jak wiemy jest równy iloczynowi liczb stojących na przekątnej czyli jest równy 1. Niech dana będzie macierz A (niekoniecznie kwadratowa) wymiarów n × m oraz liczba naturalna k, która nie jest większa ani od n ani od m. Wybierzmy z macierzy A dowolne k wierszy i k kolumn. Z wszystkich elementów, które stoją na przecięciu wybranych wierszy i kolumn można zbudować nową macierz kwadratową stopnia k. Wyznacznik tej macierzy nazywamy minorem stopnia k macierzy A. Minor danej macierzy oznaczać będziemy symbolem Mi1 ,...,ik ;j1 ,...,jk , jeśli mamy na myśli minor stopnia k wyznaczony przez wiersze o numerach i1 , . . . , ik i kolumny o numerach j1 , . . . , jk . Na przykład, jeśli 2 3 6 7 −2 A = 3 −2 1 0 5 , 4 0 2 1 −1 to # " 3 −2 = −3, M1,3;2,5 = det 0 −1 natomiast 3 7 −2 M1,2,3;2,4,5 = det −2 0 5 = 4 − 14 − 15 = −25. 0 1 −1 Jeśli Mi1 ,...,ik ;j1 ,...,jk , jest minorem macierzy kwadratowej A, to elementy macierzy A stojące na przecięciu wierszy, których numer jest różny od i1 , . . . , ik i kolumn o numerach różnych od j1 , . . . , jk tworzą również macierz kwadratową. Wyznacznik tej macierzy nazywamy dopełnieniem minora Mi1 ,...,ik ;j1 ,...,jk , który oznaczać będziemy symbolem Mi01 ,...,ik ;j1 ,...,jk . W szczególności minorami stopnia 1 są wyznaczniki macierze jednoelementowe czyli elementy macierzy. W przypadku macierzy kwadratowej stopnia n dopełnieniami elementów aij macierzy A są minory stopnia n − 1 postaci: 0 Mi;j = det Aij = a11 a21 .. . det ai−1 1 a i+1 1 . . . an1 a12 a22 .. . ... ... a1,j−1 a2,j−1 .. . a1,j+1 a2,j+1 .. . ... ... ai−1 2 . . . ai−1 j−1 ai−1 j+1 . . . ai+1 2 . . . ai+1 j−1 ai+1 j+1 . . . .. .. .. . . . an2 . . . an,j−1 an,j+1 . . . a1n a2n .. . ai−1 n , ai+1 n .. . ann 2. WYZNACZNIKI 59 czyli wyznaczniki macierzy Aij powstałych z macierzy A w wyniku skreślenia i - tego wiersza i j-tej kolumny. Dopełnieniem minora M1,3;2,3 w macierzy 1 2 3 1 0 −1 6 2 A= 1 7 −2 1 3 4 2 1 jest " 0 M1,3;2,3 # 0 2 = det = −6, 3 1 a minora M2;3 czyli elementu a23 = 6 jest 0 M2;3 1 2 1 = det 1 7 1 = 7 + 4 + 6 − 21 − 4 − 2 = −10. 3 4 1 Dla minora Mi1 ,i2 ,...,ik ;j1 ,j2 ,...,jk danej macierzy kwadratowej A liczbę (−1)t Mi01 ,i2 ,...,ik ;j1 ,j2 ,...,jk , gdzie t = i1 + · · · + ik + j1 + · · · + jk , nazywamy dopełnieniem algebraicznym minora Mi1 ,i2 ,...,ik ;j1 ,j2 ,...,jk w macierzy A. W szczególnym przypadku, dopełnienia algebraiczne elementów aij macierzy kwadratowej A będziemy oznaczać symbolem Dij . Wobec tego (6) 0 Dij = (−1)i+j Mi;j = (−1)i+j det Aij . Przykład 2.5. Niech 1 1 A= 2 2 2 1 2 0 3 6 5 0 4 # " 1 2 3 . ; oraz M = det 1 1 2 1 Widać, że minor M jest wyznaczony przez pierwszy i drugi wiersz oraz pierwszą i drugą kolumnę. Wobec tego " # 5 2 0 M = det , 0 1 i dopełnienie algebraiczne minora M jest równe: (−1)1+2+1+2 det M 0 = det M 0 = 5. Dopełnienie algebraiczne elementu 4 stojącego w pierwszym wierszu i czwartej kolumnie macierzy A jest równe D14 1 1 6 1+4 = (−1) det 2 2 5 = 14. 2 0 0 60 II. MACIERZE I WYZNACZNIKI Jeśli M jest minorem macierzy kwadratowej A, a M 0 jego dopełnieniem, to dowolny składnik minora M 0 (składnik wyznacznika M 0 ) pomnożony przez liczbę (−1)t , gdzie t jest sumą numerów wierszy i kolumn w których występuje macierz określająca minor M , nazywamy składnikiem dopełnienia algberaicznego minora M . Lemat 2.1. Jeśli M jest minorem stopnia k w macierzy kwadratowej A stopnia n, przy czym k < n, to: (1) dowolny składnik minora M pomnożony przez składnik dopełnienia algebraicznego minora M jest składnikiem wyznacznika macierzy A; (2) iloczyn minora M przez jego dopełnienie algebraiczne jest sumą k! · (n − k)! różnych składników wyznacznika macierzy A. Ustalmy w macierzy kwadratowej stopnia n wiersze o numerach i1 , . . . , ik oraz kolumny o numerach j1 , . . . , jk . Wybrane wiersze i kolumny wyznaczają minor M = Mi1 ,...,ik ;j1 ,...,jk b11 . . . . .. = det . .. bk1 . . . b1k .. . , bkk gdzie bl m = ail jm , 1 6 l 6 k, 1 6 m 6 k. Dopełnieniem tego minora będzie minor 0 M 0 = Mi01 ,...,i0n−k ;j10 ,...,jn−k c11 . . . . .. = det .. . cn−k 1 . . . c1 n−k .. , . cn−k n−k gdzie 0 , cl m = ai0l jm 1 6 l, m 6 n − k. Oczywiście 0 {i1 , . . . , ik , i01 , . . . , i0n−k } = {j1 , . . . , jk , j10 , . . . , jn−k } = {1, . . . , n} Ustalmy dowolną permutację p = (p1 , . . . , pk ) zbioru {1, . . . , k} oraz permutację q = (q1 , . . . , qn−k ) zbioru {1, . . . , n − k}. Składnik minora M wyznaczony przez permutację p jest postaci (7) (−1)I(p) b1 p1 · · · · · bk pk = (−1)I(p) ai1 jp1 · · · · · aik jpk , zaś składnik dopełnienia minora M wyznaczony przez permutację q jest postaci (8) (−1)I(q) c1 q1 · · · · · cn−k qn−k = (−1)I(q) ai01 jq0 1 · · · · · ai0n−k jq0 Zdefiniujmy permutację r zbioru {1, . . . , n} w następujący sposób: (9) rl = j ps , j 0 qs , jeśli l = is jeśli l = i0s . n−k . 2. WYZNACZNIKI 61 Zauważmy przede wszystkim, że zarówno liczby jp1 , . . . , jpk jak i liczby jq0 1 , . . . , jq0 n−k występują w porządku wzrastania dolnych wskaźników, tzn. jeśli l < m to liczba jpl poprzedza w permutacji r liczbę jpm oraz liczba jq0 l poprzedza w permutacji r liczbę jq0 m . Wynika to stąd, że i1 < · · · < ik oraz i01 < · · · < i0n−k . Obliczmy ilość inwersji w 0 permutacji r. Ponieważ także j1 < · · · < jk oraz j10 < · · · < jn−k , więc ilość inwersji w r wynikająca z poprzedzania elementu mniejszego przez większy wśród elementów postaci jp1 , . . . , jpk jest równa I(p), a ilość analogicznych inwersji występujących wśród elementów postaci jq0 1 , . . . jq0 n−k będzie równa I(q). Wobec tego ilość inwersji w permutacji r jest równa I(r) = I(p) + I(q) + w, gdzie w jest ilością inwersji występujących w r, które tworzą elementy postaci jpl oraz jq0 m . Z zadania 3 (str. 34) wynika, że ilość inwersji, w których występuje element postaci jps jest liczbą parzystą wtedy i tylko wtedy, gdy jps + is jest liczbą parzystą dla każdego s = 1, . . . , k. Wszystkie inwersje, w których występują elementy jps wyczerpią nam zbiór wszystkich inwersji permutacji r, za wyjątkiem tych, które są utworzone jedynie przez elementy jq0 s . Dlatego też I(jp1 ; r) + · · · + I(jpk ; r) = 2I(p) + w, gdzie dla każdego s = 1, . . . , k symbol I(jps ; r) oznacza ilość inwersji w permutacji r, w których występuje element pjs . Ponieważ wszystkie liczby postaci I(jps ; r) − (jps + is ), są parzyste więc liczba I(jp1 ; r) + · · · + I(jpk ; r) − (jp1 + · · · + jpk + i1 + · · · + ik ) jest parzysta, skąd wynika, że w − (jp1 + · · · + jpk + i1 + · · · + ik ) = w − (j1 + · · · + jk + i1 + · · · + ik ) jest liczbą parzystą. Mamy zatem (−1)w = (−1)j1 +···+jk +i1 +···+ik . Po wymnożeniu składnika minora M przez składnik jego dopełnienia algebraicznego (patrz wzory (7) i (8)) otrzymujemy (10) (−1)I(p) ai1 jp1 · · · · · aik jpk · (−1)i1 +···+ik +j1 +···+jk (−1)I(q) ai01 jq0 1 · · · · · ai0n−k jq0 n−k = (−1)I(p)+I(q)+w ai1 jp1 · · · · · aik jpk ai01 jq0 1 · · · · · ai0n−k jq0 n−k = = = (−1)I(r) a1r1 · · · · · anrn , czyli składnik wyznacznika macierzy A. W ten sposób dowód pierwszej części lematu został zakończony. W celu wykazania drugiej części lematu zauważmy, że minor M , jako wyznacznik macierzy stopnia k, jest sumą swoich k! składników. Z kolei jego dopełnienie, jako wyznacznik macierzy stopnia n − k, ma (n − k)! składników. Dlatego też iloczyn minora 62 II. MACIERZE I WYZNACZNIKI M przez jego dopełnienie algebraiczne ma formalnie k! · (n − k)! składników. Na mocy pierwszej części lematu każdy z nich jest składnikiem wyznacznika macierzy A. Przekonajmy się, że te wszystkie składniki są różnymi składnikami wyznacznika macierzy A. Ze wzorów (7), (8) oraz (10), wynika, że iloczyn składnika minora M przez jego dopełnienie algebraiczne jest równe składnikowi wyznacznika macierzy A postaci: (−1)I(r) a1r1 · · · · · anrn , gdzie r jest permutacją zbioru {1, . . . , n} zdefiniowanego wzorem (9), przy czym składnik minora M jest wyznaczony przez permutację p, a składnik dopełnienia algberaicznego jest wyznaczony przez permutację q zbioru {1, . . . , n − k}. Biorąc dowolny inny iloczyn składnika minora M przez składnik jego dopełnienia algebraicznego otrzymujemy składnik macierzy A postaci: 0 (−1)I(r ) a1r10 · · · · · anrn0 , gdzie r0 jest permutacją zbioru {1, . . . , n} określoną także wzorem (9), przy czym teraz składnik minora M jest wyznaczony przez pewną permutację p0 , a składnik dopełnienia algebraicznego przez permutację q 0 , gdzie p 6= p lub q 6= q 0 . Wystarczy więc pokazać, że permutacje r oraz r0 są różne. Załóżmy na przykład, że p 6= p0 (analogicznie rozumujemy, jeśli q 6= q 0 ). Wtedy dla pewnego s ∈ {1, . . . , n} mamy ps 6= p0s . Niech l = is . Wobec tego na mocy definicji permutacji r i r0 mamy rl = jps 6= jp0s = rl0 , skąd wynika, że permutacje r i r0 są różne. Własność zawartą w powyższym lemacie wykorzystamy w następujący sposób. Ustalmy dowolnie k wierszy w macierzy kwadratowej A stopnia n, gdzie 1 6 k < n. Niech M1 , M2 , . . . , Ml będą wszystkimi minorami, wyznaczonymi przez ustalone k wierszy oraz k kolumn macierzy A. Wyborom k spośród n kolumn odpowiadają dokładnie n k–elementowe kombinacje zbioru n–elementowego. Dlatego też l = k (patrz twierdzenie 2.4 str. 10). Niech Ai oznacza dopełnienie algebraiczne minora Mi dla każdego i ∈ {1, . . . , l}. Z ostatniego lematu wynika, że dla każdego i ∈ {1, . . . , l} iloczyn Mi · Ai zawiera dokładnie k! · (n − k)! różnych składników wyznacznika macierzy A. Dlatego też suma (11) M1 A1 + M2 A2 + · · · + Ml Al , zawiera formalnie l · k! · (n − k)! = nk · k! · (n − k)! = n! składników wyznacznika macierzy A. Nietrudno zauważyć, że wszystkie składniki wyznacznika macierzy A, które otrzymamy z sumy (11) będą różne. W tym celu wystarczy pokazać, że składniki macierzy A otrzymane z różnych składników Mi · Ai sumy (11) są różne. To wynika jednak stąd, że dwa różne minory Mi i Mj są wyznacznikami różnych macierzy Bi oraz Bj stopnia k znajdujących się w ustalonych k wierszach. Każdy składnik minora Mi zawierać będzie jako czynnik element z pewnej kolumny macierzy Bi , która to kolumna nie jest kolumną macierzy Bj . Ponadto żaden element tej kolumny nie jest czynnikiem 2. WYZNACZNIKI 63 składnika dopełnienia algebraicznego Aj . Tak więc wszystkie składniki wyznacznika macierzy A otrzymane z sumy (11) są różnymi składnikami wyznacznika macierzy A, a ponieważ jest ich n!, więc wyczerpują wszystkie możliwe składniki det A. W ten sposób dowiedliśmy następującego twierdzenia: Twierdzenie 2.9 (Laplace). Jeśli w macierzy kwadratowej A stopnia n jest ustalonych k wierszy, gdzie k < n, to wyznacznik macierzy A jest równy sumie wszystkich iloczynów minorów stopnia k występujących w ustalonych wierszach przez ich dopełnienia algberaiczne. Analogiczne twierdzenie jest prawdziwe, jeśli ustalimy dowolną liczbę kolumn w macierzy A. Wynika to z twierdzenia 2.3, gdyż operacja transpozycji zmienia wiersze na kolumny, a jednocześnie wyznacznik się nie zmienia. W szczególnym przypadku dla minorów stopnia 1 jako wniosek z twierdzenia Laplace’a otrzymujemy nastepujące Twierdzenie 2.10 (Wzór Laplace’a). Jeśli w macierzy kwadratowej A ustalimy wiersz o numerze i lub kolumnę o numerze j, to zachodzą następujące wzory: det A = (−1)i+1 ai1 Mi;1 + (−1)i+2 ai2 Mi;2 + · · · + (−1)i+n ain Mi;n , (12) oraz det A = (−1)1+j a1j M1;j + (−1)2+j a2j M2;j + · · · + (−1)n+j anj Mn;j . (13) Jeśli do obliczenia wyznacznika macierzy stosujemy wzór (12), to mówimy, że rozwijamy go względem i-tego wiersza. Podobnie, w przypadku stosowania wzoru (13) mówimy o rozwinięciu wyznacznika względem j-tej kolumny. Przykład 2.6. Poniżej rozwijamy wyznacznik względem czwartej kolumny. 1 1 det 2 2 2 1 2 0 3 6 5 0 4 1 2 3 1 1 6 3 = (−1)1+4 · 4 · det 2 2 5 + (−1)2+4 · 3 · det 2 2 5 + 2 2 0 0 2 0 0 1 1 2 3 1 2 3 4+4 3+4 · 1 · det 1 1 6 = + (−1) · 2 · det 1 1 6 + (−1) 2 2 5 2 0 0 = (−4) · (−14) + 3 · 8 + (−2) · 18 + 7 = 51. Otrzymamy jednak nieco prostsze rachunki, gdy rozwiniemy go względem czwartego wiersza: 1 1 det 2 2 2 1 2 0 3 6 5 0 4 2 3 4 1 2 3 3 = (−1)4+1 · 2 · det 1 6 3 + (−1)4+4 · 1 · det 1 1 6 = 2 2 5 2 2 2 5 1 = (−2) · (−22) + 7 = 51. 64 II. MACIERZE I WYZNACZNIKI Z twierdzenia Laplace’a wyprowadzimy teraz następujące twierdzenie: Twierdzenie 2.11 (Cauchy). Jeśli A i B są macierzami kwadratowymi tego samego stopnia, to det(AB) = det A · det B. Istotnie, niech A = [aij ] i B = [bij ] będą macierzami kwadratowymi stopnia n. Po ustaleniu pierwszych n wierszy w następującej macierzy C stopnia 2n a11 . . . .. . C= a n1 −1 .. . ... ... ... 0 a1n .. . 0 .. . ... 0 .. . ann 0 . . . 0 , 0 b11 . . . b1n .. .. .. . . . −1 bn1 . . . bnn otrzymujemy na mocy twierdzenia Laplace’a, że det C = det A · det B, (14) gdyż jedynym niezerowym minorem w pierwszych n wierszach macierzy C jest det A, a jego dopełnienie algebraiczne jest równe (−1)2(1+···+n) det B = det B. Z drugiej strony, korzystając z twierdzenia 2.8, możemy tak przekształcić macierz C nie zmieniając jej wyznacznika, aby w miejscu występowania elementów aij pojawiły się zera. W tym celu pomnożymy n+1-szy wiersz macierzy C przez liczbę a11 i dodamy do wiersza pierwszego. Następnie n + 2-gi wiersz pomnożymy przez liczbę a12 i dodamy do pierwszego i tak dalej aż do wiersza o numerze 2n, który mnożymy przez a1n i dodajemy do pierwszego. W ten sposób w pierwszym wierszu w kolumnach do n-tej włącznie pojawią się zera. Następne wyrazy pierwszego wiersza będą równe odpowiednio: a11 b11 + · · · + a1n bn1 = n X a1j bj1 , . . . , a11 b1n + · · · + a1n bnn = n X a1j bjn . j=1 j=1 Działając analogicznie na wiersz drugi, trzeci i tak dalej, kończąc na n-tym otrzymamy w miejscu elementów aij zera. Pozostałe wyrazy tych wierszy będą równe a21 b11 + · · · + a2n bn1 = n X a2j bj1 , . . . , a21 b1n + · · · + a2n bnn = j=1 a31 b11 + · · · + a3n bn1 = n X j=1 n X a2j bjn j=1 a3j bj1 , . . . , a31 b1n + · · · + a3n bnn = n X a3j bjn j=1 .................................................................................................................. 2. WYZNACZNIKI an1 b11 + · · · + ann bn1 = n X anj bj1 , . . . , an1 b1n + · · · + ann bnn = j=1 65 n X anj bjn . j=1 Zauważmy, że wyrazy te, to zgodnie ze wzorem (3) (patrz str. 47) elementy iloczynu macierzy AB. W ten sposób otrzymamy macierz " # 0 AB D= , −In B której det D = det C. (15) Korzystając jeszcze raz z twierdzenia Laplace’a dla pierwszych n wierszy macierzy D otrzymujemy det D = det(AB) · (−1)1+2+···+n+(n+1)+···+2n det(−In ) = = det(AB) · (−1) (1+2n)2n 2 · (−1)n = det(AB)(−1)2n(n+1) = det(AB). Z ostatniej równości oraz z (14) i (15) wynika, że det A · det B = det C = det D = det(AB). 66 II. MACIERZE I WYZNACZNIKI 3. Macierz odwrotna Macierz kwadratową B stopnia n nazywamy macierzą odwrotną do macierzy kwadratowej A stopnia n jeśli: AB = In , gdzie In jest macierzą jednostkową stopnia n. Macierz odwrotną do macierzy A oznaczamy symbolem A−1 . Załóżmy, że macierz kwadratowa A ma macierz odwrotną. Wtedy z twierdzenia Cauchy’ego otrzymujemy równość det(A · A−1 ) = det A · det A−1 . Ponieważ A · A−1 = In , oraz det In = 1, więc det A · det A−1 = 1, a wobec tego det A 6= 0. Stąd wynika, że jeśli macierz kwadratowa ma macierz odwrotną, to musi ona mieć wyznacznik różny od zera. Okazuje się, że prawdziwe jest także twierdzenie odwrotne. Twierdzenie 3.1. Dla dowolnej macierzy kwadratowej A istnieje macierz odwrotna wtedy i tylko wtedy, gdy det A 6= 0. Pozostaje wykazać, że macierz A o wyznaczniku różnym od zera ma macierz odwrotną. Załóżmy, że det A 6= 0. Okazuje się, że macierz B dana wzorem: T (1) D11 D12 . . . D1n D21 D22 . . . D2n 1 B= .. .. .. , det A . . . Dn1 Dn2 . . . Dnn 0 gdzie Dij = (−1)i+j Mi;j jest dopełnieniem algberaicznym elementu aij , jest macierzą odwrotną macierzy A. Sprawdzimy, że A · B = In Jeśli zamienimy j-tą kolumnę macierzy A kolumną k-tą, tzn. a1k a2k . , . . ank to wyznacznik z tak otrzymanej macierzy, zgodnie z twierdzeniem 2.5, będzie równy zero, jeśli k 6= j (jeśli k = j, to nic nie zmieniamy i wyznacznik będzie równy det A). Z drugiej strony rozwijając wyznacznik tak zmienionej macierzy względem j-tej (nowej zmienionej kolumny) otrzymamy zgodnie ze wzorem Laplace’a, że 0 0 0 (−1)1+j a1k M1;j + (−1)2+j a2k M2;j + · · · + (−1)n+j ank Mn;j = 0, 3. MACIERZ ODWROTNA 67 jeśli j 6= k, oraz 0 0 0 (−1)1+j a1j M1;j + (−1)2+j a2j M2;j + · · · + (−1)n+j anj Mj;n = det A. 0 Ostatnie dwie równości możemy krótko zapisać, pamiętając, że Dij = (−1)i+j Mi;j ,w następującej postaci (2) n X aik Dij = δkj det A, i=1 gdzie symbol δkj oznacza deltę Kroneckera. Analogiczny wzór prawdziwy jest dla wierszy: (3) n X aki · Dji = δkj det A. i=1 Przyjmijmy W = det A. Wówczas element cij macierzy A · B, jest na mocy definicji iloczynu macierzy równy cij = ai1 · 1 1 1 · Dj1 + ai2 · · Dj2 + · · · + ain · Djn = W W W n 1 X 1 = ai1 · Dj1 + ai2 · Dj2 + · · · + ain · Djn = aik Djk W W k=1 Jednak zgodnie ze wzorem (3) wiemy, że powyższa suma jest równa δij · W . Stąd cij = δij , a to oznacza, że AB = [δij ] = In . Zauważmy, że jeśli AB = In , to również BA = In . Istotnie, jeśli AB = In , to zarówno macierz A jak i B ma wyznacznik różny od zera. Z ostatniego twierdzenia wynika, że istnieje macierz odwrotna do B. Wobec tego B −1 = In B −1 = (AB)B −1 = A(BB −1 ) = AIn = A, a stąd BA = BB −1 = In . Macierze kwadratowe o wyznaczniku różnym od zera nazywamy macierzami nieosobliwymi. Tak więc macierze nieosobliwe (i tylko one) mają macierz odwrotną. Dowód ostatniego twierdzenia podaje nam metodę wyznaczania macierzy odwrotnej. Rozpatrzmy macierz A, dla której det(A) 6= 0. Budujemy macierz D, której elementami są dopełnienia algebraiczne elementów macierzy A, tzn. D11 D12 . . . D21 D22 . . . D= .. .. . . Dn1 Dn2 . . . D1n D2n .. , . Dnn 68 II. MACIERZE I WYZNACZNIKI a następnie tę macierz transponujemy. Teraz aby otrzymać macierz odwrotną wystarczy każdy element macierzy DT podzielić przez det A. Przykład 3.1. Wyznaczyny macierz odwrotną do macierzy 2 5 2 A = 6 3 1 . 7 3 1 Wpierw obliczamy wyznacznik: 2 5 2 det 6 3 1 = −1. 7 3 1 Następnie obliczamy dopełnienia algebraiczne kolejnych elementów macierzy A: 1+1 D11 = (−1) D21 D31 5 = (−1) det 3 5 = (−1)3+1 det 3 2+1 3 1 6 1 6 3 det = 0, D12 = (−1)1+2 det = 1, D13 = (−1)3+1 det = −3, 3 1 7 1 7 3 2 2 2 2 = 1, D22 = (−1)2+2 det = −12, D23 = (−1)2+3 det 1 7 1 7 2 2 2 2 = −1, D32 = (−1)3+2 det = 10, D33 = (−1)3+3 det 1 6 1 6 5 = 29, 3 5 = −24. 3 Mamy zatem 0 1 −1 DT = 1 12 10 . −3 29 −24 Stąd otrzymujemy macierz odwrotną: A−1 0 −1 1 0 1 −1 1 = DT = − 1 12 10 = −1 −12 −10 . −1 3 −29 24 −3 29 −24 Z wyprowadzonych dotąd wzorów i twierdzeń nietrudno już wyprowadzić kilka dalszych: Twierdzenie 3.2. Jeśli macierze A i B są macierzami nieosobliwymi tego samego stopnia, to zachodzą następujące wzory: (c) (AB)−1 = B −1 A−1 ; 1 det(A−1 ) = ; det(A) (A−1 )−1 = A; (d) (A−1 )T = (AT )−1 . (a) (b) 4. ZADANIA DO ROZDZIAŁU II 69 4. Zadania do rozdziału II Zadanie 41. Dane są macierze: " # " # " # 2 −3 −2 3 1 2 3 A= , B= , C= , −1 4 1 −4 0 3 1 1 2 0 2 −1 3 D = 0 −1 3 , E = 1 0 2 . 2 1 5 0 3 0 Sprawdź czy wykonalne są działania, a jeśli tak to wykonaj je: (a) 2A + B, DC T , (A + D)C; (b) (A − B)C, CDE, (D + E)C T ; (c) C T (A + D), A2 + C, A + C 2 . Zadanie 42. Sprawdzić, że dla dowolnych macierzy A ∈ Rm×n , B ∈ Rn×k zachodzi wzór (AB)T = B T AT . Zadanie 43. Rozważmy ciąg {an }∞ n=0 zadany rekurencyjnie: a0 = 0, a1 = 1 oraz ∞ an+1 = an−1 + an dla n ­ 2. Ciąg {an }n=0 nazywany jest ciągiem Fibbonaciego. Sprawdzić, że dla każdej liczby naturalnej n zachodzi równość " # " an+1 an 1 1 = an an−1 1 0 #n Zadanie 44. Macierz A nazywa się symetryczną, jeśli A = AT . Udowodnić, że (a) jeśli macierz A jest symetryczna, to dla dowolnej macierzy B macierz BAB T też jest symetryczna; (b) jeśli A i B są macierzami symetrycznymi, to AB jest macierzą symetryczną wtedy i tylko wtedy, gdy AB = BA; (c) jeśli macierz odwracalna A jest symetryczna, to A−1 także jest symetryczna. Zadanie 45. Obliczyć wyznaczniki następujących macierzy: (a) 1 1 1 1 2 3 , 1 3 6 5 −3 11 5 2 −9 ; 1 −4 −12 (b) 1 2 3 4 1 5 2 6 7 8 , 9 10 11 12 3 13 14 15 16 4 2 3 4 1 3 4 1 2 4 1 1 1 , 2 0 3 0 1 1 1 0 0 1 1 1 0 1 1 0 , 1 1 1 1 1 1 1 2 3 4 ; 4 9 16 8 27 64 70 II. MACIERZE I WYZNACZNIKI (c) 2 1 1 1 1 1 3 1 1 1 1 1 4 1 1 1 1 1 5 1 1 1 5 1 1 , 4 1 3 2 6 2 1 5 4 3 3 2 1 5 4 4 3 2 1 5 0 5 1 4 3 , 1 2 1 1 1 1 0 1 1 1 1 1 0 1 1 1 1 1 0 1 1 1 1 ; 1 0 (d) 1 a1 a2 a3 a4 1 a + b a a a 1 1 2 3 4 a1 a2 + b 2 a3 a4 , 1 1 a1 a2 a3 + b 3 a4 1 a1 a2 a3 a4 + b 4 Odpowiedzi (a): 1; 564. (b): 0; 160; −1; 12. (c): 394; 1875; 4. (d): b1 b2 b3 b4 . Zadanie 46. Wykazać, że wyznacznik dowolnej macierzy kwadratowej wyznaczony przez elementy stojące w lewym górnym rogu „prostokątnego” trójkąta Pascala (patrz zadanie 9 str. 35), tzn. wyznacznik macierzy 1 1 ... 1 1 1 ... 1 1 1 2 3 n 3 . . . n 1 1 2 ... 1 1 1 n+1 1 3 3 4 n+1 6 ... = 1 ... 2 2 2 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2n−2 n n+1 2n−2 1 n n+1 . . . 1 ... n−1 n−1 n−1 n−1 n−1 jest równy 1. Wskazówka: Od każdej kolumny odjąć poprzednią, a następnie od każdego wiersza odjąć poprzedni. Wykorzystać tożsamość (8) ze str. 9, a następnie stosując wzór Laplace’a rozwinąć wyznacznik według pierwszej kolumny (lub wiersza). Zauważyć, że wyznacznik tak powstałej macierzy jest równy wyznacznikowi analogicznej macierzy mającej o jedną kolumnę mniej. Zadanie 47. Wykazać, że 1 2 3 ... n − 1 n n 1 2 . . . n − 2 n − 1 nn−1 (n + 1) n − 1 n 1 . . . n − 3 n − 2 . det = (−1)n−1 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 3 4 ... n 1 (a) 4. ZADANIA DO ROZDZIAŁU II 71 Wskazówka: Od każdego wiersza poczynając od pierwszego odjąć następny, po czym od każdej kolumny odjąć ostatnią. Pomnożyć każdą z kolumn z wyjątkiem ostatniej przez − n1 i dodać do ostatniej kolumny. 0 1 1 ... 1 1 0 1 . . . 1 1 1 0 . . . 1 = (−1)n−1 (n − 1). det . . . . . . . . . . . . . . . 1 1 1 ... 0 (b) Wskazówka: Od każdego wiersza poczynając od drugiego odjąć wiersz pierwszy. Następnie do pierwszej kolumny dodać kolejno wszystkie kolumny począwszy od drugiej. Zadanie 48. Dla jakich wartości x ∈ R zachodzą równości: (a) 1 1 1 1 1 x − 1 1 1 =0 det 1 1 x−2 1 1 1 1 x−3 (b) 1 x x x x 1 x x =0 det x x 1 x x x x 1 (c) 1 x x 2 x3 1 a a2 a3 = 0, det 1 b b2 b3 1 c c 2 c3 gdzie (a − b)(b − c)(c − a) 6= 0. Odpowiedzi (a): x = 2, x = 3, x = 4. (b): x = 1, x = − 31 . (c): x = a, x = b, x = c. Zadanie 49. Wykazać, że dla równości: (a) a+b det a b (b) 1 1 det a b a2 b 2 dowolnych liczba a, b, c ∈ R zachodzą następujące b a 3 3 a+b b = 2(a + b ). a a+b 1 c = (a − b)(b − c)(c − a). c2 72 II. MACIERZE I WYZNACZNIKI (c) a 0 det 0 b 0 a b 0 0 b a 0 b 0 = (a2 − b2 )2 . 0 a Zadanie 50. Wykazać, że wyznacznik 1 2 det 7 1 0 4 2 2 1 3 9 8 4 1 3 7 jest podzielny przez 13. Wskazówka: Do kolumny czwartej dodać kolejno: kolumnę pierwszą pomnożoną przez 1000, kolumnę drugą pomnożoną przez 100 i kolumnę trzecią pomnożoną przez 10, a następnie skorzystać z równości 13 · 78 = 1014, 13 · 187 = 2431, 13 · 561 = 7293 oraz 13 · 99 = 1287 Zadanie 51. Wykazać, że jeśli macierz kwadratowa A jest stopnia n, a macierz kwadratowa B jest stopnia m, to wyznacznik macierzy kwadratowej D stopnia m + n, gdzie " # A 0 D= C B jest równy det A · det B. Wskazówka: Wykorzystać ogólny wzór Laplace’a. Zadanie 52. Obliczyć przy pomocy ogólnego wzoru Laplace’a następujące wyznacznik 1 2 3 0 2 0 1 2 0 1 0 0 1 0 0 det 5 6 7 1 0 8 9 0 3 1 Zadanie 53. Obliczyć macierze (a) 1 2 0 1 0 0 (b) 4 1 0 0 odwrotne do macierzy: −3 2 2 3 2 , 1 −1 0 1 −1 2 1 7 0 0 1 1 1 1 1 1 1 −1 −1 0 2 0 0 , , 0 7 −4 1 −1 1 −1 0 0 −5 3 1 −1 −1 1 0 3 −5 7 1 2 1 2 −3 , 0 1 2 1 0 0 1 1 1 2 2 1 3 1 3 2 2 2 4 3 4. ZADANIA DO ROZDZIAŁU II 73 (c) −2 −2 −1 −1 1 4 2 1 2 1 2 4 , 1 1 4 1 9 1 1 8 2 5 4 3 2 4 3 2 2 −2 5 −2 0 3 −2 3 −6 2 , 2 −3 5 −8 2 −2 2 −3 1 2 5 1 0 1 4 2 5 4 , 3 −1 2 3 5 4 −1 3 2 4 1 4 3 5 2 5 1 3 −1 2 4 1 4 3 , 0 2 1 1 1 7 −2 5 (d) 1 3 2 1 1 1 0 1 6 −2 4 5 , 3 −1 2 2 2 0 2 1 4 2 3 2 , 1 1 4 3 4 1 4 3 −1 2 0 2 1 7 −2 5 (e) 3 1 1 1 5 2 4 3 4 2 3 2 3 −2 3 −6 2 3 0 2 −2 5 −2 1 , , 2 −3 5 −8 2 2 2 −2 2 −3 1 1 6 −2 4 4 1 0 1 2 , 3 −1 2 1 0 2 1 1 8 6 4 3 6 5 3 2 5 2 . 2 2 (f) 1 2 2 0 3 3 1 7 2 2 , 7 1 5 3 2 −1 3 7 7 1 2 1 3 3 3 1 4 5 0 1 1 0 , 3 0 1 4 0 1 0 2 5 −2 9 2 , 3 −1 5 3 3 1 0 1 1 3 5 5 2 4 5 9 . 8 13 7 11 Odpowiedź (a): 1 −2 7 0 1 −2 ; 0 0 1 1 −4 −3 1 −5 −3 −1 6 4 (b): 2 −7 0 0 1 −3 11 −38 1 1 1 1 2 3 −7 6 −1 4 0 0 1 1 1 −1 −1 0 1 −2 1 7 −1 2 7 −10 , , , . 0 1 −2 7 4 −1 0 −2 0 3 4 4 1 −1 1 −1 0 0 0 0 5 7 0 0 0 1 1 −1 −1 1 −3 −1 0 5 Zadanie 54. Z równania A · X · B = C T · B wylicz macierz X wiedząc, że 2 1 1 −2 1 0 1 0 1 A = 1 3 1 , B = 5 6 7 , C = 1 1 0 . 2 0 1 2 0 0 0 1 1 Zadanie 55. Z równania A · X · B = C · B T wylicz macierz X wiedząc, że 1 0 0 1 1 1 1 1 1 A = 3 3 2 , B = 1 2 3 , C = 0 1 1 . 0 2 1 1 3 4 0 0 1 74 II. MACIERZE I WYZNACZNIKI Zadanie 56. Z równania AT · X · B = A · C wylicz macierz X wiedząc, że 0 1 1 2 1 1 1 3 1 A= 3 2 1 , B = 3 2 −1 , C = 1 0 1 . 0 1 0 2 1 0 1 1 1 Zadanie 57. Z równania A · X · B = A · C T wylicz macierz X wiedząc, że 1 2 3 1 4 1 0 0 −1 (a) A = 0 1 2 , B = 3 3 2 , C = 0 1 0 . 0 0 1 2 0 1 1 0 0 1 0 1 2 1 1 4 5 6 (b) A = 2 1 0 , B = 1 3 1 , C = 1 1 0 . 0 1 1 2 0 1 2 0 0 1 2 3 1 −1 0 1 1 1 0 1 2 3 1 3 (c) A = ,B = , C = 0 1 1 . 0 0 1 −1 2 1 0 0 1 Zadanie 58. Z równania A · X · B = A · C wyliczyć macierz X wiedząc, że 0 0 1 3 1 2 1 1 2 A = 1 4 1 , B = 0 1 0 , C = 0 1 0 . 1 0 0 1 0 1 2 0 1 Zadanie 59. Z równania AT · X · B = C 2 · B wyliczyć macierz X wiedząc, że 1 1 0 1 1 1 3 0 1 A = 1 1 0 , B = 0 1 1 , C = 1 2 0 . 0 0 1 0 0 1 2 0 1 Zadanie 60. Z równania (A · X · B)T = C · AT wylicz macierz X wiedząc, że 0 0 −1 1 3 1 1 2 3 A= 0 1 2 , B = 1 4 1 , C = 0 1 0 . 1 0 0 2 0 1 0 0 1 Zadanie 61. Mając daną macierz 1 1 −1 A = 1 −1 −1 1 1 −1 znaleźć macierz kwadratową X stopnia 3, jeśli wiadomo, że macierz A−1 · X · A jest macierzą diagonalną oraz 0 0 0 −1 2 A · X · A = 0 1 0 . 0 0 9 4. ZADANIA DO ROZDZIAŁU II 75 Wskazówka: Wykorzystać równość A−1 · X 2 · A = (A−1 · X · A) · (A−1 · X · A). Zadanie 62. Wykazać, że iloczyn oraz macierz odwrotna dla macierzy postaci 1 a b 0 1 c 0 0 1 jest macierzą takiej samej postaci. Zadanie 63. Sprawdzić prawdziwość wzorów (a) – (d) z twierdzenia 3.2 str. 68. ROZDZIAŁ III Układy równań liniowych 1. Układy równań liniowych Rozważmy układ m równań z n niewiadowymi x1 , x2 , . . . , xn : (1) a11 x1 + a12 x2 + · · · + a1n xn = b1 a21 x1 + a22 x2 + · · · + a2n xn = b2 . . ................................ am1 x1 + am2 x2 + · · · + amn xn = bm , gdzie aij , bi ∈ R, dla i, j 6 n. Powyższy układ możemy zapisać także w postaci a11 a21 . . . a12 a22 .. . ... ... am1 am2 . . . a1n x1 b1 a2n x b2 2 . = . .. . .. .. amn xn bm Macierz A = [aij ] będziemy nazywać macierzą układu równań (1), a wektory kolumnowe b1 x1 b2 x2 x= .. , b = .. . . bm xn odpowiednio kolumną niewiadomych i kolumną wyrazów wolnych układu równań (1). Tak więc układ równań możemy zapisać w postaci następującego równania macierzowego: Ax = b. Wektor kolumnowy c1 c2 c= .. , . cn gdzie c1 , . . . , cn są liczbami rzeczywistymi, będziemy nazywać rozwiązaniem układu równań (1), jeśli po podstawieniu za każdą niewiadomą xi liczby ci we wszystkich równaniach układu otrzymamy równość. Układ równań nazywamy niesprzecznym, jeśli ma on przynajmiej jedno rozwiązanie. W przeciwnym przypadku układ nazywamy sprzecznym. Jeśli układ ma więcej niż jedno rozwiązanie, to nazywamy go nieoznaczonym. 77 78 III. UKŁADY RÓWNAŃ LINIOWYCH Układ równań liniowych nazywamy układem Cramera, jeśli liczba niewiadomych w tym układzie jest równa ilości równań oraz macierz układu równań jest nieosobliwa. Załóżmy, że układ równań postaci (1) jest układem Cramera. Wtedy m = n oraz det A 6= 0. Poszukajmy rozwiązań takiego układu równań. Jeśli c jest rozwiązaniem układu, to Ac = b. Wobec nieosobliwości macierzy A, istnieje macierz odwrotna A−1 , a zatem c = A−1 b. Zgodnie ze wzorem (1) mamy A−1 D11 D21 . . . Dn1 D12 D22 . . . Dn2 1 = .. .. , .. det A . . . D1n Dn2 . . . Dnn a zatem c1 D11 D21 . . . Dn1 b1 D12 D22 . . . Dn2 c2 b2 1 .=c= . .. .. . . . det A . .. . . .. cn D1n Dn2 . . . Dnn bn Mnożąc macierze zapisane po prawej stronie ostatniej równości otrzymujemy, wzór D1i b1 + D2i b2 + · · · + Dni bn det A dla każdego i 6 n. Skorzystajmy ze wzoru Laplace’a i zauważamy, że licznik tego ułamka przedstawia wyznacznik macierzy A, w której i-tą kolumnę zastąpiono kolumną wyrazów wolnych. W ten sposób wykazaliśmy następujące twierdzenie: ci = (2) Twierdzenie 1.1. Układ Cramera ma dokładnie jedno rozwiązanie c1 c2 c= .. . cn gdzie elementy ci dla i 6 n wyrażają się wzorami (2). Przykład 1.1. Rozwiążemy układ równań 3x1 x1 −x1 −4x1 −5x2 +3x2 −x2 +5x2 −2x3 +2x3 −x3 +2x3 −2x4 −x4 +x4 +3x4 =1 =0 = −1 =0 1. UKŁADY RÓWNAŃ LINIOWYCH 79 Obliczamy wyznacznik układu równań: 3 −5 −2 −2 1 3 2 −1 = −1. det −1 −1 −1 1 −4 5 2 3 Stąd układ jest układem Cramera. Następnie obliczamy wyznaczniki czterech macierzy, które powstają w wyniku zastąpienia odpowiednio pierwszej, drugiej, trzeciej i czwartej kolumny kolumną wyrazów wolnych. 1 −5 −2 −2 0 3 2 −1 = 2, det −1 −1 −1 1 0 5 2 3 3 1 −2 −2 1 0 2 −1 = 3, det −1 −1 −1 1 −4 0 2 3 3 −5 1 −2 3 −5 −2 1 1 3 0 −1 3 2 0 1 det = −5, det = 1. −1 −1 −1 1 −1 −1 −1 −1 −4 5 0 3 −4 5 2 0 Dlatego rozwiązaniem układu równań jest wektor kolumnowy −2 −3 . 5 −1 80 III. UKŁADY RÓWNAŃ LINIOWYCH 2. Przekształcenia elementarne macierzy Przekształceniami elementarnymi na wierszach (kolumnach) macierzy nazywamy następujące operacje: (1) mnożenie dowolnego wiersza (kolumny) przez liczbę różną od zera; (2) dodanie do wiersza (kolumny) innego wiersza (kolumny) pomnożonego przez dowolną liczbę. (3) przestawienie miejscami dwóch dowolnych wierszy (kolumn) macierzy; Nietrudno zauważyć, że przkształcenie (3), tzn. zamiana wierszy może być łatwo uzyskana poprzez zastosowanie operacji (1) oraz (2). Istotnie, jeśli chcemy w macierzy zamienić dwa wiersze powiedzmy wiersz i-ty z wierszem k-tym, to na początek dodajmy do i-tego wiersza k-ty. Następnie tak otrzymany wiersz pomnóżmy przez -1. Wtedy w i-tym wierszu mamy elementy postaci −aij − akj . Po dodaniu tego wiersza do wiersza k-tego, w k-tym wierszu otrzymamy liczby postaci −aij . Tak więc po wymnożeniu go przez −1 w k-tym wieszu dostaniemy wiersz o numerze i. Następnie dodając go do wiersza o numerze i i mnożąc tak otrzymany wiersz i-ty przez −1, w i-tym wierszu pojawi się wiersz k-ty. Jeśli macierz B jest otrzymana z macierzy A poprzez zastosowanie przekształceń elementarnych na wierszach to mówimy, że macierze A i B są równoważne, co zapisujemy w postaci A ' B. Macierz kwadratową nazywamy macierzą elementarną, jeśli spełnia jeden z dwóch warunków: (a) jest ona macierzą diagonalną, w której na przekątnej występują same jedynki z wyjątkiem co najwyżej jednego elementu, który jest różny od zera; (b) jest macierzą, w której na przekątnej są same jedynki, a poza nią same zera z wyjątkiem jednego elementu niezerowego. Twierdzenie 2.1. Przekształceniom elementarnym typu (1) i (2) na wierszach macierzy A wymiarów m × n odpowiadają iloczyny macierzy elementarnych stopnia n typu (a)i (b), przez macierz A. Istotnie zauważmy, że przekształcenie typu (1), tj. pomnożenie i-tego wiersza przez liczbę α 6= 0 można otrzymać mnożąc (z lewej strony) macierz A przez macierz elementarną w której i-ty element stojący na przekątnej jest równy α: a11 . .. αai1 .. . am1 a12 .. . ... a1n .. . 1 . .. 0 ... .. . 0 ... .. . 0 a11 . .. . .. a12 . . . .. . a1n .. . αai2 . . . .. . αain = 0 .. . . .. 0 ... .. . α ... .. . 0 ai1 .. .. . . ai2 . . . .. . ain .. . an2 amn 0 0 ... 0 ... 1 ... am1 an2 . . . amn 2. PRZEKSZTAŁCENIA ELEMENTARNE MACIERZY 81 Dodanie j-tego wiersza macierzy A pomnożonego przez liczbę α do i-tego otrzymujemy mnożąc macierz A (z lewej strony) przez macierz elementarną typu (2), w której aij = α. Na przykład a11 + αa21 a12 + αa22 . . . .. .. . . a1n + αa2n .. . αai1 .. . αai2 .. . ... αain .. . am1 an2 ... amn = 1 α 0 ... 0 1 0 . . . 0 0 1 ... = .. .. .. . . . 0 0 0 ... 0 a11 0 a21 a31 0 .. .. . . 1 a12 . . . a22 . . . a32 . . . .. . am1 an2 . . . a1n a2n a3n . .. . amn Twierdzenie 2.2. Każdą macierz niezerową można przekształcić za pomocą operacji elementarnych na wierszach do postaci schodkowej, tj. do postaci 0 . . . 0 b1j1 . . . b1j2 . . . b1jk . . . b1n 0 . . . 0 0 . . . b2j2 . . . b2jk . . . b2n 0 . . . 0 . . . b3jk . . . b3n 0 . . . 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . , 0 . . . 0 0 . . . 0 . . . bkjk . . . bkn 0 ... 0 ... 0 ... 0 0 . . . 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 ... 0 0 ... 0 ... 0 ... 0 gdzie k 6 n, liczby b1j1 , . . . , bkjk są liczbami różnymi od zera, a wszystkie elementy znajdujące we wszystkich wierszach począwszy od k + 1-ego oraz stojące z lewej strony b1j1 , . . . , bkjk są równe zero, tzn. bij = 0 dla i > k + 1 oraz bij = 0 dla j < ji , gdzie i = 1, . . . , k. Przykładami macierzy schodkowych są macierze 0 1 2 3 0 0 1 1 , 0 0 0 1 0 0 2 0 0 0 0 3 1 0 0 0 8 5 4 1 0 1 2 4 . 1 0 Istotnie, jeśli mamy macierz o jednym wierszu niezerowym, to jest ona oczywiście schodkowa. Przypuśćmy, że nasze twierdzenie jest prawdziwe dla macierzy, które mają m wierszy. Rozważmy dowolną macierz niezerową, która ma m + 1 wierszy. Istnieje kolumna tej macierzy, w której jest przynajmniej jeden element różny od zera. Ustalmy 82 III. UKŁADY RÓWNAŃ LINIOWYCH taką kolumnę o najniższym numerze (będzie to pierwsza taka kolumna patrząc od lewej strony). Niech numer tej kolumny będzie równy j1 . Jeśli liczba stojąca w pierwszym wierszu w koumnie j1 jest równa zero, to dokonajmy operacji elementarnej polegającej na zamianie pierwszego wiersza z dowolnym wierszem, w którym jest element niezerowy kolumny o numerze j1 (gdyby liczba ta była różna od zera, to nie wykonujemy żadnej operacji). W ten sposób otrzymamujemy macierz, w której w pierwszym wierszu element stojący w kolumnie j1 -ej jest niezerowy, a wszystkie wyrazy poprzedzające ten element w pierwszym wierszu są równe 0. Oznaczmy ten niezerowy element symbolem b1j1 . Stosując operacje elementarne możemy teraz tak przekształcić macierz aby w miejscu elementów niezerowych bij1 występujących ewentualnie pod elementem b1j1 pojawiły się zera. W tym celu wystaczy pomnożyć wiersz pierwszy przez bij − 1 b1j1 i dodać do wiersza i-tego. Po wykonaniu tych wszystkich operacji macierz zostanie przekszałcona do postaci b1j1 +1 . . . b1n 0 . . . 0 b1j1 0 . . . 0 0 b2j1 +1 . . . b2n . B= . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 . . . 0 0 bm+1j1 +1 . . . bm+1n Macierz b2j1 +1 . . . b2n . . . . . . . . . . . . . . . . . . . . , bm+1j1 +1 . . . bm+1n jest macierzą o m wierszach, a więc korzystając z założenia indukcyjnego możemy ją sprowadzić do macierzy schodkowej przy pomocy operacji elementarnych na wierszach. Operacje te odpowiadają dokładnie operacjom na wierszach od drugiego do m + 1-ego macierzy B. Odpowiadające operacje nie zmienią wiersza pierwszego i kolumn o numerach mniejszych od j1 , a zatem doprowadzą wyjściową macierz do postaci schodkowej. Tak więc z zasady indukcji matematycznej wynika, że twierdzenie 2.2 jest prawdziwe dla każdej macierzy. Przy pomocy tego twierdzenia możemy podać znacznie efektywniejszą metodę wyznaczania macierzy odwrotnej niż ta wynikająca z twierdzenia 3.1. Załóżmy, że macierz A stopnia n jest nieosobliwa. Wiemy już, że dokonując operacji elementarnych na wierszach macierzy A możemy ją sprowadzić do macierzy schodkowej B postaci b11 b12 . . . b1n 0 b b2n 22 . . . B= . . . . . . . . . . . . . . . . . . 0 0 . . . bnn Elementy stojące na przekątnej powyższej macierzy są niezerowe, gdyż operacje elementarne przekształcają macierz nieosobliwą w nieosobliwą. Jeśli teraz dla każdego 2. PRZEKSZTAŁCENIA ELEMENTARNE MACIERZY 83 i 6 n pomnożymy wiersze o numerze i macierzy B przez odwrotności elementów bii (czyli zastosujemy operacje elementarne typu (1)), to otrzymamy macierz postaci 1 c12 . . . c1n 0 1 . . . c 2n C= . . . . . . . . . . . . . . . . 0 0 ... 1 Teraz już łatwo widać, że stosując operacje elementarne typu (2) na wierszach macierzy C otrzymamy macierz jednostkową In . Z drugiej strony twierdzenie 2.2 mówi, że każdej operacji elementarnej na wierszach macierzy A odpowiada pomnożenie tej macierzy z lewej strony przez odpowiednią macierz elementarną. Możemy więc napisać, że E1 E2 . . . El A = In , gdzie E1 , E2 , . . . , El są macierzami elementarnymi odpowiadającymi operacjom elementarnym prowadzącym od macierzy A do macierzy B, od B do C i w końcu od C do In . Z ostatniej równości wynika zatem, że E1 E2 . . . El In = A−1 . Ostatnie dwie równości możemy zinterpretować w postaci następującego twierdzenia. Twierdzenie 2.3. Aby otrzymać macierz odwrotną do macierzy nieosobliwej A stopnia n należy dokonać tych samych przekształceń elementarnych na wierszach macierzy jednostkowej In , co na wierszach macierzy A, które prowadzą do macierzy In . Przykład 2.1. Znajdziemy macierz odwrotną do macierzy 2 7 3 A = 3 9 4 1 5 3 metodą przekształceń elementarnych tzn. stosując twierdzenie 2.3. Ponieważ mamy wykonywać te same przekształcenia elementarne na wierszach macierzy A i na wierszach macierzy I3 tworzymy macierz powstałą z A uzupełniając ją macierzą jednostkową stopnia 3 2 7 3 | 1 0 0 3 9 4 | 0 1 0 ' 1 5 3 | 0 0 1 Dalej, zgodnie z twierdzeniem, będziemy się starać przekształcić macierz A do I3 , dokonując tych samych operacji elementarnych na wierszach macierzy I3 . Zgodnie z definicją macierze równoważne, to takie, że jedna z nich może być otrzymana z drugiej w wyniku zastosowania operacji elementarnych, więc kolejno otrzymywane macierze będziemy na początku i końcu oznaczać symbolem „'”. Wpierw zmieniamy kolejność wierszy: 1 5 3 | 0 0 1 ' 2 7 3 | 1 0 0 ' 3 9 4 | 0 1 0 84 III. UKŁADY RÓWNAŃ LINIOWYCH Mnożymy teraz pierwszy wiersz macierzy przez −2 i dodajemy do wiersza drugiego a następnie mnożymy pierwszy wiersz przez −3 i dodajemy do wiersza trzeciego: 1 5 3 | 0 0 1 ' 0 −3 −3 | 1 0 −2 ' 0 −6 −5 | 0 1 −3 Następnie mnożymy drugi wiersz przez −2 i dodajemy do wiersza trzeciego: 1 5 3 | 0 0 1 0 −3 −3 | 1 0 −2 ' ' 0 0 1 | −2 1 1 Teraz mnożymy drugi wiersz przez − 13 : 1 5 3 | 0 0 1 1 2 ' 0 1 1 | −3 0 3 ' 0 0 1 | −2 1 1 Mnożąc drugi wiersz przez −5 i dodając do pierwszego otrzymujemy: 5 0 − 37 1 0 −2 | 3 2 ' ' 1 | − 13 0 0 1 3 0 0 1 | −2 1 1 Na koniec do pierwszego wiersza dodajemy trzeci wiersz pomnożony przez 2, a do drugiego dodajemy wiersz trzeci pomnożony przez −1: 1 0 0 | − 73 2 − 13 1 0 0 | − 37 2 − 13 1 2 5 ' ' −1 − 13 0 1 1 | −3 0 0 1 0 | . 3 3 0 0 1 | −2 1 1 0 0 1 | −2 1 1 Z ostatniego twierdzenia wynika więc, że macierzą odwrotną do macierzy 2 7 3 A = 3 9 4 1 5 3 jest macierz − 73 2 − 13 5 B= −1 − 13 . 3 −2 1 1 Wykonując mnożenie AB lub BA sprawdzamy, że wynik jest poprawny. Wyżej opisane operacje elementarne możemy także wykonywać na kolumnach macierzy zamiast na wierszach i w efekcie otrzymamy także macierz odwrotną Najwygodniej wtedy podpisać macierz jednostkową pod macierzą, której macierz odwrotną chcemy obliczyć i przeprowadzać operacje na kolumnach. 3. METODA GAUSSA ROZWIĄZYWANIA UKŁADÓW RÓWNAŃ 85 3. Metoda Gaussa rozwiązywania układów równań Przejdziemy teraz do omówienia metody rozwiązania dowolnego układu równań, tzn. takiego, w którym ilość równań jest niekoniecznie taka sama jak ilość niewiadomych. Zatem rozważmy układ (1) a11 x1 + a12 x2 + · · · + a1n xn = b1 a21 x1 + a22 x2 + · · · + a2n xn = b2 .................................. am1 x1 + am2 x2 + · · · + amn xn = bm , gdzie aij są liczbami rzeczywistymi. Jak pamiętamy wzory Cramera dawały rozwiązania układu równań Cramera, tj. takiego układu, w którym ilość niewiadomych była równa ilości równań oraz macierz tego układu była nieosobliwa. Podamy teraz naturalną metodę rozwiązywania dowolnych układów równań, która na dodatek nie odwołuje się do pojęcia wyznacznika. Dwa układy równań nazywamy równoważnymi, jeśli mają one takie same zbiory rozwiązań. Na początek prosta obserwacja. Zauważmy, że jeśli w układzie równań (1) którekolwiek równanie pomnożymy obustronnie przez liczbę różną od zera, to otrzymamy układ równoważny z wyjściowym. Podobnie, pomnożenie obustonne dowolnego równania a następnie dodanie go do innego równania prowadzi do układu równoważnego. Jest rzeczą oczywistą, że przestawienie dwóch wierszy także nie zmieni nam zbioru rozwiązań układu równań. Wszystkie wymienione powyżej operacje na układzie równań możemy nazwać, przez analogię do operacji wykonywanych na wierszach macierzy, operacjami albo przekształceniami elementarnymi. Jak się przekonamy analogia ta jest nieprzypadkowa. Macierz Au postaci a11 a12 . . . a1n b1 a a22 . . . a2n b2 21 Au = . . . . . . . . . . . . . . . . . . . . . . . . am1 am2 . . . amn bm powstałą przez dopisanie do macierzy A układu równań (1) kolumny wyrazów wolnych nazywamy macierzą uzupełnioną układu równań (1). Z poczynionych wcześniej uwag wynika, że mamy następujące twierdzenie: Twierdzenie 3.1. Jeśli macierz B jest macierzą otrzymaną poprzez zastosowanie przekształceń elementarnych na wierszach macierzy Au , gdzie Au jest macierzą uzupełnioną układu równań postaci (1), to układ równań, dla którego macierz B jest macierzą uzupełnioną jest równoważny z układem (1). Zauważmy, że jeśli któreś równanie w układzie równań może być otrzymane z innych w rezultacie obustronnego dodania innych równań pomnożonych przez odpowiednie liczby to takie równanie może być pominięte w układzie równań. Istotnie, jeśli równanie ai1 x1 + · · · + ain xn = bi może być otrzymane w rezultacie dodania i1 -ego równania 86 III. UKŁADY RÓWNAŃ LINIOWYCH pomnożonego obustronnie przez liczbę c1 , i2 -ego pomnożonego przez c2 itd, to mnożąc odpowiednio i1 -sze równanie przez −c1 , drugie przez −c2 itd, a następnie dodając je obustronnie do i-tego otrzymamy równanie 0x1 + 0x2 + . . . 0xn = 0, które jest spełnione przez dowolne liczby rzeczywiste. Wobec tego jeśli w wierszu macierzy uzupełnionej po dokonaniu przekształceń elementarnych pojawi się wiersz złożony z samych zer, to możemy go pominąć, nie zmieniając przy tym zbioru rozwiązań. Przejdźmy teraz do opisu metody Gaussa. Rozpatrujemy macierz uzupełnioną układu równań. Jak wiemy każdą macierz można przekształcić za pomocą przekształceń elementarnych do postaci schodkowej. Po usunięciu wierszy złożonych z samych zer (jeśli one się pojawią) otrzymamy macierz postaci b11 b12 . . . b1n d1 0 b b2n d2 22 . . . . . . . . . . . . . . . . . . . . . . . . 0 0 . . . bnn dn gdzie bii 6= 0 dla i 6 n, albo macierz postaci b11 b12 . . . b1m . . . b1n d1 0 b b2m . . . b2n d2 22 . . . , . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0 0 . . . bmm . . . bmn dm gdzie m < n oraz bii 6= 0 dla i 6 m. Pierwsza z tych macierzy odpowiada układowi równań (2) b11 x1 + b12 x2 + · · · + b1n xn = d1 b22 x2 + · · · + b2n xn = d2 ............................... bnn xn = dn które, jak nietrudno się przekonać, ma jednoznaczne rozwiązanie. Z ostatniego równania wyliczamy xn . Mając już xn z przedostatniego równania możemy obliczyć xn−1 itd, aż do x1 . W drugim przypadku nasza macierz odpowiada układowi równań (3) b11 x1 + b12 x2 + · · · + b1m xm + · · · + b1n xn = d1 b22 x2 + · · · + b2m xm + · · · + b2n xn = d2 ............................................. bmm xm + · · · + bmn xn = dm 3. METODA GAUSSA ROZWIĄZYWANIA UKŁADÓW RÓWNAŃ 87 Jeśli teraz w układzie równań za niewiadome xm+1 , . . . , xn przyjąć dowolne liczby rzeczywiste αm+1 , . . . , αn , a następnie napisać układ (3) w postaci b11 x1 + b12 x2 + · · · + b1m xm = d1 − b1 m+1 αm+1 − · · · − b1n αn b22 x2 + · · · + b2m xm = d2 − b2 m+1 αm+1 − · · · − b2n αn . . . . . . . . ................... bmm xm = dm − bm m+1 αm+1 − · · · − bmn αn to możemy układ rozwiązać w taki sam sposób jak układ (2). W tym przypadku otrzymamy nieskończenie wiele rozwiązań, a więc układ ten jest nieoznaczony. Powyższy sposób rozwiązania układu równań nosi nazwą metody Gaussa lub metody rugowania niewiadomych. Przykład 3.1. Rozwiążemy metodą Gaussa następujący układ równań. − 3x2 + 4x2 + x2 + 4x2 x1 2x1 3x1 12x1 + − + + 4x3 3x3 2x3 7x3 + 2x4 + 3x4 − x4 + 2x4 = = = = 1 −1 0 0 Wpierw wyznaczamy macierz uzupełnioną tego układu równań: Au = 1 −3 4 2 1 2 4 −3 3 −1 . 3 1 2 −1 0 12 4 7 2 0 Następnie dokonujemy przekształceń elementarnych na wierszach tej macierzy, tak aby otrzymać macierz schodkową. W tym celu na początek mnożymy wiersz pierwszy przez -2 i dodajemy do wiersza drugiego, wiersz pierwszy przez -3 i dodajemy do wiersza trzeciego, w końcu mnożymy wiersz pierwszy przez -12 i dodajemy do czwartego. Po tych operacjach otrzymujemy macierz rownoważną postaci: 1 −3 4 2 1 0 10 −11 −1 −3 0 10 −10 −7 −3 0 40 −41 −22 −12 . Jeśli teraz wiersz drugi otrzymanej macierzy pomnożymy przez -1 i dodamy do wiersza trzeciego, a potem jeszcze wiersz drugi pomnożymy przez -4 i dodamy do wiersza czwartego, to otrzymamy macierz 1 −3 4 2 1 0 10 −11 −1 −3 . 0 0 1 −6 0 0 0 3 −18 0 88 III. UKŁADY RÓWNAŃ LINIOWYCH Następnie wiersz trzeci mnożymy przez −3 i dodajemy do wiersza ostatniego: 1 −3 4 2 1 0 10 −11 −1 −3 . 0 0 1 −6 0 0 0 0 0 0 Widzimy, że w czwartym wierszu są same zera, a więc możemy pominąć go w dalszych rachunkach. Otrzymujemy wówczas macierz 1 −3 4 2 1 0 10 −11 −1 −3 . 0 0 1 −6 0 Za niewiadomą x4 podstawiamy dowolną liczbę rzeczywistą α i w ten sposób mamy x3 = 6α. Pozostałe dwie niewiadome obliczamy korzystając z dwóch pierwszych wierszy ostatniej macierzy: −3 + 11x3 + x4 −3 + 11 · 6α + α −3 + 67α x2 = = = , 10 10 10 −3 + 67α 1 − 59α x1 = 1 + 3x2 − 4x3 − 2x4 = 1 + 3 − 4 · 6α − 2α = . 10 10 4. FORMY KWADRATOWE 89 4. Formy kwadratowe Formą kwadratową zmiennych x1 , . . . , xn nazywamy wielomian tych zmiennych postaci (1) F (x1 , . . . , xn ) = n X aij xi xj = i,j=1 = a11 x21 + a12 x1 x2 + . . . + a1n x1 xn + +a21 x2 x1 + a22 x22 + . . . + a2n x2 xn + .............................................. +an1 xn x1 + an2 xn x2 + . . . + ann x2n , gdzie aij = aji dla i, j ∈ {1, . . . , n}. Nietrudno zauważyć, że formę kwadratową postaci (1) możemy zapisać w postaci równoważnej przy pomocy następującego równania macierzowego h F (x1 , . . . , xn ) = x1 x2 . . . a11 a12 i a21 a22 xn · .. .. . . an1 an2 ... ... x1 a1n a2n x2 .. · . , . .. ... . . . ann xn lub oznaczając A = [aij ] oraz x jako wektor kolumnowy o elementach x1 , . . . , xn po prostu jako F (x) = xT · A · x. Macierz symetryczną A będziemy nazywać macierzą formy kwadratowej F . Wraz z każdą formą kwadratową F możemy związać tzw. formę dwuliniową. Definiujemy ją na parach wektorów kolumnowych w następujący sposób: g(x, y) = xT · A · y. Przyjmijmy dla ustalonej liczby naturalnej n następujące oznaczenia wektorów kolumnowych: 1 0 0 0 0 1 0 0 , e2 = 0 , . . . , en = 0 oraz 0 = 0 . 0 e1 = .. .. .. .. . . . . 0 0 1 0 Nietrudno sprawdzić, że dla każdej pary liczb i, j ∈ {1, . . . , n} zachodzi równość aij = eTi · A · ej . Głównym problemem jakim będziemy się zajmować w tym paragrafie, jest odpowiedź na pytanie jakie warunki winna spełniać macierz A formy kwadratowej F , aby dla każdego wektora kolumnowego x 6= 0 spełniony był warunek (2) F (x) > 0. 90 III. UKŁADY RÓWNAŃ LINIOWYCH W takim przypadku mówimy, że forma kwadratowa F jest dodatnio określona. Jeśli dla każdego x 6= 0 spełniony jest warunek F (x) < 0. (3) to mówimy, że forma kwadratowa F jest ujemnie określona. Załóżmy, że następujące minory macierzy A są różne od zera: " (4) N1 = a11 6= 0, N2 = det Nn−1 = det a11 a21 .. . a12 a22 .. . a11 a12 a21 a22 ... ... ... an−1 1 an−1 2 . . . # a11 a12 a13 6 0, ..., 6= 0, N3 = det a21 a22 a23 = a31 a32 a33 a11 a12 a1 n−1 a2 n−1 a21 a22 6= 0, Nn = det . .. .. . . . . an1 an2 an−1 n−1 ... ... a1n a2n .. 6= 0. ... . . . . ann Dodatkowo oznaczmy N0 = 1. Postawmy sobie na początek zadanie znalezienia n wektorów γn1 γ31 γ21 γ11 γ γ γ 0 n2 32 22 γ γ 0 0 33 γ1 = , γ2 = , γ3 = , . . . , γn = n3 , .. .. .. .. . . . . γnn 0 0 0 tak aby dla każdego i, j ∈ {1, . . . , n}, i 6= j, zachodził warunek g(γi , γj ) = 0, (5) oraz dla każdego i ∈ {1, . . . , n} spełniona była równość g(γi , ei ) = 1, (6) gdzie g jest formą dwuliniową wyznaczoną przez formę kwadratową F . Zauważmy, że jeśli dla każdego l = 1, . . . , n oraz m < l zachodzi warunek g(γl , em ) = 0, (7) to, dla j < i mamy (8) g(γi , γj ) = γiT · A · γj = γiT · A · (γj1 e1 + · · · + γjj ej ) = = γiT · (A · γj1 e1 + · · · + A · γjj ej ) = γiT · (γj1 A · e1 + · · · + γjj A · ej ) = = (γiT · γj1 A · e1 ) + · · · + (γiT · γjj A · ej ) = γj1 (γiT · A · e1 ) + · · · + γjj (γiT · A · ej ) = = γj1 g(γi , e1 ) + · · · + γjj g(γi , ej ) = 0. Jeśli i < j, to korzystając z symetryczności macierzy A oraz z równości (8) otrzymujemy, że również g(γi , γj ) = [g(γi , γj )]T = [γiT · A · γj ]T = γjT · AT · γi = γjT · A · γi = g(γj , γi ) = 0. 4. FORMY KWADRATOWE 91 Tak więc, jeśli warunek (7) jest spełniony, to także spełniony jest warunek (5). Zobaczmy co mówi warunek (7). Ustalmy dowolne l 6 n. Wówczas dla każdego m < l mamy (9) 0 = g(γl , em ) = γlT · A · em = (γl1 e1 + · · · + γll el )T · A · em = = γl1 eT1 · A · em + · · · + γll eTl · A · em = γl1 g(e1 , em ) + · · · + γll g(el , em ) = = γl1 a1m + · · · + γll alm . Warunek (6) natomiast oznacza, że (10) 1 = g(γl , el ) = γlT · A · el = (γl1 e1 + · + γll el )T · A · el = = γl1 eT1 · A · el + · · · + γll eTl · A · el = γl1 g(e1 , el ) + · · · + γll g(el , el ) = = γl1 a1l + · · · + γll all = 1, dla każdego l = 1 . . . , n. Tak więc dla każdego l 6 n istnieją szukane liczby γl1 , . . . , γll (czyli wektory γl ) spełniające warunki (7) i (6) wtedy i tylko wtedy, gdy dla każdego l 6 n liczby γl1 , . . . , γll spełniają układ równości a11 γl1 + . . . + a1l γll = 0 a21 γl1 + . . . + a2l γll = 0 .................................. , al−1 1 γl1 + . . . + al−1 l γll = 0 al1 γl1 + . . . + all γll = 1 czyli są rozwiązaniami układu równań liniowych (11) a11 x1 + . . . + a1l xl = 0 a21 x1 + . . . + a2l xl = 0 ................................. a + al−1 l xl = 0 l−1 1 x1 + . . . al1 x1 + . . . + all xl = 1 Na mocy założenia (4) o niezerowości wyznaczników N1 , N2 , . . . , Nn otrzymujemy z twierdzenia Cramera, że dla dowolnego l = 1, 2, . . . , n, układ równań postaci (11) ma (i to dokładnie jedno) rozwiązanie. Tak więc kwestia istnienia wektorów γ1 , . . . , γn spełniających warunki (6) oraz (7), a przez to i warunek (5), została pozytywnie rozstrzygnięta. Obliczymy jeszcze g(γi , γi ) korzystając z warunków (5) oraz (7): g(γi , γi ) = g(γi , γi1 e1 + · · · + γii ei ) = γiT · A · (γi1 e1 + · · · + γii ei ) = = γi1 γiT · A · e1 + · · · + γii γiT · A · ei = γi1 g(γi , e1 ) + · · · + γii g(γi , ei ) = γii . 92 III. UKŁADY RÓWNAŃ LINIOWYCH Liczbę γii dla każdego i możemy wyznaczyć rów Cramera: a11 a12 a21 a22 det .. .. . . z układu równań (11) korzystając ze wzo... ... 0 0 .. . ... ai1 ai2 . . . 1 Ni−1 = . γii = Ni Ni Z wszystkich wektorów kolumnowych utwórzmy następującą macierz γ11 γ21 0 γ22 M = .. .. . . 0 0 ... ... ... ... γn1 γn2 .. . . γnn Ponieważ det M = γ11 · · · · · γnn = 1 N1 Nn−1 1 · · ··· · = 6= 0, N1 N2 Nn Nn więc układ równań γ11 x1 + γ21 x2 + . . . + γn1 xn = a1 γ22 x2 + . . . + γn2 xn = a2 . . . . . . . . . . . ............................. γnn xn = an ma na mocy twierdzenia Cramera dokładnie jedno rozwiązanie c1 , . . . , cn dla dowolnych liczb rzeczywistych a1 , . . . , an . Dlatego też dowlony wektor kolumnowy a o wyrazach a1 , . . . , an możemy przedstawić w postaci a1 a2 a= .. = c1 γ1 + · · · + cn γn , . an gdzie c1 , . . . , cn są pewnymi liczbami rzeczywistymi. Obliczamy wartość formy kwadratowej (1) dla wektora a: F (a) = aT · A · a = (c1 γ1 + · · · + cn γn )T · A · (c1 γ1 + · · · + cn γn ) = = X i,j ci cj γiT · A · γj = X i,j ci cj g(γi , γj ) = n X c2i g(γi , γi ) = i=1 n X i=1 c2i γii = n X i=1 c2i Ni−1 . Ni Jeśli wektor a 6= Θ, czyli jeśli nie wszystkie liczby a1 , . . . , an są równe zero, to i wśród liczb c1 , . . . , cn przynajmniej jedna będzie różna od zera. Ponadto, jeśli wszystkie liczby (12) N0 1 N1 Nn−1 = , ,..., N1 N1 N2 Nn 4. FORMY KWADRATOWE 93 będą dodatnie, to F (a) będzie liczbą dodatnią dla dowolnego a 6= 0. Jeśli natomiast wszystkie liczby (12) będą ujemne, to F (a) < 0 dla każdego a 6= 0. Możemy zatem sformułować jedno z najważniejszych twierdzeń o formach kwadratowych. Twierdzenie 4.1 (Kryterium Sylvestera). Jeśli A = [aij ] jest macierzą formy kwadratowej F , to forma kwadratowa F jest a) dodatnio określona, jeśli " N1 = a11 > 0, N2 = det a11 a12 a21 a22 # a11 a12 a21 a22 > 0, . . . , Nn = det .. .. . . an1 an2 ... ... ... . . . ann b) ujemnie określona, jeśli N1 = a11 a11 a12 a13 < 0, N3 = det a21 a22 a23 < 0, . . . a31 a32 a33 oraz " N2 = det a11 a12 a21 a22 # a11 a 21 > 0, N4 = det a31 a41 a12 a22 a32 a42 a13 a23 a33 a43 a1n a2n .. > 0; . a14 a24 > 0, . . . . a34 a44 94 III. UKŁADY RÓWNAŃ LINIOWYCH 5. Zadania do rozdziału III Zadanie 64. Rozwiązać układy równań korzystając ze wzorów Cramera (a) x1 2x + 2x2 + x2 + 2x2 + 3x2 + 3x3 + 2x3 + x3 + 2x3 + 4x4 + 3x4 + 2x4 + x4 = 5 = 1 = 1 = −5 + 2x2 − x2 + 2x2 − 3x2 + 3x3 − 2x3 − x3 + 2x3 − 2x4 − 3x4 + 2x4 + x4 = 6 = 8 = 4 = −8 + x2 − x2 + 3x2 + 2x2 + 2x3 − x3 − x3 + 3x3 + 3x4 − 2x4 − x4 − x4 = 1 = −4 = −6 = −4 − 3x3 + 4x4 − 2x3 + 3x4 − 5x4 − 5x3 = −5 = −4 = 12 = 5 − x3 + 2x3 − x3 + x3 + x4 − 3x4 + 2x4 − 3x4 = = = = 1 1 1 1 + 5x2 + 3x2 + 10x2 + 8x2 + + + + + x4 + x4 + 7x4 + 2x4 = = = = 20 11 40 37 + 2x2 − 4x2 − 12x2 − 14x2 + 3x3 + 5x3 + 17x3 + 18x3 1 3x1 4x1 (b) x1 2x 1 3x1 2x1 (c) x1 3x 1 2x1 x1 (d) x x2 1 3x1 + 2x2 + 3x2 4x1 (e) 2x1 3x 1 5x1 2x1 + + + + x2 x2 x2 x2 (f) 2x1 x 1 2x1 3x1 4x3 2x3 9x3 9x3 (g) x1 2x 1 6x1 7x1 + 2x4 + 6x4 + 16x4 + 17x4 = = = = 0 0 0 0 5. ZADANIA DO ROZDZIAŁU III 95 (h) 2x1 x + + + + 1 2x1 2x1 5x2 3x2 4x2 6x2 − − − − 6x3 3x3 4x3 6x3 + + + + 25x4 12x4 18x4 27x4 = = = = 1 1 2 2 + x2 + x4 + 3x2 + 4x3 + 2x4 + 4x2 + 7x3 + 5x2 + 5x3 + x4 = = = = 5 1 0 5 + x2 + 2x2 + 4x2 + 5x2 = = = = 3 5 3 5 (i) x1 x 1 5x1 6x1 (j) x1 x 1 2x1 3x1 + x3 + 3x3 + x3 + 2x3 + x4 + 4x4 + 5x4 + 7x4 (k) 2x1 3x 1 x1 x1 + + + + 2x2 6x2 5x2 3x2 + + + + 2x3 5x3 3x3 2x3 − 2x4 − x4 + 4x4 + 2x4 =2 =1 =0 =1 + + + + 8x2 4x2 3x2 3x2 + + + + 8x3 + 4x4 4x3 + x4 2x3 3x3 + x4 =2 =0 =1 =0 + + + + 4x2 5x2 4x2 5x2 + + + + 2x3 + 4x4 3x3 + 3x4 3x3 + x4 4x3 =2 =1 =0 =1 (l) 2x1 3x 1 2x1 2x1 (m) 4x1 4x 1 2x1 3x1 (n) 2x1 5x 1 3x1 + 4x2 + 5x2 + 3x2 + x2 + 4x3 =0 + 4x3 + 2x4 = 1 + x3 + 2x4 = 1 + 2x3 − x4 = −1 + 2x2 + 2x2 + x2 + 3x2 + 10x3 + 7x3 + 4x3 + 7x3 (o) 8x1 6x 1 3x1 7x1 + + + + 6x4 6x4 3x4 8x4 =2 =1 =0 =1 96 III. UKŁADY RÓWNAŃ LINIOWYCH Odpowiedź (a): x1 = −2, x2 = 2, x3 = −3, x4 = 3. (b): x1 = 1, x2 = 2, x3 = −1, x4 = −2. (c): x1 = −1, x2 = −1, x3 = 0, x4 = 1. (d): x1 = 1, x2 = 2, x3 = 1, x4 = −1. (e): x1 = 0, x2 = 1, x3 = 0, x4 = 0. (f): x1 = 1, x2 = 2, x3 = 2, x4 = 0. (g): x1 = 0, x2 = 0, x3 = 0, x4 = 0. Zadanie 65. Znaleźć wielomian w(x) stopnia 2-go wiedząc, że w(1) = −1; w(−1) = 9; w(2) = −3. Zadanie 66. Znaleźć wielomian w(x) stopnia 3-go wiedząc, że w(−1) = 0; Zadanie 67. Rozwiązać (a) 3x1 2x 1 x 1 x1 (b) 2x1 6x 1 10x 1 8x1 (c) 2x1 x 1 x 1 5x1 (d) 2x1 4x 1 2x 1 2x1 (e) x1 + 3x + 1 x + 1 2x1 + (f) x1 + x1 + x + 1 w(1) = 4; w(2) = 3; w(3) = 16. metodą Gaussa następujące układy równań: − 2x2 − 5x3 − 3x2 + x3 + 2x2 − x2 − 4x3 + x4 + 5x4 − 4x4 + 9x4 = = = = 3 −3 −3 22 − + + + + 3x3 − 2x3 − 3x3 + x3 + 2x4 − x4 − 2x4 + 3x4 = = = = 3 −4 3 −7 + + − + 3x3 5x3 9x3 4x3 + x4 − 2x4 + 8x4 + 5x4 = = = = 5 3 1 12 + x3 − 2x3 + 5x3 − 3x3 − x4 + 3x4 − 6x4 + 4x4 = = = = 3 2 1 5 3x2 9x2 3x2 6x2 + 7x2 + 3x2 + 5x2 + 18x2 − x2 − 2x2 − x2 − x2 x2 3x2 x2 2x2 + + + + 3x3 5x3 7x3 2x3 − − − − 2x4 4x4 4x4 3x4 + x5 = 4 + 3x5 = 5 + x5 = 11 + 3x5 = 6 4x2 + 2x3 + x4 + 3x5 = 5 3x2 + x3 + 2x4 + 5x5 = 2 7x2 + 5x3 − 2x4 − 3x5 = 14 5. ZADANIA DO ROZDZIAŁU III 97 Odpowiedzi: (a): x1 = −1, x2 = 3, x3 = −2, x4 = 2. (b): x1 = 12 , x2 = − 23 , x3 = 2, x4 = −3. (c): x1 = 6 − 26α + 17β, x2 = −1 + 7α − 5β, x3 = α, x4 = β, gdzie α, β ∈ R. , x2 = α, x3 = −3+2β , x4 = −5 + β, x5 = β, (d): układ sprzeczny. (e): x1 = −15−4α−2β 4 4 gdzie α, β ∈ R. Zadanie 68. W zależności od parametru a ∈ R rozwiązać układ równań x1 x1 x1 ax1 + x2 + x2 + ax2 + x2 + x3 + ax3 + x3 + x3 + ax4 + x4 + x4 + x4 = = = = 1 −1 0 0 Odpowiedź Jeśli a 6= 1 i α 6= −3, to układ ma dokładnie jedno rozwiązanie: x1 = 0, 1 1 x2 = 0, x3 = 1−a , x4 = a−1 ; jeśli a = 1, to układ jest sprzeczny; jeśli a = −3, to układ ma nieskończenie wiele rozwiązań postaci x1 = α + 14 , x2 = α + 14 , x3 = α + 12 , x4 = α, gdzie α ∈ R. ROZDZIAŁ IV Przekształcenia liniowe 1. Pojęcie przekształcenia liniowego Definicja 1.1. Załóżmy, że V i W są przestrzeniami liniowymi nad ciałem K, a f : V → W . Mówimy, że f jest przekształceniem liniowym, jeśli dowolnych v, w ∈ V i dowolnego skalara α ∈ K spełnione są następujące warunki: (a) f (v + w) = f (v) + f (w); (b) f (αv) = αf (v). Przekształcenia liniowe nazywamy także odwzorowaniami liniowymi. Własność (a) nazywana jest addytywnością, a własność (b) jednorodnością przekształcenia f . Zamiast warunków (a) i (b) definiujących przekształcenie liniowe można podać jeden warunek. W istocie, aby f : V → W było przekształceniem liniowym potrzeba i wystarcza żeby równość (c) f (αv + βw) = αf (v) + βf (w) zachodziła dla dowolnych v, w ∈ V oraz dowolnych α, β ∈ K. Przykład 1.1. (a) Rozważmy f : R2 → R2 określone wzorem: f ([x1 , x2 ]) = [5x1 − 2x2 , 2x1 + x2 ]. Bez trudu sprawdzamy, że f (α[x1 , x2 ] + β[y1 , y2 ]) = f ([αx1 + βy1 , αx2 + βy2 ]) = = [5(αx1 + βy1 ) − 2(αx2 + βy2 ), 2(αx1 + βy1 ) + (αx2 + βy2 )] = = [α(5x1 − 2x2 ) + β(5y1 − 2y2 ), α(2x1 + x2 ) + β(2y1 + y2 )] = = α[5x1 − 2x2 , 2x1 + x2 ] + β[5y1 − 2y2 , 2y1 + y2 ] = = αf ([x1 , x2 ]) + βf ([y1 , y2 ]). Tak więc f jest przekształceniem liniowym przestrzeni R2 w siebie. (b) Rozważmy przestrzeń liniową R[x] złożoną ze wszystkich wielomianów o współczynnikach rzeczywistych i odwzorowanie f : R[x] → R[x] określone w następujący sposób: f (w) = w0 , tj. f przypisuje wielomianowi w jego pochodną. Ponieważ pochodna wielomianu jest wielomianem, więc f jest poprawnie określone. Z własności pochodnej wynika, że f (αw1 + βw2 ) = (αw1 + βw2 )0 = αw10 + βw20 = αf (w1 ) + βf (w2 ). 99 100 IV. PRZEKSZTAŁCENIA LINIOWE Wobec tego f jest odwzorowaniem liniowym. (c) Zdefiniujmy J : C([0, 1]) → R wzorem: J(h) = Z 1 h(x) dx. 0 Ponieważ J(h1 + h2 ) = Z 1 0 (h1 (x) + h2 (x))) dx = oraz J(αh) = Z 1 Z 1 0 h1 (x) dx + αh(x) dx = α Z 1 Z 1 0 h2 (x) dx = J(h1 ) + J(h2 ), h(x) dx = αJ(h), 0 0 więc J jest odwzorowaniem liniowym. Zbiór wszystkich przekształceń liniowych f : V → W oznaczamy symbolem L(V, W ). W zbiorze L(V, W ) można wprowadzić działania sumy i mnożenia przez skalar w następujący sposób. Jeśli f, g ∈ L(V, W ), to sumą przekształceń f i g nazywamy przekształcenie f + g określone wzorem: (f + g)(v) = f (v) + g(v), gdzie v ∈ V . Iloczynem przekształcenia liniowego f przez skalar α ∈ K nazywamy przekształcenie αf zdefiniowane formułą: (αf )(v) = αf (v), gdzie v ∈ V . W zbiorze L(V, W ) możemy wyróżnić jeszcze przekształcenie O, które każdemu wektorowi v ∈ V przypisuje wektor zerowy 0 ∈ W . Bez trudu można sprawdzić, że f + g, αf ∈ L(V, W ), jeśli f, g ∈ L(V, W ) i α ∈ K. Niemal oczywistym jest fakt, że O ∈ L(V , W ). Jeśli dla każdego f ∈ L(V, W ) określimy −f w następujący sposób: −f = (−1)f, to możemy stwierdzić, że: Twierdzenie 1.1. Jeśli V i W są przestrzeniami liniowymi nad ciałem K, to zbiór L(V, W ) złożony ze wszystkich przekształceń liniowych f : V → W z działaniami sumy, mnożeniem przez skalar i wyróżnionym przekształceniem O jest przestrzenią liniową nad ciałem K. Jeśli f ∈ L(V, W ) i g ∈ L(W, Z), to złożenie g ◦ f : V → Z jest odwzorowaniem liniowym, które oznaczamy krótko gf . Twierdzenie 1.2. Załóżmy, że V, W, Y, Z są przestrzeniami liniowymi nad ciałem K, h ∈ L(V, W ), g, g1 ∈ L(W, Y ), f, f1 ∈ L(Y, Z) oraz α ∈ K, to: (1) (f g)h = f (gh). (2) α(f g) = (αf )g; (3) (f + f1 )g = f g + f1 g; (4) f (g + g1 ) = f g + f g1 ; 2. POSTAĆ MACIERZOWA PRZEKSZTAŁCEŃ LINIOWYCH 101 Przekształcenie liniowe f : V → W nazywamy monomorfizem liniowym, jeśli f jest różnowartościowe. Jeśli f (V ) = W , to mówimy, że f jest epimorfizmem liniowym z przestrzeni V na przestrzeń W . Przekształcenie liniowe f : V → W , które jest zarówno monomorfizmem jak i epimorfizmem liniowym nazywamy izomorfizmem liniowym. Jeśli V jest przestrzenią liniową, a f : V → V jest przekształceniem liniowym, to mówimy, że f jest endomorfizmem liniowym przestrzeni V . Tak więc L(V, V ) jest przestrzenią wszystkich endomorfizmów liniowych przestrzeni V . W zbiorze L(V, V ) możemy wyróżnić endomorfizm tożsamościowy I , określony oczywistą formułą: I (v ) = v dla każdego v ∈ V . 2. Postać macierzowa przekształceń liniowych Zakładać będziemy w dalszym ciągu, że przestrzenie liniowe mają wymiar skończony. Ustalmy zatem w przestrzeni liniowej V , której wymiar jest równy n, bazę uporządkowaną (v1 , . . . , vn ), a w przestrzeni liniowej W , której wymiar jest równy m, bazę (w1 , . . . , wm ). Niech v ∈ V . Zatem v = α1 v1 + · · · + αn vn . Niech f ∈ L(V, W ). Zgodnie z definicją przekształcenia liniowego f (v) = f (α1 v1 + · · · + αn vn ) = α1 f (v1 ) + · · · + αn f (vn ). Ponieważ układ (w1 , . . . , wm ) jest bazą przestrzeni W , więc dla każdego j = 1, . . . , n istnieje dokładnie jeden taki układ skalarów α1j , . . . , αmj , że f (vj ) = α1j w1 + · · · + αmj wm . Wobec tego (1) f (v) = n X αi f (vj ) = n X αj αij wi = m X n X i=1 i=1 j=1 j=1 m X αj αij wi . j=1 Równość (1) oznacza, że jeśli (α1 , . . . , αn ) jest ciągiem współrzędnych wektora v w bazie uporządkowanej, to i-ta współrzędna βi , gdzie i ∈ {1, . . . , m}, wartości f (v) w bazie (w1 , . . . , wm ) wyraża się formułą βi = n X αij αj . j=1 Można to ująć zapisując następującą równość macierzową β1 α11 β2 α21 . = . . . . . βm α12 α22 .. . ... ... αm1 αm2 . . . α1n α1 α2n α2 .. · . . .. αmn αn 102 IV. PRZEKSZTAŁCENIA LINIOWE Samą macierz α11 α21 . . . α12 α22 .. . ... ... α1n α2n .. . αm1 αm2 . . . αmn nazywamy macierzą przekształcenia liniowego f . Macierz tą oznaczać będziemy symbolem M (f ). Formalnie macierz M (f ) zależy jeszcze od baz uporządkowanych przestrzeni V i W. Przykład 2.1. Rozważmy odwzorowanie liniowe f : R2 → R2 f ([x1 , x2 ]) = [5x1 − 2x2 , 2x1 + x2 ]. opisane w przykładzie 1.1 (a). Załóżmy, że w przestrzeni R2 rozważamy bazy kanoniczne (e1 , e2 ) (w dziedzinie i przeciwdziedzinie). Skoro f (e1 ) = f ([1, 0]) = [5, 2] = 5e1 + 2e2 oraz f (e2 ) = f ([0, 1]) = [−2, 1] = −2e1 + 1e2 , więc macierz przekształcenia f w bazach kanonicznych jest równa " # 5 −2 . M (f ) = 2 1 Gdybyśmy jednak rozważyli w dziedzinie bazę kanoniczną (e1 , e2 ) a w przeciwdziedzinie bazę ([5, 2], [−2, 1]) (fakt, że wektory [5, 2] i [−2, 1] tworzą bazę przestrzeni R2 pozostawiamy jako łatwe ćwiczenie), to macierz M (f ) przyjmie postać macierzy jednostkowej: # " 1 0 . M (f ) = 0 1 Załóżmy, że (v1 , . . . , vn ), (w1 , . . . , wm ) oraz (z1 , . . . , zk ) będą bazami uporządkowanymi odpowiednio przestrzeni liniowych V , W i Z oraz f ∈ L(V, W ), g ∈ L(W, Z). Wówczas jak nietrudno sprawdzić M (gf ) = M (g) · M (f ). Przykład 2.2. Załóżmy, że f : R3 → R2 i g : R2 → R4 określone jest wzorami: f ([x1 , x2 , x3 ]) = [2x1 + 3x2 + x3 , −x1 + 5x2 ], g([x1 , x2 ]) = [x1 , x2 , x1 + x2 , x1 − x2 ]. Fakt, że f i g są liniowe nie przedstawia większych trudności. Rozważamy w każdej przestrzeni bazy kanoniczne. Wówczas " # 2 3 1 M (f ) = −1 5 0 3. ZMIANY BAZ 103 oraz 1 0 0 1 . M (g) = 1 1 1 −1 Zatem macierz złożenia gf : R3 → R4 przyjmie postać: 2 3 1 0 " # 0 1 2 3 1 −1 5 · = M (gf ) = M (g) · M (f ) = 1 1 1 −1 5 0 8 3 −2 1 −1 1 0 . 1 1 Twierdzenie 2.1. Jeśli (v1 , . . . , vn ) oraz (w1 , . . . , wm ) są bazami odpowiednio przestrzeni liniowych V i W , to funkcja M przypisująca każdemu f ∈ L(V, W ) jego macierz przekształcenia M (f ) jest izomorfizmem przestrzeni L(V, W ) na przestrzeń Kn×m . 3. Zmiany baz Definicja 3.1. Niech B = (v1 , . . . , vn ) oraz C = (w1 , . . . , wn ) będą bazami (uporządkowanymi) przestrzeni liniowej V . Niech αij , 1 ¬ i, j ¬ n, będą takimi skalarami z ciała K, że w1 = α11 v1 + α21 v2 + · · · + αn1 vn w2 = α12 v1 + α22 v2 + · · · + αn2 vn . .. . wn = α1n v1 + α2n v2 + · · · + αnn vn Macierz P = [αij ] nazywamy macierzą przejścia od bazy B do bazy C. Twierdzenie 3.1. (1) Macierz przejścia od bazy B do niej samej jest macierzą jednostkową. (2) Jeśli P1 jest macierzą przejścia od bazy B do bazy C, a P2 jest macierzą przejścia od bazy C do bazy D, to iloczyn P1 · P2 jest macierzą przejścia od bazy B do bazy D. (3) Jeśli P jest macierzą przejścia od bazy B do bazy C, to det(P ) 6= 0. Ponadto macierz P −1 jest macierzą przejścia od bazy C do bazy B. Przykład 3.1. Rozważmy bazy uporządkowane B = ([4, 5], [7, 8]) i C = ([7, 11], [1, 5]) przestrzeni R2 . Ponieważ [7, 11] = 7[4, 5] + (−3)[7, 8] oraz [1, 5] = 9[4, 5] + (−5)[7, 8], więc macierzą przejścia z bazy B do bazy C jest macierz " # 7 9 P = . −3 −5 104 IV. PRZEKSZTAŁCENIA LINIOWE Twierdzenie 3.2. Załóżmy, że P1 jest macierzą przejścia od bazy (v1 , . . . , vn ) do bazy (v10 , . . . , vn0 ) przestrzeni liniowej V , a niech P2 będzie macierzą przejścia od bazy 0 (w1 , . . . , wm ) do bazy (w10 , . . . , wm ) przestrzeni liniowej W . Niech ponadto f : V → W będzie odwzorowaniem liniowym. Jeśli M1 (f ) jest macierzą odwzorowania liniowego w bazach (v1 , . . . , vn ) i (w1 , . . . , wm ), a M2 (f ) jest macierzą tego samego odwzorowania f 0 ale w bazach (v10 , . . . , vn0 ) i (w10 , . . . , wm ), to M2 (f ) = P2−1 · M1 (f ) · P1 . Z twierdzenia 3.2 wynika, że jeśli mamy endomorfizm liniowy f przestrzeni V i dwie bazy uporządkowane B i C przestrzeni V , to M2 (f ) = P −1 · M1 (f ) · P, gdzie P jest macierzą przejścia od bazy B do C, M1 (f ) jest macierzą endomorfizmu f w bazie B, a M2 (f ) macierzą endomorfizmu w bazie C. W algebrze zwykło się nazywać dwie macierze kwadratowe A i B tego samego stopnia macierzami podobnymi, jeśli istnieje macierz C, dla której det(C) 6= 0 oraz A = C −1 · B · C. 4. Wartości i wektory własne Rozpoczniemy od następującej definicji. Definicja 4.1. Załóżmy, że f ∈ L(V, V ), tj. f jest endomorfizmem liniowym przestrzeni liniowej V nad ciałem K. Jeśli v ∈ V jest takim wektorem niezerowym, że istnieje skalar λ ∈ K, że f (v) = λv, to wektor v nazywamy wektorem własnym endomorfizmu f , a skalar λ wartością własną endomorfizmu f . Mówimy również, że v jest wektorem własnym odpowiadającym wartości własnej λ. Definicja 4.2. Wielomianem charakterystycznym macierzy kwadratowej A ∈ Kn×n nazywamy wyznacznik macierzy A − λI, gdzie I jest macierzą kwadratową stopnia n, a λ ∈ K. Wielomian charakterystyczny macierzy A oznaczać b ędziemy symbolem FA (λ). Przykład 4.1. Wyznaczymy wielomian charakterystyczny macierzy " # " #! 1 1 A= . 1 0 W tym celu obliczamy wyznacznik: " det # 1 1 − λI 1 0 ! " = det Tak więc FA (λ) = λ2 − λ − 1. # 1 1 1 0 −λ 1 0 0 1 " # 1−λ 1 = det = λ2 + λ − 1. 1 −λ 4. WARTOŚCI I WEKTORY WŁASNE 105 Odnotujmy ważną własność wielomianów charakterystycznych. Twierdzenie 4.1. Wielomiany macierzy podobnych są takie same. Tak więc wielomian charakterystyczny macierzy endomorfizmu liniowego przestrzeni skończenie wymiarowej V nie zależy od wyboru bazy przestrzeni V . Zdefiniujmy zatem następujące pojęcie Definicja 4.3. Wielomianem charakterystycznym endomorfizmu liniowego f skończenie wymiarowej przestrzeni liniowej V nazywamy wielomian charakterystyczny macierzy M (f ) (przy dowolnej bazie przestrzeni V ). Twierdzenie 4.2. Skalar µ jest wartością własną endomorfizmu liniowego f przestrzeni skończenie wymiarowej V wtedy i tylko wtedy, gdy µ jest pierwiastkiem wielomianu charakterystycznego endomorfizmu f , to znaczy, że µ jest pierwiastkiem wielomianu FM (f ) (λ). Przykład 4.2. Rozważmy odwzorowanie liniowe f : R2 → R2 określone wzorem: f ([x1 , x2 ]) = [6x1 + x2 , x1 + 6x2 ]. Wyznaczamy macierz odwzorowania f w bazie kanonicznej: " 6 1 M (f ) = 1 6 # Wielomian charakterystyczny endomorfizmu f jest postaci # " 6−λ 1 = (6 − λ)2 − 1 = λ2 − 12λ + 35, det 1 6−λ którego pierwiastkami są liczby λ1 = 5 oraz λ2 = 7. Tak więc liczby 5 oraz 7 są wartościami własnymi endomorfizmu f . Znajdźmy jeszcze wektory własne odpowiadające otrzymanym wartościom własnym. Dla wartości własnej 5 szukamy takiego wektora v, że f (v) = 5v. Przekładając to na język macierzy otrzymujemy równość " # " # " # 6 1 x x · 1 =5 1 , 1 6 x2 x2 " # x gdzie v = 1 jest szukanym wektorem własnym. Powyższa równość jest równoważna x2 układowi równań ( 6x1 + x2 = 5x1 . x1 + 6x2 = 5x2 Rozwiązaniem tego układu równań jest x1 = −t, x2 = t gdzie t ∈ R. Wobec tego każdy wektor postaci [−t, t] gdzie t ∈ R jest wektorem własnym endomorfizmu f odpowiadającym wartości własnej 5. Analogiczne rozważania 106 IV. PRZEKSZTAŁCENIA LINIOWE prowadzą do stwierdzenia, że wektory postaci [t, t], gdzie t ∈ R, są wektorami własnymi endomorfizmu f odpowiadającymi wartości własnej 7. Twierdzenie 4.3. Załóżmy, że v1 , . . . , vm są wektorami własnymi odpowiadającymi wartościom własnym λ1 , . . . , λm endomorfizmu f przestrzeni liniowej V . Zakładamy przy tym, że λi 6= λj dla i 6= j. Wówczas wektory v1 , . . . , vm są liniowo niezależne. Załóżmy, że endomorfizm liniowy f przestrzeni V ma n różnych wartości własnych, przy czym n = dim(V ). Wówczas dowolny układ n wektorów własnych odpowiadających różnym wartościom własnych jest, na mocy twierdzenia 4.3 liniowo niezależny, a więc tworzy bazę przestrzeni V . Macierz endomorfizmu w tej bazie ma wyjątkowo prostą budowę. Istotnie, macierz ta jest macierzą diagonalną postaci λ1 0 . . . 0 0 0 λ2 . . . . .. .. .. , . . . . . 0 0 . . . λn gdzie λ1 , λ2 , . . . , λn są wszystkimi różnymi wartościami własnymi endomorfizmu f . Wynika stąd, że jeśli M (f ) jest macierzą endomorfizmu f w dowolnej bazie B przestrzeni V , to na mocy twierdzenia 3.2 (1) λ1 0 . . . 0 0 0 λ2 . . . −1 . · M (f ) · P, .. .. .. =P . . . . . 0 0 . . . λn gdzie P jest macierzą przejścia od bazy B do bazy złożonej z wektorów własnych. Spostrzeżenie to ma swój wymiar praktyczny w postaci tzw. diagonalizacji macierzy kwadratowych. Diagonalizację opiszemy w następującym przykładzie. Przykład 4.3. Rozważmy endomorfizm f : R2 → R2 określony wzorem f ([x1 , x2 ]) = [x1 + x2 , x1 ]. Macierz endomorfizmu f w bazie kanonicznej jest równa # " 1 1 M (f ) = . 1 0 W przykładzie 4.1 wyznaczyliśmy wielomian charakterystyczny FM (f ) (λ) = λ2 − λ − √ 1. √Wielomian charakterystyczny FA (λ) ma dwa √pierwiastki: λ1 = 1−2 5 oraz λ2 = 1+ 5 . Nietrudno sprawdzić, że wartości własnej 1−2 5 odpowiada wektor własny postaci 2√ √ √ 1− 5 1+ 5 1+ 5 [ 2 t, t], a wartości własnej 2 wektor√własny postaci [ 2 t, t], gdzie t ∈ R. Weźmy √ 1− 5 1+ 5 dla przykładu t = 1. Wówczas układ ([ 2 , 1], [ 2 , 1]) jest bazą uporządkowaną R2 , w której endomorfizm f ma macierz " √ 1− 5 2 0 0√ 1+ 5 2 # . 5. ZADANIA DO ROZDZIAŁU IV 107 Macierz przejścia z bazy kanonicznej (e1 , e2 ) do naszej bazy złożonej z wektorów własnych jest równa " √ √ # 1− 5 1+ 5 2 2 P = . 1 1 Tak więc na mocy równości (1) otrzymujemy, że " √ 1− 5 2 0√ # = 1+ 5 2 0 " lub równoważnie " √ 1− 5 2 √ # 1+ 5 2 1 1 " · √ #−1 1+ 5 2 √ 1− 5 2 1 1 √ 1− 5 2 # " 0√ 1+ 5 2 0 · " # " 1 1 · · 1 0 √ 1− 5 2 1 √ # 1+ 5 2 √ 1− 5 2 1 √ #−1 1+ 5 2 1 1 " # 1 1 = . 1 0 Tym samym macierz M (f ) okazała się podobną do macierzy diagonalnej. Ostatnia równość pozwala obliczyć dowolną potęgę macierzy M (f ). Istotnie, wykorzystując fakt, że √ " √ √ # 1− 5 2 1+ 5 2 1 1 −1 = −1 √ 5 √1 5 1+√ 5 2 √ 5 , −1+ √ 5 2 5 otrzymujemy że " 1 1 1 0 #n " = √ 1− 5 2 1 √ # 1+ 5 2 1 " = = " · √ 1− 5 2 0 0√ #n " 1+ 5 2 √ n 1− 5 2 · √ 1− 5 2 1 √ #−1 1+ 5 2 1 = √ 1+√ 5 2 √ 5 = √ n · · 5 −1+ 1+ 5 √ 1 1 0 2 2 5 √ √ n √ n+1 √ n n+1 1+ 1+ 1 5 1− 5 1 5 √ − − 1−2 5 √5 2 2 2 5 √ n √ n √ n−1 √ n−1 . 1+ 5 1− 5 1+ 5 1− 5 √1 √1 − − 2 2 2 2 5 5 √ 1− 5 2 √ # 1+ 5 2 0 −1 √ 5 √1 5 Uzyskana równość pozwala podać wzór na n-ty wyraz ciągu Fibbonaciego (p. zadanie 43): √ !n √ !n ! 1 1− 5 1+ 5 an = √ − 2 2 5 5. Zadania do rozdziału IV Zadanie 69. Wyznaczyć macierz przekształcenia liniowego f : R3 → R2 określonego wzorem: (a) f ([x1 , x2 , x3 ]) = [5x1 − 2x2 + 3x3 , −x1 + x2 + x3 ], (b) f ([x1 , x2 , x3 ]) = [x1 + 2x2 + 3x3 , 3x1 + 2x2 + x3 ], (c) f ([x1 , x2 , x3 ]) = [12x1 + 2x3 , 5x2 ], przy czym przestrzenie R3 i R2 rozważamy w bazach kanonicznych. 108 IV. PRZEKSZTAŁCENIA LINIOWE Zadanie 70. Przekształcenie liniowe f : R3 → R2 dane jest wzorem: f ([x1 , x2 , x3 ]) = [5x1 + x2 + x3 , −x1 − x2 + 4x3 ]. Znaleźć macierz przekształcenia f jeśli bazy odpowiednio przestrzeni R3 i R2 są równe: (a) ([2, −1, 0], [1, 3, 2], [0, 4, 1]) oraz ([1, 1], [1, 0]), (b) ([3, 1, 1], [5, 1, 6], [4, −1, 2]) oraz ([2, 3], [1, 3]), (c) ([1, 0, 1], [0, 1, 1], [1, 1, 0]) oraz ([3, 1], [−1, −1]). Zadanie 71. Znaleźć macierz przejścia od bazy B do bazy C przestrzeni liniowej R3 jeśli: (a) B = ([1, 2, 3], [1, 3, 4], [1, 5, 7]), C = ([2, 3, 4], [4, 4, 5], [6, 3, 4]), (b) B = ([5, 2, 4], [3, 1, 1], [5, 1, 2]), C = ([5, 3, 6], [6, 1, 0], [5, 2, 4]), (c) B = ([1, 1, 1], [4, 3, 5], [5, 5, 4]), C = ([6, 5, 7], [9, 9, 8], [9, 8, 9]). Zadanie 72. Wyznaczyć wartości własne i wektory własne endomorfizmu f przestrzeni liniowej R2 określonego wzorem: (a) f ([x1 , x2 ]) = [3x1 − 9x2 , x1 − 3x2 ], (b) f ([x1 , x2 ]) = [7x1 − x2 , 9x1 + x2 ], (c) f ([x1 , x2 ]) = [x1 + 5x2 , x1 + 5x2 ]. Zadanie 73. Obliczyć n-tą potęgę następujących macierzy: " (a) # 7 −8 6 −7 " (b) 4 3 1 6 # " (c) 3 2 −1 6 # " (d) # 5 1 . 1 5 Skorowidz aksjomat Dedekinda, 14 argument liczby zespolonej, 24 minor, 58 moduł liczby zespolonej, 24 baza przestrzeni liniowej, 32 kanoniczna, 32 uporządkowana, 32 nierówność Bernoulliego, 6 permutacja, 7 przekształcenia elementarne macierzy, 80 przekształcenie liniowe, 99 przestrzeń liniowa, 29 ciało, 29 dopełnienie minora, 58 algebraiczne, 59 schemat Sarrusa, 52 skalar, 29 forma kwadratowa, 89 dodatnio (ujemnie) określona, 90 funkcja, 4 różnowartościowa, 4 trójkąt Pascala, 9 twierdzenie Cauchy’ego (o wyznacznikach), 64 Laplace’a, 63 zasadnicze arytmetyki, 18 grupa, 27 wartość bezwzględna, 16 wartość własna, 104 wektor, 29 własny, 104 wielomian charakterystyczny, 104 charakterystyczny endomorfizmu, 105 współczynniki Newtona, 9 współrzędna wektora w bazie, 33 wykres funkcji, 4 wymiar przestrzeni liniowej, 32 wyznacznik macierzy, 51 wzór dwumienny Newtona, 11 Laplace’a, 63 inwersja, 8 kombinacja, 10 kombinacja liniowa wektorów, 31 kres górny (dolny) zbioru, 15 kryterium Sylvestera, 93 macierz, 45 diagonalna, 49 elementarna, 80 jednostkowa, 49 kwadratowa, 48 przejścia, 103 przekształcenia liniowego, 102 symetryczna, 69 transponowana, 46 trójkątna, 49 macierze podobne, 104 równoważne, 80 zasada indukcji matematycznej, 5 zasada minimum, 4 zbiór liniowo niezależny, 31 109 110 liniowo zależny, 31 SKOROWIDZ Bibliografia [1] A. Białynicki-Birula, Algebra, PWN, Warszawa, 1976. [2] A. Białynicki-Birula, Algebra liniowa z geometrią, PWN, Warszawa, 1976. [3] A. Błaszczyk, S. Turek, Wstęp do matematyki z elementami zastosowania w ekonomii, WSB Dąbrowa Górnicza, 2000?. [4] B. Gleichgewicht, Algebra, PWN, Warszawa, 1975. [5] L. Jeśmianowicz, J. Łoś Zbiór zadań z algebry, PWN, Warszawa, 1966. [6] A. Mostowski, M. Stark Zarys algebry wyższej, PWN, Warszawa, 1963. [7] A. Mostowski, M. Stark Algebra liniowa, PWN, Warszawa, 1977. [8] J. Rutkowski, Algebra liniowa w zadaniach, PWN, Warszawa, 2008. [9] D. Witczyńska, K. Witczyński, Wybrane zagadnienia z algbery liniowej i geometrii, Oficyna Wydawnicza Politechniki Warszawskiej, Warszawa, 2001. 111