Wstęp do Analizy Matematycznej z elementami Logiki i Teorii Mnogości Notatki do wykładów dla studentów kierunku Matematyka Komputerowa Marian Mrozek Uniwersytet Jagielloński 3 października 2014 2 Spis treści 1 Wprowadzenie do analizy matematycznej 1.1 Rozwój pojęcia liczby . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Liczby naturalne . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.2 Ułamki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.3 Liczby ujemne, całkowite i wymierne . . . . . . . . . . . . . . 1.1.4 Liczby niewymierne . . . . . . . . . . . . . . . . . . . . . . . 1.1.5 Liczby rzeczywiste . . . . . . . . . . . . . . . . . . . . . . . . 1.1.6 Liczby urojone i zespolone . . . . . . . . . . . . . . . . . . . . 1.1.7 Liczby w komputerze . . . . . . . . . . . . . . . . . . . . . . . 1.2 Ciągi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Przybliżanie pierwiastka . . . . . . . . . . . . . . . . . . . . . 1.2.2 Ciągi przybliżeń . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.3 Granice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.4 Obliczanie granic ciągu. . . . . . . . . . . . . . . . . . . . . . 1.2.5 Liczba π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Szeregi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Pole koła . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.2 Liczba π poprzez szereg. . . . . . . . . . . . . . . . . . . . . . 1.3.3 Szeregi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Koncepcja funkcji . . . . . . . . . . . . . . . . . . . . . . . . 1.4.2 Miejsca zerowe funkcji . . . . . . . . . . . . . . . . . . . . . . 1.4.3 Wykres funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.4 Geometryczne konstrukcje funkcji . . . . . . . . . . . . . . . 1.4.5 Rozwijanie funkcji w szereg . . . . . . . . . . . . . . . . . . . 1.5 Pola figur i całkowanie . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5.1 Całka oznaczona . . . . . . . . . . . . . . . . . . . . . . . . . 1.5.2 Całka nieoznaczona . . . . . . . . . . . . . . . . . . . . . . . 1.6 Styczna do krzywej i granica funkcji . . . . . . . . . . . . . . . . . . 1.6.1 Styczna do krzywej . . . . . . . . . . . . . . . . . . . . . . . . 1.6.2 Granica funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.3 Funkcje ciągłe . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.4 Obliczanie granic. . . . . . . . . . . . . . . . . . . . . . . . . 1.7 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7.1 Lokalne maksima i minima . . . . . . . . . . . . . . . . . . . 1.7.2 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . . 1.7.3 Podstawowe twierdzenie rachunku różniczkowego i całkowegoŚCI Elementy logiki i teorii mnogości 39 2 Matematyka zbiorów skończonych 2.1 Zbiory skończone . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Operacje mnogościowe . . . . . . . . . . . . . . . . . . . 2.1.2 Zawieranie się i równość zbiorów. Podzbiory. . . . . . . 2.1.3 Uzupełnienie zbioru. . . . . . . . . . . . . . . . . . . . . 2.1.4 Elementarne własności operacji mnogościowych . . . . . 2.2 Iloczyn kartezjański . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Para . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Iloczyn kartezjański . . . . . . . . . . . . . . . . . . . . 2.3 Relacje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Relacje . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Własności relacji . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Iloczyn kartezjański n zbiorów i relacje n-argumentowe. 2.4 Relacje równoważności . . . . . . . . . . . . . . . . . . . . . . . 2.4.1 Relacja równoważności . . . . . . . . . . . . . . . . . . . 2.5 Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Obrazy i przeciwobrazy . . . . . . . . . . . . . . . . . . 2.5.2 Injekcje, surjekcje, i bijekcjelementy logiki matematycznej 3.1 Program Hilberta . . . . . . . . . . . . . 3.1.1 Struktury matematyczne. . . . . 3.1.2 Alfabet, słowo i języki formalne. 3.1.3 Spójniki logiczne . . . . . . . . . 3.1.4 Kwantyfikatory . . . . . . . . . . 3.1.5 Termy i predykaty . . . . . . . . 3.2 Język rachunku predykatów. . . . . . . . 3.2.1 Interpretacje. . . . . . . . . . . . 3.3 Rachunek zdań . . . . . . . . . . . . . . 3.4 Tautologie rachunku predykatów . . . . 3.5 Konsekwencja i dowód formalny . . . . . 3.6 Teorie aksjomatyczne . . . . . . . . . . . 3.7 Formalizm w praktyce matematycznej. . 3.8 Schematy dowodowelementy teorii mnogości 4.1 Formalizm teorii mnogości . . . . . . . . . . . . . . . . 4.1.1 Podstawowe definicje i oznaczenia. . . . . . . . 4.2 Formuły zbiorotwórcze. . . . . . . . . . . . . . . . . . 4.3 Aksjomaty teorii mnogości. . . . . . . . . . . . . . . . 4.3.1 Elementarne własności operacji mnogościowych 4.4 Iloczyn kartezjański . . . . . . . . . . . . . . . . . . . 4.4.1 Para . . . . . . . . . . . . . . . . . . . . . . . . 4.4.2 Iloczyn kartezjański . . . . . . . . . . . . . . . 4.5 Relacje . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.1 Relacje . . . . . . . . . . . . . . . . . . . . . . 4.5.2 Własności relacjiŚCI 4.6 4.7 4.8 5 4.5.3 Złożenie relacji . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.4 Charakterystyka własności relacji . . . . . . . . . . . . . . . Relacje równoważności . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.1 Relacja równoważności . . . . . . . . . . . . . . . . . . . . . Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7.1 Relacje jednolistne . . . . . . . . . . . . . . . . . . . . . . . 4.7.2 Funkcje częściowe . . . . . . . . . . . . . . . . . . . . . . . . 4.7.3 Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.7.4 (*)Zawieranie się funkcji . . . . . . . . . . . . . . . . . . . . 4.7.5 Sklejenie funkcji . . . . . . . . . . . . . . . . . . . . . . . . 4.7.6 (*)Zestawienie i iloczyn kartezjański funkcji . . . . . . . . . 4.7.7 Obrazy i przeciwobrazy . . . . . . . . . . . . . . . . . . . . 4.7.8 Złożenie funkcji . . . . . . . . . . . . . . . . . . . . . . . . . 4.7.9 Injekcje, surjekcje, i bijekcje. . . . . . . . . . . . . . . . . . 4.7.10 Iloczyn kartezjański n zbiorów . . . . . . . . . . . . . . . . 4.7.11 Sumy i iloczyny indeksowane . . . . . . . . . . . . . . . . . Równoliczność zbiorów. Twierdzenie Cantora i Cantora-Bernsteinaiczby naturalne. Indukcja i rekurencja. 5.1 Liczby naturalne . . . . . . . . . . . . . . . . . 5.1.1 Aksjomatyka liczb naturalnych . . . . . 5.1.2 Konstrukcja von Neumanna . . . . . . . 5.2 Ciągi i rekurencja. . . . . . . . . . . . . . . . . 5.3 Ciągi i podciągi . . . . . . . . . . . . . . . . . . 5.3.1 Definicja ciągu i podciągu . . . . . . . . 5.3.2 Ciąg przybliżeń pierwiastka jeszcze raz. 5.3.3 Monotoniczność ciągu. . . . . . . . . . . 5.4 Rekurencyjne definiowanie ciągu. . . . . . . . . 5.4.1 Pierwiastek poprzez ciąg rekurencyjny. . 5.4.2 (*)Arytmetyka liczb natualnych . . . . 5.5 Zbiory skończone i przeliczalne . . . . . . . . . 5.6 Rozszerzona zasada indukcji . . . . . . . . . . . 5.7 Silnia i symbol Newtona . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 93 93 94 96 96 96 96 98 98 99 100 101 101 101 6 Struktury porządkowe 6.1 Relacje porządku . . . . . . . . . . . 6.1.1 Częściowy i liniowy porządek 6.1.2 Majoranty i minoranty . . . . 6.2 Przestrzenie ciągłe . . . . . . . . . . 6.2.1 Kresy . . . . . . . . . . . . . 6.2.2 Przedziały . . . . . . . . . . . 6.2.3 Własność L . . . . . . . . . . 6.2.4 Przestrzenie ciągłe . . . . . . 6.3 Funkcje monotoniczne . . . . . . . . 6.3.1 Funkcje rosnące i malejące . . 6.4 Liczby kardynalne i porządkowe. . . 6.4.1 Liczby kardynalne. . . . . . . 6.4.2 Aksjomat wyboru. . . . . . . 6.4.3 Liczby porządkoweŚCI 7 Struktury algebraiczne. 7.1 Liczby całkowite. . . . . . . . . . . . . 7.1.1 Działania . . . . . . . . . . . . 7.1.2 Grupy . . . . . . . . . . . . . . 7.1.3 Zbiór liczb całkowitych . . . . 7.1.4 Sumy i iloczyny . . . . . . . . . 7.2 Liczby wymierne . . . . . . . . . . . . 7.2.1 Ciała . . . . . . . . . . . . . . 7.2.2 Funkcja potęgowa i wielomian . 7.2.3 Zbiór liczb wymiernych . . . . 7.2.4 Wzory skróconego mnożenia . . 7.3 Ciało liczb rzeczywistych . . . . . . . . 7.3.1 Ciała uporządkowane . . . . . 7.3.2 Zbiór liczb rzeczywistych . . . 7.3.3 (*)Konstrukcja Cauchy’egoranice 8 Liczby rzeczywiste i liczby zespolone 8.1 Ciało liczb rzeczywistych. . . . . . . . . . . . . . . 8.1.1 Podzbiory R . . . . . . . . . . . . . . . . . 8.2 Liczby reprezentowalne . . . . . . . . . . . . . . . . 8.3 Funkcja potęgowa w R . . . . . . . . . . . . . . . . 8.3.1 Nierówność Bernoullego . . . . . . . . . . . 8.4 Wartość bezwzględna . . . . . . . . . . . . . . . . . 8.5 Twierdzenie o istnieniu pierwiastka. . . . . . . . . 8.5.1 Własność Archimedesa . . . . . . . . . . . . 8.5.2 Gęstość zbioru w zbiorze . . . . . . . . . . . 8.5.3 Pierwiastki . . . . . . . . . . . . . . . . . . 8.6 Rozszerzony zbiór liczb rzeczywistych . . . . . . . 8.6.1 R uzupełniony o −∞ i +∞ . . . . . . . . . 8.6.2 Kresy funkcji . . . . . . . . . . . . . . . . . 8.7 Ciało liczb zespolonych . . . . . . . . . . . . . . . . 8.7.1 Liczby zespolone . . . . . . . . . . . . . . . 8.7.2 Ciało C . . . . . . . . . . . . . . . . . . . . 8.7.3 Zespolona funkcja kwadratowa . . . . . . . 8.7.4 Liczby zespolone o module jeden. . . . . . . 8.7.5 Odległość w R i C. . . . . . . . . . . . . . . 8.8 Granice ciągów w R . . . . . . . . . . . . . . . . . 8.8.1 Eksperymenty numeryczne . . . . . . . . . 8.8.2 Granice pozorne . . . . . . . . . . . . . . . 8.8.3 Definicja Cauchy’ego granicy ciągu . . . . . 8.8.4 Granica ciągu, a struktura ciała w R . . . . 8.8.5 Granica ciągu, a struktura porządkowa w R 8.9 Przykłady i zastosowania granic ciągów w R . . . . 8.9.1 Granice kilku ważnych ciągów . . . . . . . . 8.9.2 Procent składany . . . . . . . . . . . . . . . 8.9.3 Liczba eŚCI 8.9.4 7 Funkcja wykładnicza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 9 Topologia przestrzeni metrycznych 9.1 Przestrzenie metryczne . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1.1 Przestrzeń metryczna . . . . . . . . . . . . . . . . . . . . . . 9.1.2 Przykłady metryk w Rn . . . . . . . . . . . . . . . . . . . . . 9.1.3 Metryka indukowana i podprzestrzenie przestrzeni metrycznej 9.1.4 Kule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.1.5 Zbiory ograniczone . . . . . . . . . . . . . . . . . . . . . . . . 9.2 Średnica zbiorów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.2.1 Średnica zbioru . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3 Zbiory otwarte i domknięte, wnętrze, domknięcie i brzeg zbioru . . . 9.3.1 Wnętrze i domknięcie . . . . . . . . . . . . . . . . . . . . . . 9.3.2 Własności wnętrza i domknięcia . . . . . . . . . . . . . . . . 9.4 Otoczenia, punkty skupienia . . . . . . . . . . . . . . . . . . . . . . . 9.4.1 Rodzina otoczeń punktu . . . . . . . . . . . . . . . . . . . . . 9.4.2 Punkty skupienia zbioru . . . . . . . . . . . . . . . . . . . . . 9.5 Metryki równoważne, iloczyn kartezjański przestrzeni metrycznych . 9.5.1 Równoważność metryk. . . . . . . . . . . . . . . . . . . . . . 9.5.2 Iloczyn kartezjański przestrzeni metrycznych . . . . . . . . . 9.6 (*)Topologia przestrzeni metrycznej . . . . . . . . . . . . . . . . . . 9.6.1 Fundamentalne własności zbiorów otwartych i domkniętych . 9.7 (**)Bazy otoczeń . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.7.1 Baza otoczeń punktu . . . . . . . . . . . . . . . . . . . . . . . 9.7.2 Własność Hausdorffa . . . . . . . . . . . . . . . . . . . . . . . 9.7.3 Metryka w R̄ . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.8 (**)Przeliczalne bazy otoczeń punktu . . . . . . . . . . . . . . . . . 9.9 (*)Zupełność . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.9.1 Warunek Cauchy’ego . . . . . . . . . . . . . . . . . . . . . . . 9.9.2 Przestrzenie zupełneranica funkcji 10.1 Granica funkcji w przestrzeniach metrycznych . . . . . . . . . . 10.1.1 Eksperymenty numeryczne . . . . . . . . . . . . . . . . 10.1.2 Definicja granicy funkcji w przestrzeniach metrycznych . 10.1.3 Jednoznaczność granicy . . . . . . . . . . . . . . . . . . 10.1.4 Granica złożenia funkcji . . . . . . . . . . . . . . . . . . 10.2 (**)Przypadki szczególne definicji granicy . . . . . . . . . . . . 10.2.1 Kryterium na granicę w bazach . . . . . . . . . . . . . . 10.2.2 Granica ciągu . . . . . . . . . . . . . . . . . . . . . . . . 10.2.3 Granica funkcji w przestrzeni metrycznej . . . . . . . . 10.2.4 Granica nieskończona w R̄ . . . . . . . . . . . . . . . . . 10.2.5 Granica w nieskończoności . . . . . . . . . . . . . . . . . 10.3 Granice jednostronne . . . . . . . . . . . . . . . . . . . . . . . . 10.4 Punkty graniczne . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4.1 Ciągowa charakterystyka granicy . . . . . . . . . . . . . 10.4.2 Zbiór punktów granicznych . . . . . . . . . . . . . . . . 10.4.3 Ciągowa charakterystyka granicy ciągu . . . . . . . . . 10.5 Granica dolna i górnaŚCI 10.5.1 Granica dolna i górna . . . . . . . . . 10.5.2 Własności granicy dolnej i górnej . . . 10.6 Granica, a struktura algebraiczna . . . . . . . 10.6.1 Sumy, różnica, iloczyn i iloraz funkcji 10.6.2 Granica sumy, różnicy i iloczynu . . . 10.6.3 Granica ilorazu . . . . . . . . . . . . . 10.7 Granica, a struktura porządkowa . . . . . . . 10.7.1 Zachowywanie nierówności w granicy . 10.7.2 Twierdzenie o trzech funkcjach . . . . 10.7.3 Granica funkcji monotonicznej . . . . 10.8 Granice w produkcie kartezjańskimiągłość funkcji 11.1 Koncepcja ciągłości . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1.1 Definicja ciągłości . . . . . . . . . . . . . . . . . . . . . . 11.1.2 Kryteria ciągłości . . . . . . . . . . . . . . . . . . . . . . . 11.1.3 Ciągłość złożenia . . . . . . . . . . . . . . . . . . . . . . . 11.1.4 Ciągłość operacji arytmetycznych . . . . . . . . . . . . . . 11.1.5 Twierdzenie o lokalnym zachowywaniu znaku . . . . . . . 11.1.6 (*)Nieciągłości funkcji f : R → R . . . . . . . . . . . . . . 11.1.7 Ciągłość bijekcji monotonicznej . . . . . . . . . . . . . . . 11.2 Ciągłość, a zwartość . . . . . . . . . . . . . . . . . . . . . . . . . 11.2.1 Zwartość podprzestrzeni Rd . . . . . . . . . . . . . . . . . 11.2.2 (*)Intuicja zwartości i ogólna definicja zwartości. . . . . . 11.2.3 Przestrzenie zwarte . . . . . . . . . . . . . . . . . . . . . . 11.2.4 Obraz zbioru zwartego przez odwzorowanie ciągłe. . . . . 11.2.5 Funkcja ciągła na przedziale zwartym osiąga swoje kresy . 11.2.6 Funkcja odwrotna do funkcji ciągłej . . . . . . . . . . . . 11.3 Jednostajna ciągłość . . . . . . . . . . . . . . . . . . . . . . . . . 11.3.1 Funkcje Lipschitza . . . . . . . . . . . . . . . . . . . . . . 11.4 Ciągłość, a spójność . . . . . . . . . . . . . . . . . . . . . . . . . 11.4.1 Spójne podzbiory R̄. . . . . . . . . . . . . . . . . . . . . . 11.4.2 (*)Przestrzenie spójne . . . . . . . . . . . . . . . . . . . . 11.4.3 Obraz zbioru spójnego przez odwzorowanie ciągłe. . . . . 11.4.4 Własność Darbouxw kołozeregi 12.1 Eksperymenty numeryczne . . . . . . . . . . . . . . . . . . 12.1.1 Przybliżanie liczby π polami wielokątów wpisanych 12.1.2 Warunek konieczny zbieżności szeregu . . . . . . . 12.1.3 Rozbieżność do nieskończoności . . . . . . . . . . . 12.2 Własności podstawowe . . . . . . . . . . . . . . . . . . . . 12.2.1 Pojęcie szeregu . . . . . . . . . . . . . . . . . . . . 12.2.2 Szereg geometryczny . . . . . . . . . . . . . . . . . 12.3 Kryteria zbieżności P∞ . . . . . . . . . . . . . . . . . . . . . . 12.3.1 Szereg n=1 n1p . . . . . . . . . . . . . . . . . . . . 12.3.2 Kryterium Leibniza . . . . . . . . . . . . . . . . . 12.3.3 Kryterium Cauchy’ego i kryterium d’Alemberta . . 12.3.4 Szeregi potęgowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . SPIS TREŚCI 12.4 Operacje na szeregach . . . . . . . . . . . 12.4.1 Suma i iloczyn szeregów . . . . . . 12.4.2 (**)Permutacja szeregu i zbieżność 12.4.3 (**)Twierdzenie Riemanna . . . . 12.4.4 Szeregi w programie Mathematica 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198 198 199 200 200 13 Funkcje wykładnicza, logarytmiczna i trygonometryczne 13.1 Funkcja wykładnicza i logarytmiczna . . . . . . . . . . . . . 13.1.1 Zespolona funkcja wykładnicza . . . . . . . . . . . . 13.1.2 Funkcja wykładnicza ex . . . . . . . . . . . . . . . . 13.1.3 Logarytm naturalny . . . . . . . . . . . . . . . . . . 13.1.4 Funkcja wykładnicza ax . . . . . . . . . . . . . . . . 13.2 Funkcje trygonometryczne . . . . . . . . . . . . . . . . . . . 13.2.1 Nawijanie prostej na okrąg . . . . . . . . . . . . . . 13.2.2 Funkcje sin i cos . . . . . . . . . . . . . . . . . . . . 13.2.3 Liczba π . . . . . . . . . . . . . . . . . . . . . . . . . 13.2.4 Okresowość . . . . . . . . . . . . . . . . . . . . . . . 13.2.5 Wzory trygonometrycznebezwarunkowa . . . . . . . . . . . . . . . . . . Rachunek różniczkowy i całkowy 14 Przestrzenie wektorowe 14.1 Definicja przestrzeni wektorowej . . . . . . . . 14.1.1 Przestrzeń wektorowa . . . . . . . . . . 14.2 Przestrzenie wektorowe z iloczynem skalarnym 14.2.1 Iloczyn skalarny . . . . . . . . . . . . . 14.2.2 Nierówność Cauchy-Schwartza . . . . . 14.3 Przestrzenie wektorowe unormowane . . . . . . 14.3.1 Norma . . . . . . . . . . . . . . . . . . . 14.3.2 Norma euklidesowa . . . . . . . . . . . . 14.3.3 Przestrzenie Hilberta i Banachaochodne i różniczki. 15.1 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.1.1 Definicja pochodnej . . . . . . . . . . . . . . . . . . . . . . 15.1.2 Pochodna funkcji stałej i identycznościowej. . . . . . . . . . 15.1.3 Pochodna lewo- i prawostronna. . . . . . . . . . . . . . . . . 15.1.4 Ciągłość funkcji różniczkowalnej . . . . . . . . . . . . . . . 15.2 Różniczka funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.2.1 Aproksymacja liniowa . . . . . . . . . . . . . . . . . . . . . 15.2.2 Relacja "o małe" . . . . . . . . . . . . . . . . . . . . . . . . 15.2.3 Płaskość w zerze . . . . . . . . . . . . . . . . . . . . . . . . 15.2.4 Różniczkowalność . . . . . . . . . . . . . . . . . . . . . . . . 15.3 Różniczkowanie sumy, różnicy, iloczynu i ilorazu . . . . . . . . . . 15.4 Różniczkowanie funkcji złożonej . . . . . . . . . . . . . . . . . . . . 15.5 Różniczkowanie funkcji wykładniczej i funkcji trygonometrycznych 15.6 Nieciągłości pochodnej i funkcje klasy C 1 . . . . . . . . . . . . . . . 15.7 Metoda Newtona . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.8 Ekstrema lokalne, a różniczkowalność. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 219 219 220 221 222 223 223 225 226 226 228 230 232 234 235 238 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 SPIS TREŚCI 15.8.1 Maksima i minima lokalne . . . . . . . . . . . . . . . 15.8.2 Twierdzenie Rolle’a. . . . . . . . . . . . . . . . . . . 15.9 Twierdzenie o wartości średniej . . . . . . . . . . . . . . . . 15.9.1 Uogólnione twierdzenie o wartości średniej . . . . . . 15.9.2 Twierdzenie Lagrange’a o wartości średniej . . . . . 15.9.3 Twierdzenie o przyrostach skończonych . . . . . . . 15.10Zastosowania twierdzenia o wartości średniej . . . . . . . . 15.10.1 Pochodna, a monotoniczność . . . . . . . . . . . . . 15.10.2 Twierdzenie o wartościach pośrednich dla pochodnej 15.10.3 Reguła de l’Hospitala . . . . . . . . . . . . . . . . . 15.11Różniczkowanie funkcji odwrotnej . . . . . . . . . . . . . . . 15.11.1 Wzór na pochodną funkcji odwrotnej . . . . . . . . . 15.11.2 Pochodna funkcji logarytmicznej . . . . . . . . . . . 15.11.3 Funkcje kołowe (odwrotne do trygonometrycznych) . 15.11.4 Pochodna funkcji potęgowej . . . . . . . . . . . . . . 15.12Pochodne wyższych rzędów . . . . . . . . . . . . . . . . . . 15.12.1 n-ta pochodna . . . . . . . . . . . . . . . . . . . . . 15.12.2 Wielomian Taylora . . . . . . . . . . . . . . . . . . . 15.12.3 n-płaskość w zerze. . . . . . . . . . . . . . . . . . . . 15.13Wzory Taylora i szereg Taylora. . . . . . . . . . . . . . . . . 15.13.1 Wzór Taylora z resztą Peano. . . . . . . . . . . . . . 15.13.2 Wzór Taylora z resztą Lagrange’a . . . . . . . . . . . 15.13.3 Punkty przegięcia . . . . . . . . . . . . . . . . . . . 15.13.4 Szereg Taylora . . . . . . . . . . . . . . . . . . . . . 16 Całka oznaczona 16.1 Całka Riemanna funkcji jednej zmiennej . . . . . . . 16.1.1 Pole obszaru. . . . . . . . . . . . . . . . . . . 16.1.2 Przedziały w R i ich podziały. . . . . . . . . . 16.1.3 Całkowalność w sensie Riemanna . . . . . . . 16.1.4 Epsilonowe kryterium całkowalności . . . . . 16.2 Własności całki Riemanna . . . . . . . . . . . . . . . 16.2.1 Monotoniczność całki . . . . . . . . . . . . . 16.2.2 Przestrzeń wektorowa funkcji całkowalnych w 16.2.3 Miarowe kryterium całkowalności. . . . . . . 16.2.4 Całkowalność złożenia i iloczynu . . . . . . . 16.2.5 Całka Riemanna na podprzedziale . . . . . . 16.2.6 Całka oznaczona . . . . . . . . . . . . . . . . 16.2.7 Twierdzenie Riemannasensie Riemannaunkcja pierwotna i całka nieoznaczona 17.1 Podstawowe twierdzenie rachunku różniczkowego i całkowego . . . . 17.1.1 Pochodna całki . . . . . . . . . . . . . . . . . . . . . . . . . . 17.1.2 Funkcja pierwotna i całka nieoznaczona. . . . . . . . . . . . . 17.1.3 Podstawowe twierdzenie rachunku różniczkowego i całkowego 17.2 Podstawowe techniki całkowania. . . . . . . . . . . . . . . . . . . . . 17.2.1 Własności całki nieoznaczonej. . . . . . . . . . . . . . . . . . 17.2.2 Całkowanie przez części . . . . . . . . . . . . . . . . . . . . . 17.2.3 Całkowanie przez podstawienie . . . . . . . . . . . . . . . . . . . . . . . . . SPIS TREŚCI 17.2.4 Twierdzenia o wartości średniej dla całek 17.3 Całkowanie funkcji wektorowych . . . . . . . . . 17.4 Zastosowania geometryczne całek . . . . . . . . . 17.4.1 Długość krzywej . . . . . . . . . . . . . . 17.4.2 Bryła obrotowa . . . . . . . . . . . . . . . 17.4.3 Obętość bryły obrotowej . . . . . . . . . . 17.4.4 Pole powierzchni bocznej bryły obrotowejiągi i szeregi funkcyjne 18.1 Zbieżność punktowa i jednostajna . . . . . . . . . . . . . . . . . . 18.1.1 Zbieżność punktowa . . . . . . . . . . . . . . . . . . . . . 18.1.2 Zbieżność jednostajna . . . . . . . . . . . . . . . . . . . . 18.1.3 Kryterium Cauchy’ego zbieżności jednostajnej . . . . . . . 18.2 Zbieżność jednostajna, a ciągłość, różniczka i całka . . . . . . . . 18.2.1 Granica, a zbieżność jednostajna . . . . . . . . . . . . . . 18.2.2 Całkowanie i różniczkowanie, a zbieżność jednostajna . . . 18.3 Aproksymacja funkcji ciągłych . . . . . . . . . . . . . . . . . . . 18.4 Szeregi potęgowe . . . . . . . . . . . . . . . . . . . . . . . . . . . 18.4.1 Twierdzenie o szeregu Taylora . . . . . . . . . . . . . . . . 18.4.2 Funkcje analityczne . . . . . . . . . . . . . . . . . . . . . 18.5 Szeregi Fouriera . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18.5.1 Wielomiany trygonometryczne . . . . . . . . . . . . . . . 18.5.2 Zespolony iloczyn skalarny . . . . . . . . . . . . . . . . . 18.5.3 Przestrzeń wektorowa z zespolonym iloczynem skalarnym 18.5.4 Układ ortonormalny . . . . . . . . . . . . . . . . . . . . . 18.5.5 Szereg Fouriera . . . . . . . . . . . . . . . . . . . . . . . . 18.5.6 Rzut ortonormalny . . . . . . . . . . . . . . . . . . . . . . 18.5.7 Jądro Dirichleta . . . . . . . . . . . . . . . . . . . . . . . 18.5.8 Zbieżność punktowa szeregu FourieraŚCI Wstęp Niniejsze notatki do kursów Elementy Logiki i Teorii Mnogości oraz Analiza Matematyczna I przeznaczonego dla studentów kierunku Matematyka Komputerowa stanowią roboczą wersję i w trakcie kursu mogą podlegać aktualizacji. Punktem wyjścia tych notatek jest rękopis moich materiałów do wykładu z analizy matematycznej prowadzonego w latach 1984-1990 dla studentów informatyki UJ. W owym czasie był to bardzo obszerny kurs obejmujący 240h wykładów i 240h ćwiczeń. Wykładało i studiowało się wtedy zupełnie inaczej, bo wykładowca miał do dyspozycji tylko tablicę i kredę, a studenci to co zdołali w trakcie wykładu zanotować. Dziś możliwości są zupełnie inne, stąd i te notatki są inne, choć w dużym stopniu wykorzystują jeszcze mój dawny rękopis. Już wtedy starałem się o to, by część odnosząca się do intuicji była obszerna i równocześnie wyraźnie oddzielona od części formalnej. Wydaje się, że takie podejście jest szczególnie ważne dla studentów specjalności Matematyka Komputerowa, dlatego planuję je kontynuować również w ramach obecnego wykładu. Część materiału poświęcona intuicjom ma charakter całkowicie nieformalny. Dla wyraźnego odróżnienia od części formalnej jest złożona brązową, pochyloną czcionką. W szczególności cały pierwszy rozdział jest nieformalny. Nieformalne mówienie o matematyce rodzi często więcej pytań niż daje odpowiedzi. Ale takie właśnie jest jej zadanie: sprowokować do myślenia. Dociekliwy czytelnik, który czyta najpierw nieformalny tekst matematyczny wyrabia sobie pewne idee, które wymagają dopracowania. W moim przekonaniu takie podejście powoduje, że studiowanie tekstu formalnego, który to dopracowanie dostarcza, staje się w efekcie bardziej naturalne i znacznie łatwiejsze. Najważniejsze pytania jakie rodzi tekst nieformalny zostały w tekście wyróżnione poprzez umieszczenie w ramce o różowym tle. Pytań jest oczywiście dużo więcej niż tych, które w tekście zostały jawnie postawione. Różne kolory tła tekstu oznaczają: blado pomarańczowy - twierdzenia, blado zielony - definicje, różowy - problemy, blado niebieski (C++) i blado fioletowy (Mathematica) - listingi programów komputerowych, żółłty - ćwiczenia tablicowe, niebieski - ćwiczenia kokmputerowe. W notatkach odręcznych • znak i oznacza początek dowodu indukcyjnego, • znak s oznacza początek dowodu nie wprost, • znak x oznacza sprzeczność, • znak p oznacza początek dowodu przez przypadki, • znak oznacza koniec fragmentu dowodu, • znak oznacza koniec dowodu, • wytłuszczony wykrzyknik zastępuje słowo "niech", • dwie pionowe kreski po lewej stronie tekstu oznaczają materiał nieformalny. Aspekty obliczeniowe analizy matematycznej, ilustrowane programami komputerowymi w języku C++ oraz instrukcjami programu Mathematica złożone są czcionką w kolorze niebieskim. Znajomość rozdziałów, podrozdziałów i dowodów oznaczonych (*) obowiązuje jedynie studentów mierzących w ocenę bdb. Rozdziały i podrozdziały oznaczone (**) są nieobowiązkowe. Życzę wszystkim uczestnikom kursu udanego studiowania matematyki komputerowej na Wydziale Matematyki i Informatyki UJ. Rozdział 1 Wprowadzenie do analizy matematycznej Nim zabierzemy si˛e do studiowania analizy matematycznej w szczegółach, warto sobie zadać pytanie czym analiza matematyczna si˛e zajmuje. Nie da si˛e na nie dać dobrej odpowiedzi bez przyjrzenia si˛e jak koncepcje, które ukształtowały współczesna˛ analiz˛e matematyczna˛ stopniowo kształtowały si˛e na przestrzeniach dziejów. Niniejszy rozdział wprowadzajacy ˛ stanowi krótki przeglad ˛ podstawowych problemów analizy matematycznej oraz ich umiejscowienia w historii matematyki. 1.1 1.1.1 Rozwój pojęcia liczby Liczby naturalne Umiej˛etność posługiwania si˛e liczbami rozwijała si˛e u człowieka stopniowo. Pierwotny zbiór liczebników ograniczał si˛e do trzech: jeden, dwa i wiele. Wraz z rozwojem ludzkiej cywilizacji pojawiła si˛e konieczność dokładnego rozeznania w liczebności oddziału wojowników, stada bydła, czy zestawu strzał. Tak zrodziła si˛e umiej˛etność porównywania liczności zbiorów, która doprowadziła do pojawienia si˛e abstrakcyjnego poj˛ecia liczby naturalnej. Zapewne niedługo potem człowiek nauczył si˛e te liczby dodawać, odejmować i mnożyć. Operacje te wymagały opanowania stosownych algorytmów post˛epowania, a ich efektywność silnie zależała od stosowanego sposobu zapisu liczb. Używany przez nas dziś dziesiatkowy ˛ system pozycyjny wywodzi si˛e z Indii, gdzie pojawił si˛e około VIII w. To tam też po raz piewrwszy zaakceptowano zero jako pełnoprawna˛ liczb˛e, przydatna˛ w rachunkach. 1.1.2 Ułamki Pojawienie si˛e ułamków wiaże ˛ si˛e z rozwojem handlu, który wymagał doskonalenia umiej˛etności mierzenia. Do mierzenia używano miary. Na przykład w przypadku płynów i materiałów sypkich mogła to być gliniana amfora o ustalonej obj˛etości. Poczatkowo ˛ zaniedbywano powstajace ˛ przy odmierzaniu cz˛eści ułamkowe, ale gdy z biegiem czasu rosła potrzeba dokładności, wprowadzano miary pomocnicze b˛edace ˛ cz˛eścia˛ wyjściowej miary, na przykład połowa,˛ jedna˛ trzecia˛ czy jedna˛ czwarta.˛ Co charakterystyczne, były to tzw. ułamki proste, czyli ułamki o liczniku jeden. Gdy handel zaczał˛ przekraczać granice pojedynczych plemion pojawiła si˛e konieczność wprowadzania przelicznika dla różnych systemów miar obowiazuj ˛ acych ˛ w różnych rejonach. To zapewne przyczyniło si˛e do powstania abstrakcyjnej postaci ułamka. 1.1.3 Liczby ujemne, całkowite i wymierne Dwie liczby naturalne i dwa ułamki można zawsze do siebie dodać i w wyniku powstaje inna liczba naturalna lub inny ułamek. Jednakże od liczby a nie można odjać ˛ liczby b gdy b ­ a bez rozszerzenia zbioru liczb o liczby ujemne i zero. Jak wiemy z każda˛ liczba˛ a powiazać ˛ można liczb˛e do niej przeciwna,˛ oznaczana˛ −a, tak że ich suma daje zero. Zbiór liczb naturalnych rozszerzony o zero i liczby przeciwne do liczb naturalnych nazywamy zbiorem liczb całkowitych, a analogicznie rozszerzony zbiór ułamków nazywamy zbiorem liczb wymiernych. Zwyczajowo stosujemy oznaczenia N dla liczb naturalnych, Z dla liczb całkowitych oraz Q dla liczb wymiernych. Natomiast zbiór liczb wymiernych dodatnich, czyli po prostu zbiór klasycznych ułamków oznaczamy Q+ . Liczby ujemne w pewnym stopniu były znane już w starożytnych Chinach i Indiach, gdzie interpretowane były w kategoriach długu. Jednak nie były specjalnie doceniane i na codzień radzono sobie bez nich. Matematyka europejska zaakceptowała liczby ujemne dopiero w XVII w, ale nawet dziś w życiu codziennym 13 14 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ Rysunek 1.1: Pitagoras z Samos, VI w. przed Chrystusem. Źródło: Wikipedia 2 2 Rysunek 1.2: c2 = (a + b)2 − 4 ab 2 =a +b jesteśmy w stanie radzić sobie bez liczb ujemnych. Najwi˛ekszy pożytek z liczb ujemnych jest przy ujednolicaniu algorytmów, gdyż dzi˛eki nim nie musimy rozważać różnych przypadków, by zagwarantować, że wszystkie rozważane w trakcie pracy algorytmu liczby sa˛ dodatnie. 1.1.4 Liczby niewymierne Odkrycie, że ułamki nie wystarczaja˛ do mierzenia dowolnych wielkości przypisuje si˛e szkole pitagorejskiej, wywodzacej ˛ si˛e od żyjacego ˛ w VI w. przed Chrystusem w Grecji Pitagorasa z Samos (rys.1.1). Pitagorejczycy świ˛ecie wierzyli, że ułamki wystarczaja˛ do zmierzenia dowolnych długości. Dlatego dokonane przez nich odkrycie było dla nich ciosem, tym wi˛ekszym, że było konsekwnecja˛ słynnego twierdzenia udowodnionego przez Pitagorasa (rys.1.2). Twierdzenie 1.1.1 (Pitagoras z Samos) W trójkacie ˛ prostokatnym ˛ suma kwadratów przyprostokatnych ˛ jest równa kwadratowi przeciwprostokatnej. ˛ Z twierdzenia Pitagorasa wynika, że przekatna ˛ kwadratu o boku długości jeden jest liczba,˛ która podniesiona do kwadratu wynosi dwa, czyli tak zwanym pierwiastkiem z dwóch (rys. 1.3). Pitagorejczycy pierwsi zauważyli, że żaden ułamek podniesiony do kwadratu nie może dać liczby dwa. Było to szokujace ˛ 1.1. ROZWÓJ POJĘCIA LICZBY 15 Rysunek 1.3: Przekątna kwadratu to √ 2. Ale ile to jest √ 2? spostrzeżenie, z którym niełatwo było si˛e pogodzić. Tak pojawiły si˛e liczby niewymierne, a wraz nimi problem ich przybliżania ułamkami. • Rozkładajac ˛ na czynniki pierwsze licznik i mianownik ułamka spróbuj uzasadnić, dlaczego √ • Czy podobne rozumowanie może być przeprowadzone dla 3 2? dla innych pierwiastków? Ćwiczenie 1.1.2 √ 2 nie może być ułamkiem. √ Problem 1.1.3 Czy wiemy czym naprawd˛e jest liczba 2? Czy ona rzeczywiście ma sens? Jakich liczb jeszcze brakuje wśród ułamków, by wszystkie długości dało si˛e wymierzyć? W jaki sposób je zdefiniować? 1.1.5 Liczby rzeczywiste Precyzyjna definicja liczby niewymiernej jest skomplikowana. Stwierdzenie, że liczby niewymierne, to wszystkie liczby, które nie sa˛ wymierne jest dobra˛ definicja˛ tylko wtedy gdy wiemy co oznacza zwrot "wszystkie liczby". Intuicyjnie chodzi nam o taki zbiór liczb, który pozwala mierzyć długości tak odcinków jak i krzywych. Zbiór takich liczb został precyzyjnie zdefiniowany dopiero w XIX wieku. Określa si˛e go mianem zbioru liczb rzeczywistych i oznacza symbolem R. Natomiast zbiór liczb rzeczywistych dodatnich oznacza si˛e symbolem R+ . 1.1.6 Liczby urojone i zespolone Określenie liczby rzeczywiste zrodziło si˛e w kontraście do tzw. liczb urojonych. Liczba urojona to liczba, której kwadrat jest liczba˛ ujemna.˛ Kwadrat liczby rzeczywistej nie może być ujemny, tak wi˛ec liczb urojona nie jest liczba˛ rzeczywista.˛ Sensowność takich liczb długo budziła watpliwości, ˛ co wyjaśnia ich nazw˛e. Liczby zespolone, b˛edace ˛ sumami liczb rzeczywistych i urojonych, maja˛ wiele cech podobnych do liczb rzeczywistych, a także wiele zalet, których liczby rzeczywiste nie maja.˛ Dzi˛eki temu pozwalaja˛ rozwiazywać ˛ pewne problemy "na skróty". Jednym z pierwszych pożytków z liczb zespolonych było podanie w XVI wieku algorytmów wyznaczania miejsc zerowych równania trzeciego i czwartego stopnia. 1.1.7 Liczby w komputerze Rachunki liczbowe na papierze wykonywane sa˛ zazwyczaj na ułamkach zwykłych, a cz˛eściej na ułamkach dziesi˛etnych. Wraz ze zbudowaniem w połowie XX w. pierwszych komputerów stworzono też koncepcj˛e przechowywania i przetwarzania liczb w komputerze. Było to konieczne, bo wszystko co przetwarza współczesny komputer na poziomie procesora sprowadza si˛e do wykonywania obliczeń na liczbach. Typowy użytkownik 16 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ komputera oglada ˛ filmy, słucha muzyki, przeglada ˛ strony internetowe albo po prostu gra na komputerze i nie uświadamia sobie, że wszystko to sprowadza si˛e do przetwarzania liczb. Zazwyczaj sa˛ to liczby całkowite, ale wiele pozamatematycznych zastosowań wymaga też obliczeń na liczbach wymiernych. Komputer jest oczywiście równie niezastapiony ˛ jeśli naszym celem jest przeprowadzenie mniej lub bardziej skomplikowanych obliczeń matematycznych, inżynierskich badź ˛ naukowych. Jeśli obliczenia sa˛ bardzo specjalistyczne, jest ich szczególnie dużo, a nam zależy na efektywności, piszemy własny lub zamawiamy stosowny program w kompilowanym j˛ezyku wysokiego poziomu. Jeśli obliczenia sa˛ typowe, a ich ilość jest umiarkowana, si˛egamy po specjalistyczne oprogramowanie takie jak Mathematica, Maple, Matlab czy Scilab. W ramach niniejszego kursu aspekty numeryczne analizy matematycznej demonstrować b˛edziemy programami napisanymi dla środowiska Mathematica, a także programami napisanymi w j˛ezyku C++. Mathematica to bogaty pakiet oprogramowania bardzo ułatwiajacy ˛ wszelkie obliczenia matematyczne. Umożliwia on tak prosta˛ prac˛e interaktywna˛ jak i pisanie własnego oprogramowania. Na przykład, aby pomnożyć przez siebie liczby 123 i 456 wystarczy napisać 123∗456 i przycisnać ˛ rówcznocześnie klawisze ’Shift’ i ’Enter’. Przyciśni˛ecie ’Shift’ wraz ’Enter’ jest sygnałem, że oczekujemy przeprowadzenia obliczeń. Natychmiast otrzymujemy wynik 56088 W programie Mathematica operacje arytmetyczne dodawania, odejmowania, mnożenia, dzielenia i pot˛egowania oznaczamy odpowiednio znakami +,-,*,/,^. Tak wi˛ec piszac ˛ 3^4 otrzymujemy 81 W podobny sposób przeprowadzamy obliczenia na ułamkach dziesi˛etnych. Na przykład 3.14 + 2.72 daje wynik 5.86. Trzeba jedynie pami˛etać, że zgodnie z anglosaskim zwyczajem używamy kropki dziesi˛etnej, a nie przecinka. Obliczenia na liczbach dziesi˛etnych zwiazane ˛ sa˛ niestety z bł˛edami zaokragleń. ˛ Na przykład 1.0/3.0 daje 0.333333 co jest wynikiem przybliżonym. Bł˛edu zaokragleń ˛ można uniknać ˛ przeprowadzajac ˛ obliczenia na liczbach wymiernych. Jeśli napiszemy 1/3 Mathematica zwróci ułamek 1 , 3 a piszac ˛ 7/3+3/11 otrzymamy jako wynik ułamek 86 . 33 co , w przeciwieństwie do obliczeń na liczbach dziesi˛etnych, jest wynikiem dokładnym. Jeśli potrzebujemy jednak przybliżenia dziesi˛etnego, zawsze możemy je otrzymać. Piszac ˛ N[ 1 / 2 3 ] otrzymujemy przybliżenie ułamka 1 23 0.0434783. 1.2. CIĄGI 1.2 17 Ciągi 1.2.1 Przybliżanie pierwiastka Choć wśród ułamków brak jest takiego, który podniesiony do kwadratu daje liczb˛e dwa, to rozważajac ˛ wszystkie ułamki o mianowniku m znajdziemy taki, postaci i , że m i m 2 <2< i+1 m 2 . Dla danego m licznik taki jest dokładnie jeden. Sam pierwiastek z dwóch, czymkolwiek jest, leży gdzieś pomi˛edzy 1 dokładnościa˛ co najmniej m . Na przykład, dla m = 5 mamy i m, a i+1 m , zatem i m jest przybliżeniem √ 2z 2 2 7 49 64 8 = <2< = 5 25 25 5 zatem 7 5 1.2.2 jest przybliżeniem √ 2 z dokładnoscia˛ wi˛eksza˛ niż 15 . Aby dostać lepsza˛ dokładność wystarczy wziać ˛ odpowiednio duży mianownik m. Ciągi przybliżeń W praktyce wygodnie ograniczyć si˛e do mianowników postaci m = 10n . Niestety r˛eczne poszukiwanie stosownego licznika jest bardzo żmudne, a dla dużych n praktycznie niewykonalne. Potrzebujemy algorytmu, który dla zadanego mianownika 10n pozwoli nam wyznaczyć stosowny licznik in oraz komputera, który sprawnie wykona obliczenia w tym algorytmie. Łatwo zauważyć, że in = max { i | i ∗ i < 2 ∗ 100n }. n Sugeruje to algorytm, który przy zadanym n sprawdza nierówność √ i ∗ i < 2 ∗ 100 dla kolejnych liczb naturalnych i i zwraca in jako ostatnie i, dla którego in nierówność ta zachodzi. Wtedy xn := 10n jest przybliżeniem 2, które, jak łatwo sprawdzić, spełnia |xn − √ 2| ¬ 1 . 10n Kolejne liczby xn tworza˛ tzw. ciag ˛ liczbowy, w tym przypadku tzw. ciag ˛ przybliżeń. Ciag ˛ przybliżeń, to ciag ˛ skonstruowany w celu przybliżania pewnej liczby niewymiernej liczbami wymiernymi. Ciagi ˛ przybliżeń to nie jedyne ciagi ˛ rozważane w matematyce, choć ich rola praktyczna jest bardzo istotna. Badanie ciagów ˛ to jeden z głównych obiektów zainteresowań analizy matematycznej. Wprowadźmy w programie Mathematica rozdzielony średnikami ciag ˛ instrukcji n = 3 ; i = 1 ; While [ i ^ 2 < 2 ∗ 1 0 0 ^ n , i = i + 1 ] ; { ( i −1)/10^ n , i / 1 0 ^ n } Pojawiaja˛ si˛e tu zmienne i oraz n. Instrukcja While to instrukcja p˛etli. Jak długo spełniony jest warunek i^2 < 2*100^n wykonywana jest instrukcja i = i + 1. Ponieważ przed wykonaniem instrukcji While ustawiliśmy zmienna˛ n na 3, a i na 1, p˛etl˛e wykonujemy dla kolejnych wartości i = 1, 2, . . . aż zajdzie nierówność i^2 ­ 2000000. Mathematica wyprowadza jako wynik ostatnie obliczone wyrażenie, którym jest para ułamków {(i-1)/10^n,i/10^n}. W rozważanym przypadku otrzymamy { √ 707 283 , }. 500 200 1 2 z dokładnościa˛ do 1000 . √ Podstawiajac ˛ w powyższym listingu za n kolejne liczby naturalne i wykonujac ˛ obliczenia otrzymamy przybliżenia 2 od dołu i od góry o coraz lepszej jako oszacowanie od dołu i od góry 18 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ dokładności: 14 15 , 10 10 141 142 , 100 100 1414 1415 , 1000 1000 14142 14143 , 10000 10000 141421 141421 , 100000 100000 1414213 1414213 , 1000000 1000000 ··· Obliczenia ˛ przybliżeń od dołu i ciagu ˛ przybliżeń od √ te, przynajmniej teoretycznie, możemy kontynuować w nieskończoność. Otrzymujemy w ten sposób ciag góry liczby 2. W tym miejscu trzeba zrobić uwag˛e na temat stosowanej w programie Mathematica notacji. Mathematica używa nawiasów wasiastych ˛ {, } do oznaczania list. Zwyczajowo w matematyce nawiasów wasiastych ˛ używa si˛e do oznaczania zbiorów. Różnica ta ma znaczenie, bo przy wypisywaniu elementów listy kolejność jest istotna, a przy wypisywaniu elementów zbioru nie jest. Innymi słowy, dwie listy, które różnia˛ si˛e tylko kolejnościa˛ elementów sa˛ różne, a dwa zbiory, które różnia˛ si˛e tylko kolejnościa˛ w jakiej wymieniono ich elementy sa˛ traktowane jako identyczne. Korzystajac ˛ z programu Mathematica musimu o tej różnicy pami˛etać. Zaproponowana tu metoda liczenia pierwiastka należy do najprostszych, ale oczywiście jest daleka od doskonałości. Mathematica radzi sobie doskonale nie tylko z liczeniem pierwiastków, ale również innych funkcji elementarnych, w szczególności funkcji trygonometrycznych i funkcji logarytmicznej. Trzeba jednak pami˛etać, że jeśli jako argument podamy liczb˛e dokładna,˛ na przykład naturalna˛ lub ułamek, a wynik nie jest liczba˛ naturalna˛ badź ˛ ułamkiem, aby zachować dokładność Mathematica nie przeprowadzi obliczeń. Na przykład piszac ˛ Sqrt [ 2 ] otrzymamy jako wynik √ 2. Ale piszac ˛ Sqrt [ 2 . ] otrzymamy 1.41421. Do zagadnienia obliczania pierwiastka b˛edziemy jeszcze wracać w dalszych rozdziałach. Oczywiście ciagi ˛ nie musza˛ być zadawane w tak skomplikowany sposób jak nasz ciag ˛ przybliżeń. Najprościej zadać ciag ˛ podajac ˛ wzór na jego n-ty wyraz. Na przykład ciag ˛ dany wzorem xn = 1 n to tak zwany ciag ˛ harmoniczny. Problem 1.2.1 Czy ciag ˛ harmoniczny przybliża jakaś ˛ liczb˛e? Jeśli tak to jaka? ˛ Gdy ciag ˛ określony jest wzorem, na przykład wzorem (1.1), wystarczy napisać Table [ 1 / n , { n , 1 . , 10.}] a otrzymamy przybliżenia poczatkowych ˛ wyrazów tego ciagu ˛ {1., 0.5, 0.333333, 0.25, 0.2, 0.166667, 0.142857, 0.125, 0.111111, 0.1} (1.1) 1.2. CIĄGI 19 Rysunek 1.4: Wykres początkowych wyrazów ciągu 1 + (−1)n n . Można też łatwo uzyskać wizualizacj˛e (wykres) ciagu. ˛ Na przykład wykres poczatkowych ˛ wyrazów ciagu ˛ danego wzorem un = 1 + (−1)n n uzyskamy piszac ˛ D i s c r e t e P l o t [ 1 + ( −1)^ n / n , { n , 1 , 5 0 } ] Uzyskamy w ten sposób wykres przedstawiony na rys. 1.4. 1.2.3 Granice √ √ Obrazowo mówimy, że ciag ˛ ten osiaga ˛ liczb˛e 2 w granicy, albo krócej, że zmierza do 2. Właśnie √ w tym celu go skonstruowaliśmy. Ale czy możemy mieć pewność, że nasz ciag ˛ dla dużych wartości n nie zmieni zdania i na przykład zamiast zmierzać do 2 zacznie uciekać do nieskończoności? Jesteśmy w stanie policzyć tylko skończona˛ ilość wyrazów tego ciagu. ˛ Zawsze zostanie nieskończenie wiele wyrazów, których nie policzyliśmy. Czy możemy mieć pewność, że nasz ciag ˛ przybliżeń nigdy nas nie zawiedzie? Problem 1.2.2 Co to znaczy, że ciag ˛ osiaga ˛ jakaś ˛ liczb˛e w granicy (zmierza do granicy)? Jakie ciagi ˛ maja˛ granic˛e? Czy, kiedy i jak granic˛e daj˛e si˛e policzyć? Odpowiedź na te pytania to jedno z fundamantalnych zadań analizy matematycznej. Poj˛eciem granicy w takim badź ˛ innym sensie posługiwano si˛e już od czasów starożytnych, jednak aż do wieku XIX matematycy nie umieli sobie poradzić z postawieniem precyzyjnej definicji. Dopiero czeski matematyk Bernard Bolzano (rys.1.5) oraz niezależnie francuski matematyk, Augustin-Louis Cauchy (rys.1.5) pierwsi postawili precyzyjna˛ definicj˛e. Ponieważ prace Bolzano długo pozostawały mało znane, przyj˛eło si˛e mówić o definicji Cauchy’ego. Według definicji Cauchy’ego ciag ˛ liczb xn jest zbieżny do granicy g jeżeli dla każdego > 0 istnieje taka liczba naturalna N , że dla wszystkich liczb naturalnych n ­ N zachodzi nierówność |xn − g| < . 20 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ Rysunek 1.5: Augustin Louis Cauchy (1789 - 1857) i Bernard Bolzano (1781 - 1844) Źródło: Wikipedia Piszemy wtedy lim xn = g. n→∞ Ćwiczenie komputerowe 1.2.3 Dla każdego z poniższych ciagów ˛ postaw hipotez˛e, czy ma on granic˛e. Jeśli uważasz, że ma granic˛e, spróbuj odgadnać ˛ jaka.˛ Wcześniej przeprowadź eksperymenty wykorzystujac ˛ instrukcj˛e Table w Mathematica. 1. n n+1 2. 1 + (−1)n 3. 1 + (−1)n n 4. (*) cos nπ 5. (*) sin n 6. (*) 1.2.4 sin n n Obliczanie granic ciągu. W praktyce niewiele granic liczy si˛e wprost z definicji, choć najprostsze granice właśnie tak si˛e wyznacza. Znajac ˛ już granice jakichś ciagów ˛ liczymy granice innych ciagów ˛ korzystajac ˛ z różnych twierdzeń. Do najważniejszych należa˛ Twierdzenie 1.2.4 Jeśli ciagi ˛ an , bn sa˛ zbieżne odpowiednio do a i b to ich suma, różnia, iloczyn oraz iloraz sa˛ zbieżne odpowiednio do a + b, a − b, ab, ab , przy czym w przypadku ilorazu trzeba dodatkowo założyć, że b 6= 0. 1.2. CIĄGI 21 Rysunek 1.6: Archimedes z Syrakuz (ok. 287–212 pne.) (medal Fieldsa). Źródło: Wikipedia Twierdzenie 1.2.5 Jeśli ciagi ˛ an , bn , cn spełniaja˛ nierówność an ¬ bn ¬ cn i ciagi ˛ an oraz cn sa˛ zbieżne i to do tej samej granicy, to ciag ˛ bn też jest zbieżny i też do tej granicy. Ćwiczenie 1.2.6 wielkości a. 1 • Posługujac ˛ si˛e definicja˛ granicy oblicz granice ciagów ˛ n, • (*) Oblicz granice ciagów ˛ 1.2.5 √1 , 1n n 2 oraz ciagu, ˛ którego wszystkie wyrazy sa˛ stale równe stałej 2−3n+5n2 , 1+1√n . n2 Liczba π Wśród ważnych problemów rozważanych już w starożytności było wyznaczanie obwodu i pola koła o zadanym promieniu. Kluczowy w tych obliczeniach jest obwód koła o średnicy jeden, zwyczajowo oznaczany grecka˛ litera˛ π . Koło o innej średnicy ma proporcjonalnie wi˛ekszy badź ˛ mniejszy obwód, w szególności koło o promieniu r , a wi˛ec średnicy 2r ma obwód 2πr . √ Liczba π , podobnie jak 2, jest liczba˛ niewymierna,˛ ale o tym starożytni nie wiedzieli. Udowodniono to dopiero w XVIII w. Co wi˛ecej, w wieku XIX udowodniono, że π jest liczba˛ transcendentna,˛ to znaczy, że nie jest pierwiastkiem żadnego wielomianu o współczynnikach wymiernych. Oznacza to w szczególności, że nawet jeśli zbiór ułamków rozszerzymy o wszystkie możliwe pierwiastki, to nadal nie wystarczy on do mierzenia wszelkich długości. W starożytności przyjmowano różne liczby pomi˛edzy 3 i 3.16 jako przybliżenie liczby π bez przywiazywania ˛ szczególnej wagi do popełnianego bł˛edu. Dopiero grecki matematyk Archimedes (rys. 1.6) zaproponował algorytmiczna˛ metod˛e wyznaczania π , która przez ponad 1000 lat dostarczała coraz lepszych przybliżeń. Jest to metoda geometryczna, oparta o wpisywanie w okrag ˛ i opisywanie na okr˛egu wielokatów ˛ (rys.1.7). Posługujac ˛ si˛e 96-katem ˛ Archimedes oszacował, że 223/71 < π < 22/7 (3.1408 < π < 3.1429), co daje dobre przybliżenie π do dwóch miejsc po przecinku. Co ciekawe, w 1596 roku, ciagle ˛ w oparciu o metod˛e metod˛e Archimedesa, holenderski matematyk Ludolph van Ceulen policzył π z dokładnościa˛ do 35 cyfr. Oznaczmy przez an bok 2n -kata ˛ foremnego wpisanego w okrag ˛ o średnicy jeden. W oparciu o twierdzenie Pitagorasa można pokazać, że √ 2 a2 = , 2 an+1 1 = 2 q p 2 − 4 − 4a2n . (1.2) Zatem obwód tego 2n -kata ˛ wynosi An := 2n an . Można si˛e spodziewać, że ciag ˛ An powinien zmierzać do liczby π , bo tyle wynosi obwód koła o średnicy jeden. W rozdziale 8.8.1 przyjrzymy si˛e bliżej zachowaniu ciagu ˛ (1.2). 22 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ Rysunek 1.7: Przybliżanie obwodu i pola koła wielokątami Ćwiczenie 1.2.7 • (*) Opierajac ˛ si˛e na swojej wiedzy z geometrii spróbuj uzasadnić wzór (1.2). • (*) Uzasadnij stwierdzenie, że bok 2n -kata ˛ foremnego opisanego na okr˛egu o średnicy jeden wyraża si˛e wzorem an bn := p . 1 − a2n W programie Mathematica liczb˛e π zapisuje si˛e jako Pi. 1.3 1.3.1 Szeregi Pole koła Archimedesowi zawdzi˛eczamy również sposób liczenia pola koła. Zastosował on tu również metod˛e wielokatów. ˛ Najpierw zauważył, że pole n-kata ˛ foremnego wpisanego w okrag ˛ można policzyć sumujac ˛ pola n trójkatów ˛ równoramiennych. Maja˛ one wszystkie jednakowa˛ podstaw˛e xn i jednakowa˛ wyskość hn , zatem pole wielokata ˛ wynosi Pn := nxn2 hn co równe jest Ln2hn , gdzie Ln := nxn jest obwodem wielokata. ˛ Przy n zmierzajacym ˛ do nieskończoności wysokości ˛ hn zmierzaja˛ do promienia r koła, a obwody Ln zmierzaja˛ do obwodu koła, o którym wiemy już, że wynosi 2πr. Zatem pola Pn zmierzaja˛ do 2πrr 2 skad wnosimy, że pole koła o promieniu r to P := πr2 . 1.3.2 (1.3) Liczba π poprzez szereg. Powróćmy do obliczania liczby π . Widzieliśmy, że metoda oparta o przybliżanie obwodu koła daje niezbyt zadowalajacy ˛ wynik. Cz˛esto jednak, jeśli jeden algorytm zastapimy ˛ innym, to możemy uzyskać lepsze wyniki przy zastosowaniu tej samej arytmetyki komputerowej. Wiemy, że liczba π jest nie tylko obwodem koła o średnicy jeden, ale również polem koła o promieniu jeden. Zast˛epujac ˛ pole tego koła polami wpisanych w nie 2n -katów ˛ foremnych również otrzymamy ciag ˛ przybliżeń liczby π . Oznaczmy przez Pn pole 2n -kata ˛ foremnego wpisanego w koło. Dla n = 1 rozważamy 2 − kt jako zdegenerowana,˛ pozbawiona˛ pola figur˛e redukujac ˛ a˛ si˛e do średnicy koła, zatem P1 = 0. 1.3. SZEREGI 23 Rysunek 1.8: Kolejne dodatki do pola koła. Zauważmy, że 2n+1 -kat˛ powstaje z 2n -kata ˛ poprzez dorysowanie figury złożonej z 2n trójkatów ˛ równoramiennych wpisanych w koło o podstawach leżacych ˛ na bokach 2n -kata ˛ (patrz rys. 1.8). Niech An oznacza pole tej figury. Zatem Zatem Pn+1 = Pn + An , czyli An+1 jest poprawka,˛ która dodana do pola 2n -kata ˛ daje pole 2n+1 -kata. ˛ Stad ˛ Pn = A1 + A2 + A3 + A4 + . . . + An−1 , a pole koła PK otrzymamy sumujac ˛ wszystkie poprawki: PK = A 1 + A 2 + A 3 + A 4 + . . . . Wartości Ai można wyliczyć. Aby wykorzystać wzory z podrozdziału 1.2.5, zamiast koła o promieniu jeden rozważymy ponownie koło o średnicy jeden, a wi˛ec o promieniu 1/2. Zatem ze wzoru (1.3) jego pole to π4 . Zatem jako przybliżenie π interesuje nas ciag ˛ sn := 4Pn . Niech Tn oznacza pole trójkata ˛ równoramiennego o podstawie równej bokowi 2n -kata, ˛ a ramionach równych bokowi 2n+1 -kata. ˛ Mamy An = 2n Tn Można policzyć, że Tn = an (1− √ 4 1−a2n ) , gdzie an , jak poprzednio, oznacza bok 2n -kata ˛ foremnego wpisanego w koło o średnicy jeden. Zatem Pn+1 = Pn + 2 n an (1 − p 1 − a2n ) 4 oraz sn+1 = sn + 2n an (1 − 1.3.3 p 1 − a2n ). (1.4) Szeregi Warto zwrócić uwag˛e, że ciag ˛ sn jest specyficzny. Jego m-ty wyraz może zostać zapisany w postaci sm = m X cn , (1.5) n=1 gdzie 0 cn = 2 p n 2 an (1 − 1 − a2n ) dla n = 1, dla n = 2, dla n > 2. 24 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ Ciag ˛ takiego typu nazywamy szeregiem o wyrazach cn . Zazwyczaj (choć bardzo nieściśle) używamy zapisu ∞ X cn n=1 na oznaczenie szeregu o wyrazach cn , a sm dane wzorem (1.5) nazywamy m-ta˛ suma˛ cz˛eściowa˛ szeregu. Mówimy, że szereg jest zbieżny, jeżeli ciag ˛ sn jest zbieżny. W takim przypadku granic˛e ciagu ˛ sn nazywamy suma˛ szeregu i oznaczamy tym samym symbolem co sam szereg. Szeregi odgrywaja˛ ważna˛ rol˛e w wielu zastosowaniach, dlatego badaniu ich zbieżności poświ˛eca si˛e w analizie matematycznej szczególna˛ uwag˛e. Szczególnie ważne sa˛ narz˛edzia, które pozwalaja˛ określić, czy szereg jest zbieżny, czy nie. Jeśli nie wiemy czy szereg jest zbieżny, to nie możemy z pożytkiem wykorzystywać w obliczeniach numerycznych. 1.4 1.4.1 Funkcje Koncepcja funkcji Koncepcja funkcji, jedna z fundamentalnych idei współczesnej matematyki, jako samodzielny obiekt badań pojawiła si˛e w drugiej połowie XVII w. W tym pierwotnym uj˛eciu funkcja była rozumiana jako wartość, tzw. zmienna zależna, która˛ można obliczyć rachunkiem algebraicznym badź ˛ poprzez konstrukcje geometryczne w oparciu o inna˛ wartość, tzw. zmienna˛ niezależna˛ oraz pewne stałe. Jako przykład pierwszej kategorii może tu posłużyć funkcja kwadratowa x 7→ x2 , funkcja wyznaczajaca ˛ pole koła o promieniu r r 7→ πr2 , czy ogólnie wielomian x 7→ a0 + a1 x + a2 x2 + · · · + an xn . 1.4.2 Miejsca zerowe funkcji Wśród ważnych zagadnień praktycznych jakie pojawiaja˛ si˛e w kontekście funkcji jest pytanie czy i dla jakich wartości zmiennej niezależnej, albo inaczej argumentu, funkcja przyjmuje wartość zero. Argument taki nazywa si˛e miejscem zerowym funkcji. Jedna˛ z prostych metod poszukiwania miejsca zerowego funkcji jest tzw. metoda bisekcji. Wymaga ona dysponowania dwoma argumentami a < b, w których funkcja przyjmuje wartości o znakach przeciwnych. Konstruujemy wtedy rekurencyjnie dwa ciagi ˛ x1 := a y1 := b ( xn := xn +yn xn+1 2 ( yn+1 := n )<0 if f (xn )f ( xn +y 2 otherwise. yn n if f (yn )f ( xn +y )<0 2 xn +yn 2 otherwise. W wielu przypadkach, choć niestety nie zawsze, ciagi ˛ te daż ˛ a˛ do wspólnej granicy b˛edacej ˛ miejscem zerowym funkcji f . 1.4. FUNKCJE 25 Rysunek 1.9: Wykres wielomianu Q(x) := −16 + 16x2 − 4x3 − 3x4 + x5 . Ćwiczenie komputerowe 1.4.1 (*) Zaimplementuj metod˛e bisekcji w j˛ezyku Mathematica. Przetestuj ja˛ dla funkcji (1) x 7→ x2 − 3 dla a = 1 i b = 3 (2) x 7→ x+cos x sin x − 1 dla a = −1 i b = 1. Postaw hipotezy na temat zbieźności ciagów ˛ xn i yn . Jeśli uznasz, że sa˛ one zbieżne do wspólnej granicy, zastanów si˛e, czy jest ona poszukiwanym miejscem zerowym, a jeśli nie jest, to co jest tego przyczyna.˛ 1.4.3 Wykres funkcji Jeśli zadawala nas zgrubne przybliżenie miejsc zerowych funkcji, wystarczy narysować wykres funkcji. Z wykresu, obok miejsc zerowych możemy też odczytać tzw. ekstrema, czyli najwi˛eksze i jakie najmniejsze wartości osiaga ˛ funkcja w zadanym zbiorze. Rys. 1.9 przedstawia wykres wielomianu Q(x) := −16 + 16x2 − 4x3 − 3x4 + x5 , z którego na przykład odczytać możemy, że wartościa˛ najmniejsza˛ w przedziale [−1, 1] jest −16. Analizowanie funkcji poprzez narysowanie wykresu wystarcza jednak tylko do pobieżnego zapoznania si˛e z funkcja.˛ Jak zobaczymy, analiza matematyczna dostarcza znacznie lepsze metody do analizowania własności funkcji. Wykresy funkcji jednej zmiennej bardzo łatwo uzyskać przy pomocy programu Mathematica. Na przykład wykres wielomianu Q(x) := −16 + 16x2 − 3 4x − 3x4 + x5 na rys. 1.9 uzyskano instrukcja˛ P l o t [ − 16+16 x ^2 − 4 x ^3 − 3 x ^ 4 + x ^ 5 , { x , − 2 . 5 , 3 . 5 } ] 1.4.4 Geometryczne konstrukcje funkcji Funkcje pierwotnie definiowane poprzez konstrukcje geometryczne, to przede wszystkim funkcje trygonometryczne, na przykład x 7→ sin x. 26 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ Rysunek 1.10: Geometryczna definicja funkcji sin i cos: w wycinku koła o promieniu 1 i długości łuku x wartość sin x definiuje się jako długość odcinka spuszczonego z końca łuku prostopadle do ramienia wycinka koła ze znakiem plus, gdy koniec łuku jest ponad ramieniem, a znakiem minus, gdy koniec łuku jest poniżej ramienia. Rysunek 1.11: Wykres funkcji sin. Konstrukcj˛e geometryczna˛ sin x i cos x pokazano na rys. 1.10. W konstrukcji tej |x| jest interpretowane jako długość łuku wycinka koła o promieniu jeden, a znak x rozstrzyga o wzajemnym położeniu poczatku ˛ i końca łuku. Przyj˛ete jest, że znak plus oznacza iż poczatek ˛ łuku wyst˛epuje przed końcem łuku przy ruchu przeciwnym do ruchu wskazówek zegara. Wykres funkcji sin przedstawiono na rys. 1.11. W wielu zastosowaniach bardziej od funkcji sin i cos przydaje si˛e funkcja tangens tg : x 7→ sin x cos x ctg : x 7→ cos x . sin x oraz funkcja cotangens Ponieważ dzielenie przez zero nie ma sensu, funkcja tangens nie ma określonej wartości dla argumentów x, dla których funkcja cos przyjmuje wartość zero, a funkcja cotangens dla argumentów, dla których funkcja sinus si˛e zeruje. Wykres funkcji tg przedstawiono na rys. 1.12. W programie Mathematica zwyczajowo nazwy funkcji rozpoczyna si˛e od dużej litery. Sin, Cos, Tan, Cot to nazwy funkcji sinus, cosinus, tangens i cotangens. Wykres funkcji sinus na rys. 1.11 uzyskano instrukcja˛ P l o t [ Sin [ x ] , { x , −2 Pi , 2 Pi } ] 1.4. FUNKCJE 27 Rysunek 1.12: Wykres funkcji tg. Możemy też definiować własne funkcje, na przykład f [ x_ ] : = x ^2 definiuje funkcj˛e, która zmiennej x przypisuje wartość x2 . Teraz piszac ˛ f [3] otrzymamy wartość 9. Co ciekawe, możemy też definiować funkcje, które w różnych przypadkach zdefiniowane sa˛ różnymi wzorami. Na przykład g [ x _ ] : = I f [ x ^ 2 > 1 , x ^ 2 , − 1] definiuje funkcj˛e, która˛ przy zastosowaniu tradycyjnej matematycznej notacji zapisalibyśmy wzorem ( x2 x 7→ −1 gdy x2 > 1, w przeciwnym razie. Instrukcja If j˛ezyka Mathematica to tak zwana instrukcja warunkowa. Ma ona trzy argumenty. Zwraca drugi, gdy pierwszy ewaluuje si˛e do prawdy. W przeciwnym razie zwraca argument trzeci. 1.4.5 Rozwijanie funkcji w szereg Jednym z ważniejszych osiagni˛ ˛ eć analizy matematycznej było odkrycie, że funkcje trygonometryczne nie musza˛ być obliczane metoda˛ geometryczna,˛ ale moga˛ być wyznaczone przez przybliżanie wartości szeregu. Na przykład sin x = x − ∞ X x3 x5 x2n+1 + − ... = (−1)n , 1·2·3 1·2·3·4·5 (2n + 1)! n=0 gdzie m! = 1·2·3 · · · n, czytane m silnia, to iloczyn kolejnych liczb naturalnych od 1 do m. Wzór ten oraz podobne wzory dla innych funkcji trygonometrycznych odkrył w wieku XIV hinduski matematyk Madhavan of Sangamagramam. Dzisiejsza definicja funkcji jest nieporównanie szersza od pierwotnej koncepcji i obejmuje ciagi ˛ jako szczególny przypadek. W stosowanej dzisiaj definicji nie wnikamy w jaki sposób (algebraiczny, geometryczny czy jakikolwiek inny) określono jak zmiennej niezależnej przypisano zmienna˛ zależna,˛ traktujac ˛ ja˛ po prostu jako skadś ˛ dana.˛ Taka˛ jest na przykład funkcja Dirichleta ( x 7→ 1 x∈Q 0 x∈ 6 Q, w której definicji nie interesujemy si˛e jak w praktyce sprawdzić, czy liczba jest wymierna czy nie jest. 28 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ Rysunek 1.13: Pole soczewkowatej figury jest różnicą pól pod wykresami funkcji. 1.5 1.5.1 Pola figur i całkowanie Całka oznaczona Widzieliśmy, że koncepcja granicy jest pomocna przy obliczaniu pola koła. W podobny sposób możemy post˛epować z innymi figurami. Problem można sprowadzić do liczenia pola pod wykresem funkcji. Rozważmy na przykład figur˛e o soczewkowatym kształcie przedstawiona˛ na rys. 1.13. Jak łatwo zauważyć pole tej figury jest różnica˛ pól pod wykresami funkcji y = −x2 + 2x, y = x2 . Pole pod wykresem funkcji f na przedziale [a, b] określane jest mianem całki oznaczonej. Do policzenia całki oznaczonej z funkcji f na przedziale [a, b] też możemy zastosować technik˛e przejścia granicznego. W tym celu dzielimy przedział [a, b] punktami a = x0 < x1 < x2 < . . . < xn = b na n podprzedziałów, niekoniecznie równych, i nad każdym z nich budujemy prostokat˛ o wysokości równej wartości funkcji f w prawym końcu przedziału. Oznaczajac ˛ przez ∆xi := xi − xi−1 długość i-tego przedziału (i-ta˛ różnic˛e) i sumujac ˛ pola prostokatów ˛ otrzymujemy przybliżenie pola pod wykresem równe: f (x1 )∆x1 + f (x2 )∆x2 + . . . f (xn )∆xn = n X f (xi )∆Xi . i=1 Biorac ˛ coraz wi˛ecej punktów i coraz krótsze przedziały, w granicy otrzymujemy poszukiwane pole. Oznaczamy je dość tajemniczym symbolem Z b f (x)dx, a w którym znak sumy przekształcił si˛e w wydłużona˛ liter˛e ’S’, a różnica ∆xi w "nieskończonie mała˛ różnic˛e", czyli różniczk˛e, oznaczona˛ symbolem dx. (1.6) 1.5. POLA FIGUR I CAŁKOWANIE 29 Rysunek 1.14: Pole pod wykresem ćwiartki okręgu. Przykładowy efekt takiego post˛epowania dla funkcji y= p 1 − x2 na przedziale [0, 1] przy n = 5 przedstawiono na rys. 1.14. Podobnie jak poprzednio naturalne jest oczekiwanie, że takie post˛epowanie w granicy da poszukiwane pole pod wykresem funkcji. Ten sposób liczenia pól stosowano już w starożytności, choć zrozumienie przyczyn jego poprawności bardzo długo pozostawało mgliste. Proces przejścia granicznego opisywano jako zastapienie ˛ skończonego podziału podziałem na nieskończona˛ ilość przedziałów o nieskończenie małej lecz dodatniej długości dx. Ta tajemnicza liczba dx dawała po przemnożeniu przez wartość funkcji na tym przedziale kolejna˛ nieskończenie mała˛ lecz dodatnia˛ wartość f (x)dx. Dopiero wysumowanie nieskończonej ilości tych nieskończenie małych wartości dawało poszukiwane pole. Opis ten oczywiście wyjaśnia zapis i nazw˛e całki (całkowita suma, powstała przez wysumowanie wszystkich nieskończenie małych f (x)dx), ale w żadnym przypadku nie może być uznany za definicj˛e całki oznaczonej. Dopiero niemiecki matematyk, Georg Friedrich Bernhard Riemann (rys. 1.15) podał jako pierwszy precyzyjna˛ definicj˛e całki oznaczonej oraz warunki, kiedy ta definicja ma sens. Dziś wyrażenie (1.6) określa si˛e mianem sumy Riemanna. 1.5.2 Całka nieoznaczona Zakładajac, ˛ że całka oznaczona z funkcji f jest dobrze zdefiniowana (do czego potrzebujemy sum Riemanna i granicy), możemy zdefiniować funkcj˛e Z F (u) := u f (x)dx, 0 dla której zachodzi wzór Z b f (x)dx = F (b) − F (a). a 30 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ Rysunek 1.15: Georg Friedrich Bernhard Riemann, 1826-1866. Źródło: Wikipedia Funkcja F spełniajaca ˛ powyższy wzór nosi nazw˛e całki nieoznaczonej funkcji f . Oznaczamy ja˛ (nieprecyzyjnie) symbolem Z f (x)dx Jeśli potrafilibyśmy znaleźć analityczny sposób na znalezienie całki nieoznaczonej w oparciu o funkcj˛e f , liczenie pól znacznie ułatwiłoby si˛e. Żyjacy ˛ na przełomie X i XI w. naukowiec arabski znany w Europie jako Alhacen potrafił pokazać (oczywiście w ówczesnym j˛ezyku matematyki), że jeśli f jest wielomianem stopnia drugiego f (x) := a0 + a1 x + a2 x2 , to jego całka˛ nieoznaczona˛ jest F (x) := a0 x + a1 x2 a2 x3 + . 2 3 Alhacen potrafił też podać wzór na całk˛e nieoznaczona˛ dla wielomianów stopnia trzeciego i czwartego. Wykorzystujac ˛ ten wzór, możemy bardzo szybko policzyć pole naszej soczewki z rys.1.13, bo przyjmujac ˛ wygodne oznaczenie b [F (u)]a := F (b) − F (u) otrzymujemy Z 1 x2 dx 0 Z 0 1 (−x2 + 2x)dx = x3 3 1 = 0 1 3 3 1 x 2x2 2 = − + = . 3 2 0 3 Płyna˛ z tego dwa ważne wnioski. Po pierwsze, granica skomplikowanego ciagu ˛ wcale nie musi być trudna˛ w wyliczeniu liczba˛ niewymierna.˛ Po drugie i ważniejsze, poj˛ecie granicy może być pomocne nie tylko w obliczeniach liczb niewymiernych. Nie mniej, a może nawet wi˛ecej, przydaje si˛e ono do definiowania nowych poj˛eć, trudnych do zdefiniowania inaczej. 1.6. STYCZNA DO KRZYWEJ I GRANICA FUNKCJI 31 Rysunek 1.16: Styczna do okręgu 1.6 1.6.1 Styczna do krzywej i granica funkcji Styczna do krzywej Problem wyznaczenia stycznej do krzywej w zadanym punkcie to też jeden z problemów rozwiazywanych ˛ już w starożytności przy wykorzystaniu przejścia granicznego. W uproszczeniu, styczna do krzywej w danym punkcie krzywej, to prosta przechodzaca ˛ przez zadany punkt, która w jego pobliżu nie przecina krzywej w żadnym innym punkcie. Rys. 1.16 przedstawia styczna˛ do łuku okr˛egu. Styczna˛ można wyznaczać geometrycznie, przykładajac ˛ do krzywej linijk˛e, ale nie jest to metoda dokładna. Lepiej jest wyliczyć kat˛ jaki styczna tworzy z prosta˛ pozioma,˛ albo tak zwany współczynnik nachylenia prostej, czyli tangens tego kata. ˛ Jeśli krzywa zadana jest funkcja˛ f , to współczynnik nachylenia stycznej w punkcie wykresu o współrz˛ednych (x0 , f (x0 )) można przybliżyć, analizujac ˛ sieczna˛ poprowadzona˛ z punktu (x0 , f (x0 )). Jest to prosta, która przecina krzywa˛ w punkcie (x0 , f (x0 )) oraz dodatkowo w punkcie (x1 , f (x1 )), gdzie x1 = x0 + h jest bliskie x0 . Rysujac ˛ stosowny trójkat˛ prostokatny ˛ (rys. 1.17), łatwo zauważyć, że tangens kata, ˛ jaki sieczna tworzy z osia˛ x wynosi f (x1 ) − f (x0 ) f (x0 + h) − f (x0 ) . = x1 − x0 h Zmierzajac ˛ z h do zera zbliżamy sieczna˛ do stycznej, a wi˛ec w granicy dostać powinniśmy współczynnik nachylenia stycznej. I rzeczywiście dostajemy, jeśli tylko funkcja jest odpowiednio porzadna. ˛ Należy zwrócić uwag˛e, że mamy tu do czynienia z innego typu granica˛ niż rozważane do tej pory, bo nie rozważamy ciagu, ˛ lecz funkcj˛e h 7→ f (x0 + h) − f (x0 ) h (1.7) zmiennej h (x0 traktujemy jako parametr). Jak definiuje si˛e granic˛e ciagu ˛ już mniej wi˛ecej wiemy. A jak si˛e to robi w przypadku granicy funkcji? 1.6.2 Granica funkcji Chociaż poj˛eciem granicy funkcji operowano co najmniej od XVII w., to pierwsza˛ precyzyjna˛ definicj˛e postawił czeski matematyk Bernard Bolzano dopiero w 1817 roku, a używana˛ współcześnie definicj˛e podał niemiecki matematyk Karol Weierstrass (rys. 1.18). 32 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ Rysunek 1.17: Styczna i sieczna do krzywej. Rysunek 1.18: Karol Weierstrass (1815-1897). Źródło: Wikipedia 1.6. STYCZNA DO KRZYWEJ I GRANICA FUNKCJI 33 Według Weierstrassa funkcja f ma w punkcie x0 granic˛e g jeżeli dla każdego > 0 istnieje δ > 0 takie, że dla wszystkich x 6= x0 |x − x0 | < δ ⇒ |f (x) − g| < . Piszemy wtedy lim f (x) = g. x→x0 1.6.3 Funkcje ciągłe Warto sobie od razu powiedzieć, że w przeciwieństwie do ciagów, ˛ typowa funkcja, z jaka˛ spotykamy si˛e na co dzień, jeśli jest określona w punkcie x0 , to ma w nim granic˛e równa˛ swojej wartości w x0 . Może to robić wrażenie, że teoria granicy funkcji jest mniej użyteczna od granicy ciagu. ˛ Ale właśnie ten fakt, którego bez poj˛ecia granicy funkcji nie da si˛e zaobserwować, jest interesujacy ˛ sam w sobie. Funkcje o tej własności określamy mianem ciagłych. ˛ Obrazowo mówimy, że funkcja ciagła ˛ to taka funkcja, której wykres można narysować bez odrywania ołówka od papieru. Nie jest to do końca prawda,˛ bo dotyczy jedynie funkcji, których dziedzina jest odcinkiem domkni˛etym. 1.6.4 Obliczanie granic. Granica funkcji może być liczona w punkcie x0 , w którym funkcja jest nieokreślona, ale jest określona dla wartości różnych od x0 . Wtedy ciagłość ˛ funkcji w punktach różnych od x0 nie wystarcza, by wyznaczyć granic˛e. Mimo to cz˛esto można ja˛ łatwo policzyć. Na przykład funkcja f :x→ 2x + x2 x jest nieokreślona w zerze, ale określona dla wartości wi˛ekszych i mniejszych od zera. Dla wartości tych jest ona równa funkcji x → 2 + x, która jest ciagła ˛ i określona w zerze, a zatem ma w zerze granic˛e dwa. Zatem lim f (x) = 2. x→0 Przykład ten może wydawać si˛e sztuczny, ale docenimy jego wartość, gdy uświadomimy sobie, że dokładnie taka granica pojawia si˛e przy obliczaniu współczynnika kierunkowego stycznej do wykresu funkcji x 7→ x2 w punkcie 1, bo zgodnie ze wzorem (1.7) jest to funkcja h 7→ 2h + h2 (x0 + h)2 − x20 = , h h czyli funkcja f . Oczywiście nie wszystkie granice funkcji daja˛ si˛e tak łatwo policzyć. I tu, jak w przypadku ciagów, ˛ korzystamy z różnych twierdzeń. W szczególności dla funkcji można udowodnić odpowiedniki twierdzenia o trzech ciagach ˛ oraz o granicy sumy, różnicy, iloczynu i ilorazu. Problem 1.6.1 Jak uogólnić poj˛ecie granicy, tak by granica ciagu ˛ i funkcji wpadały "do jednego worka" i odpowiednie twierdzenia obejmowały tak ciagi ˛ jak i funkcje? Jak dołaczyć ˛ do takiej definicji przypadek ciagu ˛ lub funkcji zmierzajacej ˛ do nieskończoności? Oczywiście granica funkcji nie musi istnieć. Jest tak na przykład w przypadku funkcji 1 x 7→ sin , x która jest określona i ciagła ˛ dla wszystkich x z wyjatkiem ˛ zera, ale w zerze nie ma granicy. Z kolei funkcja x 7→ sin x , x która też jest określona i ciagła ˛ dla wszystkich x z wyjatkiem ˛ zera, w zerze ma granic˛e wynoszac ˛ a˛ jeden, ale nie jest oczywiste jak to pokazać. Jednak z z wykresu (rys. 1.20) widać, że należy si˛e tego spodziewać. 34 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ Rysunek 1.19: Wykres funkcji x 7→ sin x1 . Granica tej funkcji w zerze nie istnieje Rysunek 1.20: Wykres funkcji x 7→ sin x x . Granica tej funkcji w zerze wynosi jeden. 1.7. POCHODNA FUNKCJI 35 Rysunek 1.21: Wybrane styczne do wykresu funkcji. Na czerwono zaznaczono styczne w miejscach gdzie wykres się wznosi, na zielono gdzie opada, a na żółto miejsca gdzie styczna jest pozioma. 1.7 1.7.1 Pochodna funkcji Lokalne maksima i minima Współczynnik nachylenia stycznej do wykresu funkcji niesie w sobie informacje o samej funkcji. Tam gdzie ten współczynnik jest dodatni funkcja (umownie) rośnie, a gdzie jest ujemny maleje. Zerowa wartość współczynnika nachylenia oznacza, że styczna jest pozioma. Może to świadczyć o lokalnej górce (lokalne maksimum) lub lokalnym dołku (lokalne minimum). Pozioma styczna może też wystapić ˛ w miejcu, chwilowo przestaje rosnać ˛ badź ˛ maleć. 1.7.2 Pochodna funkcji Dlatego dla danej funkcji f interesujace ˛ jest poszukiwanie miejsc zerowych nowej funkcji, która punktowi x przypisuje współczynnik nachylenia stycznej do wykresu funkcji f w punkcie x. Funkcja taka nazywana jest pochodna˛ funkcji f i oznaczana f 0 . Wiemy, że współczynnik kierunkowy stycznej obliczamy jako granic˛e przy h → 0 wyrażenia f (x + h) − f (x) h zwanego ilorazem różnicowym. Zatem f 0 (x) = lim h→0 f (x + h) − f (x) h oczywiście przy założeniu, że ta granica istnieje. Wprowadzajac ˛ oznaczenia na różnice (x + h) − x = h ∆x := ∆y := f (x + h) − f (x) możemy iloraz różnicowy napisać w postaci ∆y , ∆x (1.8) 36 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ co wyjaśnia jego nazw˛e. Używajac ˛ nieprecyzyjnego j˛ezyka nieskończenie małych można powiedzieć, że pochodna˛ funkcji otrzymujemy zast˛epujac ˛ w ilorazie różnicowym róznice ∆y i ∆x nieskończenie małymi różnicami oznaczanymi dy i dx i zwanymi różniczkami. Wyjaśnia to używana˛ do dziś nazw˛e teorii pochodnych: rachunek różniczkowy. Sama koncepcja różniczki doczekała si˛e precyzyjnej definicji i choć odbiega ona od pierwotnej idei, pozwala zapis f 0 (x) = dy dx uczynić precyzyjnym. Jeśli potrafimy ze wzoru na funkcj˛e f wyprowadzić wzór na funkcj˛e f 0 oraz potrafimy znaleźć miejsca zerowe funkcji f 0 , to potrafimy wskazać miejsca podejrzane o wyst˛epowanie lokalnych minimów i lub maksimów. Okazuje si˛e, że choć w definicji pochodnej wyst˛epuje granica, to w wielu przypadkach jest to granica, która˛ możemy policzyć czysto analitycznie bez konieczności stosowania przybliżeń. Na przykład dla funkcji x 7→ f (x) := x2 − 4x + 5 mamy (x + h)2 − 4(x + h) + 5 − (x2 − 4x + 5) h→0 h = lim (2x + h − 4) = 2x − 4, f 0 (x) = lim h→0 bo funkcja x 7→ 2x − 4 jest ciagła. ˛ Widać, że f 0 (2) = 0, zatem funkcja f , jeśli ma gdzieś minimu lokalne to w punkcie 2. 1.7.3 Podstawowe twierdzenie rachunku różniczkowego i całkowego Perski matematyk Sharaf al-Din al-Tusi już z końcem XII w. potrafił pokazać, że (używajac ˛ współczesnego j˛ezyka) pochodna˛ wielomianu trzeciego stopnia Q(x) := b0 + b1 x + b2 x2 + b3 x3 jest Q0 (x) = b1 + 2b2 x + 3b3 x2 . Przypomnijmy, że około 200 lat wcześniej, Alhacen policzył, że całka˛ nieoznaczona˛ f (x) := a0 + a1 x + a2 x2 , jest Z F (x) = f (x)dx = a0 x + a2 x3 a1 x2 + . 2 3 Podstawiajac ˛ b1 = a0 2b2 = a1 3b3 = a2 możemy zaobserwować, że jest zwiazek ˛ mi˛edzy mi˛edzy liczeniem pochodnej i całkowaniem: Z Q0 (x)dx Z 0 f (x)dx = b1 x + b2 x2 + b3 x3 = Q(x) − b0 = F 0 (x) = f (x). Zatem już w XII w. były podstawy do odkrycia tego zwiazku, ˛ ale udało si˛e to dopiero 500 lat później. Pod koniec XVII w. Anglik Isaac Newton oraz Niemiec Gottfried Leibniz (rys. 1.22) pokazali nast˛epujace ˛ twierdzenie 1.7. POCHODNA FUNKCJI 37 Rysunek 1.22: Isaac Newton (1643 - 1727) i Gottfried Leibniz (1646 - 1716). Źródło: Wikipedia Twierdzenie 1.7.1 Jeśli f jest pochodna˛ funkcji F , to F jest całka˛ nieoznaczona˛ funkcji f . Jeśli F jest całka˛ nieoznaczona˛ funkcji f , to pochodna˛ funkcji F jest f . Twierdzenie to jest dzisiaj określane mianem podstawowego twierdzenia rachunku różniczkowego i całkowego. Do czasu odkrycia tego twierdzenia teorie pochodnej i całki rozwijane były niezależnie, przy czym w liczeniu pochodnych notowano wi˛eksze post˛epy niż w liczeniu całek. Odkrycie Newtona i Leibniza pokazało, że w istocie jest jedna teoria, a każdy wzór na pochodna˛ jest równocześnie wzorem na całk˛e. Umożliwiło to liczenie wielu nowych całek, dało impuls do intensywnego rozwoju rachunku różniczkowego i całkowego i przyczyniło si˛e do szybkiego rozwoju nauk technicznych. 38 ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ Część I Elementy logiki i teorii mnogości 39 Rozdział 2 Matematyka zbiorów skończonych Osobom postronnym cz˛esto si˛e wydaje, że badania matematyczne nie maja˛ zwiazku ˛ z otaczajac ˛ a˛ nas rzeczywistościa.˛ Jest to konsekwencja wysoce sformalizowanegeo j˛ezyka, którym współcześnie posługuje si˛e matematyka. Za tym formalizmem kryje si˛e jednak bardzo bogaty świat matematycznych intuicji, bezpośrednio inspirowany nie tylko konkretnymi problemami nauki i techniki, ale przede wszystkim doświadczeniem i wyobrażeniami z codziennego życia. Matematycy rozwijaja˛ swoja˛ intuicj˛e wymyślajac ˛ i analizujac ˛ liczne przykłady. W przykładach tych poszukuja˛ powtarzajacych ˛ si˛e prawidłowości. Jeśli taka˛ prawidłowość uda si˛e wykryć i nie udaje si˛e znaleźć przykładu, w którym prawidłowość nie zachodzi, formułuje si˛e hipotez˛e, że prawidłowość taka zachodzi zawsze. Hipoteza nie musi być i cz˛esto nie jest w pełni prawidłowym opisem rzeczywistości, choć przynajmniej źdźbło prawdy cz˛esto w niej twki. W odróżnieniu od wielu innych nauk, matematycy odrzucaja˛ intuicj˛e i eksperyment jako metod˛e rozstrzygajac ˛ a˛ co jest prawda.˛ Hipotez˛e trzeba uzasadnić poprzez wyprowadzenie jej droga˛ logicznego rozumowania z uznawanych za oczywiste faktów. Rozumowanie takie nazywa si˛e dowodem, a hipotez˛e, dla której udało si˛e podać dowód, twierdzeniem. W tym miejscu pojawia si˛e sformalizowany j˛ezyk. Przeprowadzenie matematycznego dowodu wymaga bowiem stosownej teorii. W teorii takiej ustala si˛e najpierw podstawowe poj˛ecia, czyli tak zwane poj˛ecia pierwotne teorii oraz fakty uznawane za oczywiste, nazywane aksjomatami teorii. Wszystkie inne poj˛ecia teorii definiowane sa˛ w oparciu o poj˛ecia pierwotne, a twierdzenia dowodzone sa˛ w oparciu o przyj˛ete aksjomaty. Wysoki stopień sformalizowania j˛ezyka matematycznego dowodu ma uniemożliwić, a przynajmniej utrudnić, świadome lub nieświadome przemycenie do dowodu fałszywego argumentu. Logiczne rozumowanie jako metoda dochodzenia do prawdy towarzyszy ludzkości co najmniej od starożytności. W cywilizacji zachodniej podwaliny logiki stworzył w IV stuleciu p.n.e. grecki filozof Arystoteles (ryc. 2.2). W kolejnym stuleciu grecki matematyk Euklides, (ryc. 2.2) w słynnym dziele zatytułowanym Elementy, po raz pierwszy przedstawił sformalizowana˛ teori˛e matematyczna˛ opisujac ˛ a˛ geometri˛e. Jako poj˛ecia pierwotne przyjał˛ punkt i prosta.˛ Sformułował też 10 aksjomatów. Nast˛epnie z aksjomatów tych wyprowadził wi˛ekszość znanych ówcześnie twierdzeń geometrii, w szczególności twierdzenie Pitagorasa. Jako przykład matematycznej hipotezy posłużyć nam może słynna hipoteza Goldbacha z 1742 roku: każda˛ parzysta˛ liczb˛e naturalna˛ wi˛eksza˛ od dwóch można przedstawić jako sum˛e dwóch liczb pierwszych. Widzimy, że rzeczywiście: 4 = 2 + 2, 6 = 3 + 3, 8 = 3 + 5, 10 = 5 + 5, 12 = 5 + 7, 14 = 7 + 7, 16 = 5 + 11, 18 = 5 + 13, 20 = 3 + 17, ... . Do dziś nie udało si˛e znaleźć ani dowodu tej hipotezy, ani kontrprzykładu, a wi˛ec wi˛ekszej od dwóch parzystej liczby naturalnej, dla której rozkład na sum˛e dwóch liczb pierwszych nie istnieje. Dzi˛eki komputerom udało si˛e natomiast przeprowadzić eksperymenty, które potwierdzaja,˛ że wśród liczb naturalnych nie wi˛ekszych niż 4 × 1018 nie ma kontrprzykładu. Teoria, w której ewentualny dowód hipotezy Goldbacha można byłoby przeprowadzić, obejmuje liczby naturalne i operacj˛e ich dodawania jako poj˛ecia pierwotne oraz kilka faktów zbierajacych ˛ podstawowe własności liczb naturalnych, na przykład przemienność dodawania, jako aksjomaty. Świeżo sformułowana˛ hipotez˛e nadzwyczaj rzadko udaje si˛e od razu udowodnić. Co wi˛ecej, jeśli hipoteza jest bł˛edna, dowód nie jest możliwy. Trudności w skonstruowaniu dowodu cz˛esto daja˛ podpowiedź jak znaleźć tak zwany kontrprzykład, a wi˛ec przykład, dla którego hipoteza nie zachodzi. To z kolei pozwala zmodyfikować hipotez˛e i ponownie podjać ˛ prób˛e dowodu. Ten proces oscylacji pomi˛edzy próbami dowodu, budowaniem kontrpzykładu i modyfikowaniem hipotezy niejednokrotnie trzeba wiele razy powtórzyć nim osiagnie ˛ si˛e sukces, czyli udowodnione twierdzenie. Właśnie dlatego uprawianie matematyki wspiera si˛e na dwóch jednakowo ważnych podporach: intuicji i formaliźmie. Niestety, gdy studiujemy matematyk˛e, najcz˛eściej mamy do czynienia wyłacznie ˛ z twierdzeniami i gotowymi już formalnymi dowodami. Cz˛esto brakuje czasu na przyjrzenie si˛e dużej liczbie przykładów. A dopiero przeanalizowanie licznych przykładów pozwala na wyrobienie sobie intuicji niezb˛ednych do rzeczywistego zrozumienia konkretnego twierdzenia. Analizowanie przykładów jest jednak zaj˛eciem żmudnym. Na szcz˛eście mamy dzisiaj komputery i programy, które bardzo ułatwiaja˛ konstruowanie i analizowanie przykładów. Jedna˛ z metod dowodzenia jest przeanalizowanie wszystkich możliwych przypadków. Jest to jednak możliwe tylko wtedy, gdy przypadków jest skończona 41 42 ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH Rysunek 2.1: Dawid Hilbert, 1862-1943 oraz Kurt Gödel, 1906-1978. Źródło: Wikipedia Rysunek 2.2: Arystoteles, IV w. p.n.e., rzymska kopia greckiego popiersia oraz Euklides, IV-III w. p.n.e., przedstawiony na posągu w Muzeum Historii Naturalnej w Oksfordzie. Źródło: Wikipedia ilość. Do pewnego stopnia dzieje si˛e tak w tak zwanej matematyce dyskretnej, a wi˛ec zajmujacej ˛ si˛e wyłacznie ˛ zbiorami zawierajacymi ˛ skończona˛ ilość elementów. Jednak nawet w tym przypadku cz˛esto chcemy udowodnić, że coś zachodzi dla każdego zbioru skończonego, a zbiorów skończonych jest już nieskończenie wiele. √ Niewymierność liczby 2 uświadomiła matematykom, że maja˛ przed soba˛ dwie drogi: albo pogodzić si˛e z faktem, że przekatna ˛ √ kwadratu o boku długości jeden sama√długości nie posiada, albo zaakceptować stosowanie w rozumowaniach obiektów nieskończonych. W przypadku liczby 2 jest to niekończony ciag ˛ przybliżeń 2 liczbami wymiernymi. Rozważania na temat nieskończonych obiektów przez całe tysiaclecia ˛ sprawiały matematykom dużo trudności. W szczególności w odniesieniu do ciagów ˛ przybliżeń używano poj˛eć "nieskończenie mały" lub "nieskończenie wielki" choć widać było, że poj˛ecia te sa˛ problematyczne: dało si˛e z nich wywieść tak wnioski pożadane ˛ jak i nonsensowne. W XIX wieku, wraz ze wzrostem precyzji w fromułowaniu idei rachunku różniczkowego i całkowego i pojawiajacymi ˛ si˛e coraz cz˛eściej sprzecznościami zwiazanymi ˛ z nieodpowiednim posługiwaniem si˛e nieskończonościa,˛ zacz˛eła narastać potrzeba usystematyzowania metod badawczych matematyki. W 1920 roku niemiecki matematyk Dawid Hilbert (rys. 2.1) zaproponował swój program bardzo formalnego podejścia do matematyki. Jest on dziś znany pod nazwa˛ program Hilberta. Hilbert zuważył, że choć analiza matematyczna wymaga operowania nieskończonościa,˛ to j˛ezyk, w którym mówi si˛e o matematyce jest skończony, bo składa si˛e ze skończonej ilości słów. Hilbert postulował, że wszystkie twierdzenia matematyki należy wyprowadzić droga˛ formalnego dowodu z dobrze dobranego zestawu aksjomatów, czyli możliwie oczywistych stwierdzeń przyjmowanych bez dowodu. Nie był to pomysł nowy: jak wspomnieliśmy, takie podejście do geometrii zaproponował Euklides. Zasługa˛ Hilberta była obserwacja, że takie podejście może rozwiazać ˛ problemy z nieskończonościa.˛ Każde twierdzenie daje si˛e zapisać jako skończony ciag ˛ słów, 2.1. ZBIORY SKOŃCZONE 43 a każdy dowód jest skończonym ciagiem ˛ formuł, również zbudowanych ze skończonej ilości słów. Zatem poprawność dowodu można sprawdzić droga˛ skończonej inspekcji i to również w przypadku gdy samo twierdzenie dotyczy zbiorów nieskończonych. Matematycznym uj˛eciem formalnego opisu teorii matematycznej, w tym dowodów, zajmuje si˛e logika matematyczna oraz tzw. metamatematyka. Zazwyczaj j˛ezyk metamatematyki nie jest już tak sformalizowany jak j˛ezyk formalny, który metamatematyka opisuje. Ale, zgodnie z obserwacja˛ Hilberta, metamatematyka bada obiekty skończone (formuły j˛ezyka formalnego), wi˛ec sam j˛ezyk metamatematyki nie musi być do końca sformalizowany. By jednak podejście takie było przekonujace ˛ wypada najpierw udowodnić, że zestaw przyj˛etych bez dowodu aksjomatów nie jest sprzeczny sam w sobie. Hilbert goraco ˛ wierzył, że jego program da si˛e zrealizować. Jednak już 11 lat później austriacki matematyk Kurt Gödel (rys. 2.1) pokazał, że nie istnieje niesprzeczny układ aksjomatów, z którego dałoby si˛e wyprowadzić wszystkie twierdzenia dotyczace ˛ liczb naturalnych. Innymi słowy, jeśli teoria obejmujaca ˛ arytmetyk˛e liczb naturalnych jest niesprzeczna (wywiedziona z niesprzecznego zestawu aksjomatów) to jest niezupełna (sa˛ w niej zdania p, dla których nie ma dowodu ani dla p, ani dla nieprawda, że p). Pomimo twierdzenia Gödla jak i trudności w realizacji postulatu sprawdzenia niesprzeczności program Hilberta szybko przyjał˛ si˛e i pozostaje do dziś powszechnie przyj˛eta˛ metoda˛ uprawiania matematyki. 2.1 Zbiory skończone Zaczniemy od przedstawienia teorii zbiorów skończonych, przy okazji nieformalnie przygladaj ˛ ac ˛ si˛e niektórym zbiorom nieskończonym. Teoria zbiorów skończonych w swoich elementach nie różni si˛e wiele od teorii zbiorów nieskończonych, nie wymaga jednak takiej ostrożności jak post˛epowanie ze zbiorami nieskończonymi. Formalna˛ teori˛e zbiorów nieskończonych przedstawimy w rozdziale 4. Zbiór skończony definiujemy wymieniając jego elementy, na przykład: { a, b, c } oznacza zbiór, którego elementami są trzy litery: a, b, c. W niniejszym rozdziale, to jest w rozdziale 2, mówiąc zbiór mamy na myśli zbiór skończony, chyba, że wyraźnie zaznaczymy inaczej. Zbiory oznaczamy zazwyczaj dużymi literami. Pisząc Z := { 2, 3, 5, 7, 11, 13, 17, 19 } definiujemy zbiór składający się z liczb 2, 3, 5, 7, 11, 13, 17 i 19 i nadajemy mu nazwę Z. Fakt, że liczba 5 jest elementem zbioru Z zapisujemy jako 5 ∈ Z. Jeśli coś nie jest elementem zbioru, używamy znaku 6∈, na przykład 15 ∈ 6 Z. Zbiór Z możemy też opisać słownie: zbiór liczb pierwszych mniejszych od 20, symbolicznie Z = { x | x jest liczbą pierwszą i x < 20 }. Przypomnijmy, że liczba pierwsza to liczba naturalna większa od jeden, która dzieli się bez reszty tylko przez siebie i przez liczbę jeden. Nie jest nią więc ani 9, ani 15, bo liczby te dzielą się przez 3. Nie jest nią też żadna liczba parzysta większa od 2. Zaznaczmy, że przy definiowaniu zbioru kolejność w jakiej wymieniamy elementy nie ma znaczenia. Tak więc na przykład zapisy { 2, 3, 5, 7, 11, 13, 17, 19 }, { 2, 3, 17, 19, 5, 7, 11, 13 } czy { 19, 17, 13, 11, 7, 5, 3, 2 } definiują ten sam zbiór. Również kilkakrotne wymienienie elementu nie wpływa na zawartość zbioru. Tak więc zapisy {1, 2, 2, 3, 3, 3} oraz {1, 2, 3} oznaczają ten sam zbiór. Zbiór nieskończony czasami też próbujemy definiować poprzez wypisanie jego elementów: { 2, 4, 6, 8, 12, 14 . . . }, jednak nie jesteśmy w stanie wypisać ich wszystkich, wi˛ec wypisujemy tylko cz˛eść, zakładajac, ˛ że czytelnik sam, w razie potrzeby ustali na zasadzie analogii co jeszcze do tego zbioru należy. W rozważanym przykładzie można si˛e domyśleć, że chodzi nam o zbiór liczb naturalnych parzystych. Ustalenie na zasadzie analogii co jest elementem zbioru w istocie oznacza określenie własności czy formuły, która rozstrzyga co do naszego zbioru należy, a co nie należy. Jest to jedyny 44 ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH Rysunek 2.3: Zbiór { x | x = (x1 , x2 ) i x21 + x22 <= 1 } zwizualizowany w układzie współrzędnych na płaszczyźnie. formalnie poprawny sposób definiowania zbiorów nieskończonych. Jednak, jak zobaczymy później, problemy ze zbiorami nieskończonymi biora˛ si˛e stad, ˛ że nie każda własność definiuje zbiór. Jako przykład zbioru nieskończonego zadanego poprzez własność rozważmy x jest para˛ liczb (x1 , x2 ) takich, że x21 + x22 <= 1. Zaleta˛ takiego przykładu jest, że zwiazany ˛ z ta˛ formuła˛ zbiór { x | x = (x1 , x2 ) i x21 + x22 <= 1 } łatwo zwizualizować rysunkiem na płaszczyźnie (rys. 2.3). Warto sobie uświadomić, że wizualizacja, w szczególności wizualizacja komputerowa zbioru nieskończonego jest sama w sobie zbiorem skończonym. Wynika to stad, ˛ że obraz komputerowy jest zbudowany ze skończonej liczby pikseli. Wrażenie, że punktów jest nieskończenie wiele wynika z niedoskonałości naszego oka. Tak wi˛ec każda wizualizacja jest tylko pewnym przybliżeniem idei jaka˛ jest zbiór nieskończony. Jak zobaczymy, czasami wygodnie jest też posłużyć się zbiorem pozbawionym jakichkolwiek elementów. Zbiór taki określamy mianem zbiór pusty i oznaczany ∅. Czasami stosujemy też oznaczenie {}. Zbiór {a} ma dokładnie jeden element, mianowicie a. Zbiór taki określamy mianem singleton. Podobnie definiujemy dubleton {a, b} jako zbiór złożony z dwóch elementów a, b. W zasadzie definicję tę stosujemy tylko wtedy gdy a 6= b, gdyż dla a = b zbiór {a, b} pokrywa się z singletonem {a}. 2.1.1 Operacje mnogościowe Na zbiorach można wykonywać kilka podstawowych operacji, które mają pewne, choć ograniczone, podobieństwo do operacji arytmetycznych na liczbach. 2.1. ZBIORY SKOŃCZONE 45 Rysunek 2.4: Wierszami od lewego górnego rogu: zbiory A i B, zbiór A ∪ B, zbiór A ∩ B i zbiór A B. Definicja 2.1.1 Niech A, B będą zbiorami. Definiujemy ich sumę oraz iloczyn, różnicę i różnicę symetryczną odpowiednio jako A∪B := { x | x ∈ A lub x ∈ B }, A∩B := { x | x ∈ A i x ∈ B }, A\B := { x | x ∈ A i x 6∈ B }, AB := (A \ B) ∪ (B \ A). Sumę zbiorów określamy też mianem unia zbiorów, a iloczym zbiorów mianem przecięcie zbiorów. Rozważmy zbiory na płaszczyźnie A = { (x1 , x2 ) | (x1 + 0.5)2 + x22 <= 1 } B = { (x1 , x2 ) | (x1 − 0.5)2 + x22 <= 1 }. Łatwo sprawdzamy, że A∪B = { (x1 , x2 ) | (x1 + 0.5)2 + x22 <= 1 lub (x1 − 0.5)2 + x22 <= 1 }, A∩B = AB = { (x1 , x2 ) | (x1 + 0.5)2 + x22 <= 1 i (x1 − 0.5)2 + x22 <= 1 }, { (x1 , x2 ) | (x1 + 0.5)2 + x22 <= 1 i (x1 − 0.5)2 + x22 > 1 lub (x1 + 0.5)2 + x22 > 11 i (x1 − 0.5)2 + x22 <= 1 }. Wizualizacj˛e tych zbiorów na płaszczyźnie przedstawiono na rys. 2.4). Mówimy, że A, B są rozłączne jeżeli A ∩ B = ∅. 46 ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH 2.1.2 Zawieranie się i równość zbiorów. Podzbiory. Definicja 2.1.2 Mówimy, że zbiór A zawiera się w zbiorze B lub inaczej, że A jest podzbiorem B jeśli każdy element zbioru A jest też elementem zbioru B. Piszemy wtedy A ⊂ B. Jeśli ⊂ B i B ⊂ A, to mówimy, że zbiory A i B są równe i piszemy A = B. Mówimy, że A jest podzbiorem właściwym B jeśli A ⊂ B i nie jest prawdą, że A = B. Definicja 2.1.3 Zbiór podzbiorów zbioru A definiujemy jako zbiór postaci P(A) := { U | U ⊂ A }. Na przykład dla zbioru A = {a, b, c} mamy P(A) = { ∅, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c} }. 2.1.3 Uzupełnienie zbioru. Gdy mówimy o jakiejś matematycznej rzeczywistości, wygodnie jest rozważać zbiór wszystkich obiektów tej rzeczywistości. Gdy uprawiamy arytmetyk˛e, wygodnie jest mówić o zbiorze wszystkich liczb, na przykład wszystkich liczb całkowitych lub wszystkich liczb rzeczywistych. W geometrii płaszczyzny wygodnie jest mówić o zbiorze wszystkich punktów płaszczyzny, w polityce mi˛edzynarodowej o zbiorze wszystkich państw, w biologii o zbiorze wsztstkich gatunków. W odniesieniu do takiego zbioru wszystkich obiektów rozważanej rzeczywistości matematycy używaja˛ określenia przestrzeń. Od strony formalnej przestrzeń jest synonimem słowa zbiór, jednak określenie przestrzeń niesie w sobie dodatkowa˛ nieformalna˛ informacj˛e, że zbiór ten zawiera w sobie wszelkie inne zbiory obiektów, które w rozważanej rzeczywistości moga˛ nas interesować. Warto od razu zaznaczyć, że interesujace ˛ przestrzenie matematyczne na ogół sa˛ nieskończone. Tym niemniej z poj˛eciem przestrzeni dobrze jest si˛e oswoić już teraz. Definicja 2.1.4 Jeśli A ⊂ X to zbiór X \A nazywamy uzupełnieniem A do X i oznaczamy CX A. Gdy X jest ustalony i znany z kontekstu, to uzupełnienie A do X oznaczamy po prostu CA lub \A. Poj˛ecie uzpełnienia jest szczególnie wygodnie w odniesieniu do przestrzeni. Na przykład jeśli X to przestrzeń wszystkich państw, a E oznacza państwa europejskie, to \E oznacza państwa, które nie leża˛ w Europie. Rysunki 2.3 oraz 2.4 uzyskano przy pomocy pakietu oprogramowania PSets napisanego w języku Mathematica. Pakiet ten pozwala na definiowanie zbiorów na płaszczyźnie zadanych formami zdaniowymi zbudowanymi z nierówności algebraicznych. Aby móc korzystać z pakietu, trzeba go najpierw wczytać instrukcją << PSets .m Teraz wprowadzając sA = PSet [ { x , y } , ( x + 0 . 5 ) ^ 2 + y^2 <= 1 ] ; sB = PSet [ { x , y } , ( x − 0 . 5 ) ^ 2 + y^2 <= 1 ] ; Print [ sA \ [ Union ] sB ] ; Print [ sA \ [ Intersection ] sB ] ; Print [ sA \ [ B a c k s l a s h ] sB ] ; Print [ sA \ [ C i r l c e M i n u s ] sB ] ; 2.1. ZBIORY SKOŃCZONE 47 obliczymy sumę, iloczyn, różnicę i różnicę symetryczną zbiorów A: = { (x, y) | (x + 0.5)2 + y 2 ¬ 1 } B: = { (x, y) | (x − 0.5)2 + y 2 ¬ 1 }. Możemy też sprawdzić, czy konkretny punkt, na przykład (1, 0) należy do zbioru, na przykład A, pisząc { 1 , 0 } \ [ Element ] sA Użycie operatorów \back[Subset], \back[Superset] i \back[equal] pozwala na sprawdzanie zawierania się i równości zbiorów. Warto wiedzieć, że różnego rodzaju operatory, w tym operatory mnogościowe w Mathematica można wprowadzać używając skrótów klawiaturowych. Wybrane skróty przedstawiono w tabeli poniżej. W tabeli tej znakiem :̇oznaczono przyciśnięcie klawisza Esc w lewym górnym rogu klawiatury. operator \[Union] \[Intersection] \[Backslash] \[CirlceMinus] \[Subset] \[Superset] \[Equal] \[Element] \[SmallCirlce] \[CenterDot] \[CircleDot] \[CirclePlus] \[Cross] \[Times] skrót :̇un:̇ :̇inter:̇ :̇\:̇ :̇c-:̇ :̇sub:̇ :̇sup:̇ :̇==:̇ :̇el:̇ :̇sc:̇ :̇.:̇ :̇c.:̇ :̇c+:̇ :̇cross:̇ :̇*:̇ forma graficzna ∪ ∩ \ ⊂ ⊃ = ∈ ◦ · ⊕ × × Pisząc S e t P l o t [ ( sA \ [ Union ] sB ) , { −2 , 2 } , { −2 , 2 } ] otrzymamy rysunek zbioru A ∪ B w domyślnych kolorach. Pisząc S e t P l o t [ ( sA \ [ B a c k s l a s h ] sB ) , { −2 , 2 } , { −2 , 2 } , I n t e r i o r S t y l e −> Green , BoundaryStyle −> {RGBColor[ 0 , 0 . 5 , . 0 ] , Thick } ] uzyskamy rysunek zbioru A \ B w kolorze i stylu dobranym przez nas. Pisząc S e t P l o t [ ( sA \ [ C i r l c e M i n u s ] sB ) , { −2 , 2 } , { −2 , 2 } , Grid−>True ] uzyskamy rysunek zbioru A B z naniesioną siatką poziomych i pionowych linii o współrzędnych całkowitych. Rysunek taki pozwala w szczególności szybko policzyć ilość zawartych w zbiorze tzw. punktów kratowych, tj. punktów o obu współrzędnych całkowitych. Ćwiczenie komputerowe 2.1.5 Wykorzystując pakiet PSets oblicz i narysuj zbiory A, B, A ∪ B, A ∩ B, A \ B, B \ A i A B dla różnych, zaproponowanych przez Ciebie podzbiorów płaszczyzny. Eksperymentując, ustal znacznie parametrów instrukcji SetPlot. Zastanów się, czy otrzymane rysunki można zawsze uznać za w pełni poprawne. Czasami warto kilka zbiorów umieścić razem na jednym wykresie (rysunku). Pisząc pa = S e t P l o t [ sA , { −2 , 2 } , { −2 , 2 } , I n t e r i o r S t y l e −> {Red, Opacity [ 0 . 6 ] } , BoundaryStyle −> {Red, Thick } ] ; 48 ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH pb = S e t P l o t [ sB , { −2 , 2 } , { −2 , 2 } , I n t e r i o r S t y l e −> {Blue , Opacity [ 0 . 6 ] } , BoundaryStyle −> {Blue , Thick } ] ; Show [ pa , pb ] uzyskamy oba zbiory A i B na jednym wykresie, tak jak to przedstawiono w lewym gónym rogu rys. 2.4. Ćwiczenie komputerowe 2.1.6 Wykorzystaj instrukcję Show, by zilustrować: rozłączność zbiorów, zawieranie się zbiorów jak również brak rozłączności i brak zawierania się. Możemy również eksperymentować z pakietem FSets, który implementuje operacje mnogościowe na zbiorach skończonych. Na przykład pisząc sA=FSet [ a , b , c ] sB=FSet [ b , c , d ] sC=sA \ [ Union ] sB obliczymy, że sumą mnogościową zbiorów a, b, c i b, c, d jest a, b, c, d. 2.1.4 Elementarne własności operacji mnogościowych Uwaga 2.1.7 Niech A, B, C będą zbiorami. Operacje mnogościowe mają następujące własności. Jeśli A ⊂ B, B ⊂ C, to A ⊂ C, A \ A = ∅, A \ ∅ = A, A ∪ B = B ∪ A, A ∪ A = A, A ∩ A = A, A ∩ B = B ∩ A, A ⊂ B wtedy i tylko wtedy gdy A ∪ B = B, A ⊂ B wtedy i tylko wtedy gdy A ∩ B = A, A ⊂ A ∪ B, B ⊂ A ∪ B, A ∪ (B ∪ C) = (A ∪ B) ∪ C, A ∩ B ⊂ A, A ∩ B ⊂ B, A ∩ (B ∩ C) = (A ∩ B) ∩ C, A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C), A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) Uwaga 2.1.8 Niech A, B ⊂ X będą zbiorami w przestrzeni X. Uzupełnienie do przestrzeni X ma następujące własności. A \ B = A ∩ (\B), \(\A) = A, \(A ∪ B) = (\A) ∩ (\B), \(A ∩ B) = (\A) ∪ (\B), A ⊂ B wtedy i tylko wtedy gdy \ A ⊃ \B. Ćwiczenie komputerowe 2.1.9 Wykorzystaj pakiet FSets, by zilustrować wybrane elementarne własności operacji mnogościowych. 2.2. ILOCZYN KARTEZJAŃSKI 2.2 2.2.1 49 Iloczyn kartezjański Para Wśród kluczowych poj˛eć analizy matematycznej jest poj˛ecie ciagu ˛ i funkcji. Funkcj˛e najprościej zdefiniować jak pewien zbiór par. Pierwszy element pary to argument, a drugi to wartość funkcji dla tego argumentu. Zatem jeśli chcemy definicj˛e funkcji podać na gruncie teorii mnogości, musimy zdefiniować par˛e elementów a i b, zwyczajowo oznaczana˛ (a, b). W poj˛eciu pary istotne jest, by było wiadomo, który element pary jest pierwszy, a który drugi. Tak wi˛ec roli pary nie może pełnić dubleton, bo w dubletonie kolejność nie ma znaczenia. Mamy bowiem {a, b} = {b, a}. Nie jest oczywiste jak postawić definicj˛e pary na gruncie teorii mnogości. Nie możemy zdefiniować pary jako dwuelementowego ciagu, ˛ gdyż ciag ˛ jest szczególnym przypadkiem funkcji, a na gruncie teorii mnogości funkcj˛e definiuje si˛e jako pewien zbiór par (x, y) o stosownych własnościach. Formalną definicję pary na gruncie teorii mnogości podamy w rozdziale 4.4.1. Na razie wystarczy nam intiucyjne pojęcie pary jako zbioru dwuelementowego (dubletonu) {a, b}, w którym dodatkowo ustalono, że a jest pierwszy, a b jest drugi. Parę elementów a, b zapisywać będziemy (a, b). Kluczową własnością pary, której nie ma dubleton, jest Uwaga 2.2.1 (a, b) = (c, d) wtedy i tylko wtedy gdy a = c i b = d. Tak więc para (5, 11) nie jest równa parze (11, 5) chociaż, zgodnie z umową dotyczącą zbiorów, mamy {5, 11} = {11, 5}. 2.2.2 Iloczyn kartezjański Zbiór wszystkich możliwych par (x, y), gdzie x ∈ X , a y ∈ Y tworzy tzw. iloczyn kartezjański zbiorów X i Y . Nazwa wywodzi si˛e od francuskiego matematyka Kartezjusza (René Descartes, rys. 2.5), który jako pierwszy zaproponował algebraiczne podejście do geometrii poprzez potraktowanie płaszczyzny jako zbioru par liczb. Definicja 2.2.2 Iloczynem kartezjańskim zbiorów X i Y nazywamy zbiór X × Y := { (x, y) | x ∈ X, y ∈ Y }. Iloczyn kartezjański X × X oznaczamy krótko X 2 . W pakiecie FSets iloczyn kartezjański zbiorów skończonych obliczamy instrukcją sC=sA \ [ Cross ] sB Ćwiczenie komputerowe 2.2.3 Wykorzystaj pakiet FSets, by zilustrować wyliczenie iloczynu kratezjańskiego wybranych przez siebie zbiorów skończonych. 2.3 Relacje Poj˛ecie relacji znane jest nam dobrze z j˛ezyka codziennego. Mówi si˛e na przykład, że dwie osoby pozostaja˛ w relacji pokrewieństwa. Albo, że dwa państwa pozostaja˛ w dobrych relacjach. Relacja oznacza pewien zwiazek ˛ pomi˛edzy dwoma elementami. Z abstrakcyjnego punktu widzenia relacja pomi˛edzy elementami zbiorów X i Y to w pewien sposób wyróżniony podzbiór iloczynu kartezjańskiego X × Y . Wyróżnienie może nastapić ˛ poprzez podanie warunku wymaganego, by elementy były w relacji, ale w przypadku zbiorów skończonych cz˛esto ograniczamy si˛e do wypisania par tworzacych ˛ relacj˛e bez merytorycznego wnikania co elementy w te pary połaczyło. ˛ Poj˛ecie relacji jest punktem wyjścia do szeregu podstawowych poj˛eć współczesnej matematyki: w szczególnośc relacji równoważności oraz relacji cz˛eściowego i liniowego porzadku. ˛ Jak zobaczymy, funkcje też traktowane sa˛ dziś przez matematyków jako szczególny przypadek relacji. 50 ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH Rysunek 2.5: Kartezjusz, 1596-1650 2.3.1 Relacje Definicja 2.3.1 Relacją w zbiorach X i Y nazywamy dowolny podzbiór R ⊂ X × Y . Gdy X = Y , mówimy krótko o relacji w X. Tradycyjnie piszemy xRy zamiast (x, y) ∈ R. Zbiór pusty i X × X to odpowiednio relacja pusta i relacja pełna w X. Relacją identycznościową w X jest ∆X := idX := { (x, x) | x ∈ X }. Zazwyczaj wyrażajac ˛ w j˛ezyku naturalnym fakt, iż jakieś dwa obiekty pozostaja˛ w pewnej relacji, używamy rzeczowników odnoszac ˛ si˛e do obiektów, a czasownika odnoszac ˛ si˛e do relacji. Na przykład zdanie "Ala lubi Tomka" opisuje relacj˛e pomi˛edzy obiektami (osobami) ’Ala’ i ’Tomek’ (rzeczowniki) wyrażona˛ przy pomocy czasownika ’lubić’. Czasownik, szczególnie czasownik ’być’, cz˛esto wyst˛epuje z przymiotnikiem lub przysłówkiem, tak jak w bardziej matematycznym przykładzie ’Liczba 5 jest wi˛eksza niż liczba 3’. Zdanie ’Japonia zaatakowała USA’ opisuje relacj˛e pomi˛edzy obiektami (państwami) ’Japonia’ i ’USA’ wyrażona˛ przy pomocy czasownika ’zaatakować’. Jeśli w zdaniu tym rzeczowniki ’Japonia’, ’Niemcy’ zastapimy ˛ zmiennymi x, y , otrzymamy zwrot ’x zaatakował y ’, określany mianem formy zdaniowej. Forma zdaniowa nie jest zdaniem, bo nie można ocenić, czy wyraża prawd˛e czy fałsz. Można to zrobić, gdy za zmienne podstawimy konkretne obiekty. W uj˛eciu formalnym to właśnie forma zdaniowa służy do określenia relacji, a sama relacja jest zbiorem par tych obiektów, które podstawione do formy zdaniowej daja˛ zdanie prawdziwe. Rozważmy relację w zbiorze X := { 1, 2, 3, 4 } daną wzorem R := { (1, 1), (1, 2), (1, 4), (2, 3), (3, 1), (4, 2) }. (2.1) Relacj˛e t˛e można zobrazować rysujac ˛ jej wykres oraz graf (rys. 2.6). Wykres relacji rysujemy podobnie jak wykres funkcji, zaznaczajac ˛ w układzie współrz˛ednych te punkty, których współrz˛edne odpowiadaja˛ parom pozostajacym ˛ w relacji. Rysowanie wykresu relacji jest możliwe tylko wtedy gdy zbiory X i Y sa˛ podzbiorami prostej lub w jakiś sposób daja˛ si˛e utożsamić z pewnymi podzbiorami prostej. Same zbiory X i Y nie musza˛ być skończone. Narysowanie grafu relacji jest możliwe tylko wtedy gdy zbiór X (oba zbiory X i Y gdy relacja jest w zbiorach X i Y ) sa˛ skończone. Każdy z elementów zbioru X (lub zbiorów X i Y ) zaznaczamy jako punkt na płaszczyźnie. Punkty łaczymy ˛ strzałka,˛ gdy odpowiadajace ˛ im elementy pozostaja˛ w relacji. 2.3. RELACJE 51 Rysunek 2.6: Wykres i graf relacji R w X Pakiet Relations w języku Mathematica pozwala na rysowanie wykresów i grafów relacji w zbiorze skończonym X. Na przykład instrukcja R = R e l a t i o n [{1 ,2 ,3 ,4} ,{1 − >1 ,1 − >2 ,1 − >4 ,2 − >3 ,3 − >1 ,4 − >2}] tworzy relację w zbiorze X := { 1, 2, 3, 4 } daną wzorem (2.1). Rysunek wykresu tej relacji uzyskamy pisząc RChart [ r e ] Natomiast graf uzyskamy pisząc RGraph [ r e ] Aby sprawdzić, czy dana para (a, b) jest w relacji R wystarczy napisać a \ [ CenterDot ] R \ [ CenterDot ] b Rozważmy relację w X := { a, b, c } i Y := { p, q, r, s } daną wzorem R := { (a, p), (b, p), (b, q), (c, s) }. Relacj˛e t˛e można zobrazować rysujac ˛ jej graf (rys. 2.7). W przypadku relacji w zbiorach X i Y gdy X 6= Y rysowanie grafu jest bardziej skomplikowane, bo nie można się zdać na automatyczne rozlokowanie wierzchołków. Rysunek 2.7 uzykano następującym ciągiem instrukcji sx = 0 ; sy = 7 ; g1 = GraphPlot [ { a −> p , b −> p , b −> q , c −> s , r −> r } , V e r t e x C o o r d i n a t e R u l e s −> { a −> { sx , 1 } , b −> { sx + 1 , 0 } , c −> { sx , −1} , p −> { sy + 1 , 2 } , q −> { sy , 1 } , r −> { sy + 1 , 0 } , s −> { sy , −1}} , V e r t e x L a b e l i n g −> True , D i r e c t e d E d g e s −> True , S e l f L o o p S t y l e −> False , PlotRange −> {{ −2 , 1 2 } , { −4 , 4 } } ] ; g2 = R e g i o n P l o t [ x^2 + y^2 <= 3 , {x , −2, 1 2 } , {y , −4, 4 } , PlotRange −> {{ −2 , 1 2 } , { −4 , 4 } } , AspectRatio −> Automatic , PlotStyle −> { Opacity [ 0 . 0 5 ] , Darker [ Green ] } ] ; g3 = R e g i o n P l o t [ ( x − 7)^2 + y^2 <= 8 , {x , −2, 1 2 } , {y , −4, 4 } , 52 ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH Rysunek 2.7: Graf relacji R w X i Y PlotRange −> {{ −2 , 1 2 } , { −4 , 4 } } , AspectRatio −> Automatic , PlotStyle −> { Opacity [ 0 . 0 5 ] , Blue } ] ; g4 = Graphics [ { Text [ S t y l e [ "X" , Darker [ Green ] , Bold , 2 4 ] , { −1 , − 2 . 5 } ] , Text [ S t y l e [ "Y" , Blue , Bold , 2 4 ] , { sy + 2 . 5 , − 2 . 5 } ] } , PlotRange −> {{ −2 , 1 2 } , { −4 , 4 } } ] ; u = Show [ g1 , g2 , g3 , g4 ] 2.3.2 Własności relacji Niech R ⊂ X × X będzie relacją w X. Definicja 2.3.2 Wyróżniamy następujące własności relacji R. • Relacja R jest zwrotna jeśli dla każdego x ∈ X zachodzi x R x. • Relacja R jest symetryczna jeśli dla dowolnych x, y ∈ X relacja x R y implikuje relację y R x. • Relacja R jest antysymetryczna jeśli dla dowolnych x, y ∈ X zachodzenie tak relacji x R y jak i relacji y R x jest możliwe tylko gdy x = y. • Relacja R jest przechodnia jeśli dla dowolnych x, y, z ∈ X zachodzenie relacji x R y i y R z implikuje zachodzenie relacji x R z. • Relacja R jest spójna jeśli dla dowolnych x, y ∈ X zachodzi przynajmniej jedna z relacji x R y, y R x. Pakiet Relations umożliwia proste sprawdzanie, czy dana relacja ma powyższe własności. Wprowadzając IsReflexive [ re ] IsSymmetric [ r e ] IsAntisymmetric [ re ] IsTransitive [ re ] IsTotal [ re ] 2.4. RELACJE RÓWNOWAŻNOŚCI 53 dowiadujemy się, że relacja zadana wzorem (2.1) jest antysymetryczna, ale pozostałych rozważanych własności nie posiada. Ćwiczenie komputerowe 2.3.3 Dla każdej z powyższych pięciu własności podaj przykład relacji w zbiorze pięcioelementowym, która ma dokładnie tę i, o ile to możliwe, żadną inną z powyższych własności. Przykład zilustruj rysunkiem wykresu i grafu opracowanym w programie Mathematica. Zastanów się, które z powyższych własności łatwo sprawdzić oglądając wykres, a które oglądając graf. Iloczyn kartezjański n zbiorów i relacje n-argumentowe. 2.3.3 Pojęcie pary można uogólnić do pojęcia n-tki (trójki, czwórki, ...) elementów. Formalną definicję n-tki podamy w rozdziale 4.7.10. Na razie przyjmiemy, że n-tka elementów to zbiór n-elementowy {a1 , a2 , . . . an }, w którym ustalono kolejność elementów. Taką n-tkę zapisujemy (a1 , a2 , . . . an ), w którym element pierwszy umieszczamy na pierwszej pozycji, drugi na drugiej itd. Z trzech elementów 1, 2, 3 możemy zatem utworzyć jeden zbiór trzyelementowy, choć zapisać możemy go na sześć różnych sposobów. {1, 2, 3} = {1, 3, 2} = {2, 1, 3} = {2, 3, 1} = {3, 1, 2} = {3, 2, 1}. Natomiast każda z sześciu trójek (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1) jest inna. Definicja 2.3.4 Definiujemy iloczyn kartezjański zbiorów X1 , X2 , . . . Xn jako X1 × X2 × · · · × Xn := { (x1 , x2 , . . . , xn ) | gdzie xi ∈ Xi dla i = 1, 2, . . . , n }. W przypadku gdy wszystkie zbiory Xi są tym samym zbiorem X mówimy o n-tej potędze kartezjańskiej zbioru X i używamy skrótu X n . Wygodnie jest rozszerzyć tę konwencję na n = 1 i przyjąć, że X 1 := X. Relacją n-argumentową w zbiorach X1 , X2 , . . . Xn nazywamy dowolny podzbiór zbioru X1 × X2 × · · · × Xn . Podobnie jak relacja dwuargumentowa wyraża zwiazek ˛ pomi˛edzy dwoma elementami, relacja n-argumentowa wyraża zwiazek ˛ pomi˛edzy n-elementami. Gdy w j˛ezyku naturalnym chcemy wyrazić relacj˛e wieloargumentowa,˛ na przykład trójelementowa,˛ wspomagamy si˛e najcz˛eściej okolicznikami. Na przykład forma zdaniowa ’w zaatakował x w sojuszu z y ’ zadaje relacj˛e trójargumentowa,˛ w której trzeci argument został dodany przy wykorzystaniu okolicznika ’e sojuszu z w’. Konsekwencja˛ przyj˛ecia umowy, że X 1 = X , jest dopuszczenie relacji jednoargumentowych. W konsekwencji każdy podzbiór X stanowi pewna˛ relacj˛e jednoargumentowa.˛ Relacje jednoargumentowe określaja˛ własności obiektów. W j˛ezyku naturalnym wyrażane sa˛ przy pomocy czasownika ’być’ z przymiotnikiem. Na przykład forma zdaniowa ’x jest zielonooki określa własność posiadania zielonych oczu. 2.4 Relacje równoważności Relacja równoważności dokonuje utożsamienia obiektów pod pewnym wzgl˛edem przy zachowaniu różnic pod innym wzgl˛edem. Relacja˛ równoważności jest na przykład bycie tej samej narodowości. Dwie osoby tej samej narodowości moga˛ si˛e różnić pod wieloma wzgl˛edami, ale pod wzgl˛edem narodowości sa˛ identyczne. W matematyce relacje równoważności służa˛ jako narz˛edzie do definiowania nowych poj˛eć. Posłużymy si˛e nimi by z liczb naturalnych skonstruować liczby całkowite, z liczb całkowitych liczby wymierne, a z liczb wymiernych liczby rzeczywiste. 54 ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH 2.4.1 Relacja równoważności Definicja 2.4.1 Relację w zbiorze X, która jest zwrotna, symetryczna i przechodnia nazywamy relacją równoważności. Dla x ∈ X klasę [x]R := { y ∈ X | xRy } nazywamy klasą równoważności elementu x. W rozdziale ... udowodnimy następujące ważne twierdzenie opisujące podstawowe własności klas równoważności. Twierdzenie 2.4.2 Niech R będzie relacją równoważności w X. Jeśli x, y ∈ X oraz xRy, to [x]R = [y]R . Innymi słowy, klasy równoważności równoważnych elementów są identyczne. Ponadto dla dowolnych x, y ∈ X albo [x]R = [y]R , albo [x]R ∩ [y]R = ∅, to znaczy klasy równoważności dwóch elementów są albo równe, albo rozłączne. Pakiet Relations.m umożliwia sprawdzenie czy relacja jest relacją równoważności. Na przykład pisząc rR = R e l a t i o n [ { a , b , c } , { a −> a , b −> b , c −> c , a −> b , b −> a } ] I s E q u i v a l e n c e [ rR ] otrzymamy odpowiedź True. 2.5 Funkcje Poj˛ecie funkcji w matematyce przeszło znaczna˛ ewolucj˛e. Pierwtonie poj˛ecie funkcji wiazano ˛ ze wzorem, który pewnej zmiennej liczbowej przypisywał nowa˛ wartość wyliczana˛ ze wzoru. Na przykład, najprostsza funkcja kwadratowa przypisuje liczbie x wartość x2 . Z czasem wymóg algebraicznego wzoru rozluźniono, wymagajac ˛ jedynie podania jakiegokolwiek, nie koniecznie wyrażajacego ˛ si˛e wzorem, sposobu przypisania argumentowi wartości funkcji. Na przykład liczbie naturalnej n można przypisać najwi˛eksza˛ liczb˛e naturalna˛ k , taka,˛ że 2k dzieli liczb˛e n bez reszty. Nie ma wzoru na takie k , ale można podać algorytm, który takie k nam wyznaczy. Mianowicie dzielimy nasza˛ liczb˛e przez 2. Jeśli wynik jest liczba˛ naturalna,˛ ponownie dzielimy przez 2. Proces ten powtarzamy aż do momentu, gdy dzielenie bez reszty nie jest już możliwe, równocześnie zliczajac ˛ dzielenia bez reszty. Otrzymana liczba dzieleń bez reszty jest szukanym najwi˛ekszym k . W obu tych podejściach możemy utworzyć pary łacz ˛ ac ˛ argumenty ze zbioru X w par˛e z odpowiadajacymi ˛ im wartościami ze zbioru Y . Na funkcj˛e możemy wi˛ec patrzeć jako na zbiór par, a wi˛ec relacj˛e w zbiorach X , Y . W pewnym momencie matematycy uznali, że za funkcj˛e można uznać zbiór par nawet wtedy gdy nie widać żadnego wzoru, czy algorytmu pozwalajacego ˛ przypisać argumentowi x ∈ X wartość y ∈ Y . Ma to w szczególności sens w przypadku zbiorów skończonych, bo aby zadać relacj˛e, wystarczy wypisać wszystkie pary, które w relacji pozostaja.˛ Trzeba jednak wyraźnie podkreślić, że nie każda relacja może być uznana za funkcj˛e. Aby tak si˛e stało potrzebujemy dwóch własności. Pierwsza z nich to jednolistność. Definicja 2.5.1 Niech R ⊂ X × Y będzie relacją. Mówimy, że R jest funkcją jeżeli dla każdego x ∈ X istnieje dokładnie jeden y ∈ Y taki, że x R y. Pakiet Relations.m umożliwia sprawdzenie czy relacja jest funkcją. Na przykład pisząc rR = R e l a t i o n [ { a , b , c } , {a−>c , b −> b , c −> a } ] I s F u n c t i o n [ rR ] otrzymamy odpowiedź True. Na zbiór funkcji z X do Y stosujemy oznaczenie Y X := { f | f : X → Y - funkcja z X do Y } 2.5. FUNKCJE Przykład 2.5.2 55 1. Niech c ∈ Y . Wtedy { (x, c) | x ∈ X } jest funkcją z X do Y . Nazywamy ją funkcją stałą. 2. Relacja identycznościowa ∆X jest funkcją ∆X : X → X. 3. Relacja pełna w przestrzeni X nie jest funkcją z wyjątkiem przypadku gdy X jest pusty lub jest singletonem. 2.5.1 Obrazy i przeciwobrazy Niech f : X → Y , A ⊂ X, B ⊂ Y . Obrazem zbioru A nazywamy f (A) := { f (x) | x ∈ A }. Przeciwobrazem zbioru B nazywamy f −1 (B) := { x ∈ X | f (x) ∈ B }. Uwaga 2.5.3 Niech f : X → Y , a A, A1 , A2 ⊂ X i B, B1 , B2 ⊂ Y będą zbiorami. Wtedy Jeśli A1 ⊂ A2 , to f (A1 ) ⊂ f (A2 ), Jeśli B1 ⊂ B2 , to f (A1 )f −1 (B1 ) ⊂ f −1 (B2 ), f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ), f −1 f −1 (B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ), f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 ), (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ), f (f −1 (B)) = B ∩ im f, f −1 (f (A)) ⊃ A. 2.5.2 Injekcje, surjekcje, i bijekcje. Funkcję f : X → Y nazywamy injekcją, jeżeli dla dowolnych x1 , x2 ∈ X równość f (x1 ) = f (x2 ) implikuje równość x1 = x2 . Funkcję f nazywamy surjekcją, jeżeli dla dowolnego y ∈ Y istnieje x ∈ X takie, że y = f (x). Funkcję f nazywamy bijekcją jeśli jest injekcją i surjekcją. Twierdzenie 2.5.4 Niech f : X → Y będzie funkcją. Relacja odwrotna f −1 jest jednolistna wtedy i tylko wtedy gdy f jest injekcją. Relacja odwrotna f −1 jest funkcją wtedy i tylko wtedy gdy f jest bijekcją. Relację odwrotną do bijekcji nazywamy funkcją odwrotną. Pakiet Relations.m umożliwia sprawdzenie injektywności, surjektywności i bijektywności funkcji przy pomocy metod IsInjective, IsSurjective i IsBijective. 56 ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH Rozdział 3 Elementy logiki matematycznej 3.1 Program Hilberta Przyjrzyjmy si˛e bliżej programowi Hilberta. Chcemy stworzyć j˛ezyk formalny b˛edacy ˛ opisem pewnej matematycznej rzeczywistości. Zastanówmy si˛e najpierw co może składać si˛e na taka˛ rzeczywistość? Najlepiej zaczać ˛ od takich obiektów matematycznych, z którymi jesteśmy już oswojeni, na przykład od liczb całkowitych. Obiektom przypisujemy pewne własności. Na przykład możemy stwierdzić, że pewna liczba całkowita z jest parzysta. Albo zauważyć, że liczba x jest mniejsza od liczby y . Własność może dotyczyć jednego (jak w przypadku parzystości), dwóch (jak w przypadku mniejszości) lub trzech i wi˛ecej obiektów. Wiemy już, że taka˛ własność dotyczac ˛ a˛ n obiektów określamy mianem n-argumentowej relacji. Oprócz analizowania własności obiektów, wykonujemy też pewne konstrukcje obiektów. Na przykład dysponujac ˛ liczba˛ x możemy wziać ˛ liczb˛e do niej przeciwna˛ −x. Dysponujac ˛ liczbami x i y możemy obliczyć sum˛e x + y czy iloczyn xy . Taka konstrukcja może wymagać dostarczenia jednego (jak w przypadku liczby przeciwnej), dwóch (jak w przypadku sumy czy iloczynu), badź ˛ trzech lub wi˛ecej obiektów. Konstrukcj˛e nowego obiektu w oparciu o dane n obiektów określamy mianem n-argumentowej funkcji. Oprócz rozważania relacji i funkcji zazwyczaj potrzebujemy też pewne wyróżnione obiekty o specjalnych własnościach, na przykład liczb˛e 0 i liczb˛e 1. W j˛ezyku formalnym, który ma nasza˛ rzeczywistość opisywać, musimy zaplanować symbole, które b˛eda˛ kodować relacje, funkcje i wyróżnione obiekty. Chcemy, by tych symboli było możliwie mało, dlatego w kodowaniu ograniczamy si˛e do pewnego niezb˛ednego minimum tak by wszystko inne co jest nam potrzebne dało si˛e zdefiniować przy użyciu wybranego możliwie małego zestawu. Na przykład odejmowanie dwóch liczb całkowitych nie jest nam potrzebne, bo x − y można zdefiniować jako dodawanie x + (−y), czyli dodanie x i liczby przeciwnej do y . Podobnie, trzyargumentowe dodawanie x + y + z zdefiniować można jako dwukrotne dwuargumentowe dodawanie (x + y) + z . Wygodnie jest też dopuścić funkcje zeroargumentowe, co pozwala zrezygnować z wyróżnionych obiektów, bo funkcja zeroargumentowa, ze wzgl˛edu na brak argumentów, zwraca zawsze ten sam wynik, który można utożsamić z wyróżnionym obiektem. Te wyróżnione funkcje i relacje traktujemy jako poj˛ecia pierwotne teorii, która˛ b˛edziemy opisywać w j˛ezyku formalnym. W szczególności mówimy o pierwotnych funkcjach i pierwotnych relacjach. W odniesieniu do pierwotnych funkcji cz˛esto używamy zamiennie określenia operacja z jedna˛ drobna,˛ zwyczajowa˛ różnica˛ j˛ezykowa:˛ operacje wykonujemy na obiektach, a funkcje wyliczamy dla obiektów. 3.1.1 Struktury matematyczne. Formalny j˛ezyk sam w sobie nie niesie żadnych treści. Jest to jedynie zbiór poprawnie skonstruowanych napisów i nic wi˛ecej. Aby te napisy miały jakaś ˛ treść, trzeba nadać znaczenie zmiennym, symbolom funkcyjnym i symbolom relacyjnym. W tym celu musimy im przypisać jakieś obiekty, funkcje i relacje z pewnej matematycznej rzeczywistości, tak zwanej struktury matematycznej. Przez strukturę matematyczną lub krótko strukturę rozumiemy zestaw, na który składają się: • pewien typ interesujących nas obiektów, zwany dziedziną struktury, gwarantujący istnienie przynajmniej jednego obiektu, • pewien skończony zbiór relacji pomiędzy obiektami, • pewien skończony zbiór operacji, które na obiektach można wykonywać, • pewien skończony zbiór wyróżnionych obiektów dziedziny. 57 58 ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ 3.1.2 Alfabet, słowo i języki formalne. Zastanówmy si˛e z kolei jak powinien wygladać ˛ j˛ezyk formalny. Ma on służyć formułowaniu stwierdzeń o pewnej strukturze matematycznej. Stwierdzenia powinny przyjać ˛ form˛e napisu b˛edacego ˛ ciagiem ˛ symboli z pewnego ustalonego alfabetu. Warto zaznaczyć, że choć używamy określenia alfabet, to cz˛esto cały ciag ˛ liter traktujemy jako oddzielny symbol. Powszechnie stosowanym przykładem sa˛ symbole funkcji trygonometrycznych: sin, cos, tg. Ta konwencja bierze si˛e stad, ˛ że matematykom ( a tym bardziej informatykom) zbiór liter j˛ezyka codziennego absolutnie nie wystarcza jako zbiór symboli. Stad ˛ stosowanie różnych rodzajów znaków, liter opartych o różne czcionki a, b, c, ..., A, B, C, ..., A, B, C, ..., A, B, C, ..., α, β, γ, ..., Γ, ∆, Λ..., czy różnego rodzaju modyfikatorów jak daszki x̂, ŷ, ẑ . . . czy ptaszki x̌, y̌, ž . . .. Niech Σ będzie skończonym zbiorem symboli, zwanym alfabetem. Definicja 3.1.1 • Słowem nad Σ nazywamy dowolny skończony ciąg symboli. • Zbiór słów nad alfabetem Σ oznaczamy Σ∗ . • Językiem L nad Σ nazywamy pewien podzbiór zbioru słów Σ∗ . Słowa należące do L nazywamy słowami dopuszczalnymi języka L, albo krótko formułami języka L. Oczywiście, tylko niektóre z wszystkich możliwych napisów maja˛ jakiś sens. Dlatego, definiujac ˛ konkretny j˛ezyk musimy podać jakieś reguły, które pozwola˛ rozstrzygnać ˛ co jest, a co nie jest sensownym napisem, a wi˛ec tzw. formuła˛ j˛ezyka. Nim si˛e tym zajmiemy, przyjrzyjmy si˛e najpierw bliżej co powinno si˛e składać na alfabet j˛ezyka formalnego. Przede wszystkim potrzebujemy odpowiednio bogatego zestawu nazw do oznaczania dowolnych obiektów dziedziny, tak zwanych zmiennych. Zazwyczaj używamy do tego końcowych liter alfabetu x, y, z choć cz˛esto potrzebujemy znacznie wi˛ecej zmiennych, stosowane sa˛ wi˛ec też inne konwencje, na przykład dodawanie indeksów x1 , x2 , x3 . . ., Natomiast przyda si˛e nam bardzo szeroki zbiór zmiennych opartych o różne czcionki: Potrzebujemy też oddzielnych symboli dla wyróżnionych obiektów dziedziny, dla zestawu przyj˛etych operacji i dla zestawu przyj˛etych relacji. Ponadto potrzebujemy nawiasów i przecinka do zapisywania argumentów operacji i relacji. Taki zestaw symboli pozwala nam już na zapisanie pewnych prostych faktów dotyczacych ˛ struktury, która˛ j˛ezyk ma opisywać. Dla przykładu rozważmy jeszcze raz struktur˛e, na która˛ składaja˛ si˛e: liczb całkowite jako dziedzina, wyróżnione liczby zero i jeden, dwuargumentowe relacje równości i wi˛ekszości oraz dwuargumentowe operacje dodawania i mnożenia. Rozważmy j˛ezyk, w którym wyróżniona liczba zero oznaczana jest symbolem Z , liczba jeden symbolem ’J’, operacja dodawania symbolem D , operacja mnożenia symbolem M , relacja silnej wi˛ekszości symbolem W , a relacja równości symbolem R. Oto prosty fakt zapisany w tym j˛ezyku W (J, Z), który łatwo rozszyfrujemy jako stwierdzenie, że jeden jest wi˛eksze niż zero. Używajac ˛ zwyczajowych symboli zapisujemy to jako 1 > 0. Nieco trudniej rozszyfrować formuł˛e R(D(D(J, J), D(J, J)), M (D(J, J), D(J, J))), która˛ przy użyciu bardziej tradycyjnych oznaczeń zapisać można jako ((1 + 1) + (1 + 1)) = ((1 + 1) ∗ (1 + 1)), a po wprowadzeniu skrótu 2 na 1 + 1 i pomini˛eciu zb˛ednych nawiasów jako 2 + 2 = 2 ∗ 2. Widać, że zapisy w j˛ezyku formalnym sa˛ dla człowieka dość trudne do rozszyfrowania ze wzgl˛edu na ich złożoność nawet dla bardzo prostych faktów. By uniknać ˛ tej złożoności przyjmuje si˛e szereg konwencji, których uczymy si˛e już od szkoły podstawowej. Taka˛ konwencja˛ jest na przykład zapisywanie operacji i relacji dwuargumentowych przez wstawienie znaku operacji czy relacji pomi˛edzy argumenty, co pozwala pominać ˛ nawiasy. Tak wi˛ec piszemy 0 + 1 zamiast +(0, 1) oraz 1 > 0 zamiast > (1, 0). Inna˛ konwencja˛ jest przypisanie priorytetów symbolom funkcyjnym i relacyjnym, co też pozwala uniknać ˛ pisania wielu nawiasów. Na przykład przyjmujemy, że mnożenie ma wi˛ekszy priorytet od dodawania co pozwala rozszyfrować zapis 1 + 1 ∗ 1 jako 1 + (1 ∗ 1), a nie jako (1 + 1) ∗ 1. Zazwyczaj przyjmujemy, że wszystkie symbole funkcyjne maja˛ wyższy priorytet niż relacyjne. Wreszcie, aby uprościć zapis formuły, dla cz˛esto powtarzajacych ˛ si˛e fragmentów wprowadzamy skrótowe oznacznia, na przykład 2 dla 1 + 1. Podkreślmy, że oznaczenia takie nie sa˛ cz˛eścia˛ alfabetu j˛ezyka, a jedynie służa˛ ułatwieniu czytania skomplikowanych formuł. Jeśli chcemy zobaczyć formuł˛e j˛ezyka w jej czystej formie, musimy konsekwentnie z niej wyrugować wszystkie skróty. 3.1. PROGRAM HILBERTA 59 W dalszym ciagu ˛ b˛edziemy cz˛esto używać raz przyj˛etych konwencji i skrótów bez uprzedzenia, zakładajac, ˛ że czytelnik je zna i jest w stanie, w razie potrzeby, przekształcić zapis tak, by konwencji si˛e pozbyć. Warto sobie uświadomić, że stworzenie koncepcji języka formalnego stworzyło grunt, bez którego nie powstałby współczesny komputer. Języki formalne, w takim czy innym ujęciu, stanowią podstawę programowania komputerów. W szczególności język pakietu Mathematica jest językiem formalnym. Na szczęście, poprzez stworzenie szeregu konwencji i skrótów jest on przyjazny użytkownikowi. Warto jednak czasem zapytać jak wygląda formuła w języku Mathematica ogołocona z konwencji i skrótów. Pisząc FullForm [ x + y∗ z < w ] otrzymujemy odpowiedź Less [ Plus [ x , Times [ y , z ] ] , w ] która przestawia zapis fomuły x + y ∗ z < w pozbawiony konwencji i skrótów. W szczególności w, x, y, z są zmiennymi, Plus i Times symbolami funkcyjnymi, a Less jest symbolem relacyjnym. 3.1.3 Spójniki logiczne Wróćmy do naszej analizy alfabetu j˛ezyka. Ograniczyliśmy zestaw zakodowanych w symbolach j˛ezyka własności (relacji) do niezb˛ednego minimum. Aby móc w j˛ezyku wyrażać takie własności jak x jest wi˛eksze lub równe od y potrzebujemy złożyć napisy x > y i x = y w jedna˛ całość przy użyciu spójnika logicznego ’lub’. W tym celu spójnik ’lub’ musimy dodać do alfabetu. Spójnik ten zwyczajowo kodujemy znakiem ∨. Dodanie tego spójnika do alfabetu pozwala na utworzenie napisu x > y ∨ x = y . Dla wygody wprowadzamy skrót ­ przyjmujac, ˛ że x ­ y oznacza właśnie x > 0 ∨ x = 0. W rozważanym przykładzie, ze wzgl˛edu na minimalistyczne podejście do zestawu poj˛eć, wśród relacji pierwotnych uwzgl˛edniliśmy tylko relacje > i =, ale już nie <. Zauważmy jednak, że własność ’x jest mniejsze niż y ’ jest równoważna stwierdzeniu: ’niepawda, że zachodzi alternatywa x jest wi˛eksze od y lub x jest równe y . Tak wi˛ec, aby móc zdefiniować własność mniejszości potrzebujemy jeszcze spójnika logicznego ’nieprawda, że’. Zwyczajowo kodujemy go znakiem ¬. Dodanie go do alfabetu umożliwia utworzenie napisu ¬x ­ y , co można przyjać ˛ jako definicj˛e skrótu x < y . Zwyczajowo przyjmujemy, że spójnik ¬ ma najwyższy priorytet ze wszystkich spójników logicznych. Spójniki logiczne ∨ oraz ¬ nie sa˛ jedynymi jakie si˛e przydaja.˛ Aby zapisać własność x > 0 i x < 2 potrzebujemy spójnika logicznego ’i’, zapisywanego ∧. Nie musimy go dodawać do alfabetu, bo możemy przyjać, ˛ że dla formuł ϕ oraz ψ zapis ϕ ∧ ψ jest skrótem od zapisu ¬(¬ϕ ∨ ¬ψ). Innym cz˛esto używanym spójnikem logicznym jest ’implikuje’, zapisywany jako ’⇒’. W j˛ezyku potocznym pojawia si˛e on w wielu różnych wariantach: ’ϕ implikuje ψ ’, ’jeśli ϕ, to ψ ’, ’ψ , chyba że nie ϕ’, przy założeniu ϕ zachodzi ψ . Choć w pierwszej chwili wydaje si˛e to zaskakujace, ˛ spójnik ’⇒’ daje si˛e wyrazić poprzez spójniki ’∨’ oraz ’¬’. Dokładniej, zapis ϕ ⇒ ψ oznacza tyle samo, co ¬ϕ ∨ ψ , tak wi˛ec spójnik ’⇒’ również traktujemy jako skrót. Ze spójnikiem tym wiaże ˛ si˛e troch˛e nieporozumień: bywa mylnie traktowany jako stwierdzajacy ˛ możliwość wywnioskowania ψ z ϕ. J˛ezyk formalny nie służy jednak do stwierdzeń na temat możliwości przeprowadzania wnioskowania. Stwierdzenie ’Jeśli na narty pojechałem w Dolomity, to słoneczna pogoda była zagwarantowana’ nie oznacza, że słoneczna pogoda w Dolomitach jest jakaś ˛ konsekwencja˛ tego, że ktoś si˛e tam wybrał na narty. Jest tylko obserwacja˛ współistnienia pewnych faktów. Współistnienia wynikajacego ˛ z tego, że słoneczna pogoda zima˛ w Dolomitach jest cz˛esto i nie trzeba dużo szcz˛eścia, by na taka˛ trafić. Mamy też spójnik ’jest równoważne’, zapisywany jako ⇔. Zapis ϕ ⇔ ψ oznacza tyle samo, co (ϕ ⇒ ψ) ∧ (ψ ⇒ ϕ). W j˛ezyku potocznym jest formułowany również zwrotem ’zachodzi wtedy i tylko wtedy gdy’. 3.1.4 Kwantyfikatory Rozważane do tej pory przykłady formuł opisuja˛ własności wyróżnionych elementów dziedziny struktury matematycznej. Dla takich formuł można sprawdzić czy zapisuja˛ prawd˛e, czy fałsz. O takich formułach mówimy, że sa˛ zdaniami. Używajac ˛ zmiennych, możemy konstruować formuły opisujace ˛ własności bliżej nieokreślonych elementów dziedziny. Formuły, w których wyst˛epuja˛ zmienne nazywamy formami zdaniowymi, bo staja˛ si˛e zdaniami dopiero po podstawieniu za zmienne konkretnych elementów dziedziny. Na przykład formuła x > y jest prawdziwa, gdy za x podstawimy 1, a za y podstawimy 0. Natomiast podstawiajac ˛ 0 za x, a 1 za y otrzymujemy fałsz. Jest jeszcze inny sposób przekształcenia formy zdaniowej w zdanie. Rozważmy na przykład form˛e x ∗ x ­ 0 w dziedzinie liczb całkowitych. Podstawiajac ˛ w tej formie dowolna˛ liczb˛e całkowita˛ dostajemy zdanie prawdziwe. Możemy t˛e obserwacj˛e wyrazić zdaniem: Dla każdego x zachodzi x ∗ x ­ 0. Wyrażenie ’dla każdego’ nazywamy kwantyfikatorem ogólnym, albo inaczej uniwersalnym. Zapisujemy go przy pomocy symbolu ∀. Jest to odwrócona litera ’A’ od angielskiego słowa ’all’. Nasz przykład zapisujemy zatem symbolicznie jako ∀x x ∗ x ­ 0. 60 ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ Ogólnie, rozważmy form˛e zdaniowa˛ ϕ, w której wyst˛epuje zmienna x, co zapisujemy ϕ(x). Stwierdzajac, ˛ że dla każdego x zachodzi ϕ(x) otrzymujemy zdanie, które zapisujemy przy pomocy kwantyfikatora ogólnego jako ∀x ϕ(x). Jest ono prawdziwe jeśli rzeczywiście po podstawieniu za zmienna˛ x dowolnego elementu z dziedziny otrzymujemy zdanie prawdziwe. Jeśli istnieje choć jeden element a z dziedziny, dla którego zdanie ϕ(a) jest fałszywe, to zdanie ∀x ϕ(x) jest fałszywe. Na przykład zdanie ∀x x > 0 jest fałszywe, bo podstawiajac ˛ za x liczb˛e całkowita˛ −1 otrzymujemy zdanie fałszywe. Natomiast zdanie ∀x x ∗ x ­ 0, jak już zauważyliśmy, jest prawdziwe. Należy tu podkreślić, że niestety nie jesteśmy w stanie jego prawdziwości sprawdzić podstawiajac ˛ za x po kolei wszystkie liczby całkowite, bo jest ich nieskończenie wiele. Wierzymy, że tak jest, bo dzieje si˛e tak dla dowolnie dużego zbioru liczb całkowitych jaki jesteśmy w stanie sprawdzić. Jesteśmy też w stanie udowodnić ten fakt. I właśnie po to jest nam potrzebny j˛ezyk formalny. Mamy jeszcze drugi kwantyfikator. Aby si˛e z nim zaznajomić rozważmy własność parzystości liczb całkowitych. Liczba x jest parzysta jeśli x = 2y dla pewnej innej liczby całkowitej y . To samo inaczej: liczba x jest parzysta, jeżeli istnieje y takie, że x = 2y . Zwrot ’istnieje’ określamy mianem kwantyfikatora szegółowego, albo egzystencjalnego. Oznaczamy go symbolem ’∃’. Jest to odwrócona litera ’E’ od angielskiego słowa ’exists’. Zatem własność parzystości liczby x można zapisać w j˛ezyku formalnym jako ∃y x = 2y . Ogólnie, z formy zdaniowej ϕ(x) możemy utworzyć zdanie przy użyciu kwantyfikatora szczegółowego, stwierdzajac, ˛ że istnieje x dla którego zachodzi ϕ(x), co zapisujemy jako ∃x ϕ(x). Jest ono prawdziwe jeśli da si˛e znaleźć element a dziedziny taki, że ϕ(a) jest zdaniem prawdziwym. Jeśli takiego elementu nie ma, zdanie ∃x ϕ(x) jest fałszywe. Na przykład zdanie ∃x x > 0 jest prawdziwe, bo 1 > 0. Natomiast zdanie ∃x x ∗ x + 1 = 0 jest fałszywe. Oczywiście fałszywe dla struktury, którego dziedzina˛ jest zbiór liczb całkowitych, bo w zbiorze liczb zespolonych jest ono akurat prawdziwe. Pami˛etać zatem należy, że prawdziwość lub fałszywość zdania w j˛ezyku formalnym zależy od struktury, do którego zdania j˛ezyka odnosimy. Zauważmy, że zaprzeczenie stwierdzenia ∀x ϕ(x) możemy wyrazić przy pomocy spójnika ∃, bo jeśli nie jest prawda,˛ że dla każdego x zachodzi ϕ(x), to istnieje x taki, że nie zachodzi ϕ(x). Zatem stwierdzenie ¬∀x ϕ(x) jest równoważne stwierdzeniu ∃x ¬ϕ(x). Podobnie zauważamy, że stwierdzenie ¬∃x ϕ(x) jest równoważne stwierdzeniu ∀x ¬ϕ(x). Stad ˛ wnosimy, że ∃x ϕ(x) jest równoważne stwierdzeniu ¬∀x ¬ϕ(x). Oznacza to, że kwantyfikator szczegółowy ∃ można traktować jako skrót wyrażenia ¬∀x ¬ϕ(x). 3.1.5 Termy i predykaty Jak wiemy z gramatyki, wśród cz˛eści mowy wyróżniamy w szczególności rzeczowniki, czasowniki i przymiotniki. Rzeczowniki służa˛ do nazywania obiektów. Przymiotniki pozwalaja˛ określać własności obiektów. Czasowniki określaja˛ zależności pomi˛edzy obiektami. Zauważyliśmy już w rozdziale ..., że przymiotniki i czasowniki możemy wrzucić do jednego worka jako cz˛eści mowy wyrażajace ˛ relacje n argumentowe (jednoargumentowe dla przymiotników, wieloargumentowe dla czasowników). W j˛ezyku logiki odpowiednikiem rzeczownika jest określenie term, a odpowiednikiem przymiotnika i czasownika jest określenie predykat. W pewnym uproszczeniu, termy to nazwy obiektów, którymi si˛e zajmujemy, badź ˛ zmienne, pod które możemy obiekty podstawiać. Natomiast predykaty służa˛ do wyrażania własności termów i relacji zachodzacych ˛ pomi˛edzy termami. 3.2 Język rachunku predykatów. Formalizacja matematyki odbywa się przy użyciu tzw. języka rachunku predykatów. Alfabet języka rachunku predykatów jest sumą rozłączną A = L ∪ V ∪ F ∪ R ∪ I, gdzie L to zbiór spójników logicznych, V to zbiór zmiennych, F to zbiór symboli funkcyjnych, R to zbiór symboli relacyjnych, a I zbiór symboli interpunkcyjnych. Przyjmujemy, że zbiór symboli logicznych L obejmuje dokładnie trzy symbole: ¬, ∨ i ∀, a zbiór symboli interpunkcyjnych obejmuje parę nawiasów (, ) oraz przecinek. Ponadto zakładamy, że z każdym symbolem funkcyjnym i każdym relacyjnym związana jest liczba naturalna lub zero, zwana argumentowością symbolu. Zbiór symboli funkcyjnych o argumentowości k oznaczać będziemy Fk , a zbiór symboli relacyjnych o argumentowości k oznaczać będziemy Rk . Aby zdefiniować formuły języka rachunku predykatów, czyli jego słowa dopuszczalne, zdefiniujemy najpierw termy, odpowiadające w językach naturalnych rzeczownikom. 3.2. JĘZYK RACHUNKU PREDYKATÓW. 61 Definicja 3.2.1 Termy języka określone są przez następujące dwie reguły: t1) Termem języka jest każda nazwa będąca zmienną. t2) Ponadto, jeśli t1 , t2 , . . . tk są termami języka, a f jest symbolem operacji k-argumentowej, to f (t1 , t2 , . . . tk ) jest również termem języka. Przypadek ten obejmuje w szczególności wyróżnione elementy, które utożsamiamy z funkcjami zero-argumetnowymi. Definicja 3.2.2 Formuły języka predykatów określone są przez następujące dwie reguły: p1) Jeśli t1 , t2 , . . . tk dla k ­ n są termami, a r jest symbolem relacji k-argumentowej, to r(t1 , t2 , . . . tk ) jest formułą. Formułę taką nazywamy formułą atomową. p2) Jeśli ϕ i ψ są formułami, to ¬(ϕ), (ϕ ∨ ψ) oraz ∀x ϕ również są formułami. Potrzebne jest nam jeszcze pojęcie zmiennej wolnej w formule. Określają to następujące cztery reguły: Definicja 3.2.3 w1) Zmienna jest zmienną wolną w formule atomowej f (t1 , t2 , . . . tk ) jeśli występuje ona wśród termów t1 , t2 , . . . tn . w2) Zmienna jest zmienną wolną w formule postaci ¬(ϕ) jeśli jest ona zmienną wolną w formule ϕ. w3) Zmienna jest zmienną wolną w formule postaci (ϕ ∨ ψ) jeśli jest ona zmienną wolną przynajmniej w jednej z formuł ϕ, ψ. w4) Zmienna jest zmienną wolną w formule postaci ∀x(ϕ) jeśli jest ona zmienną wolną w formule ϕ i nie jest to zmienna występująca bezpośrednio po znaku kwantyfikatora. Aby zaznaczyć, że x jest zmienną wolną w formule ϕ, piszemy ϕ(x). Zbiór argumentów formuły to zbiór utworzony ze wszystkich zmiennych wolnych tej formuły. Mówimy, że zmienna x jest zmienną związaną w formule jeśli nie jest to zmienna wolna w tej formule. Na przykład w formule ∀x ∃y y > x + z zmienne x i y są związane, a zmienna z jest wolna. Formułę pozbawioną zmiennych wolnych nazywamy zdaniem. Formułę, która nie jest zdaniem nazywamy jest formą zdaniową. Formę zdaniową o niezwiązanych zmiennych x1 , x2 , . . . xn zapisujemy często w postaci ϕ(x1 , x2 , . . . xn ). Stosujemy również symbole ∧, ⇒, ⇔, ∃, ale traktujemy jako skróty: ϕ∧ψ ϕ⇒ψ := ¬ϕ ∨ ψ, ϕ⇔ψ := ∃x ϕ(x) 3.2.1 Interpretacje. := ¬(¬ϕ ∨ ¬ψ), (ϕ ⇒ ψ) ∧ (ψ ⇒ ϕ), := ¬∀x ¬ϕ(x). 62 ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ Definicja 3.2.4 • Interpretacją języka L w strukturze matematycznej A nazwiemy przypisanie λ, które z każdą zmienną x wiąże pewien obiekt λ[x] w dziedzinie struktury A, z każdym k-argumentowym symbolem funkcyjnym f pewną k-argumentową funkcję λ[f ] w dziedzinie struktury A, a z każdym k-argumentowym symbolem relacyjnym r pewną k-argumentową relację λ[r] w dziedzinie struktury A. • Powiemy, że interpretacja κ jest zgodna z λ, jeśli κ i λ przypisują to samo wszystkim symbolom funkcyjnym i relacyjnym. • Powiemy, że interpretacja κ pokrywa się z λ poza x, jeśli κ jest zgodna z λ i przypisuje to samo wszystkim zmiennym z wyjątkiem, co najwyżej, zmiennej x. Przykładem może być struktura składajaca ˛ si˛e ze zbioru liczb całkowitych jako dziedziny, liczb zero i jeden jako wyróżnionych elementów dziedziny, dwuargumentowych operacji dodawania i mnożenia dwóch liczb całkowitych i jednoargumentowej operacji brania liczby przeciwnej do danej oraz dwuargumentowej operacji silnej mniejszości liczb. Do jej opisania wystarczy j˛ezyk, w którym F0 = {0, 1}, F1 = {−}, F2 = {+, ∗}, R2 = {<}, a interpretacja przypisuje tym symbolom ich tradycyjne znaczenia, a zmiennym jakieś liczby ze zbioru liczb całkowitych. Zauważmy, że taki sam j˛ezyk wystarczy do opisania struktury obejmujacej ˛ liczby naturalne z zerem, liczby wymierne, czy liczby rzeczywiste. Jak zobaczymy, różnica tkwi nie w samym j˛ezyku, ale w interpretacji. Na przykład formuła ∀x 0 < x ∨ x < 0 ⇒ ∃y x ∗ y = 1 jest spełniona przy interpretacji w zbiorze liczb wymiernych, ale nie w zbiorze liczb całkowitych. Doprecyzujemy teraz co dokładnie oznacza, że formuła jest spełniona w pewnej interpretacji. Interpretację rozszerzamy na termy, przyjmując, że λ[f (t1 , t2 , . . . , tk )] := λ[f ](λ[t1 ], λ[t2 ], . . . , λ[tk ])]. Dla każdego k-argumentowego symbolu relacyjnego r i zestawu termów t1 , t2 , . . . , tk możemy postawić pytanie, czy w dziedzinie struktury A zachodzi relacja λ[r](λ[t1 ], λ[t2 ], . . . , λ[tk ]). Możliwe odpowiedzi są tylko dwie: albo relacja ta zachodzi, albo nie zachodzi. Wygodnie jest to kodować w zbiorze wartości logicznych B := {0, 1} poprzez rozszerzenie interpretacji λ na formuły atomowe według wzoru. ( 1 gdy λ[r](λ[t1 ], λ[t2 ], . . . , λ[tk ])] zachodzi, λ[r(t1 , t2 , . . . , tk )] := 0 gdy λ[r](λ[t1 ], λ[t2 ], . . . , λ[tk ])] nie zachodzi. Zróbmy jeszcze jeden krok dalej i rozszerzmy interpretację λ na dowolne formuły przyjmując: λ[¬ϕ] := λ[ϕ ∨ ψ] := λ[∀x ϕ] 1 − λ[ϕ], max(λ[ϕ], λ[ψ]), ( 1 gdy κ[ϕ] = 1 dla dowolnej interpretacji κ pokrywającej się z λ poza x, := 0 w przeciwnym razie. Liczbę λ[ϕ] określać będziemy wartością logiczną formuły ϕ przy interpretacji λ. Definicja 3.2.5 Będziemy mówili, że formuła ϕ przy interpretacji λ jest spełniona, jeśli λ[ϕ] = 1. W przeciwnym razie będziemy mówili, że formuła nie jest spełniona. Zatem zgodnie z przyjętym przez nas rozszerzeniem, formuła ¬ϕ jest spełniona przy interpretacji λ wtedy i tylko wtedy, gdy formuła ϕ nie jest spełniona. Podobnie, formuła ϕ ∨ ψ jest spełniona przy interpretacji λ wtedy i tylko wtedy, 3.2. JĘZYK RACHUNKU PREDYKATÓW. 63 gdy przynajmniej jedna z formuł ϕ, ψ jest spełniona. Z kolei formuła ∀x ϕ jest spełniona przy interpretacji λ wtedy i tylko wtedy, gdy formuła ϕ jest spełniona dla każdej interpretacji, która zmiennej x przypisuje dowolny obiekt z dziedziny struktury A, a pozostałym zmiennym i wszytkim symbolom relacyjnym i funkcyjnym to samo co interpretacja λ. Obserwacje te pokazują, że przyjęta przez nas interpretacja formuł nadaje symbolom ¬, ∨, ∀ znaczenie zgodne odpowiednio ze zwrotami "nieprawda, że", "albo", "dla każdego" z języka potocznego. Metatwierdzenie 3.2.6 Wartość logiczną formuł ¬ϕ, ϕ ∨ ψ, ϕ ∧ ψ, ϕ ⇒ ψ, ϕ ⇔ ψ przy interpretacji λ można wyznaczyć w oparciu o wartości logiczne formuł ϕ i ψ przy interpretacji λ zgodnie z tabelą ϕ ψ ¬ϕ ϕ∨ψ ϕ∧ψ ϕ⇒ψ ϕ⇔ψ 0 0 1 0 0 1 1 1 0 0 1 0 0 0 0 1 1 1 1 0 1 0 1 1 1 1 (3.1) Dowód: Dwa pierwsze wiersze powyższej tabeli otrzymujemy natychmiast podstawiając zera i jedynki do wzorów ... . Pozostałe wiersze otrzymujemy prostym rachunkiem w podobny sposób. Łatwo zauważyć, że przy pewnych interpretacjach ta sama formuła raz jest spełniona, a raz nie jest. Na przykład, rozważmy formuł˛e ∀x x + 1 > y. Wyst˛epuje w niej dokładnie jedna zmienna wolna, mianowicie y . Rozważmy interpretacj˛e w strukturze liczb naturalnych {1, 2, 3, . . .} z relacja˛ wi˛ekszości w roli > oraz operacja˛ dodawania w roli +, która zmiennej y przypisuje liczb˛e 5. Nie jest prawda,˛ że formuła x + 1 > 5 jest spełniona dla dowolnej liczby naturalnej x, bo na przykład nie jest spełniona przy przypisaniu zmiennej x liczby 3. Jednak formuła ta jest spełniona przy przypisaniu zmiennej y liczby 1. Rzeczywiście, dla dowolnej liczby naturalnej x zachodzi x + 1 > 1. Łatwo sprawdzić, że jest to jedyna liczba naturalna, która przypisana do y spełnia nasza˛ formuł˛e w dziedzinie liczb naturalnych. Natomiast przy interpretacji w strukturze liczb całkowitych nie znajdziemy żadnego przypisania zmiennej y liczby całkowitej, dla którego formuła ∀x x + 1 > y byłaby spełniona. Definicja 3.2.7 • Formułę ϕ nazywamy semantycznie prawdziwą w interpretacji λ, jeśli jest spełniona przy każdej interpretacji κ zgodnej z λ. • Formułę ϕ nazywamy semantycznie fałszywą w interpretacji λ, jeśli formuła ¬ϕ jest semantycznie prawdziwa w interpretacji λ. Zauważmy, że formuła, która nie jest semantycznie prawdziwa w interpretacji λ nie musi być logicznie fałszywa w tej interpretacji. Na przykład nie jest semantycznie prawdziwa formuła x>5 dla interpretacji λ przypisującej symbolowi > relację większości w dziedzinie liczb naturalnych, bo nie jest ona spełniona przy interpretacji κ zgodnej z λ, przypisującej zmiennej x liczbę 3. Zaprzeczenie tej formuły przy interpretacji λ też nie jest semantycznie prawdziwe, bo nie jest spełnione przy interpretacji przypisującej zmiennej x liczbę 8. Jeśli formuła jest zdaniem, to przy zadanej interpretacji musi być albo semantycznie prawdziwa, albo semantycznie fałszywa. Jest tak, bo w zdaniu nie ma zmiennych wolnych, a więc przypisanie obiektów zmiennym nie wpływa na spełnialność zdania. Zatem każde zdanie przy zadanej interpretacji jest semantycznie rozstrzygalne przy tej interpretacji. Definicja 3.2.8 Formułę nazywamy tautologią rachunku predykatów, jeśli jest semantycznie prawdziwa przy wszystkich interpretacjach. Mówimy też wtedy, że formuła jest logicznie prawdziwa. 64 ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ Natomiast, jeśli formuła ¬ϕ jest logicznie prawdziwa, to formułę ϕ nazywamy logicznie fałszywą. Podobnie jak w przypadku semantycznej prawdziwości, formuła, która nie jest logicznie prawdziwa nie musi być logicznie fałszywa. Może bowiem być przy pewnych interpretacjach, a przy innych być fałszywa. W przeciwieństwie do semantycznej prawdziwości/fałszywości dotyczny to również zdań. Na przykład zdanie ∀x x ­ 1 nie jest ani logicznie prawdziwe, ani logicznie fałszywe, bo jest semantycznie prawdziwe przy interpretacji ­ jako relacja ’większe lub równe’ w dziedzinie liczba naturalnych, ale nie jest semantycznie prawdziwe przy interpretacji ­ jako relacja ’większe lub równe’ w dziedzinie liczb całkowitych. Tautologie rachunku predykatów są podstawą wszelkich matematycznych rozumowań. Niestety, nie ma automatycznej metody rozstrzygania co jest, a co nie jest tautologią rachunku predykatów. Każda tautologia rachunku predykatów wymaga podania oddzielnie dla niej opracowanego uzasadnienia. Można to robić na poziomie metajęzyka, podając metadowód, odwołujący się do pojęcia interpretacji. Przykłady takich metadowodów podamy w rozdziale .... . Można to też robić na poziomie samego języka, podając dowody formalne, o czym porozmawiamy w rozdziale .... . Jest jednak pewna szczególna rodzina formuł, dla której jest możliwe automatyczne rozstrzygnięcie, czy formuła jest tautologią. Zajmiemy się nimi najpierw. 3.3 Rachunek zdań Niech ϕ będzie zdaniem języka L. Mówimy, że zdanie to jest złożone, jeśli ma postać ¬ψ lub ψ ∨ χ (ewentualnie ψ ∧ χ, ψ ⇒ χ, ψ ⇔ χ, jeśli spójników tych nie traktujemy jako skróty). Łatwo zauważyć, że wtedy ψ i χ też są zdaniami. Zdania ψ, χ nazywamy składnikami podstawowymi zdania ϕ. Składnik zdania φ definiujemy poprzez następujące dwie reguły: składnik podstawowy jest składnikiem oraz składnik składnika jest składnikiem. Zdanie, które nie jest zdaniem złożonym nazywamy zdaniem prostym. Składnik zdania ϕ, który jest zdaniem prostym nazywamy składnikiem prostym zdania φ. Zdanie proste albo ma postać r(t1 , t2 , . . . , tk ), gdzie r jest symbolem relacyjnym k-argumentowym, a t1 , t2 , . . . , tk są termami pozbawionymi zmiennych, albo ma postać ∀x ψ(x) (ewentualnie ∃x ψ(x), jeśli kwantyfikator ∃ nie jest traktowany jako skrót). W zdaniu złożonym kwantyfikatory, symbole relacyjne i termy, w szczególności zmienne, schowane są w jego składnikach prostych. Ze wzorów ... wynika, że wartość logiczną zdania ϕ przy zadanej interpretacji λ można obliczyć, jeśli znane są wartości logiczne jego składników prostych przy tej interpretacji. Obserwacja ta prowadzi do następującej koncepcji rachunku zdań. Definicja 3.3.1 Formułę nazywamy formułą rachunku zdań, jeśli nie ma w niej zmiennych, ani symboli funkcyjnych. Łatwo zauważyć, że wtedy nie ma w niej również symboli kwantyfikatorów, a jedynymi symbolami relacyjnymi są symbole relacyjne zeroargumentowe. Definicja 3.3.2 Język rachunku zdań to przypadek szczególny języka rachunku predykatów, który obejmuje wyłącznie formuły rachunku zdań. Przede wszystkim zauważmy, że formuła rachunku zdań zawsze jest zdaniem, a jego składniki proste są symbolami relacyjnymi zeroargumentowymi. W przpadku formuły rachunku zdań jej składniki proste określać będziemy też mianem zmiennych zdaniowych, bo ich interpretacja pozostaje bez związku z interpretacją zwykłych zmiennych. Tautologią rachunku zdań lub krótko tautologią nazywamy formułę rachunku zdań, która jest tautologią. Stwierdzenie, czy dana formuła rachunku zdań jest tautologią może być wykonane automatycznym rachunkiem. Przyjmijmy, że formuła ϕ rachunku zdań ma k składników prostych (zmiennych zdaniowych). Każda z tych zmiennych zdaniowych może przyjąć jedną z dwóch wartości logicznych. Łącznie mamy zatem 2k możliwych konfiguracji wartości tych zmiennych. Jak zauważyliśmy, wartość logiczna formuły rachunku zdań może być wyliczona z wartości logicznej jej składników prostych. 3.4. TAUTOLOGIE RACHUNKU PREDYKATÓW Prawo tożsamości: Prawa przemienności: Prawa łączności: Prawa rozdzielności: Prawa idempotentności: Prawo wyłączonego środka: Prawo podwójnej negacji: Prawa De Morgana: Prawo kontrapozycji: Prawo sylogizmu: Prawa pochłaniania: Prawo odrywania: 65 α⇔α α∨β⇔β∨α α∧β⇔β∧α (α ⇔ β) ⇔ (β ⇔ α) (α ∨ β) ∨ γ ⇔ α ∨ (β ∨ γ) (α ∧ β) ∧ γ ⇔ α ∧ (β ∧ γ) (α ∨ β) ∧ γ ⇔ (α ∧ γ) ∨ (β ∧ γ) (α ∧ β) ∨ γ ⇔ (α ∨ γ) ∧ (β ∨ γ) α∨α⇔α α∧α⇔α α ∨ ¬α ¬¬α ⇔ α ¬(α ∨ β) ⇔ ¬α ∧ ¬β ¬(α ∧ β) ⇔ ¬α ∨ ¬β α ⇒ β ⇔ ¬β ⇒ ¬α (α ⇒ β) ∧ (β ⇒ γ) ⇒ (α ⇒ γ) α ∧ (α ∨ β) ⇔ α α ∨ (α ∧ β) ⇔ α α ∧ (α ⇒ β) ⇒ β Tabela 3.1: Wybrane tautologie rachunku zdań Wystarczy zatem wyliczyć tę wartość dla wszystkich 2k możliwych konfiguracji. Jeśli w każdym przypadku otrzymamy wartość 1, to formuła ϕ jest tautologią rachunku zdań. W ten sposób łatwo można udowodnić następujące twierdzenie: Metatwierdzenie 3.3.3 Formy rachunku zdań w tabeli 3.1 są tautologiami. Tautologie rachunku zdań sa˛ nieocenione w rozumowaniach. Można si˛e do nich odwołać zawsze, bez wzgl˛edu na to jakie konkretnie zdania podstawimy za zmienne zdaniowe. Łatwo sprawdzić, że podstawiając w formule rachunku zdań za zmienne zdaniowe formuły języka predykatów dostajemy formułę języka predykatów. Mamy następujące twierdzenie. Twierdzenie 3.3.4 Niech ϕ będzie tautologią rachunku zdań. Niech α1 , α2 , . . . , αk będą wszystkimi, parami różnymi zmiennymi zdaniowymi tej tautologii. Dobierając do każdego αi pewną formułę rachunku predykatów ψi i podstawiając wszędzie w formule ϕ formułę ψi za zmienną αi otrzymujemy tautologię rachunku predykatów. Dowód: Niech ϕ0 będzie formułą otrzymaną z ϕ po podstawieniach i niech λ będzie ustaloną interpretacją. Niech λ0 oznacza interpretację, która zmiennej zdaniowej αi przypisuje wartość λ[ψi ]. Łatwo sprawdzić, że λ[ϕ0 ] = λ0 [ϕ]. Ale λ0 [ϕ] = 1, ϕ jest tautologią. Zatem λ[ϕ0 ] = 1 dla dowolnej interpretacji λ, co dowodzi, że również ϕ0 jest tautologią. 3.4 Tautologie rachunku predykatów Jak już wspomnieliśmy, w przypadku formuły rachunku predykatów nie ma mechanicznego sposobu sprawdzenia, czy jest ona tautologią. Przyjrzymy się teraz kilku najważniejszym tautologiom rachunku predykatów i podamy dla wybranych dowody na poziomie metajęzyka. 66 ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ Metatwierdzenie 3.4.1 Niech ϕ(x) będzie formułą, w której zmienna x jest wolna, a zmienna y nie występuje. Niech ϕ(y) oznacza formułę otrzymaną z ϕ przez podstawienie zmiennej y za zmienną x wszędzie tam gdzie x występuje jako zmienna wolna. Następujące formuły są tautologiami rachunku predykatów. ∀x ϕ(x) ⇔ ∀y ϕ(y), (3.2) ∃x ϕ(x) ⇔ ∃y ϕ(y), (3.3) ∀x ϕ(x) ⇒ ϕ(y). (3.4) Dowód: ... Metatwierdzenie 3.4.2 Niech ϕ będzie formułą o zmiennej wolnej x. Następujące formuły są tautologiami rachunku predykatów. ∀x ϕ(x) ⇔ ∃x ϕ(x), ¬∀x ϕ(x) ⇔ ∃x ¬ϕ(x), ¬∃x ϕ(x) ⇔ ∀x ¬ϕ(x). Metatwierdzenie 3.4.3 Niech ϕ, ψ będą formułami o zmiennej wolnej x. Następujące formuły są tautologiami rachunku predykatów. ∀x ϕ(x) ∧ ψ(x) ⇔ ∀x ϕ(x) ∧ ∀x ψ(x), ∃x ϕ(x) ∨ ψ(x) ⇔ ∃x ϕ(x) ∨ ∃x ψ(x), ∀x ϕ(x) ∨ ∀x ψ(x) ⇒ ∃x ϕ(x) ∧ ψ(x) ⇒ ∀x ϕ(x) ∨ ψ(x), ∃x ϕ(x) ∧ ∃x ψ(x). Ponadto, w ostatnich dwóch formułach symbolu implikacji nie można zastąpić symbolem równoważności. Metatwierdzenie 3.4.4 Niech ϕ będzie formułą o zmiennych wolnych x i y. Następujące formuły są tautologiami rachunku predykatów. ∀x ∀y ϕ(x, y) ⇔ ∀y ∀x ϕ(x, y), ∃x ∃y ϕ(x, y) ⇔ ∃y ∃x ϕ(x, y), ∃x ∀y ϕ(x, y) ⇒ ∀y ∃x ϕ(x, y). Ponadto, w ostatniej formule symbolu implikacji nie można zastąpić symbolem równoważności. Metatwierdzenie 3.4.5 Niech ϕ będzie formułą o zmiennej wolnej x, a ψ formułą, w której x nie występuje. Następujące formuły są tautologiami rachunku predykatów. ∀x (ϕ(x) ∧ ψ) ⇔ (∀x ϕ(x)) ∧ ψ, ∃x (ϕ(x) ∨ ψ) ⇔ (∃x ϕ(x)) ∨ ψ, ∀x (ϕ(x) ∨ ψ) ⇔ (∀x ϕ(x)) ∨ ψ, ∃x (ϕ(x) ∧ ψ) ⇔ (∃x ϕ(x)) ∧ ψ. 3.5. KONSEKWENCJA I DOWÓD FORMALNY 3.5 67 Konsekwencja i dowód formalny Niech Φ będzie pewnym skończonym zbiorem formuł języka L. Mówimy, że formuła ψ jest konsekwencją semantyczną zbioru Φ jeśli dla każdej interpretacji λ jeśli λ[φ] = 1 dla wszystkich φ ∈ Φ, to również λ[ψ] = 1. Fakt, że formuła ψ jest konsekwencją semantyczną zbioru Φ zapisujemy jako Φ |= ψ. Konsekwencji semantycznej nie jesteśmy w stanie sprawdzić w praktyce, bo wymaga to przeanalizowania nieskończonej liczby interpretacji. Dlatego interesuje nas alternatywny, skończony sposób weryfikowania zachodzenia konsekwencji. W tym celu zdefiniujemy konsekwencję syntaktyczną. Niech ϕ, ψ będą dowolnymi formułami. Przyjmujemy następujące dwie reguły dowodzenia: Reguła odrywania: Formuła ψ wynika z formuł ϕ i ϕ ⇒ ψ. Reguła uogólniania: Formuła ∀x ϕ wynika z formuły ϕ poprzez generalizację względem zmiennej x Wynikanie na mocy reguł dowodzenia określamy też mianem bezpośredniej konsekwencji. Definicja 3.5.1 Dedukcją lub wywodem ψ z Φ nazywamy ciąg formuł ψ1 , ψ2 , . . . ψn taki, że ψn = ψ oraz każda formuła ψk dla k = 1, 2, . . . n spełnia jeden z poniższych trzech warunków: 1) ψk ∈ Φ, 2) istnieją i, j < k takie, że ψk wynika z formuł ψi , ψj na mocy reguły odrywania, 3) istnieje i < k takie, że ψk wynika z formuły ψi na mocy reguły uogólniania poprzez generalizację względem zmiennej, która nie jest zmienną wolną w żadnej formule należącej do Φ. Ustalmy pewien zbiór formuł A, który nazywać będziemy zbiorem aksjomatów. Dedukcją lub wywodem ψ z Φ w oparciu o aksjomaty z A nazywamy wywód ψ z Φ ∪ A. W tym kontekście elementy Φ nazywamy przesłankami wywodu. Warto wyjaśnić, czemu przesłanki odróżniamy od aksjomatów. Od aksjomatów oczekujemy, by były semantycznie prawdziwe w pewnej interpretacji. Od przesłanek tego nie oczekujemy. Jak zobaczymy, przesłanki stanowia˛ wygodnie narz˛edzie pomocnicze w rozumowaniach, ale w ostatecznym rozrachunku interesuja˛ nas wywosy nie wykorzystujace ˛ przesłanek. Jeśli istnieje dedukcja ψ z ϕ w oparciu o aksjomaty z A to mówimy, że ψ jest syntaktyczną konsekwencją Φ i piszemy Φ `A ψ lub krótko Φ ` ψ gdy zbiór aksjomatów A jest znany z kontekstu. W dalszym ciągu zakładamy, że zbiór aksjomatów A obejmuje wszystkie formuły podpadające pod następujące schematy, w których ϕ, ψ, χ są formułami języka L: (A1) ϕ ∨ ϕ ⇒ ϕ, (A2) ϕ ⇒ ϕ ∨ ψ, (A3) ϕ ∨ ψ ⇒ ψ ∨ ϕ, (A4) (ϕ ⇒ ψ) ⇒ (χ ∨ ϕ ⇒ χ ∨ ψ), (A5) (∀x ϕ(x)) ⇒ ϕ(y), (A6) ∀x (ϕ ⇒ ψ) ⇒ (ϕ ⇒ ∀x ψ(x)), przy czym zakładamy, że w (A8) x nie jest zmienną wolną w ϕ. 68 ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ Definicja 3.5.2 • Jeśli ψ ma dedukcję z samych aksjomatów, to znaczy ∅ ` ψ to piszemy krótko `ψ i mówimy, że ψ jest twierdzeniem teorii opartej o aksjomaty ze zbioru A. • Jeśli A obejmuje wyłącznie formuły ze schematów (A1) − (A6) to mówimy, że ψ jest twierdzeniem rachunku predykatów. Metatwierdzenie 3.5.3 (o dedukcji). Syntaktyczna konsekwencja Φ ` ϕ ⇒ ψ zachodzi wtedy i tylko wtedy gdy Φ ∪ {ϕ} ` ψ. Zbiór formuł Φ nazywamy sprzecznym, jeżeli dla pewnej formuły χ jest Φ ` χ ∧ ¬χ. Jak pokazuje poniższe metatwierdzenie, ze sprzecznego zbioru formuł można wydedukować dowolną formułę. Metatwierdzenie 3.5.4 (o sprzeczności) Jeśli Φ jest sprzeczny, to dla dowolnej formuły χ jest Φ ` χ. Tym niemniej pojęcie sprzecznego zbioru formuł jest użyteczne w dowodzeniu. Metatwierdzenie 3.5.5 (o dedukcji nie wprost). Syntaktyczna konsekwencja Φ ` ψ zachodzi wtedy i tylko wtedy gdy Φ ∪ {¬ψ} jest sprzeczny. Metatwierdzenie 3.5.6 ( o dedukcji koniunkcji) Jeśli Φ ` ψ1 i Φ ` ψ2 to Φ ` ψ1 ∧ ψ2 Dowód: Zdanie ψ1 ∧ψ2 ⇔¬(ψ1 ⇒¬ψ2 ) jest tautologią wystarczy więc pokazać, że Φ`¬(ψ1 ⇒¬ψ2 ). Na mocy twierdzenia o dedukcji nie wprost wystarczy pokazać, że Φ0 := Φ ∪ {ψ1 ⇒ ¬ψ2 } jest sprzeczny. Z założenia wiemy, że ψ1 oraz ψ2 mają wywód z Φ. Wypisujemy te wywody jeden po drugim i na końcu dopisujemy ψ1 ⇒ ¬ψ2 , ¬ψ2 , co pokazuje, że Φ0 ` ¬ψ2 . Oczywiście Φ0 ` ψ2 . Zatem Φ0 jest sprzeczny. Metatwierdzenie 3.5.7 ( o dedukcji przez przypadki) Jeśli Φ ∪ {ϕ} ` ψ i Φ ∪ {¬ϕ} ` ψ to Φ ` ψ. Dowód: Na mocy twierdzenia o dedukcji Φ ` ϕ ⇒ ψ oraz Φ ` ¬ϕ ⇒ ψ. Na mocy twierdzenia o dedukcji koniunkcji Φ ` ϕ ⇒ ψ ∧ ¬ϕ ⇒ ψ. Wykorzystując tautologię (ϕ ⇒ ψ ∧ ¬ϕ ⇒ ψ) ⇒ ψ otrzymujemy Φ ⇒ ψ. Następujące ważne metatwierdzenie, pochodzące od K. Gödela, pozostawimy bez dowodu. Metatwierdzenie 3.5.8 (o pełności rachunku predykatów, K. Gödel, 1930) Dla dowolnego zbioru formuł Φ i formuły ψ formuła ψ jest semantyczną konsekwencją Φ wtedy i tylko wtedy gdy ψ jest syntaktyczną konsekwencją Φ. W szczególności formuła jest twierdzdeniem rachunku predykatów wtedy i tylko wtedy gdy jest tautologią rachunku predykatów. 3.6. TEORIE AKSJOMATYCZNE 69 Rysunek 3.1: Giuseppe Peano, 1858-1932. Źródło: Wikipedia Metatwierdzenie 3.5.9 ( o nazywaniu istniejących obiektów ) Niech ϕ(u) i ψ(u) będą formułami o zmiennej wolnej u Jeśli ϕ(u) ` ψ(u) i `∃u ϕ(u) to `∃u ϕ(u) ∧ ψ(u). Dowód: Na mocy twierdzenia o dedukcji mamy `ϕ(u) ⇒ ψ(u). Ponieważ zbiór przesłanek jest pusty, więc w oparciu o regułę uogólniania mamy też `∀u ϕ(u) ⇒ ψ(u) co jest równoważne `∀u ¬ϕ(u) ∨ ψ(u). Dowodząc nie wprost formułę ∃u ϕ(u) ∧ ψ(u), mamy ∀u ¬ϕ(u) ∨ ¬ψ(u). Zatem ∀u (¬ϕ(u) ∨ ¬ψ(u)) ∧ (¬ϕ(u) ∨ ψ(u)). Wykorzystując rozdzielność koniunkcji względem alternatywy otrzymujemy ∀u ¬ϕ(u) ∧ ¬ϕ(u) ∨ ¬ϕ(u) ∧ ψ(u) ∨ ¬ψ(u) ∧ ¬ϕ(u) ∨ ¬ψ(u) ∧ ψ(u)). Stąd wnosimy, że ∀u ¬ϕ(u), czyli z praw de Morgana ¬∃u ϕ(u) co przeczy przyjętemu założeniu. 3.6 Teorie aksjomatyczne Wiele matematycznych rozważań można sformalizować w oparciu o rachunek predykatów wzbogacony o dodatkowe, pozalogiczne aksjomaty, charakterystyczne dla rozważanej teorii. Przykład 3.6.1 Jako pierwszy przykład rozważmy teorię identyczności, która sama w sobie nie jest bardzo ciekawa, ale jest potrzebna praktycznie w każdej innej teorii, choć akurat, jak zobaczymy, w teorii mnogości identyczność nie musi być pojęciem pierwotnym, ale można ją zdefiniować. Do opisania teorii identyczności przyjmuje się jeden wyróżniony symbol relacyjny =∈ R2 natomiast dopuszcza się dowolne inne symbole relacyjne i dowolne symbole funkcyjne. Przyjmuje się następujące aksjomaty I1) ∀x x = x, I2) ∀x∀x x = y ⇒ y = x, I3) ∀x∀x∀z x = y ∧ y = z ⇒ x = z. I4) dla każdego symbolu funcyjnego f ∈ Fn i dla każdego i = 1, 2, . . . n ti = t0i ⇒ f (t1 , . . . , ti−1 , ti , ti+1 , . . . , tn ) = f (t1 , . . . , ti−1 , t0i , ti+1 , . . . , tn ) I5) dla każdego symbolu relacyjnego r ∈ Fn różnego od symbolu równości i dla każdego i = 1, 2, . . . n ti = t0i ⇒ (r(t1 , . . . , ti−1 , ti , ti+1 , . . . , tn ) ⇔ r(t1 , . . . , ti−1 , t0i , ti+1 , . . . , tn )) . 70 ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ Przykład 3.6.2 Jako drugi przykład podajmy formalizację liczb naturalnych z zerem, pochodzącą od włoskiego matematyka Giuseppe Peano (rys. 3.1). Do jej opisania wystarcza język z jednym symbolem relacyjnym =∈ R2 , z jednym symbolem funkcyjnym zeroargumentowym 0 ∈ F0 interpretowanym jako liczba zero i jednym symbolem jednooargumentowym 0 ∈ F1 interpretowanym jako operacja wzięcia kolejnej liczby naturalnej. Peano wykazał, że arytmetykę liczb naturalnych można opisać w takim języku, przyjmując, obok aksjomatów teorii identyczności dla symbolu = zestaw aksjomatów • ∀n ¬(n0 = 0), • ∀n∀m n0 = m0 ⇒ n = m, • dla każdej formuły ϕ zachodzi (ϕ(0) ∧ ∀n ϕ(n) ⇒ ϕ(n0 )) ⇒ ∀n ϕ(n) Na podstawie tych aksjomatów w szczególności można zdefiniować operacje dodawania, mnożenia i porównywania liczb naturalnych i udowodnić ich własności. Dowodem formuły w teorii aksjomatycznej jest jej dedukcja ze zbioru aksjomatów. Formułę posiadającą dowód nazywa się twierdzeniem tej teorii. Teorię nazywa się niesprzeczną, jeżeli jej zbiór aksjomatów jest niesprzeczny. Teorię nazywa się zupełną, jeśli dla każdego zdania tej teorii albo ono albo jego zaprzeczenie jest twierdzeniem tej teorii. Program Hilberta zakładał, że po sformalizowaniu kluczowych teorii matematycznych uda się przeprowadzić dowody ich niesprzeczności i zupełności w oparciu o samą analizę metamatematyczną formalnego języka te teorie opisującego. Są dwie metody dowodzenia niesprzeczności: metamatematyczna, poprzez czysto formalną analizę języka opisującego teorię, której niesprzeczność chcemy udowodnić oraz semantyczna, w której konstruujemy model dla teorii, której niesprzeczność dowodzimy na gruncie innej, prostszej teorii, której niesprzeczność zakładamy. Ten drugi sposób jest relatywny: niesprzeczność jakiejś teorii, możliwie najprostszej, musimy założyć. W 1930 roku Kurt Gödel pokazał, że metamatematyczny dowód niesprzeczności teorii matematycznej dostatecznie bogatej, by zawierać arytmetykę liczb naturalnych może być przeprowadzony jedynie na gruncie teorii bogatszej od tej, której niesprzeczność chcemy udowodnić. Jest to jeszcze gorsze od dowodu relatywnego. Co więcej, Gödel pokazał też, że każda sformalizowana teoria matematyczna dostatecznie bogata by zawierać arytmetykę liczb naturalnych, jeśli jest niesprzeczna, to jest niezupełna. Te dwa twierdzenia Gödla spowodowały, że plan Hilberta okazał się nie do zrealizowania w skali o jakiej Hilbert marzył. Tym niemniej, formalizacja teorii matematycznych została przez matematyków zaakceptowana jako najlepszy sposób unikania paradoksów. Co więcej, dowodzenie niesprzeczności matematycznych teorii poprzez konstrukcje modelu w teorii prostszej sprawiło, że dziś praktycznie cała matematyka została osadzona na gruncie teorii mnogości, jako tej najbardziej elementarnej teorii matematycznej. 3.7 Formalizm w praktyce matematycznej. Jedynie dowód formalny daje nam pewność, że formuła, którą udowodniliśmy rzeczywiście jest twierdzeniem. Z drugiej strony dowód formalny, nawet jeśli zawiera komentarz wyjaśniający co z czego wynika, jest na ogół długi, męczący w czytaniu i najczęściej nie pozwala zrozumieć jak został wymyślony, a w konsekwencji nie sprzyja budowaniu intuicji związanych z dowodzonym twierdzeniem. Matematyk wprawny w konstruowaniu dowodów często woli wymyślić dowód własny niż zrozumieć czyjś dowód zapisany czysto formalnie. Dlatego zazwyczaj dowody w literaturze matematycznej są swego rodzaju kompromisem pomiędzy formalizmem i czytelnością. To, którędy przebiega kompromis zależy od przygotowania czytelnika, do którego adresowany jest tekst. Typowy zapis dowodu jest raczej mniej lub bardziej szczegółowym szkicem, jak uzyskać dowód formalny. Szkic jednak powinien być na tyle precyzyjny, by czytelnik w oparciu o swoje doświadczenie mógł bez problemu uzupełnić brakujące szczegóły. Jak wspominaliśmy, matematycy stosują mnóstwo sztuczek, by mieć do dyspozycji bardzo dużo różnych symboli, a w konsewkencji dużo różnych zmiennych. Choć teoretycznie może być on dowolnie duży (na przykład można dodać dowolnie dużo ptaszków), w praktyce i tak jest on zbyt mały, by uniknąć kolizji. Dlatego wygodnie jest operować pojęciem zakresu 3.8. SCHEMATY DOWODOWE. 71 występowania zmiennej. Przyjmujemy, że zakresem występowania zmiennej związanej jest najmniejsza podformuła formuły, której związanie dotyczy. W przypadku zmiennej wolnej zakres jej występowania będziemy rozpoczynać zwrotem "Niech x będzie takie, że ..." lub x := ... czytane "Zdefiniujmy x jako ..." lub jakimś zwrotem o tym samym znaczeniu. Zakres występowania takiej nazwy obejmuje wszsytkie formuły od użycia tego zwrotu aż do ponownego użycia tego zwrotu, które to rozpoczyna nowy zakres. Teoretycznie, wymieniając zmienne w różnych zakresach na nowe tak by nie było powtórzeń, możemy się pozbyć powtarzających się zmiennych o różnych znaczeniach. Aby uniknąć powtarzania ciągle tych samych formuł, wprowadza się do tekstu matematycznego definicje. Od strony formalnej definicje to tylko skróty. Do definiowania używać będziemy symbolu :⇔ lub ⇔ :, w którym po stronie dwukropka umieszczać będziemy to co definiujemy, a po stronie drugiej to jak definiujemy. Od strony praktycznej dobrze dobrane definicje są nieocenione, bo sprzyjają budowaniu stosownych intuicji. W następnych rozdziałach przedstawimy w miarę formalnie zarys teorii mnogości. Oczywiście podstawowym celem będzie dowodzenie twierdzeń. Będzie ich dużo więc wygodnie jest nieco rozszerzyć terminologię dotyczącą twierdznenia. Jeśli dowód twierdzenia jest stosunkowo prosty to samo twierdzenie określa się mianem uwaga. Klasyczne słowo twierdzenie matematcy rezerwują dla szczególnie ważnych twierdzeń. Twierdzenia, których rola jest głównie pomocnicza określa się mianem lematu. Twierdzenia wynikające bezpośrednio z wcześniej udowodnionego innego twierdzenia określa się mianem wniosku. 3.8 Schematy dowodowe. Jak już wspomnieliśmy, w codziennej praktyce matematycznej wypisywanie kompletnych formalnych dowodów jest niewykonalne. Najczęściej zamiast kompletnych dowodów podajemy mniej lub bardziej dokładne szkice dowodów, opierając się o różnego rodzaju schematy dowodowe. Schemat dowodowy to pewien sposób rozumowania, o którym wiadomo, że może zostać zastąpiony formalnym dowodem. Ponadto schemat dowodowy zazwyczaj zawiera komentarze, które czytelnikowi mają ułatwić ustalenie na jakiej podstawie konkretna formuła ma prawo znaleźć się w dowodzie. Co więcej, formuły często w części lub całości zastępujemy ich słownymi opisami, bo ułatwia czytanie. Do najważniejszych schematów należy zaliczyć Dowód wprost. Ten schemat oznacza, że szkicujemy bezpośredni dowód, a więc podajemy kolejne, choć zazwyczaj nie wszystkie, formuły jakie znajdują się w dowodzie formalnym. Dowód implikacji. Jeśli formuła ma postać ϕ⇒ψ to na mocy metatwierdzenia 3.5.3 wystarczy podać wywód formuły ψ z przesłanki ϕ. Dowód przez przypadki. Jeśli podamy wywód formuły θ z przesłanki ϕ oraz wywód z formuły γ z przesłanki ψ i udowodnimy ϕ ∨ ψ, to wiemy z metatwierdzenia 3.5.7, że formuła θ posiada dowód. Dowód formuły ∀x ∈ A ϕ(x). Aby udowodnić taką formułę wystarczy podać wywód formuły ϕ(x) z przesłanki x ∈ A i zastosować regułę generalizacji. 72 ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ Rozdział 4 Elementy teorii mnogości 4.1 Formalizm teorii mnogości Jedna˛ z metod sprawdzania niesprzeczności aksjomatów teorii jest pokazanie, że aksjomaty te sa˛ twierdzeniami innej teorii, której niesprzeczność już udowodniono, albo przynajmniej teorii, w której niesprzeczność aksjomatów budzi mniej watpliwości. ˛ W pierwszym dwudziestoleciu XX wieku teoria zbiorów, w j˛ezyku polskim najcz˛eściej określana mianem teoria mnogości, stała si˛e fundamentem głównego nurtu współczesnej matematyki, jako najbardziej elementarna teoria, w której weryfikować można aksjomaty bardziej zaawansowanych teorii. Twórca˛ teorii mnogości był niemiecki matematyk Georg Cantor (rys. 4.1). Formalizacja teorii mnogości opiera się na języku predykatów. Nie są potrzebne symbole funkcyjne i jest tylko jeden symbol relacyjny: ∈ - symbol przynależności do zbioru. Tak więc formuła x∈y będzie przez nas intepretowana jako stwierdzenie, że x jest elementem zbioru y. Przyjmujemy też od razu skrót x 6∈ y :⇔ ¬x ∈ y. Aby nie mnożyć pojęć, wygodnie jest przyjąć, że wszystkie zmienne oznaczają zbiory. W szczególności, jeśli x ∈ y to nie tylko y jest zbiorem, ale również x jest zbiorem. Takie podejście jest nieco zaskakujące, ale studiując teorię mnogości szybko się z nim oswajamy, uświadamiając sobie, że jest wygodne, bo nie mnoży pojęć, a nie ma w nim nic niebezpiecznego. 4.1.1 Podstawowe definicje i oznaczenia. Na początek w formalnych formułach będziemy używać wyłącznie małych liter z końca alfabetu: t, u, v, w, x, y, z dla oznaczenia zbiorów, dla podkreślenia, że chodzi o zmienne języka formalnego. Na codzień jest to jednak niewygodne, więc niebawem trochę rozluźnimy tę konwencję. Definicja 4.1.1 Mówimy, że zbiór x zawiera się w zbiorze y i piszemy x ⊂ y jeżeli ∀t t ∈ x ⇒ t ∈ y. Uwaga 4.1.2 Mamy ∀x x ⊂ x. 73 74 ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI Rysunek 4.1: Georg Cantor, 1845-1918. Źródło: Wikipedia Dowód: Oto kolejne formuły dowodu formalnego: 1. ¬w ∈ x ∨ w ∈ x podstawienie do tautologii wyłączonego środka 2. w ∈ x ⇒ w ∈ x rozpisanie przy pomocy znaku implikacji 3. ∀w w ∈ x ⇒ w ∈ x na podstawie reguły generalizacji 4. x ⊂ x wykorzystanie definicji zawierania się zbiorów 5. ∀x x ⊂ x ponownie na podstawie reguły generalizacji. Uwaga 4.1.3 Mamy ∀x ∀y ∀z (x ⊂ y ∧ y ⊂ z ⇒ x ⊂ z). Dowód: Pokażemy najpierw, że {x ⊂ y ∧ y ⊂ z, w ∈ x} ` w ∈ z. Dowód formalny tego wnioskowania wygląda następująco: 1. x ⊂ y ∧ y ⊂ z przesłanka 2. w ∈ x przesłanka 3. x ⊂ y ∧ y ⊂ z ⇒ x ⊂ y podstawienie do tautologii ϕ ∧ ψ ⇒ ϕ 4. x ⊂ y z 1 i 3 na podstawie reguły odrywania 5. ∀t t ∈ x ⇒ t ∈ y rozpisanie 4 z definicji 6. w ∈ x ⇒ w ∈ y na podstawie tautologii (3.4) 7. w ∈ y z 2 i 6 na podstawie reguły odrywania 8. x ⊂ y ∧ y ⊂ z ⇒ y ⊂ z podstawienie do tautologii ϕ ∧ ψ ⇒ ψ 9. y ⊂ z z 1 i 8 na podstawie reguły odrywania 10. ∀t t ∈ y ⇒ t ∈ z rozpisanie 9 z definicji 11. w ∈ y ⇒ w ∈ z na podstawie tautologii (3.4) 12. w ∈ z z 7 i 11 na podstawie reguły odrywania Na podstawie metatwierdzenia 3.5.3 wnosimy, że {x ⊂ y ∧ y ⊂ z} ` w ∈ x ⇒ w ∈ z. Ponownie z metatwierdzenia 3.5.3 dostajemy `(x ⊂ y ∧ y ⊂ z) ⇒ (w ∈ x ⇒ w ∈ z), 4.1. FORMALIZM TEORII MNOGOŚCI 75 czyli, że formuła (x ⊂ y ∧ y ⊂ z) ⇒ (w ∈ x ⇒ w ∈ z) posiada dowód. Na podstawie reguły generalizacji na końcu tego dowodu możemy dopisać formułę ∀w (x ⊂ y ∧ y ⊂ z) ⇒ (w ∈ x ⇒ w ∈ z). Rozpisując pierwszą implikację z definicji mamy ∀w ¬(x ⊂ y ∧ y ⊂ z) ∨ (w ∈ x ⇒ w ∈ z). Wykorzystując przemienność alternatywy oraz tautologię 3.5 mamy ¬(x ⊂ y ∧ y ⊂ z) ∨ ∀w (w ∈ x ⇒ w ∈ z) co można ponownie zapisać przy pomocy implikacji jako (x ⊂ y ∧ y ⊂ z) ⇒ ∀w (w ∈ x ⇒ w ∈ z), a stosując definicję zawierania się zbiorów jako (x ⊂ y ∧ y ⊂ z) ⇒ x ⊂ z. Stusując teraz trzykrotnie regułę generalizacji otrzymujemy tezę. W dalszym ciągu trochę rozluźnimy konwencję oznaczania zbiorów i uczynimy ją nieco bardziej intuicyjną. Nowa konwencja będzie następująca. O zbiorach, które jedynie formalnie są zbiorami, ale "nie zaglądamy im do środka", tzn. nie interesują nas ich elementy, ale wyłącznie one same w roli elementów innych zbiorów, mówić będziemy ’obiekty’ lub ’elementy’. Dla takich zbiorów używać będziemy liter małych podobnie jak do tej pory, choć niekoniecznie z końca alfabetu. Słowo ’zbiór’ rezerwujemy dla "zwykłych" zbiorów, a więc takich, których elementom nie zaglądamy do środka. Na oznaczenie takich zbiorów używać będziemy drukowanych dużych liter A, B, ... X, Y , Z. W przypadku zbiorów, których elementy są zbiorami w tym znaczniu, że zaglądamy im do środka, a więc interesują nas ich elementy, używać będziemy określenia ’rodzina zbiorów’. Rodziny zbiorów oznaczać będziemy dużymi literami pisanymi A, B, ... X , Y, Z. Oczywiście mogą się pojawić i pojawią się rodziny zbiorów rzędu drugiego, a więc rodziny, których elementy same w sobie są rodzinami, rodziny rzędu trzeciego, których elementy są rodzinami rzędu drugiego itd. W takich przypadkach nasz system oznaczeń będzie nieco odbiegać od przyjętej konwencji, ale nie powinno to prowadzić do nieporozumień. Podkreślmy, że ten system oznaczeń ma jedynie na celu ułatwienie czytania formalnego tekstu, bo dla samej treści to, jakie stosujemy oznacznia nie ma zupełnie znaczenia. Definicja 4.1.4 Mówimy, że zbiory X i Y są identyczne lub równe jeżeli X ⊂ Y ∧ Y ⊂ Y. Piszemy wtedy X = Y . Mówimy, że zbiory X i Y są różne i piszemy X 6= Y jeżeli ¬X = Y . Zauważmy, że Uwaga 4.1.5 X = Y ⇔ (∀z z ∈ X ⇔ z ∈ Y ) 76 ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI Uwaga 4.1.6 Identyczność zbiorów ma następujące trzy własności ∀x ∀x∀y ∀x∀y∀z x = x, (4.1) x = y ⇒ y = x, (4.2) x = y ∧ y = z ⇒ x = z. (4.3) Dowód: ... Wygodnie jest jeszcze wprowadzić dwa synonimy zwrotu ’zawiera się’. Definicja 4.1.7 Mówimy, że X jest podzbiorem zbioru Y jeżeli X ⊂ Y . Mówimy, że X jest podzbiorem właściwym zbioru Y i piszemy X ( Y , jeżeli X ⊂ Y i X 6= Y . Mówimy, że X jest nadzbiorem zbioru Y i piszemy X ⊃ Y jeżeli Y ⊂ X. Mówimy, że X jest nadzbiorem właściwym zbioru Y i piszemy X ) Y , jeżeli X ⊃ Y i X 6= Y . Często udaje się pokazać nie tylko istnienie obiektu x o własności ϕ(x), ale również fakt, że obiekt ten jest dokładnie jeden w znaczeniu, że jeśli ϕ(x1 ) i ϕ(x2 ) to x1 = x2 . Wygodnie jest wprowadzić skrót na oznaczenie takiej sytuacji. Przyjmujemy więc następujące oznaczenie ∃!x ϕ(x) :⇔ ∃x ϕ(x) ∧ (∀y∀z ϕ(y) ∧ ϕ(z) ⇒ y = z), a znak ∃! czytamy ’istnieje dokładnie jeden’. Wygodnie jest też wprowadzić oznaczenie na przypadek gdy kwantyfikator odnosimy tylko do elementów pewnego zbioru X. 4.2 ∀x ∈ X ϕ(x) :⇔ ∀x x ∈ X ⇒ ϕ(x) ∃x ∈ X ϕ(x) :⇔ ∃x x ∈ X ∧ ϕ(x) Formuły zbiorotwórcze. Rozważmy formułę ϕ(x) o dokładnie jednej zmiennej wolnej x. Naturalne jest pytanie, czy istnieje zbiór X, którego elementami są dokładnie takie x, dla których formuła ϕ(x) jest spełniona. Formalnie, jest to pytanie czy formuła ∃X ∀x x ∈ X ⇔ ϕ(x) (4.4) jest spełniona. Powiemy, że formuła ϕ jest zbiorotwórcza, jeżeli formuła (4.4) jest spełniona. Na wczesnym etapie tworzenia teorii mnogości bezkrytycznie przyjmowano, że każda formuła jest zbiorotwórcza. Jednak w 1901 roku brytyjski filozof Bertrand Russel (ryc. 4.2 zauważył, że może to prowadzić do sprzeczności. Dokładniej, Russel zauważył, że formuła ϕ(x) := x 6∈ x nie może być zbiorotwórcza. Rzeczywiście, załóżmy, że istnieje zbiór X takich zbiorów x, że x 6∈ x. Mamy dwa możliwe przypadki: albo X jest swoim elementem, albo nie jest. Jeśli X ∈ X, to na mocy definicji X mamy X 6∈ X. Jeśli X 6∈ X to znów na mocy definicji X mamy X ∈ X. Otrzymujemy więc sprzeczność, zwaną paradoksem Russela. Sprzeczności związanych z paradoksem Russela udało się uniknąć poprzez aksjomatyzację teorii mnogości, w której jedynie dla wybranych formuł na mocy aksjomatu przyjmuje się, że są zbiorotwórcze. Uwaga 4.2.1 Jeśli ϕ jest zbiorotwórcza, to zbiór X w formule (4.4) jest wyznaczony jednoznacznie. Formalnie: ∃!X ∀x x ∈ X ⇔ ϕ(x) 4.2. FORMUŁY ZBIOROTWÓRCZE. 77 Rysunek 4.2: Bertrand Russell, 1872-1970. Źródło: Wikipedia Dowód: Rozpisując oznaczenie ∃! stwierdzamy, że musimy pokazać koniunkcję dwóch formuł ∃X ∀x x ∈ X ⇔ ϕ(x) oraz ∀X1 ∀X2 (∀x x ∈ X1 ⇔ ϕ(x)) ∧ (∀x x ∈ X2 ⇔ ϕ(x)) ⇒ X1 = X2 . Pierwsza wynika z założenia, że formuła ϕ jest zbiorotwórcza. Aby pokazać drugi, przyjmijmy, że zbiory X1 i X2 są takie, że ∀x x ∈ X1 ⇔ ϕ(x) i ∀x x ∈ X2 ⇔ ϕ(x). Wtedy ∀x x ∈ X1 ⇔ x ∈ X2 i z uwagi 4.1.5 dostajemy, że X1 = X2 . Zbiór X, którego istnienie postuluje formuła (4.4) oznaczamy { x | ϕ(x) }. (4.5) Podkreślmy, że w oznaczeniu tym zmienną x należy traktować jak zmienną związaną, bo zastąpienie jej inną zmienną daje ciągle ten sam zbiór. Oznaczenie (4.5) zwane jest wyrażeniem klasowym. Nazwa ta bierze się stąd, że oznaczenie (4.5) bywa stosowane również wtedy, gdy formuła ϕ nie jest zbiorotwórcza. Mówi się wtedy, że definiuje ono klasę. Pozwala to zastąpić zwrot ’formula ϕ jest zbiorotwórcza’ równoważnym mu zwrotem ’klasa { x | ϕ(x) } jest zbiorem’. Pojęcie klasy też może być sformalizowane, my jednak nie będziemy tego robić ograniczając się jedynie do przyjęcia zasady, że wprowadzając oznaczenie F := { x | ϕ(x) } w przypadku klasy, która nie jest zbiorem, ograniczymy się jedynie do zapisów x ∈ F, które są równoważne formalnemu zapisowi ϕ(x). W szczególności używać będziemy oznaczenia V := { x | x = x } na tak zwaną klasą pełną. Jak zobaczymy, klasa ta też nie jest zbiorem. Natomiast zapis x ∈ V oznacza po prostu tyle, że x jest zbiorem. Pojęcie zbiorotwórczości można rozważać dla formuły o wielu zmiennych wolnych. Dokładniej, jeśli zmiennymi wolnymi w formule ϕ są: wyróżniona zmienna x oraz pozostałe zmienne x1 , x2 , . . . xk , to mówimy, że ϕ jest zbiorotwórcza względem x jeśli spełniona jest formuła ∀x1 ∀x2 · · · ∀xk ∃X ∀x x ∈ X ⇔ ϕ(x, x1 , x2 , . . . xk ). 78 ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI Rysunek 4.3: Ernst Zermelo, 1871-1953 i Abraham Fraenkel, 1891-1965. Źródło: Wikipedia 4.3 Aksjomaty teorii mnogości. Zbiór aksjomatów teorii mnogości, na którym się oprzemy, zaproponował matematyk niemiecki Ernst Zermelo w roku 1908. W kształtowanie się aksjomatów teorii mnogości istotny wkład miał też izraelski matematyk Abraham Fraenkel (rys. 4.3). W rozdziale tym zaprezentujemy jeden z wariantów wywodzącej się od tych matematyków aksjomatyki teorii mnogości zwanej aksjomatyką Zermelo-Fraenkla. ZF1. Aksjomat jednoznaczności. ∀x ∀y x = y ⇒ (∀A x ∈ A ⇔ y ∈ A). Aksjomat jednoznaczności mówi, że jeśli dwa zbiory są identyczne, to jeden z nich może być elementem jakieś rodziny wtedy i tylko wtedy gdy również drugi z nich jest elementem tej rodziny. ZF2. Aksjomat zbioru pustego. Klasa { x | x 6= x } jest zbiorem. Formalnie ∃E ∀x x ∈ E ⇔ x 6= x. Zbiór, którego istnienie postuluje aksjomat zbioru pustego oznaczamy ∅ i nazywamy zbiorem pustym. Nazwa tę uzasadnia następująca uwaga. Uwaga 4.3.1 ∀x x 6∈ ∅. Dowód: Ustalmy dowolne x. Ze wzoru (4.1) wnosimy, że x = x. Zatem x 6∈ ∅. Generalizując względem x otrzymujemy tezę. Powiemy, że formuła ϕ(x, y) o zmiennych wolnych x i y ma własność jednoznaczności względem y, jeżeli ∀x∃z∀y ϕ(x, y) ⇔ y = z. Nasz kolejny aksjomat, to w rzeczywistości schemat, który dostarcza po jednym aksjomacie dla każdej formuły ϕ(x, y) z własnością jednoznaczności względem y. 4.3. AKSJOMATY TEORII MNOGOŚCI. 79 ZF3. Schemat aksjomatów zastępowania. Dla każdej formuły ϕ o zmiennych wolnych x, y i własności jednoznaczności względem Y i dla każdego zbioru A klasa { y | ∀x ∈ A ϕ(x, y) } jest zbiorem. Formalnie: (∀x∃z∀y ϕ(x, y) ⇔ y = z) ⇒ ∀A∃B∀y (y ∈ B ⇔ ∀x ∈ A ϕ(x, y)). Schemat aksjomatów zastępowania mówi, że dla każdej rozważanej formuły i dla każdego zbioru A można utworzyć zbiór B obejmujący dokładnie te elementy y, dla których istnieje element x ∈ A taki, że zachodzi ϕ(x, y). Ważną konsekwencją tego schematu aksjomatów jest następujące metatwierdzenie będące schematem twierdzeń po jednym dla każdej formuły ϕ. Metatwierdzenie 4.3.2 (o specyfikowaniu podzbiorów) Niech ϕ(y) będzie formułą o zmiennej wolnej y. Dla dowolnego zbioru X klasa { y | y ∈ X ∧ ϕ(y) } jest zbiorem. Formalnie: ∀X ∃Y ∀y y ∈ Y ⇔ y ∈ X ∧ ϕ(y). Dowód: Rozważmy najpierw przypadek, gdy nie istnieje x ∈ X taki, że ϕ(x). Wtedy y ∈ X ∧ ϕ(y) ⇔ y ∈ ∅, zatem poszukiwany zbiór Y istnieje, bo jest nim zbiór pusty. Natomiast jeśli istnieje x0 ∈ X taki, że ϕ(x0 ), to definiujemy formułę ψ o zmiennych wolnych x i y następująco: ψ(x, y) := (ϕ(x) ∧ x = y) ∨ (¬ϕ(x) ∧ x = x0 ). Założenia aksjomatu zastępowania dla tej formuły są ewidentnie spełnione. Na mocy tego aksjomatu zbiorowi X odpowiada zbiór, którego elementami są dokładnie takie y, że y ∈ X oraz ϕ(y). Na mocy tego metatwierdzenia, nawet jeśli klasa { x | ϕ(x) } nie jest zbiorem, to analogiczna klasa, ale ograniczona do pewnego zbioru daje już zbiór. Na podstawie tego metatwierdzenia dla danego zbioru X możemy wprowadzić oznaczenie { x ∈ X | ϕ(x) } := { x | x ∈ X ∧ ϕ(x) }, które zawsze definiuje zbiór. Podkreślmy jednak, że w oznaczeniu tym zakładamy, że X jest zbiorem. Jest to powszechan metoda definiowania zbiorów w matematyce. Wymaga jednak dysponowania zbiorem X, do którego zawężamy nasze zainteresowanie formułą ϕ. Zauważmy, że w szczególności z metatwierdzenia o specyfikowaniu podzbiorów wynika, że klasa pełna V nie może być zbiorem. Gdyby bowiem była zbiorem, to klasa { x ∈ V | x 6∈ x } byłaby zbiorem, a wiemy, że nie jest. ZF4. Aksjomat zbioru podzbiorów. Jeśli X jest zbiorem, to klasa {A | A ⊂ X } jest zbiorem. Formalnie ∀X ∃A ∀A A ∈ A ⇔ A ⊂ X. 80 ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI Aksjomat zbioru podzbiorów mówi, że dla każdego zbioru można utworzyć zbiór wszystkich jego podzbiorów. Oznaczamy go P(X) lub 2X . Zauważmy, że P(∅) ma dokładnie jeden element, mianowicie ∅ ∈ P(∅). Natomiast P(P(∅)) ma dokładnie dwa elementy: ∅, P(∅) ∈ P(P(∅)). Twierdzenie 4.3.3 (o istnieniu singletona i dubletona) Dla dowolnych zbiorów a, b klasa {x | x = a ∨ x = b} jest zbiorem. Formalnie: ∀a ∀b ∃X ∀x x ∈ X ⇔ x = a ∨ x = b. Dowód: Rozważmy formułę ϕ(x, y) := (x = ∅ ∧ y = a) ∨ (x = P(∅) ∧ y = b). Założenia aksjomatu zastępowania dla tej formuły są ewidentnie spełnione. Rozważmy zbiór A := P(P(∅)). Na mocy aksjomatu zastępowania odpowiada mu zbiór, którego elementami są dokładnie a oraz b. Twierdzenie 4.3.3 mówi, że dla dowolnych zbiorów a i b istnieje zbiór, którego elementami są dokładnie a oraz b. Oznaczamy go {a, b}. Gdy a 6= b nazywamy go dubletonem elementów a, b. W przeciwnym razie nazywamy go singletonem elementu a. ZF5. Aksjomat unii. Dla dowolnej rodziny zbiorów A klasa { x | ∃A ∈ A x ∈ A } jest zbiorem. Formalnie ∀A ∃U ∀a a ∈ U ⇔ ∃A ∈ A a ∈ A. Aksjomat unii mówi, że jeśli A jest rodziną zbiorów, to można utworzyć zbiór U , którego elementami są wszystkie elementy S zbiorów w rodzinie A i tylko te elementy. Nazywamy go unią lub sumą rodziny A i oznaczamy A. W szczególności, jeśli A i B są zbiorami, to przyjmujemy oznaczenie [ A ∪ B := {A, B}, a zbiór A ∪ B nazywamy sumą lub unią zbiorów A i B. Rozważmy teraz wyrażenie klasowe \ A := { x | ∀A ∈ A x ∈ A }. T T Metatwierdzenie 4.3.4 Jeśli rodzina A jest niepusta, to A jest zbiorem. Natomiast ∅ jest klasą pełną V, a więc nie jest zbiorem. T Dowód: Jeśli A0 ∈ A, to x ∈ A implikuje x ∈ A0 , więc \ A := { x ∈ A0 | ∀A ∈ A x ∈ A }, T a zatem A jest zbiorem na mocy metatwierdzenia o specyfikowaniu zbiorów. Jeśli A = ∅ to implikacja A ∈ A ⇒ x T ∈A T zachodzi dla dowolnego x, bo poprzednik jest fałszywy. Zatem ∅ jest klasą pełną. Dla niepustej rodziny A zbiór A nazywamy przecięciem lub iloczynem rodziny zbiorów A. 4.3. AKSJOMATY TEORII MNOGOŚCI. 81 Dla dwóch zbiorów A i B przyjmujemy oznaczenie A ∩ B := \ {A, B}, a zbiór A ∩ B nazywamy iloczynem lub przecięciem zbiorów A i B. Definiujemy też różnicę i różnicę symetryczną zbiorów A i B odpowiednio jako A\B := { x ∈ A | x 6∈ B }, AB := (A \ B) ∪ (B \ A). Mówimy, że A, B są rozłączne jeżeli A ∩ B = ∅. Przyjęte do tej pory aksjomaty ani nie wykluczają, ale też nie gwarantują istnienia zbiorów nieskończonych. Jeśli jednak chcemy skonstruować na gruncie teorii mnogości liczby naturalne, musimy przyjąć jakiś aksjomat, który zagwarantuje istnienie choć jednego zbioru nieskończonego. Jak zobaczymy, konstrukcja zbioru liczb naturalnych opiera się na operacji następnika zbioru A zdefiniowanej następująco; S(A) := A ∪ {A}. Mamy S(∅) = {∅} S(S(∅)) = {∅, {∅}} S(S(S(∅))) = {∅, {∅}, {∅, {∅}}} S(S(S(S(∅)))) = {∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}} ... Każdy kolejny zbiór jest nadzbiorem właściwym zbioru poprzedniego, więc w szczególności zbiory te są różne. Jest ich nieskończenie wiele. W aksjomacie nieskończoności postulujemy, że istnieje zbiór, który te wszystkie zbiory zawiera. ZF6. Aksjomat nieskończoności. Istnieje rodzina zbiorów A taka, że ∅ ∈ A oraz dla każdego zbioru A ∈ A jego następnik S(A) ∈ A. Formalnie: ∃A ∅ ∈ X ∧ ∀A ∈ A ∃B ∈ A ∀x x ∈ B ⇔ x ∈ A ∨ x = A. 4.3.1 Elementarne własności operacji mnogościowych Wzięcie sumy, iloczynu, różnicy czy różnicy symetrycznej dwóch zbiorów określamy ogólnie mianem operacji mnogościowej. Uwaga 4.3.5 Niech A, B, C będą zbiorami. Operacje mnogościowe mają następujące własności. A ⊂ B, B ⊂ C ⇒ A ⊂ C, A \ A = ∅, A \ ∅ = A, A ∪ B = B ∪ A, A ∪ A = A, A ∩ A = A, A ∩ B = B ∩ A, A ⊂ B ⇔ A ∪ B = B ⇔ A ∩ B = A, A ⊂ A ∪ B, B ⊂ A ∪ B, A ∪ (B ∪ C) = (A ∪ B) ∪ C, A ∩ B ⊂ A, A ∩ B ⊂ B, A ∩ (B ∩ C) = (A ∩ B) ∩ C, A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C), A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) 82 ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI Rysunek 4.4: Kazimierz Kuratowski, 1896-1980 Definicja 4.3.6 Jeśli A ⊂ X to zbiór X \A nazywamy uzupełnieniem A do X i oznaczamy CX A. Gdy X jest ustalony i znany z kontekstu, to często nazywamy go przestrzeną a uzupełnienie A do X oznaczamy po prostu CA lub \A. Uwaga 4.3.7 Niech A, B ⊂ X będą zbiorami w przestrzeni X. Uzupełnienie do przestrzeni X ma następujące własności. A \ B = A ∩ (\B), \(\A) = A, \(A ∪ B) = (\A) ∩ (\B), \(A ∩ B) = (\A) ∪ (\B), A ⊂ B ⇔ \A ⊃ \B. 4.4 4.4.1 Iloczyn kartezjański Para Parą elementów a i b nazywamy zbiór {{a, b}, {b}} oznaczany krótko (a, b). Powyższa,˛ powszechnie dziś używana˛ definicj˛e pary podał w 1921 roku polski matematyk Kazimierz Kuratowski (rys. 4.4). Wcześniejsze, bardziej skomplikowane definicje si˛e nie przyj˛eły. Kluczową własnością pary, której nie ma dubleton, jest Uwaga 4.4.1 (a, b) = (c, d) ⇔ a = c ∧ b = d. 4.4. ILOCZYN KARTEZJAŃSKI 83 W poniższym dowodzie trzykrotnie zastosowano schemat dowodowy zwany dowodem przez przypadki. W dowodzie przez przypadki zamiast jednego dowodu przedstawiamy dwa lub wi˛ecej dowodów, każdy z pewnym dodatkowym nieudowodnionym założeniem. Dowód jest kompletny, jeśli dodatkowo potrafimy udowodnić, że przynajmniej jedno z tych dodatkowych założeń musi być prawdziwe. Ten ostatni fakt cz˛esto sprawdzić jest bardzo łatwo, bo rozważane przypadki wzajemnie si˛e dopełniaja:˛ na przykład jeden przypadek to x > 0, a drugi x ¬ 0. Zaleta˛ takiego podejścia jest możliwość odmiennego poprowadzenia dowodu w każdym z przypadków. Dowód: Choć własność wydaje się oczywista, to jednak jej w miarę formalny dowód jest pracochłonny. Aby udowodnić, że (a, b) = (c, d) ⇔ a = c ∧ b = d. wystarczy podać oddzielnie dowód implikacji (a, b) = (c, d) ⇒ a = c ∧ b = d oraz implikacji a = c ∧ b = d ⇒ (a, b) = (c, d). Podamy dowód pierwszej z tych implikacji. Dowód drugiej jest znacznie łatwiejszy i zostawiamy go jako ćwiczenie. Załóżmy zatem, że (a, b) = (c, d), co zgodnie z naszą definicją pary oznacza, że {{a, b}, {b}} = {{c, d}, {d}}. Ponieważ {b} jest elementem zbioru {{a, b}, {b}}, więc jest on też elementem zbioru = {{c, d}, {d}}. Zatem albo {b} = {{c, d}} albo {b} = {d}. Dalszą część dowodu możemy zatem poprowadzić przez przypadki. Załóżmy najpierw, że {b} = {{c, d}}. Ponieważ tak c jak i d należą do dubletona {{c, d}}, a dubleton {{c, d}} jest w tym przypadku równy singletonowi {b}, więc c i d należą do singletona {b}. Zgodnie z definicją singletona jest to możliwe tylko wtedy gdy c = b i d = b. Zatem również c = d co oznacza w szczególności, że dubleton {c, d} pokrywa się z singletonem {d}, a w konsekwencji mamy (c, d) = {{c, d}, {d}} = {{d}, {d}} = {{d}}. Zatem {{a, b}, {b}} = {{d}}. Ponieważ {a, b} należy do lewej strony tej równości, więc należy też do prawej strony. Stąd {a, b} = {d}. To oznacza, że d = a i d = b. Pokazaliśmy zatem, że a = b = c = d, więc w szczególności a = c i b = d. Kończy to dowód w przypadku gdy {b} = {{c, d}}. By rozważyć drugi przypadek przyjmijmy, że {b} = {d}. Wtedy b = d i pozostaje pokazać, że a = c. Z b = d wynika, że (a, b) = (c, b). Ponieważ {a, b} ∈ (a, b), więc również {a, b} ∈ (c, b). Mamy zatem do rozpatrzenia dwa podprzypadki: albo {a, b} = {c, b} albo {a, b} = {b}. W pierwszym podprzypadku dostajemy a = c lub a = b. Podpodprzypadek a = c nie wymaga już dalszego rozumowania, bo chcieliśmy właśnie pokazać, że a = c. Natomiast jeśli a = b, to {a} = {c, b}, skąd również wynika, że a = c. Pozostaje jeszcze rozważyć podprzypadek {a, b} = {b}. Wtedy a = b, skąd (a, b) = {{a}}. Zatem {c, d} ∈ {{a}}, skąd a = c = d. Tak więc w tym podprzypadku znów dostajemy, że wszsytkie cztery elementy są równe, skąd w szczególności a = c i b = d. 4.4.2 Iloczyn kartezjański Zauważmy, że jeśli X i Y są zbiorami, x ∈ X, y ∈ Y , to (x, y) = {{x, y}, {y}} ∈ P(P(X ∪ Y )). Iloczynem kartezjańskim zbiorów X i Y nazywamy zbiór X × Y := { u ∈ P(P(X ∪ Y )) | ∃x ∈ X∃y ∈ Y u = (x, y) }. Iloczyn kartezjański X × X oznaczamy krótko X 2 . 84 ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI Twierdzenie 4.4.2 Iloczyn kartezjański ma następujące własności. (i) Jeśli A 6= ∅ 6= B, to A × B ⊂ X × Y ⇔ A ⊂ X i B ⊂ Y, (ii) Dla dowolnych zbiorów A1 , A2 , B mamy (A1 × B) ∪ (A2 × B) = (A1 ∪ A2 ) × B, (A1 × B) ∩ (A2 × B) = (A1 ∩ A2 ) × B, (iii) Dla dowolnych zbiorów A, B, C, D mamy (A × B) ∩ (C × D) = (A ∩ C) × (B ∩ D). 4.5 Relacje 4.5.1 Relacje Relacją w zbiorach X i Y nazywamy dowolny podzbiór R ⊂ X × Y . Gdy X = Y , mówimy krótko o relacji w X. Tradycyjnie piszemy xRy zamiast (x, y) ∈ R. Zbiór pusty i X × X to odpowiednio relacja pusta i relacja pełna w X. Relacją identycznościową w X jest ∆X := idX := { (x, x) | x ∈ X }. 4.5.2 Własności relacji Niech R ⊂ X × X będzie relacją w X. Podane już w rozdziale ... własności relacji definiujemy przy użyciu następujących wzorów formalnych. R zwrotna : ⇔ x R x, ∀x, y ∈ X x R y ⇒ y R x, :⇔ ∀x, y ∈ X x R y ∧ y R x ⇒ x = y, R antysymetryczna R przechodnia : ⇔ R spójna 4.5.3 ∀x ∈ X R symetryczna : ⇔ :⇔ ∀x, y, z ∈ X ∀x, y ∈ X x R y ∧ y R z ⇒ x R z, x R y ∨ y R x. Złożenie relacji Definicja 4.5.1 Dla relacji R w X × Y i relacji S w Y × Z definiujemy obłożenie relacji R przez relację S zwane również podstawieniem relacji R w relacji S jako S ◦ R := { (x, z) ∈ X × Z | ∃y ∈ Y xRy i ySz }. Definiujemy również relację odwrotną do relacji R jako R−1 := { (y, x) ∈ Y × X | xRy }. 4.6. RELACJE RÓWNOWAŻNOŚCI 85 Twierdzenie 4.5.2 Niech Q będzie relacją w W × X, R relacją w X × Y , a S relacją w Y × Z. Wtedy (S ◦ R) ◦ Q = S ◦ (R ◦ Q), (S ◦ R)−1 = R−1 ◦ S −1 , (R−1 )−1 = R, ∆−1 X = ∆X . 4.5.4 Charakterystyka własności relacji Następujące twierdzenie opisuje własności relacji w języku zbiorów. Twierdzenie 4.5.3 Niech R ⊂ X × X będzie relacją. Wtedy: 4.6 4.6.1 R zwrotna ⇔ ∆X ⊂ R, R symetryczna ⇔ R−1 = R, R anysymetryczna ⇔ R ∩ R−1 ⊂ ∆X , R przechodnia ⇔ R ◦ R ⊂ R, R spójna ⇔ R ∪ R−1 = X × X. Relacje równoważności Relacja równoważności Definicja 4.6.1 Relację w klasie X, która jest zwrotna, symetryczna i przechodnia nazywamy relacją równoważności. Dla x ∈ X zbiór [x]R := { y ∈ X | xRy } nazywamy klasą równoważności elementu x. Twierdzenie 4.6.2 Niech R będzie relacją równoważności w X. Jeśli x, y ∈ X oraz xRy, to [x]R = [y]R . Innymi słowy, klasy równoważności równoważnych elementów są identyczne. Ponadto dla dowolnych x, y ∈ X albo [x]R = [y]R , albo [x]R ∩ [y]R = ∅, to znaczy klasy równoważności dwóch elementów są albo równe, albo rozłączne. 4.7 4.7.1 Funkcje Relacje jednolistne Definicja 4.7.1 Niech R ⊂ X × Y będzie relacją. Mówimy, że R jest jednolistna jeżeli (x, y) ∈ R ∧ (x, y 0 ) ∈ R ⇒ y = y 0 . 86 ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI Rysunek 4.5: Graf relacji niejednolistnej i jednolistnej Rysunek 4.6: Wykres relacji niejednolistnej i jednolistnej 4.7. FUNKCJE 87 Przykładowy graf relacji niejednolistnej (po lewej) i jednolistnej (po prawej) przedstawiono na rys. 4.5. Wykresy tych relacji (niejednolistnej po lewej, jednolistnej po prawej) przedstawiono na rys. 4.6. Relacja jednolistna nie może być jeszcze uznana za funkcj˛e, bo własność jednolistności nie gwarantuje, że każdy element x ∈ X pozostaje w relacji z jakimś elementem y ∈ Y . Jednak nim zajmiemy si˛e definicja˛ funkcji zauważmy najpierw, że czasami mamy do czynienia z sytuacja,˛ w której pewnym argumentom nie chcemy badź ˛ nie potrafimy w rozsadny ˛ sposób przypisać wartości. Mówimy wtedy o funkcjach cz˛eściowych. 4.7.2 Funkcje częściowe Definicja 4.7.2 Mówimy, że trójka (X, f, Y ) jest funkcją częściową z X do Y Tradycyjnie piszemy f : X−→ ◦ Y na oznaczenie funkcji częściowej z X do Y . częściowej f z X do Y , to element y jest wyznaczony jednoznacznie przez nazywamy wartością funkcji częściowej f w x. Dziedzinę funkcji częściowej f jeżeli f jest relacją jednolistną w X ×Y . Jeśli para (x, y) jest elementem funkcji element x. Oznaczamy go f (x) := y i definiujemy jako dom f := { x ∈ X | ∃y ∈ Y (x, y) ∈ f }. Obraz funkcji częściowej f definiujemy jako im f := { y ∈ Y | ∃x ∈ X (x, y) ∈ f }. Uwaga 4.7.3 Dwie funkcje częściowe (X1 , f1 , Y1 ) i (X2 , f2 , Y2 ) są sobie równe wtedy i tylko wtedy gdy X1 = X2 i f1 = f2 i Y1 = Y2 . Pakiet Relations.m umożliwia sprawdzenie czy relacja jest funkcją częściową. Na przykład pisząc rR = R e l a t i o n [ { a , b , c } , {b −> b , c −> c , b −> a } ] I s P a r t i a l F u n c t i o n [ rR ] otrzymamy odpowiedź False. 4.7.3 Funkcje Aby funkcja cz˛eściowa f była funkcja˛ musimy jeszcze dodać warunek, że dla każdego x ∈ X istnieje y ∈ Y taki, że (x, y) ∈ f . Wykorzystujac ˛ poj˛ecie dziedziny, możemy ten wymóg sformułować nast˛epujaco: ˛ Definicja 4.7.4 Jeżeli dla funkcji częściowej (X, f, Y ) spełniony jest warunek dom f = X, to piszemy f :X→Y i mówimy, że (X, f, Y ) jest funkcją z X do Y lub odwzorowaniem z X do Y lub przekształceniem X w Y . Często, od strony formalnej niepoprawnie, mówimy, że to f jest funkcją, rozumiejąc, że jest jasne o jakie X i Y chodzi. Na zbiór funkcji z X do Y stosujemy oznaczenie Y X := { f | f : X → Y - funkcja z X do Y } Przykład 4.7.5 1. Niech c ∈ Y . Wtedy { (x, c) | x ∈ X } jest funkcją z X do Y . Nazywamy ją funkcją stałą. 2. Relacja identycznościowa ∆X jest funkcją ∆X : X → X. 3. Relacja pełna w przestrzeni X nie jest funkcją z wyjątkiem przypadku gdy X jest pusty lub jest singletonem. 88 ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI Rysunek 4.7: Zawieranie funkcji 4.7.4 (*)Zawieranie się funkcji Uwaga 4.7.6 Niech f, g : X−→ ◦ Y . Wtedy warunek f ⊂ g jest równoważny koniunkcji warunków dom f ⊂ dom g i ∀x ∈ dom f f (x) = g(x). Przykład zawierania się funkcji przedstawiono na rys. 4.7 Definicja 4.7.7 Niech f, g będą fukcjami częściowymi z X do Y . Mówimy, że f jest zawężeniem g lub g jest rozszerzeniem f jeżeli f ⊂ g. Niech f : X → Y , A ⊂ X. Zawężeniem funkcji f do A nazywamy funkcję f|A := f ∩ A × Y. 4.7.5 Sklejenie funkcji Uwaga 4.7.8 Niech f, g będą fukcjami częściowymi z X do Y . Suma f ∪ g jest funkcją częsciową z X do Y wtedy i tylko wtedy gdy ∀x ∈ dom f ∩ dom g f (x) = g(x). Definicja 4.7.9 Jeśli f, g : X−→ ◦ Y są funkcjami częściowymi z X do Y i f ∪ g jest funkcją to nazywamy ją sklejeniem funkcji f i g. Przykładowe sklejenie funkcji przedstawiono na rys. 4.8 4.7. FUNKCJE 89 Rysunek 4.8: Sklejenie funkcji 4.7.6 (*)Zestawienie i iloczyn kartezjański funkcji Definicja 4.7.10 Niech f : X → Y i g : X → Z. Zestawieniem funkcji f i g nazywamy funkcję (f, g) : X 3 x 7→ (f (x), g(x)) ∈ X × Y. Definicja 4.7.11 Niech f : X1 → Y1 , a g : X2 → Y2 . Iloczynem kartezjańskim funkcji f i g nazywamy funkcję f × g : X1 × X2 3 (x1 , x2 ) → (f (x1 ), g(x2 )) ∈ Y1 × Y2 . Oznaczenie na zestawienie i iloczyn kartezjański funkcji koliduje z parą funkcji i iloczynem kartezjańskim funkcji potraktowanych jako zbiory. Jednak w tym drugim znaczeniu oznaczeń tych praktycznie się nie używa, więc ryzyko błędnej interpretacji jest minimalne. 4.7.7 Obrazy i przeciwobrazy Niech f : X → Y , A ⊂ X, B ⊂ Y . Obrazem zbioru A nazywamy f (A) := { y ∈ Y | ∃x ∈ A y = f (x) }. Przeciwobrazem zbioru B nazywamy f −1 (B) := { x ∈ X | f (x) ∈ B }. Uwaga 4.7.12 Niech f : X → Y , a A, A1 , A2 ⊂ X i B, B1 , B2 ⊂ Y będą zbiorami. Wtedy A1 ⊂ A2 ⇒ f (A1 ) ⊂ f (A2 ), B1 ⊂ B2 ⇒ f −1 (B1 ) ⊂ f −1 (B2 ), f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ), f −1 f −1 (B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ), f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 ), (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ), f (f −1 (B)) = B ∩ im f, f −1 (f (A)) ⊃ A. 90 ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI 4.7.8 Złożenie funkcji Twierdzenie 4.7.13 Niech f : X−→ ◦ Y , g : Y −→ ◦ Z będą funkcjami częściowymi. Wtedy g ◦ f jest funkcją częściową z X do Z, dom g ◦ f = f −1 (dom g), oraz dla x ∈ dom g ◦ f g ◦ f (x) = g(f (x)). Co więcej, jeśli f i g są funkcjami, to g ◦ f jest funkcją. 4.7.9 Injekcje, surjekcje, i bijekcje. Relacja odwrotna do relacji jednolistnej nie musi być jednolistna. Zatem relacja odwrotna do funkcji częściowej nie musi być funkcją częściową. Funkcję f : X → Y nazywamy injekcją, jeżeli dla dowolnych x1 , x2 ∈ X f (x1 ) = f (x2 ) ⇒ x1 = x2 . Funkcję f nazywamy surjekcją, jeżeli dla dowolnego y ∈ Y istnieje x ∈ X takie, że y = f (x). Funkcję f nazywamy bijekcją jeśli jest injekcją i surjekcją. Twierdzenie 4.7.14 Niech f : X → Y będzie funkcją. Relacja odwrotna f −1 jest jednolistna wtedy i tylko wtedy gdy f jest injekcją. Relacja odwrotna f −1 jest funkcją wtedy i tylko wtedy gdy f jest bijekcją. Relację odwrotną do bijekcji nazywamy funkcją odwrotną. 4.7.10 Iloczyn kartezjański n zbiorów Iloczyn kartezjański nie jest łączny: (X × Y ) × Z 6= X × (Y × Z), bo ((a, b), c) 6= (a, (b, c)). Jest jednak naturalna bijekcja (X × Y ) × Z 3 ((a, b), c) 7→ (a, (b, c)) ∈ X × (Y × Z), która pozwala utożsamiać te zbiory. Pozwala to mówić o iloczynie kartezjańskim trzech (i analogicznie) więcej zbiorów bez podawania nawiasów. Dla n-krotnego iloczynu kartezjańskiego zbioru X przez siebie stosujemy krótką notację X n . 4.7.11 Sumy i iloczyny indeksowane Definicja 4.7.15 Często zdarza się, że rodzina podzbiorów zbioru X zadana jest jako kodziedzina odwzorowania, t.zw. odwzorowania indeksującego A : J → P(X). Wtedy rodzinę tę zapisujemy często jako {Aj }j∈J oraz wprowadzamy oznaczenia na sumę i przecięcie tej rodziny \ [ [ \ Aj := { Aj | j ∈ J }, Aj := { Aj | j ∈ J }. j∈J j∈J 4.8. RÓWNOLICZNOŚĆ ZBIORÓW. TWIERDZENIE CANTORA I CANTORA-BERNSTEINA. 91 Twierdzenie 4.7.16 Niech A : J → P(X) będzie odwzorowaniem indeksującym rodzinę podzbiorów X. Jeśli J = J1 ∪ J2 , to [ [ [ \ \ \ Aj = Aj ∪ Aj , Aj = Aj ∩ Aj . j∈J Ponadto j∈J1 j∈J2 j∈J [ \ Aj = j∈J j∈J1 \ \Aj , \ j∈J j∈J2 \ Aj = j∈J [ \Aj . j∈J Jeśli dodatkowo B : K → P(Y ) jest odwzorowaniem indeksującym rodzinę podzbiorów Y , to ! [ [ [ Aj × Bk = Aj × B k , j∈J k∈K [ Aj ∩ j∈J ! [ Bk j∈J = k∈K Aj ∪ [ Aj ∩ B k , (j,k)∈J×K \ 4.8 (j,k)∈J×K ! \ k∈K Bk = \ Aj ∪ B k . (j,k)∈J×K Równoliczność zbiorów. Twierdzenie Cantora i Cantora-Bernsteina. Definicja 4.8.1 Zbiory X, Y nazywamy równolicznymi jeśli istnieje bijekcja f : X → Y . Twierdzenie 4.8.2 Relacja równoliczności zbiorów jest relacją równoważności w klasie pełnej. Twierdzenie 4.8.3 (Cantora) Żaden zbiór nie jest równoliczny ze zbiorem swoich podzbiorów. Dowód: Dla dowodu nie wprost przypuśćmy, że dla pewnego zbioru X istnieje bijekcja f : X 7→ 2X . Rozważmy zbiór Z := { x ∈ X | x 6∈ f (x) }. X Z definicji zbioru Z wynika, że Z ∈ 2 . Zatem, ponieważ f jest bijekcją, wnosimy, że istnieje z ∈ X takie, że f (z) = Z. Zachodzi jeden z dwóch przypadków: albo z ∈ Z, albo z 6∈ Z. W pierwszym przypadku wnosimy z definicji zbioru Z, że z 6∈ f (z) = Z, otrzymujemy więc sprzeczność. Podobnie, w przypadku drugim, mamy z 6∈ Z. Ale wtedy z ∈ f (z) = Z, co ponownie daje sprzeczność. Tak więc w każdym z możliwych dwóch przypadków otrzymujemy sprzeczność, co dowodzi, że nasze przypuszczenie o istnieniu bijekcji było fałszywe. Twierdzenie 4.8.4 (Cantora-Bernsteina) Jeśli zbiór A jest równoliczny z podzbiorem zbioru B, a zbiór B jest równoliczny z podzbiorem zbioru A, to zbiory A i B są równoliczne. Dowód: .... 92 ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI Rozdział 5 Liczby naturalne. Indukcja i rekurencja. Naszym celem w tym i nast˛epnym rozdziale jest naszkicowanie konstrukcji zbiorów liczbowych na gruncie teorii mnogości. Czasami, jak to zrobimy w przypadku zbioru liczb całkowitych, wymiernych, czy zespolonych wygodnie jest przeprowadzić bezpośrednie konstrukcje. Robimy tak zazwyczaj wtedy, gdy jest jakaś szczególnie naturalna, narzucajaca ˛ si˛e konstrukcja. Jeśli możliwych, istotnie różnych konstrukcji jest wiele, preferujemy podanie ogólnej definicji wraz ze stwierdzeniem pokazujacym, ˛ że stosowny zbiór da si˛e skonstruować i to w jedyny, z dokładnościa˛ do pewnego utożsamienia, sposób. Tak postapimy ˛ w przypadku liczb naturalnych i liczb rzeczywistych. Ponadto w rozdziale tym zdefiniujemy poj˛ecie działania, grupy oraz ciała. Poj˛ecia te pozwalaja˛ uogólnić koncepcj˛e dodawania i mnożenia liczb i dowodzić twierdzenia modelowane na własnościach liczb, a prawdziwe w znacznie szerszym zakresie. W przypadku takich ogólnych definicji cz˛esto używamy poj˛ecia aksjomatyka. Należy jednak podkreślić, że użycie słowa aksjomatyka w odniesieniu do definicji nie oznacza, że rozszerzamy zbiór aksjomatów. W matematyce budowanej w oparciu o teri˛e mnogości jedyne potrzebne aksjomaty to aksjomaty teorii mnogości. 5.1 5.1.1 Liczby naturalne Aksjomatyka liczb naturalnych Naturalne jest przyjać, ˛ że pierwotny pasterz, który wiedział, że ma stado owiec liczace ˛ n sztuk, był świadom, że może też mieć stado o jedna˛ sztuk˛e wi˛eksze. "O jeden wi˛ecej" to bardzo naturalne i bardzo elementarne poj˛ecie w matematyce określane mianem nast˛epnika. Jest ono podstawa˛ nast˛epujacej ˛ definicji określanej mianem aksjomatyki liczb naturanych. Użycie zwrotu aksjomatyka w odniesieniu do tej definicji służy jedynie podkreśleniu, że wszystkie twierdzenia, które wywieść można z danej definicji stanowia˛ ważna˛ teori˛e, która może być rozwijana niezależnie od teorii mnogości. Definicja 5.1.1 Struktura liczb naturalnych to trójka (N, 0, s) spełniająca warunki (i) N jest zbiorem, (ii) s : N → N jest injekcją, (iii) 0 ∈ N \ s(N ) (iv) (zasada indukcji) dla dowolnego K ⊂ N jeśli (iv.1) 0 ∈ K, (iv.2) n ∈ K ⇒ s(n) ∈ K to K = N . 93 94 ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA. Rysunek 5.1: John von Neumann, 1903-1957, Źródło: Wikipedia 5.1.2 Konstrukcja von Neumanna Postawienie powyższej definicji oczywiście nie gwarantuje, że coś co spełnia wymogi tej definicji rzeczywiście istnieje i jest w jakimś rozsadnym ˛ sensie dokładnie jedno (nie chcielibyśmy mieć wielu istotnie różnych zbiorów liczb naturalnych). Dlatego potrzebna jest jakaś konstrukcja zbioru liczb naturalnych na gruncie teorii mnogości oraz uzasadnienie jednoznaczności. Formalna˛ konstrukcj˛e zbioru liczb naturalnych na gruncie teorii mnogości, a dokładniej w oparciu o aksjomat nieskończoności, podał amerykański matematyk w˛egierskiego pochodzenia, John von Neumann (rys. 5.1). Rol˛e nast˛epnika pełni w niej funkcja S wykorzystywana w aksjomacie nieskończoności. Nie możemy skorzystać z operacji dodania jedynki, bo na tym etapie formalizacji nie mamy jeszcze formalnie zdefiniowanego dodawania liczb. Dodawanie zdefiniujemy dopiero w oparciu o poj˛ecie nast˛epnika. Twierdzenie 5.1.2 Trójka spełniająca warunki definicji 5.1.1 istnieje. Dowód: Przypomnijmy, że następnikiem zbioru a nazywamy zbiór S(a) := a ∪ {a}. Powiemy, że zbiór A jest induktywny, jeśli spełnia dwa warunki ∅∈A a ∈ A ⇒ S(a) ∈ A. Łatwo sprawdzić, że przecięcie dowolnej rodziny zbiorów induktywnych, w szczególności dwóch zbiorów induktywnych, też jest zbiorem induktywnym. Na mocy aksjomatu nieskończoności przynajmniej jeden zbiór induktywny istnieje. Ustalmy jeden taki zbiór i oznaczmy go L. To mógłby być nasz zbiór liczb naturalnych, ale może być w nim coś więcej, dlatego musimy się tych ewentualnych, niepotrzebnych elementów pozbyć. Niech L oznacza rodzinę wszystkich induktywnych podzbiorów L i T niech N := L. Łatwo sprawdzamy, że zbiór N też jest induktywny. Co więcej, jeśli K jest zbiorem induktywnym, to K ∩ L jest zbiorem induktywnym zawartym w L. Stąd N ⊂ K ∩ L ⊂ K, zatem N zawiera się w dowolnym innym zbiorze induktywnym. Zatem N jest najmniejszym zbiorem induktywnym w sensie relacji inkluzji. Przyjmujemy oznaczenia: 0 s(n) := ∅, := S(n) dla n ∈ N . 5.1. LICZBY NATURALNE 95 Sprawdzimy, że trójka (N, 0, s) spełnia warunki definicji 5.1.1. Wiemy już, że N jest zbiorem, więc własność (i) zachodzi. Oczywiście 0 = ∅ ∈ N , a ponieważ n ∈ s(n), więc dla dowolnego n ∈ N mamy s(n) 6= ∅ = 0. co pokazuje własność (iii). Własność (iv) definicji 5.1.1 stwierdza, że każdy induktywny podzbiór N jest równy N . Zatem wynika ona natychmiast z naszej wcześniejszej obserwacji, że N zawiera się w każdym zbiorze induktywnym. Aby udowodnić własność (ii) pokażemy najpierw, że ∀n ∈ N ∀m ∈ N m ∈ n ⇒ m ⊂ n. (5.1) Niech N 0 := { n ∈ N | ∀m ∈ N m ∈ n ⇒ m ⊂ n }. Wystarczy pokazać, że N 0 jest induktywny. Zauważmy, że implikacja m∈∅ ⇒ m⊂∅ jest pusto spełniona. Zatem 0 = ∅ ∈ N 0 , co oznacza, że zbiór N 0 spełnia warunek (iv.1). Aby pokazać (iv.2) załóżmy, że n ∈ N 0 . Aby pokazać, że s(n) ∈ N 0 weźmy m ∈ s(n). Ponieważ założyliśmy, że n ∈ N 0 , więc z definicji zbioru n0 wnosimy, że w szczególności dla naszego m zachodzi implikacja m ∈ n ⇒ m ⊂ n. (5.2) Z definicji s(n) i przesłanki m ∈ s(n) wnosimy, że albo m ∈ n albo m = n. W pierwszym przypadku z implikacji (5.2) wnosimy, że m ⊂ n. W drugim przypadku ta inkluzja jest oczywista. Zatem dla dowolnego n ∈ N pokazaliśmy implikację m ∈ s(n) ⇒ m ⊂ s(n), co dowodzi, że s(n) ∈ N 0 . Zatem z przesłanki n ∈ N 0 wynika, że s(n) ∈ N 0 . Dowodzi to, że N 0 spełnia również warunek (iv.2), czyli jest induktywny. Zatem z pokazanej już własności (iv) wnosimy, że N 0 = N , a to dowodzi prawdziwości formuły (5.1). Możemy teraz pokazać własność (ii). Załóżmy, że dla pewnych n, m ∈ N mamy s(n) = s(m). Wtedy w szczególności n ∈ s(n) = s(m), zatem albo n ∈ m albo n = m. Zatem z (5.1) w pierwszym przypadku, a w sposób oczywisty w drugim przypadku, dostajemy n ⊂ m. Zamieniając m i n rolami dostajemy dowód, że m ⊂ n. Zatem m = n, czyli s jest iniekcją. Warto się przyjrzeć jak wygląda kilka początkowych liczb naturalnych według von Neumanna. I tak, mamy 0 := ∅, 1 := s(0) = {∅}, 2 := s(1) = {∅} ∪ {{∅}} = {∅, {∅}}, 3 := s(2) = {∅, {∅}} ∪ {{∅, {∅}}} = {∅, {∅}, {∅, {∅}}}, ··· . Konstrukcja von Neumanna nie jest jedyna˛ możliwa.˛ Na przykład można przyjać ˛ 0 := ∅, 1 := {∅}, 2 := {{∅}}, 3 := {{{∅}}}, ··· . W tym momencie widać pożytek z postawienia formalnej definicji (aksjomatyki) zbioru liczb naturalnych. Pozwala ona na codzień nie myśleć o skomplikowanej konstrukcji liczb naturalnych i badać ich własności jedynie poprzez odnoszenie si˛e do własności podanych w definicji. Szczególna˛ rol˛e pełni własność 5.1.1(iv). Jest ona podstawa˛ schematu dowodowego zwanego dowodem przez indukcj˛e. Schemat ten mówi, że aby udowodnić iż pewna własność przysługuje wszystkim liczbom naturalnym, wystarczy pokazać, że przysługuje ona liczbie 0 oraz udowodnić implikacj˛e, że jeśli przysługuje liczbie naturalnej n to przysługuje liczbie nast˛epnej S(n). Tradycyjnie zbiór liczb naturalnych oznaczamy przez N i stosujemy notację n∗ := S(n) dopóki nie zdefiniujemy formalnie dodawania liczb naturalnych oraz liczby jeden. 96 ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA. 5.2 Ciągi i rekurencja. Jesteśmy wreszcie gotowi podać formalna˛ definicj˛e ciagu. ˛ Do tego potrzebowaliśmy definicji funkcji oraz definicji zbioru liczb naturalnych. Ciag ˛ to po prostu funkcja ze zbioru liczb naturalnych do dowolnego innego zbioru. 5.3 5.3.1 Ciągi i podciągi Definicja ciągu i podciągu Definicja 5.3.1 Ciągiem w zbiorze X nazywamy dowolne odwzorowanie a : N → X. Dla ciągu a obok notacji funkcyjnej a(n) dla wartości a w n stosujemy też tradycyjną notację ciągową an := a(n). O an mówimy często, że jest n-tym wyrazem ciągu a lub krótko wyrazem ciągu a. Definicja 5.3.2 Niech X będzie zbiorem, c : N → X ciągiem o wartościach w X, a k : N → N ciągiem silnie rosnącym. Wtedy ciąg będący złożeniem c ◦ k nazywamy podciągiem ciągu c. Jego n-tym wyrazem jest (c ◦ k)(n). Tradycyjnie oznaczamy go ckn . Rozważmy ciagi ˛ 1 ∈ Q, 1+n k : N ∈ n → 2n ∈ N. a:N3n→ Poczatkowe ˛ wyrazów ciagu ˛ a to 1 1 1 1, , , , . . . 2 3 4 Poczatkowe ˛ wyrazy ciagu ˛ k to 0, 2, 4, 6, . . . Ciag ˛ k jest rosnacym ˛ ciagiem ˛ o wartościach w N. Zatem możemy rozważać złożenie b := a ◦ k : N → Q. Złożenie to jest ciagiem ˛ b : N 3 n → a(k(n)) = akn = 1 ∈ Q. 1 + 2n Kilka poczatkowych ˛ wyrazów ciagu ˛ b to 1, 1 1 = , 1+2×1 3 1 1 = , 1+2×2 5 1 1 = ,.... 1+2×3 7 Widać wi˛ec, że ciag ˛ b jest zbudowany z wybranych wyrazów ciagu ˛ a, przy czym wyboru dokonujemy przy pomocy ciagu ˛ k . Wyjaśnia to nazw˛e podciag. ˛ 5.3.2 Ciąg przybliżeń pierwiastka jeszcze raz. Ciąg instrukcji, który wykorzystywaliśmy do liczenia przybliżeń pierwiastka wygodnie zapakować w postaci programu, z którego można korzystać wielokrotnie. Program ten przedstawiono na listingu 5.1. Wystarczy teraz napisać SqrtTwo [ 3 ] i otrzymamy { 707 283 , }. 500 200 5.3. CIĄGI I PODCIĄGI 97 ( ∗ D e f i n i u j e m y f u n k c j ę o nazwie SqrtTwoBf o b l i c z a j ą c ą p i e r w i a s t e k z dwóch z jednym argumentem o k r e ś l a j ą c y m żądaną d o k ł a d n o ś ć ∗ ) SqrtTwoBf [ n_ ] := ( ∗ Znak p o d k r e ś l e n i a po n i n f o r m u j e , ż e n j e s t argumentem ∗ ) Module [ { i } , ( ∗ Moduł może z a w i e r a ć zmienne l o k a l n e . I c h l i s t ę umieszczamy na p o c z ąt k u ∗ ) i = 1 ; ( ∗ I n i c j a l i z u j e m y zmienną i w a r t o ś c i ą j e d e n ∗ ) While [ ( ∗ Początek p ę t l i ∗ ) i ^2 < 2∗100^n , ( ∗ P ę t l ę wykonujemy j a k długo s p e ł n i o n y j e s t warunek ∗ ) i = i + 1 ( ∗ Jedyna i n s t r u k c j a wewnątrz n a s z e j p ę t l i ∗ ) ] ; ( ∗ Koniec p ę t l i ∗ ) ( ∗ O s t a t n i e o b l i c z o n e w y r a ż e n i e t o w a r t o ś ć zwracana p r z e z f u n k c j ę ∗ ) ( ∗ J e s t nim para ułamków s z a c u j ą c y c h p i e r w i a s t e k od dołu i góry ∗ ) { ( i − 1)/10^ n , i /10^n} ] ( ∗ Koniec modułu d e f i n i u j ą c e g o f u n k c j ę ∗ ) Listing 5.1: Obliczania pierwiastka metodą brutalnej siły zademonstrowane w języku Mathematica. Tekst zamknięty w parach dwuznaków (* i *) oznacza komentarz. ( ∗ Funkcja o b l i c z a j ą c a p i e r w i a s t e k z l i c z b y a>0 z d o k ł a d n o ś c i ą do d c y f r ∗ ) S q r t B f P l u s [ a_ , d_ ] := Module [ { i , n } , ( ∗ Zmienne l o k a l n e : l i c z n i k i mianownik ∗ ) i = 1; n = 1; While [ True , ( ∗ Główną p ę t l ę przerwiemy i n s t r u k c j ą Break p o n i ż e j ∗ ) ( ∗ Wewnętrzna p ę t l a d o b i e r a w a r t o ś ć l i c z n i k a do a k t u a l n e g o mianownika ∗ ) While [ ( i + 1 ) ∗ ( i + 1 ) < a ∗n∗n , i = i + 1 ] ; ( ∗ Po o s i ą g n i ę c i u ż ą d a n e j d o k ł a d n o ś c i wychodzimy z p ę t l i ∗ ) I f [ n >= 10^d , Break [ ] ] ; ( ∗ Rozszerzamy r e p r e z e n t a c j ę ułamka p r z e d kolejnym p r z e j ś c i e m p ę t l i ∗ ) i = i ∗10; n = n∗10; ]; { i /n , ( i + 1 ) / n} ] Listing 5.2: Usprawnione podejście do obliczania pierwiastka przedstawione w programie Mathematica. Ćwiczenie komputerowe 5.3.3 Adaptuj nasz program SqrtTwoBf do SqrtBf tak by liczył pierwiastek z dowolnej liczby naturalnej. Ćwiczenie komputerowe 5.3.4 Sprawdź doświadczalnie jak rośnie czas obliczeń naszego algorytmu SqrtTwo przy zwiększaniu dokładności. Warto wiedzieć, że obliczenie wyrażenia, którego wykonanie w programie Mathematica trwa zbyt długo zawsze można przerwać wybierając w menu Evaluation opcję Abort evaluation. Jak widać nasz algorytm liczenia pierwiastka jest daleki od doskonałości. Znacznie ulepszoną wersję przedstawiono na listingu 5.2 Jak zobaczymy niebawem są jeszcze lepsze algorytmy. Warto jednak uświadomić sobie, że, choć tego nie jesteśmy w stanie zaobserwować przy obliczaniu pojedynczego pierwiastka, jedną z przyczyn, dla których obliczenia przy dużej dokładnosci są dość wolne jest przekroczenie pojemności maszynowego typu int i konieczność programowego symulowania większej pojemności. Między innymi z tego powodu w tradycyjnych obliczeniach numerycznych zamiast dokładnych – ale na ogół bardzo wolnych – obliczeń na liczbach całkowitych lub ułamkach preferuje się znacznie szybsze, ale obarczone pewnym błędem, obliczenia na maszynowych liczbach zmiennopozycyjnych takich jak double, o których opowiemy w rozdziale 8.2. 98 ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA. Ćwiczenie komputerowe 5.3.5 Adaptuj program z listingu 5.1 lub listingu 5.2 tak by wyznaczał ciąg przybliżeń dodatniego pierwiastka równania x2 + x = 3. Listing 5.2 prezentuje nieco udoskonaloną wersję liczenia pierwiastka metodą brutalnej siły. Zastosowano tu pętlę w pętli, by przy obliczeniach dla zwiększonej dokładności niepotrzebnie nie powtarzać tego co już jest wiadome na podstawie obliczeń wcześniejszych. Ćwiczenie komputerowe 5.3.6 Zmodyfikuj program z listingu 5.2 tak, by liczył go dla liczb, dla których znasz prawidłową odpowiedź. 5.3.3 √ 3 a dla zadanej liczby a. Przetestuj Monotoniczność ciągu. Twierdzenie 5.3.7 Niech X będzie przestrzenią uporządkowaną. Ciąg a : N → X jest słabo rosnący wtedy i tylko wtedy gdy ∀n ∈ N an ¬ an+1 . Jest on silnie rosnący wtedy i tylko wtedy gdy ∀n ∈ N an < an+1 . Analogicznie można scharakteryzować ciągi słabo i silnie malejące. 5.4 Rekurencyjne definiowanie ciągu. Zobaczymy w rozdziale 5.4.1, że dla a > 1 funkcja f : R+ 3 x 7→ ma t˛e sympatyczna˛ własność, iż jeśli x jest przybliżeniem √ wyprodukować ciag ˛ coraz lepszych przybliżeń a √ a + x2 ∈ R+ 2x a, to f (x) jest jeszcze lepszym przybliżeniem √ a. Zaczynajac ˛ od liczby jeden możemy zatem 1, f (1), f (f (1)), f (f (f (1))), . . . . Cecha˛ tego ciagu ˛ jest to, że aby wyliczyć wyraz n-ty musimy już mieć policzony wyraz (n − 1)-szy. Podanie ogólnego wzoru na n-ty wyraz jest jednak trudne o ile w ogóle możliwe. Może si˛e zatem pojawić watpliwość. ˛ Jeśli nie potrafimy podać wzoru na 4N4-ty wyraz, to czy rzeczywiście możemy mówić o dobrze zdefiniowanym ciagu? ˛ Poniższe twierdzenie o rekurencyjnym definiowaniu ciagu ˛ upewnia nas, że takie post˛epowanie prowadzi do dobrze zdefiniowanego ciagu. ˛ Twierdzenie 5.4.1 (o rekurencyjnym definiowaniu ciągu) Niech f : X → X będzie funkcją i niech c ∈ X. Wtedy istnieje dokładnie jeden ciąg a : N → X taki, że a0 = c, ∀n ∈ N an∗ = f (an ). 5.4. REKURENCYJNE DEFINIOWANIE CIĄGU. 99 ( ∗ S z y b k i e o b l i c z a n i e p i e r w i a s t k a z l i c z b y a z d o k l a d n o s c i a do e p s i l o n ∗ ) SqrtQuick [ a_ , d_ ] := Module [ { x , e p s } , e p s = 10^(−d ) ; ( ∗ żądana d o k ł a d n o ś ć ∗ ) x = 1 ; ( ∗ w a r t o ś ć początkowa c i ą g u r e k u r e n c y j n e g o ∗ ) While [ Abs [ x∗x − a ] / 2 > eps , ( ∗ j e ś l i n i e o s i ą g n i ę t o ż ą d a n e j d o k ł a d n o ś c i ∗ ) x = ( x∗x + a ) / ( 2 ∗ x ) ; ( ∗ nowa w a r t o ś ć c i ą g u r e k u r e n c y j n e g o ∗ ) Print [N[ { x − ( x∗x − a ) / 2 , x } , d + 1 ] ] ( ∗ wydruk k o n t r o l n y ∗ ) ]; {x − ( x∗x − a ) / 2 , x} ( ∗ końcowy wynik ∗ ) ] Listing 5.3: Szybkie wyznaczenie ciągu przybliżeń pierwiastka w języku Mathematica. Powyższe twierdzenie dowodzi si˛e przy pomocy zasady indukcji. Twierdzenie to pozwala definiować ciagi ˛ bez wypisywania jawnego wzoru na n-ty wyraz. Wystarczy podać wyraz poczatkowy ˛ oraz recept˛e jak z wyrazu n-tego dostać wyraz (n + 1). Mówimy wtedy o rekurencyjnym definiowaniu ciagu. ˛ Twierdzenie 5.4.2 Trójka spełniająca warunki definicji 5.1.1 istnieje dokładnie jedna w tym sensie, że jeśli (N1 , 01 , S1 ) i (N2 , 02 , S2 ) są dwiema takimi strukturami, to istnieje bijekcja f : N1 → N2 taka, że f (01 ) = (02 ) oraz dla każdego n ∈ N1 zachodzi f (S1 (n)) = S2 (f (n)). Dowód: .... 5.4.1 Pierwiastek poprzez ciąg rekurencyjny. Jako ilustracj˛e pożytków z ciagu ˛ zdefiniowanego rekurencyjnie rozważymy nast˛epujac ˛ a,˛ bardzo szybka˛ metod˛e liczenia pierwiastka z liczby a. Używamy w tym celu ciagu ˛ zadanego rekurencyjnie wzorami x0 xn := 1 a + x2n := 2xn √ Można pokazać, że ciag ˛ ten jest zbieżny do a, i to bardzo szybko. Program liczacy ˛ pierwiastek ta˛ metoda˛ napisany w j˛ezyku Mathematica przedstawiono na listingu 5.3. Problem 5.4.3 Jak ocenić pr˛edkość zbieżności? Jak skonstruować ciag, ˛ który b˛edzie możliwie szybko zbieżny do poszukiwanej liczby? Odpowiedzi na pytania tego typu daje analiza numeryczna oraz teoria aproksymacji. Rekurencyjne definiowanie ciagów ˛ dost˛epne jest również w j˛ezykach programowania. Mówi si˛e tam o rekurencyjnym wywoływaniu funkcji, ale chodzi o funkcje z argumentem b˛edacym ˛ liczba˛ naturalna,˛ a wi˛ec w terminologii przyj˛etej w matematyce o ciag. ˛ W j˛ezyku Mathematica definicj˛e rekurencyjna˛ podaje si˛e jako par˛e wzorów. Na ogół bardzo upraszcza to pisanie programu, choć cz˛esto odbija si˛e to na jego efektywności. Na przykład wersja rekurencyjna szybkiego liczenia pierwiastka z listingu 5.3 to Q u i c k S q r t [ a_ , 0 ] = 1 ; Q u i c k S q r t [ a_ , n_ ] : = Module [ { x } , x = Q u i c k S q r t [ a , n − 1 ] ; ( x ^ 2 + a ) / ( 2 ∗ x ) ] ; Piszac ˛ QuickSqrt [2. ,4] √ otrzymujemy przybliżenie 2 z dokładnościa˛ do 5 miejsc po przecinku. W rozwiazaniu ˛ tym jest jednak pewnym problemem jak dobrać wyraz ciagu ˛ by uzyskać żadan ˛ a˛ dokładność. Definicj˛e rekurencyjna QuickSqrt można zapisać jeszcze krócej, bez użycia modułu: 100 ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA. Q u i c k S q r t [ a_ , 0 ] = 1 ; Q u i c k S q r t [ a_ , n_ ] : = ( QuickSqrt [ a , n − 1]^2 + a )/(2∗ QuickSqrt [ a , n − 1 ] ) ; Ćwiczenie komputerowe 5.4.4 ˛ działa. Zastanów si˛e ile razy wywoływana jest funkcja QuickSqrt by obliczyć √ Sprawdź czy i jak to rozwiazanie 2. Wyciagnij ˛ wnioski. czwarty wyraz ciagu ˛ przybliżajacego ˛ 5.4.2 (*)Arytmetyka liczb natualnych Jesteśmy teraz gotowi podać formalne definicje dodawania i mnożenia liczb naturalnych. Sa˛ to definicje rekurencyjne. Wykorzystujemy w nich aksjomatycznie dana˛ funkcj˛e nast˛epnika. Przypomnijmy, że nast˛epnik liczby n oznaczamy n∗ . Operacje dodawania liczb naturalnych definiujemy rekurencyjnie: m+0 m+n m := ∗ (5.3) ∗ (m + n) := (5.4) Liczbę jeden, oznaczaną 1, definiujemy jako następnik zera. Tak więc 1 := 0∗ . Podstawiając zero w miejsce n we wzorze 5.4 i wykorzystując 5.3 ortzymujemy m + 0∗ = (m + 0)∗ = m∗ . Zatem definiując liczbę jeden jako następnik zera, to jest przyjmując 1 := 0∗ otrzymujemy m + 1 = m∗ , co pozwala nam zapisywać następnik n w tradycyjnej formie n + 1. Również rekurencyjnie definiujemy iloczyn: m·0 m·n ∗ := 0 := m · n + m Zwyczajowo znak mnożenia w iloczynie pomijamy, jeśli nie prowadzi to do nieporozumień. Możemy teraz podać formalną definicję nierówności. Definicja 5.4.5 Mówimy, że m jest nie większe (mniejsze lub równe) od n i piszemy m ¬ n jeżeli ∃k ∈ N m + k = n. Mówimy, że m jest mniejsze niż n jeżeli m ¬ n i m 6= n. Podobnie definiujemy podzielność. Definicja 5.4.6 Mówimy, że m dzieli n i piszemy m|n jeżeli ∃k ∈ N m · k = n. Można indukcyjnie pokazać, że w obu powyższych przypadkach jeśli k istnieje to jest jedyne. Nazywamy je odpowiednio n różnicą (dla nierówności) oraz ilorazem (dla podzielności) i oznaczamy odpowiednio n − m i m . Dla p ∈ N ędziemy stosować oznaczenia Np := { n ∈ N | n ­ p }, Ip : = Zauważmy, że w szczególności N0 = N oraz I0 = ∅. { n ∈ N | 1 ¬ n ¬ p }. 5.5. ZBIORY SKOŃCZONE I PRZELICZALNE 5.5 101 Zbiory skończone i przeliczalne Definicja 5.5.1 Mówimy, że zbiór X jest skończony, jeśli istnieje liczba naturalna n ∈ N taka, że zbiór X jest równoliczny ze zbiorem In . Wtedy liczbę n nazywamy mocą zbioru X i piszemy card X = n. Mówimy, że zbiór X jest przeliczalny, jeżeli X jest równoliczny ze zbiorem liczb naturalnych. Definicja 5.5.2 Ciągiem skończonym w zbiorze X nazywamy dowolne odwzorowanie a : Ip → X. 5.6 Rozszerzona zasada indukcji Czasami wzór czy twierdzenie, które chcemy dowieść przy pomocy zasady indukcji nie ma sensu dla liczby zero, czy kilku poczatkowych ˛ liczb naturalnych. Innymi słowy odnosi si˛e do zbioru Np = {p, p + 1, p + 2, . . .}. Co wi˛ecej, przy dowodzeniu wzgl˛ednej prawdziwości twierdzenia dla n w drugim kroku indukcyjnym wygodnie jest skorzystać z założenia indukcyjnego nie tylko dla n − 1, ale dla wszystkich k < n. Poprawność takiego post˛epowania uzasadnia nast˛epujaca ˛ rozszerzona zasada indukcji. Twierdzenie 5.6.1 (Rozszerzona zasada indukcji) Niech p ∈ N oraz Z ⊂ N. Jeżeli zachodzą warunki (i) (ii) p ∈ Z, N p ∩ In ⊂ Z ⇒ n + 1 ∈ Z to Z = Np . Mamy też rozszerzone twierdzenie o rekurencyjnym definiowaniu ciągu. Twierdzenie 5.6.2 (rozszerzone o rekurencyjnym definiowaniu ciągu) Niech f : X → X będzie funkcją, niech c ∈ X i p ∈ N. Wtedy istnieje dokładnie jeden ciąg a : Np → X taki, że ap ∀n ∈ Np an+1 5.7 = c, = f (an ). Silnia i symbol Newtona Jednym z klasycznych pytań matematyki zbiorów skończonych jest pytanie na ile sposobów elementy zbioru n-elementowego X można ustawić w ciag. ˛ Każde takie ustawienie to bijekcja z In do X . Pytamy wi˛ec ile jest możliwych takich bijekcji. Okazuje si˛e, że jest ich n!. Dokładniej, można pokazać nast˛epujace ˛ twierdzenie. Dla n ∈ N definiujemy rekurencyjnie ( 1 n! := n(n − 1)! n = 0, n > 0. Wyrażenie n! czytamy "n silnia". Wyrażenie n! pojawia si˛e w kontekście klasycznego pytania na ile sposobów elementy zbioru n-elementowego X można ustawić w ciag. ˛ Każde takie ustawienie to bijekcja z In do X . Pytamy wi˛ec ile jest możliwych takich bijekcji. Okazuje si˛e, że jest ich n!. Dokładniej, można pokazać nast˛epujace ˛ twierdzenie. 102 ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA. Twierdzenie 5.7.1 Niech X będzie zbiorem skończonym i niech n := card X. Wtedy card { f : In → X | f jest bijekcją } = n! Dla n, k ∈ N definiujemy tzw. symbol Newtona wzorem n n! := . k k!(n − k)! Symbol Newtona ma również teoriomnogościową interpretację. Mamy bowiem następujące twierdzenie Twierdzenie 5.7.2 Niech X będzie zbiorem skończonym o mocy n. Wtedy n card { A ⊂ X | card A = k } = . k Z twierdzenia tego wynika w szczególności, że symbol Newtona jest zawsze liczbą naturalną, tzn. że k!(n − k)! dzieli n!. W programie Mathematica silnię obliczamy stosując tradycyjną notację. Pisząc 50! otrzymujemy 30414093201713378043612608166064768844377641568960512000000000000 Natomiast symbol Newtona obliczymy używając funkcji Binomial. Pisząc Binomial[5, 2] otrzymujemy 52 , czyli 10. Rozdział 6 Struktury porządkowe 6.1 6.1.1 Relacje porządku Częściowy i liniowy porządek Definicja 6.1.1 Relację R w X nazywamy częściowym porządkiem lub krótko porządkiem jeżeli R jest relacją zwrotną, antysymetryczną i przechodnią, a liniowym porządkiem jeżeli dodatkowo R jest spójna. Parę (X, R) nazywamy przestrzenią częściowo uporządkowaną lub krótko przestrzenią uporządkowaną jeżeli R jest częściowym porządkiem w X, a przestrzenią liniowo uporządkowaną jeżeli R jest porządkiem liniowym. Klasę przestrzeni częściowo uporządkowanych oznaczać będziemy Ord, a liniowo uporząkowanych LOrd. Jeśli R jest częściowym porządkiem zwyczajowo będziemy pisać ¬ w miejsce R, a ­ w miejsce R−1 . Ponadto mówić będziemy, że x jest mniejsze od y i pisać x < y jeżeli x ¬ y i x 6= y. Analogicznie mówić będziemy, że x jest większe od y i pisać x > y jeżeli x ­ y i x 6= y. W rozdziale 7.1.3 podamy formalna˛ definicj˛e porzadku ˛ linowego w zbiorze liczb całkowitych Z (wzór (7.4)), a w rozdziale 7.2.3 porzadku ˛ liniowego w zbiorze liczb wymiernych Q (wzór (7.5)). W obu przypadkach b˛eda˛ to porzadki ˛ zgodne z codzienna˛ intuicja˛ zwiazan ˛ a˛ z porównywaniem liczb. Uwaga 6.1.2 Jeśli R jest porządkiem w X, a Y ⊂ X, to RY := R ∩(Y ×Y ) jest porządkiem w Y . Jeśli R jest liniowy, to RY jest liniowy. Porządek RY nazywamy porządkiem indukowanym, a (Y, RY ) nazywamy podprzestrzenią przestrzeni uporządkowanej (X, R). Porzadek ˛ w Z ⊂ Q jest przykładem porzadku ˛ indukowanego z Q. Ćwiczenie 6.1.3 Udowodnić uwagę 6.1.2 Aby zwi˛ekszyć przejrzystość rysunku, rysujac ˛ graf cz˛eściowego badź ˛ liniowego porzadku ˛ pomijamy kraw˛edzie, które sa˛ konsekwencja˛ własności przechodniości i własności zwrotności. Tak otrzymany graf cz˛eściowego porzaku ˛ nazywamy grafem zredukowanym. Jest on bardziej przejrzysty, bo zawiera mniej kraw˛edzi, które w wyobraźni łatwo uzupełnić wykorzystujac ˛ własność zwrotności i przechodniości, Rys. 6.1 przedstawia graf zredukowany przestrzeni liniowo uporzadkowanej ˛ (po lewej) oraz graf zredukowany przestrzeni cz˛eściowo uporzadkowanej ˛ (po prawej). 103 104 ROZDZIAŁ 6. STRUKTURY PORZĄDKOWE Rysunek 6.1: Graf liniowego i częściowego porządku Rysunek 6.2: Przetrzeń częściowo uporządkowana i jej podzbiór A 6.1.2 Majoranty i minoranty Definicja 6.1.4 Niech (X, ¬) będzie przestrzenią częściowo uporządkowaną i niech A będzie podzbiorem X. Mówimy, że x ∈ X jest majorantą zbioru A jeżeli a ¬ x dla każdego elementu a ∈ A. Jeżeli x ∈ A i x jest majorantą A, to x nazywamyelementem największym w A. Z kolei mówimy, że x jest elementem maksymalnym w A jeżeli x ∈ A oraz w A nie istnieje element y większy od x. Analogicznie, odwracając kierunek nierówności, definiujemy minorantę, element najmniejszy i element minimalny. Jeśli w podzbiorze A przestrzeni częściowo uporządkowanej istnieje element największy (najmniejszy) to oznaczamy go max A, (min A). Rys. 6.2 przedstawia przestrzeń cz˛eściowo uporzadkowan ˛ a˛ X oraz jej podzbiór A. W zbiorze A sa˛ dwa elementy maksymalne e oraz f , ale nie ma w nim elementu najwi˛ekszego. Nie ma też majorant. Natomiast elementem najmniejszym zbioru A jest d. Jest to też jedyny element minimalny tego zbioru. Minorantami zbioru A sa˛ elementy a, b, c, d. 6.2. PRZESTRZENIE CIĄGŁE 105 Twierdzenie 6.1.5 Niech (X, ¬) będzie przestrzenią częściowo uporządkowaną i niech A będzie podzbiorem X. (i) Tak element największy jak i najmniejszy w zbiorze A istnieje co najwyżej jeden. (ii) Podzbiór skończony niepusty A przestrzeni częściowo uporząkowanej posiada co najmniej jeden element minimalny i co najmniej jeden element maksymalny w A. (iii) Element maksymalny (minimalny) zbioru liniowo uporządkowanego jest jego elementem największym (najmniejszym). (iv) Podzbiór skończony niepusty przestrzeni liniowo uporządkowanej posiada element największy i element najmniejszy. Dowód: Aby pokazać własnośc (i) przyjmijmy najpierw, że z1 i z2 są elementami największymi w zbiorze A. Z definicji elementu największego wiemy, że z1 jest majorantą A, zatem ∀x ∈ A x ¬ z1 . (6.1) ∀x ∈ A x ¬ z2 . (6.2) Ponieważ z2 też jest największy, więc również Z definicji elementu największego wiemym że z1 , z2 ∈ A. Podstawiając z2 za x w (6.1) dostajemy z2 ¬ z1 . Podobnie z (6.2) dostajemy z1 ¬ z2 . Wobec własności antysymetrii relacji porządku dostajemy z1 = z2 . Zatem element największy jest co najwyżej jeden. Podobnie pokazujemy, że element najmniejszy jest co najwyżej jeden. Własność (ii) pokażemy nie wprost. Przypuśćmy, że w A nie ma elementu maksymalnego. Zatem dla każdego x ∈ A znajdziemy x∗ ∈ A taki, że x∗ > x. Ponieważ A 6= ∅, możemy wybrać element a ∈ A. Rozważmy elementy a < a∗ < a∗∗ < · · · Ponieważ zbiór A jest skończony, więc w tym ciągu nierówności muszą znaleźć się dwa wyrazy równe. Ale równe być nie mogą, bo nierówności są silne. Sprzeczność ta dowodzi, że przypuszcznie iż w A nie ma elementu maksymalnego było fałszywe. Podobnie dowodzimy, że w A musi być element minimalny. Aby pokazać własność (iii) przypuśćmy, że a jest maksymalny w liniowo uporządkowanym zbiorze A i równocześnie nie jest on największy. Zatem istnieje b ∈ A taki, że nie jest prawdą iż b ¬ a. Ponieważ A jest liniowo uporządkowany, z własności spójności wynika, że b > a. Ale to przeczy maksymalności a. Zatem a jest największy Podobnie pokazujemy, że element minimalny zbioru liniowo uporządkowanego jest jego elementem najmniejszym. Aby zakończyć dowód wystarczy zauważyć, że własność (iv) wynika natychmiast z własności (ii) i ( iii). 6.2 Przestrzenie ciągłe Wiemy, że zbiór liczb wymiernych Q jest dziurawy. Brakuje w nim wielu liczb potrzebnych do mierzenia długości: na przykład długości przekatnej ˛ kwadratu lub obwodu okr˛egu. Potrzebujemy "zakleić" te dziury. W tym rozdziale podamy formalna˛ definicj˛e przestrzeni liniowo uporzadkowanej ˛ bez dziur, tzw. przestrzeni ciagłej. ˛ Zbiór Q nie jest przestrzenia˛ ciagła. ˛ W rozdziale 7.3.3 skonstruujemy z liczb wymiernych zbiór liczb rzeczywistych R i pokażemy, że w przeciwieństwie do Q jest on przestrzenia˛ ciagł ˛ a.˛ 6.2.1 Kresy Niech X będzie przestrzenią częściowo uporządkowaną i niech A ⊂ X. Definicja 6.2.1 Mówimy, że zbiór A jest ograniczony od góry (od dołu) jeżeli posiada majorantę (minorantę). 106 ROZDZIAŁ 6. STRUKTURY PORZĄDKOWE Definicja 6.2.2 Mówimy, że x jest kresem górnym (supremum) zbioru A i piszemy x = sup A, jeżeli A jest ograniczony od góry, a x jest jego najmniejszą majorantą. Definicja 6.2.3 Mówimy, że x jest kresem dolnym (infimum) zbioru A i piszemy x = inf A, jeżeli A jest ograniczony od dołu, a x jest jego największą minorantą. Ćwiczenie 6.2.4 • Podaj przykład ilustrujący, że w zbiorze skończonym częściowo uporządkowanym X może być podzbiór A, którego kres dolny (górny) nie istnieje, albo istnieje, ale do A nie należy • Pokaż, że jeśli X jest skończony, liniowo uporządkowany, to dla dowolnego A ⊂ X kres dolny (górny) istnieje i zawsze należy do A. Zobaczymy, że w zbiorach nieskończonych liniowo uporzadkowanych ˛ moga˛ być podzbiory ograniczone, których kresy nie istnieja,˛ badź ˛ istnieja,˛ ale do podzbioru nie należa.˛ 6.2.2 Przedziały Definicja 6.2.5 Niech X będzie przestrzenią częściowo uporządkowaną i niech a, b ∈ X. Przedział otwarty, lewostronnie otwarty, prawostronnie otwarty oraz przedział domknięty o końcach a, b definiujemy odpowiednio wzorami (a, b) := { x ∈ X | a < x i x < b }, (a, b] := { x ∈ X | a < x i x ¬ b }, [a, b) := { x ∈ X | a ¬ x i x < b }, [a, b] := { x ∈ X | a ¬ x i x ¬ b }. Podobnie definiujemy lewy półprzedział otwarty, prawy półprzedział otwarty, lewy półprzedział domknięty, prawy półprzedział domknięty o końcu a odpowiednio wzorami wzorami (−∞, a) := { x ∈ X | x < a }, (a, ∞) := { x ∈ X | a < x }, (−∞, a] := { x ∈ X | x ¬ a }, [a, ∞) := { x ∈ X | a ¬ x }. Należy zwrócić uwagę, że oznaczenie (a, b) na przedział otwarty jest nieodróżnialne od oznaczenia na parę (a, b). Jednak z kontekstu zawsze można będzie ustalić, o którą interpretację chodzi. 6.2. PRZESTRZENIE CIĄGŁE 6.2.3 107 Własność L Mówimy, że niepusty podzbiór A przestrzeni liniowo uporządkowanej X ma własność (L) jeżeli A jest ograniczony od góry oraz x ∈ A i y ¬ x ⇒ y ∈ A. Analogicznie mówimy, że A ma własność (R) jeżeli A jest ograniczony od dołu oraz x ∈ A i y ­ x ⇒ y ∈ A. Uwaga 6.2.6 Każdy lewy półprzedział ma własność (L), a każdy prawy półprzedział ma własność (R). Niepusty, właściwy podzbiór A przestrzeni liniowo uporządkowanej X ma własność (L) wtedy i tylko wtedy gdy X \ A ma własność (R). Pojawia si˛e naturalne pytanie czy w jakiejś przestrzeni liniowo uprzadkowanej ˛ moga˛ istnieć zbiory, które maja˛ własność (L) lub (R), a nie sa˛ przedziałami. Odpowiedź jest twierdzaca. ˛ Zbiór A := { q ∈ Q | q ¬ 0 albo q 2 < 2 } √ ma własność (L), ale nie jest przedziałem, bo ewentualnym końcem tego przedziału musiałby być 2, a wiemy już, że w zbiorze liczb wymiernych takiej liczby nie ma. Zbiór ten jest równocześnie przykładem zbioru ograniczonego od góry, który nie ma (w Q) kresu górnego. Ma on jednak kres górny, do tego zbioru nie √ należacy, ˛ jeśli A potraktujemy jako podzbiór zbioru liczb rzeczywistych. Kresem tym jest w takim przypadku 2. 6.2.4 Przestrzenie ciągłe Definicja 6.2.7 Mówimy, że przestrzeń liniowo uporządkowana X jest przestrzenią ciągłą jeżeli dla każdego niepustego, właściwego podzbioru A tej przestrzeni, który ma własność (L) istnieje a ∈ X takie, że A = (−∞, a) lub A = (−∞, a] co jest równoważne założeniu, że dla każdego niepustego, właściwego podzbioru A tej przestrzeni, który ma własność (R) istnieje a ∈ X takie, że A = (a, ∞) lub A = [a, ∞). Od zbioru liczb rzeczywistych, jakkolwiek go zdefiniujemy, oczekujemy, żeby był przestrzenia˛ liniowo uporzadkowan ˛ a˛ ciagł ˛ a.˛ Twierdzenie 6.2.8 Następujące trzy warunki są parami równoważne. (i) X jest przestrzenią ciągłą. (ii) Każdy niepusty, ograniczony od góry podzbiór X posiada kres górny. (iii) Każdy niepusty, ograniczony od dołu podzbiór X posiada kres dolny. 108 6.3 6.3.1 ROZDZIAŁ 6. STRUKTURY PORZĄDKOWE Funkcje monotoniczne Funkcje rosnące i malejące Definicja 6.3.1 Niech X i Y będą przestrzeniami uporządkowanymi, a f : X → Y niech będzie funkcją. Mówimy, że f jest słabo rosnąca, jeżeli ∀x1 , x2 ∈ X x1 < x2 ⇒ f (x1 ) ¬ f (x2 ), a silnie rosnąca, jeżeli ∀x1 , x2 ∈ X x1 < x2 ⇒ f (x1 ) < f (x2 ). Podobnie, mówimy, że f jest słabo malejąca, jeżeli ∀x1 , x2 ∈ X x1 < x2 ⇒ f (x1 ) ­ f (x2 ), ∀x1 , x2 ∈ X x1 < x2 ⇒ f (x1 ) > f (x2 ). a silnie malejąca, jeżeli Twierdzenie 6.3.2 Niech X będzie przestrzenią liniowo uporząkowaną i niech f : X → X będzie odwracalna. Wtedy jeśli f jest rosnąca (malejąca) to f −1 jest rosnąca (malejąca). 6.4 6.4.1 Liczby kardynalne i porządkowe. Liczby kardynalne. ........................ 6.4.2 Aksjomat wyboru. ........................ 6.4.3 Liczby porządkowe. ........................ Rozdział 7 Struktury algebraiczne. 7.1 7.1.1 Liczby całkowite. Działania W rozdziale 8 podamy formalna˛ definicj˛e zbioru liczb rzeczywistych. Najpierw jednak przyjrzymy si˛e oddzielnie tzw. strukturom algebraicznym formalizujacym ˛ operacje dodawania i mnożenia. Dodawanie i mnożenie liczb to operacje arytmetyczne znane nam dobrze ze szkoły. Z formalnego punktu widzenia operacje te to funkcje, które parom liczb rzeczywistych przyporzadkowuj ˛ a˛ odpowiednio ich sum˛e lub iloczyn. Działaniem dwuargumentowym w zbiorze X lub krótko działaniem nazywamy dowolne odwzorowanie d : X × X → X. W przypadku działania dwuargumentowego zazwyczaj stosujemy tzw. notację infixową, w której symbol działania stawiamy pomiędzy argumentami x d y := d(x, y). Mówimy o działaniach zamiast po prostu o funkcjach dwuargumentowych, bo w przypadku działań zazwyczaj oczekujemy spełnienia pewnych specjalnych własności, modelowanych na własnościach dodawania i mnożenia liczb. Definicja 7.1.1 Działanie d : X × X → X nazywamy łącznym jeżeli ∀x, y, z ∈ X (x d y) d z = x d (y d z), a przemiennym jeżeli ∀x, y ∈ X x d y = y d x. Element e ∈ X nazywamy elementem neutralnym dla działania d, jeżeli ∀x ∈ X e d x = x d e = x. Jeśli d : X × X → X ma element neutralny e to dla x ∈ X mówimy, że x0 jest jego elementem odwrotnym, jeżeli x d x0 = x0 d x = e. Uwaga 7.1.2 Jeśli działanie d : X × X → X ma element neutralny, to jest on dokładnie jeden. Jeśli działanie d jest łączne i ma element neutralny, to element odwrotny do danego elementu może być co najwyżej jeden. 109 110 ROZDZIAŁ 7. STRUKTURY ALGEBRAICZNE. Dowód: Aby pokazać, że element neutralny jest dokładnie jeden należy pokazać, że jeśli dwa elementy spełniają wymogi elementu neutralnego, to są one sobie równe. Załóżmy zatem, że e oraz f są elementami neutralnymi dla działania d. Mamy zatem ∀x ∈ X e d x = x d e = x (7.1) oraz ∀x ∈ X f d x = x d f = x. (7.2) Ponieważ równości w (7.1) zachodzą dla każdego x, więc w szczególności dla x = f mamy e d f = f. Podobnie, po podstawieniu x = e, z równości (7.2) dostajemy e d f = e. Zatem e = f . Dowód drugiej części uwagi jest podobny i zostawiamy go jako ćwiczenie. Tak dodawanie jak i mnożenie liczb możemy traktować jako działania, jeśli odpowiednio dobierzemy zbiór liczb, na przykład sa˛ to działania w zbiorze liczb naturalnych, całkowitych, wymiernych, rzeczywistych, rzeczywistych dodatnich oraz w zbiorze ułamków (liczb wymiernych dodatnich). Mnożenie jest też działaniem w zbiorze ułamków właściwych, czyli liczb wymiernych dodatnich i mniejszych niż jeden. Jednak dodawania nie można już traktować jako działania w tym zbiorze, bo suma dwóch ułamków właściwych może nie być ułamkiem właściwym, np. 23 + 23 = 43 . Tak dodawanie jak i mnożenie liczb sa˛ łaczne ˛ oraz przemienne. Elementem neutralnym dla dodawania liczb jest zero, a dla mnożenia jest jeden. W przypadku mnożenia elementem odwrotnym do x jest x1 , oczywiście o ile x1 ma sens i jest elementem zbioru, w którym mnożenie rozważamy jako działanie. Zero nigdy nie posiada elementu odwrotnego wzgl˛edem mnożenia. Dla pozostałych liczb istnienie elementu odwrotnego wzgl˛edem mnożenia zależy od zbioru, w którym mnożenie rozważamy jako działanie. Na przykład liczba 2 posiada element odwrotny wzgl˛edem mnożenia w zbiorze liczb wymiernych, ale go nie posiada w zbiorze liczb całkowitych. W przypadku dodawania zwyczajowo zamiast o elemencie odwrotnym mówimy o elemecie przeciwnym. Dla liczby x jest nim −x, oczywiście o ile −x jest elementem zbioru, w którym dodawanie rozważamy jako działanie. Elementy przeciwne istnieja˛ dla dodawania rozważanego jako działanie w zbiorze liczb rzeczywistych, wymiernych, całkowitych. Przykład 7.1.3 W zbiorze skończonym działanie można zadać przy pomocy tabelki. Na przykład poniższa tabelka a b c a b a b b a b c c c c a (7.3) zadaje działanie w zbiorze trzyelementowym { a, b, c }. Wartość x d y jest elementem znajdującym się w przecięciu wiersza oznaczonego x i kolumny oznaczonej y. Pakiet Operations umożliwia definiowanie działań w zbiorach skończonych i sprawdzanie, czy działanie ma rozważane własności. Instrukcja Operations ma dwa argumenty. Pierwszy to lista elementów zbioru, w którym określono działanie. Drugi argument to tabelka zadająca działanie, zapisana jako lista wierszy. Wprowadzając op = O p e r a t i o n [ { a , b , c } , { { b , a , c } , { a , b , c } , { b , c , a } } ] definiujemy działanie zadane w tabelce (7.3). Z kolei wprowadzając I s A s s o c i a t i v e [ op ] HasNeutral [ op ] H a s I n v e r s e s [ op ] dowiadujemy się, że działanie to ma element neutralny, ale nie jest łączne i, przynajmniej dla pewnych elementów, nie ma ono elementów odwrotnych. 7.1. LICZBY CAŁKOWITE. 111 Rysunek 7.1: Évariste Galois, 1811-1832, Źródło: Wikipedia Ćwiczenie 7.1.4 odwrotnych. (i) Ustal, które elementy w działaniu rozważanym w przykładzie 7.1.3 nie posiadają elementów (ii) W tabelce (7.3) wystarzczy zamienić miejscami dwa elementy, by otrzymać działanie, które jest łączne, ma element neutralny i wszystkie elementy odwrotne. Ustal jaka to zamiana. 7.1.2 Grupy Wśród wielu różnych działań szczególna˛ rol˛e pełnia˛ działania łaczne ˛ posiadajace ˛ element neutralny oraz elementy odwrotne. Na przykład dodawanie w zbiorze liczb całkowitych oraz mnożenie w zbiorze liczb wymiernych dodatnich sa˛ takimi działaniami. Okazuje si˛e, że jest bardzo wiele działań o takich własnościach, określonych w bardzo różnych zbiorach, w szczególności w zbiorach skończonych. Dlatego warto wyróżnić takie działania wprowadzajac ˛ poj˛ecie grupy. Jednym z pierwszych, którzy pokazali wag˛e tego poj˛ecia był francuski matematyk Évariste Galois (rys. 7.1). Posłużył si˛e on poj˛eciem grupy w celu określenia kiedy daje si˛e wyrazić miejsca zerowe wielomianu przy użyciu czterech operacji arytmetycznych i pierwiastkowania. Definicja 7.1.5 Trójkę (G, d, e) nazywamy grupą jeżeli d : G × G → G jest działaniem spełniającym następujące warunki G1) d jest łączne, G2) e jest elementem neutralnym dla d, G3) każdy element w G posiada element odwrotny. W przypadku gdy spełniona jest jedynie własność G1) trójkę (G, d, e) nazywamy półgrupą. Jeśli spełnione są tylko własności G1) i G2), półgrupę nazywamy półgrupą z jedynką lub monoidem. Grupę (półgrupę) nazywamy przemienną albo abelową, jeżeli działanie d jest przemienne. Przykładem grupy przemiennej jest (Z, +, 0) oraz (R, ·, 1). Grupa˛ przemienna˛ jest też (R+ , ·, 1), natomiast nie jest grupa˛ (N, +, 0), bo dodawanie nie posiada w tym zbiorze elementu przeciwnego(odwrotnego). Z kolei (N, +, 0) jest przykładem półgrupy. 112 ROZDZIAŁ 7. STRUKTURY ALGEBRAICZNE. Ćwiczenie 7.1.6 (*)Niech X będzie ustalonym zbiorem. Pokazać, że zbiór bijekcji X w X ze składaniem odwzorowań jako działaniem jest grupą. Jeśli rozważamy ustaloną grupę lub półgrupę tradycyjnie działanie d oznaczamy ’·’, element neutralny oznaczamy 1, a element odwrotny do x oznaczmy x−1 . W praktyce ’·’ często w ogóle pomijamy. Ponadto dla n ∈ N stosujemy oznaczenia n-krotnie xn x−n z }| { := x · x · · · · · x n := x−1 . Ten system notacji określamy mianem notacji multyplikatywnej. W przypadku grupy lub półgrupy przemiennej tradycyjnie działanie d oznaczamy ’+’, a element neutralny oznaczamy 0. W przypadku tym zamiast o elemencie odwrotnym do x mówimy o elemencie przeciwnym do x i oznaczamy go −x. Ponadto dla n ∈ N stosujemy oznaczenia n-krotnie nx (−n)x }| { z := x + x + · · · + x := n(−x). Ten system notacji określamy mianem notacji addytywnej. Choć formalnie grupa jest trójką składającą się, ze zbioru, działania i elementu zbioru, w praktyce często o samym zbiorze mówimy, że jest grupą, zdając się na domyślność czytelnika co jest brane jako działanie, a co jako element neutralny. 7.1.3 Zbiór liczb całkowitych Wiemy, że aby odejmować bez ograniczeń liczby naturalne, potrzebujemy rozszerzyć zbiór liczb naturalnych o liczby ujemne. Na przykład, żeby wykonać odejmowanie 3 − 5 potrzebujemy liczby −2. Jak formalnie zdefiniować liczb˛e −2 na gruncie tego co już mamy, to jest liczb naturalnych? Można na przykład przyjać, ˛ że liczba −2 to para (3, 5). Przy takiej definicji nie wychodzimy poza poj˛ecia, które już mamy zdefiniowane. Pojawia si˛e jednak problem. Liczba −2 to również wynik odejmowania 7 − 9. Zatem pary (3, 5) i (7, 9) trzeba jakoś utożsamić. Nie możemy postawić warunku 3 − 5 = 7 − 9, bo jeszcze nie zdefiniowaliśmy odejmowania gdy wynik jest ujemny. Ale warunek 3 − 5 = 7 − 9, po przeniesieniu 5 i 7 na druga˛ stron˛e równości, daje warunek równoważny 3 + 9 = 7 + 5, który operuje jedynie dodawaniem liczb naturalnych, a to już mamy zdefiniowane. Sugeruje to, by par˛e (m, n) utożsamić z para˛ (m0 , n0 ) gdy m + n0 = m0 + n i prowadzi do nast˛epujacej ˛ formalnej konstrukcji. Zbiór liczb całkowitych definiujemy jako zbiór klas równoważności Z := { [(m, n)]R | (m, n) ∈ N2 } względem relacji R := { ((m, n), (m0 , n0 )) ∈ N2 × N2 | m + n0 = m0 + n }. Dla n ∈ N wprowadzamy oznaczenie −n := [(0, n)]R oraz utożsamiamy klasę [n, 0]R z liczbą n, co pozwala traktować Z jako rozszerzenie N. Ćwiczenie 7.1.7 (*)Rozszerzyć operację dodawania z N na Z tak by w Z uzyskać strukturę grupy przemiennej. Rozszerzyć operację mnożenia z N \ {0} na Z \ {0} tak by w Z \ {0} uzyskać strukturę półgrupy przemiennej. Dla m, n ∈ Z definiujemy m ¬ n :⇔ n − m ∈ N. (7.4) Łatwo sprawdzić, że definicja ta rozszerza definicję 5.4.5 nierówności w N. Przedziałem w Z o końcach m, n ∈ Z nazywamy zbiór [m, n]Z := { x ∈ Z | m ¬ x ¬ n }. Łatwo zauważyć, że zbiór ten jest niepusty wtedy i tylko wtedy gdy m ¬ n. 7.2. LICZBY WYMIERNE 7.1.4 113 Sumy i iloczyny Niech G będzie półgrupą (w notacji addytywnej lub multyplikatywnej), m, n elementami Z, a x : [m, n]Z → G ciągiem. W przypadku notacji addytywnej definiujemy rekurencyjnie sumę elementów ciągu x wzorem ( n X 0 m>n xi := Pn−1 w przeciwnym razie . i=m xi + xn i=m Analogicznie dla notacji multyplikatywnej definiujemy rekurencyjnie iloczyn elementów ciągu x wzorem ( n Y 1 m>n xi := Qn−1 w przeciwnym razie . i=m xi · xn i=m Często stosujemy też mniej formalną, ale bardziej intuicyjną notację kropkową: xm + xm+1 + . . . + xn xm · xm+1 · . . . · xn := := n X xi i=m Πni=m xi . Dla n ∈ N w przypadku n-krotnie wykonanego działania na elemencie x stosujemy oznaczenie ( 1 n = 0, n x := x · xn−1 n > 0 w przypadku notacji multyplikatywnej oraz oznaczenie ( nx := 0 x + (n − 1)x n = 0, n>0 w przypadku notacji addytywnej. 7.2 Liczby wymierne Mamy już formalnie zdefiniowane liczby naturalne i całkowite. Po drodze wprowadziliśmy poj˛ecie grupy. Widzieliśmy, że choć liczby całkowite z dodawaniem tworza˛ grup˛e, to sa˛ również grupy, które niewiele maja˛ wspólnego z liczbami całkowitymi. Naszym nast˛epnym celem sa˛ liczby wymierne. Liczby wymierne z dodawaniem też tworza˛ grup˛e, a z mnożeniem tworza˛ grup˛e gdy pominiemy zero. Ponadto, operacje dodawania i mnożenia liczb wymiernych sa˛ ze soba˛ powiazane: ˛ n-krotne dodadnie do siebie liczby a to to samo co pomnożenie liczby a przez n, czego konsekwencja˛ jest rozdzielczość mnożenia wzgl˛edem dodawania (a + b) · c = a · c + b · c. Powstaje pytanie, czy sformalizowanie tej koncepcji prowadzi już jednoznacznie do aksjomatyki liczb wymiernych, tak jak to przedstawiliśmy dla liczb naturalnych? 7.2.1 Ciała Definicja 7.2.1 Piątkę (F, +, ·, 0, 1) gdzie 0 6= 1 nazywamy ciałem jeżeli (F, +, 0) oraz (F \ {0}, ·, 1) są grupami przemiennymi, a ponadto zachodzi tzw. prawo rozdzielności mnożenia względem dodawania ∀x, y, z ∈ F (x + y) · z = x · z + y · z. 114 ROZDZIAŁ 7. STRUKTURY ALGEBRAICZNE. Okazuje si˛e, że sa˛ ciała istotnie różne od ciała liczb wymiernych. Jak zobaczymy mamy ciało liczb rzeczywistych, ciało liczb zespolonych, ale co ciekawe, podobnie jak w przypadku grup, sa˛ też ciała skończone. Ćwiczenie 7.2.2 Pokazać, że zbiór {0, 1} z działaniami + i ∗ danymi tabelami + 0 1 0 0 1 1 1 0 * 0 1 0 0 0 1 0 1 jest ciałem. Ciało to zwyczajowo oznaczamy Z2 . 7.2.2 Funkcja potęgowa i wielomian Niech (F, +, ·, 0, 1) będzie ciałem. Dla n ∈ N definiujemy funkcję potęgową ·n : F 3 x 7→ xn ∈ F, a dla a0 , a1 , . . . an ∈ F definiujemy wielomian A o współczynnikach a0 , a1 , . . . an Qa0 ,a1 ,...an : F 3 x 7→ a0 + a1 x + a2 x2 + · · · + an xn ∈ F. Największe n takie, że an 6= 0 nazywamy stopniem wielomianu Q. 7.2.3 Zbiór liczb wymiernych Konstrukcja zbioru liczb wymiernych ze zbioru liczb całkowitych bardzo przypomina konstrukcj˛e liczb całkowitych z liczb naturalnych. Aby zapewnić sobie możliwość dzielenia m/n rozważamy pary (p, q) liczb całkowitych oraz relacj˛e utożsamiajac ˛ a˛ pary (p, q)] i (p0 , q 0 ) gdy pq 0 = qp0 . Zbiór liczb wymiernych definiujemy jako zbiór klas równoważności Q := { [(p, q)]S | (p, q) ∈ Z × N1 } względem relacji S := { ((p, q), (p0 , q 0 )) ∈ (Z × N1 ) × (Z × N1 ) | pq 0 = qp0 }. Dla liczb wymiernych [(p, q)]S , [(p0 , q 0 )]S definiujemy relację nierówności [(p, q)]S ¬ [(p0 , q 0 )]S :⇔ pq 0 ¬ qp0 . (7.5) Łatwo sprawdzić, że definicja ta nie zależy od wyboru reprezentantów i rozszerza definicję nierówności zadaną wzorem (7.4) dla liczb całkowitych. Ćwiczenie 7.2.3 (*)Rozszerzyć operacje dodawania i mnożenia z Z na Q tak by w Q uzyskać strukturę ciała. 7.2.4 Wzory skróconego mnożenia Niniejsze wzory obowiązujące w każdym ciele będą nam wielokrotnie pomocne. Ich indukcyjny dowód pomijamy. Twierdzenie 7.2.4 Niech (F, +, ·, 0, 1) będzie ciałem, a, b ∈ F oraz n ∈ N1 . Wtedy n b −a n = (b − a) n−1 X an−i−1 bi , (7.6) i=0 n (a + b) = n X n i=0 i ai bn−i . (7.7) 7.3. CIAŁO LICZB RZECZYWISTYCH 7.3 115 Ciało liczb rzeczywistych Bardzo użyteczna˛ własnościa˛ dodawania liczb jest zachowywanie nierówności przy operacjach arytmetycznych. Jeśli x ¬ y to x + z ¬ y + z . Z mnożeniem jest podobnie. Nierówność x ¬ y implikuje xz ¬ yz , ale pod dodatkowym warunkiem, że z > 0. Jeśli z < 0, to nie wszystko jest stracone: nierówność si˛e nie zachowuje, ale pojawia si˛e nierówność przeciwna: xz ­ yz . Przypadek z = 0 jest specyficzny: przemnożenie przez zero powoduje, że po obu stronach pojawia si˛e zero. Te użyteczne własności sa˛ konsekwencja˛ faktu, że definicja porzadku ˛ w zbiorach liczbowych posługuje si˛e operacja˛ dodawania, a mnożenie jest powiazane ˛ z dodawaniem własnościa˛ rozdzielności. Jednak jeśli mamy jakieś ciało, a w nim jakiś porzadek, ˛ to nie mamy gwarancji, że nierówności si˛e zachowuja˛ przy wykonywaniu operacji dodawania lub mnożenia w ciele. Dlatego warto wyróżnić te ciała wyposażone w relacj˛e porzadkuj ˛ ac ˛ a,˛ dla których zachowywanie nierówności ma miejsce. 7.3.1 Ciała uporządkowane Definicja 7.3.1 Szóstkę (F, +, ·, 0, 1, ¬) nazywamy ciałem uporządkowanym, jeżeli (F, +, ·, 0, 1) jest ciałem, (F, ¬) jest przestrzenią liniowo uporządkowaną oraz (i) ∀x, y, z ∈ F (ii) ∀x, y ∈ F x ¬ y ⇒ x + z ¬ y + z, x > 0, y > 0 ⇒ xy > 0. Wprowadzamy oznaczenia Q+ := { q ∈ Q | q > 0 }, Q− := { q ∈ Q | q < 0 }. Ćwiczenie 7.3.2 Pokazać, że zbiór liczb wymiernych Q wraz z określonymi wcześniej działaniami dodawania i mnożenia oraz relacją porządku jest ciałem uporządkowanym. Ćwiczenie 7.3.3 Pokazać, że ciało z ćw. 7.2.2 z porządkiem {0 ¬ 0, 0 ¬ 1, 1 ¬ 1} nie jest ciałem uporządkowanym. 7.3.2 Zbiór liczb rzeczywistych Jakkolwiek zdefiniujemy zbiór liczb rzeczywistych, oczekujemy by miał on struktur˛e ciała uporzadkowanego. ˛ Wiemy, że ciało liczb wymiernych z naturalnym porzadkiem ˛ jest ciałem uporzadkowanym. ˛ Pami˛etamy też, że od zbioru liczb rzeczywistych oczekujemy by, w przeciwieństwie do zbioru liczb wymiernych, był przestrzenia˛ uporzadkowan ˛ a˛ ciagł ˛ a.˛ Powstaje pytanie, czy nie żadamy ˛ za dużo, to znaczy czy koncepcja ciała uporzadkowanego ˛ ciagłego ˛ nie jest sprzeczna sama w sobie, a jeśli nie jest, to czy moga˛ być ciała uporzakowane ˛ istotnie różne od liczb rzeczywistych. Odpowiedź zgodna˛ z naszymi oczekiwaniami daje nast˛epujace ˛ twierdzenie. Twierdzenie 7.3.4 Istnieje ciało uporządkowane ciągłe. Jeśli F1 i F2 są dwoma takimi ciałami, to istnieje silnie rosnąca bijekcja f : F1 → F2 taka, że ∀x, y ∈ F1 f (x + y) = f (x) + f (y) oraz f (x · y) = f (x) · f (y). Bijekcja f w powyższym twierdzeniu daje sposób utożsamienia dwóch formalnie różnych ciał uporzadkowanych. ˛ Można wi˛ec powiedzieć, że z dokładnościa˛ do utożsamienia poprzez bijekcj˛e f istnieje dokładnie jedno ciało uporzadkowane ˛ ciagłe. ˛ Jest nim intuicyjnie rozważany od rozdziału wst˛epnego zbiór liczb rzeczywistych z naturalnymi działaniami dodawania i mnożenia oraz naturalnym porzadkiem. ˛ Definicja 7.3.5 Ciałem liczb rzeczywistych nazywamy ciało uporządkowane ciągłe. Ciało to oznaczamy R. 116 ROZDZIAŁ 7. STRUKTURY ALGEBRAICZNE. 7.3.3 (*)Konstrukcja Cauchy’ego Dowód tw. 7.3.4 nie jest prosty. Ograniczymy się jedynie do podania szkicu konstrukcji liczb rzeczywistych pochodzącej od Cauchy’ego. Pierwsze konstrukcje ciała liczb rzeczywistych podali Cauchy, Dedekind i Weierstrass. Konstrukcja Cauchy’ego opiera się na pojęciu ciągu Cauchy’ego. Definicja 7.3.6 Ciąg x : N → Q nazywamy ciągiem Cauchy’ego jeżeli ∀ ∈ Q+ ∃N ∈ N ∀m, n ∈ N m, n ­ N ⇒ |xm − xn | < . Dla ciągów x, y : N → Q definiujemy sumę x + y i iloczyn x · y wzorami x+y x·y : N 3 n 7→ xn + yn ∈ Q, : N 3 n 7→ xn · yn ∈ Q oraz nierówność x ¬ y :⇔ ∀ ∈ Q+ ∃N ∈ N ∀n ∈ N n ­ N ⇒ xn − ¬ yn . W zbiorze ciągów Cauchy’ego wprowadzamy relację równoważności x ∼ y :⇔ ∀ ∈ Q+ ∃N ∈ N ∀n ∈ N n ­ N ⇒ |xn − yn | < . Zbór liczb rzeczywistych według Cauchy’ego definiujemy jako R := { [x]∼ | x : N → Q ciąg Cauchy’ego. } Liczbę wymierną q ∈ Q utożsamiamy z klasą równoważności ciągu stale równego q. Część II Granice 117 Rozdział 8 Liczby rzeczywiste i liczby zespolone 8.1 Ciało liczb rzeczywistych. W części pierwszej, na gruncie teorii mnogości naszkicowaliśmy jak konstruuje się liczby rzeczywiste i dowodzi ich własności. Rozpoczynając czytanie bezpośrednio od części drugiej możemy się oprzeć na następujących definicjach. Definicja 8.1.1 Ciało liczbowe F to zbiór liczb z dwuargumentowymi działaniami + (dodawanie), · (mnożenie) i wyróżnionymi liczbami 0 (zero) i 1 (jeden) taki, że • dla dowolnego x ∈ F x+0 = x·1 x = x • dla dowolnego x ∈ F istnieje x0 ∈ F , zwyczajowo oznaczane −x, takie że x + x0 = 0 • dla dowolnego x ∈ F \ {0} istnieje x00 ∈ F , zwyczajowo oznaczane x · x00 = 1 x, takie że 1 • dla dowolnych x, y ∈ F x+y = y+x x·y = y·x • dla dowolnych x, y, z ∈ F (x + y) + z (x · y) · z (x + y) · z 119 = x + (y + z) = x · (y · z) = x·z+y·z 120 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE Definicja 8.1.2 Ciało liczbowe uporządkowane to ciało liczbowe F dodatkowo z dwuargumentową relacją > (większe) takie, że • dla dowolnych x, y ∈ F x>0∧y >0 ⇒ x·y >0 • dla dowolnych x, y, z ∈ F x>y ⇒ x + z > y + z. Piszemy x ­ y jako skrót x > y ∨ x = y. Dla wygody wprowadzamy też oznaczenie x ¬ y dla y ­ x oraz x < y dla y > x. Mówimy, że b ∈ F jest majorantą zbioru X ⊂ F jeśli dla każdego x ∈ X mamy x ¬ b. Mówimy, że zbiór X ⊂ F jest ograniczony od góry, jeśli ma majorantę. Mówimy, że a ∈ F jest kresem górnym zbioru X i piszemy a = sup X jeżeli a jest majorantą zbioru X i zbiór ten nie posiada mniejszej majoranty. Analogicznie definiujemy minorantę, zbiór ograniczony od dołu i kres dolny, który oznaczamy inf A. Definicja 8.1.3 Ciało liczb rzeczywistych R to ciało liczbowe uporządkowane o tej własności, że każdy niepusty ograniczony podzbiór x ⊂ R posiada kres górny. 8.1.1 Podzbiory R Zbiór naturlanych N utożsamiamy ze zbiorem liczb postaci n razy z }| { { x ∈ R | x = 1 + 1 + . . . + 1 }. Zbiór Z utożsamiamy ze zbiorem { x ∈ R | x ∈ N lub − x ∈ N }. Zbiór Q utożsamiamy ze zbiorem { x ∈ R | ∃p ∈ Z ∃q ∈ N1 x = p · q −1 }. Wprowadzamy oznaczenia R+ := { x ∈ R | x > 0 }, − := { x ∈ R | x < 0 }, ∗ := { x ∈ R | x ­ 0 }. R R 8.2 Liczby reprezentowalne W pamięci komputera możemy reprezentować jedynie pewien skończony podzbiór zbioru liczb. Używane są różne podzbiory. W przypadku liczb, na których operuje procesor są to pewne podzbiory zbioru liczb całkowitych oraz pewne podzbiory zbioru liczb wymiernych, najczęściej liczby całkowite typu int oraz wymierne typu double. Do reprezentacji liczb typu int używa się zazwyczaj 32 cyfr dwójkowych, czyli inaczej bitów (rys.8.1). Sama liczba zapisana jest przy pomocy 31 bitów, a 32-gi bit używany jest do zapisania znaku. Pozwala to na zapisywanie liczb całkowitych z zakresu −2147483648 do +2147483647. 8.2. LICZBY REPREZENTOWALNE 121 Rysunek 8.1: 32-bitowe słowo (4 bajty) używane do reprezentacji liczb typu int. Rysunek 8.2: 64-bitowe słowo (8 bajtów) używane do reprezentacji liczb typu double. Liczby typu double przechowywane są zazwyczaj na 64 bitach, z czego jeden bit reprezentuje znak s, 11 bitów cechę N , a pozostałe 52 mantysę m będącą ułamkiem o mianowniku 252 z przedziału [1, 2) (rys.8.2). Umożliwa to zapisywanie liczb w postaci x = sm2N , a także, przy pomocy specjalnego kodu, liczby zero. Wykorzystanie cechy i mantysy pozwala na przybliżanie liczb o bardzo dużym zakresie, od bardzo małych, rzędu 10−323 , do bardzo dużych, rzędu 10308 , przy zachowaniu w miarę stałej dokładności, wynoszącej około 15 cyfr znaczących. Większość języków programowania zadowala się takim systemem liczb reprezentowalnych jaki jest dostępny na poziomie procesora. Tak jest na przykład w języku C++. Takie podejście jest wystarczające do większości zastosowań. Jeśli jednak z jakiegoś powodu zachodzi potrzeba stosowania większej dokładności w obliczeniach, zawsze można skorzystać z biblioteki udostępniającej liczby reprezentowalne reprezentowane na dowolnej ilości bitów, ograniczonej nie wielkością słowa maszynowego ale jedynie całkowitą ilością wolnej pamięci. Jedyne co przy takim rozwiązaniu tracimy to czas obliczeń, który jest istotnie wolniejszy niż w przypadku obliczeń wykonywanych na pojedynczych słowach maszynowych. Specjalizowane programy do matematyki obliczeniowej, takie jak Mathematica mają tego typu biblioteki wbudowane. Na przykład, aby pomnożyć przez siebie dwie liczby 25-cyfrowe wystarczy napisać 1234567890123456789012345∗1234567890123456789012345. Natychmiast otrzymujemy wynik 1524157875323883675049533479957338669120562399025 Pisząc 2^200 otrzymujemy 1606938044258990275541962092341162602522202993782792835301376 Możliwa jest też zamiana ułamka na liczbę dziesiętną o dowolnie wysokiej dokładności. Na przykład pisząc N[ 1 / 2 3 , 5 0 ] otrzymujemy przybliżenie ułamka 1 23 0.043478260869565217391304347826086956521739130434783 122 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE z dokładnością do 50 cyfr. Tam gdzie liczy się prędkość obliczeń (na przykład, gdy musimy policzyć nie jeden pierwiastek, ale miliony pierwiastków jako część innego zadania) zamiast języków interpretowanych, takich jak Mathematica, używamy języków kompilowanych. Współcześnie wszędzie tam, gdzie kluczowa jest szybkość obliczeń prym wiedzie język C++, choć na przykład fizycy preferują jeszcze szybszy, ale nieco już sędziwy język Fortran. Najszybszy kod można uzyskać stosując bezpośrednio język maszynowy, ale pisanie w nim programów jest wyjątkowo żmudne. Listingi 8.1 i 8.2 prezentują nasz algorytm liczenia pierwiastka metodą brutalnej siły napisany w języku C++. Działa on z dokładnością do 10−4 . Większej dokładności w oparciu o użyty w nim standardowy typ całkowitoliczbowy int nie da się uzyskać, bo dla n >= 100000 wyrażnie p ∗ n ∗ n nie może być policzone poprawnie gdy reprezentowane jest jako typ int. Odpowiednik programu z listingu 5.3 napisany w języku C++ przedstawono na listingu 8.3. 8.3 Funkcja potęgowa w R n razy }| { z Dla n ∈ N przyjmujemy oznaczenie xn := x · x · · · · · x. Funkcję R 3 x 7→ xn ∈ R nazywamy funkcją potęgową. Uwaga 8.3.1 Mamy następujące własności funkcji potęgowej w R (i) ∀x ∈ R (ii) ∀x ∈ R x2 ­ 0, x2 = 0 ⇔ x = 0, (iii) ∀x, y, z ∈ R x > 0, y < z ⇒ xy < xz, (iv) ∀x, y, z ∈ R x < 0, y < z ⇒ xy > xz, (v) ∀x ∈ R x > 0 ⇒ x−1 > 0. Dowód: ćwiczenie. Twierdzenie 8.3.2 Funkcja potęgowa na zbiorze R∗ jest silnie rosnąca, tzn. ∀n ∈ N1 ∀x, y ∈ R∗ : 0 ¬ x < y ⇒ xn < y n Dowód: Dowód poprowadzimy indukcyjnie względem n. Dla n = 1 teza pokrywa się z założeniem, więc implikacja jest oczywiście prawdziwa. Załóżmy zatem, że dla pewnego k ∈ N mamy ∀x, y ∈ R∗ x < y ⇒ xk < y k . (8.1) Chcemy pokazać, że ∀x, y ∈ R∗ x < y ⇒ xk+1 < y k+1 . (8.2) k k Rozważmy więc x, y ∈ R takie, że x < y. Z założenia indukcyjnego (8.1) wnosimy, że x < y . Stosując dwukrotnie własność (ii) ciała uporządkowanego dostajemy xk+1 = xk x < y k x < y k y = y k+1 . Zatem xk+1 < y k+1 co dowodzi, że implikacja (8.2) zachodzi. Zatem na mocy zasady indukcji twierdzenie zostało udowodnione. 8.3. FUNKCJA POTĘGOWA W R 123 /∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ SqrtTwoBf . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ /∗ Obliczanie przybliżenia pierwiastka z 2 ∗/ /∗ metodą b r u t a l n e j s i ł y ∗/ /∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗/ /∗ Tu włączamy standardową b i b l i o t e k ę w e j ś c i a w y j ś c i a ∗/ #include <i o s t r e a m > /∗ I podpinamy tak zwaną standardową p r z e s t r z e ń nazw . Bez t e g o nazwy t a k i e j a k c o u t p o n i ż e j m u s i e l i b y ś m y p i s a ć j a k o s t d : : c o u t ∗/ using namespace s t d ; /∗ Właściwy p o c z ą t e k programu . Program główny w C++ ma zawsze nazwę main . Pomiędzy nawiasami ( i ) może być l i s t a ewentualnych argumentów ( danych w e j ś c i o w y c h ) . W naszym przypadku j e s t ona p u s t a . Słowo i n t p r z e d main o z n a c z a typ z w r a c a n e j w a r t o ś c i , k t ó r y musi tu być , a l e nas n i e i n t e r e s u j e . Sam program m i e ś c i s i ę pomiędzy nawiasami { i } ∗/ i n t main ( ) { /∗ Deklarujemy i i n i c j a l i z u j e m y t r z y zmienne typu i n t ∗/ i n t a =2,n=10000 , i=n ; /∗ Jak długo s p e ł n i o n y j e s t warunek zwiększamy zmienną i . Taka k o n s t r u k c j a nazywana j e s t p ę t l ą w h i l e . W t e j p ę t l i wykonywana j e s t t y l k o j e d n a i n s t r u k c j a , z w i ę k s z e n i a z m i e n n e j i o j e d e n . Znak = n i e p e ł n i tu r o l i porównania ( wtedy d o s t a l i b y ś m y s p r z e c z n o ś ć 0=1) t y l k o p r z y p i s a n i a : z a w a r t o ś ć i z a s t ą p p r z e z i +1 ∗/ while ( i ∗ i<=a ∗n∗n ) i=i +1; /∗ O s t a t n i a dobra w a r t o ś ć z m i e n n e j i była m n i e j s z a o j e d e n . Poprawiamy i=i −1; ∗/ /∗ Wyprowadzamy zmienną i , t e k s t " / " , zmienną n o r a z znak nowej l i n i i na standardowe w y j ś c i e ∗/ c o u t << i << "/" << n << e n d l ; /∗ Koniec programu ∗/ } Listing 8.1: Obliczania pierwiastka metodą brutalnej siły w C++ 124 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE /∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ S q r t B f P l u s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ /∗ U s p r a w n i e n i e programu SqrtTwoBf . cpp ∗/ /∗ Zamiast z a c z y n a ć d o b i e r a n i e w a r t o ś c i z m i e n n e j i ∗/ /∗ od 1 , zaczynamy od p o p r z e d n i e j z n a l e z i o n e j ∗/ /∗ w a r t o ś c i ∗/ /∗ ∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗/ #include <i o s t r e a m > /∗ Włączenie dodatkowej b i b l i o t e k i z a w i e r a j ą c e j m. i n . s e t p r e c i s i o n w y j a ś n i o n e d a l e j ∗/ #include <iomanip> using namespace s t d ; /∗ Podprogram o b l i c z a j ą c y p i e r w i a s t e k z l i c z b y a . Przyjmuje on w a r t o ś ć j a k o argument typu d o u b l e . Wartość zwracana j e s t t e ż typu d o u b l e ∗/ double S q r t B f P l u s ( double a ) { /∗ Ustawiamy p r e c y z j ę na 14 c y f r ∗/ double p = 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 . 0 ; /∗ Deklarujemy dwie zmienne l o k a l n e typu z m i e n n o p o z y c y j n e g o ∗/ double n=1 , i =1; /∗ P ę t l ę przerwiemy i n s t r u k c j ą break p o n i ż e j ∗/ while ( true ) { /∗ Dopóki kwadrat z i /n n i e p r z e k r a c z a a zwiększamy i ∗/ while ( i ∗ i<=a ∗n∗n ) i=i +1; /∗ O s t a t n i e dobre i b y l o m n i e j s z e o j e d e n ∗/ i=i −1; /∗ i /n j e s t naszym kolejnym p r z y b l i ż e n i e m p i e r w i a s t k a ∗/ c o u t << i /n << e n d l ; /∗ Gdy o s i ą g n i e m y żądaną p r e c y z j ę , przerywamy p ę t l ę ∗/ i f ( n>=p ) break ; /∗ Zwiększamy n o r a z i 10− k r o t n i e ∗/ n=n ∗ 1 0 ; i=i ∗ 1 0 ; /∗ Koniec bloku . Zawracamy i podejmujemy próbę k o l e j n e g o p r z e j ś c i a i n s t r u k c j i w bloku . Ponieważ n w każdym kolejnym p r z e j ś c i u j e s t 10− k r o t n i e w i ę k s z e , n i e będziemy t e g o na s z c z ę ś c i e r o b i ć w n i e s k o ń c z o n o ś ć . . . ∗/ } /∗ Zwracamy wynik ∗/ return i /n ; /∗ Koniec podprogramu ∗/ } /∗ Program główny ∗/ i n t main ( ) { /∗ Ustalamy d o k ł a d n o ś ć wyprowadzanych wyników na 15 c y f r ∗/ c o u t << s e t p r e c i s i o n ( 1 5 ) ; /∗ Deklarujemy j e d n ą zmienną typu d o u b l e ∗/ double a ; /∗ Wyprowadzamy t e k s t na standardowe w y j ś c i e ∗/ c o u t << " Podaj liczbe naturalna : " ; /∗ Wprowadzamy w a r t o ś ć z m i e n n e j a z k l a w i a t u r y ∗/ c i n >> a ; /∗ Uruchamiamy podprogram ∗/ c o u t << " Pierwiastek z " << a << " wynosi " << S q r t B f P l u s ( a ) << "\n" ; /∗ Koniec programu ∗/ } Listing 8.2: Usprawnione podejście do obliczania pierwiastka w C++ 8.3. FUNKCJA POTĘGOWA W R 125 /∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗ SqrtBfQuick . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ /∗ Szybki sposób l i c z e n i a p i e r w i a s t k a ∗/ /∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗/ #include <i o s t r e a m > #include <iomanip> using namespace s t d ; /∗ Podprogram o b l i c z a j ą c y w a r t o ś ć bezwzględną ∗/ double abs ( double x ) { i f ( x>=0) return x ; e l s e return −x ; } /∗ Podprogram o b l i c z a j ą c y p i e r w i a s t e k z l i c z b y a ∗/ double SqrtBfQuick ( double a ) { double x=a ; /∗ Dopóki w a r t o ś ć bezwzględna r ó ż n i c y kwadratu p r z e k r a c z a 10 w p o t ę d z e −15 z a p i s a n e w p o s t a c i w y k ł a d n i c z e j j a k o 1 e −15 ∗/ while ( abs ( x∗x−a)>1e −15){ x=(x∗x+a ) / ( 2 ∗ x ) ; c o u t << x << e n d l ; } return x ; } /∗ Po czątek głównego programu ∗/ i n t main ( ) { c o u t << s e t p r e c i s i o n ( 1 5 ) ; double a ; c o u t << " Podaj liczbe dodatnia : " ; c i n >> a ; c o u t << " Pierwiastek z " << a << " wynosi " << SqrtBfQuick ( a ) << "\n" ; } Listing 8.3: Szybkie wyznaczenie ciągu przybliżeń pierwiastka w C++. 126 8.3.1 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE Nierówność Bernoullego Poniższa nierówność przyda si˛e nam w dowodzie twierdzenia 8.9.2, o zbieżności ciagu ˛ o wyrazach 1 + Jacob Bernoulli(rys. 8.9). 1 n . n Jej autorem jest słynny matematyk szwajcarski Twierdzenie 8.3.3 ∀n ∈ N1 ∀x ∈ R : x > −1 ⇒ (1 + x)n ­ 1 + nx Dowód: (*) Dowód poprowadzimy indukcyjnie względem n. Dla n = 1 nierówność jest oczywista. Załóżmy, że zachodzi ona dla pewnego k ∈ N i wszystkich x > −1. Ustalmy y > −1. Na mocy założenia (1 + y)k ­ 1 + ky. (8.3) Ponieważ y + 1 > 0, więc mnożąc nierówność (8.3) obustronnie przez y + 1 dostajemy (1 + y)k+1 ­ (1 + ky)(1 + y) = 1 + (k + 1)y + ky 2 ­ 1 + (k + 1)y, co dowodzi, że teza zachodzi dla n = k + 1 i kończy dowód indukcyjny. 8.4 Wartość bezwzględna Definicja 8.4.1 Dla x ∈ R definiujemy wartość bezwzględną x jako ( x gdy x ­ 0, |x| := −x gdy x < 0. Twierdzenie 8.4.2 Niech x, y, a ∈ R. Wtedy |x| = | − x|, |x| ­ 0, −|x| ¬ x ¬ |x|, |x| = 0 ⇔ x = 0, |x| ¬ a ⇔ −a ¬ x ¬ a, |x| ­ a ⇔ x ¬ −a lub x ­ a, ||x| − |y|| ¬ |x ± y| ¬ |x| + |y|, √ x2 = |x|. |xy| = |x||y|, (8.4) (8.5) (8.6) (8.7) (8.8) Dowód: Własności (8.4), (8.5), (8.6) i (8.8) są oczywiste gdy rozważy się oddzielnie przypadki x ­ 0 i x < 0. Aby pokazać (8.7) najpierw udowodnimy, że dla dowolnych x, y ∈ R mamy |x + y| ¬ |x| + |y|. (8.9) Z własności (8.4) mamy −|x| ¬ x ¬ |x| i − |y| ¬ y ¬ |y|. Z własności ciała uporządkowanego mamy zatem −(|x| + |y|) ¬ x + y ¬ |x| + |y|. Zatem z (8.6) dostajemy (8.9). Ponieważ (8.9) zachodzi dla dowolnych x, y ∈ R, więc w szczególności możemy podstawić w (8.9) x − y za x. W efekcie dostajemy |x| = |(x − y) + y| ¬ |x − y| + |y|. 8.5. TWIERDZENIE O ISTNIENIU PIERWIASTKA. 127 Podobnie otrzymujemy |y| ¬ |y − x| + |x|, skąd wnosimy, że |x| − |y| ¬ |x − y| i |y| − |x| ¬ |y − x| = |x − y|. Zatem z (8.6) dostajemy ||x| − |y|| ¬ |x − y|, a także ||x| − |y|| = ||x| − | − y|| ¬ |x − (−y)| = |x + y|, co kończy dowód własności (8.7). 8.5 Twierdzenie o istnieniu pierwiastka. Naszym celem√w tym rozdziale jest udowodnienie, że w zbiorze liczb rzeczywistych dodatnich pierwiaski istnieja.˛ W szczególności ostatecznie zamkniemy spraw˛e sensowności 2. Nim jednak twierdzenie to udowodnimy potrzebujemy dwa pomocniczne twierdzenia: własność Archimedesa oraz g˛estość Q w R. 8.5.1 Własność Archimedesa Twierdzenie 8.5.1 Ciało liczb rzeczywistych ma własność Archimedesa, tzn. ∀a, b ∈ R+ ∃n ∈ N na > b. Dowód: (*) Dowód poprowadzimy nie wprost. Załóżmy zatem, że istnieją liczby rzeczywiste dodatnie a, b takie, że dla każdej liczby naturalnej n zachodzi na ¬ b. Oznacza to, że b jest majorantą zbioru A := { x ∈ R | ∃n ∈ N x = na }. Niech c := sup A będzie jego kresem gónym. Ponieważ c − a < c, więc c − a nie jest majorantą zbioru A. Zatem znajdziemy n0 ∈ N takie, że n0 a > c − a. Ale wtedy (n0 + 1)a > c, a w konsekwencji c nie jest majorantą A, a tym bardziej kresem górnym zbioru A. Otrzymana sprzeczność dowodzi twierdzenia. Wniosek 8.5.2 Ciało liczb wymiernych ma wartość Archimedesa. Dowód: ćwiczenie. 8.5.2 Gęstość zbioru w zbiorze Definicja 8.5.3 Niech X będzie przestrzenią liniowo uporządkowaną, a A niech będzie podzbiorem X. Mówimy, że A jest gęsty w X jeżeli ∀x, y ∈ X x < y ⇒ ∃z ∈ A x < z < y. Gdy A = X, mówimy, że A jest gęsty w sobie. Twierdzenie 8.5.4 Zbiór liczb wymiernych jest gęsty w zbiorze liczb rzeczywistych. 128 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE Dowód: Niech x, y ∈ R będą takie, że x < y. Możliwe są trzy przypadki x < 0 < y lub 0 ¬ x < y lub x < y ¬ 0. W pierwszym przypadku teza jest oczywista, bo zero jest liczbą wymierną. Rozważmy drugi przypadek. Niech a := y −x > 0. Z własności Archimedesa znajdziemy liczbę naturalną n taką, że na > 1. Wtedy n1 < a. Również z własności Archimedesa wniosimy, że zbiór A := { k ∈ N | k n1 > x } jest niepusty. Niech m := min A. Wtedy m − 1 6∈ A. W szczególności m−1 n ¬ x oraz m m−1 1 1 = + ¬ x + < x + a = y. n n n n m Zatem x < m n < y, a ponieważ oczywiście n ∈ Q, teza w tym przypadku zachodzi. Pozostaje rozważyć trzeci przypadek. Wtedy 0 ¬ −y < −x, zatem z rozważonego już przypadku znajdziemy z ∈ Q takie, że −y < z < −x. Ale wtedy x < −z < y i oczywiście −z ∈ Q co kończy dowód twierdzenia. 8.5.3 Pierwiastki Teraz możemy już udowodnić twierdzenie o istnieniu n-tego pierwiastka Twierdzenie 8.5.5 (o istnieniu n-tego pierwiastka) ∀n ∈ N1 ∀x ∈ R∗ ∃!y ∈ R∗ : yn = x Dowód: (*) Pokażemy najpierw, że pierwiastek istnieje co najwyżej jeden. Dla dowodu nie wprost, przyjmijmy, że istnieją y1 , y2 ∈ R∗ takie, że y1 6= y2 oraz y1n = y2n . Dla ustalenia uwagi możemy przyjąć, że y1 < y2 (dowód gdy y1 > y2 jest analogiczny). Na mocy twierdzenia 8.3.2 mamy y1n < y2n co przeczy y1n = y2n i dowodzi jednoznaczności. Dla dowodu istnienia zauważmy najpierw, że 0n = 0, zatem teza jest oczywista gdy x = 0. Możemy więc założyć, że x > 0. Rozważmy zbiór E := { u ∈ R∗ | un < x }. Oczekujemy, że kres górny tego zbioru jest poszukiwanym pierwiastkiem. Musimy jednak najpierw pokazać, że E jest zbiorem niepustym i ograniczonym od góry. x Pokażemy, że E 6= ∅. Niech t := x+1 . Mamy 0 < t < 1 oraz t < x. Mnożąc nierówności 0 < t < 1 obustronnie przez t > 0 dostajemy z własności ciała uporządkowanego dostajemy 0 < t2 < t. Ale t < 1, zatem 0 < t2 < 1. Rozumując indukcyjnie stwierdzamy, że również 0 < tn−1 < 1. Mnożąc tę nierówność obustronnie przez t >) dostajemy tn < t. Zatem tn < x co oznacza, że t ∈ E. Tak więc E 6= ∅. Pokażemy z kolei, że 1 + x jest majorantą zbioru E. Gdyby tak nie było, znaleźlibyśmy s ∈ E, takie, że s > 1 + x. Wtedy sn > s > x. Zatem s 6∈ E. Otrzymana sprzeczność pokazuje, że 1 + x rzeczywiście jest majorantą zbioru E, zatem E jest ograniczony od góry. Zatem ma kres górny. Połóżmy y := sup E. Pokażemy, że rzeczywiście y n = x. Dla dowodu nie wprost załóżmy, że y n 6= x. Mamy do rozważenia dwa przypadki: y n < x lub y n > x. Rozważmy najpierw przypadek y n < x. Liczymy teraz, że da si˛e skonstruować y1 > y takie, że y1n < y , co przeczyłoby y = sup E . Naturalne jest poszukiwać y1 w postaci y1 = y + h. Pytanie jak dobrać h? Mamy mieć (y + h)n < x co jest równoważne (y + h)n − y n < x − y n . Wiemy ze wzoru (7.6), że (y + h)n − y n = h (y + h)n−1 + (y + h)n−2 y + · · · y n−1 < hn(y + h)n . Zatem, dla h < 1 mamy (y + h)n − y n < hn(y + 1)n . (8.10) 8.6. ROZSZERZONY ZBIÓR LICZB RZECZYWISTYCH 129 Stad, ˛ by zagwarantować (8.10), wystarczy zapewnić, że hn(y + 1)n < x − y n , a w tym celu wystarczy wziać ˛ h< x−y n n(y+1)n . Jesteśmy teraz gotowi, by ze zrozumieniem wrócić do formalnego dowodu. Dobierzmy h ∈ Q takie, że 0 < h < min{1, x − yn }. n(y + 1)n Istnienie takiego h zapewnia nam gęstość Q w R (twierdzenie 8.5.4). Łatwo sprawdzamy, że wtedy (y + h)n − y n < hn(y + 1)n < x − y n . Zatem (y + h) < x, czyli y + h ∈ E. Ale y + h > y = supE, skąd y + h 6∈ E. Otrzymana sprzeczność wyklucza nierówność y n < x. Pozostaje pokazać, że nierówność y n > x też prowadzi do sprzeczności. Tym razem liczymy, że uda si˛e skonstruować y2 < y , również b˛edace ˛ majoranta˛ zbioru E , co doprowadzi do sprzeczności z faktem, że y jako kres górny jest najmniejsza˛ majoranta.˛ Poszukujemy y2 w postaci y − k . Chcemy mieć (y − k)n > x co jest równoważne postulatowi y n − (y − k)n < y n − x Rozpisujac ˛ podobnie jak poprzednio mamy y n − (y − k)n = k y n−1 + y n−2 (y − k) + · · · + (y − k)n−1 < kny n−1 . Podpowiada to jak dobrać k . Dobierzmy k ∈ Q takie, że 0<k< yn − x . ny n−1 Łatwo sprawdzamy, że przy tak dobranym k mamy (y − k)n > x. Twierdzimy, że y − k jest majorantą zbioru E. Gdyby tak nie było, znaleźlibyśmy v ∈ E takie, że v > y − k. Ale wtedy v n > (v − k)n > x, co przeczy v ∈ E. Zatem y − k rzeczywiście jest majorantą zbioru E. Ale y − k < y, skąd y nie jest najmniejszą majorantą E< zatem y 6= sup E. Otrzymana sprzeczność dowodzi, że y n = x. √ Nieujemną liczbę, której n-ta potęga jest równa liczbie x ­ 0 nazywamy n-tym pierwiastkiem z x i oznaczamy n x. Twierdzenie 8.5.6 ∀n ∈ N1 ∀x, y ∈ R∗ : √ n xy = √ √ n xny Dowód: ćwiczenie. W programie Mathematica pierwiastek kwadratowy z√x zapisujemy jako Sqrt[x]. Nie ma natomiast podobnej notacji n dla pierwiastków stopnia wyższego niż dwa. Aby policzyć x piszemy x^(1/n). Notacja ta bierze si˛e stad, ˛ że, jak wkrótce zobaczymy, √ 1 n funkcj˛e pot˛egowa˛ można rozszerzyć na wykładniki rzeczywiste i wtedy x = x n . 8.6 8.6.1 Rozszerzony zbiór liczb rzeczywistych R uzupełniony o −∞ i +∞ Aby brać kres górny lub dolny podzbioru R trzeba sprawdzać czy jest on ograniczony odpowiednio od góry lub dołu. Jest to niewygodnie, dlatego przydaje si˛e zbiór liczb rzeczywistych rozszerzony o plus i minus nieskończoność. W takim rozszerzonym zbiorze każdy podzbiór ma kres górny lub dolny. Jest nim zwykła liczba gdy zbiór jest ograniczony, a plus lub minus nieskończoność jeśli jest nieograniczony od góry lub nieograniczony od dołu. 130 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE Definicja 8.6.1 Definiujemy rozszerzony zbiór liczb rzeczywistych jako R̄ := R ∪ {−∞, ∞}. Ponadto przyjmujemy, że dla każdego x ∈ R − ∞ < x < ∞. Uwaga 8.6.2 Każdy niepusty podzbiór R̄ posiada kresy. Definicja 8.6.3 W R̄ definiujemy następujące działania: (i) Dla x ∈ R x + ∞ := ∞, x − ∞ := −∞, x ∞ (ii) Dla x ∈ R+ x · ∞ := ∞, x · (−∞) := −∞. (iii) Dla x ∈ R− x · ∞ := −∞, x · (−∞) := ∞. := x −∞ := 0. (iv) Ponadto ∞ · ∞ := (−∞) · (−∞) := ∞, ∞ · (−∞) := (−∞) · ∞ := −∞. (v) Oraz ∞ + ∞ := ∞, (−∞) + (−∞) := −∞. Uwaga 8.6.4 Jeśli A ⊂ R̄ jest zbiorem niepustym, to A jest ograniczony od góry (od dołu) wtedy i tylko wtedy gdy sup A < ∞ (inf A > −∞). 8.6.2 Kresy funkcji Definicja 8.6.5 Niech X będzie zbiorem, A ⊂ X jego podzbiorem, a f : X → R̄ funkcją. Definiujemy kres górny funkcji f na zbiorze A jako sup f (x) := sup f (A) = sup { f (x) | x ∈ A }. x∈A Definiujemy kres dolny funkcji f na zbiorze A jako inf f (x) := inf f (A) = inf { f (x) | x ∈ A }. x∈A Mówimy, że f jest ograniczona od góry (od dołu) na zbiorze A gdy f (A) jest ograniczony od góry (od dołu) co jest równoważne warunkowi supx∈A f (x) < ∞ (inf x∈A f (x) > −∞). 8.6. ROZSZERZONY ZBIÓR LICZB RZECZYWISTYCH 131 Twierdzenie 8.6.6 Mamy następujące własności kresów funkcji: (i) Niech f : X → R̄ będzie funkcją, a A ⊂ X. Wtedy inf (−f (x)) = − sup f (x), sup (−f (x)) = − inf f (x). x∈A x∈A x∈A x∈A (ii) Niech fi : X → R̄ dla i ∈ {1, 2} będą funkcjami, a A ⊂ Xi . Wtedy sup (f1 (x) + f2 (x)) ¬ x∈A sup f1 (x) + sup f2 (x), x∈A inf (f1 (x) + f2 (x)) x∈A ­ x∈A inf f1 (x) + inf f2 (x). x∈A x∈A Dowód: (*)Aby udowodnić własność (i) połóżmy a := supx∈A f (x) oraz b := inf x∈A (−f (x)). Wystarczy pokazać, że −a ¬ b i −a ­ b. Niech x ∈ A. Wtedy z definicji kresu górnego f (x) ¬ a. Zatem −a ¬ −f (x) dla wszystkich elementów x ∈ A. Zatem −a jest minorantą zbioru { −f (x) | x ∈ A }, skąd −a ¬ inf x∈A (−f (x)) = b. Potrzebujemy jeszcze pokazać, że −a ­ b. Ustalmy ponownie x ∈ A. Z definicji kresu dolnego mamy b ¬ −f (x), skąd f (x) ¬ −b. Zatem −b jest majorantą zbioru { f (x) | x ∈ A }, co oznacza, że −b ­ a, czyli −a ­ b. Dowodzi to pierwszej równości własności (i). Drugą dowodzi się analogicznie. Dla dowodu pierwszej nierówności własności (ii) połóżmy a1 := supx∈A f1 (x), a2 := supx∈A f2 (x) oraz ustalmy x ∈ A. Z definicji kresu górnego mamy f1 (x) ¬ a1 f2 (x) ¬ a2 . Zatem f1 (x) + f2 (x) ¬ a1 + a2 . Ponieważ x ∈ A jest dowolnie ustalone, wnosimy, że a1 + a2 jest majorantą zbioru { f1 (x) + f2 (x) | x ∈ A }. Ponieważ supx∈A (f1 (x) + f2 (x)) jest najmniejszą majorantą tego zbioru, dostajemy sup (f1 (x) + f2 (x)) ¬ a1 + a2 , x∈A co dowodzi pierwszej nierówności we własności (ii). Drugą nierówność dowodzi się analogicznie. W podobny sposób dowodzi się następujących twierdzeń. Twierdzenie 8.6.7 Niech f : X1 × X2 → R̄ będzie funkcją, a Ai ⊂ Xi dla i ∈ {1, 2}. Wtedy f (x1 , x2 ) = sup sup f (x1 , x2 ) , sup x1 ∈A1 (x1 ,x2 )∈A1 ×A2 x2 ∈A2 inf (x1 ,x2 )∈A1 ×A2 f (x1 , x2 ) = inf x1 ∈A1 inf f (x1 , x2 ) . x2 ∈A2 Twierdzenie 8.6.8 Niech fi : Xi → R̄ oraz Ai ⊂ Xi dla i ∈ {1, 2}. Jeśli inf xi ∈Ai fi (xi ) > −∞ oraz supxi ∈Ai fi (xi ) < ∞ to sup (f1 (x1 ) + f2 (x2 )) = inf (x1 ,x2 )∈A1 ×A2 sup f1 (x1 ) + sup f2 (x2 ), x1 ∈A1 (x1 ,x2 )∈A1 ×A2 (f1 (x1 ) + f2 (x2 )) = x2 ∈A2 inf f1 (x1 ) + inf f2 (x2 ). x1 ∈A1 x2 ∈A2 132 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE Twierdzenie 8.6.9 Niech f : X → R̄ będzie funkcją, A ⊂ X, a c ∈ R. Wtedy sup (f (x) + c) = x∈A inf (f (x) + c) x∈A 8.7 8.7.1 sup f (x) + c, x∈A = inf f (x) + c. x∈A Ciało liczb zespolonych Liczby zespolone Chcemy rozszerzyć ciało liczb rzeczywistych tak, by pozostało ciałem, ale była w nim liczba i o własności i2 = −1. Widać, że jeśli ma to być ciało to musi w nim też być liczba a + bi dla dowolnych rzeczywistych a, b. Jednak suma i iloczyn liczb tej postaci nie wymaga już dalszego rozszerzania, bo (a + bi) + (c + di) = (a + c) + (b + d)i, (a + bi)(c + di) = ac + adi + bci + bdi2 = (ac − bd) + (ad + bc)i. Niestety nie ma szans, by ciało to było uporzadkowane, ˛ bo wtedy albo i > 0, albo −i > 0, co na mocy własności ciała uporzadkowanego ˛ prowadzi do i2 > 0 2 sprzecznego z i = −1. Pozostaje jednak pytanie, czy sam pomysł liczby i jako elementu ciała rozszerzajacego ˛ ciało liczb rzeczywistych też nie prowadzi do jakiejś sprzeczności, której jeszcze nie widzimy. Aby przekonać si˛e, że tak nie jest, trzeba zbudować formalny model liczb zespolonych. 8.7.2 Ciało C W C := R2 wprowadzamy działania (a, b) + (c, d) := (a + c, b + d), (a, b)(c, d) := (ac − bd, ad + bc). Twierdzenie 8.7.1 Zbiór C := R2 z tak określonymi działaniami oraz parami (0, 0) i (1, 0) jako elementami neutralnymi odpowiednio dla dodawania i mnożenia jest ciałem. Definicja 8.7.2 Ciało to nazywamy ciałem liczb zespolonych. Dla dowolnych a, b ∈ R mamy (a, 0) + (b, 0) = (a + b, 0) oraz (a, 0)(b, 0) = (ab, 0), zatem parę (a, 0) możemy utożsamiać z liczbą rzeczywistą a. Zwyczajowo kładziemy i := (0, 1). Jest to tak zwana jednostka urojona. Łatwo sprawdzamy, że i2 = (−1, 0) = −1 oraz (a, b) = (a, 0) + (b, 0)i = a + bi. √ Dla liczby zespolonej z := a + bi definiujemy jej moduł |z| := a2 + b2 oraz jej sprzężenie z̄ := a − bi. Dla liczby zespolonej z = a+bi liczby a, b ∈ R nazywamy odpowiednio częścią rzeczywistą i częścią urojoną z i oznaczamy re z i im z. W programie Mathematica jednostkę urojoną i oznaczamy I, a liczbę zespoloną a + bi zapisujemy jako a + b I. Interpretacja geometryczna liczby zespolonej przedstawiona jest na rys. 8.3, interpretacja sumy na rys. 8.4, a interpretacja iloczynu liczby zespolonej przez liczbę i na rys. 8.5. 8.7. CIAŁO LICZB ZESPOLONYCH Rysunek 8.3: Interpretacja geometryczna liczby zespolonej z := a + bi, jej modułu oraz sprzężenia. Rysunek 8.4: Interpretacja geometryczna sumy liczb zespolonych. Rysunek 8.5: Interpretacja geometryczna iloczynu liczby zespolonej przez liczbę i. 133 134 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE 8.7.3 Zespolona funkcja kwadratowa Wiemy ze szkoły, że miejsca zerowe funkcji kwadratowej x 7→ ax2 + bx + c zależa˛ od tzw. wyróżnika ∆ := b2 −4ac, w szczególności miejsc zerowych nie ma, gdy wyróżnik jest ujemny. Sytuacja ulega zmianie, gdy w funkcji tej dopuścimy argument zespolony. Twierdzenie 8.7.3 Rozważmy zespoloną funkcją kwadratową o współczynnikach rzeczywistych tj. funkcję Q : C 3 z 7→ az 2 + bz + c ∈ C, gdzie a, b, c ∈ R są zadanymi współczynnikami rzeczywistymi. Niech ∆ := b2 − 4ac. Jeśli ∆ > 0, to Q ma dwa rzeczywiste miejsca zerowe √ −b ± ∆ . z1,2 := 2a Gdy ∆ = 0 funkcja Q ma jeden pierwiatek rzeczywisty z := −b . 2a Natomiast dla ∆ < 0 mamy dwa zespolone, wzajemnie sprzężone miejsca zerowe √ −b ± i −∆ z1,2 := . 2a 8.7.4 Liczby zespolone o module jeden. Półprosta poprowadzona z poczatku ˛ układu współrz˛ednych pod katem ˛ ϕ do osi X przecina okrag ˛ jednostkowy S1 := { z ∈ C | |z| = 1 } (rys. 8.6) w punkcie o współrz˛ednych zϕ (cos ϕ, sin ϕ) ∈ C. Wykorzystujac ˛ tożsamości trygonometryczne dla sumy katów ˛ można pokazać, że zϕ+ψ = cos(ϕ + ψ) + i sin(ϕ + ψ) = (cos ϕ cos ψ − sin ϕ sin ψ) + i(sin ϕ cos ψ + cos ϕ sin ψ) = (cos ϕ + i sin ϕ)(cos ψ + i sin ψ) = zϕ zψ . To przypomina fundamentalna˛ własność funkcji wykładniczej. Matematyk szwajcarski Leonard Euler pokazał, że rzeczywista˛ funkcj˛e wykładnicza˛ można rozszerzyć na argumenty zespolone ez := ∞ X zn n! n=0 i przy takiej definicji dla x ∈ R zachodzi słynny wzór o nawijaniu prostej na okrag ˛ 8.8. GRANICE CIĄGÓW W R 135 Rysunek 8.6: Liczby zespolone o module jeden. eix = cos x + i sin x, który jest wygodna˛ podstawa˛ tak formalnej definicji jak i własności funkcji trygonometrycznych. Aby pójść ta˛ droga˛ potrzebujemy rozszerzyć poj˛ecie granicy ciagu ˛ i zbieżności szeregu na liczby zespolone. 8.7.5 Odległość w R i C. Wyst˛epujaca ˛ w definicji Cauchy’ego granicy ciagu ˛ wartość bezwzgl˛edna |a − b| dla a, b ∈ R może być interpretowana jako odległość pomi˛edzy liczbami a i b. Uogólniajac ˛ poj˛ecie odległości możemy si˛e pokusić o uogólnienie poj˛ecia granicy. Moduł liczby zespolonej pod wieloma względami przypomina wartość bezwzględną: Twierdzenie 8.7.4 Moduł liczby zespolonej ma następujące własności (i) ∀z ∈ C |z| = 0 ⇔ z = 0, (ii) ∀z1 , z2 ∈ C |z1 z2 | = |z1 ||z2 |, (iii) ∀z1 , z2 ∈ C |z1 + z2 | ¬ |z1 | + |z2 |. Dlatego |z1 − z2 | można interpretować jako odległość pomi˛edzy liczbami zespolonymi z1 i z2 . Zilustrowano to na rys. 8.7 8.8 Granice ciągów w R W rozdziale 1.2 ˛ jako narz˛edzie do przybliżania liczb, które nie sa˛ liczbami wymiernymi i analizowaliśmy prosty algorytm pozwalajacy ˛ przy√ przedstawiliśmy ciagi bliżać liczb˛e 2. Przedstawiliśmy też ide˛e granicy ciagu ˛ jako liczby, która˛ ciag ˛ przybliża. Teraz przyjrzymy si˛e temu poj˛eciu dokładniej, ale zaczniemy od dwóch dodatkowych eksperymentów numerycznych. 8.8.1 Eksperymenty numeryczne Listing 8.4 prezentuje program w j˛ezyku Mathematica obliczajacy ˛ wyrazy ciagu ˛ (1.2) rozważanego w rozdziale 1.2.5 jako narz˛edzie do przybliżania liczby π . Jego odpowiednik w j˛ezyku C++ przedstawiono na listingu 8.5. 136 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE Rysunek 8.7: Odległość liczb zespolonych z1 i z2 . ( ∗ P r z y b l i ż a n i e l i c z b y p i obwodem wpisanych w i e l o k ą t ó w ∗ ) P i B y C i rcumference [ d_ ] := Module [ { a , m, n , A} , ( ∗ Zaczynamy od wpisanego kwadratu . Jego bok a wynosi p ó ł p i e r w i s t k a z dwóch . Do p o l i c z e n i a p i e r w i a s t k a wykorzystujemy f u n k c j ę wbudowaną S q r t ∗ ) a = Sqrt [ 2 . ] / 2 ; m = 4 ; ( ∗ I l o ś c boków w i e l o k ą t a , na p o c z ą t e k c z t e r y ∗ ) n = 1; ( ∗ Numer k o l e j n e g o wyrazu c i ą g u , na p o c z ą t e k j e d e n ∗ ) Do[ ( ∗ Początek p ę t l i Do∗ ) A=m∗ a ; ( ∗ Obliczamy d ł u g o ś ć obwodu ∗ ) ( ∗ Domyślnie d l a l i c z b maszynowych Mathematica w y p i s u j e t y l k o 6 c y f r . NumberForm pozwala wydobyć w i ę c e j c y f r ∗ ) Print [ n , " " , NumberForm[ A, 1 6 ] ] ; ( ∗ Wydruk k o n t r o l n y . ∗ ) n = n + 1; ( ∗ K o l e j n y wyraz c i ą g u ∗ ) m = m∗ 2 ; ( ∗ K o l e j n y w i e l o b o k b ę d z i e miał dwa r a z y w i ę c e j boków ∗ ) a = Sqrt [ 2 − Sqrt [ 4 − 4∗ a ∗ a ] ] / 2 , ( ∗ o t a k i e j d ł u g o ś c i ∗ ) {d} ( ∗ I l o ś ć powtórzeń p ę t l i Do ∗ ) ] ; ( ∗ Koniec p ę t l i Do∗ ) a ∗m ] Listing 8.4: Wyznaczenie ciągu przybliżeń liczby π w języku Mathematica w oparciu o obwody wielokątów 8.8. GRANICE CIĄGÓW W R 137 /∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ PiByCircumference . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ /∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z obwody ∗/ /∗ w i e l o k ą t ó w foremnych wpisanych w okrąg o ś r e d n i c y j e d e n ∗/ /∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/ #include <i o s t r e a m > #include <iomanip> /∗ B i b l i o t e k a matematyczna , z a w i e r a standardowe i m p l e m e n t a c j e w i e l u matematycznych , f u n k c j i . My sk orzys tamy p o n i ż e j z f u n k c j i s q r t l i c z ą c e j p i e r w i a s t e k kwadratowy ∗/ #include <cmath> using namespace s t d ; i n t main ( ) { c o u t << s e t p r e c i s i o n ( 1 5 ) ; c o u t << f i x e d << r i g h t ; /∗ Zaczynamy od wpisanego kwadratu , k t ó r e g o bok a wynosi p ó ł p i e r w i a s t k a z 2 . Do p o l i c z e n i a p i e r w i a s t k a wykorzystujemy b i b l i o t e c z n y podprogram s q r t ∗/ double a=s q r t ( 2 . 0 ) / 2 ; /∗ I l o ś c boków w i e l o k ą t a , na p o c z ą t e k c z t e r y ∗/ i n t m=4; /∗ Numer k o l e j n e g o wyrazu c i ą g u , i l o ś ć wyrazów do p o l i c z e n i a ∗/ i n t n=1 ,nmax=40; /∗ Dla w s z y s t k i c h n od 1 do nmax ∗/ while ( n<nmax ) { /∗ Obliczamy d ł u g o ś ć obwodu ∗/ double A=m∗ a ; c o u t << " A[" << setw ( 2 ) << n << "] =" ; c o u t << setw ( 1 8 ) << A << e n d l ; /∗ K o l e j n y w i e l o k ą t b ę d z i e miał dwa r a z y w i ę c e j boków ∗/ m=m∗ 2 ; /∗ A t y l e w y n i e s i e d ł u g o ś ć j e g o boku ∗/ a=s q r t (2− s q r t (4−4∗ a ∗ a ) ) / 2 ; /∗ K o l e j n y wyraz c i ą g u ∗/ n=n+1; } } Listing 8.5: Wyznaczenie ciągu przybliżeń liczby π w C++ w oparciu o obwody wielokątów 138 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE Uruchamiajac ˛ program w C++ z listingu 8.5 otrzymujemy nast˛epujacy ˛ ciag ˛ liczb (moga˛ wyst˛epować drobne różnice dla różnych platform), z których pierwszych czternaście to: A1 = 2.828427124746190 A2 = 3.061467458920719 A3 = 3.121445152258053 A4 = 3.136548490545940 A5 = 3.140331156954754 A6 = 3.141277250932759 A7 = 3.141513801144285 A8 = 3.141572940367515 A9 = 3.141587725275636 A10 = 3.141591421514008 A11 = 3.141592345563526 A12 = 3.141592576625775 A13 = 3.141592634298169 A14 = 3.141592650272843 Do tego miejsca ciag ˛ ten zachowuje si˛e bardzo przyzwoicie, a jego kolejne wyrazy rosna.˛ Jednak dalsze wyrazy pokazuja,˛ że nie do końca spełnia on nasze oczekiwania. A15 = 3.141592648934190 A16 = 3.141592684156058 A17 = 3.141592607672169 A18 = 3.141592910939673 A19 = 3.141591696683685 A20 = 3.141596553704820 A21 = 3.141596553704820 A22 = 3.141518840465548 A23 = 3.141207968282266 A24 = 3.142451272494134 A25 = 3.142451272494134 A26 = 3.162277660168380 A27 = 3.162277660168380 A28 = 2.828427124746190 A29 = 0.000000000000000 Poczynajac ˛ od wyrazu A15 ciag ˛ przestaje być rosnacy ˛ i zamiast przybliżać, zaczyna oddalać si˛e od π , a wyraz A29 wynosi wr˛ecz zero! I w tym przypadku przyczyna˛ ograniczeń algorytmu jest skończona arytmetyka komputera. Efekt obliczeń z precyzja˛ maszynowa˛ w środowisku Mathematica jest analogiczny. Wartość liczby π z dokładnościa˛ do 15-tu miejsc dziesi˛etnych wynosi π = 3.141592653589793 . . . . 8.8. GRANICE CIĄGÓW W R 139 Zatem przy zastosowaniu 64-bitowego typu double przedstawiona metoda pozwala policzyć π z dokładnościa˛ do około 8 cyfr znaczacych. ˛ Warto podkreślić, że sama obserwacja numeryczna zachowania tego ciagu ˛ może prowadzić do bł˛ednego wniosku iż ciag ˛ ten jest zbieżny do zera. Aby mieć praktyczny pożytek z ciagu ˛ jako narz˛edzia do przybliżania liczb, musimy umieć od strony teoretycznej przeanalizować jego zachowanie. Mathematica radzi sobie łatwo z wyliczeniem π z duża˛ dokładnościa,˛ ale wymaga to obliczeń wysokiej precyzji, znacznie kosztowniejszych od obliczeń z precyzja˛ maszynowa.˛ Na przykład piszac ˛ N [ Pi , 1 0 0 0 ] otrzymujemy 3.14159265358979323846264338327950288419716939937510582097494459230781\ 6406286208998628034825342117067982148086513282306647093844609550582231\ 7253594081284811174502841027019385211055596446229489549303819644288109\ 7566593344612847564823378678316527120190914564856692346034861045432664\ 8213393607260249141273724587006606315588174881520920962829254091715364\ 3678925903600113305305488204665213841469519415116094330572703657595919\ 5309218611738193261179310511854807446237996274956735188575272489122793\ 8183011949129833673362440656643086021394946395224737190702179860943702\ 7705392171762931767523846748184676694051320005681271452635608277857713\ 4275778960917363717872146844090122495343014654958537105079227968925892\ 3542019956112129021960864034418159813629774771309960518707211349999998\ 3729780499510597317328160963185950244594553469083026425223082533446850\ 3526193118817101000313783875288658753320838142061717766914730359825349\ 0428755468731159562863882353787593751957781857780532171226806613001927\ 876611195909216420199 jako przybliżenie liczby π z dokładnościa˛ do 1000 cyfr. Ćwiczenie komputerowe 8.8.1 Zmodyfikuj program z listingu 8.5 tak by przybliżał π wykorzystujac ˛ 2n -katy ˛ foremne opisane na okr˛egu (patrz cw. 1.2.7). Wykorzystaj ten program do prześledzenia zachowania tego ciagu ˛ przybliżeń. 8.8.2 Granice pozorne W poprzednim podrozdziale zaobserwowaliśmy, że wyciaganie ˛ wniosków na temat granicy ciagu ˛ z samego numerycznego eksperymentu może być niebezpieczne. Okazuje si˛e, że ciag ˛ może robić wrażenie zbieżnego, a mimo wszystko zbieżnym nie być. Rozważmy ciag ˛ dany wzorem rekurencyjnym x0 x1 = = 136.462554878752 5.39650717129623 (8.11) (8.12) xn = 0.3x0 + 1 − 1.4x21 (8.13) Program w j˛ezyku Mathematica wyznaczajacy ˛ wyrazy tego ciagu ˛ przedstawiony jest na listingu 8.6. Wersja w C++ jest na listingu 8.7. Przejrzenie pierwszych 15-tu wyrazów tego ciagu ˛ może robić wrażenie, że ciag ˛ ten jest zbieżny do granicy wynoszacej ˛ około 0.63135. Przejrzenie 50-ciu wyrazów zaciera to pierwsze wrażenie. Jednakże, po doświadczeniach z ciagiem przybliżajacym ˛ π możemy być skłonni podejrzewać, że przyczyna˛ niestabilnego zachowania dalszych wyrazów tego ciagu ˛ znów jest skończona arytmetyka komputera. Okazuje si˛e jednak, że obserwowana numerycznie zbieżność tego ciagu ˛ jest pozorna. Wykres pierwszych 100 wyrazów tego ciagu ˛ przedstawiono na rys. 8.8. Przykłady tego typu zaobserwowane zostały przez matematyków po raz pierwszy dopiero w XX wieku. Rozważany przez nas przykład wywodzi si˛e z tzw. odwzorowania Hénona. 8.8.3 Definicja Cauchy’ego granicy ciągu Niech x : N → R będzie ciągiem liczb rzeczywistych. 140 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE ( ∗ Przykład z c i ą g i e m p o z o r n i e zbieżnym , zadanym r e k u r e n c y j n i e ∗ ) Henon [ n_ ] := Module [ { a , b , x0 , x1 , x2 , k } , a = 1 . 4 ; b = 0 . 3 ; ( ∗ Pomocnicze parametry a i b ∗ ) k = 0 ; ( ∗ L i c z n i k wyrazów c i ą g u ∗ ) ( ∗ Dwa początkowe wyrazy c i ą g u ∗ ) x0 = 1 3 6 . 4 6 2 5 5 4 8 7 8 7 5 2 ; x1 = 5 . 3 9 6 5 0 7 1 7 1 2 9 6 2 3 ; Do[ k = k + 1 ; ( ∗ K o l e j n y wyraz c i ą g u wyliczamy w o p a r c i u o dwa p o p r z e d n i e ∗ ) x2 = b∗ x0 + 1 − a ∗ x1 ∗ x1 ; ( ∗ Nowe w a r t o ś c i dwóch p o r z e d n i c h wyrazów c i ą g u ∗ ) x0 = x1 ; x1 = x2 ; Print [ { k , NumberForm[ x2 , 1 6 ] } ] , {n} ]; ] Listing 8.6: Przykład ciągu pozornie zbieżnego w języku Mathematica. Rysunek 8.8: Wykres pierwszych 100 wyrazów ciągu danego wzorami (8.11)-(8.13) 8.8. GRANICE CIĄGÓW W R 141 /∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ Henon . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ /∗ Przykład z zadanym r e k u r e n c y j n i e c i ą g i e m , p o z o r n i e zbieżnym . ∗/ /∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/ #include <i o s t r e a m > #include <iomanip> using namespace s t d ; i n t main ( ) { c o u t << s e t p r e c i s i o n ( 1 5 ) ; /∗ Dla w i ę k s z e j c z y t e l n o ś c i wyników narzucamy s t a ł o p o z y c y j n y , wyrównywany w prawo z a p i s l i c z b ∗/ c o u t << f i x e d << r i g h t ; /∗ Pomocnicze parametry a i b ∗/ double a =1.4 , b = 0 . 3 ; /∗ Dwa początkowe wyrazy c i ą g u ∗/ double x0 = 1 3 6 . 4 6 2 5 5 4 8 7 8 7 5 2 ; double x1 = 5 . 3 9 6 5 0 7 1 7 1 2 9 6 2 3 ; /∗ I l o ś ć wyrazów c i ą g u do p o l i c z e n i a ∗/ i n t nmax=15; /∗ Inna forma p ę t l i . I n s t r u k c j e w bloku { . . . } wykonujemy d l a w a r t o ś c i n od j e d e n do nmax z w i ę k s z a j ą c n za każdym razem o j e d e n ∗/ f o r ( i n t n=1;n<=nmax ; n=n+1){ /∗ K o l e j n y wyraz c i ą g u wyliczamy w o p a r c i u o dwa p o p r z e d n i e ∗/ double x2=b∗ x0+1−a ∗ x1 ∗ x1 ; /∗ Wyprowadzamy w y n i k i na standardowe w y j ś c i e . setw ( p ) u s t a l a i l o ś ć p ó l d l a wyprowadzanej k o l e j n e j z m i e n n e j . Pozwala t o na l e p s z e f o r m a t o w a n i e wypisywanych danych ∗/ c o u t << "x[" << setw ( 2 ) << n << " ]= " ; c o u t << setw ( 2 0 ) << x0 << e n d l ; /∗ Nowe w a r t o ś c i dwóch p o r z e d n i c h wyrazów c i ą g u ∗/ x0=x1 ; x1=x2 ; } } Listing 8.7: Przykład ciągu pozornie zbieżnego w C++. 142 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE Definicja 8.8.2 Mówimy, że ciąg x jest zbieżny do granicy g ∈ R jeżeli ∀ > 0∃N ∈ N∀n > N |xn − g| < . Piszemy wtedy lim xn = g. n→∞ Mówimy, że ciąg x jest zbieżny, jeżeli istnieje g ∈ R takie, że x jest zbieżny do g. Twierdzenie 8.8.3 Niech p ∈ N1 . Wtedy lim n→∞ 1 = 0. np Dowód: 1 Niech ∈ R+ . Weźmy n ∈ N takie, że N > √ Niech n będzie większe od N . Wtedy n > p 1 1 p potęgowej n > i w konsekwencji np < . Zatem dla n > N mamy | 1 √ p i z monotoniczności funkcji 1 1 − 0| = p < . p n n Mówimy, że ciąg a : N → R jest ograniczony, jeśli istnieje M ∈ R takie, że |an | ¬ M dla wszystkich n ∈ N. Twierdzenie 8.8.4 Ciąg zbieżny w R jest ograniczony. Dowód: Niech a∗ := limn→∞ an . Dla = 1 znajdziemy N ∈ N takie, że dla n > N mamy |an − a∗ | < 1. Zatem dla takich n jest |an | = |an − a∗ + a∗ | ¬ |an − a∗ | + |a∗ | < 1 + |a∗ |. W zbiorze skończonym { |an | | n ∈ N i n ¬ N } jest element największy. Oznaczmy go M0 i weźmy M := max(1 + |a∗ |, M0 ). Wtedy dla wszystkich n ∈ N mamy an ¬ M . 8.8.4 Granica ciągu, a struktura ciała w R Niech a, b : N → R będą ciągami liczb rzeczywistych. Niech ∈ { +, −, · } będzie operatorem dodawania, odejmowania lub mnożenia w R. Definiujemy nowy ciąg a b : N 3 n 7→ an bn ∈ R. Twierdzenie 8.8.5 (i) Jeśli ciągi a, b są zbieżne to ciąg a b jest zbieżny oraz lim (an bn ) = lim an lim bn . n→∞ (ii) n→∞ n→∞ Jeśli ciągi a, b są zbieżne i limn→∞ bn 6= 0 to ciąg a / b jest zbieżny oraz lim n→∞ an limn→∞ an = . bn limn→∞ bn 8.8. GRANICE CIĄGÓW W R 143 Dowód: Niech limn→∞ an = a∗ i limn→∞ bn = b∗ Przedstawimy dowód dla przypadku gdy jest iloczynem. Pozostałe dowody są albo łatwiejsze (suma, różnica), albo wyglądają podobnie (iloraz). Naszym celem jest oszacowanie różnicy |an bn − a∗ b∗ | dla dużych n, przy wykorzystaniu oszacowań na różnice |an − a∗ | i |bn − b∗ |, które możemy uzyskać ze zbieżności ciagów ˛ a i b. Sztuczka˛ powszechnie stosowana˛ przy takich oszacowaniach jest dodanie i odj˛ecie wyrazu pomocniczego i skorzystanie z własności wartości bezwzgl˛ednej. |an bn − a∗ b∗ | = |an bn − a∗ bn + a∗ bn − a∗ b∗ | = |(an − a∗ )bn + a∗ (bn − b∗ )| ¬ |an − a∗ ||bn | + |a∗ ||bn − b∗ | ˛ ac ˛ nierówność Aby suma dwóch ostatnich składników była mniejsza od wystarczy, by każdy z nich był mniejszy od 2 . Rozwiazuj |a∗ ||bn − b∗ | < , 2 ˛ b do stałej 2|a ∗ | . Wyjatkiem ˛ jest |a∗ | = 0, widzimy, że wystarczy, by |bn − b∗ | < 2|a ∗ | , a to mamy zagwarantowane dla n > N1 dobranego dla ciagu bo wtedy nie można dzielić przez |a∗ |, ale z tym nie ma problemu, bo przy |a∗ | = 0 lewa strona nierówności jest zero, wi˛ec nierówność jest spełniona dla wszystkich n. Troch˛e bardziej kłopotliwy jest przypadek nierówności |an − a∗ ||bn | < , 2 bo tu n wyst˛epuje w dwóch miejscach. Jednak wiemy, że ciag ˛ zbieżny jest ograniczony, wi˛ec możemy znaleźć stała˛ M > 0 taka,˛ że |bn | < M dla wszystkich n. Zatem wystarczy, by |an − a∗ | < , 2M a to mamy zagwarantowane dla n > N2 dobranego dla ciagu ˛ a do stałej 2M . Aby uniknać ˛ oddzielnego rozważania przypadku a∗ = 0 wystarczy zauważyć, że |a∗ | < |a∗ | + 1, a |a∗ | + 1 6= 0, wi˛ec można od razu dobrać N1 tak, by |bn − b∗ | < 2(|a∗|+1) . Weźmy ustalone > 0. Niech M będzie takie, że |bn | < M dla wszystkich n ∈ N. Niech N1 ∈ N oraz N2 ∈ N będą takie, że , n > N1 ⇒ |bn − b∗ | < 2(|a∗ | + 1) n > N2 ⇒ |an − a∗ | < . 2M Niech N := max{N1 , N2 }. Ustalmy n > N . Wtedy |an bn − a∗ b∗ | ¬ |an − a∗ ||bn | + |a∗ ||bn − b∗ | ¬ |an − a∗ |M + (|a∗ | + 1)|bn − b∗ | < M + (|a∗ | + 1) = , 2M 2(|a∗ | + 1) co dowodzi, że lim an bn = a∗ b∗ . n→∞ 8.8.5 Granica ciągu, a struktura porządkowa w R Niech a, b, c : N → R będą ciągami liczb rzeczywistych. Twierdzenie 8.8.6 Jeśli istnieje N ∈ N takie że dla wszystkich n > N ciągi an , bn , cn spełniają nierówność an ¬ bn ¬ cn i ciągi an oraz cn są zbieżne do granicy g, to ciąg bn też jest zbieżny do granicy g. 144 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE Dowód: Ustalmy > 0. Ze zbieżności ciągów a i c do g wynika, że możemy dobrać stałą N > 0 tak, by dla n > N zachodziły nierówności |an − g| < , |cn − g| < . Oznacza to, że dla n ∈ N zachodzi − < an − g < , − < cn − g < . Zatem mamy dla n > N − < an − g ¬ bn − g ¬ cn − g < , co oznacza, że dla takich n |bn − g| < i dowodzi, że lim bn = g. n→∞ Twierdzenie 8.8.7 Niech a : N → R będzie ciągiem liczb rzeczywistych. (i) Jeśli a jest ciągiem rosnącym i ograniczonym od góry, to ciąg ten jest zbieżny oraz lim an = sup { an | n ∈ N }. n→∞ (ii) Jeśli a jest ciągiem malejącym i ograniczonym od dołu, to ciąg ten jest zbieżny oraz lim an = inf { an | n ∈ N }. n→∞ Dowód: Udowodnimy własność (i). Drugą własność dowodzi się analogicznie. Oznaczmy a∗ := sup { an | n ∈ N }. Ustalmy > 0. Z definicji kresu górnego wynika, że a∗ − nie jest majorantą zbioru { an | n ∈ N }, zatem istnieje takie N ∈ N, że aN > a∗ − . Zatem dla n > N mamy a∗ − < aN ¬ an ¬ a∗ < a∗ + , czyli |an − a∗ | < , co dowodzi, że ciąg a jest zbieżny i jego granicą jest a∗ . 8.9. PRZYKŁADY I ZASTOSOWANIA GRANIC CIĄGÓW W R 8.9 8.9.1 145 Przykłady i zastosowania granic ciągów w R Granice kilku ważnych ciągów Twierdzenie 8.9.1 p ∈ R+ ⇒ lim √ n p=1 (8.14) lim √ n n=1 (8.15) n→∞ n→∞ α α ∈ Q, a > 1 ⇒ p∈R ⇒ n =0 an 1 lim pn = 0 n→∞ nie istn. w R (8.16) lim n→∞ p=1 p ∈ (−1, 1) p ¬ −1 lub p > 1. (8.17) Dowód: √ Dla pokazania własności (8.14) rozważmy najpierw przypadek p ­ 1. Niech xn := n p − 1. Wtedy xn ­ 0 oraz na mocy nierówności Bernoulliego mamy 1 + nxn ¬ (1 + xn )n = p. Zatem dla wszystkich n ∈ N mamy p−1 . n Z twierdzenia o trzech ciągach wynika, że ciąg limn→∞ xn = 0. Tak więc własność (8.14) dla p ­ 1 otrzymujemy z twierdzenia o granicy sumy ciągów. Gdy p ∈ (0, 1) wystarczy zauważyć, że dla q := p1 mamy z twierdzenia o granicy ilorazu ciągów 0 ¬ xn ¬ lim √ n n→∞ Aby udowodnić (8.15) oznaczmy xn := dwumianu Newtona mamy √ n p= 1 1 √ = = 1. limn→∞ n q 1 n − 1. Wystarczy pokazać, że ciąg o wyrazach xn zmierza do zera. Z rozwinięcia n = (1 + xn )n ­ 1 n(n − 1)x2n , 2 skąd wynika, że dla n ­ 2 mamy r 0 < xn ¬ 2 2 ¬√ , n−1 n a zatem limn→∞ xn = 0. Dla dowodu (8.16) oznaczmy b := a − 1 wybierzmy k ∈ N, takie że k > α + 1. Mamy dla n > 2k ( n )k n k n(n − 1) · · · (n − k + 1) k an = (1 + b)n > b = b > 2 bk , k 1 · 2···k k! zatem 0< nα 2k k! α−k 2k k! 1 < n < (1 + b)n bk bk n i tezę znów dostajemy z twierdzenia o trzech ciągach. Własność (8.17) jest prostym wnioskiem z (8.16) dla p ∈ (0, 1). Dla p ∈ {0, 1} własność jest oczywista. Dla p ∈ (−1, 0) wynika z nierówności −|p|n ¬ pn ¬ |p|n . 146 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE W pozostałym przypadku ciąg ma wartości dowolnie wielkie dla wykładników parzystych, jest więc nieograniczony, a więc nie może być zbieżny. Aby policzyć granicę ciągu a : N → R w programie Mathematica należy użyć instrukcji Limit[a[n], n -> Infinity, Assumptions -> Element[n, Integers]] Na przykład pisząc Limit[Sqrt[(1 + n)/(1 + 3 n)], n -> Infinity, Assumptions -> Element[n, Integers]] otrzymujemy √1 . 3 Często ten sam wynik otrzymamy używając krótszej instrukcji Limit[a[n], n -> Infinity] która służy do liczenia granicy funkcji. Granica funkcji jest szerszym pojęciem, ale w przypadku argumentu zmierzającego do nieskończoności często daje ten sam wynik. Jednak nie jest to dokładnie to samo, bo na przykład w przypadku ciągu lim cos 2πn = 1, n→∞ gdyż jest to ciąg stale równy jeden, ale granica funkcji lim cos 2πx x→∞ nie istnieje. Mathematica dla instrukcji Limit[Cos[2 Pi n], n -> Infinity, Assumptions -> Element[n, Integers]] zwraca liczbę 1, natomiast instrukcja Limit[Cos[2 Pi n], n -> Infinity] zwraca Interval[{-1, 1}] co oznacza, że granica nie istnieje, a zbiór punktów granicznych, czyli granic wszystkich możliwych podciągów, to przedział [−1, 1]. Pojęciem zbioru punktów granicznych zajmiemy się w rozdziale 10. 8.9.2 Procent składany Matematyk szwajcarski, Jakob Bernoulli (rys. 8.9) rozważał problem procentu składanego, który przedstawić można skrótowo nast˛epujaco. ˛ Wpłacamy do banku 1zł oprocentowane na 100%. Po roku odbieramy 1 + 1 = 2 zł. Jeśli bank jest gotowy wypłacać proporcjonalne oprocentowanie za dowolnie krótki okres, to po pół roku wypłacimy 1 + 12 = 1.5 zł. Wpłacajac ˛ t˛e kwot˛e na kolejne pół roku odbierzemy (1 + 12 )(1 + 12 ) = 2.25 zł. Zadajac ˛ sobie trud wpłat i wypłat n-krotnie w ciagu ˛ roku na koniec roku wypłacimy kwot˛e 1 1+ n n zł. Powstaje pytanie: czy możemy zyskać w ten sposób dowolnie wiele, jeśli n b˛edzie odpowiednio duże? Programy w j˛ezyku Mathematica oraz w C++ realizujace ˛ stosowny eksperyment numeryczny przedstawiono na listingach 8.8 i 8.9. 8.9. PRZYKŁADY I ZASTOSOWANIA GRANIC CIĄGÓW W R 147 ( ∗ O b l i c z a n i e p r z y b l i ż e ń l i c z b y e według i d e i p r o c e n t u s k ł a d a n e g o ( ang . compound i n t e r e s t ) ∗ ) CompoundInterest [ d_ ] := Module [ { n } , n = 1; Do[ Print [ "e[" , n , " ]= " , NumberForm [ ( 1 . + 1 . / n )^ n , 1 6 ] ] ; n = n + 1, {d} ]; ] Listing 8.8: Eksperyment numeryczny z procentem składanym w języku Mathematica /∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ CompoundInterest . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ /∗ O b l i c z a n i e p r z y b l i ż e ń l i c z b y e według i d e i p r o c e n t u ∗/ /∗ s k ł a d a n e g o ( ang . compound i n t e r e s t ) ∗/ /∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/ #include <i o s t r e a m > #include <cmath> #include <iomanip> using namespace s t d ; i n t main ( ) { c o u t << f i x e d << r i g h t ; c o u t << s e t p r e c i s i o n ( 1 5 ) ; // Policzymy 1000 wyrazów c i ą g u i n t nmax=1000; f o r ( i n t n=1;n<=nmax ; n=n+1){ // Czynnik , k t ó r y t r z e b a przemnożyć n r a z y p r z e z s i e b i e // Piszemy 1 . 0 / n , a n i e 1/n , bo w a r y t m e t y c e // c a ł k o w i t o l i c z b o w e j 1/n d a j e z e r o . double x=1+1.0/n ; // W C++ brak wbudowanego potęgowania , // w i ę c l i c z y m y p o t ę g ę przy pomocy p ę t l i double prod =1; f o r ( i n t i =1; i<=n ; i=i +1) prod=prod ∗x ; c o u t << " s[" << setw ( 3 ) << n << "] =" << setw ( 1 8 ) << prod ; c o u t << e n d l ; } } Listing 8.9: Eksperyment numeryczny z procentem składanym w C++ 148 8.9.3 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE Liczba e Twierdzenie 8.9.2 Ciąg 1 + 1 n n jest rosnący i ograniczony, a więc ma skończoną granicę. Dowód: Pokażemy najpierw, że ciąg ten jest rosnący. Podstawiając w nierówności Bernoullego (tw. 8.3.3) − n12 za x i przekształcając uzyskaną nierówność otrzymujemy dla n > 1 n 1 1 1− 2 ­ 1− n n n n 1 1 1 1− 1+ ­ 1− . n n n n−1 n Z kolei dzieląc obustronnie przez 1 − n1 , mnożąc przez n−1 i przekształcając dostajemy 1 1− n n−1 n 1 1+ n n 1 1+ n n 1 1+ n ­ 1 ­ ­ n n−1 1+ n−1 1 n−1 n−1 do dowodzi, że rozważany ciąg jest rosnący. Aby pokazać, że jest on ograniczony, najpierw zauważmy, że podstawiając 1 za b oraz 1 1 1 1 + n−2 + · · · + 1 . 1− n = 2 2 2n−1 2 1 2 za a we wzorze (7.6) otrzymujemy (8.18) Zatem podstawiając we wzorze (7.7) 1 za a oraz n1 za b, przekształcając i na koniec wykorzystując (8.18) otrzymujemy n 1 n 1 n 1 n 1 n 1 1+ = 1+ + + + ··· + 2 3 1 n 2 n n 3 n n nn n(n − 1) 1 n(n − 1)(n − 2) 1 n(n − 1) · · · 1 1 n1 = 1+ + + + ··· + 2 3 1n 1·2 n 1·2·3 n 1 · 2 · · · n nn 1 1 1 2 1(1 − n ) 1(1 − n )(1 − n ) 1(1 − n ) · · · (1 − n−1 n ) + + ··· + = 1+1+ 1·2 1·2·3 1 · 2···n 1 1 1 < 1+1+ + + ··· + 1·2 1·2·3 1 · 2···n 1 1 1 < 1 + 1 + + 2 + · · · + n−1 2 2 2 1 = 1 + 2 1 − n < 1 + 2 = 3. 2 n Zatem na mocy twierdzenia 8.8.7 ciąg 1 + n1 jest zbieżny. n Choć Bernoulli pierwszy zauważył, że ciag ˛ o wyrazach 1 + n1 jest zbieżny, jego granic˛e nazywamy liczba˛ Eulera i oznaczamy litera˛ e, bo to Leonard Euler (rys. 8.9), inny szwajcarski matematyk, pokazał jak ważna jest ona w matematyce. On pierwszy oznaczał ja˛ litera˛ e i tak pozostało do dziś. Liczba e w przybliżeniu wynosi e = 2.71828182845904523536 . . . 8.9. PRZYKŁADY I ZASTOSOWANIA GRANIC CIĄGÓW W R 149 Rysunek 8.9: Jacob Bernoulli (1654 - 1705) i Leonard Euler (1707 - 1783) n Co ciekawe, ciag ˛ 1 + n1 nadaje liczbie e ważna˛ interpretacj˛e, jednak zupełnie nie nadaje si˛e do obliczania jej przybliżeń, bo jest bardzo wolno zbieżny. W rozdziale 12 poznamy nieporównanie szybsza˛ metod˛e wyznaczania liczby e. W programie Mathematica liczba e jest oznaczana E. 8.9.4 Funkcja wykładnicza Wpłacajac ˛ kwot˛e 1zł na rachunek z oprocentowaniem nie 100%, tylko x (potraktowane jako liczba, 100%=1) po roku wypłacamy kwot˛e exp(x) := lim n→∞ 1+ x n zł. n Jest to przykład funkcji ciagłej, ˛ której wzrost (lub spadek) jest proporcjonalny do jej wartości. Można to zapisać w postaci równania różniczkowego f 0 (x) = af (x). Rozwiazaniem ˛ tego równania jest funkcja wykładnicza i jej wielokrotności. Bardzo wiele zjawisk w fizyce (np. rozpad pierwiastków promieniotwórczych, biologii (np. wzrost populacji przy nieograniczonych zasobach), ekonomii (np. piramidy finansowe) i innych dziedzinach opisywanych jest przy pomocy funkcji wykładniczej. Można pokazać, że funkcja wykładnicza spełnia wzór f (x + y) = f (x)f (y), a stad, ˛ że jest postaci R 3 x 7→ ax ∈ R+ . W wyrażeniu tym a ∈ R+ , a ax jest rozszerzeniem wyrażenia an dla n ∈ N na dowolny wykładnik rzeczywisty. W szczególności łatwo stad ˛ wywnioskować, że dla pq ∈ Q+ p aq = √ q ap , 150 ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE Rysunek 8.10: Wykres funkcji exp. a0 = 1, oraz dla r ∈ Q− ar = 1 a−r . Przyjmujac ˛ powyższe wzory jako definicje, można zdefiniować funkcj˛e wykładnicza˛ dla dowolnego x ∈ R wzorem ax := sup { ar | r ∈ Q, r < x } i pokazać, że exp(x) = ex . W programie Mathematica funkcja exp jest oznaczana Exp. Natomiast wyrażenie ax wyst˛epujace ˛ w funkcji wykładniczej o podstawie a w programie Mathematica zapisywane jest w postaci a^x. Wykres funkcji wykładniczej przedstawiono na rys. 8.10 Od strony obliczeniowej wygodniejszy jest jednak wzór exp(x) = który nam posłuży jako podstawa do formalnej definicji funkcji wykładniczej. ∞ X xn , n! n=0 Rozdział 9 Topologia przestrzeni metrycznych Jak widzieliśmy w poprzednim rozdziale jest potrzeba rozszerzenia poj˛ecia granicy tak, by przynajmniej obejmowało ono granice ciagów ˛ liczb zespolonych. W rzeczywistości, jak już mówiliśmy, koncepcja granicy jest kluczowa dla całej analizy. Dlatego spróbujemy zastanowić si˛e co jest rzeczywiście niezb˛edne do zdefiniowania granicy. Intencja˛ zwrotu |xn − g| < w definicji Cauchy’ego granicy ciagu ˛ jest stwierdzenie, że xn leży nie dalej niż od g . Widzieliśmy, że również w przypadku liczb zespolonych możemy mierzyć odległość mi˛edzy u, w ∈ C rozważajac ˛ funkcj˛e, która parze liczb zespolonych przyporzadkowuje ˛ moduł ich różnicy. C 3 (u, w) 7→ |u − w| ∈ R∗ . Ma ona własności analogiczne do funkcji, która parze liczb rzeczywistych przyporzadkowuje ˛ wartość bezwzgl˛edna˛ ich różnicy. W tym rozdziale przedstawimy ide˛e odległości, która uogólnia obie te funkcje. Jak zobaczymy później jest to jednak tylko krok pośredni do uzyskania ogólnego poj˛ecia granicy. 9.1 9.1.1 Przestrzenie metryczne Przestrzeń metryczna Definicja 9.1.1 Odległością (metryką) w zbiorze X nazywamy odwzorowanie ρ : X × X → R∗ spełniające własności (i) ρ(x, y) = 0 ⇔ x = y, (ii) ρ(x, y) = ρ(y, x), (iii) ρ(x, z) ¬ ρ(x, y) + ρ(y, z). Parę (X, ρ) nazywamy przestrzenią metryczną. 151 152 ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH Rysunek 9.1: Odległość punktów x, y ∈ R2 w metryce euklidesowej (zielony), Manhattan (niebieski) i maksimum (czerwony). 9.1.2 Przykłady metryk w Rn Przestrzeń Rn to iloczyn kartezjański n kopii zbioru liczb rzeczywistych R. Element x ∈ Rn ma postać n-tki liczb: x = (x1 , x2 , . . . , xn ), którą krótko zapisujemy x = (xi )i=1,n . Dla x = (xi )i=1,n , y = (yi )i=1,n ∈ Rn definiujemy v u n uX de (x, y) := t (xi − yi )2 , i=1 dmax (x, y) := d1 (x, y) := max { |xi − yi | | i = 1, 2, . . . n }, n X |xi − yi |. i=1 Jak łatwo zauważyć, pierwsza z tych definicji uogólnia na przypadek Rn metrykę zadaną w R poprzez wartość bezwzględną oraz metrykę w C zadaną poprzez moduł. Twierdzenie 9.1.2 (i) (Rn , de ), (Rn , dmax ) i (Rn , d1 ) są przestrzeniami metrycznymi. (ii) de w R2 = C pokrywa się z modułem, a w R z wartością bezwzględną różnicy argumentów. Metryka de to metryka euklidesowa, metrykę dmax określa się mianem metryka maksimum, a metrykę d1 mianem metryka Manhattan. Łatwo sprawdzić, że dla n = 1 wszystkie te trzy metryki są sobie równe, dane wzorem ρ(x, y) = |x − y| dla x, y ∈ R. Przykład liczenia odległości w R2 w różnych metrykach przedstawiono na rys. 9.1. 9.1.3 Metryka indukowana i podprzestrzenie przestrzeni metrycznej Twierdzenie 9.1.3 Niech (X, ρ) będzie przestrzenią metryczną, a Y ⊂ X podzbiorem. Wtedy ρY := ρ|Y ×Y jest metryką w Y . Dowód: ćwiczenie. 9.1. PRZESTRZENIE METRYCZNE 153 Rysunek 9.2: Kule w R2 w metryce euklidesowej (zielony), Manhattan (niebieski) i maksimum (czerwony). Odpowiednie sfery zaznaczono ciemniejszym kolorem. Definicja 9.1.4 Metrykę ρY nazywamy metryką indukowaną z X w Y , a przestrzeń metryczną (Y, ρY ) nazywamy podprzestrzenią przestrzeni (X, ρ). Zatem każdy podzbiór przestrzeni metrycznej jest przestrzenią metryczną. Pokazuje to, że przestrzenie metryczne mogą być bardzo różnorodne. 9.1.4 Kule Definicja 9.1.5 Niech (X, ρ) będzie przestrzenią metryczną, x punktem w X, a r liczbą rzeczywistą dodatnią. Przez kulę otwartą w X o środku w x i promieniu r rozumiemy zbiór K(x, r) := { y ∈ X | ρ(y, x) < r }. Podobnie definiujemy kulę domkniętą jako zbiór K̄(x, r) := { y ∈ X | ρ(y, x) ¬ r }, a sferę jako zbiór S(x, r) := { y ∈ X | ρ(y, x) = r }. Dla ustalonej przestrzeni metrycznej (X, ρ) oraz x ∈ X będziemy używać oznaczenia Ball(x) := Ball(x, X) := Ball(x, X, ρ) := { K(x, r) | r ∈ R+ }. na rodzinę kul otwartych o środku w x. Przykład kul domkniętych i sfer w R2 w różnych metrykach przedstawiono na rys. 9.2. Różnica mi˛edzy kula˛ domkni˛eta,˛ a otwarta˛ jest analogiczna do różnicy mi˛edzy przedziałem domkni˛etym, a przedziałem otwartym. Na rysunku można ja˛ przedstawić tylko umownie, na przykład zaznaczajac ˛ sfer˛e ograniczajac ˛ a˛ kul˛e otwarta˛ linia˛ cienka,˛ a sfer˛e ograniczajac ˛ a˛ kul˛e domkni˛eta˛ linia˛ gruba˛ (rys.9.3). Posługujac ˛ si˛e metryka,˛ można poj˛ecie granicy ciagu ˛ w przestrzeni metrycznej sformułować tak 154 ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH Rysunek 9.3: Umowne przedstawienie różnicy między kulą domknięta, sferą i kulą otwartą. lim xn = g n→∞ :⇔ ∀ > 0 ∃N ∈ N ∀n ∈ N n ­ N ⇒ ρ(xn , g) < , a posługujac ˛ si˛e poj˛eciem kuli tak lim xn = g n→∞ :⇔ ∀K ∈ Ball(g) ∃N ∈ N ∀n ∈ N n ­ N ⇒ xn ∈ K. Docelowo chcielibyśmy je przeformułować tak lim xn = g n→∞ :⇔ ∀V ∈ Nb(g) ∃U ∈ Nb(∞) ∀n ∈ N n ∈ U ⇒ xn ∈ V, gdzie Nb(g) to pewna rodzina zbiorów "zadajaca ˛ coraz wi˛eksze wymagania bliskości" do g , a Nb(∞) to pewna rodzina zbiorów "zadajaca ˛ coraz wi˛eksze wymagania bliskości" do ∞. W naszym przypadku ta pierwsza rodzina to rodzina kul o środku w g , a ta druga to rodzina przedziałów [N, ∞). Tego typu rodziny to tzw. bazy otoczeń. Sformalizujemy to poj˛ecie pod koniec tego rozdziału. 9.1.5 Zbiory ograniczone W dalszym ciągu przyjmujemy, że X jest przestrzenią metryczną z metryką ρ. Definicja 9.1.6 Podzbiór A ⊂ X nazywamy ograniczonym jeśli istnieje kula K(x, r) o środku w x i promieniu r taka, że A ⊂ K(x, r). Twierdzenie 9.1.7 Suma skończonej ilości zbiorów ograniczonych jest zbiorem ograniczonym. 9.2 9.2.1 Średnica zbiorów Średnica zbioru 9.3. ZBIORY OTWARTE I DOMKNIĘTE, WNĘTRZE, DOMKNIĘCIE I BRZEG ZBIORU 155 Rysunek 9.4: Poszukiwanie punktów brzegowych (na górze po lewej) zbioru A, brzeg zbioru A (na górze po prawej), domknięcie zbioru A jako przykład zbioru domkniętego (na dole po lewej) i otwarcie zbioru A jako przykład zbioru otwartego (na dole po prawej). Definicja 9.2.1 Średnicę zbioru A ⊂ X definiujemy jako ρ(A) := sup { ρ(x, y) | x, y ∈ A } gdy A jest zbiorem niepustym, a jako zero w przeciwnym razie. Zauważmy, że dla metryki euklidesowej de w R oraz x, y ∈ R takich, że x ¬ y średnica przedziału otwartego (x, y) oraz domkniętego [x, y] wynosi y − x. Uwaga 9.2.2 Średnica zbioru ma następujące własności. (i) Zbiór A jest ograniczony wtedy i tylko wtedy, gdy jego średnica jest skończona. (ii) Średnica zbioru A wynosi zero wtedy i tylko wtedy, gdy zbiór A ma nie więcej niż jeden element. (iii) Jeśli A ⊂ B, to ρ(A) ¬ ρ(B). (iv) Jeśli A : N → P(X) jest ciągiem zbiorów takich, że ρ(An ) < 9.3 1 n, to ρ( T∞ n=1 An ) = 0. Zbiory otwarte i domknięte, wnętrze, domknięcie i brzeg zbioru Poj˛ecia zbioru otwartego i domkni˛etego uogólniaja˛ poj˛ecia kuli otwartej i domkni˛etej. Intuicyjnie zbiór otwarty to taki, który jest rozłaczny ˛ ze swoim brzegiem, a zbiór domkni˛ety to taki, który zawiera swój brzeg. Punkt x jest punktem brzegowym zbioru A jeżeli każda kula K ∈ Ball(x) zawiera tak punkty należace ˛ do A jak i nie należace ˛ do A. Ide˛e t˛e przedstawiono na rys. 9.4. Definicja 9.3.1 Niech A ⊂ X. Brzegiem zbioru A w X nazywamy zbiór bd A := { x ∈ X | ∀K ∈ Ball(x) K ∩ A 6= ∅ i K \ A 6= ∅ }. Mówimy, że A jest otwarty, jeżeli A ∩ bd A = ∅. Mówimy, że A jest domknięty, jeżeli bd A ⊂ A. 156 ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH Twierdzenie 9.3.2 A jest otwarty wtedy i tylko wtedy gdy ∀x ∈ A ∃K ∈ Ball(x) K ⊂ A. A jest domknięty wtedy i tylko wtedy gdy ∀x 6∈ A ∃K ∈ Ball(x) 9.3.1 K ∩ A = ∅. Wnętrze i domknięcie Definicja 9.3.3 Niech A ⊂ X. Wnętrzem zbioru A nazywamy zbiór int A := A \ bd A Domknięciem zbioru A nazywamy zbiór cl A := A ∪ bd A Twierdzenie 9.3.4 Niech A ⊂ X. Wtedy int A = { x ∈ X | ∃K ∈ Ball(x) K ⊂ A. } oraz cl A = { x ∈ X | ∀K ∈ Ball(x) K ∩ A 6= ∅. } Niech X ∈ Metr, x ∈ X, r > 0. Twierdzenie 9.3.5 Kula otwarta K(x, r) jest zbiorem otwartym, a kula domknięta K̄(x, r) jest zbiorem domkniętym. Rodzinę zbiorów otwartych w przestrzeni metrycznej (X, ρ) oznaczać będziemy Open(X, ρ), a zbiorów domkniętych Clos(X, ρ). W notacji tej będziemy pomijać metrykę i pisać Open(X), Clos(X) gdy metryka będzie znana z kontekstu. 9.3.2 Własności wnętrza i domknięcia Uwaga 9.3.6 Niech A ⊂ X. Wtedy (i) int A ⊂ A ⊂ cl A, (ii) A jest otwarty wtedy i tylko wtedy gdy A = int A, (iii) A jest domknięty wtedy i tylko wtedy gdy A = cl A, (iv) \ int A = cl(\A), \ cl A = int(\A), (v) bd A = cl A ∩ cl(\A) jest zbiorem domkniętym. 9.4. OTOCZENIA, PUNKTY SKUPIENIA 157 Twierdzenie 9.3.7 Operacje wnętrza i domknięcia są monotoniczne względem relacji inkluzji, tzn. jeśli A ⊂ B ⊂ X, to int A ⊂ int B oraz cl A ⊂ cl B. Twierdzenie 9.3.8 Niech A ⊂ X. Wnętrze A jest zbiorem otwartym. Jest to największy zbiór otwarty zawarty w A. Podobnie domknięcie A jest zbiorem domkniętym i jest to najmniejszy zbiór domknięty zawierający A. Wniosek 9.3.9 Dla każdego A ⊂ X mamy int(int A) = int A, cl(cl A) = cl A. Twierdzenie 9.3.10 Dla dowolnych A, B ⊂ X mamy 9.4 9.4.1 int(A ∩ B) = int A ∩ int B, int(A ∪ B) ⊃ int A ∪ int B, cl(A ∩ B) ⊂ cl A ∩ cl B, cl(A ∪ B) = cl A ∪ cl B. Otoczenia, punkty skupienia Rodzina otoczeń punktu Definicja 9.4.1 Mówimy, że zbiór A jest otoczeniem punktu x ∈ X jeżeli x ∈ int A. Mówimy, że A jest otoczeniem otwartym punktu x jeżeli A jest otwarty i x ∈ A. Zbiór otoczeń punktu x oznaczamy Nb(x), a zbiór otoczeń otwartych punktu x oznaczamy ONb(x). 9.4.2 Punkty skupienia zbioru Definicja 9.4.2 Punkt x ∈ X nazywamy punktem skupienia zbioru A ⊂ X, jeżeli ∀V ∈ Nb(x) ∃y ∈ X y 6= x i y ∈ V ∩ A. Zbiór punktów skupienia zbioru A oznaczamy A0 . Definicja 9.4.3 Mówimy, że x ∈ X jest punktem izolowanym zbioru A ⊂ X, jeżeli x ∈ A i x nie jest punktem skupienia zbioru A. Dla zbioru n A := { n1 | n ∈ N1 } ∪ { n+1 | n ∈ N1 } jedynymi punktami skupienia są 0 i 1, z czego tylko 1 jest elementem A. Wszystkie pozostałe punkty zbioru A to jego punkty izolowane. 158 9.5 9.5.1 ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH Metryki równoważne, iloczyn kartezjański przestrzeni metrycznych Równoważność metryk. Definicja 9.5.1 Niech ρ1 i ρ2 będą metrykami w zbiorze X. Mówimy, że ρ1 i ρ2 są równoważne wtedy i tylko wtedy, gdy zachodzą następujące dwa warunki Open(X, ρ1 ) = Open(X, ρ2 ). Twierdzenie 9.5.2 Metryki ρ1 , ρ2 na X są rówoważne wtedy i tylko wtedy gdy ∀x ∈ X ∀K1 ∈ Ball(x, X, ρ1 ) ∃K2 ∈ Ball(x, X, ρ2 ) K2 ⊂ K1 , ∀x ∈ X ∀K2 ∈ Ball(x, X, ρ2 ) ∃K1 ∈ Ball(x, X, ρ1 ) K1 ⊂ K2 . Twierdzenie 9.5.3 Metryki euklidesowa, maksimum i Manhattan w Rd są wzajemnie równoważne. 9.5.2 Iloczyn kartezjański przestrzeni metrycznych Twierdzenie 9.5.4 Niech (Xi , ρi ) dla i = 1, 2, . . . d będą przestrzeniami metrycznymi. Dla x := (x1 , x2 , . . . , xd ) ∈ X1 × X2 × · · · × Xd i y := (y1 , y2 , . . . , yd ) ∈ X1 × X2 × · · · × Xd połóżmy v u n uX ρi (xi , yi )2 , ρe (x, y) := t i=1 ρmax (x, y) ρ1 (x, y) max { ρi (xi , yi ) | i = 1, 2, . . . n }, n X := ρi (xi , yi ). := i=1 Wtedy ρe , ρmax i ρ1 (x, y) są wzajemnie równoważnymi metrykami w X1 × X2 × · · · × Xd . 9.6 9.6.1 (*)Topologia przestrzeni metrycznej Fundamentalne własności zbiorów otwartych i domkniętych Twierdzenie 9.6.1 Niech (X, ρ) będzie przestrzenią metryczną. Wtedy ∅, X ∈ Open(X), U1 , U2 ∈ Open(X) ⇒ U1 ∩ U2 ∈ Open(X), [ {Uι }ι∈I ⊂ Open(X) ⇒ Uι ∈ Open(X). ι∈I 9.7. (**)BAZY OTOCZEŃ 159 Twierdzenie 9.6.2 Niech (X, ρ) będzie przestrzenią metryczną. Wtedy ∅, X ∈ Clos(X), U1 , U2 ∈ Clos(X) ⇒ U1 ∪ U2 ∈ Clos(X), \ {Uι }ι∈I ⊂ Clos(X) ⇒ Uι ∈ Clos(X). ι∈I Definicja 9.6.3 Rodzinę zbiorów otwartych przestrzeni metrycznej nazywamy topologią tej przestrzeni. Widzimy, że różne metryki moga˛ prowadzić do tej samej rodziny zbiorów otwartych, czyli topologii. I właśnie topologia jest tym co nas w tym wykładzie interesuje bardziej niż metryka. Topologi˛e można studiować bez metryki. Wtedy przyjmuje si˛e jako aksjomaty własności rodziny zbiorów otwartych zawarte w tezie twierdzenia 9.6.1. Przestrzeń z zadana˛ rodzina˛ takich zbiorów nazywa si˛e przestrzenia˛ topologiczna.˛ Okazuje si˛e, że istnieja˛ przestrzenie topologiczne, których topologii nie da si˛e zadać przy pomocy metryki. Dziedzin˛e matematyki, która zajmuje si˛e badaniem przestrzeni topologicznych też określa si˛e mianem topologia. 9.7 (**)Bazy otoczeń 9.7.1 Baza otoczeń punktu Niech (X, ρ) będzie ustaloną przestrzenią metryczną. Definicja 9.7.1 Mówimy, że rodzina B ⊂ X jest bazą otoczeń punktu x ∈ X jeżeli zachodzą następujące dwa warunki (i) ∀B ∈ B x ∈ B, (ii) ∀U ∈ Open(X) x ∈ U ⇒ ∃B ∈ B B ⊂ U . Rodzinę rodzin zbiorów {B x }x∈X nazywamy bazą otoczeń w X jeżeli dla każdego x ∈ X rodzina B x jest bazą otoczeń punktu x. Dla x ∈ X zdefiniujmy ONb(x) Nb(x) Ball0 (x) := { V ∈ Open(X) | x ∈ V }, := { A ⊂ X | ∃V ∈ Open(X) x ∈ V ⊂ A }, := { K(x, n1 ) | n ∈ N }. Dla każdego x ∈ X mamy Ball0 (x) ⊂ Ball(x) ⊂ ONb(x) ⊂ Nb(x). Twierdzenie 9.7.2 Rodziny rodzin zbiorów {Ball0 (x)}x∈X , {Ball(x)}x∈X , {ONb(x)}x∈X , {Nb(x)}x∈X są bazami otoczeń w X. Bazy otoczeń są przydatne, bo wiele warunków wystarczy sprawdzać jedynie na bazach. W szczególności mamy następujące twierdzenie. 160 ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH Rysunek 9.5: Rozdzielenie punktów kulami w przestrzeni metrycznej. Twierdzenie 9.7.3 Niech {B x }x∈X będzie bazą otoczeń w X. Wtedy (i) Zbiór A jest otwarty w X wtedy i tylko wtedy gdy dla każdego x ∈ A istnieje B ∈ B x takie, że B ⊂ A. (ii) Zbiór A jest domknięty w X wtedy i tylko wtedy gdy dla każdego x 6∈ A istnieje B ∈ B x takie, że B ∩ A = ∅. 9.7.2 Własność Hausdorffa Twierdzenie 9.7.4 Niech {B x }x∈X będzie bazą otoczeń w X. Jeśli x1 , x2 ∈ X i x1 6= x2 , to istnieją B1 ∈ B x1 oraz B2 ∈ B x2 takie, że B1 ∩ B2 = ∅. 9.7.3 Metryka w R̄ Twierdzenie 9.7.5 Istnieje silnie rosnąca bijekcja f : R̄ → [−1, 1]. W szczególności jest taką funkcja zadana wzorem x = −∞, −1 x x ∈ R, f (x) := 1+|x| 1 x = ∞. Jeśli f : R̄ → [−1, 1] jest silnie rosnącą bijekcją, to funkcja ρf : R̄ × R̄ → R∗ dana wzorem ρf (x, y) := |f (x) − f (y)| jest metryką w R̄. Co więcej, jeśli f1 , f2 : R̄ → [−1, 1] są dwoma silnie rosnącymi bijekcjami, to metryki ρf1 i ρf2 są równoważne. W dalszym ciągu zbiór R̄ traktować będziemy jako przestrzeń metryczną z metryką ρf . Twierdzenie 9.7.6 Metryka indukowana z R̄ w R jest równoważna metryce euklidesowej w R. Zbiór N̄ := N ∪ {∞} jest podzbiorem R̄, jest więc przestrzenią metryczną z metryką indukowaną z R̄. Łatwo sprawdzić, że w przestrzeni tej wszystkie punkty są izolowane, z wyjątkiem punktu ∞, który jest punktem skupienia zbioru N ⊂ N̄. Ponieważ kule w metryce ρf nie mają prostego opisu, wygodnie jest posługiwać się następującym twierdzeniem. 9.8. (**)PRZELICZALNE BAZY OTOCZEŃ PUNKTU 161 Twierdzenie 9.7.7 Dla x ∈ R̄ połóżmy { [−∞, −n) | n ∈ N } B x := { (x − n1 , x + n1 ) | n ∈ N } { (n, ∞] | n ∈ N } Wtedy {B x } x∈R̄ 9.8 x = −∞, x ∈ R, x = ∞. stanowi bazę otoczeń w R̄. (**)Przeliczalne bazy otoczeń punktu Rodzina Ball0 (x) jest przeliczalna. Pozwala to w szczególności udowodnić następujące dwa twierdzenia. Twierdzenie 9.8.1 Zbiór A ⊂ X jest domknięty wtedy i tylko wtedy gdy dla każdego ciągu x : N → A jeśli x jest zbieżny do x0 ∈ X to x0 ∈ A. Twierdzenie 9.8.2 Punkt x0 ∈ X jest punktem skupienia zbioru A ⊂ X wtedy i tylko wtedy gdy istnieje ciąg a : N → A \ {x0 } zbieżny do x0 . 9.9 9.9.1 (*)Zupełność Warunek Cauchy’ego Definicja 9.9.1 Niech (X, ρ) będzie przestrzenią metryczną. Mówimy, że ciąg X : N → X spełnia warunek Cauchy’ego jeżeli ∀ > 0∃N ∈ N∀n, m ­ N ρ(xn , xm ) < . Twierdzenie 9.9.2 Każdy ciąg zbieżny jest ciągiem Cauchy’ego. Dowód: Twierdzenie 9.9.3 (*)Jeśli ciąg Cauchy’ego posiada podciąg zbieżny to jest zbieżny. Dowód: 162 ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH Twierdzenie 9.9.4 (*)Każdy ciąg Cauchy’ego jest ograniczony Dowód: Wniosek 9.9.5 Każdy ciąg Cauchy’ego w Rd jest zbieżny. Dowód: (*) 9.9.2 Przestrzenie zupełne Definicja 9.9.6 Przestrzeń metryczną nazywamy zupełną, jeżeli każdy ciąg Cauchy’ego w tej przestrzeni jest zbieżny. Wniosek 9.9.7 Rd jest przestrzenią zupełną. Rozdział 10 Granica funkcji 10.1 Granica funkcji w przestrzeniach metrycznych 10.1.1 Eksperymenty numeryczne Przy obliczeniach numerycznych granicy limx→x0 f (x) nie możemy rozważyć wszystkich wartości argumentu x, wi˛ec w praktyce wybieramy ciag ˛ xn zmierzajacy ˛ do x0 i obserwujemy zachowanie f (xn ). Program w j˛ezyku Mathematica obliczajacy ˛ przybliżenie granicy funkcji poprzez obliczanie wartości funkcji w ciagu ˛ punktów przedstawiono na listingu 10.1. Analogiczny przykład w C++ w odniesieniu do granicy limx→0 sinx x i ciagu ˛ xn := n1 przedstawiono w programie z listingu 10.2. Ćwiczenie komputerowe 10.1.1 wartosciach p. • Sprawdź działanie programu z listingu 10.1 dla funkcji x 7→ sin x x i dla ciagu ˛ xn := 1 np przy różnych ˛ • Sprawdź działanie programu z listingu 10.1 dla funkcji x 7→ sin x1 i dla różnych ciagów. • W programie z listingu 10.2 zmień ciag ˛ xn na xn := 1 np dla różnych wartości p i zaobserwuj zachowanie si˛e programu. • Zmodyfikuj program z listingu 10.2 zast˛epujac ˛ funkcj˛e x 7→ sin x x funkcja˛ x 7→ sin 1 x i zaobserwuj zachowanie si˛e programu dla różnych ciagów. ˛ Eksperymenty numeryczne pokazuja,˛ że definicj˛e granicy funkcji lepiej byłoby postawić uniezależniajac ˛ si˛e od ciagów, ˛ bo zachowanie funkcji może być różne, przy podstawieniu w miejsce argumentów różnych ciagów. ˛ Taka˛ definicj˛e rozważaliśmy już w rozdziale wst˛epnym. 10.1.2 Definicja granicy funkcji w przestrzeniach metrycznych Niech X, Y będą przestrzeniami metrycznymi odpowiednio z metrykami ρX i ρY . Niech A będzie podzbiorem X. Rozważmy punkt skupienia x0 zbioru A, punkt y0 ∈ Y oraz funkcję f : A → Y . Twierdzenie 10.1.2 Następujące warunki są równoważne: ∀ > 0 ∃δ > 0 ∀x ∈ A \ {x0 } ρX (x, x0 ) < δ ⇒ ρY (f (x), y0 ) < , ∀V ∈ Nb(y0 ) ∃U ∈ Nb(x0 ) ∀x ∈ U ∩ A \ {x0 } f (x) ∈ V. (10.1) (10.2) Dowód: Załóżmy, że warunek (10.1) zachodzi. Niech V będzie otoczeniem punktu y0 . Z definicji otoczenia znajdziemy kulę K(y0 , r) w Y zawartą w V . Ponieważ r > 0, na mocy założenia (10.1) znajdziemy δ > 0 takie, że dla wszystkich x ∈ A \ {x0 } ρX (x, x0 ) < δ ⇒ ρY (f (x), y0 ) < r. 163 164 ROZDZIAŁ 10. GRANICA FUNKCJI (∗ P r z y b l i ż a n i e granicy f u n k c j i f granicą ciągu n wartości f u n k c j i w punktach c i ą g u x ∗ ) F u n c t i o n L i m i t [ f_ , x_ , n_ ] := Module [ { k } , k = 1; Do[ Print [ f [ x [ k ] ] ] ; k = k + 1, {n} ]; ] ( ∗ Funkcja , k t ó r e j g r a n i c ę w z e r z e l i c z y m y ∗ ) g [ x_ ] := Sin [ x ] / x ; ( ∗ Ciąg o wyrazach z m i e r z a j ą c y c h do z e r a ∗ ) x [ n_ ] := 1 . / n ( ∗ Test p r z y b l i ż a n i a w a r t o ś c i f u n k c j i ∗ ) FunctionLimit [ g , x , 100] Listing 10.1: Przybliżanie granicy funkcji w języku Mathematica Zatem dla x ∈ A \ {x0 } mamy x ∈ K(x0 , δ) ⇒ y ∈ K(y0 , r) ⊂ V. Ponieważ K(x0 , δ) jest otoczeniem x0 , więc dobraliśmy do V otoczenie U , którego istnienie jest postulowane w (10.2). Dowodzi to, że warunek (10.1) implikuje warunek (10.2). Dowód implikacji przeciwnej jest podobny. Zostawiamy go jako ćwiczenie. Twierdzenie 10.1.2 pozwala postawić następującą ogólną definicję granicy w przestrzeniach metrycznych. Definicja 10.1.3 Mówimy, że y0 ∈ Y jest granicą funkcji f w punkcie x0 i piszemy lim f (x) = y0 x→x0 jeżeli zachodzi którykolwiek z równoważnych warunków (10.1) i (10.2). 10.1.3 Jednoznaczność granicy Twierdzenie 10.1.4 (o jednoznaczności granicy) Niech X, Y będą przestrzeniami metrycznymi, A ⊂ X, f : X → Y funkcją, a x0 punktem skupienia A w X. Jeśli dla pewnych y1 , y2 ∈ Y mamy lim f (x) = y1 i lim f (x) = y2 x→x0 to y1 = y2 . x→x0 10.1. GRANICA FUNKCJI W PRZESTRZENIACH METRYCZNYCH 165 /∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ F u n c t i o n L i m i t . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ /∗ P r z y b l i ż a n i e g r a n i c y f u n k c j i g r a n i c ą c i ą g u w a r t o ś c i ∗/ /∗ f u n k c j i ∗/ /∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/ #include <i o s t r e a m > #include <cmath> #include <iomanip> using namespace s t d ; /∗ Funkcja , k t ó r e j g r a n i c ę w z e r z e l i c z y m y ∗/ double f ( double x ) { return s i n ( x ) / x ; } /∗ Ciąg o wyrazach z m i e r z a j ą c y c h do z e r a ∗/ double x ( i n t n ) { return 1 . 0 / n ; } /∗ W p r o g r a m i e głównym wypisujemy c i ą g w a r t o ś c i f u n k c j i w zadanym c i ą g u punktów ∗/ i n t main ( ) { c o u t << f i x e d << r i g h t ; c o u t << s e t p r e c i s i o n ( 1 5 ) ; f o r ( i n t n=1;n<=20;n=n+1){ c o u t << "x[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << x ( n ) ; c o u t << " f(x[" << setw ( 2 ) << n << " ]) =" ; c o u t << setw ( 1 8 ) << f ( x ( n ) ) << e n d l ; } } Listing 10.2: Przybliżanie granicy funkcji w C++ 166 ROZDZIAŁ 10. GRANICA FUNKCJI Dowód: Dla dowodu nie wprost załóżmy, że y1 6= y2 . Wtedy r := ρ(y1 , y2 ) > 0. Z warunku (10.1) zastosowanego dla y1 i y2 do := 2r znajdziemy odpowiednio δ1 i δ2 takie, że dla x ∈ A \ {x0 } ρ(x, x0 ) < δ1 ⇒ ρ(f (x), y1 ) < (10.3) ρ(x, x0 ) < δ2 ⇒ ρ(f (x), y2 ) < . (10.4) Niech δ := min(δ1 , δ2 ). Ponieważ x0 jest punktem skupienia zbioru A w X, a K(x0 , δ) jest otoczeniem x0 w X, więc znajdziemy punkt x∗ ∈ K(x0 , δ) ∩ A. Ponieważ w szczególności ρ(x∗ , x0 ) < δ1 i ρ(x∗ , x0 ) < δ2 , więc na mocy (10.3) i (10.4) mamy ρ(f (x∗ ), y1 ) < i ρ(f (x∗ ), y2 ) < . Zatem z nierówności trójkąta ρ(y1 , y2 ) ¬ ρ(y1 , f (x∗ )) + ρ(f (x∗ ), y2 ) < + = ρ(y1 , y2 ). Otrzymana sprzeczność dowodzi tezy. 10.1.4 Granica złożenia funkcji Twierdzenie 10.1.5 (O granicy złożenia funkcji) Niech X, Y, Z będą przestrzeniami metrycznymi, x0 ∈ X 0 , y0 ∈ Y 0 , z0 ∈ Z. Jeśli f : X → Y i g : Y → Z są takie, że y0 6∈ im f oraz limx→x0 f (x) = y0 i limy→y0 g(y) = z0 to limx→x0 (g ◦ f )(x) = z0 . Dowód: W programie Mathematica granicę limx→u f (x) dla funkcji f : R̄−→ ◦ R̄ i u ∈ R̄ liczymy przy pomocy instrukcji Limit[f[x], x -> u] Na przykład Limit[1/(1 + x), x -> Infinity] zwraca 0. 10.2 (**)Przypadki szczególne definicji granicy Przypomnijmy, że ciag ˛ x : N → R ma granic˛e x∗ wtedy i tylko wtedy gdy ∀ > 0 ∃N ∈ N n > N ⇒ |xn − x∗ | < . Natomiast funkcja f : R → R ma granic˛e f∗ przy x zmierzajacym ˛ do x∗ wtedy i tylko wtedy gdy ∀ > 0 ∃δ > 0 |x − x∗ | < δ, x 6= x∗ ⇒ |f (x) − f∗ | < . Funkcja f może też mieć granic˛e nieskończona.˛ Mówimy, że funkcja f : R → R ma granic˛e ∞ przy x zmierzajacym ˛ do x∗ wtedy i tylko wtedy gdy ∀A > 0 ∃δ > 0 |x − x∗ | < δ, x 6= x∗ ⇒ f (x) > A. 10.2. (**)PRZYPADKI SZCZEGÓLNE DEFINICJI GRANICY 167 Powstaje naturalne pytanie, czy te trzy formalnie różne definicje nie daja˛ si˛e uogólnić do jednej definicji uniwersalnej. Podpowiedź jak to zrobić zawarta jest w nast˛epujacym ˛ przeformułowaniu powyższych definicji. lim xn = x∗ :⇔ ∀ > 0 ∃N ∈ N ∀n ∈ (N, ∞] \ {∞} xn ∈ (x∗ − , x∗ + ), lim f (x) = f∗ :⇔ ∀ > 0 ∃δ > 0 ∀x ∈ (x − δ, x + δ) \ {x∗ } f (x) ∈ (f∗ − , f∗ + ), lim f (x) = ∞ :⇔ ∀A > 0 ∃δ > 0 ∀x ∈ (x − δ, x + δ) \ {x∗ } f (x) ∈ (A, ∞]. n→∞ x→x∗ x→x∗ Widać, że w każdym przypadku pojawiaja˛ si˛e otoczenia: albo postaci (x − r, x + r) dla x ∈ R, albo postaci (r, ∞] w przypadku punktu w nieskończoności. Tak wi˛ec zast˛epujac ˛ te konkretne otoczenia w R̄ ogólnymi otoczeniami w przestrzeni metrycznej dostajemy dość ogólna˛ definicj˛e granicy. 10.2.1 Kryterium na granicę w bazach Niech B 1 będzie bazą otoczeń x0 , a B 2 bazą otoczeń y0 . Twierdzenie 10.2.1 Warunek lim f (x) = y0 x→x0 jest równoważny warunkowi ∀V ∈ B 2 ∃U ∈ B 1 ∀x ∈ U ∩ A \ {x0 } 10.2.2 f (x) ∈ V. Granica ciągu Zobaczmy jak z naszego ogólnego kryterium na granicę w bazach można odzyskać naszą definicję granicy ciągu liczb. Jako przestrzeń X bierzemy N̄. Jako przestrzeń Y bierzemy R. Jako metrykę w R bierzemy metrykę euklidesową. Jako zbiór A, na którym jest określona funkcja f : A → Y bierzemy N. Funkcja określona na N to przecież ciąg, więc w miejsce f pisać będziemy bardziej tradycyjnie a, a jako argumentu zamiast x używać będziemy n. Jako punkt x0 , w którym liczymy granicę bierzemy ∞. Punkt ∞ jest rzeczywiście punktem skupienia zbioru A = N w przestrzeni X = N̄. Jako bazę otoczeń dla x0 = ∞ bierzemy B 1 := {B(N ) := (N, ∞] | N ∈ N}. Jako bazę otoczeń dla y0 bierzemy B 2 := Ball(y0 ). Podstawiając to wszystko do naszej ogólnej definicji dostajemy lim an = y0 n→∞ :⇔ ∀K = K(y0 , ) ∈ Ball(y0 ) ∃B = B(N ) ∈ B 1 ∀n ∈ B ∩ A \ {∞} ⇔ ∀ > 0 ∃N ∈ N ∀n > N an ∈ K |an − y0 | < , a więc dokładnie taki warunek jaki postawiliśmy jako definicję granicy ciągu. 10.2.3 Granica funkcji w przestrzeni metrycznej Definicję Cauchy’ego granicy funkcji R w R odzyskujemy biorąc A = X = Y = R, jako metrykę biorąc metrykę euklidesową w R, a jako bazy otoczeń B 1 i B 2 rodziny kul w x0 i y0 . Dostajemy lim f (x) = y0 x→x0 :⇔ ∀K = K(y0 , ) ∈ Ball(y0 ) ∃B = K(x0 , δ) ∈ Ball(x0 ) ∀x ∈ B ∩ A \ {x0 } ⇔ ∀ > 0 ∃δ > 0 ∀x 6= x0 |x − x0 | < δ ⇒ |f (x) − y0 | < , f (x) ∈ K 168 ROZDZIAŁ 10. GRANICA FUNKCJI 10.2.4 Granica nieskończona w R̄ Przypadek nieskończonej wartości granicy funkcji uzyskujemy biorąc Y = R̄, y0 = ∞, B 1 = Ball(x0 ) i B 2 = {(E, ∞] | E ∈ R+ }. Dostajemy lim f (x) = ∞ x→x0 :⇔ ∀B = (E, ∞] ∈ B 1 ∃K = K(x0 , δ) ∈ Ball(x0 ) ∀x ∈ K ∩ A \ {x0 } ⇔ ∀E > 0 ∃δ > 0 ∀x ∈ A \ {x0 } f (x) ∈ B ρ(x, x0 ) < δ ⇒ f (x) > E, Podobnie wygląda przypadek granicy wynoszącej −∞. Za bazę otoczeń B 2 bierzemy jedynie {[−∞, −E) | E ∈ R+ } 10.2.5 Granica w nieskończoności Przypadek granicy w nieskończoności dla funkcji f : X → R uzyskujemy biorąc X = R̄, A = R, x0 = ∞, B 1 = { (E, ∞] | E ∈ R+ }, B 2 = Ball(y0 ). Dostajemy lim f (x) = y0 x→∞ :⇔ ∀K = K(y0 , ) ∈ Ball(y0 ) ∃B = (E, ∞] ∈ B 1 ∀x ∈ B ∩ A \ {∞} ⇔ ∀ > 0 ∃E > 0 ∀x ∈ R f (x) ∈ K x > E ⇒ |f (x) − y0 | < , Podobnie wygląda przypadek granicy w −∞. Za bazę otoczeń B 1 bierzemy jedynie {[−∞, −E) | E ∈ R+ } 10.3 Granice jednostronne Niech Y będzie przestrzenią metryczną. Rozważmy f : R → Y i punkt x0 ∈ R. Definicja 10.3.1 Mówimy, że f ma w x0 granicę lewostronną równą y ∈ Y i piszemy lim f (x) = y, x→x− 0 jeżeli f|(−∞,x0 ] : (−∞, x0 ] → Y ma w x0 granicę y. Analogicznie, mówimy, że f ma w x0 granicę prawostronną równą y ∈ Y i piszemy lim+ f (x) = y, x→x0 jeżeli f|[x0 ,∞) : [x0 , ∞) → Y ma w x0 granicę y. Twierdzenie 10.3.2 Funkcja f ma w x0 granicę y ∈ Y wtedy i tylko wtedy gdy obie granice jednostronne istnieją i są sobie równe. W programie Mathematica granicę jednostronną limx→u− f (x) liczymy przy pomocy instrukcji Limit[f[x], x -> u, Direction -> 1] a granicę jednostronną limx→u+ f (x) liczymy przy pomocy instrukcji Limit[f[x], x -> u, Direction -> -1] Na przykład Limit[1/x, x -> 0, Direction -> 1] zwraca −∞. 10.4. PUNKTY GRANICZNE 169 10.4 Punkty graniczne 10.4.1 Ciągowa charakterystyka granicy Ustalmy dwie przestrzenie metryczne X, Y oraz funkcję f : X → Y i punkt x0 ∈ X 0 . Twierdzenie 10.4.1 Następujące dwa warunki są sobie równoważne (i) istnieje granica lim f (x) = y0 , x→x0 (ii) dla każdego ciągu x : N1 → X \ {x0 } zachodzi lim xn = x0 ⇒ lim f (xn ) = y0 . n→∞ n→∞ Dowód: 10.4.2 Zbiór punktów granicznych Definicja 10.4.2 Niech f : X → Y będzie funkcją odwzorowującą przestrzeń metryczną X w przestrzeń metryczną Y . Niech x0 ∈ X będzie punktem skupienia X w X. Definiujemy zbiór punktów granicznych funkcji f w x0 jako Lim f (x) := { y ∈ Y | ∃a : N → X limn→∞ an = x0 i limn→∞ f (an ) = y }. x→x0 Twierdzenie 10.4.3 Zbiór Limx→x0 f (x) jest domknięty. Dowód: 170 ROZDZIAŁ 10. GRANICA FUNKCJI 10.4.3 Ciągowa charakterystyka granicy ciągu Twierdzenie 10.4.4 Niech a : N → Y będzie ciągiem w przestrzeni metrycznej Y , a y ∈ Y . Następujące warunki są równoważne. (i) limn→∞ an = y, (ii) ∀k : N → N limn→∞ kn = ∞ ⇒ limn→∞ (a ◦ k)(n) = y, (iii) ∀k : N → N k silnie rosnący ⇒ limn→∞ (a ◦ k)(n) = y, (iv) Dla każdego a0 podciągu a jest limn→∞ a0n = y. Twierdzenie 10.4.5 Niech a : N → Y będzie ciągiem w przestrzeni metrycznej Y . Wtedy Lim an = { y ∈ Y | ∃kN → N silnie rosnący i taki, że lim akn = y }. n→∞ 10.5 Granica dolna i górna 10.5.1 Granica dolna i górna Niech X będzie przestrzenią metryczną, Y ⊂ R̄ oraz f : X → Y . Załóżmy ponadto, że dla pewnego x0 ∈ X 0 zbiór Limx→x0 f (x) jest niepusty. Definicja 10.5.1 W przypadku gdy Limx→x0 f (x) jest ograniczony od góry, granicę górną definiujemy wzorem lim sup f (x) := sup Lim f (x). x→x0 x→x0 Analogicznie, gdy Limx→x0 f (x) jest ograniczony od dołu, granicę dolną definiujemy wzorem lim inf f (x) := inf Lim f (x). x→x0 x→x0 Zobaczymy później, że w przypadku Y = R̄ zbiór punktów granicznych jest zawsze niepusty, a ponieważ każdy zbiór w R̄ jest ograniczony tak od góry jak i od dołu, wi˛ec granica górna i dolna sa˛ w tym przypadku zawsze określone. Twierdzenie 10.5.2 Niech f : X → R̄ oraz x0 ∈ X 0 . Wtedy a = limx→x0 f (x) jest równoważne równości lim inf f (x) = lim sup f (x). x→x0 x→x0 10.5. GRANICA DOLNA I GÓRNA 171 W przypadku gdy Y = R̄ możemy podać przydatne kryterium na granicę górną i dolną, a także twierdzenie o zachowywaniu nierówności przez te granice. W dowodach wykorzystujemy nieudowodniony jeszcze fakt, że każdy ciąg w R̄ posiada podciąg zbieżny. Fakt ten udowodnimy w rozdziale 11. 10.5.2 Własności granicy dolnej i górnej Twierdzenie 10.5.3 Niech f : X → R̄ oraz x0 ∈ X 0 . Wtedy a = lim supx→x0 f (x) jest równoważne koniunkcji następujących dwóch warunków. a ∈ Lim f (x), x→x0 ∀b > a ∃V ∈ Nb(x0 ) x ∈ V ⇒ f (x) < b. Dowód: Twierdzenie 10.5.4 Niech f, g : X → R̄ oraz x0 ∈ X 0 . Jeśli istnieje V ∈ Nb(x0 ) takie, że dla każdego x ∈ V \ {x0 } mamy f (x) ¬ g(x) to lim inf f (x) ¬ lim inf g(x), x→x0 x→x0 lim sup f (x) ¬ lim sup g(x). x→x0 Dowód: x→x0 172 ROZDZIAŁ 10. GRANICA FUNKCJI 10.6 Granica, a struktura algebraiczna 10.6.1 Sumy, różnica, iloczyn i iloraz funkcji Niech X będzie przestrzenią metryczną, a x0 punktem skupienia X. Niech Y będzie ciałem R lub ciałem C. Załóżmy, że dane są funkcje f1 , f2 : X → Y. Niech : Y × Y będzie działaniem w ciele Y . Definiujemy funkcję f1 f2 : X 3 x 7→ f1 (x) f2 (x) ∈ Y. Dla ∈ { +, −, ·, / } nazywamy ją odpowiednio sumą, różnicą, iloczynem i ilorazem funkcji f1 i f2 . 10.6.2 Granica sumy, różnicy i iloczynu Twierdzenie 10.6.1 Załóżmy, że f1 , f2 mają w x0 odpowiednio granice a1 , a2 ∈ Y , tzn. lim fi (x) = ai . x→x0 Wtedy istnieją granice sumy, różnicy i iloczynu funkcji f1 , f2 w x0 i wynoszą odpowiednio lim (f1 (x) + f2 (x)) = a1 + a2 , lim (f1 (x) − f2 (x)) = a1 − a2 , x→x0 x→x0 lim (f1 (x)f2 (x)) x→x0 Dowód: 10.6.3 Granica ilorazu = a1 a2 . 10.7. GRANICA, A STRUKTURA PORZĄDKOWA 173 Twierdzenie 10.6.2 Przy założeniach poprzedniego twierdzenia, jeśli ponadto a2 6= 0, to istnieje też granica ilorazu i wynosi f1 (x) a1 lim = . x→x0 f2 (x) a2 Dowód: Powyższe twierdzenia zachodzą też w przypadku Y = R̄, ale tylko wtedy, gdy odpowiednie działania mają sens. 10.7 Granica, a struktura porządkowa 10.7.1 Zachowywanie nierówności w granicy Twierdzenie 10.7.1 Niech f, g : X → R̄, x ∈ X 0 . Jeśli istnieje otoczenie V punktu x0 takie, że dla każdego x ∈ X \ {x0 } mamy f (x) ¬ g(x), to lim f (x) ¬ lim g(x). x→x0 Dowód: 10.7.2 Twierdzenie o trzech funkcjach x→x0 174 ROZDZIAŁ 10. GRANICA FUNKCJI Twierdzenie 10.7.2 Niech f, g, h : X → R̄, x ∈ X 0 . Jeśli istnieje otoczenie V punktu x0 takie, że dla każdego x ∈ X \ {x0 } mamy f (x) ¬ g(x) ¬ h(x) oraz istnieją granice lim f (x), x→x0 lim h(x) x→x0 i obie są równe pewnemu a ∈ R̄, to istnieje granica limx→x0 g(x) i też wynosi a. Dowód: 10.7.3 Granica funkcji monotonicznej Twierdzenie 10.7.3 Niech A ⊂ R̄ i ω := sup A. Jeśli ω jest punktem skupienia zbioru A, a f : A → R̄ jest funkcją rosnącą i ograniczoną od góry, to istnieje granica limx→ω f (x) i jest równa sup { f (x) | x ∈ A, x < ω }. Dowód: 10.8 Granice w produkcie kartezjańskim Twierdzenie 10.8.1 Niech X oraz Y1 , Y2 , . . . Yn będą przestrzeniami metrycznymi, a f = (f1 , f2 , . . . fn ) : X → Y1 × Y2 × · · · × Yn niech będzie zestawieniem funkcji fi : X → Yi dla i = 1, 2, . . . , n. Niech x0 będzie punktem skupienia przestrzeni X oraz niech y := (y1 , y2 , . . . , yn ) ∈ Y1 × Y2 × · · · × Yn . Wtedy lim f (x) = y ⇔ lim fi (x) = yi dla i = 1, 2, . . . n. x→x0 x→x0 10.8. GRANICE W PRODUKCIE KARTEZJAŃSKIM Dowód: (**)Dowód przedstawimy dla przypadku n = 2. 175 176 ROZDZIAŁ 10. GRANICA FUNKCJI Rozdział 11 Ciągłość funkcji 11.1 Koncepcja ciągłości 11.1.1 Definicja ciągłości Niech f : X → Y będzie odwzorowaniem przestrzeni metrycznych. Definicja 11.1.1 Mówimy, że f jest ciągła w punkcie x0 ∈ X jeżeli dla każdego otoczenia V ∈ Nb(f (x0 )) istnieje otoczenie U ∈ Nb(x0 ) takie, że x ∈ U ⇒ f (x) ∈ V. Mówimy, że f jest ciągła jeśli jest ciągła w każdym punkcie x ∈ X. Twierdzenie 11.1.2 Funkcja f jest ciągła w x0 wtedy i tylko wtedy gdy zachodzi jeden z następujących dwóch warunków x0 6∈ X 0 lub x0 ∈ X 0 i lim f (x) = f (x0 ). x→x0 Dowód: Twierdzenie 11.1.3 Niech B 1 będzie bazą otoczeń x0 , a B 2 bazą otoczeń f (x0 ). Wtedy ciągłość f : X → Y w x0 jest równoważna każdemu z trzech poniższych warunków ∀V ∈ B 2 ∃U ∈ B 1 ∀V ∈ B 2 ∃U ∈ B 1 ∀V ∈ B 2 f (U ) ⊂ V, U ⊂ f −1 (V ), f −1 (V ) ∈ Nb(x0 ). 177 178 ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI Dowód: 11.1.2 Kryteria ciągłości Twierdzenie 11.1.4 Funkcja f : X → Y jest ciągła wtedy i tylko wtedy gdy dla każdego zbioru otwartego V w Y zbiór f −1 (V ) jest otwarty w X. Dowód: Twierdzenie 11.1.5 Funkcja f : X → Y jest ciągła wtedy i tylko wtedy gdy dla każdego zbioru domkniętego K w Y zbiór f −1 (K) jest domknięty w X. 11.1.3 Ciągłość złożenia Twierdzenie 11.1.6 Niech X, Y, Z będą przestrzeniami metrycznymi, a f : X → Y i g : Y → Z odwzorowaniami. Jeśli f jest ciągłe w x0 ∈ X, a g jest ciągłe w f (x0 ), to g ◦ f jest ciągłe w x0 . Zatem jeśli f i g są ciągłe, to g ◦ f jest ciągłe. Dowód: łatwe ćwiczenie. 11.1.4 Ciągłość operacji arytmetycznych Niech X będzie przestrzenią metryczną, a Y niech będzie ciałem liczb rzeczywistych lub ciałem liczb zespolonych. Twierdzenie 11.1.7 Jeśli f, g : X → Y są ciągłe w x0 ∈ X to f + g, f − g, f · g są ciągłe w x0 . Jeśli dodatkowo g(x0 ) 6= 0, to f /g jest ciągłe w x0 . Dowód: łatwe ćwiczenie. 11.1.5 Twierdzenie o lokalnym zachowywaniu znaku Twierdzenie 11.1.8 Niech f : X → R będzie funkcją ciągłą. Jeśli f (x0 ) > 0 dla pewnego x0 ∈ X, to istnieje U otoczenie punktu x0 takie, że dla każdego x ∈ U mamy f (x) > 0. 11.1. KONCEPCJA CIĄGŁOŚCI 179 Dowód: Twierdzenie 11.1.9 Niech X, Y będą przestrzeniami metrycznymi. (i) (ii) Niech c ∈ Y . Funkcja stała cX : X 3 x 7→ c ∈ Y jest ciągła. Niech X ⊂ Y . Inkluzja j : X 3 x 7→ x ∈ Y jest ciągła. (iii) Identyczność idX : X 3 x 7→ x ∈ X jest ciągła. (iv) Odwzorowania rzutowania pX : X × Y 3 (x, y) 7→ x ∈ X qX : X × Y 3 (x, y) 7→ y ∈ Y są ciągłe. (v) Zawężenie f|A odwzorowania ciągłego f : X → Y do zbioru A ⊂ X jest ciągłe. Dowód: łatwe ćwiczenie. Twierdzenie 11.1.10 Niech P : C → C będzie wielomianem. Wtedy P jest ciągłe. Dowód: łatwe ćwiczenie. Niech P, Q : C → C będą wielomianami. Funkcją wymierną jest funkcja P P (x) : C \ Q−1 (0) 3 x 7→ ∈ C. Q Q(x) Twierdzenie 11.1.11 Funkcja wymierna jest ciągła. Dowód: łatwe ćwiczenie. (*)Nieciągłości funkcji f : R → R 11.1.6 Niech f : (a, b) → R i niech x0 ∈ (a, b). Definicja 11.1.12 Mówimy, że f ma w x0 nieciągłość pierwszego rodzaju, jeżeli f nie jest ciągła w x0 , ale istnieją granice jednostronne limx→x− f (x) i limx→x+ f (x). W przeciwnym razie mówimy, że f ma w x0 nieciągłość drugiego 0 0 rodzaju. Twierdzenie 11.1.13 Funkcja f ma w x0 nieciągłość pierwszego rodzaju wtedy i tylko wtedy gdy limx→x− f (x) 6= 0 limx→x+ f (x) lub limx→x− f (x) = limx→x+ f (x) 6= f (x0 ). 0 0 0 180 ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI Twierdzenie 11.1.14 Jeśli f : (a, b) → R jest funkcją słabo rosnącą, to każdy jej punkt nieciągłości jest pierwszego rodzaju. Ponadto ∀x0 ∈ (a, b) ∀x1 , x2 , x3 ∈ (a, b) lim f (x) ¬ f (x0 ) ¬ lim+ f (x), x→x− 0 x→x0 x1 < x2 < x3 ⇒ lim+ f (x) ¬ f (x2 ) ¬ lim− f (x). x→x1 x→x3 Analogiczne własności ma funkcja słabo malejąca. Dowód: 11.1.7 Ciągłość bijekcji monotonicznej Twierdzenie 11.1.15 Niech (a, b) i (c, d) będą otwartymi przedziałami w R i niech f : (a, b) → (c, d) będzie bijekcją rosnącą. Wtedy f jest ciągła. Dowód: 11.2 Ciągłość, a zwartość Funkcje ciągłe mają wiele pożytecznych własności. Jednakże wiele z tych własności wymaga, by zbiory na których funkcje są określone miały pewne sprzyjające tym własnościom cechy. Do cech takich należą rozważane w tym rozdziale zwartość, spójność oraz zupełność. 11.2.1 Zwartość podprzestrzeni Rd . Przyczyny braku zbieżności mogą być różne. Ciąg a : N1 3 n 7→ 1 + (−1)n → R n 11.2. CIĄGŁOŚĆ, A ZWARTOŚĆ 181 Rysunek 11.1: Funkcja ciągła na zbiorze domkniętym i ograniczonym jest ograniczona nie jest zbieżny, bo nie może się zdecydować czy zbiegać do 1 czy do −1. Inaczej: można z niego wybrać podciągi zbieżne do dwóch różnych granic. Z kolei ciąg a : N1 3 n 7→ 2n → R, w ogóle nie posiada podciągu zbieżnego. Ale temu można zaradzić zmieniając przestrzeń R na R̄. Wtedy ten ciąg staje się zbieżny do +∞. Można pokazać, że w R̄ każdy ciąg posiada podciąg zbieżny. Przestrzenie topologiczne, które mają taką własność są z wielu powodów mile widziane. Do takich zaliczają się przestrzenie zwarte. Ponieważ ich ogólna definicja jest nieco skomplikowana, podamy ją oddzielnie w rozdz. 11.2.3. Jednak w następującym ważnym przypadku szczególnym definicja jest prosta. Definicja 11.2.1 Niech X będzie podprzestrzenią przestrzeni metrycznej Rd z metryką euklidesową. Mówimy, że przestrzeń X jest zwarta jeśli X jako podzbiór Rd jestdomknięty i ograniczony. Domkni˛ete i ograniczone podzbiory w Rn maja˛ też inne przydatne własności. Rysunek 11.1 pokazuje, że należy oczekiwać iż funkcja ciagła ˛ f na domkni˛etym i ograniczonym podzbiorze Rn jest ograniczona. Rysunek 11.2 z kolei pokazuje, że założenie iż zbiór jest ograniczony jest istotne. Co wi˛ecej, sama domkni˛etość przedziału nie wystarcza. Przedział [0, ∞), też jest domkni˛ety, ale funkcja [0, ∞) 3 x 7→ x2 ∈ R jest nieograniczona. Zatem istotne jest, by rozważać przedział domkni˛ety i ograniczony. Rozważania te sugeruja,˛ że prawdziwe powinno być nast˛epujace ˛ twierdzenie (formułujemy je dla najprostszego przypadku). Twierdzenie 11.2.2 Niech f : [a, b] → R b˛edzie funkcja˛ ciagł ˛ a.˛ Wtedy f jest funkcja˛ ograniczona.˛ 11.2.2 (*)Intuicja zwartości i ogólna definicja zwartości. Potencjalny dowód tw. 11.2.2 mógłby przebiegać tak: Do y ∈ im f dobieram x ∈ [a, b] takie, że f (x) = y oraz Vx ∈ ONb(x) takie, że u ∈ Vx ⇒ f (u) ∈ [y − 1, y + 1]. 182 ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI Rysunek 11.2: Funkcja ciągła na przedziale otwartym (a, b) nie musi być ograniczona Mamy [a, b] ⊂ [ { Vx | x ∈ [a, b] }. Mówimy, że rodzina zbiorów { Vx | x ∈ [a, b] } stanowi pokrycie otawrte przedziału [a, b]. Gdyby było możliwe zastapienie ˛ tego pokrycia podpokryciem skończonym, to znaczy wybranie skończonej ilości punktów x1 , x2 , . . . xk ∈ [a, b], tak, by [a, b] ⊂ k [ V xi , i=1 to otrzymalibyśmy f ([a, b]) ⊂ k [ [f (xi ) − 1, f (xi ) + 1] i=1 a stad ˛ f ([a, b]) ⊂ [c, d], gdzie c := min { f (xi ) − 1 | i = 1, 2, . . . k } d := max { f (xi ) + 1 | i = 1, 2, . . . k } i dowód byłby zakończony. Okazuje si˛e, że jedynymi podzbiorami w Rn , które maja˛ własność istnienia podpokrycia skończonego dla dowolnego pokrycia otwartego sa˛ zbiory domkni˛ete i ograniczone. Niestety nie jest to prawda˛ w dowolnej przestrzeni metrycznej. Ponieważ pomysł polegajacy ˛ na wybraniu z nieskończonego pokrycia zbioru pewnego podpokrycia skończonego przydaje si˛e w wielu dowodach, dlatego warto wyróżnić klas˛e zbiorów majacych ˛ taka˛ własność. Zbiory takie nazywane sa˛ zbiorami zwartymi. Co wi˛ecej, okazuje si˛e, że zwartość zbioru nie zależy od topologii przestrzeni, w której zbiór jest zanurzony, a tylko od topologii indukowanej w zbiorze. Dlatego mówimy też o przestrzeniach zwartych. Niech X będzie przestrzenią metryczną i A ⊂ X. Definicja 11.2.3 Mówimy, że zbiór A jestS zwarty jeżeli dla każdej rodziny C ⊂ Open(X) takiej, że A ⊂ skończona podrodzina C 0 ⊂ C taka, że A ⊂ C 0 . S C istnieje Definicja 11.2.4 Mówimy, że przestrzeń metryczna X jest zwarta, jeżeli X traktowane jako zbiór w przestrzeni X jest zbiorem zwartym. 11.2. CIĄGŁOŚĆ, A ZWARTOŚĆ 183 Definicja 11.2.5 Klasę przestrzeni zwartych oznaczać będziemy Comp. 11.2.3 Przestrzenie zwarte Niech X będzie ustaloną przestrzenią metryczną. Poniższe twierdzenie pokazuje, że zwartość jest własnością zbioru zależną jedynie od metryki indukowanej w tym zbiorze, a nie od metryki w całej przestrzeni. Twierdzenie 11.2.6 Niech Y ⊂ X będzie podprzestrzenią X, a A ⊂ Y . Zbiór A jest zwarty w Y wtedy i tylko wtedy gdy jest zwarty w X. Twierdzenie 11.2.7 Każdy zwarty zbiór A ⊂ X jest domknięty. Twierdzenie 11.2.8 Podzbiór domknięty zbioru zwartego jest zbiorem zwartym. Twierdzenie 11.2.9 Niech K ⊂ X będzie zbiorem zwartym, a E ⊂ K jego nieskończonym podzbiorem. Wtedy zbiór punktów skupienia E 0 6= ∅. Twierdzenie 11.2.10 Niech E ⊂ Rd . Następujące warunki są równoważne. (i) E jest domknięty i ograniczony. (ii) E jest zwarty. (iii) Każdy nieskończony podzbiór zbioru E ma punkt skupienia należący do E. Zatem ogólna definicja zwartości w przypadku podzbiorów Rd jest równoważna definicji, którą podaliśmy wcześniej. Twierdzenie 11.2.11 Przestrzeń R̄ jest zwarta. 11.2.4 Obraz zbioru zwartego przez odwzorowanie ciągłe. Ustalmy przestrzenie metryczne X, Y oraz funkcję f : X → Y . Twierdzenie 11.2.12 Jeśli f jest ciągła, a A ⊂ X jest zwarty, to f (A) jest zwarty. Dowód: (*) 184 ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI Rysunek 11.3: Funkcja ciągła na przedziale zwartym osiąga swoje kresy Wniosek 11.2.13 Zachodzą następujące własności. (i) Jeśli f : X → Rd jest ciągła, a K ⊂ X jest zwarty, to f (K) jest domknięty i ograniczony. (ii) Jeśli przestrzeń X jest zwarta, a f : X → Rd jest ciągła, to f jest ograniczona. (iii) Jeśli f : [a, b] → Rd jest ciągła, to jest ograniczona. 11.2.5 Funkcja ciągła na przedziale zwartym osiąga swoje kresy Twierdzenie 11.2.14 Jeśli X jest przestrzenią zwartą, a f : X → R jest ciągła oraz m := inf f (X), M := sup f (X), to istnieją p, q ∈ X takie, że f (p) = m i f (q) = M . Dowód: 11.2.6 Funkcja odwrotna do funkcji ciągłej Twierdzenie 11.2.15 Jeśli f : X → Y jest ciągłą bijekcją, a X jest zwarty, to f −1 jest ciągłe. Dowód: 11.3. JEDNOSTAJNA CIĄGŁOŚĆ 11.3 185 Jednostajna ciągłość Definicja 11.3.1 Funkcja f : X → Y jest jednostajnie ciągła wtedy i tylko wtedy gdy ∀ > 0 ∃δ > 0 ∀x, y ∈ X ρX (x, y) < δ ⇒ ρY (f (x), f (y)) < . Twierdzenie 11.3.2 Jeśli f : X → Y jest jednostajnie ciągła, to f jest ciągła. Twierdzenie 11.3.3 Jeśli f : X → Y jest ciągła, a X jest przestrzenią zwartą, to f jest jednostajnie ciągła. Dowód: 11.3.1 Funkcje Lipschitza Definicja 11.3.4 f : X → Y jest funkcją Lipschitza jeżeli istnieje stała L > 0 taka, że ∀x1 , x2 ∈ X ρY (f (x1 ), f (x2 )) ¬ LρX (x1 , x2 ). 186 ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI Rysunek 11.4: Funkcja jednostajnie ciągła, która nie jest funkcją Lipschitza Twierdzenie 11.3.5 Jeśli f : X → Y jest funkcją Lipschitza, to jest funkcją jednostajnie ciągłą. 11.4 Ciągłość, a spójność 11.4.1 Spójne podzbiory R̄. Intuicja przestrzeni spójnej jest bardzo prosta. Jest to taka przestrzeń, która nie rozpada si˛e na dwa lub wi˛ecej kawałków. Formalna definicja jest jednak nieco skomplikowana. Dlatego najpierw podamy definicj˛e spójności dla przestrzeni metrycznych b˛edacych ˛ podzbiorami R̄ Definicja 11.4.1 Niech X ⊂ R̄ będzie podprzestrzenią. Mówimy, że X jest przestrzenią spójną jeżeli X jest przedziałem w R̄. 11.4.2 (*)Przestrzenie spójne Niech X będzie przestrzenią metryczną. Definicja 11.4.2 Mówimy, że zbiór E ⊂ X jest niespójny, jeżeli istnieją rozłączne zbiory A, B ∈ Open(X) takie, że A ∩ E 6= ∅ 6= B ∩ E oraz E ⊂ A ∪ B. Jeśli takie zbiory nie istnieją, mówimy, że E jest spójny. Twierdzenie 11.4.3 Niech E ⊂ R̄. E jest zbiorem spójnym, wtedy i tylko wtedy gdy ∀x, y, z ∈ E z ∈ (x, y) ⇒ z ∈ E. 11.4. CIĄGŁOŚĆ, A SPÓJNOŚĆ 187 Wniosek 11.4.4 Zbiory spójne w R̄ to przedziały. Zatem ogólna definicja spójności w przypadku podzbiorów R̄ jest równoważna definicji, którą już podaliśmy. 11.4.3 Obraz zbioru spójnego przez odwzorowanie ciągłe. Twierdzenie 11.4.5 Niech f : X → Y będzie odwzorowaniem ciągłym. Jeśli E ⊂ X jest spójny, to f (E) jest zbiorem spójnym. Dowód: Wniosek 11.4.6 Jeśli a, b ∈ R̄, a < b i f : [a, b] → R̄ jest odwzorowaniem ciągłym, to f ([a, b]) jest przedziałem domkniętym. 11.4.4 Własność Darboux. Wniosek 11.4.7 (własność Darboux) Jeśli a, b ∈ R̄, a < b, f : [a, b] → R̄ jest odwzorowaniem ciągłym oraz f (a) < f (b) to dla każdego c ∈ [f (a), f (b)] istnieje ξ ∈ [a, b] takie, że f (ξ) = c. Własność Darboux zobrazowano na rys. 11.5 188 ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI Rysunek 11.5: Własność Darboux. Rozdział 12 Szeregi 12.1 Eksperymenty numeryczne 12.1.1 Przybliżanie liczby π polami wielokątów wpisanych w koło. W rozdziale 1.3.2 zaprezentowaliśmy metod˛e przybliżania liczby π poprzez pola wielokatów ˛ wpisanych w koło i zauważyliśmy, że stosowny ciag ˛ (1.4) jest szeregiem. Przyjrzyjmy si˛e teraz zachowaniu tego szeregu od strony numerycznej Program wyznaczajacy ˛ wyrazy ciagu ˛ (1.4) w Mathematica jest przedstawiony na listingu 12.1, a w j˛ezyku C++ na listingu 12.2 Uruchamiajac ˛ program łatwo sprawdzić, że metoda oparta o pola przy zastosowaniu tego samego typu double daje znacznie dokładniejsze wyniki niż metoda poprzednia, bo już 26-ta suma cz˛esciowa daje wartość s26 = 3.141592653589793, która jest poprawnym przybliżeniem liczby π do ostatniej cyfry włacznie. ˛ 12.1.2 Warunek konieczny zbieżności szeregu Twierdzenie 12.1.1 Jeśli szereg P∞ n=1 cn jest zbieżny, to ciag ˛ cn zmierza do zera. Nie jest to jednak warunek wystarczajacy, ˛ bo na przykład o szeregu ∞ X 1 n n=1 zwanym szeregiem harmonicznym, można pokazać, że nie jest zbieżny w sensie definicji Cauchy’ego. Pogrupujmy wyrazy szeregu harmonicznego w porcje kolejno po jeden, dwa, cztery itd. ∞ X 1 1 1 1 1 1 1 =1+ + + + + + + ... n 2 3 4 5 6 7 n=1 189 190 ROZDZIAŁ 12. SZEREGI ( ∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z p o l a w i e l o k ą t ó w foremnych wpisanych w okrąg o ś r e d n i c y j e d e n ∗) P i B y F i e l d [ d_ ] := Module [ { s , m, n , a } , n = 2; m = 4 ; ( ∗ I l o ś ć boków w i e l o k ą t a , na p o c z ą t e k kwadrat ∗ ) a = Sqrt [ 2 . ] / 2 ; ( ∗ Bok k o l e j n y c h w i e l o k ą t ó w ∗ ) s = 2 ; (∗ c z t e r o k r o t n e pole ko lejnego wielokąta ∗) Do[ Print [ "s[" , n , " ]= " , NumberForm[ s , 1 6 ] ] ; s = s + m∗ a ∗ ( 1 − Sqrt [ 1 − a ∗ a ] ) ; a = Sqrt [ 2 − Sqrt [ 4 − 4∗ a ∗ a ] ] / 2 ; m = m∗ 2 ; n = n + 1, {d} ]; s ] Listing 12.1: Wyznaczenie ciągu przybliżeń liczby π w języku Mathematica w oparciu o pola wielokątów Tak wi˛ec sumy kolejnych porcji to T0 T1 T2 T3 ... Tk := 1 1 1 + := 2 3 1 1 1 1 := + + + 4 5 6 7 1 1 1 1 1 1 1 1 := + + + + + + + 8 9 10 11 12 13 14 15 ... 2k+1 X−1 1 . := n k n=2 Na listingach 12.3 i 12.4 przedstawiono program odpowiednio w Mathematica i w C++, który liczy sumy kolejnych porcji Tk dla szeregu harmonicznego. Wynik działania programu sugeruje, że sumy te sa˛ wi˛eksze od pewnej stałej c > 0, co w dalszym toku udowodnimy formalnie. Na razie zaobserwujmy, że konsekwencja˛ tego faktu jest m 2 X 1 ­ mc. n n=1 Zatem sumy cz˛eściowe szeregu harmonicznego moga˛ być wi˛eksze od dowolnie zadanej liczby. 12.1.3 Rozbieżność do nieskończoności Mówimy, że ciag ˛ xn jest rozbieżny do nieskończoności, jeżeli zachodzi warunek ∀M > 0∃N > 0∀n ∈ N n > N ⇒ xn > M. Możemy wi˛ec powiedzieć, że sumy cz˛eściowe szeregu P∞ 1 n=1 n sa˛ rozbieżne do nieskończoności. 12.1. EKSPERYMENTY NUMERYCZNE 191 /∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ P i B y F i e l d . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ /∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z p o l a w i e l o k ą t ó w foremnych ∗/ /∗ wpisanych w okrąg o p r o m i e n i u j e d e n ∗/ /∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/ #include <i o s t r e a m > #include <cmath> #include <iomanip> using namespace s t d ; i n t main ( ) { c o u t << f i x e d << r i g h t ; c o u t << s e t p r e c i s i o n ( 1 5 ) ; i n t m=4; /∗ I l o ś ć boków w i e l o k ą t a , na p o c z ą t e k kwadrat . ∗/ /∗ Bok k o l e j n y c h w i e l o k ą t ó w wpisanych w k o ł o o ś r e d n i c y j e d e n . Na p o c z ą t e k bok kwadratu ∗/ double a=s q r t ( 2 . 0 ) / 2 ; /∗ Zmienna s z a w i e r a c z t e r o k r o t n e p o l e k o l e j n e g o w i e l o k ą t a . Zaczynamy od kwadratu , k t ó r y ma p o l e 1 / 2 . ∗/ double s =2; i n t nmax=30; f o r ( i n t n=2;n<nmax ; n=n+1){ c o u t << " s[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << s ; c o u t << e n d l ; /∗ C z t e r o k r o t n e p o l e k o l e j n e g o w i e l o k ą t a p r z y r a s t a o c z t e r o k r o t n e p o l e m t ró k ąt ów równobocznych ∗/ s=s+m∗ a∗(1− s q r t (1−a ∗ a ) ) ; m=m∗ 2 ; /∗ Podwajamy i l o ś ć boków ∗/ a=s q r t (2− s q r t (4−4∗ a ∗ a ) ) / 2 ; /∗ I wyznaczamy k o l e j n y bok ∗/ } } Listing 12.2: Wyznaczenie ciągu przybliżeń liczby π w C++ w oparciu o pola wielokątów 192 ROZDZIAŁ 12. SZEREGI ( ∗ A n a l i z a zachowania s z e r e g u harmonicznego ∗ ) H a r m o n i c S e r i e s [ d_ ] := Module [ { s , n , k } , k = 0; Do[ s = 0.; n = 2^k ; ( ∗ Obliczamy sumę wyrazów s z e r e g u od 2^k do 2^{ k+1}−1 ∗ ) Do[ s = s + 1./n ; n = n + 1, {2^ k} ]; Print [ "T[" , k , " ]= " , NumberForm[ s , 1 6 ] ] ; k = k + 1, {d} ]; ] Listing 12.3: Obliczanie sumy P2k+1 −1 n=2k 1 n w Mathematica /∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ H a r m o n i c S e r i e s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ /∗ A n a l i z a zachowania s z e r e g u harmonicznego ∗/ /∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/ #include <i o s t r e a m > #include <cmath> #include <iomanip> using namespace s t d ; i n t main ( ) { c o u t << f i x e d << r i g h t ; c o u t << s e t p r e c i s i o n ( 1 5 ) ; double m=1; /∗ Będziemy sumować w p o r c j a c h po m d l a m= 1 , 2 , 4 , . . . ∗/ f o r ( i n t k=0;k <25; k=k+1){ double s =0; /∗ Obliczamy sumę wyrazów s z e r e g u od m=2^k do 2m−1=2^{k+1}−1 ∗/ f o r ( double n=m; n<m∗2;++n ) { s=s +1/n ; } c o u t << "T[" << k << " ]= " << s << e n d l ; m=m∗ 2 ; /∗ K o l e j n a p o r c j a b ę d z i e dwa r a z y w i ę k s z a ∗/ } } Listing 12.4: Obliczanie sumy P2k+1 −1 n=2k 1 n w C++ 12.2. WŁASNOŚCI PODSTAWOWE 193 Co ciekawe, szereg ∞ X (−1)n n=1 1 n jest zbieżny. Ćwiczenie komputerowe 12.1.2 Adaptuj program z listingu 12.3 i/lub listingu 12.4 do prześledzenia zachowania szeregów ∞ X 1 √ n n=1 i ∞ X 1 . n2 n=1 Co sadzisz ˛ na temat ich zbieżności? 12.2 Własności podstawowe 12.2.1 Pojęcie szeregu Niech X będzie albo ciałem R albo ciałem C. Definicja 12.2.1 Dla k ∈ N parę ciągów x, s : Nk → X nazywamy szeregiem jeżeli sn = n X xi . i=k Element xn nazywamy n-tym wyrazem szeregu, a element sn nazywamy n-tą sumą częściową szeregu. Mówimy, że szereg jest zbieżny, jeżeli ciąg jego sum częściowych jest zbieżny. Jeśli ciąg sum częściowych jest zbieżny, to jego granicę nazywamy sumą szeregu i oznaczamy ∞ X xi . i=k P∞ W praktyce symbolem i=k xi zazwyczaj oznaczamy nie tylko sumę szeregu, co jest sensowne tylko jeśli szereg jest zbieżny, ale także sam szereg. To czy mamy na myśli szereg, czy jego sumę, rozstrzygamy na podstawie kontekstu. Twierdzenie 12.2.2 Szereg P∞ i=k xi jest zbieżny wtedy i tylko wtedy gdy ∀ > 0∃N ∈ Nk ∀m ­ n ­ N | m X xi | < . i=n Dowód: Własność ta oznacza, że ciąg sum częściowych szeregu spełnia warunek Cauchy’ego. Zatem teza wynika z zupełności przestrzeni R lub C. P∞ Wniosek 12.2.3 Jeśli szereg n=1 xn jest zbieżny, to limn→∞ xn = 0. Definicja 12.2.4 Szereg P∞ i=k xi nazywamy bezwzględnie zbieżnym, jeżeli szereg P∞ i=k |xi | jest zbieżny. 194 ROZDZIAŁ 12. SZEREGI Twierdzenie 12.2.5 Jeśli szereg P∞ i=k xi jest bezwzględnie zbieżny to jest zbieżny oraz | ∞ X xi | ¬ ∞ X i=k |xi |. i=k Dowód: Ponieważ ciąg sum częściowych dla szeregu wartości bezwzględnych spełnia warunek Cauchy’ego, więc, jak łatwo sprawdzić, również ciąg sum częściowych wyjściowego szeregu spełnia ten warunek i teza wynika z zupełności R lub C. 12.2.2 Szereg geometryczny Definicja 12.2.6 Niech a, q ∈ C, a 6= 0. Szereg P∞ n=0 aq n , nazywamy szeregiem geometrycznym. Twierdzenie 12.2.7 Szereg geometryczny jest zbieżny gdy |q| < 1. W przeciwnym razie jest on rozbieżny. Dowód: Wiemy, że sn = a 1 − q n+1 . 1−q Zatem, jeśli |q| < 1, to lim sn = n→∞ a , 1−q czyli szereg jest zbieżny. Natomiast jeśli |q| ­ 1, to ciąg aq n na pewno nie jest zbieżny do zera, więc nie jest spełniony warunek konieczny zbieżności. Twierdzenie 12.2.8 (Kryterium porównawcze) Jeśli ciągi a, b : N → R mają wyrazy nieujemne i istnieje N ∈ N takie, że an ¬ bn dla n ­ N , to: P∞ P∞ • jeśli n=1 bn jest zbieżny, to n=1 an jest zbieżny, P∞ P∞ • jeśli n=1 an jest rozbieżny, to n=1 bn jest rozbieżny. Dowód: Jest to wniosek z zupełności przestrzeni R. P∞ P∞ Wniosek 12.2.9 Niech n=k zn będzie szeregiem liczb zespolonych, P∞a n=k xn zbieżnym szeregiem liczb rzeczywistych. Jeśli istnieje n ∈ N takie, że |zn | ¬ xn dla n ­ N , to szereg n=k zn jest bezwzględnie zbieżny. 12.3. KRYTERIA ZBIEŻNOŚCI 195 12.3 Kryteria zbieżności 12.3.1 Szereg P∞ 1 n=1 np . Twierdzenie 12.3.1 Niech a : N → R będzie ciągiem o wyrazach nieujemnych. Szereg tylko wtedy gdy jego ciąg sum częściowych jest ograniczony. Dowód: Twierdzenie 12.3.2 Niech ciąg a : N1 → R+ będzie słabo malejący. Rozważmy ciąg b : N0 3 n 7→ 2n a2n ∈ R+ . P∞ P∞ Wtedy zbieżność szeregu n=1 an jest równoważna zbieżności szeregu n=0 bn . Dowód: Wniosek 12.3.3 Szereg Dowód: P∞ 1 n=1 np jest zbieżny dla p > 1, a rozbieżny dla p ¬ 1. P∞ n=1 an jest zbieżny wtedy i 196 ROZDZIAŁ 12. SZEREGI 12.3.2 Kryterium Leibniza Twierdzenie 12.3.4 (Leibniza P o szeregu naprzemiennym) Niech a : N0 → R+ będzie ciągiem słabo malejącym i ∞ zbieżnym do zera. Wtedy szereg n=0 (−1)n an jest zbieżny oraz dla dowolnego m ∈ N1 2m−1 X (−1)n an ¬ n=0 ∞ X (−1)n an ¬ n=0 2m X (−1)n an . n=0 Dowód: 12.3.3 Kryterium Cauchy’ego i kryterium d’Alemberta Badaniem zbieżności szeregów zajmowali się w szczególności matematycy francuscy: najpierw Jean le Rond d’Alembert (rys. 12.1), a następnie Augustin Louis Cauchy (rys. 1.5). Podali oni następujące kryteria zbieżności szeregów. Twierdzenie 12.3.5 (Kryterium Cauchy’ego i d’Alemberta) Niech a : N → C będzie ciągiem oraz α := lim sup n→∞ p n |an |, β := lim sup n→∞ |an+1 | . |an | Wtedy: • jeśli α < 1 to P∞ an jest zbieżny, • jeśli β < 1 to P∞ an jest zbieżny, • jeśli α > 1 to P∞ n=0 n=0 an jest rozbieżny, P∞ • jeśli istnieje N ∈ N takie, że aan+1 > 1 dla n ­ N , to n=0 an jest rozbieżny. n Dowód: n=0 12.3. KRYTERIA ZBIEŻNOŚCI 197 Rysunek 12.1: Jean le Rond d’Alembert, 1717-1783, Źródło: Wikipedia 12.3.4 Szeregi potęgowe P∞ Definicja 12.3.6 Szeregiem potęgowym nazywamy szereg postaci n=0 cn z n , gdzie z ∈ C jest ustalonym parametrem, a ciąg c : N0 → C jest tzw. ciągiem współczynników szeregu potęgowego. 198 ROZDZIAŁ 12. SZEREGI Twierdzenie 12.3.7 Niech Wtedy szereg |z| = R. P∞ n=0 cn z n P∞ n=0 cn z n będzie szeregiem potęgowym, α := lim supn→∞ 1 α gdy 0 < α < ∞, R := 0 gdy α = ∞, ∞ gdy α = 0. p n |cn |, a jest zbieżny dla |z| < R, a rozbieżny dla |z| > R. Kryterium nie rozstrzyga zbieżności gdy Dowód: Jest to wniosek z kryterium Cauchy’ego dla szeregów. 12.4 Operacje na szeregach 12.4.1 Suma i iloczyn szeregów Dowód: Stosujemy do sum częściowych tw. granicy sumy i iloczynu ciągów. 12.4. OPERACJE NA SZEREGACH Dowód: 12.4.2 (**)Permutacja szeregu i zbieżność bezwarunkowa 199 200 ROZDZIAŁ 12. SZEREGI 12.4.3 (**)Twierdzenie Riemanna 12.4.4 Szeregi w programie Mathematica Program Mathematica dość dobrze radzi sobie z liczeniem sum szeregów, a w przypadku braku zbieżności sygnalizuje ten P∞ fakt. Do policzenia sumy szeregu i=p an używamy instrukcji Sum[a[n],{n,p,Infinity}] Na przykład Sum[1/n!, {n, 2, Infinity}] P∞ 1 zwraca n=2 n! = −2 + e. Oznacza to, że Mathematica, w miarę swoich umiejętności, stara się zwrócić wynik dokładny, używając symbolicznych oznaczeń na stałe matematyczne. Rozdział 13 Funkcje wykładnicza, logarytmiczna i trygonometryczne 13.1 Funkcja wykładnicza i logarytmiczna 13.1.1 Zespolona funkcja wykładnicza Następujące twierdzenie pozwala przybliżać liczbę e za pomocą szeregów i to znacznie szybciej niż w przypadku ciągu, którym posłużyliśmy się przy jej definiowaniu Twierdzenie 13.1.1 ∞ X 1 = e. n! n=0 Dowód: Łatwo sprawdzić za pomocą kryterium d’Alemberta, że dla dowolnego z ∈ C szereg ∞ X zn n! n=0 jest zbieżny. Rozważać zatem możemy funkcję E : C 3 z 7→ E(z) := 201 ∞ X zn ∈ C. n! n=0 202 ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE Twierdzenie 13.1.2 Funkcja E ma następujące własności: (i) E(0) = 1 oraz E(1) = e, (ii) dla dowolnych z1 , z2 ∈ C E(z1 + z2 ) = E(z1 )E(z2 ), (iii) dla dowolnego z ∈ C mamy E(z) 6= 0 oraz E(−z) = 1 , E(z) (iv) E jest funkcją ciągłą, (v) dla dowolnego z ∈ C ¯ E(z̄) = E(z). Dowód: Definicja 13.1.3 Funkcję E nazywamy zespoloną funkcją wykładniczą. Stosujemy dla niej również tradycyjną notację ez := E(z) := 13.1.2 Funkcja wykładnicza ex ∞ X zn ∈ C. n! n=0 13.1. FUNKCJA WYKŁADNICZA I LOGARYTMICZNA 203 Twierdzenie 13.1.4 Istnieje dokładnie jedna funkcja ciągła f : R → R+ taka, że f (1) = e oraz dla dowolnych x, y ∈ R zachodzi f (x + y) = f (x)f (y). Jest ona zwana funkcją wykładniczą o podstawie e. Powszechnie stosowaną notacją dla f (x) jest ex , a sama funkcja f jest oznaczana exp : R 3 x 7→ ex ∈ R+ . Funkcja ta ma również następujące własności: (i) dla dowolnych p ∈ Z oraz q ∈ N1 p eq = √ q ep , (ii) jest silnie rosnąca, (iii) limx→∞ ex = ∞, limx→−∞ ex = 0, (iv) dla dowolnego n ∈ N mamy limx→∞ xn e−x = 0. Dowód: 13.1.3 Logarytm naturalny Funkcja exp, jako bijekcja silnie rosnąca z R do R+ , ma funkcję odwrotną, która jest bijekcją silnie rosnącą z R+ do R. Definicja 13.1.5 Funkcję tę nazywamy logarytmem naturalnym i oznaczamy ln : R+ 3 x 7→ ln x ∈ R. Z definicji tej wynika w szczególności, że dla dowlnych x ∈ R+ i y ∈ R równość y = ln x jest równoważna równości x = ey . 204 ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE Twierdzenie 13.1.6 Funcja ln ma następujące własności: (i) jest silnie rosnąca, (ii) ln 1 = 0, ln e = 1, (iii) dla dowolnych x, y ∈ R+ , n ∈ N ln(xy) = ln x + ln y, ln x = ln x − ln y, y ln xn = n ln x, ln √ n x= ln x , n (iv) limx→∞ ln x = ∞, limx→0 ln x = −∞, (v) dla dowolnych p ∈ N, q ∈ Z+ , x ∈ R+ p e q ln x = √ q p xp = x q . Dowód: W programie Mathematica logarytm naturalny oznaczany jest Log. 13.1.4 Funkcja wykładnicza ax Przy pomocy logarytmu naturalnego możemy zdefiniować funkcję wykładniczą o dowolnej podstawie a ∈ R+ . Definicja 13.1.7 Funkcję wykładniczą o podstawie a ∈ R+ definiujemy wzorem R 3 x 7→ ax := ex ln a ∈ R+ . 13.2 Funkcje trygonometryczne 13.2.1 Nawijanie prostej na okrąg Zespolona funkcja wykładnicza pozwoli nam też podać formalną i czysto analityczną definicję funkcji trygonometrycznych. Zacznijmy od następującej uwagi: Uwaga 13.2.1 Funkcja R 3 x 7→ eix ∈ S 1 jest dobrze określona i ciągła. (13.1) 13.2. FUNKCJE TRYGONOMETRYCZNE 205 Rysunek 13.1: Wykres funkcji R 3 t 7→ eit ∈ S1 . Dowód: Funkcję daną wzorem (13.1) określa się często mianem nawijania prostej na okrąg. Terminologię tę wyjaśnia rys. 13.1 13.2.2 Funkcje sin i cos Możemy teraz podać czysto analityczną definicję funkcji sin oraz cos. Analizując własności tych funkcji stopniowo przekonamy się, że pokrywają się one z funkcjami sin i cos zdefiniowanymi geometrycznie. Definicja 13.2.2 Funkcje cos i sin definiujemy wzorami eix + e−ix ∈ [−1, 1] 2 eix − e−ix = ∈ [−1, 1]. 2i cos : R 3 x 7→ re eix = sin : R 3 x 7→ im eix 206 ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE ( ∗ O b l i c z a n i e f u n k c j i s i n u s za pomocą r o z w i n i ę c i a w s z e r e g ∗ ) S i n S e r i e s [ x_ , d_ ] := Module [ { s , znak , s i l n i a , y , n } , s = 0 ; znak = 1 ; s i l n i a = 1 ; y = x ; n = 0 ; Do[ s = s + znak ∗y/ s i l n i a ; znak = −znak ; s i l n i a = s i l n i a ∗(2∗n + 2)∗(2∗ n + 3 ) ; y = y∗x∗x ; n = n + 1, {d} ]; s ] Listing 13.1: Wyznaczenie wartości funkcji sin w programie Mathematica w oparciu o rozwinięcie w szereg Uwaga 13.2.3 Funkcje sin i cos są ciągłe. Ponadto dla każdego x ∈ R zachodzą wzory: cos x = ∞ X (−1)k k=0 e x2k (2k)! ix sin x = ∞ X k=0 (−1)k x2k+1 (2k + 1)! = cos x + i sin x 2 cos x + sin2 x = 1. Dowód: Program, który przybliża wartości funkcji sin w oparciu o szereg w uwadze 13.2.3 przedstawiono na listingach 13.1 (Mathematica) i 13.2 (C++). 13.2. FUNKCJE TRYGONOMETRYCZNE 207 /∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ S i n S e r i e s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ /∗ O b l i c z a n i e f u n k c j i s i n u s za pomocą r o z w i n i ę c i a w s z e r e g ∗/ /∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/ #include <i o s t r e a m > #include <cmath> #include <iomanip> using namespace s t d ; i n t main ( ) { c o u t << f i x e d << r i g h t ; c o u t << s e t p r e c i s i o n ( 1 5 ) ; double p i = 3 . 1 4 1 5 9 2 6 5 3 5 8 9 7 9 3 ; double x=p i / 6 ; double y=x ; i n t nmax=10 , znak =1 , s i l n i a =1; double s =0; f o r ( i n t n=0;n<nmax ; n=n+1){ s=s+znak ∗y/ s i l n i a ; c o u t << " s[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << s ; c o u t << e n d l ; s i l n i a = s i l n i a ∗ ( 2 ∗ n +2)∗(2∗ n +3); y=y∗x∗x ; znak=−znak ; } } Listing 13.2: Wyznaczenie wartości funkcji sin w C++ w oparciu o rozwinięcie w szereg 208 ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE Ćwiczenie komputerowe 13.2.4 • Sprawdź zachowanie się programu z listingu 13.2 dla zmiennej x inicjalizowanej wartościami π4 , π3 , π2 , π, 2π. Co obserwujesz w zachowaniu się ciągu przybliżeń? Jakie rodzą się pytania? • Adaptuj program z listingów 13.1 i 13.2 do liczenia wartości funkcji cos wykorzystując fakt, że cos x = 1 − ∞ X x2 x4 x2n + − ... = . (−1)n 1·2 1·2·3·4 (2n)! n=0 Oceń poprawność i przydatność implementacji wykorzystując argument, w którym wartość funkcji cos jest Ci znana. Lemat 13.2.5 Zachodzą następujące wzory cos 0 = 1, sin 0 = 0, cos 2 < 0, x ∈ (0, 2] ⇒ sin x > 0. Dowód: 13.2.3 Liczba π Dysponujemy teraz wystarczającą maszynerią, by podać analityczną, a nie geometryczną definicję liczby π. Wniosek 13.2.6 Zbiór dodatnich miejsc zerowych funkcji cos jest domknięty i niepusty. W szczególności jego kres dolny jest dodatni i też jest miejscem zerowym funkcji cos. Definicja 13.2.7 Liczbę π definiujemy jako podwojone najmniejsze dodatnie miejsce zerowe funkcji cos. Innymi słowy π := 2 inf { x ∈ R+ | cos x = 0 }. 13.2.4 Okresowość Definicja 13.2.8 Niech F oznacza ciało liczb rzeczywistych lub ciało liczb zespolonych. Mówimy, że funkcja f : F −→ ◦ F jest okresowa wtedy i tylko wtedy gdy istnieje takie t ∈ F , że dla każdego x ∈ dom f mamy x + t ∈ dom f oraz f (x + t) = f (x). Liczbę t nazywamy wtedy okresem funkcji f . Jeśli istnieje najmniejszy okres dodatni funkcji f nazywamy go okresem podstawowym funkcji f 13.2. FUNKCJE TRYGONOMETRYCZNE 209 Twierdzenie 13.2.9 Mamy następujące własności: (i) funkcja exp : C → C jest okresowa o okresie 2πi, (ii) funkcje sin, cos : R → [−1, 1] są okresowe o okresie 2π, (iii) t ∈ (0, 2π) ⇒ eit 6= 1, (iv) dla każdego z ∈ S 1 istnieje dokładnie jedno t ∈ [0, 2π) takie, że eit = z. Dowód: Wniosek 13.2.10 Okresem podstawowym funkcji sin i cos jest 2π. Dowód: 13.2.5 Wzory trygonometryczne Twierdzenie 13.2.11 Dla dowolnych x, y ∈ R zachodzą wzory sin(x + y) = sin x cos y + cos x sin y, cos(x + y) = cos x cos y − sin x sin y. 210 ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE Dowód: Twierdzenie 13.2.12 (wzór de Moivre’a) Dla dowolnego x ∈ R oraz n ∈ N zachodzi wzór n (cos x + i sin x) = cos nx + i sin nx. Dowód: Część III Rachunek różniczkowy i całkowy 211 Rozdział 14 Przestrzenie wektorowe 14.1 Definicja przestrzeni wektorowej Zaproponowana przez Kartezjusza algebraizacja geometrii poprzez wprowadzenie układu współrz˛ednych na płaszczyźnie oraz geometryczna interpretacja liczb zespolonych zaowocowały wprowadzeniem w XIXw. koncepcji wektorów jako zaczepionych w poczatku ˛ układu n-wymiarowej przestrzeni zorientowanych odcinków, które można dodawać podobnie jak dodaje si˛e liczby rzeczywiste i zespolone. Intuicyjne wyobrażenie geometryczne wektora możliwe jest jedynie w przestrzeni dwu- i trójwymiarowej, bo jedynie z takimi przestrzeniami maja˛ do czynienia nasze zmysły. Od strony algebraicznej wektor to po prostu układ n liczb zwanych współrz˛ednymi wektora. Dodawanie wektorów metoda˛ geometryczna˛ sprowadza si˛e do konstrukcji przekatnej ˛ rozpi˛etego na wektorach równoległoboku. W przypadu płaszczyzny pokrywa si˛e to z geometryczna˛ interpretacja˛ sumy liczb zespolonych przedstawiona˛ na rysunku 8.4. Wektory wraz z operacja˛ dodawania stanowia˛ grup˛e. Poza wymiarem dwa wektory nie da si˛e jednak zdefiniować mnożenia wektorów tak, by uzyskać struktur˛e ciała. Możliwe jest jednak mnożenie wektora przez liczb˛e, które sprowadza si˛e do stosownej zmiany jego długości i, w przypadku mnożenia liczby ujemnej, symetrycznego odbicia wzgl˛edem poczatku ˛ układu. Powyższe idee prowadza˛ do koncepcji przestrzeni wektorowej nad zadanym ciałem. 14.1.1 Przestrzeń wektorowa Definicja 14.1.1 Niech F będzie ciałem i niech 1 oznacza element neutralny względem mnożenia w ciele F . Przestrzenią wektorową nad F nazywamy piątkę (X, F, +, ·, 0) taką, że (X, +, 0) jest grupą abelową, a ·:F ×X →X jest działaniem (tzw. działaniem zewnętrznym) spełniającym dla dowolnych α, β ∈ F oraz x, y ∈ X warunki (W1) (α + β)x = αx + βx, (W2) α(x + y) = αx + αy, (W3) α(βx) = (αβ)x, (W4) 1.x = x. Elementy ciała F określa się często mianem skalarów, a o działaniu zewnętrznym mówi się, że jest to mnożenie przez skalary. Klasę przestrzeni wektorowych nad ciałem F oznaczać będziemy Vect(F ). 213 214 ROZDZIAŁ 14. PRZESTRZENIE WEKTOROWE Przykład 14.1.2 Klasycznym przykładem przestrzeni wektorowej jest Rn nad ciałem R. Elementami tej przestrzeni są n-tki (zwane również krotkami lub po prostu wektorami) postaci x = (x1 , x2 , . . . xn ), gdzie xi ∈ R są liczbami rzeczywistymi. Sumę x = (x1 , x2 , . . . xn ) i y = (y1 , y2 , . . . yn ) definiuje się wzorem x + y := (x1 + y1 , x2 + y2 , . . . xn + yn ), a mnożenie wektora x przez skalar α ∈ R wzorem αx := (αx1 , αx2 , . . . αxn ). Łatwo sprawdzić, że jest to rzeczywiście przestrzeń wektorowa. W podobny sposób konstruujemy przestrzeń wektorową F n dla dowolnego ciała F , na przykład dla ciała liczb zespolonych. Przykład 14.1.3 Niech A będzie dowolnym ustalonym zbiorem. Niech F (A, R) oznacza zbiór wszystkich funkcji f : A → R. Dla f, g ∈ F (A, R) definiujemy sumę f + g jako funkcję f + g : A 3 x 7→ f (x) + g(x) ∈ R, a mnożenie funkcji f przez skalar α ∈ R jako funkcję αf : A 3 x 7→ αf (x) ∈ R. Łatwo sprawdzić, że jest to rzeczywiście przestrzeń wektorowa. Jeśli X jest przestrzenią topologiczną, to w podobny sposób konostruujemy przestrzeń funkcji ciągłych z X do R oznaczaną jako C(A, R) Przykład z przestrzenią wektorową funkcji ograniczonych sygnalizuje, że pożytki ze stosowania tego pojęcia mogą wykraczać poza wektory na płaszczyźnie i ich uogólnienia na Rn . W istocie, można pokazać, że przestrzeń B(A) nie jest izomorficzna z przestrzenią Rn dla żadnego n. 14.2 Przestrzenie wektorowe z iloczynem skalarnym Poprzez interpretacj˛e wektorów na płaszczyźnie jako liczb zespolonych wiemy, że można je nie tylko dodawać, ale i mnożyć z zachowaniem własności ciała. Uzyskanie struktury ciała dla wektorów w przestrzeni trówymiarowej i wyższych wymiarach nie jest możliwe. Natomiast bardzo pożyteczny jest iloczyn skalarny. Jest to odwzorowanie, które parze wektorów (v, w) przyporzadkowuje ˛ liczb˛e v · w b˛edac ˛ a˛ iloczynem długości wektora w przez długość rzutu prostopadłego wektora v na prosta,˛ w której zawiera si˛e wektor w, wzi˛eta ze znakiem plus, jeśli kat˛ mi˛edzy wektorami jest ostry i znakiem minus w przeciwnym razie. Łatwo sprawdzić, że tak zdefiniowany iloczyn skalarny jest przemienny i wyraża si˛e wzorem v · w = |v||w| cos α gdzie |v| i |w| oznaczaja˛ długości wektorów v i w, a α jest katem ˛ pomi˛edzy nimi. Ze wzoru tego wynikaja˛ od razu najważniejsze własności iloczynu skalarnego: wektory v i w sa˛ prostopadłe wtedy i tylko wtedy gdy v · w = 0 oraz v · v = |v|2 . W praktyce wygodne jest przyj˛ecie aksjomatycznej definicji iloczynu skalarnego. 14.2.1 Iloczyn skalarny 14.3. PRZESTRZENIE WEKTOROWE UNORMOWANE 215 Definicja 14.2.1 Niech X będzie przestrzenią wektorową nad R. Odwzorowanie ϕ : X × X → R nazywamy iloczynem skalarnym jeżeli dla wszystkich x, y, z ∈ X oraz α ∈ R spełnione są następujące warunki: (IS1) ϕ(x + y, z) = ϕ(x, z) + ϕ(y, z), (IS2) ϕ(αx, y) = αϕ(x, y), (IS1) ϕ(x, y) = ϕ(y, x), (IS1) ϕ(x, x) ­ 0 i ϕ(x, x) = 0 ⇔ x = 0. Iloczynem skalarnym w Rd jest odwzorowanie (x1 , x2 , . . . , xd ), (y1 , y2 , . . . , yd ) 7→ d X xi yi . i=1 Wzór na iloczyn skalarny w Rd jest podstawa˛ definiowania ilocznu skalarnego w innych przestrzeniach. W szczególności w pewnych przestrzeniach ciagów ˛ Rb P∞ iloczynem skalarnym jest i=1 xi yi , a w pewnych przestrzeniach funkcyjnych iloczynem skalarnym jest a f (x)g(x)dx. 14.2.2 Nierówność Cauchy-Schwartza Twierdzenie 14.2.2 (Nierówność Cauchy-Schwartza) Niech X będzie przestrzenią wektorową nad R z iloczynem skalarnym ϕ. Dla dowolnych x, y ∈ X mamy p p |ϕ(x, y)| ¬ ϕ(x, x) ϕ(y, y). Dowód: Rozważmy funkcję µ : R 3 t 7→ ϕ(x + ty, x + ty) ∈ [0, ∞). Wykorzystując własności iloczynu skalarnego dostajemy dla dowolnego t ∈ [0, ∞) 0 ¬ µ(t) = t2 ϕ(x, x) + 2tϕ(x, y) + ϕ(y, y). Zatem wyróżnik w tej nierówności kwadratowej musi być niedodatni, tj. 4ϕ(x, y)2 − 4ϕ(x, x)ϕ(y, y) ¬ 0 co dowodzi tezy. Wniosek 14.2.3 Dla (x1 , x2 , . . . , xd ), (y1 , y2 , . . . , yd ) ∈ Rd mamy v v u d u d d uX uX X t 2 | xi yi | ¬ xi t yi2 . i=1 14.3 i=1 i=1 Przestrzenie wektorowe unormowane W przestrzeniach wektorowych przydałoby się pojęcie odległości, tak byśmy mogli nadać jej strukturę przestrzeni metrycznej i rozważać zbiory otwarte i domknięte oraz granice. Jeśli mamy do dyspozycji koncepcję długości wektora, to odległość dwóch wektorów można zdefiniować jako długość ich różnicy. Dlatego przydałaby się aksjomatyczna definicja długości wektora, która gwarantowałaby, że wydobyć z niej można odległość. 216 ROZDZIAŁ 14. PRZESTRZENIE WEKTOROWE 14.3.1 Norma Definicja 14.3.1 Niech X będzie przestrzenią wektorową nad R. Odwzorowanie || · || : X → R∗ nazywamy normą w X jeżeli dla wszystkich x, y ∈ X oraz α ∈ R (N1) ||x|| = 0 ⇔ x = 0, (N2) ||αx|| = |α| ||x||, (N3) ||x + y|| ¬ ||x|| + ||y||. Twierdzenie 14.3.2 Jeśli ϕ jest iloczynem skalarnym w przestrzeni wektorowej X, to p ||x||ϕ := ϕ(x, x) zadaje w tej przestrzeni normę. Dowód: Własności (N1) i (N2) są oczywiste. Aby sprawdzić własność (N3) zauważmy, że p p ||x + y||2ϕ = ϕ(x + y, x + y) = ϕ(x, x) + 2ϕ(x, y) + ϕ(y, y) ¬ ϕ(x, x) + 2 ϕ(x, y) ϕ(x, y) + ϕ(y, y) = (||x||ϕ + ||y||ϕ )2 14.3.2 Norma euklidesowa Definicja 14.3.3 Normę w Rd pochodzącą od iloczynu skalarnego qP d 2 i=1 xi nazywamy normą euklidesową. Pd i=1 xi yi , tj. normę daną wzorem ||x|| := W Rd zadać można również normy nie pochodzące od iloczynu skalarnego, na przykład normą jest ||x||1 : Pd i=1 |xi |. Definicja 14.3.4 Przestrzeń wektorową nad ciałem F z zadaną normą nazywamy przestrzenią wektorową unormowaną. Klasę takich przestrzeni oznaczać będziemy NVect(F ). 14.3.3 Przestrzenie Hilberta i Banacha Twierdzenie 14.3.5 Niech ||.|| będzie normą w przestrzeni wektorowej X. Wtedy wzór ρ(x, y) := ||x − y|| określa w X metrykę. 14.3. PRZESTRZENIE WEKTOROWE UNORMOWANE 217 Rysunek 14.1: Stefan Banach, 1892 - 1945 Definicja 14.3.6 Przestrzeń wektorową z iloczynem skalarnym, zupełną nazywamy przestrzenią Hilberta. Przestrzeń wektorową unormowaną, zupełną nazywamy przestrzenią Banacha. Poj˛ecie przestrzeni Hilberta i przestrzeni Banacha pozwala metody opracowane dla przestrzeni Rn stosować w przestrzeniach funkcyjnych. Sa˛ to różnego rodzaju przestrzenie, w których rol˛e wektorów pełnia˛ funkcje. 218 ROZDZIAŁ 14. PRZESTRZENIE WEKTOROWE Rozdział 15 Pochodne i różniczki. 15.1 Pochodna funkcji 15.1.1 Definicja pochodnej W rozdziale wst˛epnym wprowadziliśmy intuicyjna˛ koncepcj˛e pochodnej funkcji f : R → R w punkcie x0 jako współczynnika kierunkowego nachylenia stycznej do wykresu poprowadzonej w punkcie (x0 , f (x0 )). Współczynnik kierunkowy prostej w układzie współrz˛ednych x i y to tangens kata ˛ jaki tworzy ta prosta z osia˛ x. Łatwo jest policzyć ten współczynnik dla siecznej poprowadzonej przez punkty (x0 , f (x0 )) i (x1 , f (x1 )). Z rysunku 15.1 wnosimy, że tangens ten to iloraz f (x1 ) − f (x0 ) , x1 − x0 zwany ilorazem różnicowym. Ustalajac ˛ x0 i przybliżajac ˛ x1 do x0 przybliżamy sieczna˛ do stycznej w (x0 , f (x0 )). Można zatem oczekiwać, że współczynnik kierunkowy siecznej zmierza do współczynnika kierunkowego stycznej. Niech h := x1 − x0 b˛edzie przyrostem zmiennej x wzgl˛edem punktu x0 . Iloraz różnicowy można wtedy zapisać jako f (x0 + h) − f (x0 ) , h a współczynnik kierunkowy stycznej w (x0 , f (x0 )) jako lim h→0 f (x0 + h) − f (x0 ) h (15.1) co prowadzi do definicji pochodnej funkcji f w punkcie x0 . Choć powyższa interpretacja dotyczy funkcji o wartościach w zbiorze liczb rzeczywistych, granica (15.1) ma sens również wtedy, gdy funkcja f ma wartości w przestrzeni wektorowej Rm , zatem nasza formalna definicja b˛edzie nieco ogólniejsza. Niech f : (a, b) → Rm będzie funkcją określoną na przedziale otwartym (a, b) ⊂ R o wartościach w Rm . Ustalmy punkt x0 ∈ (a, b) Definicja 15.1.1 Mówimy, że funkcja f jest różniczkowalna w punkcie x0 jeżeli w Rm istnieje granica lim h→0 f (x0 + h) − f (x0 ) . h Granicę tę nazywamy pochodną funkcji f w punkcie x0 i oznaczamy f 0 (x0 ). Jeśli f ma pochodną w każdym punkcie x ∈ (a, b) to mówimy, że f jest różniczkowalna na przedziale (a, b) i definiujemy również funkcję f 0 : (a, b) 3 x 7→ f 0 (x) ∈ Rm , którą nazywamy funkcją pochodną funkcji f . 219 220 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Rysunek 15.1: Styczna i sieczna do krzywej. Pochodzenie określenia "różniczkowalna" wyjaśnimy w rozdziale 15.2.4. 15.1.2 Pochodna funkcji stałej i identycznościowej. Twierdzenie 15.1.2 (o pochodnej funkcji stałej) Funkcja stała cR : (∞, ∞) 3 x 7→ c ∈ R. ma pochodną w każdym punkcie oraz (cR )0 = 0R co czasami zapisujemy mniej formalnie, ale krócej jako c0 = 0. Dowód: Rzeczywiście, dla funkcji stałej iloraz różnicowy wynosi cR (x + h) − cR (x) c−c = = 0, h h więc granica ilorazu różnicowego jako granica funkcji stale równej zero wynosi zero. Dowodzi to naszej tezy. 15.1. POCHODNA FUNKCJI 221 Twierdzenie 15.1.3 (o pochodnej identyczności) Funkcja identycznościowa idR : R 3 x 7→ x ∈ R. ma pochodną w każdym punkcie oraz (idR )0 = 1R co czasami zapisujemy mniej formalnie, ale krócej jako x0 = 1. Dowód: Dla funkcji identycznościowej iloraz różnicowy wynosi idR (x + h) − idR (x) (x + h) − x h = = = 1, h h h więc granica ilorazu różnicowego jako granica funkcji stale równej jeden wynosi jeden. Dowodzi to naszej tezy. Przykład 15.1.4 Rozważmy funkcję f : R 3 x 7→ |x| ∈ R. Jeśli x jest dodatnie, to dla dostatecznie małych h również x + h jest dodatnie, zatem wtedy |x| = x, |x + h| = x + h czyli w tym przypadku iloraz różnicowy wynosi |x + h| − |x| (x + h) − x h f (x + h) − f (x) = = = = 1. h h h h Jeśli x jest ujemne, to dla dostatecznie małych h również x + h jest ujemne, zatem wtedy |x| = −x, |x + h| = −x − h czyli w tym przypadku iloraz różnicowy wynosi f (x + h) − f (x) |x + h| − |x| (−x − h) − (−x) −h = = = = −1. h h h h Dla x = 0 iloraz różnicowy może wynosić tak jeden jak i minus Podsumowując, −1 0 f (x) = nie istnieje 1 15.1.3 jeden, w zależności od znaku h, więc nie ma granicy. gdy x < 0, gdy x = 0, gdy x > 0. Pochodna lewo- i prawostronna. Ostatni przykład podpowiada, że, podobnie jak w przypadku granicy, warto też rozważać pochodne lewo- i prawostronne. Niech f : [a, b] → Rm będzie funkcją określoną na przedziale domkniętym [a, b]. 222 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Definicja 15.1.5 Niech x0 ∈ (a, b]. Mówimy, że f ma pochodną lewostronną w x0 jeśli w Rm istnieje granica lewostronna f (x0 + h) − f (x0 ) lim− . (15.2) h h→0 0 Granicę tę nazywamy pochodną lewostronną funkcji f w x0 i oznaczamy f− (x0 ). Podobnie, jeśli x0 ∈ [a, b) to mówimy, m że f ma pochodną prawostronną w x0 jeśli w R istnieje granica prawostronna f (x0 + h) − f (x0 ) . h lim h→0+ (15.3) 0 Granicę tę nazywamy pochodną prawostronną funkcji f w x0 i oznaczamy f+ (x0 ). Przykład 15.1.6 Funkcja f w przykładzie 15.1.4 ma w zerze pochodną lewostronną równą -1 oraz pochodną prawostronną równą 1. Ćwiczenie 15.1.7 Pokaż, że funkcja f : (a, b) → Rm ma w punkcie x0 ∈ (a, b) pochodną wtedy i tylko wtedy gdy ma w tym punkcie tak pochodną lewostronną jak i prawostronną i są one sobie równe. W dalszym ciągu wygodnie będzie również rozważać różniczkowalność funkcji określonej na przedziale domkniętym. Definicja 15.1.8 Mówimy, że funkcja f : [a, b] → Rm jest różniczkowalna jeśli ma pochodną w każdym punkcie przedziału (a, b), pochodną prawostronną w a i pochodną lewostronną w b. W przypadku funkcji różniczkowalnej f : [a, b] → Rm wygodnie jest mówić krótko o pochodnej f w a i w b rozumiejąc przez to odpowiednio pochodną prawostronną w a i lewostronną w b. 15.1.4 Ciągłość funkcji różniczkowalnej W dalszych rozdziałach podamy szereg twierdzeń gwarantujących istnienie pochodnej, co pozwoli nam konstruować znacznie bardziej zaawansowane przykłady. Na koniec tego rozdziału podajmy następujące twierdzenie określające warunek konieczny istnienia pochodnej. Twierdzenie 15.1.9 Jeśli funkcja f : (a, b) → Rm ma w punkcie x0 ∈ (a, b) pochodną to jest w tym punkcie ciągła. Dowód: Aby pokazać ciągłość f w x0 ustalmy > 0. Na mocy definicji pochodnej istnieje granica lim h→0 f (x0 + h) − f (x0 ) . h Z definicji granicy dla 0 = 1 znajdziemy δ 0 > 0 takie, że jeśli h ∈ (−δ 0 , δ 0 ) to f (x0 + h) − f (x0 ) 0 − f (x0 ) < 1. h W szczególności f (x0 + h) − f (x0 ) f (x0 + h) − f (x0 ) 0 ¬ − f (x0 ) + |f 0 (x0 )| < 1 + |f 0 (x0 )|. h h (15.4) Weźmy δ := min(δ 0 , 1+|f 0 (x0 )| ). Z (15.4) dla h ∈ (−δ, δ) mamy |f (x0 + h) − f (x0 )| < (1 + |f 0 (x0 )|)|h| ¬ co pokazuje, że limh→0 f (x) = f (x0 ) i dowodzi, że f jest ciągła w x0 . 15.2. RÓŻNICZKA FUNKCJI 223 Rysunek 15.2: Aproksymacja liniowa funkcji f w punkcie (x0 , f (x0 )) w lokalnym układzie współrzędnych (x̄, ȳ). Ćwiczenie 15.1.10 Uogólnić twierdzenie 15.1.9 na przypadek funkcji f : [a, b] → Rm . 15.2 Różniczka funkcji 15.2.1 Aproksymacja liniowa Interpretacja pochodnej jako współczynnika kierunkowego nachylenia stycznej w danym punkcie do wykresu nie jest jedyna˛ użyteczna˛ intuicja˛ w tym kontekście. Poj˛ecie pochodnej wiaże ˛ si˛e również z idea˛ przybliżania funkcji funkcja˛ liniowa.˛ Definicja 15.2.1 Funkcja liniowa R → Rn jednej zmiennej to funkcja postaci R 3 t 7→ tv ∈ Rn dla ustalonego v ∈ Rn . Wektor v (liczbę w przypadku n = 1) nazywać będziemy współczynnikiem funkcji liniowej jednej zmiennej. Funkcję taką oznaczać będziemy Lv , lub krótko L, jeśli współczynnik v jest nieistotny. Łatwo sprawdzić, że funkcja liniowa jest ciągła i w zerze ma wartość zero. Uwaga 15.2.2 Jeśli L : R → Rm jest funkcją liniową, to L = Lv dla v = L(1). Innymi słowy wartość funkcji liniowej dla argumentu jeden jest równa jej współczynnikowi. Funkcja liniowa daje si˛e bardzo prosto wyliczać, wi˛ec jest dobrym kandydatem na przybliżanie (lokalne) innych funkcji. Idea jest nast˛epujaca. ˛ Wiemy, że pewna funkcja f ma w punkcie x0 wartość y0 := f (x0 ). Interesuje nas wartość funkcji f w punkcie x1 bliskm x0 , czyli y1 := f (x1 ). Czy dysponujac ˛ przyrostem zmiennej x, czyli róznica˛ x1 − x0 , możemy przy pomocy pewnej funkcji liniowej wyliczyć przybliżenie przyrostu zmiennej y , czyli różnic˛e y1 − y0 = f (x1 ) − f (x0 )? Podkreślmy, że chodzi nam o funkcj˛e liniowa˛ w układzie współrz˛ednych przesuni˛etym do punktu (x0 , y0 ), a wi˛ec w układzie (x̄, ȳ), gdzie x̄ := x − x0 , ȳ := y − y0 , zwanym lokalnym układem współrz˛ednych wzgl˛edem punktu (x0 , y0 ). Zwróćmy uwag˛e, że punkt o współrz˛ednych (x0 , y0 ) w lokalnym układzie współrz˛ednych ma współrz˛edne (0, 0). Nasze pytanie można wi˛ec sformułować nast˛epujaco ˛ (rys. 15.2): 224 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Czy istnieje funkcja liniowa L w lokalnym układzie współrz˛ednych (x̄, ȳ), taka że y1 − y0 ≈ ȳ = L(x̄) = L(x1 − x0 )? Zwróćmy uwag˛e, że to pytanie należy uściślić. Jeśli przybliżenie rozumieć b˛edziemy jako wymóg, by w granicy, przy x → x0 , popełniony bład, ˛ czyli wyrażenie y1 − y0 − L(x1 − x0 ) = f (x1 ) − f (x0 ) − L(x1 − x0 ) zmierzało do zera, to wymóg ten spełni każda funkcja liniowa, bo jako ciagła ˛ ma w zerze granic˛e równa˛ wartości, czyli zero. Naturalne jest jednak oczekiwanie, że im bliżej znajdziemy si˛e x0 , tym przybliżenie b˛edzie lepsze. Miara˛ jakości przybliżenia jest bład ˛ wzgl˛edem przyrostu x̄ = x1 − x0 mierzony ilorazem f (x0 + x̄) − f (x0 ) − L(x̄) y1 − y0 − L(x1 − x0 ) = . x1 − x0 x̄ Chcemy, by ten bład ˛ zmierzał do zera przy x̄ → 0. Niech L = Lv . Przy użyciu bardziej tradycyjnego oznaczenia h w miejsce x̄, nasz wymóg można zapisać jako lim h→0 f (x0 + h) − f (x0 ) − hv = 0, h co jak łatwo sprawdzić, sprowadza si˛e do żadania, ˛ by f (x0 + h) − f (x0 ) = v. h Tak wi˛ec, jeśli stosowne przybliżenie liniowe istnieje, to współczynnik v jest pochodna˛ funkcji w punkcie x0 . lim h→0 Czasami wygodnie jest patrzeć na problem sprowadzony do zera. Jak widzieliśmy wygodnie jest przesunać ˛ układ współrz˛ednych tak, by interesujacy ˛ nas punkt był w poczatku ˛ układu. Wygodnie jest też sprowadzić definiowania pochodnej do definiowania pochodnej równej zero. Z naszych wcześniejszych rozważań wynika, że pochodna równa zero oznacza, że przybliżajaca ˛ funkcja liniowa ma współczynnik v równy zero. Funkcja liniowa z R do R o współczynniku zero ma wykres b˛edacy ˛ linia˛ pozioma˛ przechodzac ˛ a˛ przez poczatek ˛ układu współrz˛ednych. Z drugiej strony, jeśli pochodna wynosi zero, to mamy f (x0 + h) − f (x0 ) = 0. h→0 h lim Zwrócmy uwag˛e, że funkcja,˛ której granic˛e tu rozważamy jest ϕ : h 7→ f (x0 + h) − f (x0 ), gdzie x0 traktujemy jako parametr. Przy tych oznaczeniach mamy ϕ(h) = 0. h→0 h lim Z definicji granicy wiemy, że wtedy dla dowolnego > 0 istnieje δ > 0 taka, że dla |h| < δ mamy ϕ(h) h < lub równoważnie |ϕ(h)| < |h|. Funkcj˛e o tej własności nazywamy płaska˛ w zerze. Poj˛ecie to wyjaśnia rysunek 15.3. Używajac ˛ j˛ezyka funkcji płaskich w zerze możemy powiedzieć, że f 0 (x) = a wtedy i tylko wtedy gdy funkcja h 7→ f (x + h) − f (x) − ah jest płaska w zerze. Jest tak, bo dla h = 0 mamy f (x + 0) − f (x) − a · 0 = 0, a, jak niebawem b˛edziemy w stanie policzyć formlnie, pochodna tej funkcji w zerze wynosi f 0 (x) − a. 15.2. RÓŻNICZKA FUNKCJI 225 Rysunek 15.3: Funkcja płaska w zerze. Każdy ze stożków po zawężeniu do stosownego otocznia zera zawiera fragment wykresu. 15.2.2 Relacja "o małe" Aby sformalizować opisane w poprzednim podrozdziale intuicje zaczniemy od podania definicji relacji "o małe", która przyda się nie tylko w podaniu formalnej definicji płaskości w zerze, ale również w następnych rozdziałach. Rozważmy f : (a, b) → Rm i g : (a, b) → R. Załóżmy ponadto, że istnieje V otoczenie x0 takie, że g(x) 6= 0 dla x ∈ V \ {x0 }. Stawiamy definicję ogólną, ale warto zaznaczyć, że na początku interesować nas będzie głównie przypadek szczególny gdy g jest funkcją identycznościową, t.j. gdy g(x) = x. Definicja 15.2.3 Mówimy, że funkcja f jest o małe od funkcji g w otoczeniu punktu x0 i piszemy f (x) = o(g(x)) przy x → x0 , jeżeli ∀ > 0 ∃δ > 0 |x − x0 | < δ ⇒ ||f (x)|| < |g(x)|. Następującą uwagę można wywnioskować wprost z definicji granicy. Uwaga 15.2.4 Relacja f (x) = o(g(x)) przy x → x0 zachodzi wtedy i tylko wtedy gdy f (x0 ) = 0 i lim x→x0 ||f (x)|| = 0. |g(x)| Z uwagi tej łatwo wyprowadzić następujący wniosek Wniosek 15.2.5 Relacja f (x) = o(g(x)) przy x → x0 zachodzi wtedy i tylko wtedy gdy istnieje funkcja ciągła ϕ : V → Rm taka, że ϕ(x0 ) = 0 oraz f (x) = ϕ(x)g(x) dla x ∈ V . Dowód: Wystarczy przyjąć ( ϕ(x) := f (x) g(x) dla x 6= 0, 0 dla x = 0. Z kolei z twierdzenia o granicy sumy i różnicy natychmiast dostajemy następujący wniosek. 226 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Wniosek 15.2.6 Jeśli istnieje V otoczenie x0 takie, że g(x) 6= 0 dla x ∈ V \ {x0 } oraz funkcje fi : R−→ ◦ R spełniają fi (x) = o(g(x)) przy x → x0 to również (f1 + f2 )(x) = o(g(x)) i (f1 − f2 )(x) = o(g(x)) przy x → x0 15.2.3 Płaskość w zerze Podamy teraz formalną definicję płaskości funkcji w zerze. Niech f : (a, b) → Rm będzie funkcją o wartościach w Rm , określoną na przedziale otwartym (a, b) ⊂ R takim, że 0 ∈ (a, b). Definicja 15.2.7 Mówimy, że f jest płaska w zerze jeżeli f (x) = o(x) przy x → 0. Następująca uwaga wynika wprost z uwagi 15.2.4. Uwaga 15.2.8 Funkcja f jest płaska w zerze wtedy i tylko wtedy gdy f (0) = 0 oraz lim x→0 f (x) = 0. x Jeśli f jest płaska w zerze, to funkcja ϕ : (a, b) → Rm zdefiniowana wzorem ( f (x) gdy x 6= 0, x ϕ(x) := 0 dla x = 0. jest ciągła w zerze oraz f (x) = xϕ(x). Łatwo sprawdzić, że również na odwrót, jeśli funkcja ϕ o takich własnościach istnieje, to f jest płaska w zerze. Mamy zatem następującą uwagę. Uwaga 15.2.9 Funkcja f jest płaska w zerze wtedy i tylko wtedy gdy istnieje funkcja ϕ : (a, b) → Rm ciągła w zerze taka, że ϕ(0) = 0 oraz f (x) = xϕ(x) dla x ∈ (a, b). 15.2.4 Różniczkowalność Wróćmy teraz do idei przybliżania przyrostu funkcji funkcja˛ liniowa.˛ Wprowadźmy tradycyjne oznaczenia na przyrost wartości argumentu i przyrost wartości funkcji (różnice) w punkcie x0 : ∆x := x − x0 , ∆y := f (x) − f (x0 ). Niech L = Lf 0 (x0 ) b˛edzie funkcja˛ liniowa˛ przybliżajac ˛ a˛ w loklanym układzie współrz˛ednych przyrost funkcji f . Wtedy ∆y ≈ L(∆x) = f 0 (x0 )∆x, (15.5) przy czym popełniony bład ˛ wzgl˛edny jest tym mniejszy im mniejsze jest ∆x. Leibniz nie dysponował precyzyjnym aparatem i mówił, że jeśli ∆x jest nieskończenie małe, to przybliżona równość (15.5) staje si˛e równościa.˛ Takie nieskończenie małe różnice ∆x i ∆y nazywał różniczkami (malusieńkimi różnicami) i oznaczał dy i dx. Używajac ˛ jego j˛ezyka napisalibyśmy, że różniczki dx i dy spełniaja˛ równanie dy = f 0 (x)dx. (15.6) Problem w tym, że różniczki jako wielkości nieskończenie małe trudno jest precyzyjnie zdefiniować. Poj˛ecie różniczki odczarował A. Cauchy, traktujac ˛ równanie (15.6) jako równanie odwzorowania liniowego przybliżajacego ˛ przyrost funkcji, a sama˛ różniczk˛e definiujac ˛ jako to przybliżajace ˛ odwzorowanie liniowe. I tak do dziś rozumiemy różniczk˛e. Natomiast termin różniczkowalność, ze wzgl˛edu na bezpośredni zwiazek ˛ pomi˛edzy różniczka˛ i pochodna,˛ jest odnoszony zarówno do istnienia pochodnej jak i różniczki, bo, jak zobaczymy, sa˛ to fakty równoważne. 15.2. RÓŻNICZKA FUNKCJI 227 Jak poprzednio, niech f : (a, b) → Rm będzie funkcją określoną na przedziale otwartym (a, b) ⊂ R o wartościach w Rm . Rozważmy przyrost funkcji f w punkcie x0 ∈ (a, b), t.j. funkcję ∆x0 f : (a − x0 , b − x0 ) → Rm określoną wzorem ∆x0 f (h) := f (x0 + h) − f (x0 ). Definicja 15.2.10 Funkcję f nazywamy różniczkowalną w punkcie x0 jeżeli istnieje funkcja liniowa L : R → Rm taka, że funkcja ∆x0 f − L, czyli różnica funkcji ∆x0 f i funkcji L jest płaska w zerze. Odwzorowanie L nazywamy wtedy różniczką funkcji f w punkcie x0 i oznaczamy dx0 f . Aby powyższa definicja miała sens, musimy wiedzieć, że różniczka jest wyznaczona jednoznacznie. W istocie różniczka jest wyznaczona przez pochodną, jak pokazuje następujące rozumowanie. Jeśli L jest różniczką fukcji f w punkcie x0 to z płaskości w zerze funkcji ∆x0 f − L wnosimy, że lim h→0 ∆x0 f (h) − L(h) = 0. h Ponieważ L(h) = L(1)h, jest to równoważne warunkowi ∆x0 f (h) − L(1) = 0 h→0 h lim oraz warunkowi ∆x0 f (h) = L(1). h→0 h lim Ponieważ ∆x0 f (h) = f (x0 + h) − f (x0 ), powyższa granica pokrywa się z granicą (15.1). Pokazaliśmy zatem następującą uwagę. Uwaga 15.2.11 Funkcja liniowa L : R → Rm jest różniczką funkcji f w punkcie x0 wtedy i tylko wtedy gdy L(1) jest pochodną tej funkcji w punkcie x0 . W szczególności f jest różniczkowalna w puncie x0 wtedy i tylko wtedy gdy f ma pochodną w punkcie x0 . Tak więc, jeśli odwzorowanie liniowe L spełniające wymogi definicji 15.2.10 istnieje, to współczynnik L(1), a zatem i samo odwzorowanie L są wyznaczone jednoznacznie. Z uwagi 15.2.11 wynika, że stwierdzenia "f jest różniczkowalna" i "f ma pochodna"˛ moga˛ być używane zamiennie. Jednak poj˛ecia różniczki i pochodnej nie sa˛ tożsame, choć sa˛ ściśle powiazane: ˛ wartość różniczki dla argumentu jeden jest pochodna.˛ Różniczka jest odwzorowaniem liniowym, które przemnaża argument przez pochodna.˛ Koncepcja różniczki bazuje na aproksymacji liniowej funkcji w punkcie. Koncepcja pochodnej bazuje na stycznej do wykresu funkcji w punkcie. Zwiazek ˛ mi˛edzy różniczka,˛ a pochodna˛ można wi˛ec też wyrazić stwierdzajac, ˛ że wykres aproksymacji liniowej funkcji f w zadanym punkcie jest prosta,˛ która pokrywa si˛e ze styczna˛ do wykresu funkcji f w tym punkcie. Zauważmy, że jeśli funkcja jest płaska w zerze, to ma pochodną w zerze równą zero. Rzeczywiście, na mocy uwagi 15.2.8 jeśli f jest płaska w zerze, to f (0) = 0 oraz limx→0 f (x) x = 0. Tę ostanią granicę można przepisać jako 0 = lim x→0 f (x) f (0 + h) − f (0) = lim h→0 x h co oznacza, że f ma w zerze pochodną zero. Łatwo zauważyć, że można przeprowadzić również odwrotne wnioskowanie. Prowadzi to do następującej uwagi. Uwaga 15.2.12 Niech f : R−→ ◦ Rm będzie funkcją określoną w otoczeniu zera. Funkcja f jest płaska w zerze wtedy i tylko wtedy gdy f (0) = 0 i f 0 (0) = 0. 228 15.3 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Różniczkowanie sumy, różnicy, iloczynu i ilorazu Naturalne jest pytanie czy znając pochodną dwóch funkcji możemy wyznaczyć pochodną sumy, różnicy, iloczynu i ilorazu tych funkcji. Jest tak w istocie, jak pokazują następujące twierdzenia. Twierdzenie 15.3.1 (o pochodnej sumy i różnicy) Niech f, g : (a, b) → Rm będą różniczkowalne w punkcie x0 ∈ (a, b). Wtedy funkcje f + g i f − g są różniczkowalne w x0 oraz (f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ) i (f − g)0 (x0 ) = f 0 (x0 ) − g 0 (x0 ). Dowód: Iloraz różnicowy dla sumy f + g to f (x0 + h) − f (x0 ) g(x0 + h) − g(x0 ) (f + g)(x0 + h) − (f + g)(x0 ) = + . h h h Ponieważ lim h→0 f (x0 + h) − f (x0 ) = f 0 (x0 ) h i lim h→0 (15.7) g(x0 + h) − g(x0 ) = g 0 (x0 ), h więc z (15.7) wnosimy, że (f + g)(x0 + h) − (f + g)(x0 ) = f 0 (x0 ) + g 0 (x0 ), h co dowodzi tezy dla sumy. Dla różnicy dowód jest analogiczny. Twierdzenie o pochodnej iloczynu przedstawimy dla funkcji o wartościach w zbiorze liczb zespolonych C. Oczywiście twierdzenie to obejmuje również przypadek funkcji o wartościach rzeczywistych, bo zbiór liczb rzeczywistych traktujemy jako podzbiór zbioru liczb zespolonych. Jako ćwiczenie zostawimy przypadek, gdy jedna funkcja przyjmuje wartości skalarne, a druga wektorowe, a iloczyn funkcji jest rozumiany jako mnożenie skalara przez wektor oraz przypadek, gdy obie funkcje są wektorowe, a iloczyn jest rozumiany jako iloczyn skalarny wektorów. lim h→0 Twierdzenie 15.3.2 (o pochodnej iloczynu) Niech f, g : (a, b) → C będą różniczkowalne w punkcie x0 ∈ (a, b). Wtedy funkcja f g jest różniczkowalna w x0 oraz (f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ). Dowód: Iloraz różnicowy dla iloczynu f g to (f g)(x0 + h) − (f g)(x0 ) h = = = f (x0 + h)g(x0 + h) − f (x0 )g(x0 ) h f (x0 + h)g(x0 + h) − f (x0 + h)g(x0 ) + f (x0 + h)g(x0 ) − f (x0 )g(x0 ) h g(x0 + h) − g(x0 ) f (x0 + h) − f (x0 ) f (x0 + h) + g(x0 ) h h Funkcja f jako różniczkowalna w x0 jest również ciągła w x0 , więc g(x0 + h) − g(x0 ) f (x0 + h) − f (x0 ) + g(x0 ) = f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 ). lim f (x0 + h) h→0 h h Zatem z otrzymanego wyżej przedstawienia ilorazu różnicowego dla iloczynu również (f g)0 (x0 ) = lim h→0 (f g)(x0 + h) − (f g)(x0 ) = f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 ) h 15.3. RÓŻNICZKOWANIE SUMY, RÓŻNICY, ILOCZYNU I ILORAZU 229 co dowodzi naszej tezy. Z twierdzenia o pochodnej iloczynu i z faktu, że pochodna funkcji stałej wynosi zero dostajemy natychmiast następujący wniosek. Wniosek 15.3.3 Niech f : (a, b) → C będzie różniczkowalne w punkcie x0 ∈ (a, b) i niech c ∈ C będzie stałą. Wtedy funkcja cf jest różniczkowalna w x0 oraz (cf )0 (x0 ) = cf 0 (x0 ). Z twierdzenia o pochodnej iloczynu wyprowadzimy też następujące twierdzenie Twierdzenie 15.3.4 (o pochodnej funkcji potęgowej) Niech n ∈ N0 będzie ustaloną liczbą naturalną. Funkcja potęgowa R 3 x 7→ xn ∈ R jest różniczkowalna. Jej pochodną jest funkcja R 3 x 7→ nxn−1 ∈ R co zapisujemy mniej formalnie, ale krócej jako (xn )0 = nxn−1 . Dowód: Dowód poprowadzimy indukcyjnie względem n. Dla n ∈ {0, 1} twierdzenie wynika natychmiast z twierdzeń 15.1.2 i 15.1.3. Załóżmy, że n > 1 oraz że twierdzenie zachodzi dla k < n. Funkcja x 7→ xn jest wtedy iloczynem funkcji identycznościowej oraz funkcji x 7→ xn−1 . Z założenia indukcyjnego mamy 0 xn−1 )0 = (n − 1)xn−2 , bo n − 1 < n. Zatem z twierdzenia o pochodnej iloczynu mamy (xn )0 = (xxn−1 )0 = x0 xn−1 + x(n − 1)xn−2 = nxn−1 co dowodzi tezy. Ćwiczenie 15.3.5 Niech α : (a, b) → R i f : (a, b) → Rm będą różniczkowalne w x0 ∈ (a, b). Pokaż, że funkcja αf : (a, b) 3 x 7→ α(x)f (x) ∈ Rm jest różniczkowalna w x0 oraz (αf )0 (x0 ) = α0 (x0 )f (x0 ) + α(x0 )f 0 (x0 ). Wyprowadź stosowny wniosek gdy funkcja α lub funkcja f jest stała. Ćwiczenie 15.3.6 Niech f, g : (a, b) → Rm będą różniczkowalne w x0 ∈ (a, b). Pokaż, że funkcja f · g : (a, b) 3 x 7→ f (x) · g(x) ∈ R jest różniczkowalna w x0 oraz (f · g)0 (x0 ) = f 0 (x0 ) · g(x0 ) + f (x0 ) · g 0 (x0 ). Wyprowadź stosowny wniosek gdy funkcja f lub funkcja g jest stała. 230 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Twierdzenie 15.3.7 (o pochodnej ilorazu) Niech f, g : (a, b) → C będą różniczkowalne w x0 ∈ (a, b) i niech g(x0 ) 6= 0. Wtedy funkcja f (x) x 7→ g(x) jest dobrze określona w pewnym otoczeniu x0 i różniczkowalna w x0 oraz 0 f f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 ) (x0 ) = . 2 g (g(x0 )) Dowód: Zauważmy, że funkcja g jako różniczowalna w x0 jest ciągła w x0 , skąd wnosimy, że własność g(x0 ) 6= 0 przenosi się na pewne otoczenie x0 . Zatem iloraz funkcji f i g jest dobrze określony w pewnym otoczeniu punktu x0 . Iloraz różnicowy dla ilorazu funkcji f i g to f f f (x0 ) f (x0 +h) (x + h) − 0 g g (x0 ) g(x0 +h) − g(x0 ) = h h f (x0 + h)g(x0 ) − f (x0 )g(x0 + h) = hg(x0 )g(x0 + h) f (x0 + h)g(x0 ) − f (x0 )g(x0 ) + f (x0 )g(x0 ) − f (x0 )g(x0 + h) = hg(x0 )g(x0 + h) (f (x0 + h) − f (x0 )) g(x0 ) − f (x0 ) (g(x0 + h) − g(x0 )) = hg(x0 )g(x0 + h) = f (x0 +h)−f (x0 ) g(x0 ) h 0) − f (x0 ) g(x0 +h)−g(x h g(x0 )g(x0 + h) Przechodząc w otrzymanej równości z h do granicy w zerze dostajemy tezę. Twierdzenie 15.3.8 (o pochodnej zestawienia) Niech fi : (a, b) → C będą funkcjami różniczkowalnymi w x0 ∈ (a, b) dla i = 1, 2, . . . m. Wtedy zestawienie f := (f1 , f2 , . . . fm ) : (a, b) → Cm jest różniczkowalne w x0 oraz 0 f 0 (x0 ) = (f10 (x0 ), f20 (x0 ), . . . , fm (x0 )) Dowód: Teza wynika natychmiast z twierdzenia o granicy zestawienia funkcji (tw. 10.8.1), gdyż m fi (x0 + h) − fi (x0 ) f (x0 + h) − f (x0 ) = h h i=1 15.4 Różniczkowanie funkcji złożonej Bardzo przydatna w liczeniu pochodnych jest informacja jak pochodna złożenia funkcji wyraża się poprzez pochodne funkcji składanych. Nim przedstawimy stosowne twierdzenie, zajmiemy się twierdzeniem pomocniczym, które przyda się nam później w dowodzie twierdzenia o różniczkowaniu złożenia. ∆ f (h) Zauważmy, że jeśli f : R−→ ◦ Rm jest różniczkowalna w x0 ∈ R, to funkcja h 7→ x0h − f 0 (x0 ) ma w zerze granic˛e zero, choć sama w zerze ∆ f (h) nie jest zdefiniowana, bo ułamek x0h dla h = 0 nie ma sensu. Możemy jednak rozszerzyć t˛e funkcj˛e do funkcji r : R−→ ◦ Rm , która z definicji w zerze przyjmuje wartość zero. B˛edzie to funkcja ciagła ˛ i b˛edzie spełniać wzór ∆x0 f (h) − hv = hr(h). 15.4. RÓŻNICZKOWANIE FUNKCJI ZŁOŻONEJ 231 Okazuje si˛e, że implikacja odwrotna również zachodzi, co prowadzi do nast˛epujacego ˛ twierdzenia. Twierdzenie 15.4.1 Niech f : R−→ ◦ Rm będzie funkcją określoną w otoczeniu x0 ∈ R. Wtedy różniczkowalność f w x0 jest równoważna istnieniu funkcji r : R−→ ◦ Rm określonej i ciągłej w otoczeniu zera oraz wektora v ∈ Rm takich, że r(0) = 0 ∆x0 f (h) − hv = hr(h). Dowód: Załóżmy najpierw, że f jest różniczkowalna w x0 . Połóżmy v := f 0 (x0 ) oraz zdefiniujmy funkcję r wzorem ( ∆x0 f (h) − v gdy x 6= 0 h r(h) := 0 w przeciwnym razie. Oczywiście r jest określona w otoczeniu zera i spełnia wzór (15.8) Ponieważ f 0 (x0 ) = v, więc ∆x0 f (h) −v =0 h→0 h lim co oznacza, że r jest również ciągła. Na odwrót, jeśli funkcja o postulowanych własnościach istnieje, to z jej ciągłości w zerze wynika, że istnieje granica ∆x0 f (h) , lim h→0 h a tym samym f jest różniczkowalna w x0 . Twierdzenie 15.4.2 (o pochodnej złożenia funkcji) Niech f : (a, b) → (c, d) będzie funkcją różniczkowalną w x0 ∈ (a, b), a g : (c, d) → Rm funkcją różniczkowalną w f (x0 ). Wtedy złożenie g ◦ f jest różniczkowalne w x0 oraz (g ◦ f )0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ). Dowód: Z założenia o różniczkowalności f w x0 i g w f (x0 ) oraz z twierdzenia 15.4.1 wnosimy, że istnieje V otoczenie zera oraz ciągłe, zerujące się w zerze funkcje ϕ, ψ : V → R takie, że dla h, k ∈ V ∆x0 f (h) ∆f (x0 ) g(k) = f (x0 + h) − f (x0 ) = (f 0 (x0 ) + ϕ(h)) h (15.8) = g(f (x0 ) + k) − g(f (x0 )) = (g 0 (f (x0 )) + ψ(k)) k. (15.9) Ponieważ funkcja h 7→ (f 0 (x0 ) + ϕ(h)) h jest ciągła i zeruje się w zerze, więc istnieje W otoczenie zera takie, że dla h ∈ W mamy (f 0 (x0 ) + ϕ(h)) h ∈ V. Zatem wzór (15.9) zachodzi również dla k = (f 0 (x0 ) + ϕ(h)) h przy h ∈ V . Mamy zatem dla h ∈ V g(f (x0 ) + (f 0 (x0 ) + ϕ(h)) h) − g(f (x0 )) = (g 0 (f (x0 )) + ψ(f 0 (x0 ) + ϕ(h)) h) (f 0 (x0 ) + ϕ(h)) h. (15.10) Wykorzystując (15.8) oraz (15.10) otrzymujemy ∆x0 (g ◦ f )(h) = g(f (x0 + h)) − g(f (x0 )) = g(f (x0 ) + (f 0 (x0 ) + ϕ(h)) h) − g(f (x0 )) = (g 0 (f (x0 )) + ψ(f 0 (x0 ) + ϕ(h)) h) (f 0 (x0 ) + ϕ(h)) h. Stąd ∆x0 (g ◦ f )(h) = (g 0 (f (x0 )) + ψ(f 0 (x0 ) + ϕ(h)) h) (f 0 (x0 ) + ϕ(h)) . h Ponieważ tak ψ jak i ϕ zmierzają do zera przy h zmierzającym do zera, prawa strona powyższej równości zmierza do g 0 (f (x0 ))f 0 (x0 ). Zatem również lewa strona jest zbieżna do g 0 (f (x0 ))f 0 (x0 ). Dowodzi to tezy, bo lewa strona to iloraz różnicowy dla funkcji g ◦ f w x0 . 232 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. 15.5 Różniczkowanie funkcji wykładniczej i funkcji trygonometrycznych W rozdziale tym podamy wzory na pochodna˛ funkcji wykładniczej oraz funkcji trygonometrycznych. Wzory te uzyskamy badajac ˛ pochodna˛ funkcji R 3 t 7→ etz ∈ C (15.11) dla ustalonej liczby zespolonej z ∈ C. Stosowny wzór podamy dla dowolnego zespolonego z , ale interesować nas b˛eda˛ głównie przypadki gdy z jest liczba˛ rzeczywista˛ badź ˛ liczba˛ urojona˛ i. Zauważmy, że iloraz róznicowy dla funkcji (15.11) ma postać ehz − 1 e(t+h)z − etz = etz , h h wi˛ec interesować nas b˛edzie granica limh→0 ehz −1 h . Lemat 15.5.1 Funkcja C \ {0} 3 u 7→ eu − 1 ∈C u ma w zerze granicę równą jeden. Dowód: Przypomnijmy, że zgodnie z definicją 13.1.3 mamy eu = ∞ X un , n! n=0 skąd eu − 1 = bo u0 0! ∞ X un , n! n=1 = 1. Zatem dla dowolnego u ∈ C \ {0} mamy P P u ∞ ∞ un − 1 ∞ un X n−1 e − 1 u n=0 n=1 n! n! = − 1 − 1 = − 1 = − 1 u u u n! n=1 ∞ ∞ ∞ X un−1 X X |u|n−1 |u|n−2 = = |u| ¬ n! n=2 n! n! n=2 n=2 Ponieważ interesuje nas tylko otoczenie zera, możemy założyć, że |u| < 1. Dla takich u dostajemy u ∞ X e − 1 1 ¬ |u| − 1 ¬ |u|e. u n! n=2 Tak więc dla |u| < 1 mamy u e − 1 0¬ − 1 ¬ |u|e. u Ponieważ prawa strona tej nierówności zmierza do zera przy u zmiarzającym do zera, z twierdzenia o trzech funkcjach wnosimy, że u e − 1 lim − 1 = 0, u→0 u co dowodzi tezy. 15.5. RÓŻNICZKOWANIE FUNKCJI WYKŁADNICZEJ I FUNKCJI TRYGONOMETRYCZNYCH 233 Twierdzenie 15.5.2 Funkcja R 3 t 7→ etz ∈ C jest różniczkowalna, a jej pochodną jest funkcja R 3 t 7→ zetz ∈ C Dowód: Dla z = 0 rozważana funkcja jest stale równa jeden, zatem jest różniczkowalna, a jej pochodną jest funkcja stale równa zero, co jest zgodne z tezą twierdzenia. Załóżmy zatem, że z 6= 0. Pochodną rozważanej funkcji w punkcie z jest e(t+h)z − ez ehz − 1 ehz − 1 = etz lim = zetz lim = zetz , h→0 h→0 h→0 h h hz lim bo z lematu 15.5.1 wiemy, że ehz − 1 eu − 1 = lim = 1. u→0 h→0 hz u lim Wniosek 15.5.3 (o różniczkowaniu rzeczywistej funkcji wykładniczej) Rzeczywista funkcja wykładnicza R 3 x 7→ ex ∈ R+ jest różniczkowalna, a jej pochodną jest ona sama, co nieprecyzyjnie, ale zwięźle zapisujemy jako (ex )0 = ex . Dowód: Tezę dostajemy natychmiast z twierdzenia 15.5.2 po podstawieniu za z stałej jeden. Twierdzenie 15.5.4 (o różniczkowaniu funkcji trygonometrycznych) Funkcje trygonometryczne: sin, cos, tg, ctg są różniczkowalne w swojej dziedzinie i zachodzą wzory (sin t)0 = cos t, (cos t)0 = − sin t, (tg t)0 = 1 , cos2 x (ctg t)0 = − 1 . sin2 x Dowód: Z twierdzenia 15.5.2 dla z = i oraz dla z = −i mamy it 0 eit + e−it e − e−it 1 1 (sin t)0 = = (eit )0 − (e−it )0 = ieit + ie−it = = cos t. 2i 2i 2i 2 Podobnie 0 (cos t) = eit + e−it 2 0 = 1 1 eit − e−it (eit )0 + (e−it )0 = ieit − ie−it = − = − sin t. 2 2 2i Z twierdzenia o granicy ilorazu mamy 0 sin t (sin t)0 cos t − sin t(cos t)0 cos t cos t − sin t(− sin t) 1 (tg t)0 = = = = . cos t cos2 t cos2 t cos2 t Podobnie (ctg t)0 = cos t sin t 0 = (cos t)0 sin t − cos t(sin t)0 − sin t sin t − cos t(cos t) 1 = =− 2 . sin2 t sin2 t sin t 234 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. 15.6 Nieciągłości pochodnej i funkcje klasy C 1 . W przykładzie 15.1.4 pokazaliśmy, że funkcja x 7→ |x| nie posiada w zerze pochodnej. Oczywiście poza zerem jest różniczkowalna. Jej nieróżniczkowalność w zerze bierze się stąd, że pochodne lewostronna i prawostronna, choć istnieją, nie są sobie równe. Poniższy przykład pokazuje, że nawet pochodne jednostronne mogą w pewnym punkcie nie istnieć. Przykład 15.6.1 Rozważmy funkcję ( x sin x1 R 3 x 7→ 0 gdy x 6= 0, dla x = 0. Funkcja ta jest ciągła, a dla x 6= 0 różniczkowalna na podstawie twierdzenia o różniczkowaniu iloczynu, funkcji złożonej i ilorazu. Dla x = 0 iloraz różnicowy ma postać h sin h1 1 = sin . h h Wiemy, że granica limh→0 sin h1 nie istnieje. Nie istnieją nawet stosowne granice jednostronne. Zatem rozważana funkcja nie jest różniczowalna w zerze i nie posiada w zerze pochodnych jednostronnych. Interesujące jest pytanie, czy jeśli funkcja jest różniczkowalna w każdym punkcie, to jej pochodna musi być funkcją ciągłą. Okazuje się, że niekoniecznie, jak pokazuje poniższy przykład. Przykład 15.6.2 Rozważmy funkcję ( R 3 x 7→ x2 sin x1 0 gdy x 6= 0, dla x = 0. Funkcja ta jest ciągła, a dla x 6= 0 różniczkowalna na podstawie twierdzenia o różniczkowaniu iloczynu, funkcji złożonej i ilorazu. Dla x = 0 iloraz różnicowy ma postać h2 sin h1 1 = h sin . h h Granica limh→0 h sin h1 istnieje i wynosi zero. Zatem również w zerze nasza funkcja jest różniczkowalna. Jej pochodną jest funkcja ( 2x sin x1 − cos x1 gdy x = 6 0, R 3 x 7→ 0 dla x = 0. Pokażemy, że pochodna ta nie jest ciągła w zerze. Gdyby była ciągła w zerze, to dla każdego ciągu xn zbieżnego do 1 zera ciąg wartości byłby zbieżny do pochodnej w zerze, czyli do zera. Ale ciąg xn = 2πn jest zbieżny do zera, a ciąg wartości pochodnej w punktach tego ciągu wynosi stale −1, więc jest zbieżny do −1, a nie do zera. Definicja 15.6.3 Funkcję f : (a, b) → Rm , która jest różniczkowalna i ma ciągłą pochodną nazywamy funkcją klasy C 1 . Zbiór takich funkcji oznaczamy C 1 ((a, b), Rm ). Nazwa "klasa C 1 " wyjaśni si˛e później, gdy zdefiniujemy również funkcje klasy C n . W programie Mathematica pochodną funkcji f zmiennej x obliczamy używając instrukcji D[f[x],x] 15.7. METODA NEWTONA 235 Na przykład pochodną funkcji 1 f (x) := log 4 x2 − 1 x2 + 1 obliczymy pisząc D[(1/4) Log[(x^2 - 1)/(x^2 + 1)], x] Jako wynik program Mathematica zwraca 2 x +1 2x x2 +1 − 2x(x2 −1) (x2 +1)2 4 (x2 − 1) . Nie jest to czytelna postać pochodnej. Instrukcja Simplify pozwala uzyskać najbardziej zwartą postać wyrażenia. Jako argumentu można użyć znaku %, który odnosi się do ostatniego wyrażenia obliczonego przez program Mathematica. Simplify[%] daje w wyniku 15.7 x . x4 − 1 Metoda Newtona Rozwiazywanie ˛ równań interesowało matematyków już od starożytności. Pierwotnie stosowano głównie metody geometryczne, które pozwalały rozwiazywać ˛ równania liniowe i wybrane równania wyższych stopni, głównie kwadratowe. Po raz pierwszy podejście algebraiczne w rozwiazywaniu ˛ równania kwadratowego zastosowano w VII wieku w Indiach. W XVIw. metod˛e rozwiazywania ˛ równania trzeciego i czwartego stopnia znaleźli włoscy matematycy Niccolo Fontana Tartaglia i Lodovico Ferrari. Liczne próby ogólnego rowiazania ˛ równań wyższych stopni spełzły na niczym, a na poczatku ˛ XIXw. norwerski matematyk Niels Henrik Abel udowodnił, że nie da si˛e podać ogólnego algorytmu rozwiazania ˛ równania stopnia wi˛ekszego niż cztery za pomoca˛ skończonej ilości operacji arytmetycznych +, −, ∗, / oraz pierwiastkowania. Pozostały zatem metody przybliżone. Wsród nich prym wiedzie wywodzaca ˛ si˛e z prac Izaaka Newtona i nazywana jego imieniem metoda iteracyjna wykorzystujaca ˛ przybliżanie funkcji styczna˛ do wykresu. Załóżmy, że chcemy rozwiazać ˛ równanie postaci f (x) = 0, gdzie f : [a, b] → R jest funkcja˛ różniczkowalna.˛ Rozwiazania ˛ takiego równania nazywane sa˛ również miejscami zerowymi funkcji f . Załóżmy, że dany jest punkt x0 ∈ [a, b], a y = cx + d jest równaniem prostej stycznej do wykresu f w punkcie x0 . Wiemy, że c, czyli współczynnik kierunkowy tej prostej jest równy f 0 (x0 ). Ponieważ punkt (x0 , f (x0 )) należy do stycznej, wi˛ec f (x0 ) = f 0 (x0 )x0 + d, skad ˛ wyliczamy d co pozwala przepisać nam równanie stycznej w postaci y = f (x0 ) + f 0 (x0 ) (x − x0 ) . Przyjmujac ˛ y = 0 i rozwiazuj ˛ ac ˛ wzgl˛edem x znajdujemy x = x0 − f (x0 ) . f 0 (x0 ) Jest to przybliżenie miejsca zerowego funkcji f tym lepsze im bliżej x0 było miejsca zerowego. Dlatego iterujac ˛ ten proces, to znaczy liczac ˛ wyrazy ciagu ˛ danego rekurencyjnie wzorem xn+1 := xn − f (xn ) f 0 (xn ) 236 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. /∗ ∗∗∗∗∗∗∗∗∗∗ newton . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ /∗ P i e r w i a s t e k wielomianu ∗/ /∗ metodą Newtona ∗/ /∗ ∗ ∗ ∗ ∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ #include <i o s t r e a m > using namespace s t d ; /∗ S t o p i e ń wielomianu ∗/ const i n t d e g r e e =2; /∗ T a b l i c a współczynników wielomianu ∗/ double c o e f [ d e g r e e + 1 ] ; /∗ maksymalna l i c z b a i t e r a c j i ∗/ i n t l i m i t =30; /∗ o c z e k i w a n a d o k ł a d n o ś ć ∗/ double e p s i l o n = 0 . 0 0 1 ; /∗ W y l i c z e n i e w a r t o ś c i wielomianu w x ∗/ double f ( double x ) { double s=c o e f [ d e g r e e ] ; f o r ( i n t i=d e g r e e −1; i >=0; i −−) s=c o e f [ i ]+x∗ s ; return s ; } /∗ W y l i c z e n i e p o c h o d n e j wielomianu w x ∗/ double d e r f ( double x ) { double s=d e g r e e ∗ c o e f [ d e g r e e ] ; f o r ( i n t i=d e g r e e −1; i >=1; i −−) s=i ∗ c o e f [ i ]+x∗ s ; return s ; } /∗ Program główny ∗/ i n t main ( ) { /∗ Wczytujemy w s p ó ł c z y n n i k i wielomianu ∗/ f o r ( i n t i =0; i <d e g r e e +1;++ i ) { c o u t << "c[" << i << " ]= " ; c i n >> c o e f [ i ] ; } /∗ o r a z w y j ś c i o w e p r z y b l i ż e n i e p i e r w i a s t k a ∗/ double x ; c o u t << " x0 =" ; c i n >> x ; /∗ P ę t l a główna ∗/ f o r ( i n t i =0; i <l i m i t ;++ i ) { double v a l=f ( x ) ; c o u t << " x =" << x << "\n" ; c o u t << " f(x )= " << v a l << "\n" ; /∗ J e ś l i o s i ą g n i ę t o żądaną d o k ł a d n o ś ć można p r z e r w a ć p ę t l ę ∗/ i f ( v a l <e p s i l o n && v a l >−e p s i l o n ) break ; /∗ Nowe p r z y b l i ż e n i e ∗/ x=x−v a l / d e r f ( x ) ; } } Listing 15.1: Wyznaczanie miejsc zerowych wielomianu w C++. 15.7. METODA NEWTONA 237 Rysunek 15.4: Interpretacja geometryczna metody Newtona możemy si˛e spodziewać, że b˛edzie on zbieżny do miejsca zerowego funkcji f w przedziale [a, b]. Nie zawsze tak jest, ale dzieje si˛e tak na tyle cz˛esto, że metoda Newtona jest do dziś bardzo powszechnie stosowanym narz˛edziem. Interpretacja geometryczna zwiazku ˛ xn i xn+1 z pochodna˛ funkcji f jest przedstawiona na rys. (15.4). Program w C++ znajdujacy ˛ miejsca zerowe wielomianu przedstawiono na listingu 15.1. W programie Mathematica rozwiazanie ˛ równania metoda˛ Newtona umożliwia insturkcja FindRoot. Ponieważ program Mathematica sam potrafi znaleźć pochodna,˛ jedyne co musimy zrobić to zapisać równanie i podać wartość, od której należy rozpoczać ˛ poszukiwanie pierwiastka. Na przykład piszac ˛ FindRoot[Cos[x] == x^3, {x, 1}] otrzymujemy jako rozwiazanie ˛ {x -> 0.865474} Program Mathematica przekształca równanie cos x = x3 do postaci f (x) = 0, gdzie f (x) := cos x − x3 , znajduje pochodna˛ f 0 (x) = − sin x − 3x2 i nast˛epnie liczy wyrazy ciagu ˛ danego wzorem rekurencyjnym x0 xn+1 := 1 := xn − cos xn − x3n − sin xn − 3x2n aż do osiagni˛ ˛ ecia przybliżenia granicy o domyślnie ustawionej dokładności. Ćwiczenie 15.7.1 Pokaż, że zaprezentowana w rozdziale 5.4.1 metoda liczenia pierwiastka kwadratowego sowana˛ do równania x2 − a = 0. √ a jest w istocie metoda˛ Newtona zasto- 238 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. 15.8 Ekstrema lokalne, a różniczkowalność. 15.8.1 Maksima i minima lokalne Pochodna funkcji przydaje się przy poszukiwaniu lokalnych minimów i maksimów funkcji. Definicja 15.8.1 Mówimy, że funkcja f : (a, b) → R ma w x0 ∈ (a, b) minimum lokalne jeżeli istnieje otoczenie U ⊂ (a, b) punktu x0 takie, że dla wszystkich x ∈ U zachodzi f (x) ­ f (x0 ). Podobnie mówimy, że f ma w x0 ∈ (a, b) maksimum lokalne jeżeli istnieje otoczenie U ⊂ (a, b) punktu x0 takie, że dla wszystkich x ∈ U zachodzi f (x) ¬ f (x0 ). Mówimy, że f ma w x0 ∈ (a, b) ekstremum lokalne jeśli f ma w x0 minimum lokalne lub maksimum lokalne. Twierdzenie 15.8.2 (o ekstremum lokalnym funkcji różniczkowalnej) Jeśli f : (a, b) → R jest różniczkowalna w x0 ∈ (a, b) i ma w x0 ekstremum lokalne, to f 0 (x0 ) = 0. Dowód: Załóżmy, że f ma w x0 maksimum lokalne. Zatem istnieje δ > 0 taka, że (x0 −δ, x0 +δ) ⊂ (a, b) oraz f (x) ¬ f (x0 ) dla x ∈ (x0 − δ, x0 + δ). W szczególności dla h ∈ (−δ, δ) mamy f (x0 + h) − f (x0 ) ¬ 0. Zatem dla h ∈ (−δ, 0) jest f (x0 + h) − f (x0 ) ­ 0, h skąd wnosimy, że pochodna lewostronna f w x0 jest nieujemna. Z drugiej strony dla h ∈ (0, δ) jest f (x0 + h) − f (x0 ) ¬ 0, h skąd wnosimy, że pochodna prawostronna f w x0 jest niedodatnia. Ale pochodna f w x0 istnieje, więc jest równa tak pochodnej lewostronnej jak i prawostronnej. Zatem f 0 (x0 ) = 0. 15.8.2 Twierdzenie Rolle’a. Francuski matematyk Michel Rolle (1652-1719) uważany jest za autora pierwszego w miarę współczesnego dowodu następującego twierdzenia. Twierdzenie 15.8.3 (Rolle’a) Załóżmy, że f : [a, b] → R jest ciągła oraz, że jest różniczkowalna dla x ∈ (a, b). Jeśli f (a) = f (b) to istnieje ξ ∈ (a, b) takie, że f 0 (ξ) = 0. Dowód: Funkcja f , jako funkcja ciągła na przedziale zwartym, osiąga wartość największą oraz najmniejszą. Jeśli tak wartość największa jak i najmniejsza są osiągane na końcach przedziału [a, b], to założenie f (a) = f (b) implikuje, że f jest stała, a więc ma pochodną zero w każdym punkcie przedziału (a, b). Załóżmy zatem, że wartość największa lub wartość najmniejsza jest osiągnięta w pewnym punkcie ξ ∈ (a, b). Wtedy f ma w ξ ekstremum lokalne, zatem z twierdzenia o ekstremum lokalnym funkcji różniczkowalnej wynika, że f 0 (ξ) = 0. 15.9 Twierdzenie o wartości średniej 15.9.1 Uogólnione twierdzenie o wartości średniej W twierdzeniu Rolle’a sieczna do wykresu poprowadzona przez punkty (a, f (a)) i (b, f (b)) jest pozioma. Styczna do wykresu w punkcie osiagania ˛ ekstremum też jest pozioma. Zatem można stwierdzić, że istnieje punkt wewnatrz ˛ przedziału (a, b) taki, że styczna do wykresu w tym punkcie jest równoległa do siecznej 15.9. TWIERDZENIE O WARTOŚCI ŚREDNIEJ 239 Rysunek 15.5: Sieczna i równoległa do niej styczna. przez punkty (a, f (a)) i (b, f (b)). Okazuje si˛e, że to stwierdzenie jest prawdziwe również wtedy gdy f (a) 6= f (b). Fakt ten, znany jako twierdzenie o wartości średniej, ilustruje rysunek 15.5. W polskiej literaturze z twierdzeniem tym kojarzony jest francuski matematyk Joseph Louis Lagrange (1736-1813), Udowodnimy najpierw jeszcze ogólniejsze twierdzenie, pochodzace ˛ od Augustina Cauchy’ego, z którego twierdzenie o wartości średniej wyprowadzimy jako wniosek. Twierdzenie 15.9.1 (uogólnione o wartości średniej) Niech f, g : [a, b] → R będą ciągłymi funkcjami, różniczkowalnymi w przedziale (a, b). Wtedy istnieje punkt ξ ∈ (a, b) taki, że (f (b) − f (a)) g 0 (ξ) = (g(b) − g(a)) f 0 (ξ). Dowód: Rozważmy funkcję ϕ : [a, b] → R daną wzorem ϕ(x) := (f (b) − f (a)) g(x) − (g(b) − g(a)) f (x). Funkcja ta jest ciągła na przedziale [a, b] i różniczkowalna na przedziale (a, b). Co więcej, prostym rachunkiem sprawdzamy, że ϕ(a) = f (b)g(a) − f (a)g(b) = ϕ(b), zatem stosując do ϕ twierdzenie Rolle’a znajdziemy punkt ξ ∈ (a, b) taki, że ϕ0 (ξ) = 0. Ale ϕ0 (ξ) = (f (b) − f (a)) g 0 (ξ) − (g(b) − g(a)) f 0 (ξ). Zatem (f (b) − f (a)) g 0 (ξ) − (g(b) − g(a)) f 0 (ξ) = 0, co dowodzi naszej tezy. 15.9.2 Twierdzenie Lagrange’a o wartości średniej Przyjmując w twierdzeniu 15.9.1 za funkcję g identyczność otrzymujemy jako wniosek następujące klasyczne twierdzenie o wartości średniej. Twierdzenie 15.9.2 (Lagrange’a o wartości średniej) Niech f : [a, b] → R będzie funkcją ciągłą, różniczkowalną w przedziale (a, b). Wtedy istnieje punkt ξ ∈ (a, b) taki, że (f (b) − f (a)) = (b − a) f 0 (ξ). 240 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. 15.9.3 Twierdzenie o przyrostach skończonych Twierdzenia o wartości średniej nie dają się przenieść w dosłownej formie na przypadek funkcji o wartościach wektorowych, na przykład zespolonych, jak pokazuje następujący przykład. Przykład 15.9.3 Rozważmy funkcję f : [0, 1] 3 t 7→ e2tπi ∈ C. Mamy f [0] = f [1] = 1, zatem gdyby twierdzenie o wartości średniej zachodziło, to istniałby punkt ξ ∈ (0, 1) taki, że f 0 (ξ) = 0. Taki punkt jednak nie istnieje, bo z twierdzenia 15.5.2 wiemy, że pochodną jest f 0 (t) = 2πie2tπi 6= 0. Mamy jednak pokrewne twierdzenie. Twierdzenie 15.9.4 (o przyrostach skończonych) Niech f : [a, b] → Rm będzie funkcją ciągłą, różniczkowalną na (a, b). Wtedy istnieje ξ ∈ (a, b) takie, że ||f (b) − f (a)|| ¬ ||f 0 (ξ)||(b − a). Dowód: Oznaczmy z := f (b) − f (a). Jeśli z = 0, teza jest oczywista. Zatem załóżmy, że z 6= 0 i rozważmy funkcję ϕ : [a, b] 3 t 7→ z · f (t) ∈ R. Funkcja ϕ jest funkcją o wartościach rzeczywistych, jest ciągła, a na podstawie ćwiczenia 15.3.6 wiemy też, że jest różniczkowalna i ϕ0 (t) = z · f 0 (t). Możemy więc do niej zastosować twierdzenie o wartości średniej. Zatem istnieje ξ ∈ (a, b) takie, że ϕ(b) − ϕ(a) = ϕ0 (ξ)(b − a) = (b − a)z · f 0 (ξ). Z drugiej strony ϕ(b) − ϕ(a) = z · (f (b) − f (a)) = z · z = ||z||2 . Zatem z nierówności Schwartza dostajemy ||z||2 = (b − a)z · f 0 (ξ) = |(b − a)z · f 0 (ξ)| ¬ (b − a)||z||||f 0 (ξ)||. Dzieląc powyższą nierówność obustronnie przez ||z|| otrzymujemy tezę. 15.10 Zastosowania twierdzenia o wartości średniej 15.10.1 Pochodna, a monotoniczność Monotoniczność funkcji różniczkowalnej znajduje odwzierciedlenie w znaku jej pochodnej. Dokładniej, mamy następujące twierdzenie. Twierdzenie 15.10.1 Niech f : (a, b) → R będzie funkcją różniczkowalną. Mają miejsce następujące równoważności (i) f 0 ­ 0 wtedy i tylko wtedy gdy f jest słabo rosnąca, (ii) f 0 > 0 wtedy i tylko wtedy gdy f jest silnie rosnąca, (iii) f 0 ¬ 0 wtedy i tylko wtedy gdy f jest słabo malejąca, (iv) f 0 < 0 wtedy i tylko wtedy gdy f jest silnie malejąca. Dowód: Załóżmy najpierw, że f 0 ­ 0. Niech x1 , x2 ∈ (a, b) oraz x1 < x2 . Z twierdzenia o wartości średniej wiemy, że f (x2 )−f (x1 ) = f 0 (ξ)(x2 −x1 ) dla pewnego ξ ∈ (x1 , x2 ). Ale z założenia f 0 (ξ) ­ 0, skąd f (x2 )−f (x1 ) ­ 0, a to dowodzi, że f jest słabo rosnąca. Z kolei jeśli f jest słabo rosnąca, to iloraz różnicowy w każdym punkcie przedziału (a, b) jest nieujemny. Zatem i pochodna jest nieujemna, jako granica ilorazu różnicowego. To dowodzi równoważności (i). Dowód pozostałych równoważności jest podobny, więc zostawiamy go jako ćwiczenie. 15.10. ZASTOSOWANIA TWIERDZENIA O WARTOŚCI ŚREDNIEJ 15.10.2 241 Twierdzenie o wartościach pośrednich dla pochodnej Widzieliśmy w przykładzie 15.6.2, że istnienie pochodnej w każdym punkcie dziedziny funkcji f nie gwarantuje ciągłości pochodnej. Tym niemniej, pochodna, nawet jeśli jest nieciągła, ma własność przyjmowania wartości pośrednich, podobnie jak funkcja ciągła. Twierdzenie 15.10.2 Niech f : (a, b) → R będzie funkcją różniczkowalną. Niech c, d ∈ (a, b) będą takie, że c < d oraz f 0 (c) < f 0 (d). Wtedy dla każdego λ ∈ (f 0 (c), f 0 (d)) istnieje ξ ∈ (c, d) takie, że f 0 (ξ) = λ. Dowód: Rozważmy funkcję g : (a, b) → R daną wzorem g(t) := f (t) − λt. Jest ona ciągła różniczkowalna oraz g 0 (c) = f (c) − λ < 0 i g 0 (d) = f 0 (d) − λ > 0. Zatem g(c) > g(c + h1 ) dla pewnego h1 ∈ (0, d − c), bo w przeciwnym razie iloraz różnicowy g(c+h)−g(c) >= 0 dla h > 0 co prowadzi do sprzeczności z g 0 (c) < 0. Podobnie stwierdzamy, że g(d) > g(d − h2 ) h dla pewnego h2 ∈ (0, d − c). Wynika stąd, że maksium, które g na przedziale [c, d] musi osiągać na mocy tw. 11.2.14 , nie może być osiągnięte na końcach tego przedziału lecz w pewnym punkcie ξ ∈ (c, d). Zatem jest to maksimum lokalne. Z tw. 15.8.2 g 0 (ξ) = f 0 (ξ) − λ = 0, skąd f 0 (ξ) = λ. Z udowodnionego twierdzenia wynika następujący ważny wniosek. 0 Wniosek 15.10.3 Niech f : (a, b) → R będzie funkcją różniczkowalną. Jeśli f 0 (x) 6= 0 dla wszystkich x ∈ (a, b), to f 0 przyjmuje wyłącznie wartości dodatnie lub wyłącznie wartości ujemne. Ćwiczenie 15.10.4 Wywnioskuj z tw. 15.10.2, że jeśli f : (a, b) → R jest funkcją różniczkowalną, to f 0 nie posiada punktów nieciągłości pierwszego rodzaju. 15.10.3 Reguła de l’Hospitala Jeśli f : R → R zeruje si˛e w zerze, to f (x) f (x) − f (0) = x x−0 może być traktowane jako przybliżenie f 0 (0), oczywiście przy założeniu, że pochodna ta istnieje. Zatem jeśli mamy dwie takie funkcje, f, g : R → R i obie zeruja˛ si˛e w zerze, to mamy f (x) = g(x) f (x) x g(x) x f 0 (0) f (0) g 0 (0) . Lewa strona nie jest przybliżeniem g(0) , bo jest to pozbawiony sensu ułamek o zerze f (x) ułamków g(x) przy x zmierzajacym ˛ do zera o ile ta granica istnieje. Zatem, przy odpowiednich Prawa˛ stron˛e tego wyrażenia można traktować jako przybliżenie w liczniku i mianowniku. Jest to jednak przybliżenie granicy założeniach, możemy si˛e spodziewać wzoru f 0 (0) f (x) = 0 . x→0 g(x) g (0) lim Udowodnimy teraz nawet nieco ogólniejsze twierdzenie. Z twierdzeniem tym kojarzony jest francuski matematyk Guillaume de l’Hospital (rys. 15.6), który pierwszy je opublikował. Jednak sa˛ argumenty za tym, że autorem twierdzenia jest szwajcarski matematyk Johann Bernoulli (rys. 15.6), brat Jacoba Bernoullego (rys. 8.9). Okazuje si˛e ono bardzo pomocne przy wyznaczaniu granic ilorazów, do których nie możemy zastosować twierdzenia o granicy ilorazu. Przypomnijmy bowiem, że twierdzenie o granicy ilorazu wymaga, by mianownik miał granic˛e różna˛ od zera. 242 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Rysunek 15.6: Guillaume de l’Hospital (1661 - 1704) i Johann Bernoulli (1667 - 1748) Źródło: Wikipedia Twierdzenie 15.10.5 (reguła de l’Hospitala). Niech f, g : (a, b) → R będą różniczkowalne oraz g 0 (x) = 6 0 dla x ∈ (a, b). Załóżmy, że lim f (x) = 0 = lim g(x) (15.12) x→a x→a lub lim g(x) ∈ {−∞, ∞}. (15.13) f 0 (x) x→a g 0 (x) (15.14) f (x) g(x) (15.15) x→a Jeśli istnieje granica lim to istnieje granica lim x→a i obie te granice są sobie równe. Twierdzenie 15.10.5 wyprowadzimy z następującego lematu Lemat 15.10.6 Przy założeniach twierdzenia 15.10.5 mamy nierówności lim sup x→a oraz lim inf x→a f (x) f 0 (x) ¬ lim sup 0 g(x) x→a g (x) (15.16) f (x) f 0 (x) ­ lim inf 0 x→a g (x) g(x) (15.17) Dowód: (twierdzenia 15.10.5) Ponieważ granica dolna jest niewiększa od granicy górnej, z (15.16) i (15.17) mamy ciąg nierówności f 0 (x) f (x) f (x) f 0 (x) lim inf 0 ¬ lim inf ¬ lim sup ¬ lim sup 0 . (15.18) x→a g(x) x→a g (x) x→a g(x) x→a g (x) W twierdzeniu 15.10.5 zakładamy istnienie granicy (15.14). Zatem stosowna granica dolna i granica górna są sobie równe. Zatem pierwsze i ostatnie wyrażenie w ciągu nierówności (15.18) są sobie równe. Jest to możliwe tylko wtedy, gdy wszystkie 15.10. ZASTOSOWANIA TWIERDZENIA O WARTOŚCI ŚREDNIEJ 243 wyrażenia są sobie równe. W szczególności drugie i trzecie wyrażenie są sobie równe. Wynika stąd istnienie granicy (15.15) i równość obu granic. Dowód: (lematu 15.10.6) Rozważmy dowód wzoru (15.16). Oznaczmy A := lim sup x→a f 0 (x) . g 0 (x) Jeśli A = ∞, to wzór (15.16) oczywiście zachodzi, załóżmy więc, że A < ∞. Wystarczy pokazać, że ∀q > A lim sup x→a f (x) ¬ q. g(x) (15.19) Ustalmy zatem liczbę q > A. Z definicji granicy znajdziemy c ∈ (a, b) takie, że ∀ x ∈ (a, c) f 0 (x) < q. g 0 (x) (15.20) Niech x, y ∈ (a, c) oraz x < y. Zwężenia f|[x,y] i g|[x,y] spełniają założenia uogólonionego twierdzenia o wartości średniej (tw. 15.9.1) zatem znajdziemy ξ ∈ (x, y) takie, że (f (y) − f (x)) g 0 (ξ) = (g(y) − g(x)) f 0 (ξ). Wykorzystując założenie o niezerowaniu się pochodnej funkcji g przepisujemy powyższą równość w postaci f (y) − f (x) f 0 (ξ) f (x) − f (y) = = 0 . g(x) − g(y) g(y) − g(x) g (ξ) Zatem z (15.20) wnosimy, że dla x, y ∈ (a, c) f (y) − f (x) f (x) − f (y) = < q. g(x) − g(y) g(y) − g(x) (15.21) Rozważmy przypadek założenia (15.12). Przechodząc ze zmienną y w (15.21) do granicy w a dostajemy f (x) ¬q g(x) dla x ∈ (a, c), skąd natychmiast wynika (15.19). Przypadek (15.13) jest nieco bardziej zagmatwany. Dowód zaprezentujemy przy założeniu limx→a g(x) = ∞. Rozumowanie dla limx→a g(x) = −∞ jest analogiczne. Zauważmy najpierw, że z limx→a g(x) = ∞ znajdziemy c0 ∈ (a, c) takie, że g(x) > 0 dla x < c0 . Założenie o niezerowaniu się pochodnej funkcji g implikuje, że g jest funkcją monotoniczną, a w konsekwencji, ze względu na założenie limx→a g(x) = ∞, jest funkcją silnie malejącą. Zatem g(x) − g(y) > 0. Mnożąc (15.21) przez g(x) − g(y) i przenosząc f (y) na prawą stronę dostajemy f (x) < f (y) + q (g(x) − g(y)) = qg(x) + f (y) − qg(y). Dla x ∈ (a, c0 ) mamy g(x) > 0, więc dzieląc ostatnią nierówność przez g(x) dostajemy f (x) f (y) g(y) <q+ −q . g(x) g(x) g(x) Ze względu na założenie limx→a g(x) = ∞, dla zadanego > 0 i przy ustalonym y ∈ (a, c) znajdziemy c00 ∈ (a, c0 ) takie, że dla x ∈ (a, c00 ) f (y) g(y) −q < . g(x) g(x) 244 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Zatem z ostatnich dwóch nierówności dla x ∈ (a, c00 ) i dowolnego > 0 mamy f (x) < q + . g(x) Ze względu na dowolność > 0 dla x ∈ (a, c00 ) mamy f (x) ¬ q, g(x) skąd wnosimy (15.19) również dla przypadku założenia (15.13). Dowód własności (15.17) jest podobny. Pozostawiamy go jako ćwiczenie. Regułę de l’Hospitala zaprezentowaliśmy dla granicy w lewym końcu przedziału. Oczywiście analogiczna reguła obowiązuje również dla prawego końca przedziału, a tym samym dla granicy lewostronnej, prawostronnej i zwykłej granicy. Przykład 15.10.7 Granica limx→0 sinx x nie daje się policzyć z twierdzenia o granicy ilorazu, bo mianownik zmierza do zera. Ponieważ jednak również licznik zmierza do zera oraz tak licznik jak i mianownik są różniczkowalne w otoczeniu zera, a mianownik ma pochodną stale równą jeden, więc możemy zastosować regułę de l’Hospitala. Dostajemy sin x (sin x)0 cos x cos 0 = lim = lim = = 1. x→0 x x→0 x→0 x0 1 1 lim 15.11 Różniczkowanie funkcji odwrotnej 15.11.1 Wzór na pochodną funkcji odwrotnej Twierdzenie 15.11.1 Załóżmy, że f : (a, b) → R jest funkcją różniczkowalną oraz f 0 (x) 6= 0 dla wszystkich x ∈ (a, b). Wtedy f jest bijekcją przedziału (a, b) w pewien przedział (c, d). Co więcej, bijekcja odwrotna f −1 : (c, d) → (a, b) jest różniczkowalna oraz 1 (f −1 )0 (f (x)) = 0 (15.22) f (x) dla wszystkich x ∈ (a, b). Dowód: Z wniosku 15.10.3 wnosimy, że f 0 jest wszędzie dodatnia lub wszędzie ujemna, zatem z tw. 15.10.1 funkcja jest silnie rosnąca lub silnie malejąca. W szczególności jest zatem injekcją. Niech Γ := im f będzie obrazem przedziału (a, b) w funkcji f . Ponieważ zbiory spójne w R pokrywają się z przedziałami (wn. 11.4.4), z tw. 11.4.5 wnosimy, że Γ jest również przedziałem. Pokażemy, że przedział ten jest otwarty. Rzeczywiście, jeśli d jest lewym lub prawym końcem przedziału Γ i d ∈ Γ, to d jest elementem największym lub najmniejszym w Γ. Równocześnie d = f (t) dla pewnego t ∈ (a, b). Wybierzmy t0 , t00 ∈ (a, b) takie, że t0 < t < t00 . Z monotoniczności f mamy f (t0 ) < d < f (t00 ) lub f (t0 ) > d > f (t00 ). Ponieważ f (t0 ), f (t00 ) ∈ Γ, wykluczone jest by d było elementem największym lub najmniejszym w Γ. Zatem Γ jest przedziałem otwartym. Przyjmijmy, że Γ = (c, d). Ustalmy x ∈ (a, b) oraz połóżmy y := f (x). Wtedy x = f −1 (y). Niech k będzie takie, że y + k ∈ (c, d). Połóżmy h := f −1 (y + k) − f −1 (y). Wtedy f −1 (y + k) = f −1 (y) + h = x + x, zatem y + k = f (x + h). Mamy f −1 (y + k) − f −1 (y) h f −1 (y + k) − f −1 (y) = = = k (y + k) − y f (x + h) − f (x) 1 f (x+h)−f (x) h . 15.11. RÓŻNICZKOWANIE FUNKCJI ODWROTNEJ 245 Zauważmy, że jeśli k → 0 to również h → 0. Zatem przechodząc w powyższej równości z k do granicy w zerze dostajemy 1 (f −1 )0 (y) = f 0 (x) co dowodzi różniczkowalności f −1 oraz równości (15.22). 15.11.2 Pochodna funkcji logarytmicznej Stosując twierdzenie 15.11.1 do funkcji wykładniczej dostajemy twierdzenie o różniczkowaniu funkcji logarytmicznej. Twierdzenie 15.11.2 Funkcja ln : R+ → R jest funkcją różniczkowalną oraz 1 . x (ln x)0 = (15.23) Dowód: Z wniosku 15.5.3 wiemy pochodną funkcji x → ex jest ona sama. Ponieważ funkcja wykładnicza nie przyjmuje wartości zero, możemy do niej zastosować twierdzenie 15.11.1. Funkcją odwrotną do funkcji wykładniczej jest funkcja logarytmiczna x → ln x, zatem funkcja ta jest różniczkowalna oraz (ln x)0 (ex ) = 1 1 = x. x 0 (e ) e Przyjmując y := ex dostajemy zatem 1 y co pokrywa się ze wzorem (15.23), gdyż w obu wzorach występujące w nich zmienne są związane. (ln y)0 = 15.11.3 Funkcje kołowe (odwrotne do trygonometrycznych) Funkcje sin, cos i tg nie są bijekcjami, więc nie mają funkcji odwrotnych. Jednak po zawężeniu do odpowiednio małego przedziału stają się bijekcjami. Zwyczajowo rozważamy zawężenia sin|[−π/2,π/2] , cos|[0,π] , tg|[−π/2,π/2] . Pochodne tych funkcji na wnętrzach tych przedziałów są niezerowe, zatem zawężęnia do wnętrz są odwracalne. Łatwo pokazać, że w konsekwencji odwracalne są również zawężenia do przedziałów domkniętych. Definicja 15.11.3 Funkcje odwrotne do funkcji sin|[−π/2,π/2] , cos|[0,π] , tg|[−π/2,π/2] oznaczamy odpowiednio arc sin, arc cos i arc tg. Nazywamy je funkcjami kołowymi lub cyklometrycznymi. Jako prosty wniosek z tw. 15.11.1 dostajemy następujące twierdzenie Twierdzenie 15.11.4 Funkcja arc sin : [−1, 1] → [−π/2, π/2] jest różniczkowalna dla x ∈ (−1, 1) oraz (arc sin x)0 = √ 1 . 1 − x2 Funkcja arc cos : [−1, 1] → [0, π] jest różniczkowalna dla x ∈ (−1, 1) oraz (arc cos x)0 = − √ 1 . 1 − x2 Funkcja arc tg : R → (−π/2, π/2) jest różniczkowalna dla x ∈ R oraz (arc tg x)0 = 1 . 1 + x2 246 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Funkcje kołowe w programie Mathematica oznaczane są ArcSin, ArcCos, ArcTan. 15.11.4 Pochodna funkcji potęgowej Wiemy już, że dla n ∈ N1 mamy (xn )0 = nxn−1 . Wzór ten uogólnić można na przypadek funkcji x → xα dla dowolnego α ∈ R. Twierdzenie 15.11.5 Dla dowolnego α ∈ R funkcja potęgowa R+ 3 x 7→ xα ∈ R+ jest różniczkowalna oraz (xα )0 = αxα−1 . Dowód: Ponieważ xα = eα ln x , więc funkcja x 7→ xα jest złożeniem funkcji x 7→ α ln x oraz funkcji u 7→ eu . Zatem z twierdzenia o różniczkowaniu złożenia funkcji mamy (xα )0 = eα ln x α α = xα = αxα−1 . x x 15.12 Pochodne wyższych rzędów 15.12.1 n-ta pochodna Jeśli pochodna f 0 funkcji f sama ma pochodną, to nazywamy ją drugą pochodną funkcji f i oznaczamy f 00 . Proces brania kolejnych pochodnych możemy kontynuować. Precyzyjniej, definicję różniczkowalności i pochodnej rozszerzamy rekurencyjnie w następujący sposób. Definicja 15.12.1 Mówimy, że funkcja f : (a, b) → Rm jest 1-różniczkowalna jeśli jest różniczkowalna. Jej pochodną f 0 nazywamy pierwszą pochodną i zapisujemy jako f (1) . Mówimy, że funkcja f jest n-różniczkowalna jeśli jej (n − 1)-sza pochodna f (n−1) jest różniczkowalna. Pochodną f (n−1) nazywamy n-tą pochodną funkcji f i zapisujemy jako f (n) . Dla małych n zamiast f (n) piszemy czasem f 00 , f 000 itd. Dodatkowo wygodnie jest samą funkcję nazywać zerową pochodną i zapisywać jako f (0) := f . Definicja 15.12.2 Mówimy, że funkcja f : (a, b) → Rm jest klasy C n jeżeli jest n-różniczkowalna we wszystkich punktach przedziału (a, b) oraz f (n) jest ciągła. Zbiór takich funkcji oznaczamy C n ((a, b), Rm ). W programie Mathematica n-tą pochodną funkcji f zmiennej x obliczamy używając instrukcji D[f[x],{x,n}] Na przykład drugą pochodną funkcji f (x) := obliczymy pisząc 1 ln 4 x2 − 1 x2 + 1 15.12. POCHODNE WYŻSZYCH RZĘDÓW 247 Rysunek 15.7: Wykres funkcji f (niebieski), prostej stycznej do wykresu f w punkcie x0 (fioletowy) i paraboli stycznej do wykresu w punkcie x0 (zielony). D[(1/4) Log[(x^2 - 1)/(x^2 + 1)], {x,2}] Jako wynik program Mathematica zwraca skomplikowane wyrażenie, ale po zastosowaniu do niego Simplify dostajemy −3x4 − 1 2. (x4 − 1) Aproksymacja liniowa poprzez różniczk˛e jest prosta, ale cz˛esto nie jest wystarczajaco ˛ dokładna. Możemy wtedy rozważać aproksymacj˛e krzywa˛ drugiego stopnia (parabola)˛ zadana˛ wzorem y = a0 + a1 h + a2 h2 gdzie h = x − x0 jest przyrostem zmiennej niezależnej (rys. 15.7). Możemy też przybliżać wielomianem n-ego stopnia postaci W (h) := a0 + a1 h + a2 h2 + . . . + an hn . Różnica f (x) − W [h) = f (x0 + h) − a0 + a1 h + a2 h2 + . . . + an hn powinna być o(hn ), bo oczekujemy bł˛edu, który szybciej zmierza do zera niż wielomian aproksymacyjny. Pokażemy, że jeśli funkcja r jest n-różniczkowalna w zerze, to własność r(h) = o(hn ) jest równoważna zerowaniu si˛e pochodnych r do n-tej włacznie, ˛ tzn. warunkowi r(0) = r0 (0) = r00 (0) = . . . = r(n) (0) = 0. W odniesieniu do naszego problemu aproksymacyjnego oznacza to, że funkcja h 7→ f (x0 + h) − W (h) powinna mieć zerowe pochodne w zerze do n-tej włacznie ˛ co jest równoważne postulatowi by funkcje h 7→ f (x0 + h) i h 7→ W (h) miały te same pochodne do n-tej włacznie. ˛ Jak zobaczymy pochodne wielomianu jest stosunkowo łatwo policzyć: W (i) (0) = i!ai . Zatem tyle musza˛ wynosić pochodne funkcji h 7→ f (x0 + h) w zerze. Sa˛ one równe pochodnym x 7→ f (x) w x0 , zatem poszukiwana aproksymacja ma postać f (x0 + h) = f (x0 ) + f 0 (x0 ) f 00 (x0 ) 2 f (n) (x0 ) n h+ h + ... + h + r(h) 1! 2! n! gdzie r(h) = o(hn ). Otrzymany w ten sposób wielomian aproksymacyjny nazywany jest wielomianem Taylora funkcji f w x0 , bo pochodzi od angielskiego matematyka Brooka Taylora (rys. 15.8). 248 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Rysunek 15.8: Brook Taylor, 1685-1731. Źródło: Wikipedia Twierdzenie 15.12.3 Wielomian W : R 3 x 7→ a0 + a1 h + a2 h2 + . . . + an hn ∈ R. (15.24) jest funkcją i-różniczkowalną dla wszystkich i ∈ N oraz W (i) (0) = i!ai (15.25) gdzie przyjmujemy ai = 0 dla i > n. Dowód: Pokażemy indukcyjnie, że dla k ∈ N zachodzi ogólniejszy wzór W (k) (x) = n X i=k i! ai xi−k . (i − k)! (15.26) Rzeczywiście, dla k = 0 wzór (15.26) pokrywa się z definicją (15.24) wielomianiu W . Natomiast jeśli (15.26) zachodzi dla pewnego k, to biorąc pochodną obu stron dostajemy W (k+1) (x) = W (k) 0 (x) = k!ak + n X i=k+1 = n X i=k+1 i! ai xi−k (i − k)! i! (i − k)ai xi−k−1 = (i − k)! Podstawiając we wzorze (15.26) za x zero dostajemy (15.25). 15.12.2 Wielomian Taylora Niech f : (a, b) → R będzie n-różniczkowalna w x0 ∈ (a, b). n X i=k+1 !0 0 = (k!ak ) + n X i=k+1 i! (ai xi−k )0 (i − k)! i! ai xi−(k+1) . (i − (k + 1))! 15.12. POCHODNE WYŻSZYCH RZĘDÓW 249 Definicja 15.12.4 Wielomianem Taylora funkcji f w punkcie x0 stopnia n nazywamy wielomian Txn0 f : R 3 h 7→ f (x0 ) + f 0 (x0 ) f 00 (x0 ) 2 f (n) (x0 ) n h+ h + ... + h ∈ R. 1! 2! n! Z twierdzenia 15.12.3 łatwo wyprowadzamy następujący wniosek. Wniosek 15.12.5 Funkcja f i jej wielomian Taylora Txn0 f mają takie same pochodne do n-tej włącznie odpowiednio w zerze i w x0 , tzn. dla i = 0, 1, 2, . . . n zachodzi Txn0 f (i) (0) = f (i) (x0 ). 15.12.3 n-płaskość w zerze. Uogólnieniem pojęcia płaskości w zerze jest n-płaskość w zerze. Definicja 15.12.6 Mówimy, że funkcja r : R−→ ◦ R określona w otoczeniu zera jest n-płaska w zerze, jeżeli r(h) = o(hn ) przy h → 0. Lemat 15.12.7 Jeśli W : R → R jest wielomianem stopnia co najwyżej n oraz W (h) =0 h→0 hn lim (15.27) to W = 0. Dowód: Dowód poprowadzimy indukcyjnie względem n. Rozważmy najpierw przypadek n = 0. Wtedy W (h) = a0 jest wtedy funkcją stałą. Z (15.27) mamy W (h) 0= = lim a0 = a0 , h→0 h0 skąd W = 0. Przyjmijmy z kolei, że lemat jest spełniony dla m < n i rozważmy wielomian W : R 3 h 7→ a0 + a1 h + a2 h2 + . . . + an hn ∈ R spełniający (15.27). Mamy a0 = lim W (h) = lim h→0 h→0 W (h) n W (h) h = lim lim hn = 0. h→0 hn h→0 hn Zatem W (h) = a1 h + a2 h2 + . . . + an hn = hW1 (h), gdzie W1 (h) := a1 + a2 h + . . . + an hn−1 . Ale W1 jest wielomianem stopnia co najwyżej (n − 1) oraz W1 (h) hW1 (h) W (h) lim = lim = lim = 0, h→0 hn−1 h→0 h→0 hn hn zatem z założenia inducyjnego W1 = 0, skąd W = 0. 250 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Rysunek 15.9: Joseph Louis Lagrange (1736 - 1813) i Giuseppe Peano (1858 - 1932). Źródło: Wikipedia 15.13 Wzory Taylora i szereg Taylora. 15.13.1 Wzór Taylora z resztą Peano. Przedstawimy teraz dwa, powiązane ze sobą twierdzenia. Pierwsze uogólnia uwagę 15.2.12 na przypadek n-płaskości w zerze. Drugie precyzuje jak wielomian Talora funkcji n-różniczkowalnej przybliża samą funkcję. Pochodzą one od włoskiego matematyka Giuseppe Peano (rys. 15.9). Twierdzenie 15.13.1 (Peano o funkcji n-płaskiej) Niech r : R−→ ◦ R będzie funkcją n-różniczkowalną w zerze. Funkcja ta jest n-płaska w zerze wtedy i tylko wtedy gdy r(i) (0) = 0 dla i = 0, 1, 2, . . . n. (15.28) Twierdzenie 15.13.2 (wzór Taylora z resztą Peano) Niech f : (a, b) → R będzie funkcją (n − 1)-różniczkowalną na przedziale (a, b) oraz n-różniczkowalną w x0 ∈ (a, b). Wtedy istnieje dokładnie jeden wielomian W : R → R stopnia co najwyżej n taki, że dla h ∈ (a − x0 , b − x0 ) f (x0 + h) = W (h) + r(h) dla pewnej n-płaskiej w zerze funkcji r : R−→ ◦ R. Co więcej, wielomianem tym jest Txn0 f , czyli wielomian Taylora funkcji f w x0 stopnia n. W szczególności h 7→ f (x0 + h) − Txn0 f (h) jest funkcją n-płaską w zerze. Dowód: (twierdzenia 15.13.1 i twierdzenia 15.13.2) Najpierw pokażemy indukcyjnie, że warunek (15.28) implikuje n-płaskość w zerze funkcji r. Dla n = 1 wynika to wprost z uwagi 15.2.12. Załóżmy, że implikacja zachodzi dla m < n oraz warunek (15.28) jest spełniony. Ponieważ r(0) = 0, z uwagi 15.2.4 wnosimy, że wystarczy pokazać, iż r(h) = 0. h→0 hn lim (15.29) Wtedy (r0 )(i) (0) = 0 dla i = 0, 1, 2, . . . n − 1, a zatem z założenia indukcyjnego zastosowanego do funkcji r0 wnosimy, że 15.13. WZORY TAYLORA I SZEREG TAYLORA. 251 r0 (h) = o(hn−1 ) przy h → 0. Zatem również z uwagi 15.2.4 wynika, iż r0 (h) = 0, h→0 hn−1 lim a stąd, przy wykorzystaniu reguły de l’Hospitala r0 (h) 1 r(h) r0 (h) = lim = lim n−1 = 0, n n−1 h→0 nh h→0 h n h→0 h lim co dowodzi (15.29). Rozważmy z kolei funkcję f spełniającą założenia twierdzenia 15.13.2. Niech r(h) := f (x0 + h) − Txn0 f (h). Wtedy (i) r (0) = 0 dla i = 0, 1, 2, . . . n. Zatem na mocy już udowodnionej części twierdzenia 15.13.1 funkcja r jest n-płaska w zerze. Dowodzi to, że za postulowany w twierdzeniu 15.13.2 wielomian W można wziąć wielomian Taylora Txn0 f . W szczególności zatem taki wielomian W istnieje, choć nie możemy jeszcze twierdzić, że jest wyznaczony jednoznacznie. Aby pokazać jednoznaczność załóżmy, że istnieją wielomiany W1 i W2 stopnia co najwyżej n oraz n-płaskie w zerze funkcje r1 i r2 takie, że f (x0 + h) = Wi (h) + ri (h) przy h → 0. W szczególności W1 (h) + r1 (h) = W2 (h) + r2 (h). Wielomian W (h) := W1 (h) − W2 (h) spełnia zatem W (h) = r2 (h) − r1 (h). Z wniosku 15.2.6 wynika, że W (h) = o(hn ) przy h → 0. W szczególności z uwagi 15.2.4 wnosimy, że W (h) = 0, h→0 hn lim a więc lemat 15.12.7 implikuje, że W = 0. Pozostaje jeszcze uzupełnić dowód twierdzenia 15.13.1. Niech r : R−→ ◦ R będzie funkcją n-różniczkowalną i n-płaską w zerze. Z udowodnionej już części twierdzenia 15.13.2 wiemy, że h 7→ r(h) − T0n r(h) jest funkcją n-płaską w zerze. Zatem z wniosku 15.2.6 wnosimy, że wielomia T0n r = r − (r − T0n r) jest n-płaska w zerze. Z uwagi 15.2.4 oraz lematu 15.12.7 wnosimy, że T0n r =, a stąd, że zachodzi (15.28). 15.13.2 Wzór Taylora z resztą Lagrange’a Szczególnie interesujacy ˛ jest przypadek, gdy funkcja f : (a, b) → R jest n-różniczkowalna dla każdego n ∈ N. Wtedy możemy zbudować wielomian Taylora Txn0 f dowolnie wysokiego stopnia. Kolejne wielomiany Taylora tworza˛ wi˛ec sumy cz˛eściowe szeregu ∞ X f (i) (x0 ) i=0 i! hi . (15.30) Naturalne jest zatem pytanie czy i kiedy ten szereg jest zbieżny do f (x0 + h). W tym celu trzeba zbadać kiedy rn (h) := f (x0 + h) − n X f (i) (x0 ) i=0 i! hi = f (x0 + h) − Txn0 f (h), zwane n-ta˛ reszta,˛ zmierza do zera przy n zmierzajacym ˛ do nieskończoności. W pierwszej chwili może si˛e wydawać, że wzór Taylor z reszta˛ Peano pozwoli odpowiedzieć na to pytanie, bo ze wzoru tego wiemy, że rn (h) = f (x0 + h) − Txn0 f (h) = o(hn ) przy h → 0, 252 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. zatem na podstawie wniosku 15.2.5 rn (h) = f (x0 + h) − Txn0 f (h) = ϕ(h)hn (15.31) n dla pewnej ciagłej ˛ i zerujacej ˛ si˛e w zerze funkcji ϕ. Ponieważ dla |h| < 1 wyrażenie h zmierza do zera przy n zmierzajacym ˛ do nieskończoności, może si˛e wydawać, że dowodzi to iż n-ta reszta rn (h) zmierza do zera. Problem w tym, że funkcja ϕ we wzorze (15.31) zależy od n, zatem wzór ten powinien być zapisany jako rn (h) = f (x0 + h) − Txn0 f (h) = ϕn (h)hn . Widać teraz, że chociaż hn zmierza do zera przy n daż ˛ acym ˛ do nieskończoności, to o granicy limn→∞ ϕn (h) nic nie potrafimy powiedzieć i nasze rozumowanie si˛e rozsypuje. Aby je uratować musimy coś wi˛ecej wiedzieć o reszcie rn (h). Niech f : (c, d) → R będzie funcją (n + 1)-różniczkowalną. Ustalmy a, b ∈ (c, d) takie, że a < b. Zaczniemy od lematu, który uogólnia twierdzenie Rolle’a (tw. 15.8.3). Lemat 15.13.3 Jeśli f jest n-płaska w a oraz f (b) = 0 to dla każdego i = 1, 2, . . . , n + 1 istnieje ξi ∈ (a, b) takie, że f (i) (ξi ) = 0. Dowód: Z twierdzenia Peano o funkcji płaskiej wnosimy, że f (i) (a) = 0 dla i = 1, 2, . . . n. Dowód poprowadzimy indukcyjnie względem n. Dla n = 0 lemat wynika wprost z twierdzenia Rolle’a (tw. 15.8.3). Załóżmy zatem, że twierdzenie zachodzi dla m < n. Stosując je dla m = n otrzymujemy istnienie potrzebnych ξi dla i = 1, 2, . . . , n. W szczególności f (n) (ξn ) = 0. Ponieważ również f (n) (a) = 0, więc stosując twierdzenie Rolle’a do f (n) na przedziale [a, ξn ] znajdziemy 0 ξn+1 ∈ (a, ξn ) takie, że f (n) (ξn+1 ) = 0. Zatem f (n+1) (ξn+1 ) = 0. Uogólnimy teraz twierdzenie o wartości średniej. Twierdzenie 15.13.4 Jeśli f jest n-płaska w a to istnieje ξ ∈ (a, b) takie, że f (b) = Dowód: Połóżmy M := f (b) (b−a)n+1 f (n+1) (ξ) (b − a)n+1 . (n + 1)! i rozważmy funkcję g : t 7→ f (t) − M (t − a)n+1 . Prostym rachunkiem sprawdzamy, że g(a) = g(b) = 0 oraz g (i) (a) = 0 dla i = 1, 2, . . . n. Zatem z twierdzenia Peano o funkcji płaskiej g spełnia założenia lematu 15.13.3. Istnieje więc ξ ∈ (a, b) takie, że g (n+1) (ξ) = 0. Ale g (n+1) (t) = f (n+1) (t) − (n + 1)!M , więc f (n+1) (ξ) = (n + 1)!M , skąd wynika teza. Jesteśmy teraz gotowi podać wzór Taylora ze zmodyfikowaną resztą, zwaną resztą Lagrange’a. Twierdzenie to pochodzi od francuskiego matematyka włoskiego pochodzenia, J.L. Lagrange’a (rys. 15.9). Twierdzenie 15.13.5 (wzór Taylora z resztą Lagrange’a) Niech f : (c, d) → R będzie funcją n + 1różniczkowalną. Niech a, b ∈ (c, d) spełniają a < b. Wtedy istnieje ξ ∈ (a, b) takie, że f (b) = Tan f (b − a) + f (n+1) (ξ) (b − a)n+1 . (n + 1)! (15.32) Przyjmując oznaczenie h := b − a oraz rozpisując wielomian Taylora możemy też powyższą tezę zapisać jako f (a + h) = f (a) + f 0 (a) f 00 (a) 2 f (n) (a) n f (n+1) (ξ) n+1 h+ h + ... + h + h . 1! 2! n! (n + 1)! Dowód: Rozważmy funkcję r : x 7→ f (x) − Tan f (x − a). Funkcja ta jest n-płaska w a, bo jej pochodne w a do n-tej włącznie się zerują. Zatem z twierdzenia 15.13.4 istnieje ξ ∈ (a, b) takie, że r(b) = r(n+1) (ξ) (b − a)n+1 . (n + 1)! 15.13. WZORY TAYLORA I SZEREG TAYLORA. 253 Ale r(n+1) (x) = f (n+1) (x), bo (n + 1)-sza pochodna wielomianu stopnia co najwyżej n zeruje się, Zatem f (n+1) (ξ) (b − a)n+1 = r(b) = f (b) − Tan f (b − a), (n + 1)! skąd wynika (15.32). W programie Mathematica n-ty wielomian Taylora funkcji f w punkcie u wyliczony dla argumentu (x − u) uzyskamy instrukcją Series[f[x],{x,u,n}] Na przykład pisząc Series[Exp[x], {x, 0, 6}] otrzymujemy 1+x+ x2 x3 x4 x5 x6 7 + + + + + O [x] 2 6 24 120 720 7 Wyrażenie O [x] jest tutaj niezbyt fortunnym, choć dającym się wytłumaczyć, sposobem zapisania reszty Lagrange’a. 15.13.3 Punkty przegięcia Definicja 15.13.6 Mówimy, że funkcja f : (a, b) → R ma punkt przegięcia w x0 ∈ (a, b) jeżeli f jest różniczkowalna w x0 oraz istnieje δ > 0 taka, że dla 0 < |h| < δ funkcja h 7→ sgn [∆x0 f (h) − f 0 (x0 )h] sgn h jest stała, to znaczy stale równa jeden lub stale równa minus jeden. Twierdzenie 15.13.7 Niech f : (a, b) → R będzie klasy C n oraz niech f (i) (x0 ) = 0 dla i = 1, 2, . . . n−1 i f (n) (x0 ) 6= 0. Jeśli n jest parzyste, to f ma w x0 maksimum lokalne gdy f (n) (x0 ) < 0 bądź minimum lokalne gdy f (n) (x0 ) > 0. Natomiast jeśli n jest nieparzyste, to f ma w x0 punkt przegięcia. Dowód: Ponieważ f jest klasy C n , więc f (n) jest funkcją ciągłą, zatem w pewnym otoczeniu punktu x0 ma stały znak. Wybierzmy δ > 0 tak, by sgn f (n) (x) było stałe dla 0 < |x − x0 | < δ. Załóżmy, że 0 < |h| < δ. Ze wzoru Taylora z resztą Lagrange’a dla pewnego θ ∈ (0, 1) f (n) (x0 + θh) n f (x0 + h) − f (x0 ) = h , n! skąd otrzymujemy tezę, ponieważ znak wyrażenia f (n) (x0 + θh) jest stały. 15.13.4 Szereg Taylora Dysponujemy teraz narzędziami do badania zbieżności szeregu (15.30). Zacznijmy od formalnej definicji. Definicja 15.13.8 Mówimy, że funkcja f : (a, b) → R jest klasy C ∞ jeżeli jest klasy C n dla każdego n ∈ N. 254 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Definicja 15.13.9 Niech f : (a, b) → R będzie funkcją klasy C ∞ i niech x0 ∈ (a, b). Szereg formalny (bez pytania o zbieżność) ∞ X f (i) (x0 ) i h i! i=0 nazywamy szeregiem Taylora funkcji f w punkcie x0 dla argumentu h i oznaczamy Tx0 f (h). Przykład 15.13.10 Pochodną rzeczywistej funkcji wykładniczej exp : R 3 x → ex ∈ R jest ona sama. Zatem wszystkie jej pochodne są jej równe. W szczególności funkcja wykładnicza jest klasy C ∞ oraz exp(n) (0) = exp(0) = 1. Zatem łatwo sprawdzamy, że szeregiem Taylora rzeczywistej funkcji wykładniczej w zerze jest ∞ X 1 i h, i! i=0 a więc ten sam szereg, który posłużył nam do zdefiniowania funkcji wykładniczej. O szeregu tym wiemy, że jest zbieżny do exp(h). Wzór Taylora z resztą Lagrange’a podpowiada nam jak zagwarantować zbieżność szeregu Taylora. Twierdzenie 15.13.11 Niech f : (a, b) → R będzie klasy C ∞ i niech x0 ∈ (a, b). Jeżeli istnieją stałe > 0 oraz M > 0 takie, że dla wszystkich n ∈ N |f (n) (x)| ¬ M dla x ∈ (x0 − , x0 + ), to dla |h| < szereg Taylora Tx0 f (h) jest zbieżny do f (x0 + h), co możemy też zapisać w postaci f (x0 + h) = ∞ X f (i) (x0 ) i=0 i! hi . Dowód: Niech |h| < i niech sn := Txn0 f (h) oraz rn := f (a + h) − sn . Ze wzoru Taylora z resztą Lagrange’a (tw. 15.13.5) dla pewnego ξ ∈ (a, b) mamy (n+1) f (ξ) n+1 M n+1 |rn | = h . ¬ n! |h| n! Prawa strona powyższej nierówności zmierza do zera przy n dążącym do nieskończoności. Zatem limn→∞ rn = 0, skąd limn→∞ sn = f (a + h). Nie w każdej sytuacji powyższe twierdzenie działa. Czasami, tak jak w poniższym przykładzie, musimy sobie radzić na piechotę. 15.13. WZORY TAYLORA I SZEREG TAYLORA. 255 Przykład 15.13.12 Skonstruujemy szereg Taylora funkcji ln w otoczeniu jedynki. Indukcyjnie sprawdzamy, że dla n­1 (n − 1)! ln(n) (x) = (−1)n−1 . xn Zatem ln(n) (1) = (−1)n (n − 1)!. Stąd (T1 ln)(h) = ln 1 + ∞ X (−1)i−1 (i − 1)! i=1 i! hi = ∞ X (−1)i−1 i=1 i hi . Ze wzoru Taylora z resztą Lagrange’a mamy dla |h| < 1 i pewnego ξ pomiędzy 1 i 1 + h n X (−1)n (−1)i−1 i 1 1 |h|n+1 1 n+1 ln(1 + h) − = h ¬ ¬ . h n+1 n+1 n+1 i (n + 1)(1 + ξ) n + 1 (1 − |ξ|) n + 1 (1 − |h|) i=1 Ponieważ prawa strona otrzymanej nierówności zmierza do zera przy n zmierzającym do nieskończoności otrzymujemy n X (−1)i−1 i lim ln(1 + h) − h=0 n→∞ i i=1 Zatem dla |h| < 1 szereg T1 ln(h) jest zbieżny oraz ln(1 + h) = h h2 h3 − + − .... 1 2 3 256 ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI. Rozdział 16 Całka oznaczona 16.1 Całka Riemanna funkcji jednej zmiennej 16.1.1 Pole obszaru. Gdy potrzebujemy pokryć pewien obszar (na przykład plac lub podłog˛e łazienki) kwadratowymi płytkami o boku jednostkowej długości (na przykład 10cm), musimy umieć policzyć ile płytek do tego celu potrzebujemy. Zakładajac, ˛ że obszar ma kształt prostokata ˛ o bokach długości m, n ∈ N łatwo stwierdzamy, że potrzebujemy mn płytek. Jeśli boki prostokata ˛ nie sa˛ liczbami całkowitymi lub obszar ma kształt inny niż prostokatny, ˛ sprawa robi si˛e bardziej skommplikowana, bo bez ci˛ecia płytek sobie nie poradzimy. Zawsze jednak możemy zapytać ile maksymalnie płytek daje si˛e ułożyć w granicach obszaru tak, by nie zachodziły one na siebie, a także ile minimalnie potrzeba płytek, by pokryć cały obszar (rys. 16.1). Te dwie liczby stanowia˛ oszacowanie od dołu i od góry tego co intuicyjnie określamy jako powierzchni˛e obszaru. Lepsze przybliżenia powierzchni dostaniemy posługujac ˛ si˛e płytkami o mniejszym boku. Kontynuujac ˛ proces szacowania powierzchni przy użyciu płytek o coraz krótszych bokach otrzymujemy dwa ciagi ˛ szacujace ˛ powierzchni˛e obszaru: jeden rosnacy ˛ i szacujacy ˛ powierzchni˛e od dołu, drugi malejacy ˛ i szacujacy ˛ powierzchni˛e od góry. Wiemy, że takie ciagi, ˛ jako monotoniczne i ograniczone, maja˛ granice. Intuicja podpowiada nam, że oba te ciagi ˛ maja˛ t˛e sama˛ granic˛e i jest nia˛ pole powierzchni rozważanego obszaru. Intuicja jest tu zawodna, bo można podać przykład zbiorów, dla których granice te sa˛ różne, co oznacza, że intuicyjne poj˛ecie powierzchni obszaru nie zawsze ma sens. Do zagadnień zwiazanych ˛ z definicja˛ pola powierzchni podzbioru R2 (ogólniej miary podzbioru Rd ) jeszcze wrócimy, a na razie ograniczymy si˛e do szczególnego przypadku obszaru postaci { (x, y) ∈ R2 | a ¬ x ¬ b, 0 ¬ y ¬ f (x) }, gdzie a < b sa˛ liczbami rzeczywistymi, a f : [a, b] → R∗ jest pewna˛ funkcja.˛ Pole powierzchni takiego obszaru można oszacować dzielac ˛ przedział [a, b] na mniejsze przedziały i sumujac ˛ pola prostokatów ˛ zbudowanych nad tymi przedziałami tak, by mieściły si˛e pod wykresem funkcji lub by pokrywały obszar. Otrzymujemy w ten sposób odpowiednio przybliżenie pola powierzchini od dołu lub od góry (rys. 16.2). 16.1.2 Przedziały w R i ich podziały. W niniejszym rozdziale rozważać będziemy przedziały zwarte w R, a więc przedziały postaci [a, b], gdzie a, b ∈ R i a < b. Zbiór takich przedziałów oznaczać będziemy Przedz(R). Liczby a oraz b nazywamy końcami przedziału [a, b]. Długością przedziału I = [a, b] ∈ Przedz(R) nazywamy liczbę b − a. Jest to liczba dodatnia, którą oznaczać będziemy len I. Mówimy, że dwa przedziały I, J ∈ Przedz(R) są rozgraniczone jeżeli mają rozłączne wnętrza. Skończony zbiór przedziałów P ⊂S Przedz(R) nazywamy podziałem przedziału I ∈ Przedz(R), jeżeli dowolne dwa różne elementy P są rozgraniczone oraz I = P. Średnicą podziału P nazywamy liczbę δ(P) := max { len P | P ∈ P }. Zbiór wszystkich podziałów przedziału I oznaczać będziemy Podz(I). 257 258 ROZDZIAŁ 16. CAŁKA OZNACZONA Rysunek 16.1: Przybliżanie pola figury poprzez zliczanie kwadratów wpisanych w figurę i pokrywających figurę w sieci kwadratowej na płaszczyźnie. Rysunek 16.2: Po lewej obszar pod wykresem funkcji. Po prawej aproksymacja pola powierzchni tego obszaru od dołu sumą pól prostokątów zawartych w obszarze oraz aproksymacja od góry sumą pól prostokątów pokrywających obszar. 16.1. CAŁKA RIEMANNA FUNKCJI JEDNEJ ZMIENNEJ 259 Niech x : { 0, 1, 2, . . . n } → [a, b] będzie silnie rosnącym, skończonym ciągiem takim, że x0 = a i xn = b. Łatwo sprawdzić, że wtedy rodzina P x := { [xi−1 , xi ] | i = 1, 2, . . . n } jest podziałem przedziału [a, b], zwanym podziałem zadanym ciągiem x. Łatwo zauważyć, że każdy podział P ∈ Podz(I) przedziału I = [a, b] ∈ Przedz(R) jest zadany pewnym ciągiem x : { 0, 1, 2, . . . n } → [a, b]. W istocie ciąg x zadający podział P otrzymamy biorąc zbiór końców przedziałów w P ustawiony w ciąg rosnący. Ciąg ten nazywać będziemy ciągiem zadającym podział P i oznaczać xP . Zatem podziały przedziału I = [a, b] ∈ Przedz(R) możemy utożsamiać ze skończonymi, silnie rosnącymi ciągami liczb rozpoczynającymi się od liczby a i kończącymi się na liczbie b. Uwaga 16.1.1 Jeśli P jest podziałem przedziału I, to len I = X len P. P ∈P Definicja 16.1.2 Niech P 1 , P 2 ∈ Podz(I) będą podziałami przedziału I ∈ Przedz(R). Mówimy, że podział P 2 jest podpodziałem podziału P 1 i piszemy P 2 @ P 1 jeżeli dla każdego przedziału P2 ∈ P 2 istnieje przedział P1 ∈ P 1 taki, że P2 ⊂ P1 . Łatwo zaobserwować, że podział P 2 ∈ Podz(I) jest podpodziałem podziału P 1 ∈ Podz(I) wtedy i tylko wtedy gdy ciąg zadający podział P 1 jest podciągiem ciągu zadającego podział P 2 . Uwaga 16.1.3 Niech P 1 , P 2 będą dwoma dowolnymi podziałami przedziału I ∈ Przedz(R). Istnieje podział P 3 przedziału I taki, że P 3 @ P 1 i P 3 @ P 2 . Dowód: Jako podział P 3 wystarczy wziąć podział zadany przez zbiór końców przedziałów w P 1 ∪ P 2 posortowany w ciąg rosnący. 16.1.3 Całkowalność w sensie Riemanna Niech I = [a, b] ∈ Przedz(R) będzie ustalonym przedziałem, a f : [a, b] → R niech będzie funkcją ograniczoną. Dla podzbioru P ⊂ [a, b] przyjmujemy oznaczenia m(f, P ) := inf { f (x) | x ∈ P }, M (f, P ) := sup { f (x) | x ∈ P }. Zwróćmy uwagę, że ograniczoność funkcji f gwarantuje iż liczby m(f, P ) i M (f, P ) są dobrze określone. Definicja 16.1.4 Niech P będzie podziałem przedziału [a, b]. Wyrażenia X L(f, P) := m(f, P ) len P, P ∈P U (f, P) := X M (f, P ) len P P ∈P nazywamy odpowiednio dolną i górną sumą Darboux dla funkcji f i podziału P. 260 ROZDZIAŁ 16. CAŁKA OZNACZONA Łatwo zauważyć, że jeżeli x : { 0, 1, 2, . . . n } → [a, b] jest ciągiem zadającym podział P, to mamy L(f, P) n X = U (f, P) i=1 n X = m(f, [xi−1 , xi ])(xi − xi−1 ), M (f, [xi−1 , xi ])(xi − xi−1 ). i=1 Jeśli funkcja f ma wartości nieujemne, to iloczyny m(f, [xi−1 , xi ])(xi − xi−1 ) i M (f, [xi−1 , xi ])(xi − xi−1 ) odpowiadaja˛ polu prostokatów ˛ o podstawie [xi−1 , xi ] i wysokości równej odpowiednio kresowi dolnemu i kresowi górnemu funkcji f na przedziale [xi−1 , xi ]. Zatem suma dolna Darboux i suma górna Darboux daja˛ odpowiednio przybliżenie od dołu i od góry pola pod wykresem funkcji f . Definicja 16.1.5 Wyrażenia L(f ) := sup { L(f, P) | P ∈ Podz([a, b]) }, U (f ) := inf { L(f, P) | P ∈ Podz([a, b]) }. nazywamy odpowiednio całką dolną i całką górną funkcji f . Jeżeli L(f ) = U (f ), to funkcję f nazywamy całkowalną Rb w sensie Riemanna, a liczbę L(f ) = U (f ) nazywamy całką Riemanna funkcji f i oznaczamy a f . Zbiór funkcji ograniczonych f : [a, b] → R, które są całkowalne w sensie Riemanna oznaczamy Riem([a, b]). Przykład 16.1.6 Najprostszym przykładem funkcji całkowalnej w sensie Riemanna jest funkcja stała c[a,b] . Rzeczywiście, dla dowolnego przedziału P ⊂ [a, b] mamy m(c[a,b] , P ) = M (c[a,b] , P ) = c, zatem dla dowolnego podziału P ∈ Podz([a, b]) jest X X L(c[a,b] , P) = U (c[a,b] , P) = c len P = c len P = c(b − a). P ∈P P ∈P Zatem L(c[a,b] ) = U (c[a,b] ) = c(b − a) i w konsekwencji Z b c[a,b] = c(b − a). a Przykład 16.1.7 Rozważmy funkcję Dirichleta ( fD : [0, 1] 3 x 7→ 0 x ∈ Q, 1 x∈ 6 Q. Jeśli P ⊂ [0, 1] jest przedziałem o niepustym wnętrzu, to m(fD , P ) = 0 i M (fD , P ) = 1. Stąd dla dowolnego P ∈ Podz([0, 1]) mamy L(fD , P) = 0 i U (fD , P) = 1. W konsekwencji L(fD ) = 0 6= 1 = U (fD ). Zatem funkcja Dirichleta nie jest całkowalna w sensie Riemanna. 16.1.4 Epsilonowe kryterium całkowalności 16.1. CAŁKA RIEMANNA FUNKCJI JEDNEJ ZMIENNEJ 261 Lemat 16.1.8 Jeśli P 1 , P 2 ∈ Podz([a, b]) oraz P 2 @ P 1 , to L(f, P 1 ) ¬ L(f, P 2 ) i U (f, P 2 ) ¬ U (f, P 1 ). Dowód: Niech P ∈ P 1 . Z uwagi 16.1.1 mamy m(f, P ) len P = m(f, P ) X P 0 ⊂P, P 0 ∈P len P 0 = X P 0 ⊂P, P 0 ∈P 2 X m(f, P ) len P 0 ¬ 2 P 0 ⊂P, P 0 ∈P m(f, P 0 ) len P 0 . 2 Sumując lewą i prawą stronę powyższych nierówności dla P ∈ P 1 dostajemy L(f, P 1 ) ¬ L(f, P 2 ). Dowód nierówności dla sum górnych jest analogiczny. Z lematu 16.1.8 i uwagi 16.1.3 dostajemy następujący wniosek Wniosek 16.1.9 Dla dowolnych podziałów P 1 , P 2 ∈ Podz([a, b]) mamy L(f, P 1 ) ¬ U (f, P 2 ). Z powyższgo wniosku dostajemy natychmiast następujący wniosek Wniosek 16.1.10 Dla dowolnej funkcji ograniczonej f : [a, b] → R mamy L(f ) ¬ U (f ). Jesteśmy teraz przygotowani, by pokazać następującą charakteryzację funkcji całkowalnych w sensie Riemanna. Twierdzenie 16.1.11 Funkcja ograniczona f : [a, b] → R jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy dla każdego > 0 istnieje podział P ∈ Podz([a, b]) przedziału [a, b] taki, że U (f, P) − L(f, P) < . (16.1) Dowód: Przyjmijmy najpierw, że f jest całkowalna w sensie Riemanna. Ustalmy > 0. Z definicji całki dolnej i górnej do /2 znajdziemy podziały P 1 , P 2 ∈ Podz([a, b]) takie, że L(f, P 1 ) > L(f ) − oraz U (f, P 2 ) < U (f ) + . 2 2 Na mocy uwagi 16.1.3 możemy wybrać podział P 3 ∈ Podz([a, b]) taki, że P 3 @ P 1 oraz P 3 @ P 2 . Z lematu 16.1.8 oraz z (16.1.4) dostajemy U (f, P 3 ) − L(f, P 3 ) ¬ U (f, P 2 ) − L(f, P 1 ) < U (f ) + − (L(f ) − ) = , 2 2 bo z założenia L(f ) = U (f ). Zatem podział P 3 spełnia wymóg (16.1). Dla dowodu przeciwnej implikacji przyjmijmy nie wprost, że f nie jest całkowalna w sensie Riemanna. Wtedy L(f ) 6= U (f ), zatem z wniosku 16.1.10 wynika, że L(f ) < U (f ). Z definicji sum dolnych i górnych wnosimy, że dla dowolnego P ∈ Podz([a, b]) mamy U (f, P) − L(f, P) ­ U (f ) − L(f ). ) W szczególności wynika stąd, że dla := U (f )−L(f , które na mocy przyjętego założenia jest dodatnie, nie znajdziemy 2 podziału P spełniającego warunek (16.1). A to dowodzi, że implikacja przeciwna również zachodzi. 262 ROZDZIAŁ 16. CAŁKA OZNACZONA 16.2 Własności całki Riemanna 16.2.1 Monotoniczność całki Twierdzenie 16.2.1 Niech f, g : [a, b] → R będą funkcjami ograniczonymi. Jeśli f ¬ g to L(f ) ¬ L(g) oraz U (f ) ¬ U (g). W szczególności, jeśli tak f jak i g są całkowalne w sensie Riemanna, to Z b Z b f¬ a 16.2.2 g. a Przestrzeń wektorowa funkcji całkowalnych w sensie Riemanna. Twierdzenie 16.2.2 Jeśli f, g : [a, b] → R są całkowalne w sensie Riemanna to f + g oraz f − g są całkowalne w sensie Riemanna oraz Z b Z b Z b Z b Z b Z b (f + g) = f+ g i (f − g) = f− g. a a a a a a Ponadto, dla dowolnego α ∈ R funkcja αf jest całkowalna w sensie Riemanna oraz Z b b Z (αf ) = α a f. a Uwaga 16.2.3 Jeśli f : [a, b] → R jest całkowalna w sensie Riemanna, to Z b f ¬ (b − a) sup |f (x)|. a x∈[a,b] Twierdzenie 16.2.4 Przestrzeń Riem([a, b]) funkcji całkowalnych w sensie Riemanna na przedziale zwartym [a, b] z działaniem dodawania funkcji oraz możenia funkcji przez liczbę jest przestrzenią wektorową. Ponadto, odwzorowanie Riem([a, b]) 3 f 7→ ||f || := sup |f (x)| ∈ R∗ x∈[a,b] jest normą, która zadaje w Riem([a, b]) strukturę przestrzeni wektorowej unormowanej, a tym samym strukturę przestrzeni metrycznej. Co więcej, odwzorowanie Z Riem([a, b]) 3 f 7→ b f ∈R a jest odwzorowaniem liniowym oraz Lipschitzowskim ze stałą len[a, b], a więc w szczególności odwzorowaniem ciągłym. 16.2. WŁASNOŚCI CAŁKI RIEMANNA 16.2.3 263 Miarowe kryterium całkowalności. Definicja 16.2.5 Miarą zewnętrzną podzbiorów R nazywamy funkcję P S µ∗ : P(R) 3 E 7→ inf { A∈A len A | A ⊂ Przedz(R) oraz E ⊂ A }. Mówimy, że zbiór E ⊂ R jest miary zero jeżeli µ∗ (E) = 0. Twierdzenie 16.2.6 Miara zewnętrzna ma następujące własności: (i) µ∗ (∅) = 0, (ii) E ⊂ F ⇒ µ∗ (E) ¬ µ∗ (F ), S∞ P∞ (iii) µ∗ ( i=1 Ei ) ¬ i=1 µ∗ (Ei ), Przykład 16.2.7 Zbiorem miary zero jest każdy skończony zbiór punktów. Wniosek 16.2.8 Suma co najwyżej przeliczalnej rodziny zbiorów miary zero jest zbiorem miary zero. Twierdzenie 16.2.9 Funkcja ograniczona f : [a, b] → R jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy zbiór punktów, w których nie jest ciągła ma miarę zero. W szczególności, jeśli f jest ciągła, to jest całkowalna w sensie Riemanna. 16.2.4 Całkowalność złożenia i iloczynu Twierdzenie 16.2.10 Całka Riemanna ma następujące własności: (i) jeśli f ∈ Riem(I) jest całkowalna w sensie Riemanna, a ϕ : R → R jest ciągła, to ϕ ◦ f ∈ Riem(I), (ii) jeśli f, g ∈ Riem(I), to ich ich iloczyn f · g ∈ Riem(I), (i) jeśli f ∈ Riem(I), to |f | ∈ Riem(I). 16.2.5 Całka Riemanna na podprzedziale Definicja 16.2.11 Niech f : R−→ ◦ R będzie funkcją ograniczoną i niech [a, b] ⊂ dom f . Mówimy, że f jest całkowalna w sensie Riemanna na przedziale [a, b], jeżeli zwężenie f|[a,b] jest funkcją całkowalną w sensie Riemanna. W takim Rb przypadku całkę a f|[a,b] nazywamy całką Riemanna funkcji f na przedziale [a, b] lub całką oznaczoną funkcji f od a do b i oznaczamy Z b Z b f := f|[a,b] . a a 264 ROZDZIAŁ 16. CAŁKA OZNACZONA Twierdzenie 16.2.12 Niech f : R−→ ◦ R będzie funkcją ograniczoną i niech [a, b] będzie przedziałem zwartym zawartym w dziedzinie funkcji f . Jeśli P jest podziałem przedziału [a, b] zadanym ciągiem x : { 0, 1, 2, . . . k } → [a, b], to f jest całkowalna w sensie Riemanna na przedziale [a, b] wtedy i tylko wtedy gdy dla każdego i = 1, 2, . . . k funkcja f jest całkowalna w sensie Riemanna na przedziale [xi−1 , xi ]. Co więcej, gdy którykolwiek z tych warunków zachodzi, to Z b f= a 16.2.6 k Z X i=1 xi f. xi−1 Całka oznaczona Definicja 16.2.13 Niech f : R−→ ◦ R będzie funkcją ograniczoną całkowalną w sensie Riemanna na przedziale [a, b]. Całkę Riemanna z f na przedziale [a, b] określa się też mianem całki oznaczonej z f na przedziale [a, b] i oznacza się bardziej tradycyjnym symbolem Z b Z b Z f (x)dx := f := f. a a [a,b] Wniosek 16.2.14 Jeśli f jest całkowalna w sensie Riemanna na przedziale [a, b] oraz c ∈ (a, b), to f jest całkowalna w sensnie Riemanna na przdziałach [a, c] i [c, b] oraz Z b Z f (x)dx = a c Z f (x)dx + a b f (x)dx. c W programie Mathematica całkę oznaczoną z funkcji f na przedziale [a, b] obliczamy używając instrukcji Integrate[f[x], {x, a, b}] W miarę swoich możliwości Mathematica stara się zwrócić dokładny wynik. Na przykład Integrate[Sqrt[1 - x^2], {x, 0, 1}] zwraca 16.2.7 π 4. Twierdzenie Riemanna Niech f : R−→ ◦ R będzie funkcją ograniczoną i niech [a, b] będzie przedziałem zwartym zawartym w dziedzinie funkcji f . Niech P będzie podziałem przedziału [a, b] zadanym ciągiem x : { 0, 1, 2, . . . k } → [a, b]. Definicja 16.2.15 Niech Ξ := { ξ1 , ξ2 , . . . ξk } ⊂ [a, b] będzie zbiorem punktów takich, że ξi ∈ [xi−1 , xi ] dla i = 1, 2, . . . k. Parę (P, Ξ) nazywamy parą aproksymacyjną dla f na przedziale [a, b], a wyrażenie S(f, P, Ξ) := k X f (ξi )(xi − xi−1 ) i=1 nazywamy sumą aproksymacyjną dla f na przedziale [a, b]. Ciąg par aproksymacyjnych (P n , Ξn )∞ n=1 nazywamy ciągiem normalnym, jeżeli ciąg średnic podziałów P n zmierza do zera. 16.2. WŁASNOŚCI CAŁKI RIEMANNA 265 Twierdzenie 16.2.16 (Riemanna). Niech f : [a, b] → R będzie funkcją ograniczoną. Funkcja ta jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy istnieje liczba g ∈ R taka, że dla każdego > 0 istnieje δ > 0 taka, że dla każdej pary aproksymacyjnej (P, Ξ) dla f na przedziale [a, b] mamy δ(P) < δ ⇒ |S(f, P, Ξ) − g| < . Liczba g jest wyznaczona jednoznacznie i jest równa całce Program, który liczy przybliżenie całki Rb a f. x Z f (t)dt 0 w oparciu o sumy Riemanna sn := n X 1 i f ( x) n n i=1 przedstawia listing 16.1. Podobny program w języku C++ przedstawia listing 16.2. Wyrazy ciągu sn powinny przybliżać pole ćwiartki koła, czyli π = 0.7853981633974483..., 4 natomiast 20-ty wyraz ciągu sn wyliczony przez program to s20 = 0.785397208948704. Widzimy więc, że z punktu widzenia liczenia liczby π ta technika jest gorsza niż zastosowana wcześniej technika szeregów. Jednak pożytki z niej leżą gdzie indziej. Ćwiczenie komputerowe 16.2.17 Adaptuj program z listingu 16.2 do policzenia przybliżenia pola soczewkowatej figury na rys. 1.13. 266 ROZDZIAŁ 16. CAŁKA OZNACZONA ( ∗ P r z y b l i ż a n i e c a ł k i o z n a c z o n e j z f u n k c j i f od 0 do x p o p r z e z p o l a m p r o s t o k ą t ó w pod wykresem ∗ ) R i e m I n t e g r a l [ f_ , x_ , m_] := Module [ { s , k , y } , s = 0 . ; k = 0; ( ∗ Sumujemy w z m i e n n e j s w a r t o ś c i f u n k c j i w punktach x∗k/m ∗ ) Do[ y = x∗k/m; s = s + f [y]; k = k + 1, {m} ]; ( ∗ Zwracamy sumę pomnożoną p r z e z wspólną d ł u g o ś ć podstawy wynoszącą 1/m ∗ ) s /m ] ( ∗ Wykres p o n i ż s z e j f u n k c j i nad p r z e d z i a ł e m [ 0 , 1 ] t o ć w i a r t k a okręgu ∗ ) a r c [ x_ ] := Sqrt [ 1 − x ^ 2 ] ; ( ∗ Przybliżymy p o l e pod ć w i a r t k ą okręgu danego f u n k c j ą a r c nad [ 0 , 1 ] Wykonamy 20 prób za każdym razem p o d w a j a j ą c i l o ś ć p r z e d z i a ł ó w ∗ ) m = 1; d = 1; Do[ p = R i e m I n t e g r a l [ arc , 1 . , m ] ; ( ∗ Wydruk k o n t r o l n y : c a ł k a powinna być b l i s k a p i /4 ∗ ) Print [ "s[" , d , " ]= " , NumberForm[ p , 1 6 ] ] ; m = m∗ 2 ; d = d + 1 , {20} ] Listing 16.1: Przybliżanie całki oznaczonej w języku Mathematica 16.2. WŁASNOŚCI CAŁKI RIEMANNA 267 /∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ R i e m I n t e g r a l . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/ /∗ P r z y b l i ż a n i e c a ł k i o z n a c z o n e j p o p r z e z p o l a p r o s t o k ą t ó w ∗/ /∗ pod wykresem ∗/ /∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/ #include <i o s t r e a m > #include <cmath> #include <iomanip> using namespace s t d ; /∗ Wykres p o n i ż s z e j f u n k c j i nad p r z e d z i a ł e m [ 0 , 1 ] t o ć w i a r t k a okręgu ∗/ double a r c ( double x ) { return s q r t (1−x∗x ) ; } /∗ P r z y b l i ż a n i e c a ł k i Riemanna f u n k c j i f od 0 do x sumą m p r o s t o k ą t ó w Z a p i s d o u b l e ( ∗ f ) ( d o u b l e ) oznacza , ż e argumentem f j e s t f u n k c j a ∗/ double R i e m I n t e g r a l ( double ( ∗ f ) ( double ) , double x , i n t m) { double s =0; /∗ Sumujemy w z m i e n n e j s w a r t o ś c i f u n k c j i w punktach x∗k/m ∗/ f o r ( i n t k=0;k<m; k=k+1){ double y=x∗k/m; s=s+f ( y ) ; } /∗ Zwracamy sumę pomnożoną p r z e z wspólną d ł u g o ś ć podstawy wynoszącą 1/m ∗/ return s=s /m; } i n t main ( ) { c o u t << f i x e d << r i g h t ; c o u t << s e t p r e c i s i o n ( 1 5 ) ; i n t m=1; /∗ Przybliżymy p o l e pod ć w i a r t k ą okręgu danego f u n k c j ą a r c nad [ 0 , 1 ] Wykonamy 20 prób za każdym razem p o d w a j a j ą c i l o ś ć p r z e d z i a ł ó w ∗/ f o r ( i n t d=1;d<=20;d=d+1){ double p=R i e m I n t e g r a l ( arc , 1 . ,m) ; /∗ Wydruk k o n t r o l n y : c a ł k a powinna być b l i s k a p i /4 ∗/ c o u t << "s[" << setw ( 2 ) << d << "] =" << setw ( 1 8 ) << p ; c o u t << e n d l ; m=m∗ 2 ; } } Listing 16.2: Przybliżanie całki oznaczonej w C++ 268 ROZDZIAŁ 16. CAŁKA OZNACZONA Rozdział 17 Funkcja pierwotna i całka nieoznaczona Jak wspomnieliśmy w rozdziale wst˛epnym Newton i Leibniz odkryli, że poj˛ecie pochodnej i poj˛ecie całki sa˛ ze soba˛ powiazane. ˛ Wzi˛ecie całki z pochodnej oraz pochodnej z całki prowadza˛ do wyjściowej funkcji. W niniejszym rozdziale doprecyzujemy co to oznacza oraz zajmiemy si˛e pożytkami jakie z tego faktu płyna.˛ 17.1 Podstawowe twierdzenie rachunku różniczkowego i całkowego 17.1.1 Pochodna całki Twierdzenie 17.1.1 Niech f : [a, b] → R będzie funkcją całkowalną w sensie Riemanna. Rozważmy funkcję Z x F : [a, b] 3 x 7→ f (t)dt. a Wtedy (i) funkcja F jest funkcją Lipschitza, (ii) jeśli f jest ciągła w punkcie x0 ∈ [a, b] to F jest różniczkowalna w x0 oraz F 0 (x0 ) = f (x0 ). Dowód: Aby pokazać własność (i) rozważmy x, y ∈ (a, b) spełniające x < y. Niech M := supx∈[a,b] f (x)|. Mamy Z y x Z f ¬ y |f | ¬ M (y − x) = M |y − x|. x Zatem F rzeczywiście jest funkcją Lipschitza. Dla dowodu własności (ii) ustalmy > 0. Z ciągłości f w x0 znajdziemy δ > 0 takie, ze |x − x0 | < δ ⇒ |f (x) − f (x0 | < . Zatem dla |h| < δ Z Z x0 +h Z x0 +h Z x0 +h x0 +h F (x0 + h) − F )x0 ) h 1 1 1 = , f (t)dt − f (x )dt |f (t) − f (x )| ¬ dt = ¬ − f (x ) = 0 0 0 h |h| x0 h |h| x0 |h| x0 x0 co dowodzi, że F jest różniczkowalna w x0 oraz F 0 (x0 ) = f (x0 ). 269 270 17.1.2 ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA Funkcja pierwotna i całka nieoznaczona. Definicja 17.1.2 Niech f : [a, b] → R. Mówimy, że F : [a, b] → R jest funkcją pierwotną funkcji f jeżeli F jest różniczkowalna oraz F 0 (x) = f (x) dla każdego x ∈ [a, b]. Z twierdzenia 17.1.1 łatwo wyprowadzamy następujacy wniosek. Wniosek 17.1.3 Jeśli f : [a, b] → R jest ciągła to funkcja Z [a, b] 3 x 7→ x f (t)dt ∈ R a jest funkcją pierwotna funkcji f . Naturalne jest pytanie czy funkcja f moze mieć więcej niż jedną pierwotną. Dodając do pierwotnej funkcję stałą dostajemy inną pierwotną tej samej funkcji, bo pochodna funkcji stałej jest zero. Okazuje się, że więcej pierwotnych już nie ma jak wynika z następującego twierdzenia. Twierdzenie 17.1.4 Jeśli F1 i F2 są pierwotnymi funkcji f , to różnica F1 − F2 jest funkcja stałą. Dowód: Niech F := F1 − F2 . Funkcja F jest różniczkowalna oraz F 0 = F10 − F20 = 0. Niech x, y ∈ [a, b] i x < y. Z twierdzenia o wartości średniej wiemy, że istnieje ξ ∈ (x, y) takie, że F (x) − F (y) = F 0 (ξ)(x − y) = 0. Zatem F (x) = F (y), a ponieważ x, y są dowolne, otrzymujemy tezę. Wygodnie jest zebrać wszystkie pierwotne razem. Definicja 17.1.5 Niech f : [a, b] → R będzie funkcją całkowalną w sensie Riemanna. Zbiór wszystkich pierwotnych R funkcji f nazywamy całką nieoznaczoną f i oznaczamy f . R W szczególności zapis F ∈ f oznacza, że F jest fukcją pierwotną f . Stosowany jest również tradycyjny, choć mało precyzyjny zapis Z F (x) = f (x)dx + C, który należy interpretować tak, że wybierając jakąś pierwotną z całki nieoznaczonej i dodając do niej stałą dostaniemy inną pierwotną. 17.1.3 Podstawowe twierdzenie rachunku różniczkowego i całkowego Leibniz i Newton odkryli, że znajomość pierwotnej pozwala wygodnie obliczać pole pod wykresem funkcji. Jest to nieporównalnie łatwiejsze od liczenia sum aproksymacyjnych Riemanna. Natomiast maszynką dostarczające liczne (choć niestety nie wszystkie potrzebne) wzory na funkcje pierwotne są wszelkie wzory na pochodne. Twierdzenie 17.1.6 (podstawowe twierdzenie rachunku różniczkowego i całkowego) Niech f : [a, b] → R będzie całkowalna w sensie Riemanna. Jeśli F jest pierwotną funkcji f to Z x F (x) = f (t)dt + F (a). (17.1) a W szczególności Z b f (t)dt = F (b) − F (a). a (17.2) 17.2. PODSTAWOWE TECHNIKI CAŁKOWANIA. 271 Dla wygody w dalszym ciągu stosować będziemy zapis F |ba := F (b) − F (a). Dowód: Pokażemy najpierw (17.2). Dla k ∈ N1 wybierzmy podział P k przedziału [a, b] o średnicy nie większej niż zadanym ciągiem xk : {0, 1, . . . nk } → R. Z twierdzenia o wartości średniej zastosowanego do F mamy F (b) − F (a) = n X F 0 (ξik )(xki − xki−1 ) 1 k, (17.3) i=1 dla pewnych punktów ξik ∈ (xki−1 , xki ). Ponieważ F 0 (xki ) = f (xki ), więc prawa strona równości (17.3) jest sumą aproksymacyjRb ną dla f na [a, b]. Zatem z twierdzenia Riemanna (tw. 16.2.16) prawa strona (17.3) zmierza do a f przy k → ∞, bo podziały P k dobraliśmy tak, by ich średnice zmierzały do zera. Ale na mocy równości (17.3) wszystkie te sumy aproksymacyjne są równe F (b) − F (a), zatem i granica jest równa F (b) − F (a) co dowodzi (17.2). Aby pokazać (17.1) wystarczy zastosować pokazany już wzór (17.2) do zawężenia f|[a,x] . 17.2 Podstawowe techniki całkowania. 17.2.1 Własności całki nieoznaczonej. Podamy teraz kilka podstawowych wzorów dla całki nieoznaczonej. Pojawiające się w nich funkcje rozważać będziemy na przedziale [a, b]. Symbolem Const oznaczać będziemy rodzinę funkcji stałych na przedziale [a, b]. Twierdzenie 17.2.1 (liniowość całki nieoznaczonej). Niech f, g : [a, b] → R będą całkowalne w sensie Riemanna. Wtedy f + g jest całkowalna w sensie Riemanna oraz Z Z Z (f + g) = f + g. (17.4) Ponadto αf jest całkowalna w sensie Riemanna dla dowolnego α ∈ R oraz Z Z (αf ) = α f. (17.5) Zauważmy, że wzory (17.4) i (17.5) należy rozumieć jako równość zbiorów, ponieważ całka nieoznaczona jest zbiorem, a dokładniej zbiorem funkcji pierwotnych. Dowód: Całkowalność funkcji αf + βg i funkcji αf dostajemy wprost z twierdzenia 16.2.2. Zauważmy, że jeżeli F jest pierwotną f , a G jest pierwotną g, to F +G jest pierwotną f +g na podstawie twierdzenia o pochodnej sumy funkcji. Dowodzi to zawieranie się strony prawej w lewej we wzorze (17.4). Aby pokazać inkluzję przeciwną załóżmy, że H jest elementem lewej strony równości (17.4). Wtedy H jest pierwotną funkcji f + g. Niech F będzie dowolnie ustaloną pierwotną funkcji f . Połóżmy G : H − F . Mamy G0 = H 0 − F 0 = (f + g) − f = g. Zatem G jest pierwotną funkcji g, a ponieważ H = F + G, więc H jest sumą pierwotnej funkcji f i pierwotnej funkcji g. Zatem H należy do prawej strony (17.4). Dowód (17.5) jest podobny i zostawiamy go jako ćwiczenie. Następujące twierdzenia są natychmiastową konsekwencją stosownych wzorów dla pochodnych i definicji całki nieoznaczonej. 272 ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA Twierdzenie 17.2.2 Zachodzą następujące wzory Z 0[a,b] dx = Const, Z 1 dx = ln x + Const, x Z ex dx = Z 1[a,b] dx = x + Const, Z xα dx = xα+1 + Const dla α 6= −1, α+1 ex + Const . Twierdzenie 17.2.3 Zachodzą następujące wzory Z sin xdx = − cos x + Const, Z 1 dx = tg x + Const, cos2 x Z 1 dx 1 + x2 Z cos xdx = sin x + Const, Z = √ 1 dx = arc sin x + Const, 1 − x2 arc tg x + Const . 17.2.2 Całkowanie przez części Widzieliśmy, że całkowanie sumy dwóch funkcji jest proste. Jest tak, bo pochodna sumy jest suma˛ pochodnych i w efekcie również całka sumy jest suma˛ całek. Niestety pochodna iloczynu nie jest iloczynem pochodnych, a w efekcie całka iloczynu nie jest iloczynem całek. Dlatego nie jest oczywiste jak liczyć całki iloczynu dwóch funkcji. Jednak wzór na pochodna˛ iloczynu jest w tym przypadku pomocny, chociaż nie bezpośrednio i nie automatycznie. Całkujac ˛ wzór na pochodna˛ iloczynu dostajemy Z Z Z (f g)0 = f 0g + f g0 . Ponieważ f g jest pierwotna˛ (f g)0 , dostajemy Z f g + Const = f 0g + Z f g0 . ˛ a˛ liczenie całki RJeśli0 jedna z dwóch całek R po prawej stronie jest łatwiejsza do policzenia niż druga, to wzór ten mozemy potraktować jako metod˛e sprowadzajac f g do liczenia całki f g 0 . Jak zobaczymy, metoda ta może być użyteczna. Określana jest mianem całkowania przez cz˛eści. Twierdzenie 17.2.4 Załóżmy, że f, g : [a, b] → R są klasy C 1 . Wtedy Z Z 0 f g = f g − f g0 (17.6) W szczególności mamy też wzór dla całek oznaczonych: Z a b f 0 (x)g(x)dx = f (x)g(x)|ba − Z a b f (x)g 0 (x)dx. (17.7) 17.2. PODSTAWOWE TECHNIKI CAŁKOWANIA. 273 Dowód: Niech F będzie elementem lewej strony wzoru (17.6). Wtedy F 0 = f 0 g. Mamy F = f g − (f g − F ). Zatem aby pokazać, że F jest elementem prawej strony wzoru (17.6), wystarczy pokazać, że f g − F jest pierwotną funkcji f g 0 . Jest tak w istocie, bo (f g − F )0 = (f g)0 − F 0 = f 0 g + f g 0 − f 0 g = f g 0 . Rozważmy teraz element prawej strony równości (17.6). Ma on postać f g − G, gdzie G jest pierwotną f g 0 . Musimy pokazać, że f g − G jest pierwotną f 0 g. Rzeczywiście tak jest, bo (f g − G)0 = f 0 g + f g 0 − f g 0 = f 0 g. Aby pokazać (17.7) wybierzmy F pierwotną dla f 0 g. Ze wzoru (17.6) wiemy, że F = f g − G, gdzie G jest pewną pierwotną f g 0 . W szczególności F (b) = f (b)g(b) − G(b) F (a) = f (a)g(a) − G(a). Odejmując te równości stronami dostajemy F (b) − F (a) = f (b)g(b) − f (a)g(a) − (G(b) − G(a)). (17.8) W oparciu o przyjętą konwencję zapisywania różnic mamy f (b)g(b) − f (a)g(a) = f (x)g(x)|ba . Z podstawowego twierdzenia rachunku różniczkowego i całkowego (tw. 17.1.6) oraz z definicji F i G jako funkcji pierwotnych odpowiednio f 0 g oraz f g 0 otrzymujemy Z F (b) − F (a) b f 0 (x)g(x)dx = a Z G(b) − G(a) = b f (x)g 0 (x)dx. a Wstawiając otrzymane trzy równości do (17.8) otrzymujemy (17.7). 274 ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA Przykład 17.2.5 Metodę całkowania przez części zastosujemy do policzenia całki Z x sin xdx. Musimy w tym celu przedstawić funkcję x 7→ x sin x jako iloczyn pewnej funkcji przez pochodną innej funkcji. Mamy dwie możliwości: x sin x = x(− cos x)0 lub x sin x = x2 2 0 sin x i nie jest oczywiste, z której lepiej skorzystać. Pierwsza sprowadzi problem do policzenia całki Z (x)0 (− cos x)dx, a druga do całki Z x2 2 (sin x)0 dx. Z tych dwóch całek zdecydowanie łatwiejsza jest pierwsza, bo Z Z (x)0 (− cos x)dx = − cos xdx = − sin x + Const . Zatem wstawiając do wzoru (17.6) za f funkcję x 7→ − cos x, a za g funkcję identycznościową x 7→ x dostajemy Z Z Z Z x sin xdx = (− cos x)0 xdx = −x cos x − (− cos x)x0 dx = −x cos x + cos xdx = −x cos x + sin x + Const . 17.2.3 Całkowanie przez podstawienie Podobnie jak w przypadku iloczynu nie jest oczywiste jak całkować złożenie funkcji. Pochodna złożenia nie jest złożeniem pochodnych zatem i całka złożenia nie jest złożeniem całek. Jednak całkujac ˛ wzór na pochodna˛ złożenia dostajemy wzór dostarczajacy ˛ metod˛e liczenia całek przydatna˛ w przypadku złożeń i zwana˛ całkowaniem przez podstawienie. Twierdzenie 17.2.6 Załóżmy, że f : [a, b] → R jest funkcją ciągłą, a g : [α, β] → [a, b] jest klasy C 1 . Jeśli F jest pierwotną funkcji f to F ◦ g jest pierwotną funkcji (f ◦ g)g 0 . W konsekwencji Z Z (f ◦ g)g 0 = f ◦ g. (17.9) W szczególności Z β α f (g(t))g 0 (t)dt = Z g(β) f (x)dx. (17.10) g(α) Dowód: Jeśli F jest pierwotną funkcji f to oczywiście F ◦ g jest pierwotną funkcji (f ◦ g)g 0 , zatem prawa strona zawiera się w lewej w (17.9). Aby pokazać, że lewa strona zawiera się w prawej przyjmijmy, że G jest pierwotną funkcji (f ◦ g)g 0 . Wybierzmy też pewną pierwotną F funkcji f . Wiemy już, że wtedy F ◦ g jest pierwotną (f ◦ g)g 0 , zatem na mocy 17.2. PODSTAWOWE TECHNIKI CAŁKOWANIA. 275 twierdzenia 17.1.4 istnieje stała C taka, że G = F ◦ g + C. Mamy G = F ◦ g + C = F ◦ g + C ◦ g = (F + C) ◦ g = F̄ ◦ g, gdzie F̄ = F + C jest inną pierwotną f . Zatem G jako podstawienie g w pierwotnej F̄ funkcji f należy do prawej strony równości (17.9). Pozostaje pokazać (17.10). Wiemy, że jeśli F jest pierwotną f to F ◦ g jest pierwotną (f ◦ g)g 0 . Zatem z podstawowego twierdzenia rachunku różniczkowego i całkowego (tw. 17.1.6) mamy Z g(β) Z β 0 f (x)dx. f (g(t))g (t)dt = (F ◦ g)(α) − (F ◦ g)(β) = F (g(α)) − F (g(β)) = g(α) α R x R x R x ln a Przykład 17.2.7 Policzymy całkę dx. Chcielibyśmy sprowadzić poR R nieoznaczoną a dx. Mamy a dx = e liczenie całki ex ln a dx do całki eu du. Funkcja x 7→ ex ln a jest podstawieniem funkcji g : x 7→ x ln a w funkcji f : u 7→ eu . Ponieważ pochodną g jest funkcja stała ln a, więc z twierdzenia 17.2.6 mamy Z Z Z Z 1 1 ax dx = ex ln a dx = ex ln a ln adx = eu du ◦ (x 7→ x ln a) = ln a ln a 1 ax 1 (eu + Const) ◦ (x 7→ x ln a) = ex ln a + Const = + Const . ln a ln a ln a 17.2.4 Twierdzenia o wartości średniej dla całek Twierdzenie 17.2.8 (o wartości średniej dla całek) Niech f : [a, b] → R będzie funkcją klasy C 1 , a g : [a, b] → R funkcją całkowalną w sensie Riemanna. Jeśli g ma stały znak na [a, b] to istnieje ξ ∈ [a, b] takie, że Z b Z f g = f (ξ) a b g. (17.11) a Dowód: Rozważmy przypadek g ­ 0. Połóżmy m := inf { f (x) | x ∈ [a, b] }, M := sup { f (x) | x ∈ [a, b] } i ustalmy x ∈ [a, b]. Wtedy m ¬ f (x) ¬ M , a zatem również mg(x) ¬ f (x)g(x) ¬ M g(x). Całkując dostajemy Z b Z b Z b m g(t)dt ¬ f (t)g(t)dt ¬ M g(t)dt. a Rb a a Rb g = 0, to również a f g = 0 i w konsekwencji (17.11) zachodzi dla dowolnie Rb dobranego ξ. Pozostaje zatem rozważyć przypadek a g 6= 0. Wtedy Rb fg m ¬ Ra b ¬ M. g a Z otrzymanej nierówności wynika, że jeśli a Zatem z twierdzenia 11.2.14 i wniosku 11.4.7 znajdziemy ξ ∈ [a, b] takie, że Rb fg f (ξ) = Ra b g a co dowodzi (17.11) dla g ­ 0. Rozumowanie dla g ¬ 0 jest analogiczne. Przyjmując w twierdzeniu 17.2.8 za g funkcję stale równą jeden dostajemy następujący wniosek. 276 ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA Wniosek 17.2.9 Jeśli f : [a, b] → R jest klasy C 1 , to istnieje ξ ∈ [a, b] takie, że b Z f = f (ξ)(b − a). a W programie Mathematica całkę nieoznaczoną (a dokładniej jedną z funkcji pierwotnych) funkcji f obliczamy używając instrukcji Integrate[f[x], x] Na przykład Integrate[Sin[3 x]^7, x] zwraca − 17.3 35 7 7 cos(21x) cos(3x) + cos(9x) − cos(15x) + 192 192 960 1344 Całkowanie funkcji wektorowych Rozważmy funkcję f : [a, b] → Rm . Funkcję taką określać będziemy mianem krzywej. Wtedy f = (f1 , f2 , . . . , fm ) gdzie fi : [a, b] → R dla i = 1, 2, . . . , m. Definicja 17.3.1 Mówimy, że f jest całkowalna w sensie Riemanna jeżeli funkcje fi są całkowalne w sensie Riemanna dla wszystkich i = 1, 2, . . . , m. W takim przypadku jako całkę Riemanna f przyjmujemy Z b b Z f := ( a Z f1 , a b Z f2 , . . . , a b fm ). a Twierdzenie 17.3.2 Niech f : [a, b] → Rm będzie całkowalna w sensie Riemanna. Wtedy funkcja ||f || : [a, b] 3 x 7→ ||f (x)|| ∈ R jest całkowalna w sensie Riemanna oraz Z || b Z f || ¬ a b ||f ||. a Dowód: Niech f = (f1 , f2 , . . . fm ). Z założenia funkcje fi są całkowalne w sensie Riemanna. Ponieważ funkcja Rm 3 x 7→ ||x|| ∈ R jest ciągła, zbiór punktów nieciągłości funkcji ||f || zawiera się w sumie mnogościowej zbiorów punktów nieciągłości funkcji fi . Na mocy twierdzenia 16.2.9 całkowalność funkcji fi implikuje, że zbiór punktów nieciągłości funkcji fi jest miary zero. Zatem również zbiór punktów nieciągłości funkcji ||f || jest miary zero, a więc z twierdzenia 16.2.9 wnosimy, że funkcja ta jest całkowalna w sensie Riemanna. Rb Połóżmy vi := a fi i v = (v1 , v2 , . . . vn ). Jeśli v = 0 to teza jest oczywista. Załóżmy zatem, że v 6= 0. Dla x ∈ [a, b] mamy z nierówności Schwartza |v · f (x)| ¬ ||v|| ||f (x)||. 17.4. ZASTOSOWANIA GEOMETRYCZNE CAŁEK 277 Funkcja [a, b] 3 x 7→ v · f (x) = m X vi fi (x) ∈ R i=1 jest całkowalna w sensie Riemanna. Zatem 2 ||v|| = m X vi vi = i=1 m X i=1 Z vi b Z Z b v·f ¬ fi = a b Z ||v|| ||f (x)||dx = ||v|| a a b ||f (x)||dx. a Dzieląc otrzymaną nierówność obustronnie przez ||v|| otrzymujemy b Z ||v|| ¬ ||f (x)||dx. a Ponieważ v = Rb a f , dowodzi to tezy. 17.4 Zastosowania geometryczne całek 17.4.1 Długość krzywej Niech γ : [a, b] → Rm będzie krzywą i niech P będzie podziałem przedziału [a, b] zadanym ciągiem punktów (x0 , x1 , . . . xn ). Liczba m X Λ(γ, P) := ||γ(xi ) − γ(xi−1 )|| i=1 określa długość łamanej rozpiętej na punktach γ(xi ). Definicja 17.4.1 Mówimy, że krzywa γ jest prostowalna jeżeli istnieje kres górny Λ(γ) := sup { Λ(γ, P) | P podział przedziału [a,b] }. Mówimy wtedy, że liczba Λ(γ) jest długością krzywej γ. Twierdzenie 17.4.2 Niech γ : [a, b] → Rm będzie krzywą klasy C 1 . Wtedy γ jest prostowalna oraz b Z ||γ 0 (t)||dt. Λ(γ) = (17.12) a Dowód: Pokażemy najpierw, że w (17.12) lewa strona jest niewiększa od prawej. Niech P będzie podziałem przedziału [a, b] wyznaczonym przez punkty x0 , x1 , . . . xn . Wtedy Z xi Z xi 0 ||γ(xi ) − γ(xi−1 )|| = || γ (t)dt|| ¬ ||γ 0 (t)dt|| xi−1 xi−1 dla i = 1, 2, . . . n. Sumując po i dostajemy Z Λ(γ, P) ¬ a b ||γ 0 (t)dt||, 278 ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA a ponieważ P jest dowolnym podziałem [a, b] otrzymujemy Z b Λ(γ) ¬ ||γ 0 (t)||dt. a Dla dowodu nierówności przeciwnej ustalmy > 0. Założyliśmy, że γ jest klasy C 1 , więc γ 0 jest funkcją ciągłą. Jako funkcja ciągła na zbiorze zwartym jest ona jednostajnie ciągła. Zatem znajdziemy δ > 0 takie, że dla s, t ∈ [a, b] |s − t| < δ ⇒ ||γ 0 (s) − γ 0 (t)|| < 0 := . 2(b − a) (17.13) Niech P będzie podziałem przedziału [a, b] wyznaczonym przez punkty x0 , x1 , . . . xn o średnicy nie przekraczającej δ. Z (17.13) wnosimy, że dla t ∈ [xi−1 , xi ] ||γ 0 (t)|| ¬ ||γ 0 (t) − γ 0 (xi )|| + ||γ 0 (xi )|| ¬ ||γ 0 (xi )|| + 0 . Niech ∆xi := xi − xi−1 . Z (17.14) mamy Z xi Z xi Z 0 0 0 0 0 ||γ (t)dt|| ¬ (||γ (xi )|| + ) dt = ||γ (xi )||∆xi + ∆xi = || xi−1 xi−1 Z xi || xi−1 Z xi || xi (17.14) γ 0 (xi )dt|| + 0 ∆xi = xi−1 (γ 0 (t) + γ 0 (xi ) − γ 0 (t)) dt|| + 0 ∆xi ¬ γ 0 (t)dt|| + || Z xi−1 xi (γ 0 (xi ) − γ 0 (t)) dt|| + 0 ∆xi ¬ xi−1 0 ||γ(xi ) − γ(xi−1 )|| + 2 ∆xi . Sumując po i dostajemy Z b ||γ 0 (t)||dt ¬ Λ(γ, P) + 20 (b − a) = Λ(γ, P) + ¬ Λ(γ) + . a Ponieważ otrzymana nierówność zachodzi dla każdego > 0, otrzymujemy Z b ||γ 0 (t)||dt ¬ Λ(γ). a Przykład 17.4.3 Rozważmy krzywą γ : [0, 2π] 3 t 7→ eit ∈ R2 . Krzywa ta jest klasy C 1 oraz γ 0 (t) = ieit . Zatem ||γ 0 (t)|| = 1. Stąd Z Λ(γ) = 2π ||γ 0 (t)||dt = 0 17.4.2 Z 2π dt = 2π − 0 = 2π. 0 Bryła obrotowa Niech f : [a, b] → R+ będzie funkcją ciągłą. Rozważmy bryłę V := { (x, y, z) ∈ R3 | a ¬ x ¬ b, y 2 + z 2 ¬ f (x)2 } 17.4. ZASTOSOWANIA GEOMETRYCZNE CAŁEK 279 Nazywamy ją bryłą obrotową zadaną przez funkcję f . Bryła ta powstaje poprzez obrót trapezu krzywoliniowego pod wykresem funkcji f wokół osi x. 17.4.3 Obętość bryły obrotowej Twierdzenie 17.4.4 Objętość bryły obrotowej dana jest wzorem Z π b f (x)2 dx. a 17.4.4 Pole powierzchni bocznej bryły obrotowej Powierzchnią boczną bryły obrotowej jest zbiór S := { (x, y, z) ∈ R3 | a ¬ x ¬ b, y 2 + z 2 = f (x)2 } 280 ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA Twierdzenie 17.4.5 Jeśli funkcja f jest klasy C 1 , to pole powierzchni bocznej bryły obrotowej dane jest wzorem Z 2π a b p f (x) 1 + f 0 (x)2 dx. Rozdział 18 Ciągi i szeregi funkcyjne 18.1 Zbieżność punktowa i jednostajna 18.1.1 Zbieżność punktowa Niech X będzie ustalonym zbiorem, a Y ustaloną przestrzenią metryczną. Rozważmy ciąg funkcji sn : X → Y . Definicja 18.1.1 Mówimy, że ciąg sn jest zbieżny punktowo do funkcji s : X → Y , jeżeli dla każdego punktu x ∈ X ciąg sn (x) jest zbieżny do s(x). Rozpisując warunek na zbieżność ciągu możemy zatem zbieżność punktową zapisać ∀x ∈ X ∀ > 0 ∃N ∈ N ∀n ­ N ρ(sn (x), s(x)) < . Przykład 18.1.2 Rozważmy ciąg funkcji fn : [0, 1] 3 x 7→ xn ∈ [0, 1]. Łatwo policzyć, że ciąg ten jest zbieżny punktowo do funkcji f : [0, 1] → [0, 1] danej wzorem ( 0 gdy x ∈ [0, 1), f (x) := 1 gdy x = 1. Choć funkcje fn są ciągłe, funkcja graniczna f nie jest ciągła. Widzimy zatem, że zbieżność punktowa funkcji ciągłych nie gwarantuje, że funkcja graniczna będzie ciągła. 281 282 ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE Przykład 18.1.3 Rozważmy ciąg funkcji fn : [0, 1] 3 x 7→ lim (cos(n!πx))2m ∈ [0, 1]. m→∞ Łatwo policzyć, że dla każdego n funkcja fn przyjmuje wartość zero wszędzie poza skończoną ilością punktów, gdzie przyjmuje wartość jeden. Zatem każda z funkcji fn jest całkowalna w sensie Riemanna. Ciąg fn jest zbieżny punktowo do funkcji f : [0, 1] → [0, 1] danej wzorem ( 0 gdy x 6∈ [0, 1] ∩ Q, f (x) := 1 gdy x ∈ [0, 1] ∩ Q. Nie jest to funkcja całkowalna w sensie Riemanna, zatem zbieżność punktowa nie gwarantuje również zachowania całowalności w sensie Riemanna. Przykład 18.1.4 Rozważmy ciąg funkcji sin nx fn : R 3 x 7→ √ ∈ R. n Łatwo sprawdzić, że ciąg ten jest punktowo zbieżny do funkcji stale równej zero. Wszystkie funkcje fn są różniczkowalne, a ich pochodne tworzą ciąg √ fn0 : R 3 x 7→ n cos nx ∈ R. Ciąg pochodnych nie jest ciągiem punktowo zbieżnym. Na przykład dla x = π dostajemy ciąg √ n 7→ (−1)n n, który nie jest zbieżny. Zatem zbieżność punktowa funkcji nie gwarantuje zachowania ich różniczkowalności w granicy. Przedstawione przykłady pokazują, że punktowa zbieżność ciągu funkcji nie gwarantuje naturalnych własności, które w wielu sytuacjach byłyby przydatne. Pojawia się pytanie, czy nie ma jakiegoś bardziej użytecznego pojęcia zbieżności ciągu funkcji. Jak zobaczymy odpowiedź na to pytanie jest pozytywna. W tym celu potraktujemy funkcje jako punkty stosownie zdefiniowanej przestrzeni metrycznej. 18.1.2 Zbieżność jednostajna Niech ρ, ρ0 będą dwoma metrykami w zbiorze Y . Definicja 18.1.5 Mówimy, że metryki ρ i ρ0 są jednostajnie równoważne, jeżeli zachodzą następujące dwa symetryczne warunki ∀ > 0 ∃δ > 0 ρ(x, y) < δ ⇒ ρ0 (x, y) < , ∀ > 0 ∃δ > 0 ρ0 (x, y) < δ ⇒ ρ(x, y) < . Definicja 18.1.6 Niech (Y, ρ) będzie przestrzenią metryczną. Mówimy, że ρ jest metryką ograniczoną, jeżeli istnieje stała M > 0 taka, że dla dowolnych x, y ∈ Y mamy ρ(x, y) < M . Mamy następującą użyteczną własność: 18.1. ZBIEŻNOŚĆ PUNKTOWA I JEDNOSTAJNA 283 Lemat 18.1.7 « Dla dowolnej przestrzeni metrycznej (Y, ρ) istnieje metryka ograniczona ρ0 jednostajnie równoważna metry- ce ρ. » 284 18.1.3 ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE Kryterium Cauchy’ego zbieżności jednostajnej 18.2. ZBIEŻNOŚĆ JEDNOSTAJNA, A CIĄGŁOŚĆ, RÓŻNICZKA I CAŁKA 18.2 Zbieżność jednostajna, a ciągłość, różniczka i całka 18.2.1 Granica, a zbieżność jednostajna 285 286 ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE 18.2.2 Całkowanie i różniczkowanie, a zbieżność jednostajna 18.3 Aproksymacja funkcji ciągłych 18.4 Szeregi potęgowe 18.4. SZEREGI POTĘGOWE 18.4.1 Twierdzenie o szeregu Taylora 18.4.2 Funkcje analityczne 287 288 ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE 18.5. SZEREGI FOURIERA 289 Rysunek 18.1: Joseph Fourier (1768-1830) 18.5 Szeregi Fouriera 18.5.1 Wielomiany trygonometryczne 290 18.5.2 ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE Zespolony iloczyn skalarny 18.5. SZEREGI FOURIERA 18.5.3 Przestrzeń wektorowa z zespolonym iloczynem skalarnym 291 292 18.5.4 ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE Układ ortonormalny 18.5. SZEREGI FOURIERA 18.5.5 Szereg Fouriera 293 294 ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE 18.5. SZEREGI FOURIERA 295 296 18.5.6 ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE Rzut ortonormalny 18.5. SZEREGI FOURIERA 18.5.7 Jądro Dirichleta 297 298 18.5.8 ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE Zbieżność punktowa szeregu Fouriera 18.5. SZEREGI FOURIERA 299 300 ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE Bibliografia [1] F. Leja, Rachunek różniczkowy i całkowy, Państwowe Wydawnictwo Naukowe, Warszawa 1969. [2] W. Rudin, Podstawy analizy matematycznej, Państwowe Wydawnictwo Naukowe, Warszawa 1982. [3] W. Rudnicki, Wykłady z analizy matematycznej, Państwowe Wydawnictwo Naukowe, Warszawa 2001. [4] G.M. Fichtenholz, Rachunek różniczkowy i całkowy, tom I, II i III. Państwowe Wydawnictwo Naukowe, Warszawa 1978. [5] W. Krysicki, L. Włodarski, Analiza matematyczna w zadaniach, część I i II, Państwowe Wydawnictwo Naukowe, Warszawa 1986. [6] J. Banaś, S. Wędrychowicz, Zbiór zadań z analizy matematycznej, Wydawnictwo Naukowo-Techniczne, Warszawa 2001. 301