Wstęp do Analizy Matematycznej z elementami Logiki i Teorii

advertisement
Wstęp do Analizy Matematycznej z elementami Logiki i Teorii Mnogości
Notatki do wykładów dla studentów kierunku Matematyka Komputerowa
Marian Mrozek
Uniwersytet Jagielloński
3 października 2014
2
Spis treści
1 Wprowadzenie do analizy matematycznej
1.1 Rozwój pojęcia liczby . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Liczby naturalne . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.2 Ułamki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.3 Liczby ujemne, całkowite i wymierne . . . . . . . . . . . . . .
1.1.4 Liczby niewymierne . . . . . . . . . . . . . . . . . . . . . . .
1.1.5 Liczby rzeczywiste . . . . . . . . . . . . . . . . . . . . . . . .
1.1.6 Liczby urojone i zespolone . . . . . . . . . . . . . . . . . . . .
1.1.7 Liczby w komputerze . . . . . . . . . . . . . . . . . . . . . . .
1.2 Ciągi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Przybliżanie pierwiastka . . . . . . . . . . . . . . . . . . . . .
1.2.2 Ciągi przybliżeń . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.3 Granice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.4 Obliczanie granic ciągu. . . . . . . . . . . . . . . . . . . . . .
1.2.5 Liczba π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Szeregi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Pole koła . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.2 Liczba π poprzez szereg. . . . . . . . . . . . . . . . . . . . . .
1.3.3 Szeregi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.1 Koncepcja funkcji . . . . . . . . . . . . . . . . . . . . . . . .
1.4.2 Miejsca zerowe funkcji . . . . . . . . . . . . . . . . . . . . . .
1.4.3 Wykres funkcji . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.4 Geometryczne konstrukcje funkcji . . . . . . . . . . . . . . .
1.4.5 Rozwijanie funkcji w szereg . . . . . . . . . . . . . . . . . . .
1.5 Pola figur i całkowanie . . . . . . . . . . . . . . . . . . . . . . . . . .
1.5.1 Całka oznaczona . . . . . . . . . . . . . . . . . . . . . . . . .
1.5.2 Całka nieoznaczona . . . . . . . . . . . . . . . . . . . . . . .
1.6 Styczna do krzywej i granica funkcji . . . . . . . . . . . . . . . . . .
1.6.1 Styczna do krzywej . . . . . . . . . . . . . . . . . . . . . . . .
1.6.2 Granica funkcji . . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.3 Funkcje ciągłe . . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.4 Obliczanie granic. . . . . . . . . . . . . . . . . . . . . . . . .
1.7 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.7.1 Lokalne maksima i minima . . . . . . . . . . . . . . . . . . .
1.7.2 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . .
1.7.3 Podstawowe twierdzenie rachunku różniczkowego i całkowego
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
13
13
13
14
15
15
15
17
17
17
19
20
21
22
22
22
23
24
24
24
25
25
27
28
28
29
31
31
31
33
33
35
35
35
36
4
I
SPIS TREŚCI
Elementy logiki i teorii mnogości
39
2 Matematyka zbiorów skończonych
2.1 Zbiory skończone . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Operacje mnogościowe . . . . . . . . . . . . . . . . . . .
2.1.2 Zawieranie się i równość zbiorów. Podzbiory. . . . . . .
2.1.3 Uzupełnienie zbioru. . . . . . . . . . . . . . . . . . . . .
2.1.4 Elementarne własności operacji mnogościowych . . . . .
2.2 Iloczyn kartezjański . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 Para . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 Iloczyn kartezjański . . . . . . . . . . . . . . . . . . . .
2.3 Relacje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Relacje . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.2 Własności relacji . . . . . . . . . . . . . . . . . . . . . .
2.3.3 Iloczyn kartezjański n zbiorów i relacje n-argumentowe.
2.4 Relacje równoważności . . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Relacja równoważności . . . . . . . . . . . . . . . . . . .
2.5 Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.1 Obrazy i przeciwobrazy . . . . . . . . . . . . . . . . . .
2.5.2 Injekcje, surjekcje, i bijekcje. . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
41
43
44
46
46
48
49
49
49
49
50
52
53
53
54
54
55
55
3 Elementy logiki matematycznej
3.1 Program Hilberta . . . . . . . . . . . . .
3.1.1 Struktury matematyczne. . . . .
3.1.2 Alfabet, słowo i języki formalne.
3.1.3 Spójniki logiczne . . . . . . . . .
3.1.4 Kwantyfikatory . . . . . . . . . .
3.1.5 Termy i predykaty . . . . . . . .
3.2 Język rachunku predykatów. . . . . . . .
3.2.1 Interpretacje. . . . . . . . . . . .
3.3 Rachunek zdań . . . . . . . . . . . . . .
3.4 Tautologie rachunku predykatów . . . .
3.5 Konsekwencja i dowód formalny . . . . .
3.6 Teorie aksjomatyczne . . . . . . . . . . .
3.7 Formalizm w praktyce matematycznej. .
3.8 Schematy dowodowe. . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
57
57
58
59
59
60
60
61
64
65
67
69
70
71
4 Elementy teorii mnogości
4.1 Formalizm teorii mnogości . . . . . . . . . . . . . . . .
4.1.1 Podstawowe definicje i oznaczenia. . . . . . . .
4.2 Formuły zbiorotwórcze. . . . . . . . . . . . . . . . . .
4.3 Aksjomaty teorii mnogości. . . . . . . . . . . . . . . .
4.3.1 Elementarne własności operacji mnogościowych
4.4 Iloczyn kartezjański . . . . . . . . . . . . . . . . . . .
4.4.1 Para . . . . . . . . . . . . . . . . . . . . . . . .
4.4.2 Iloczyn kartezjański . . . . . . . . . . . . . . .
4.5 Relacje . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1 Relacje . . . . . . . . . . . . . . . . . . . . . .
4.5.2 Własności relacji . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
73
73
73
76
78
81
82
82
83
84
84
84
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
SPIS TREŚCI
4.6
4.7
4.8
5
4.5.3 Złożenie relacji . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.4 Charakterystyka własności relacji . . . . . . . . . . . . . . .
Relacje równoważności . . . . . . . . . . . . . . . . . . . . . . . . .
4.6.1 Relacja równoważności . . . . . . . . . . . . . . . . . . . . .
Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.7.1 Relacje jednolistne . . . . . . . . . . . . . . . . . . . . . . .
4.7.2 Funkcje częściowe . . . . . . . . . . . . . . . . . . . . . . . .
4.7.3 Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.7.4 (*)Zawieranie się funkcji . . . . . . . . . . . . . . . . . . . .
4.7.5 Sklejenie funkcji . . . . . . . . . . . . . . . . . . . . . . . .
4.7.6 (*)Zestawienie i iloczyn kartezjański funkcji . . . . . . . . .
4.7.7 Obrazy i przeciwobrazy . . . . . . . . . . . . . . . . . . . .
4.7.8 Złożenie funkcji . . . . . . . . . . . . . . . . . . . . . . . . .
4.7.9 Injekcje, surjekcje, i bijekcje. . . . . . . . . . . . . . . . . .
4.7.10 Iloczyn kartezjański n zbiorów . . . . . . . . . . . . . . . .
4.7.11 Sumy i iloczyny indeksowane . . . . . . . . . . . . . . . . .
Równoliczność zbiorów. Twierdzenie Cantora i Cantora-Bernsteina.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
84
85
85
85
85
85
87
87
88
88
89
89
90
90
90
90
91
5 Liczby naturalne. Indukcja i rekurencja.
5.1 Liczby naturalne . . . . . . . . . . . . . . . . .
5.1.1 Aksjomatyka liczb naturalnych . . . . .
5.1.2 Konstrukcja von Neumanna . . . . . . .
5.2 Ciągi i rekurencja. . . . . . . . . . . . . . . . .
5.3 Ciągi i podciągi . . . . . . . . . . . . . . . . . .
5.3.1 Definicja ciągu i podciągu . . . . . . . .
5.3.2 Ciąg przybliżeń pierwiastka jeszcze raz.
5.3.3 Monotoniczność ciągu. . . . . . . . . . .
5.4 Rekurencyjne definiowanie ciągu. . . . . . . . .
5.4.1 Pierwiastek poprzez ciąg rekurencyjny. .
5.4.2 (*)Arytmetyka liczb natualnych . . . .
5.5 Zbiory skończone i przeliczalne . . . . . . . . .
5.6 Rozszerzona zasada indukcji . . . . . . . . . . .
5.7 Silnia i symbol Newtona . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
93
93
93
94
96
96
96
96
98
98
99
100
101
101
101
6 Struktury porządkowe
6.1 Relacje porządku . . . . . . . . . . .
6.1.1 Częściowy i liniowy porządek
6.1.2 Majoranty i minoranty . . . .
6.2 Przestrzenie ciągłe . . . . . . . . . .
6.2.1 Kresy . . . . . . . . . . . . .
6.2.2 Przedziały . . . . . . . . . . .
6.2.3 Własność L . . . . . . . . . .
6.2.4 Przestrzenie ciągłe . . . . . .
6.3 Funkcje monotoniczne . . . . . . . .
6.3.1 Funkcje rosnące i malejące . .
6.4 Liczby kardynalne i porządkowe. . .
6.4.1 Liczby kardynalne. . . . . . .
6.4.2 Aksjomat wyboru. . . . . . .
6.4.3 Liczby porządkowe. . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
103
103
103
104
105
105
106
107
107
108
108
108
108
108
108
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
SPIS TREŚCI
7 Struktury algebraiczne.
7.1 Liczby całkowite. . . . . . . . . . . . .
7.1.1 Działania . . . . . . . . . . . .
7.1.2 Grupy . . . . . . . . . . . . . .
7.1.3 Zbiór liczb całkowitych . . . .
7.1.4 Sumy i iloczyny . . . . . . . . .
7.2 Liczby wymierne . . . . . . . . . . . .
7.2.1 Ciała . . . . . . . . . . . . . .
7.2.2 Funkcja potęgowa i wielomian .
7.2.3 Zbiór liczb wymiernych . . . .
7.2.4 Wzory skróconego mnożenia . .
7.3 Ciało liczb rzeczywistych . . . . . . . .
7.3.1 Ciała uporządkowane . . . . .
7.3.2 Zbiór liczb rzeczywistych . . .
7.3.3 (*)Konstrukcja Cauchy’ego . .
II
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Granice
8 Liczby rzeczywiste i liczby zespolone
8.1 Ciało liczb rzeczywistych. . . . . . . . . . . . . . .
8.1.1 Podzbiory R . . . . . . . . . . . . . . . . .
8.2 Liczby reprezentowalne . . . . . . . . . . . . . . . .
8.3 Funkcja potęgowa w R . . . . . . . . . . . . . . . .
8.3.1 Nierówność Bernoullego . . . . . . . . . . .
8.4 Wartość bezwzględna . . . . . . . . . . . . . . . . .
8.5 Twierdzenie o istnieniu pierwiastka. . . . . . . . .
8.5.1 Własność Archimedesa . . . . . . . . . . . .
8.5.2 Gęstość zbioru w zbiorze . . . . . . . . . . .
8.5.3 Pierwiastki . . . . . . . . . . . . . . . . . .
8.6 Rozszerzony zbiór liczb rzeczywistych . . . . . . .
8.6.1 R uzupełniony o −∞ i +∞ . . . . . . . . .
8.6.2 Kresy funkcji . . . . . . . . . . . . . . . . .
8.7 Ciało liczb zespolonych . . . . . . . . . . . . . . . .
8.7.1 Liczby zespolone . . . . . . . . . . . . . . .
8.7.2 Ciało C . . . . . . . . . . . . . . . . . . . .
8.7.3 Zespolona funkcja kwadratowa . . . . . . .
8.7.4 Liczby zespolone o module jeden. . . . . . .
8.7.5 Odległość w R i C. . . . . . . . . . . . . . .
8.8 Granice ciągów w R . . . . . . . . . . . . . . . . .
8.8.1 Eksperymenty numeryczne . . . . . . . . .
8.8.2 Granice pozorne . . . . . . . . . . . . . . .
8.8.3 Definicja Cauchy’ego granicy ciągu . . . . .
8.8.4 Granica ciągu, a struktura ciała w R . . . .
8.8.5 Granica ciągu, a struktura porządkowa w R
8.9 Przykłady i zastosowania granic ciągów w R . . . .
8.9.1 Granice kilku ważnych ciągów . . . . . . . .
8.9.2 Procent składany . . . . . . . . . . . . . . .
8.9.3 Liczba e . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
109
109
109
111
112
113
113
113
114
114
114
115
115
115
116
117
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
119
119
120
120
122
126
126
127
127
127
128
129
129
130
132
132
132
134
134
135
135
135
139
139
142
143
145
145
146
148
SPIS TREŚCI
8.9.4
7
Funkcja wykładnicza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
9 Topologia przestrzeni metrycznych
9.1 Przestrzenie metryczne . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.1 Przestrzeń metryczna . . . . . . . . . . . . . . . . . . . . . .
9.1.2 Przykłady metryk w Rn . . . . . . . . . . . . . . . . . . . . .
9.1.3 Metryka indukowana i podprzestrzenie przestrzeni metrycznej
9.1.4 Kule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.5 Zbiory ograniczone . . . . . . . . . . . . . . . . . . . . . . . .
9.2 Średnica zbiorów . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2.1 Średnica zbioru . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3 Zbiory otwarte i domknięte, wnętrze, domknięcie i brzeg zbioru . . .
9.3.1 Wnętrze i domknięcie . . . . . . . . . . . . . . . . . . . . . .
9.3.2 Własności wnętrza i domknięcia . . . . . . . . . . . . . . . .
9.4 Otoczenia, punkty skupienia . . . . . . . . . . . . . . . . . . . . . . .
9.4.1 Rodzina otoczeń punktu . . . . . . . . . . . . . . . . . . . . .
9.4.2 Punkty skupienia zbioru . . . . . . . . . . . . . . . . . . . . .
9.5 Metryki równoważne, iloczyn kartezjański przestrzeni metrycznych .
9.5.1 Równoważność metryk. . . . . . . . . . . . . . . . . . . . . .
9.5.2 Iloczyn kartezjański przestrzeni metrycznych . . . . . . . . .
9.6 (*)Topologia przestrzeni metrycznej . . . . . . . . . . . . . . . . . .
9.6.1 Fundamentalne własności zbiorów otwartych i domkniętych .
9.7 (**)Bazy otoczeń . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.7.1 Baza otoczeń punktu . . . . . . . . . . . . . . . . . . . . . . .
9.7.2 Własność Hausdorffa . . . . . . . . . . . . . . . . . . . . . . .
9.7.3 Metryka w R̄ . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.8 (**)Przeliczalne bazy otoczeń punktu . . . . . . . . . . . . . . . . .
9.9 (*)Zupełność . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.9.1 Warunek Cauchy’ego . . . . . . . . . . . . . . . . . . . . . . .
9.9.2 Przestrzenie zupełne . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
151
151
151
152
152
153
154
154
154
155
156
156
157
157
157
158
158
158
158
158
159
159
160
160
161
161
161
162
10 Granica funkcji
10.1 Granica funkcji w przestrzeniach metrycznych . . . . . . . . . .
10.1.1 Eksperymenty numeryczne . . . . . . . . . . . . . . . .
10.1.2 Definicja granicy funkcji w przestrzeniach metrycznych .
10.1.3 Jednoznaczność granicy . . . . . . . . . . . . . . . . . .
10.1.4 Granica złożenia funkcji . . . . . . . . . . . . . . . . . .
10.2 (**)Przypadki szczególne definicji granicy . . . . . . . . . . . .
10.2.1 Kryterium na granicę w bazach . . . . . . . . . . . . . .
10.2.2 Granica ciągu . . . . . . . . . . . . . . . . . . . . . . . .
10.2.3 Granica funkcji w przestrzeni metrycznej . . . . . . . .
10.2.4 Granica nieskończona w R̄ . . . . . . . . . . . . . . . . .
10.2.5 Granica w nieskończoności . . . . . . . . . . . . . . . . .
10.3 Granice jednostronne . . . . . . . . . . . . . . . . . . . . . . . .
10.4 Punkty graniczne . . . . . . . . . . . . . . . . . . . . . . . . . .
10.4.1 Ciągowa charakterystyka granicy . . . . . . . . . . . . .
10.4.2 Zbiór punktów granicznych . . . . . . . . . . . . . . . .
10.4.3 Ciągowa charakterystyka granicy ciągu . . . . . . . . .
10.5 Granica dolna i górna . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
163
163
163
163
164
166
166
167
167
167
168
168
168
169
169
169
170
170
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
SPIS TREŚCI
10.5.1 Granica dolna i górna . . . . . . . . .
10.5.2 Własności granicy dolnej i górnej . . .
10.6 Granica, a struktura algebraiczna . . . . . . .
10.6.1 Sumy, różnica, iloczyn i iloraz funkcji
10.6.2 Granica sumy, różnicy i iloczynu . . .
10.6.3 Granica ilorazu . . . . . . . . . . . . .
10.7 Granica, a struktura porządkowa . . . . . . .
10.7.1 Zachowywanie nierówności w granicy .
10.7.2 Twierdzenie o trzech funkcjach . . . .
10.7.3 Granica funkcji monotonicznej . . . .
10.8 Granice w produkcie kartezjańskim . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
170
171
172
172
172
172
173
173
173
174
174
11 Ciągłość funkcji
11.1 Koncepcja ciągłości . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1.1 Definicja ciągłości . . . . . . . . . . . . . . . . . . . . . .
11.1.2 Kryteria ciągłości . . . . . . . . . . . . . . . . . . . . . . .
11.1.3 Ciągłość złożenia . . . . . . . . . . . . . . . . . . . . . . .
11.1.4 Ciągłość operacji arytmetycznych . . . . . . . . . . . . . .
11.1.5 Twierdzenie o lokalnym zachowywaniu znaku . . . . . . .
11.1.6 (*)Nieciągłości funkcji f : R → R . . . . . . . . . . . . . .
11.1.7 Ciągłość bijekcji monotonicznej . . . . . . . . . . . . . . .
11.2 Ciągłość, a zwartość . . . . . . . . . . . . . . . . . . . . . . . . .
11.2.1 Zwartość podprzestrzeni Rd . . . . . . . . . . . . . . . . .
11.2.2 (*)Intuicja zwartości i ogólna definicja zwartości. . . . . .
11.2.3 Przestrzenie zwarte . . . . . . . . . . . . . . . . . . . . . .
11.2.4 Obraz zbioru zwartego przez odwzorowanie ciągłe. . . . .
11.2.5 Funkcja ciągła na przedziale zwartym osiąga swoje kresy .
11.2.6 Funkcja odwrotna do funkcji ciągłej . . . . . . . . . . . .
11.3 Jednostajna ciągłość . . . . . . . . . . . . . . . . . . . . . . . . .
11.3.1 Funkcje Lipschitza . . . . . . . . . . . . . . . . . . . . . .
11.4 Ciągłość, a spójność . . . . . . . . . . . . . . . . . . . . . . . . .
11.4.1 Spójne podzbiory R̄. . . . . . . . . . . . . . . . . . . . . .
11.4.2 (*)Przestrzenie spójne . . . . . . . . . . . . . . . . . . . .
11.4.3 Obraz zbioru spójnego przez odwzorowanie ciągłe. . . . .
11.4.4 Własność Darboux. . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
177
177
177
178
178
178
178
179
180
180
180
181
183
183
184
184
185
185
186
186
186
187
187
. . . . .
w koło.
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
189
189
189
189
190
193
193
194
195
195
196
196
197
12 Szeregi
12.1 Eksperymenty numeryczne . . . . . . . . . . . . . . . . . .
12.1.1 Przybliżanie liczby π polami wielokątów wpisanych
12.1.2 Warunek konieczny zbieżności szeregu . . . . . . .
12.1.3 Rozbieżność do nieskończoności . . . . . . . . . . .
12.2 Własności podstawowe . . . . . . . . . . . . . . . . . . . .
12.2.1 Pojęcie szeregu . . . . . . . . . . . . . . . . . . . .
12.2.2 Szereg geometryczny . . . . . . . . . . . . . . . . .
12.3 Kryteria zbieżności
P∞ . . . . . . . . . . . . . . . . . . . . . .
12.3.1 Szereg n=1 n1p . . . . . . . . . . . . . . . . . . . .
12.3.2 Kryterium Leibniza . . . . . . . . . . . . . . . . .
12.3.3 Kryterium Cauchy’ego i kryterium d’Alemberta . .
12.3.4 Szeregi potęgowe . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
SPIS TREŚCI
12.4 Operacje na szeregach . . . . . . . . . . .
12.4.1 Suma i iloczyn szeregów . . . . . .
12.4.2 (**)Permutacja szeregu i zbieżność
12.4.3 (**)Twierdzenie Riemanna . . . .
12.4.4 Szeregi w programie Mathematica
9
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
198
198
199
200
200
13 Funkcje wykładnicza, logarytmiczna i trygonometryczne
13.1 Funkcja wykładnicza i logarytmiczna . . . . . . . . . . . . .
13.1.1 Zespolona funkcja wykładnicza . . . . . . . . . . . .
13.1.2 Funkcja wykładnicza ex . . . . . . . . . . . . . . . .
13.1.3 Logarytm naturalny . . . . . . . . . . . . . . . . . .
13.1.4 Funkcja wykładnicza ax . . . . . . . . . . . . . . . .
13.2 Funkcje trygonometryczne . . . . . . . . . . . . . . . . . . .
13.2.1 Nawijanie prostej na okrąg . . . . . . . . . . . . . .
13.2.2 Funkcje sin i cos . . . . . . . . . . . . . . . . . . . .
13.2.3 Liczba π . . . . . . . . . . . . . . . . . . . . . . . . .
13.2.4 Okresowość . . . . . . . . . . . . . . . . . . . . . . .
13.2.5 Wzory trygonometryczne . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
201
201
201
202
203
204
204
204
205
208
208
209
III
. . . . . . . . .
. . . . . . . . .
bezwarunkowa
. . . . . . . . .
. . . . . . . . .
Rachunek różniczkowy i całkowy
14 Przestrzenie wektorowe
14.1 Definicja przestrzeni wektorowej . . . . . . . .
14.1.1 Przestrzeń wektorowa . . . . . . . . . .
14.2 Przestrzenie wektorowe z iloczynem skalarnym
14.2.1 Iloczyn skalarny . . . . . . . . . . . . .
14.2.2 Nierówność Cauchy-Schwartza . . . . .
14.3 Przestrzenie wektorowe unormowane . . . . . .
14.3.1 Norma . . . . . . . . . . . . . . . . . . .
14.3.2 Norma euklidesowa . . . . . . . . . . . .
14.3.3 Przestrzenie Hilberta i Banacha . . . . .
211
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
213
213
213
214
214
215
215
216
216
216
15 Pochodne i różniczki.
15.1 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15.1.1 Definicja pochodnej . . . . . . . . . . . . . . . . . . . . . .
15.1.2 Pochodna funkcji stałej i identycznościowej. . . . . . . . . .
15.1.3 Pochodna lewo- i prawostronna. . . . . . . . . . . . . . . . .
15.1.4 Ciągłość funkcji różniczkowalnej . . . . . . . . . . . . . . .
15.2 Różniczka funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15.2.1 Aproksymacja liniowa . . . . . . . . . . . . . . . . . . . . .
15.2.2 Relacja "o małe" . . . . . . . . . . . . . . . . . . . . . . . .
15.2.3 Płaskość w zerze . . . . . . . . . . . . . . . . . . . . . . . .
15.2.4 Różniczkowalność . . . . . . . . . . . . . . . . . . . . . . . .
15.3 Różniczkowanie sumy, różnicy, iloczynu i ilorazu . . . . . . . . . .
15.4 Różniczkowanie funkcji złożonej . . . . . . . . . . . . . . . . . . . .
15.5 Różniczkowanie funkcji wykładniczej i funkcji trygonometrycznych
15.6 Nieciągłości pochodnej i funkcje klasy C 1 . . . . . . . . . . . . . . .
15.7 Metoda Newtona . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15.8 Ekstrema lokalne, a różniczkowalność. . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
219
219
219
220
221
222
223
223
225
226
226
228
230
232
234
235
238
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
SPIS TREŚCI
15.8.1 Maksima i minima lokalne . . . . . . . . . . . . . . .
15.8.2 Twierdzenie Rolle’a. . . . . . . . . . . . . . . . . . .
15.9 Twierdzenie o wartości średniej . . . . . . . . . . . . . . . .
15.9.1 Uogólnione twierdzenie o wartości średniej . . . . . .
15.9.2 Twierdzenie Lagrange’a o wartości średniej . . . . .
15.9.3 Twierdzenie o przyrostach skończonych . . . . . . .
15.10Zastosowania twierdzenia o wartości średniej . . . . . . . .
15.10.1 Pochodna, a monotoniczność . . . . . . . . . . . . .
15.10.2 Twierdzenie o wartościach pośrednich dla pochodnej
15.10.3 Reguła de l’Hospitala . . . . . . . . . . . . . . . . .
15.11Różniczkowanie funkcji odwrotnej . . . . . . . . . . . . . . .
15.11.1 Wzór na pochodną funkcji odwrotnej . . . . . . . . .
15.11.2 Pochodna funkcji logarytmicznej . . . . . . . . . . .
15.11.3 Funkcje kołowe (odwrotne do trygonometrycznych) .
15.11.4 Pochodna funkcji potęgowej . . . . . . . . . . . . . .
15.12Pochodne wyższych rzędów . . . . . . . . . . . . . . . . . .
15.12.1 n-ta pochodna . . . . . . . . . . . . . . . . . . . . .
15.12.2 Wielomian Taylora . . . . . . . . . . . . . . . . . . .
15.12.3 n-płaskość w zerze. . . . . . . . . . . . . . . . . . . .
15.13Wzory Taylora i szereg Taylora. . . . . . . . . . . . . . . . .
15.13.1 Wzór Taylora z resztą Peano. . . . . . . . . . . . . .
15.13.2 Wzór Taylora z resztą Lagrange’a . . . . . . . . . . .
15.13.3 Punkty przegięcia . . . . . . . . . . . . . . . . . . .
15.13.4 Szereg Taylora . . . . . . . . . . . . . . . . . . . . .
16 Całka oznaczona
16.1 Całka Riemanna funkcji jednej zmiennej . . . . . . .
16.1.1 Pole obszaru. . . . . . . . . . . . . . . . . . .
16.1.2 Przedziały w R i ich podziały. . . . . . . . . .
16.1.3 Całkowalność w sensie Riemanna . . . . . . .
16.1.4 Epsilonowe kryterium całkowalności . . . . .
16.2 Własności całki Riemanna . . . . . . . . . . . . . . .
16.2.1 Monotoniczność całki . . . . . . . . . . . . .
16.2.2 Przestrzeń wektorowa funkcji całkowalnych w
16.2.3 Miarowe kryterium całkowalności. . . . . . .
16.2.4 Całkowalność złożenia i iloczynu . . . . . . .
16.2.5 Całka Riemanna na podprzedziale . . . . . .
16.2.6 Całka oznaczona . . . . . . . . . . . . . . . .
16.2.7 Twierdzenie Riemanna . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
238
238
238
238
239
240
240
240
241
241
244
244
245
245
246
246
246
248
249
250
250
251
253
253
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
sensie Riemanna.
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
257
257
257
257
259
260
262
262
262
263
263
263
264
264
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
269
269
269
270
270
271
271
272
274
17 Funkcja pierwotna i całka nieoznaczona
17.1 Podstawowe twierdzenie rachunku różniczkowego i całkowego . . . .
17.1.1 Pochodna całki . . . . . . . . . . . . . . . . . . . . . . . . . .
17.1.2 Funkcja pierwotna i całka nieoznaczona. . . . . . . . . . . . .
17.1.3 Podstawowe twierdzenie rachunku różniczkowego i całkowego
17.2 Podstawowe techniki całkowania. . . . . . . . . . . . . . . . . . . . .
17.2.1 Własności całki nieoznaczonej. . . . . . . . . . . . . . . . . .
17.2.2 Całkowanie przez części . . . . . . . . . . . . . . . . . . . . .
17.2.3 Całkowanie przez podstawienie . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
SPIS TREŚCI
17.2.4 Twierdzenia o wartości średniej dla całek
17.3 Całkowanie funkcji wektorowych . . . . . . . . .
17.4 Zastosowania geometryczne całek . . . . . . . . .
17.4.1 Długość krzywej . . . . . . . . . . . . . .
17.4.2 Bryła obrotowa . . . . . . . . . . . . . . .
17.4.3 Obętość bryły obrotowej . . . . . . . . . .
17.4.4 Pole powierzchni bocznej bryły obrotowej
11
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
275
276
277
277
278
279
279
18 Ciągi i szeregi funkcyjne
18.1 Zbieżność punktowa i jednostajna . . . . . . . . . . . . . . . . . .
18.1.1 Zbieżność punktowa . . . . . . . . . . . . . . . . . . . . .
18.1.2 Zbieżność jednostajna . . . . . . . . . . . . . . . . . . . .
18.1.3 Kryterium Cauchy’ego zbieżności jednostajnej . . . . . . .
18.2 Zbieżność jednostajna, a ciągłość, różniczka i całka . . . . . . . .
18.2.1 Granica, a zbieżność jednostajna . . . . . . . . . . . . . .
18.2.2 Całkowanie i różniczkowanie, a zbieżność jednostajna . . .
18.3 Aproksymacja funkcji ciągłych . . . . . . . . . . . . . . . . . . .
18.4 Szeregi potęgowe . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.4.1 Twierdzenie o szeregu Taylora . . . . . . . . . . . . . . . .
18.4.2 Funkcje analityczne . . . . . . . . . . . . . . . . . . . . .
18.5 Szeregi Fouriera . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.5.1 Wielomiany trygonometryczne . . . . . . . . . . . . . . .
18.5.2 Zespolony iloczyn skalarny . . . . . . . . . . . . . . . . .
18.5.3 Przestrzeń wektorowa z zespolonym iloczynem skalarnym
18.5.4 Układ ortonormalny . . . . . . . . . . . . . . . . . . . . .
18.5.5 Szereg Fouriera . . . . . . . . . . . . . . . . . . . . . . . .
18.5.6 Rzut ortonormalny . . . . . . . . . . . . . . . . . . . . . .
18.5.7 Jądro Dirichleta . . . . . . . . . . . . . . . . . . . . . . .
18.5.8 Zbieżność punktowa szeregu Fouriera . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
281
281
281
282
284
285
285
286
286
286
287
287
289
289
290
291
292
293
296
297
298
12
SPIS TREŚCI
Wstęp
Niniejsze notatki do kursów Elementy Logiki i Teorii Mnogości oraz Analiza Matematyczna I przeznaczonego dla studentów kierunku Matematyka Komputerowa stanowią roboczą wersję i w trakcie kursu mogą podlegać aktualizacji. Punktem
wyjścia tych notatek jest rękopis moich materiałów do wykładu z analizy matematycznej prowadzonego w latach 1984-1990
dla studentów informatyki UJ. W owym czasie był to bardzo obszerny kurs obejmujący 240h wykładów i 240h ćwiczeń.
Wykładało i studiowało się wtedy zupełnie inaczej, bo wykładowca miał do dyspozycji tylko tablicę i kredę, a studenci to
co zdołali w trakcie wykładu zanotować.
Dziś możliwości są zupełnie inne, stąd i te notatki są inne, choć w dużym stopniu wykorzystują jeszcze mój dawny
rękopis. Już wtedy starałem się o to, by część odnosząca się do intuicji była obszerna i równocześnie wyraźnie oddzielona
od części formalnej. Wydaje się, że takie podejście jest szczególnie ważne dla studentów specjalności Matematyka Komputerowa, dlatego planuję je kontynuować również w ramach obecnego wykładu. Część materiału poświęcona intuicjom ma
charakter całkowicie nieformalny. Dla wyraźnego odróżnienia od części formalnej jest złożona brązową, pochyloną czcionką.
W szczególności cały pierwszy rozdział jest nieformalny. Nieformalne mówienie o matematyce rodzi często więcej pytań niż
daje odpowiedzi. Ale takie właśnie jest jej zadanie: sprowokować do myślenia. Dociekliwy czytelnik, który czyta najpierw
nieformalny tekst matematyczny wyrabia sobie pewne idee, które wymagają dopracowania. W moim przekonaniu takie podejście powoduje, że studiowanie tekstu formalnego, który to dopracowanie dostarcza, staje się w efekcie bardziej naturalne i
znacznie łatwiejsze. Najważniejsze pytania jakie rodzi tekst nieformalny zostały w tekście wyróżnione poprzez umieszczenie
w ramce o różowym tle. Pytań jest oczywiście dużo więcej niż tych, które w tekście zostały jawnie postawione.
Różne kolory tła tekstu oznaczają: blado pomarańczowy - twierdzenia, blado zielony - definicje, różowy - problemy,
blado niebieski (C++) i blado fioletowy (Mathematica) - listingi programów komputerowych, żółłty - ćwiczenia tablicowe,
niebieski - ćwiczenia kokmputerowe.
W notatkach odręcznych
• znak i oznacza początek dowodu indukcyjnego,
• znak s oznacza początek dowodu nie wprost,
• znak x oznacza sprzeczność,
• znak p oznacza początek dowodu przez przypadki,
• znak
oznacza koniec fragmentu dowodu,
• znak
oznacza koniec dowodu,
• wytłuszczony wykrzyknik zastępuje słowo "niech",
• dwie pionowe kreski po lewej stronie tekstu oznaczają materiał nieformalny.
Aspekty obliczeniowe analizy matematycznej, ilustrowane programami komputerowymi w języku C++ oraz instrukcjami
programu Mathematica złożone są czcionką w kolorze niebieskim.
Znajomość rozdziałów, podrozdziałów i dowodów oznaczonych (*) obowiązuje jedynie studentów mierzących w ocenę
bdb. Rozdziały i podrozdziały oznaczone (**) są nieobowiązkowe.
Życzę wszystkim uczestnikom kursu udanego studiowania matematyki komputerowej na Wydziale Matematyki i Informatyki UJ.
Rozdział 1
Wprowadzenie do analizy matematycznej
Nim zabierzemy si˛e do studiowania analizy matematycznej w szczegółach, warto sobie zadać pytanie czym analiza matematyczna si˛e zajmuje. Nie da si˛e na nie
dać dobrej odpowiedzi bez przyjrzenia si˛e jak koncepcje, które ukształtowały współczesna˛ analiz˛e matematyczna˛ stopniowo kształtowały si˛e na przestrzeniach
dziejów. Niniejszy rozdział wprowadzajacy
˛ stanowi krótki przeglad
˛ podstawowych problemów analizy matematycznej oraz ich umiejscowienia w historii matematyki.
1.1
1.1.1
Rozwój pojęcia liczby
Liczby naturalne
Umiej˛etność posługiwania si˛e liczbami rozwijała si˛e u człowieka stopniowo. Pierwotny zbiór liczebników ograniczał si˛e do trzech: jeden, dwa i wiele. Wraz z
rozwojem ludzkiej cywilizacji pojawiła si˛e konieczność dokładnego rozeznania w liczebności oddziału wojowników, stada bydła, czy zestawu strzał. Tak zrodziła si˛e
umiej˛etność porównywania liczności zbiorów, która doprowadziła do pojawienia si˛e abstrakcyjnego poj˛ecia liczby naturalnej. Zapewne niedługo potem człowiek
nauczył si˛e te liczby dodawać, odejmować i mnożyć. Operacje te wymagały opanowania stosownych algorytmów post˛epowania, a ich efektywność silnie zależała
od stosowanego sposobu zapisu liczb. Używany przez nas dziś dziesiatkowy
˛
system pozycyjny wywodzi si˛e z Indii, gdzie pojawił si˛e około VIII w. To tam też po raz
piewrwszy zaakceptowano zero jako pełnoprawna˛ liczb˛e, przydatna˛ w rachunkach.
1.1.2
Ułamki
Pojawienie si˛e ułamków wiaże
˛ si˛e z rozwojem handlu, który wymagał doskonalenia umiej˛etności mierzenia. Do mierzenia używano miary. Na przykład w przypadku
płynów i materiałów sypkich mogła to być gliniana amfora o ustalonej obj˛etości. Poczatkowo
˛
zaniedbywano powstajace
˛ przy odmierzaniu cz˛eści ułamkowe, ale
gdy z biegiem czasu rosła potrzeba dokładności, wprowadzano miary pomocnicze b˛edace
˛ cz˛eścia˛ wyjściowej miary, na przykład połowa,˛ jedna˛ trzecia˛ czy jedna˛
czwarta.˛ Co charakterystyczne, były to tzw. ułamki proste, czyli ułamki o liczniku jeden. Gdy handel zaczał˛ przekraczać granice pojedynczych plemion pojawiła si˛e
konieczność wprowadzania przelicznika dla różnych systemów miar obowiazuj
˛ acych
˛
w różnych rejonach. To zapewne przyczyniło si˛e do powstania abstrakcyjnej
postaci ułamka.
1.1.3
Liczby ujemne, całkowite i wymierne
Dwie liczby naturalne i dwa ułamki można zawsze do siebie dodać i w wyniku powstaje inna liczba naturalna lub inny ułamek. Jednakże od liczby a nie można odjać
˛
liczby b gdy b ­ a bez rozszerzenia zbioru liczb o liczby ujemne i zero. Jak wiemy z każda˛ liczba˛ a powiazać
˛ można liczb˛e do niej przeciwna,˛ oznaczana˛ −a,
tak że ich suma daje zero. Zbiór liczb naturalnych rozszerzony o zero i liczby przeciwne do liczb naturalnych nazywamy zbiorem liczb całkowitych, a analogicznie
rozszerzony zbiór ułamków nazywamy zbiorem liczb wymiernych. Zwyczajowo stosujemy oznaczenia N dla liczb naturalnych, Z dla liczb całkowitych oraz Q dla
liczb wymiernych. Natomiast zbiór liczb wymiernych dodatnich, czyli po prostu zbiór klasycznych ułamków oznaczamy Q+ .
Liczby ujemne w pewnym stopniu były znane już w starożytnych Chinach i Indiach, gdzie interpretowane były w kategoriach długu. Jednak nie były specjalnie
doceniane i na codzień radzono sobie bez nich. Matematyka europejska zaakceptowała liczby ujemne dopiero w XVII w, ale nawet dziś w życiu codziennym
13
14
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.1: Pitagoras z Samos, VI w. przed Chrystusem. Źródło: Wikipedia
2
2
Rysunek 1.2: c2 = (a + b)2 − 4 ab
2 =a +b
jesteśmy w stanie radzić sobie bez liczb ujemnych. Najwi˛ekszy pożytek z liczb ujemnych jest przy ujednolicaniu algorytmów, gdyż dzi˛eki nim nie musimy rozważać
różnych przypadków, by zagwarantować, że wszystkie rozważane w trakcie pracy algorytmu liczby sa˛ dodatnie.
1.1.4
Liczby niewymierne
Odkrycie, że ułamki nie wystarczaja˛ do mierzenia dowolnych wielkości przypisuje si˛e szkole pitagorejskiej, wywodzacej
˛ si˛e od żyjacego
˛
w VI w. przed Chrystusem
w Grecji Pitagorasa z Samos (rys.1.1). Pitagorejczycy świ˛ecie wierzyli, że ułamki wystarczaja˛ do zmierzenia dowolnych długości. Dlatego dokonane przez nich
odkrycie było dla nich ciosem, tym wi˛ekszym, że było konsekwnecja˛ słynnego twierdzenia udowodnionego przez Pitagorasa (rys.1.2).
Twierdzenie 1.1.1 (Pitagoras z Samos) W trójkacie
˛ prostokatnym
˛
suma kwadratów przyprostokatnych
˛
jest równa kwadratowi przeciwprostokatnej.
˛
Z twierdzenia Pitagorasa wynika, że przekatna
˛ kwadratu o boku długości jeden jest liczba,˛ która podniesiona do kwadratu wynosi dwa, czyli tak zwanym
pierwiastkiem z dwóch (rys. 1.3). Pitagorejczycy pierwsi zauważyli, że żaden ułamek podniesiony do kwadratu nie może dać liczby dwa. Było to szokujace
˛
1.1. ROZWÓJ POJĘCIA LICZBY
15
Rysunek 1.3: Przekątna kwadratu to
√
2. Ale ile to jest
√
2?
spostrzeżenie, z którym niełatwo było si˛e pogodzić. Tak pojawiły si˛e liczby niewymierne, a wraz nimi problem ich przybliżania ułamkami.
• Rozkładajac
˛ na czynniki pierwsze licznik i mianownik ułamka spróbuj uzasadnić, dlaczego
√
• Czy podobne rozumowanie może być przeprowadzone dla 3 2? dla innych pierwiastków?
Ćwiczenie 1.1.2
√
2 nie może być ułamkiem.
√
Problem 1.1.3 Czy wiemy czym naprawd˛e jest liczba 2? Czy ona rzeczywiście ma sens? Jakich liczb jeszcze brakuje wśród ułamków, by wszystkie
długości dało si˛e wymierzyć? W jaki sposób je zdefiniować?
1.1.5
Liczby rzeczywiste
Precyzyjna definicja liczby niewymiernej jest skomplikowana. Stwierdzenie, że liczby niewymierne, to wszystkie liczby, które nie sa˛ wymierne jest dobra˛ definicja˛
tylko wtedy gdy wiemy co oznacza zwrot "wszystkie liczby". Intuicyjnie chodzi nam o taki zbiór liczb, który pozwala mierzyć długości tak odcinków jak i krzywych.
Zbiór takich liczb został precyzyjnie zdefiniowany dopiero w XIX wieku. Określa si˛e go mianem zbioru liczb rzeczywistych i oznacza symbolem R. Natomiast zbiór
liczb rzeczywistych dodatnich oznacza si˛e symbolem R+ .
1.1.6
Liczby urojone i zespolone
Określenie liczby rzeczywiste zrodziło si˛e w kontraście do tzw. liczb urojonych. Liczba urojona to liczba, której kwadrat jest liczba˛ ujemna.˛ Kwadrat liczby rzeczywistej nie może być ujemny, tak wi˛ec liczb urojona nie jest liczba˛ rzeczywista.˛ Sensowność takich liczb długo budziła watpliwości,
˛
co wyjaśnia ich nazw˛e.
Liczby zespolone, b˛edace
˛ sumami liczb rzeczywistych i urojonych, maja˛ wiele cech podobnych do liczb rzeczywistych, a także wiele zalet, których liczby
rzeczywiste nie maja.˛ Dzi˛eki temu pozwalaja˛ rozwiazywać
˛
pewne problemy "na skróty". Jednym z pierwszych pożytków z liczb zespolonych było podanie w XVI
wieku algorytmów wyznaczania miejsc zerowych równania trzeciego i czwartego stopnia.
1.1.7
Liczby w komputerze
Rachunki liczbowe na papierze wykonywane sa˛ zazwyczaj na ułamkach zwykłych, a cz˛eściej na ułamkach dziesi˛etnych.
Wraz ze zbudowaniem w połowie XX w. pierwszych komputerów stworzono też koncepcj˛e przechowywania i przetwarzania liczb w komputerze. Było to
konieczne, bo wszystko co przetwarza współczesny komputer na poziomie procesora sprowadza si˛e do wykonywania obliczeń na liczbach. Typowy użytkownik
16
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
komputera oglada
˛ filmy, słucha muzyki, przeglada
˛ strony internetowe albo po prostu gra na komputerze i nie uświadamia sobie, że wszystko to sprowadza si˛e do
przetwarzania liczb. Zazwyczaj sa˛ to liczby całkowite, ale wiele pozamatematycznych zastosowań wymaga też obliczeń na liczbach wymiernych.
Komputer jest oczywiście równie niezastapiony
˛
jeśli naszym celem jest przeprowadzenie mniej lub bardziej skomplikowanych obliczeń matematycznych, inżynierskich badź
˛ naukowych. Jeśli obliczenia sa˛ bardzo specjalistyczne, jest ich szczególnie dużo, a nam zależy na efektywności, piszemy własny lub zamawiamy
stosowny program w kompilowanym j˛ezyku wysokiego poziomu. Jeśli obliczenia sa˛ typowe, a ich ilość jest umiarkowana, si˛egamy po specjalistyczne oprogramowanie takie jak Mathematica, Maple, Matlab czy Scilab.
W ramach niniejszego kursu aspekty numeryczne analizy matematycznej demonstrować b˛edziemy programami napisanymi dla środowiska Mathematica, a
także programami napisanymi w j˛ezyku C++.
Mathematica to bogaty pakiet oprogramowania bardzo ułatwiajacy
˛ wszelkie obliczenia matematyczne. Umożliwia on tak prosta˛ prac˛e interaktywna˛ jak i pisanie
własnego oprogramowania. Na przykład, aby pomnożyć przez siebie liczby 123 i 456 wystarczy napisać
123∗456
i przycisnać
˛ rówcznocześnie klawisze ’Shift’ i ’Enter’. Przyciśni˛ecie ’Shift’ wraz ’Enter’ jest sygnałem, że oczekujemy przeprowadzenia obliczeń. Natychmiast
otrzymujemy wynik
56088
W programie Mathematica operacje arytmetyczne dodawania, odejmowania, mnożenia, dzielenia i pot˛egowania oznaczamy odpowiednio znakami +,-,*,/,^.
Tak wi˛ec piszac
˛
3^4
otrzymujemy
81
W podobny sposób przeprowadzamy obliczenia na ułamkach dziesi˛etnych. Na przykład
3.14 + 2.72
daje wynik 5.86. Trzeba jedynie pami˛etać, że zgodnie z anglosaskim zwyczajem używamy kropki dziesi˛etnej, a nie przecinka. Obliczenia na liczbach dziesi˛etnych
zwiazane
˛
sa˛ niestety z bł˛edami zaokragleń.
˛
Na przykład
1.0/3.0
daje 0.333333 co jest wynikiem przybliżonym. Bł˛edu zaokragleń
˛
można uniknać
˛ przeprowadzajac
˛ obliczenia na liczbach wymiernych. Jeśli napiszemy
1/3
Mathematica zwróci ułamek
1
,
3
a piszac
˛
7/3+3/11
otrzymamy jako wynik ułamek
86
.
33
co , w przeciwieństwie do obliczeń na liczbach dziesi˛etnych, jest wynikiem dokładnym. Jeśli potrzebujemy jednak przybliżenia dziesi˛etnego, zawsze możemy je
otrzymać. Piszac
˛
N[ 1 / 2 3 ]
otrzymujemy przybliżenie ułamka
1
23
0.0434783.
1.2. CIĄGI
1.2
17
Ciągi
1.2.1
Przybliżanie pierwiastka
Choć wśród ułamków brak jest takiego, który podniesiony do kwadratu daje liczb˛e dwa, to rozważajac
˛ wszystkie ułamki o mianowniku m znajdziemy taki, postaci
i
,
że
m
i
m
2
<2<
i+1
m
2
.
Dla danego m licznik taki jest dokładnie jeden. Sam pierwiastek z dwóch, czymkolwiek jest, leży gdzieś pomi˛edzy
1
dokładnościa˛ co najmniej m
. Na przykład, dla m = 5 mamy
i
m,
a
i+1
m ,
zatem
i
m
jest przybliżeniem
√
2z
2
2
7
49
64
8
=
<2<
=
5
25
25
5
zatem
7
5
1.2.2
jest przybliżeniem
√
2 z dokładnoscia˛ wi˛eksza˛ niż 15 . Aby dostać lepsza˛ dokładność wystarczy wziać
˛ odpowiednio duży mianownik m.
Ciągi przybliżeń
W praktyce wygodnie ograniczyć si˛e do mianowników postaci m = 10n . Niestety r˛eczne poszukiwanie stosownego licznika jest bardzo żmudne, a dla dużych
n praktycznie niewykonalne. Potrzebujemy algorytmu, który dla zadanego mianownika 10n pozwoli nam wyznaczyć stosowny licznik in oraz komputera, który
sprawnie wykona obliczenia w tym algorytmie. Łatwo zauważyć, że
in = max { i | i ∗ i < 2 ∗ 100n }.
n
Sugeruje to algorytm, który przy zadanym n sprawdza nierówność
√ i ∗ i < 2 ∗ 100 dla kolejnych liczb naturalnych i i zwraca in jako ostatnie i, dla którego
in
nierówność ta zachodzi. Wtedy xn := 10n jest przybliżeniem 2, które, jak łatwo sprawdzić, spełnia
|xn −
√
2| ¬
1
.
10n
Kolejne liczby xn tworza˛ tzw. ciag
˛ liczbowy, w tym przypadku tzw. ciag
˛ przybliżeń. Ciag
˛ przybliżeń, to ciag
˛ skonstruowany w celu przybliżania pewnej liczby
niewymiernej liczbami wymiernymi. Ciagi
˛ przybliżeń to nie jedyne ciagi
˛ rozważane w matematyce, choć ich rola praktyczna jest bardzo istotna. Badanie ciagów
˛
to
jeden z głównych obiektów zainteresowań analizy matematycznej.
Wprowadźmy w programie Mathematica rozdzielony średnikami ciag
˛ instrukcji
n = 3 ; i = 1 ; While [ i ^ 2 < 2 ∗ 1 0 0 ^ n , i = i + 1 ] ;
{ ( i −1)/10^ n , i / 1 0 ^ n }
Pojawiaja˛ si˛e tu zmienne i oraz n. Instrukcja While to instrukcja p˛etli. Jak długo spełniony jest warunek i^2 < 2*100^n wykonywana jest instrukcja
i = i + 1. Ponieważ przed wykonaniem instrukcji While ustawiliśmy zmienna˛ n na 3, a i na 1, p˛etl˛e wykonujemy dla kolejnych wartości i = 1, 2, . . . aż
zajdzie nierówność i^2 ­ 2000000. Mathematica wyprowadza jako wynik ostatnie obliczone wyrażenie, którym jest para ułamków {(i-1)/10^n,i/10^n}.
W rozważanym przypadku otrzymamy
{
√
707 283
,
}.
500 200
1
2 z dokładnościa˛ do 1000
.
√
Podstawiajac
˛ w powyższym listingu za n kolejne liczby naturalne i wykonujac
˛ obliczenia otrzymamy przybliżenia 2 od dołu i od góry o coraz lepszej
jako oszacowanie od dołu i od góry
18
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
dokładności:
14 15
,
10 10
141 142
,
100 100
1414 1415
,
1000 1000
14142 14143
,
10000 10000
141421 141421
,
100000 100000
1414213 1414213
,
1000000 1000000
···
Obliczenia
˛ przybliżeń od dołu i ciagu
˛ przybliżeń od
√ te, przynajmniej teoretycznie, możemy kontynuować w nieskończoność. Otrzymujemy w ten sposób ciag
góry liczby 2.
W tym miejscu trzeba zrobić uwag˛e na temat stosowanej w programie Mathematica notacji. Mathematica używa nawiasów wasiastych
˛
{, } do oznaczania list.
Zwyczajowo w matematyce nawiasów wasiastych
˛
używa si˛e do oznaczania zbiorów. Różnica ta ma znaczenie, bo przy wypisywaniu elementów listy kolejność jest
istotna, a przy wypisywaniu elementów zbioru nie jest. Innymi słowy, dwie listy, które różnia˛ si˛e tylko kolejnościa˛ elementów sa˛ różne, a dwa zbiory, które różnia˛ si˛e
tylko kolejnościa˛ w jakiej wymieniono ich elementy sa˛ traktowane jako identyczne. Korzystajac
˛ z programu Mathematica musimu o tej różnicy pami˛etać.
Zaproponowana tu metoda liczenia pierwiastka należy do najprostszych, ale oczywiście jest daleka od doskonałości. Mathematica radzi sobie doskonale
nie tylko z liczeniem pierwiastków, ale również innych funkcji elementarnych, w szczególności funkcji trygonometrycznych i funkcji logarytmicznej. Trzeba jednak
pami˛etać, że jeśli jako argument podamy liczb˛e dokładna,˛ na przykład naturalna˛ lub ułamek, a wynik nie jest liczba˛ naturalna˛ badź
˛ ułamkiem, aby zachować
dokładność Mathematica nie przeprowadzi obliczeń. Na przykład piszac
˛
Sqrt [ 2 ]
otrzymamy jako wynik
√
2. Ale piszac
˛
Sqrt [ 2 . ]
otrzymamy 1.41421.
Do zagadnienia obliczania pierwiastka b˛edziemy jeszcze wracać w dalszych rozdziałach.
Oczywiście ciagi
˛ nie musza˛ być zadawane w tak skomplikowany sposób jak nasz ciag
˛ przybliżeń. Najprościej zadać ciag
˛ podajac
˛ wzór na jego n-ty wyraz.
Na przykład ciag
˛ dany wzorem
xn =
1
n
to tak zwany ciag
˛ harmoniczny.
Problem 1.2.1 Czy ciag
˛ harmoniczny przybliża jakaś
˛ liczb˛e? Jeśli tak to jaka?
˛
Gdy ciag
˛ określony jest wzorem, na przykład wzorem (1.1), wystarczy napisać
Table [ 1 / n , { n , 1 . ,
10.}]
a otrzymamy przybliżenia poczatkowych
˛
wyrazów tego ciagu
˛
{1., 0.5, 0.333333, 0.25, 0.2, 0.166667, 0.142857, 0.125, 0.111111, 0.1}
(1.1)
1.2. CIĄGI
19
Rysunek 1.4: Wykres początkowych wyrazów ciągu 1 +
(−1)n
n .
Można też łatwo uzyskać wizualizacj˛e (wykres) ciagu.
˛ Na przykład wykres poczatkowych
˛
wyrazów ciagu
˛ danego wzorem
un = 1 +
(−1)n
n
uzyskamy piszac
˛
D i s c r e t e P l o t [ 1 + ( −1)^ n / n , { n , 1 , 5 0 } ]
Uzyskamy w ten sposób wykres przedstawiony na rys. 1.4.
1.2.3
Granice
√
√
Obrazowo mówimy, że ciag
˛ ten osiaga
˛ liczb˛e 2 w granicy, albo krócej, że zmierza do 2. Właśnie
√ w tym celu go skonstruowaliśmy. Ale czy możemy mieć
pewność, że nasz ciag
˛ dla dużych wartości n nie zmieni zdania i na przykład zamiast zmierzać do 2 zacznie uciekać do nieskończoności? Jesteśmy w stanie
policzyć tylko skończona˛ ilość wyrazów tego ciagu.
˛ Zawsze zostanie nieskończenie wiele wyrazów, których nie policzyliśmy. Czy możemy mieć pewność, że nasz
ciag
˛ przybliżeń nigdy nas nie zawiedzie?
Problem 1.2.2 Co to znaczy, że ciag
˛ osiaga
˛ jakaś
˛ liczb˛e w granicy (zmierza do granicy)? Jakie ciagi
˛ maja˛ granic˛e? Czy, kiedy i jak granic˛e daj˛e si˛e
policzyć?
Odpowiedź na te pytania to jedno z fundamantalnych zadań analizy matematycznej. Poj˛eciem granicy w takim badź
˛ innym sensie posługiwano si˛e już od
czasów starożytnych, jednak aż do wieku XIX matematycy nie umieli sobie poradzić z postawieniem precyzyjnej definicji. Dopiero czeski matematyk Bernard
Bolzano (rys.1.5) oraz niezależnie francuski matematyk, Augustin-Louis Cauchy (rys.1.5) pierwsi postawili precyzyjna˛ definicj˛e. Ponieważ prace Bolzano długo
pozostawały mało znane, przyj˛eło si˛e mówić o definicji Cauchy’ego.
Według definicji Cauchy’ego ciag
˛ liczb xn jest zbieżny do granicy g jeżeli dla każdego > 0 istnieje taka liczba naturalna N , że dla wszystkich liczb
naturalnych n ­ N zachodzi nierówność
|xn − g| < .
20
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.5: Augustin Louis Cauchy (1789 - 1857) i Bernard Bolzano (1781 - 1844) Źródło: Wikipedia
Piszemy wtedy
lim xn = g.
n→∞
Ćwiczenie komputerowe 1.2.3 Dla każdego z poniższych ciagów
˛
postaw hipotez˛e, czy ma on granic˛e. Jeśli uważasz, że ma granic˛e, spróbuj
odgadnać
˛ jaka.˛ Wcześniej przeprowadź eksperymenty wykorzystujac
˛ instrukcj˛e Table w Mathematica.
1.
n
n+1
2. 1 + (−1)n
3. 1 +
(−1)n
n
4. (*) cos nπ
5. (*) sin n
6. (*)
1.2.4
sin n
n
Obliczanie granic ciągu.
W praktyce niewiele granic liczy si˛e wprost z definicji, choć najprostsze granice właśnie tak si˛e wyznacza. Znajac
˛ już granice jakichś ciagów
˛
liczymy granice innych
ciagów
˛
korzystajac
˛ z różnych twierdzeń. Do najważniejszych należa˛
Twierdzenie 1.2.4 Jeśli ciagi
˛ an , bn sa˛ zbieżne odpowiednio do a i b to ich suma, różnia, iloczyn oraz iloraz sa˛ zbieżne odpowiednio do a + b,
a − b, ab, ab , przy czym w przypadku ilorazu trzeba dodatkowo założyć, że b 6= 0.
1.2. CIĄGI
21
Rysunek 1.6: Archimedes z Syrakuz (ok. 287–212 pne.) (medal Fieldsa). Źródło: Wikipedia
Twierdzenie 1.2.5 Jeśli ciagi
˛ an , bn , cn spełniaja˛ nierówność
an ¬ bn ¬ cn
i ciagi
˛ an oraz cn sa˛ zbieżne i to do tej samej granicy, to ciag
˛ bn też jest zbieżny i też do tej granicy.
Ćwiczenie 1.2.6
wielkości a.
1
• Posługujac
˛ si˛e definicja˛ granicy oblicz granice ciagów
˛
n,
• (*) Oblicz granice ciagów
˛
1.2.5
√1 , 1n
n 2
oraz ciagu,
˛ którego wszystkie wyrazy sa˛ stale równe stałej
2−3n+5n2
, 1+1√n .
n2
Liczba π
Wśród ważnych problemów rozważanych już w starożytności było wyznaczanie obwodu i pola koła o zadanym promieniu. Kluczowy w tych obliczeniach jest
obwód koła o średnicy jeden, zwyczajowo oznaczany grecka˛ litera˛ π . Koło o innej średnicy ma proporcjonalnie wi˛ekszy badź
˛ mniejszy obwód, w szególności koło
o promieniu r , a wi˛ec średnicy
2r
ma
obwód
2πr
.
√
Liczba π , podobnie jak 2, jest liczba˛ niewymierna,˛ ale o tym starożytni nie wiedzieli. Udowodniono to dopiero w XVIII w. Co wi˛ecej, w wieku XIX udowodniono, że π jest liczba˛ transcendentna,˛ to znaczy, że nie jest pierwiastkiem żadnego wielomianu o współczynnikach wymiernych. Oznacza to w szczególności, że
nawet jeśli zbiór ułamków rozszerzymy o wszystkie możliwe pierwiastki, to nadal nie wystarczy on do mierzenia wszelkich długości.
W starożytności przyjmowano różne liczby pomi˛edzy 3 i 3.16 jako przybliżenie liczby π bez przywiazywania
˛
szczególnej wagi do popełnianego bł˛edu. Dopiero
grecki matematyk Archimedes (rys. 1.6) zaproponował algorytmiczna˛ metod˛e wyznaczania π , która przez ponad 1000 lat dostarczała coraz lepszych przybliżeń.
Jest to metoda geometryczna, oparta o wpisywanie w okrag
˛ i opisywanie na okr˛egu wielokatów
˛ (rys.1.7). Posługujac
˛ si˛e 96-katem
˛
Archimedes oszacował, że
223/71 < π < 22/7 (3.1408 < π < 3.1429), co daje dobre przybliżenie π do dwóch miejsc po przecinku. Co ciekawe, w 1596 roku, ciagle
˛ w oparciu o
metod˛e metod˛e Archimedesa, holenderski matematyk Ludolph van Ceulen policzył π z dokładnościa˛ do 35 cyfr.
Oznaczmy przez an bok 2n -kata
˛ foremnego wpisanego w okrag
˛ o średnicy jeden. W oparciu o twierdzenie Pitagorasa można pokazać, że
√
2
a2 =
,
2
an+1
1
=
2
q
p
2 − 4 − 4a2n .
(1.2)
Zatem obwód tego 2n -kata
˛ wynosi An := 2n an .
Można si˛e spodziewać, że ciag
˛ An powinien zmierzać do liczby π , bo tyle wynosi obwód koła o średnicy jeden. W rozdziale 8.8.1 przyjrzymy si˛e bliżej
zachowaniu ciagu
˛ (1.2).
22
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.7: Przybliżanie obwodu i pola koła wielokątami
Ćwiczenie 1.2.7
• (*) Opierajac
˛ si˛e na swojej wiedzy z geometrii spróbuj uzasadnić wzór (1.2).
• (*) Uzasadnij stwierdzenie, że bok 2n -kata
˛ foremnego opisanego na okr˛egu o średnicy jeden wyraża si˛e wzorem
an
bn := p
.
1 − a2n
W programie Mathematica liczb˛e π zapisuje si˛e jako Pi.
1.3
1.3.1
Szeregi
Pole koła
Archimedesowi zawdzi˛eczamy również sposób liczenia pola koła. Zastosował on tu również metod˛e wielokatów.
˛
Najpierw zauważył, że pole n-kata
˛ foremnego
wpisanego w okrag
˛ można policzyć sumujac
˛ pola n trójkatów
˛ równoramiennych. Maja˛ one wszystkie jednakowa˛ podstaw˛e xn i jednakowa˛ wyskość hn , zatem
pole wielokata
˛ wynosi Pn := nxn2 hn co równe jest Ln2hn , gdzie Ln := nxn jest obwodem wielokata.
˛ Przy n zmierzajacym
˛
do nieskończoności wysokości
˛
hn zmierzaja˛ do promienia r koła, a obwody Ln zmierzaja˛ do obwodu koła, o którym wiemy już, że wynosi 2πr. Zatem pola Pn zmierzaja˛ do 2πrr
2 skad
wnosimy, że pole koła o promieniu r to
P := πr2 .
1.3.2
(1.3)
Liczba π poprzez szereg.
Powróćmy do obliczania liczby π . Widzieliśmy, że metoda oparta o przybliżanie obwodu koła daje niezbyt zadowalajacy
˛ wynik. Cz˛esto jednak, jeśli jeden algorytm
zastapimy
˛
innym, to możemy uzyskać lepsze wyniki przy zastosowaniu tej samej arytmetyki komputerowej. Wiemy, że liczba π jest nie tylko obwodem koła o
średnicy jeden, ale również polem koła o promieniu jeden.
Zast˛epujac
˛ pole tego koła polami wpisanych w nie 2n -katów
˛
foremnych również otrzymamy ciag
˛ przybliżeń liczby π . Oznaczmy przez Pn pole 2n -kata
˛
foremnego wpisanego w koło. Dla n = 1 rozważamy 2 − kt jako zdegenerowana,˛ pozbawiona˛ pola figur˛e redukujac
˛ a˛ si˛e do średnicy koła, zatem P1 = 0.
1.3. SZEREGI
23
Rysunek 1.8: Kolejne dodatki do pola koła.
Zauważmy, że 2n+1 -kat˛ powstaje z 2n -kata
˛ poprzez dorysowanie figury złożonej z 2n trójkatów
˛ równoramiennych wpisanych w koło o podstawach leżacych
˛
na
bokach 2n -kata
˛ (patrz rys. 1.8). Niech An oznacza pole tej figury. Zatem Zatem
Pn+1 = Pn + An ,
czyli An+1 jest poprawka,˛ która dodana do pola 2n -kata
˛ daje pole 2n+1 -kata.
˛ Stad
˛
Pn = A1 + A2 + A3 + A4 + . . . + An−1 ,
a pole koła PK otrzymamy sumujac
˛ wszystkie poprawki:
PK = A 1 + A 2 + A 3 + A 4 + . . . .
Wartości Ai można wyliczyć. Aby wykorzystać wzory z podrozdziału 1.2.5, zamiast koła o promieniu jeden rozważymy ponownie koło o średnicy jeden, a
wi˛ec o promieniu 1/2. Zatem ze wzoru (1.3) jego pole to π4 . Zatem jako przybliżenie π interesuje nas ciag
˛ sn := 4Pn . Niech Tn oznacza pole trójkata
˛
równoramiennego o podstawie równej bokowi 2n -kata,
˛ a ramionach równych bokowi 2n+1 -kata.
˛ Mamy
An = 2n Tn
Można policzyć, że Tn =
an (1−
√
4
1−a2n )
, gdzie an , jak poprzednio, oznacza bok 2n -kata
˛ foremnego wpisanego w koło o średnicy jeden. Zatem
Pn+1 = Pn + 2
n an (1
−
p
1 − a2n )
4
oraz
sn+1 = sn + 2n an (1 −
1.3.3
p
1 − a2n ).
(1.4)
Szeregi
Warto zwrócić uwag˛e, że ciag
˛ sn jest specyficzny. Jego m-ty wyraz może zostać zapisany w postaci
sm =
m
X
cn ,
(1.5)
n=1
gdzie


0
cn = 2
p

 n
2 an (1 − 1 − a2n )
dla n = 1,
dla n = 2,
dla n > 2.
24
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Ciag
˛ takiego typu nazywamy szeregiem o wyrazach cn .
Zazwyczaj (choć bardzo nieściśle) używamy zapisu
∞
X
cn
n=1
na oznaczenie szeregu o wyrazach cn , a sm dane wzorem (1.5) nazywamy m-ta˛ suma˛ cz˛eściowa˛ szeregu.
Mówimy, że szereg jest zbieżny, jeżeli ciag
˛ sn jest zbieżny. W takim przypadku granic˛e ciagu
˛ sn nazywamy suma˛ szeregu i oznaczamy tym samym symbolem
co sam szereg.
Szeregi odgrywaja˛ ważna˛ rol˛e w wielu zastosowaniach, dlatego badaniu ich zbieżności poświ˛eca si˛e w analizie matematycznej szczególna˛ uwag˛e. Szczególnie
ważne sa˛ narz˛edzia, które pozwalaja˛ określić, czy szereg jest zbieżny, czy nie. Jeśli nie wiemy czy szereg jest zbieżny, to nie możemy z pożytkiem wykorzystywać
w obliczeniach numerycznych.
1.4
1.4.1
Funkcje
Koncepcja funkcji
Koncepcja funkcji, jedna z fundamentalnych idei współczesnej matematyki, jako samodzielny obiekt badań pojawiła si˛e w drugiej połowie XVII w. W tym pierwotnym
uj˛eciu funkcja była rozumiana jako wartość, tzw. zmienna zależna, która˛ można obliczyć rachunkiem algebraicznym badź
˛ poprzez konstrukcje geometryczne w
oparciu o inna˛ wartość, tzw. zmienna˛ niezależna˛ oraz pewne stałe. Jako przykład pierwszej kategorii może tu posłużyć funkcja kwadratowa
x 7→ x2 ,
funkcja wyznaczajaca
˛ pole koła o promieniu r
r 7→ πr2 ,
czy ogólnie wielomian
x 7→ a0 + a1 x + a2 x2 + · · · + an xn .
1.4.2
Miejsca zerowe funkcji
Wśród ważnych zagadnień praktycznych jakie pojawiaja˛ si˛e w kontekście funkcji jest pytanie czy i dla jakich wartości zmiennej niezależnej, albo inaczej argumentu,
funkcja przyjmuje wartość zero. Argument taki nazywa si˛e miejscem zerowym funkcji.
Jedna˛ z prostych metod poszukiwania miejsca zerowego funkcji jest tzw. metoda bisekcji. Wymaga ona dysponowania dwoma argumentami a < b, w których
funkcja przyjmuje wartości o znakach przeciwnych. Konstruujemy wtedy rekurencyjnie dwa ciagi
˛
x1
:= a
y1
:= b
(
xn
:=
xn +yn
xn+1
2
(
yn+1
:=
n
)<0
if f (xn )f ( xn +y
2
otherwise.
yn
n
if f (yn )f ( xn +y
)<0
2
xn +yn
2
otherwise.
W wielu przypadkach, choć niestety nie zawsze, ciagi
˛ te daż
˛ a˛ do wspólnej granicy b˛edacej
˛ miejscem zerowym funkcji f .
1.4. FUNKCJE
25
Rysunek 1.9: Wykres wielomianu Q(x) := −16 + 16x2 − 4x3 − 3x4 + x5 .
Ćwiczenie komputerowe 1.4.1 (*) Zaimplementuj metod˛e bisekcji w j˛ezyku Mathematica. Przetestuj ja˛ dla funkcji
(1) x 7→ x2 − 3 dla a = 1 i b = 3
(2) x 7→
x+cos x
sin x
− 1 dla a = −1 i b = 1.
Postaw hipotezy na temat zbieźności ciagów
˛
xn i yn . Jeśli uznasz, że sa˛ one zbieżne do wspólnej granicy, zastanów si˛e, czy jest ona poszukiwanym
miejscem zerowym, a jeśli nie jest, to co jest tego przyczyna.˛
1.4.3
Wykres funkcji
Jeśli zadawala nas zgrubne przybliżenie miejsc zerowych funkcji, wystarczy narysować wykres funkcji. Z wykresu, obok miejsc zerowych możemy też odczytać
tzw. ekstrema, czyli najwi˛eksze i jakie najmniejsze wartości osiaga
˛ funkcja w zadanym zbiorze. Rys. 1.9 przedstawia wykres wielomianu Q(x) := −16 +
16x2 − 4x3 − 3x4 + x5 , z którego na przykład odczytać możemy, że wartościa˛ najmniejsza˛ w przedziale [−1, 1] jest −16. Analizowanie funkcji poprzez
narysowanie wykresu wystarcza jednak tylko do pobieżnego zapoznania si˛e z funkcja.˛ Jak zobaczymy, analiza matematyczna dostarcza znacznie lepsze metody
do analizowania własności funkcji.
Wykresy funkcji jednej zmiennej bardzo łatwo uzyskać przy pomocy programu Mathematica. Na przykład wykres wielomianu Q(x) := −16 + 16x2 −
3
4x − 3x4 + x5 na rys. 1.9 uzyskano instrukcja˛
P l o t [ − 16+16 x ^2 − 4 x ^3 − 3 x ^ 4 + x ^ 5 , { x , − 2 . 5 , 3 . 5 } ]
1.4.4
Geometryczne konstrukcje funkcji
Funkcje pierwotnie definiowane poprzez konstrukcje geometryczne, to przede wszystkim funkcje trygonometryczne, na przykład
x 7→ sin x.
26
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.10: Geometryczna definicja funkcji sin i cos: w wycinku koła o promieniu 1 i długości łuku x wartość sin x definiuje
się jako długość odcinka spuszczonego z końca łuku prostopadle do ramienia wycinka koła ze znakiem plus, gdy koniec łuku
jest ponad ramieniem, a znakiem minus, gdy koniec łuku jest poniżej ramienia.
Rysunek 1.11: Wykres funkcji sin.
Konstrukcj˛e geometryczna˛ sin x i cos x pokazano na rys. 1.10. W konstrukcji tej |x| jest interpretowane jako długość łuku wycinka koła o promieniu jeden, a
znak x rozstrzyga o wzajemnym położeniu poczatku
˛ i końca łuku. Przyj˛ete jest, że znak plus oznacza iż poczatek
˛ łuku wyst˛epuje przed końcem łuku przy ruchu
przeciwnym do ruchu wskazówek zegara. Wykres funkcji sin przedstawiono na rys. 1.11.
W wielu zastosowaniach bardziej od funkcji sin i cos przydaje si˛e funkcja tangens
tg : x 7→
sin x
cos x
ctg : x 7→
cos x
.
sin x
oraz funkcja cotangens
Ponieważ dzielenie przez zero nie ma sensu, funkcja tangens nie ma określonej wartości dla argumentów x, dla których funkcja cos przyjmuje wartość zero, a
funkcja cotangens dla argumentów, dla których funkcja sinus si˛e zeruje. Wykres funkcji tg przedstawiono na rys. 1.12.
W programie Mathematica zwyczajowo nazwy funkcji rozpoczyna si˛e od dużej litery. Sin, Cos, Tan, Cot to nazwy funkcji sinus, cosinus, tangens i cotangens.
Wykres funkcji sinus na rys. 1.11 uzyskano instrukcja˛
P l o t [ Sin [ x ] , { x , −2 Pi , 2 Pi } ]
1.4. FUNKCJE
27
Rysunek 1.12: Wykres funkcji tg.
Możemy też definiować własne funkcje, na przykład
f [ x_ ] : = x ^2
definiuje funkcj˛e, która zmiennej x przypisuje wartość x2 . Teraz piszac
˛
f [3]
otrzymamy wartość 9.
Co ciekawe, możemy też definiować funkcje, które w różnych przypadkach zdefiniowane sa˛ różnymi wzorami. Na przykład
g [ x _ ] : = I f [ x ^ 2 > 1 , x ^ 2 , − 1]
definiuje funkcj˛e, która˛ przy zastosowaniu tradycyjnej matematycznej notacji zapisalibyśmy wzorem
(
x2
x 7→
−1
gdy x2 > 1,
w przeciwnym razie.
Instrukcja If j˛ezyka Mathematica to tak zwana instrukcja warunkowa. Ma ona trzy argumenty. Zwraca drugi, gdy pierwszy ewaluuje si˛e do prawdy. W przeciwnym
razie zwraca argument trzeci.
1.4.5
Rozwijanie funkcji w szereg
Jednym z ważniejszych osiagni˛
˛ eć analizy matematycznej było odkrycie, że funkcje trygonometryczne nie musza˛ być obliczane metoda˛ geometryczna,˛ ale moga˛
być wyznaczone przez przybliżanie wartości szeregu. Na przykład
sin x = x −
∞
X
x3
x5
x2n+1
+
− ... =
(−1)n
,
1·2·3 1·2·3·4·5
(2n + 1)!
n=0
gdzie m! = 1·2·3 · · · n, czytane m silnia, to iloczyn kolejnych liczb naturalnych od 1 do m. Wzór ten oraz podobne wzory dla innych funkcji trygonometrycznych
odkrył w wieku XIV hinduski matematyk Madhavan of Sangamagramam.
Dzisiejsza definicja funkcji jest nieporównanie szersza od pierwotnej koncepcji i obejmuje ciagi
˛ jako szczególny przypadek. W stosowanej dzisiaj definicji nie
wnikamy w jaki sposób (algebraiczny, geometryczny czy jakikolwiek inny) określono jak zmiennej niezależnej przypisano zmienna˛ zależna,˛ traktujac
˛ ja˛ po prostu
jako skadś
˛ dana.˛ Taka˛ jest na przykład funkcja Dirichleta
(
x 7→
1 x∈Q
0 x∈
6 Q,
w której definicji nie interesujemy si˛e jak w praktyce sprawdzić, czy liczba jest wymierna czy nie jest.
28
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.13: Pole soczewkowatej figury jest różnicą pól pod wykresami funkcji.
1.5
1.5.1
Pola figur i całkowanie
Całka oznaczona
Widzieliśmy, że koncepcja granicy jest pomocna przy obliczaniu pola koła. W podobny sposób możemy post˛epować z innymi figurami. Problem można sprowadzić
do liczenia pola pod wykresem funkcji. Rozważmy na przykład figur˛e o soczewkowatym kształcie przedstawiona˛ na rys. 1.13.
Jak łatwo zauważyć pole tej figury jest różnica˛ pól pod wykresami funkcji
y
= −x2 + 2x,
y
= x2 .
Pole pod wykresem funkcji f na przedziale [a, b] określane jest mianem całki oznaczonej. Do policzenia całki oznaczonej z funkcji f na przedziale [a, b]
też możemy zastosować technik˛e przejścia granicznego. W tym celu dzielimy przedział [a, b] punktami a = x0 < x1 < x2 < . . . < xn = b na n
podprzedziałów, niekoniecznie równych, i nad każdym z nich budujemy prostokat˛ o wysokości równej wartości funkcji f w prawym końcu przedziału. Oznaczajac
˛
przez ∆xi := xi − xi−1 długość i-tego przedziału (i-ta˛ różnic˛e) i sumujac
˛ pola prostokatów
˛ otrzymujemy przybliżenie pola pod wykresem równe:
f (x1 )∆x1 + f (x2 )∆x2 + . . . f (xn )∆xn =
n
X
f (xi )∆Xi .
i=1
Biorac
˛ coraz wi˛ecej punktów i coraz krótsze przedziały, w granicy otrzymujemy poszukiwane pole. Oznaczamy je dość tajemniczym symbolem
Z
b
f (x)dx,
a
w którym znak sumy przekształcił si˛e w wydłużona˛ liter˛e ’S’, a różnica ∆xi w "nieskończonie mała˛ różnic˛e", czyli różniczk˛e, oznaczona˛ symbolem dx.
(1.6)
1.5. POLA FIGUR I CAŁKOWANIE
29
Rysunek 1.14: Pole pod wykresem ćwiartki okręgu.
Przykładowy efekt takiego post˛epowania dla funkcji
y=
p
1 − x2
na przedziale [0, 1] przy n = 5 przedstawiono na rys. 1.14.
Podobnie jak poprzednio naturalne jest oczekiwanie, że takie post˛epowanie w granicy da poszukiwane pole pod wykresem funkcji.
Ten sposób liczenia pól stosowano już w starożytności, choć zrozumienie przyczyn jego poprawności bardzo długo pozostawało mgliste. Proces przejścia
granicznego opisywano jako zastapienie
˛
skończonego podziału podziałem na nieskończona˛ ilość przedziałów o nieskończenie małej lecz dodatniej długości dx.
Ta tajemnicza liczba dx dawała po przemnożeniu przez wartość funkcji na tym przedziale kolejna˛ nieskończenie mała˛ lecz dodatnia˛ wartość f (x)dx. Dopiero
wysumowanie nieskończonej ilości tych nieskończenie małych wartości dawało poszukiwane pole. Opis ten oczywiście wyjaśnia zapis i nazw˛e całki (całkowita
suma, powstała przez wysumowanie wszystkich nieskończenie małych f (x)dx), ale w żadnym przypadku nie może być uznany za definicj˛e całki oznaczonej.
Dopiero niemiecki matematyk, Georg Friedrich Bernhard Riemann (rys. 1.15) podał jako pierwszy precyzyjna˛ definicj˛e całki oznaczonej oraz warunki, kiedy ta
definicja ma sens. Dziś wyrażenie (1.6) określa si˛e mianem sumy Riemanna.
1.5.2
Całka nieoznaczona
Zakładajac,
˛ że całka oznaczona z funkcji f jest dobrze zdefiniowana (do czego potrzebujemy sum Riemanna i granicy), możemy zdefiniować funkcj˛e
Z
F (u) :=
u
f (x)dx,
0
dla której zachodzi wzór
Z
b
f (x)dx = F (b) − F (a).
a
30
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.15: Georg Friedrich Bernhard Riemann, 1826-1866. Źródło: Wikipedia
Funkcja F spełniajaca
˛ powyższy wzór nosi nazw˛e całki nieoznaczonej funkcji f . Oznaczamy ja˛ (nieprecyzyjnie) symbolem
Z
f (x)dx
Jeśli potrafilibyśmy znaleźć analityczny sposób na znalezienie całki nieoznaczonej w oparciu o funkcj˛e f , liczenie pól znacznie ułatwiłoby si˛e. Żyjacy
˛ na
przełomie X i XI w. naukowiec arabski znany w Europie jako Alhacen potrafił pokazać (oczywiście w ówczesnym j˛ezyku matematyki), że jeśli f jest wielomianem
stopnia drugiego
f (x) := a0 + a1 x + a2 x2 ,
to jego całka˛ nieoznaczona˛ jest
F (x) := a0 x +
a1 x2
a2 x3
+
.
2
3
Alhacen potrafił też podać wzór na całk˛e nieoznaczona˛ dla wielomianów stopnia trzeciego i czwartego. Wykorzystujac
˛ ten wzór, możemy bardzo szybko
policzyć pole naszej soczewki z rys.1.13, bo przyjmujac
˛ wygodne oznaczenie
b
[F (u)]a := F (b) − F (u)
otrzymujemy
Z
1
x2 dx
0
Z
0
1
(−x2 + 2x)dx
=
x3
3
1
=
0
1
3
3
1
x
2x2
2
=
− +
= .
3
2 0
3
Płyna˛ z tego dwa ważne wnioski. Po pierwsze, granica skomplikowanego ciagu
˛ wcale nie musi być trudna˛ w wyliczeniu liczba˛ niewymierna.˛ Po drugie i
ważniejsze, poj˛ecie granicy może być pomocne nie tylko w obliczeniach liczb niewymiernych. Nie mniej, a może nawet wi˛ecej, przydaje si˛e ono do definiowania
nowych poj˛eć, trudnych do zdefiniowania inaczej.
1.6. STYCZNA DO KRZYWEJ I GRANICA FUNKCJI
31
Rysunek 1.16: Styczna do okręgu
1.6
1.6.1
Styczna do krzywej i granica funkcji
Styczna do krzywej
Problem wyznaczenia stycznej do krzywej w zadanym punkcie to też jeden z problemów rozwiazywanych
˛
już w starożytności przy wykorzystaniu przejścia granicznego. W uproszczeniu, styczna do krzywej w danym punkcie krzywej, to prosta przechodzaca
˛ przez zadany punkt, która w jego pobliżu nie przecina krzywej w
żadnym innym punkcie. Rys. 1.16 przedstawia styczna˛ do łuku okr˛egu.
Styczna˛ można wyznaczać geometrycznie, przykładajac
˛ do krzywej linijk˛e, ale nie jest to metoda dokładna. Lepiej jest wyliczyć kat˛ jaki styczna tworzy z prosta˛
pozioma,˛ albo tak zwany współczynnik nachylenia prostej, czyli tangens tego kata.
˛
Jeśli krzywa zadana jest funkcja˛ f , to współczynnik nachylenia stycznej w punkcie wykresu o współrz˛ednych (x0 , f (x0 )) można przybliżyć, analizujac
˛
sieczna˛ poprowadzona˛ z punktu (x0 , f (x0 )). Jest to prosta, która przecina krzywa˛ w punkcie (x0 , f (x0 )) oraz dodatkowo w punkcie (x1 , f (x1 )), gdzie
x1 = x0 + h jest bliskie x0 .
Rysujac
˛ stosowny trójkat˛ prostokatny
˛ (rys. 1.17), łatwo zauważyć, że tangens kata,
˛ jaki sieczna tworzy z osia˛ x wynosi
f (x1 ) − f (x0 )
f (x0 + h) − f (x0 )
.
=
x1 − x0
h
Zmierzajac
˛ z h do zera zbliżamy sieczna˛ do stycznej, a wi˛ec w granicy dostać powinniśmy współczynnik nachylenia stycznej. I rzeczywiście dostajemy, jeśli
tylko funkcja jest odpowiednio porzadna.
˛
Należy zwrócić uwag˛e, że mamy tu do czynienia z innego typu granica˛ niż rozważane do tej pory, bo nie rozważamy ciagu,
˛ lecz funkcj˛e
h 7→
f (x0 + h) − f (x0 )
h
(1.7)
zmiennej h (x0 traktujemy jako parametr). Jak definiuje si˛e granic˛e ciagu
˛ już mniej wi˛ecej wiemy. A jak si˛e to robi w przypadku granicy funkcji?
1.6.2
Granica funkcji
Chociaż poj˛eciem granicy funkcji operowano co najmniej od XVII w., to pierwsza˛ precyzyjna˛ definicj˛e postawił czeski matematyk Bernard Bolzano dopiero w 1817
roku, a używana˛ współcześnie definicj˛e podał niemiecki matematyk Karol Weierstrass (rys. 1.18).
32
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.17: Styczna i sieczna do krzywej.
Rysunek 1.18: Karol Weierstrass (1815-1897). Źródło: Wikipedia
1.6. STYCZNA DO KRZYWEJ I GRANICA FUNKCJI
33
Według Weierstrassa funkcja f ma w punkcie x0 granic˛e g jeżeli dla każdego > 0 istnieje δ > 0 takie, że dla wszystkich x 6= x0
|x − x0 | < δ ⇒ |f (x) − g| < .
Piszemy wtedy
lim f (x) = g.
x→x0
1.6.3
Funkcje ciągłe
Warto sobie od razu powiedzieć, że w przeciwieństwie do ciagów,
˛
typowa funkcja, z jaka˛ spotykamy si˛e na co dzień, jeśli jest określona w punkcie x0 , to ma w
nim granic˛e równa˛ swojej wartości w x0 . Może to robić wrażenie, że teoria granicy funkcji jest mniej użyteczna od granicy ciagu.
˛ Ale właśnie ten fakt, którego
bez poj˛ecia granicy funkcji nie da si˛e zaobserwować, jest interesujacy
˛ sam w sobie. Funkcje o tej własności określamy mianem ciagłych.
˛
Obrazowo mówimy, że
funkcja ciagła
˛ to taka funkcja, której wykres można narysować bez odrywania ołówka od papieru. Nie jest to do końca prawda,˛ bo dotyczy jedynie funkcji, których
dziedzina jest odcinkiem domkni˛etym.
1.6.4
Obliczanie granic.
Granica funkcji może być liczona w punkcie x0 , w którym funkcja jest nieokreślona, ale jest określona dla wartości różnych od x0 . Wtedy ciagłość
˛
funkcji w
punktach różnych od x0 nie wystarcza, by wyznaczyć granic˛e. Mimo to cz˛esto można ja˛ łatwo policzyć. Na przykład funkcja
f :x→
2x + x2
x
jest nieokreślona w zerze, ale określona dla wartości wi˛ekszych i mniejszych od zera. Dla wartości tych jest ona równa funkcji
x → 2 + x,
która jest ciagła
˛ i określona w zerze, a zatem ma w zerze granic˛e dwa. Zatem
lim f (x) = 2.
x→0
Przykład ten może wydawać si˛e sztuczny, ale docenimy jego wartość, gdy uświadomimy sobie, że dokładnie taka granica pojawia si˛e przy obliczaniu współczynnika
kierunkowego stycznej do wykresu funkcji x 7→ x2 w punkcie 1, bo zgodnie ze wzorem (1.7) jest to funkcja
h 7→
2h + h2
(x0 + h)2 − x20
=
,
h
h
czyli funkcja f . Oczywiście nie wszystkie granice funkcji daja˛ si˛e tak łatwo policzyć. I tu, jak w przypadku ciagów,
˛
korzystamy z różnych twierdzeń. W szczególności
dla funkcji można udowodnić odpowiedniki twierdzenia o trzech ciagach
˛
oraz o granicy sumy, różnicy, iloczynu i ilorazu.
Problem 1.6.1 Jak uogólnić poj˛ecie granicy, tak by granica ciagu
˛ i funkcji wpadały "do jednego worka" i odpowiednie twierdzenia obejmowały tak ciagi
˛
jak i funkcje? Jak dołaczyć
˛
do takiej definicji przypadek ciagu
˛ lub funkcji zmierzajacej
˛ do nieskończoności?
Oczywiście granica funkcji nie musi istnieć. Jest tak na przykład w przypadku funkcji
1
x 7→ sin ,
x
która jest określona i ciagła
˛ dla wszystkich x z wyjatkiem
˛
zera, ale w zerze nie ma granicy.
Z kolei funkcja
x 7→
sin x
,
x
która też jest określona i ciagła
˛ dla wszystkich x z wyjatkiem
˛
zera, w zerze ma granic˛e wynoszac
˛ a˛ jeden, ale nie jest oczywiste jak to pokazać. Jednak z z wykresu
(rys. 1.20) widać, że należy si˛e tego spodziewać.
34
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.19: Wykres funkcji x 7→ sin x1 . Granica tej funkcji w zerze nie istnieje
Rysunek 1.20: Wykres funkcji x 7→
sin x
x .
Granica tej funkcji w zerze wynosi jeden.
1.7. POCHODNA FUNKCJI
35
Rysunek 1.21: Wybrane styczne do wykresu funkcji. Na czerwono zaznaczono styczne w miejscach gdzie wykres się wznosi,
na zielono gdzie opada, a na żółto miejsca gdzie styczna jest pozioma.
1.7
1.7.1
Pochodna funkcji
Lokalne maksima i minima
Współczynnik nachylenia stycznej do wykresu funkcji niesie w sobie informacje o samej funkcji. Tam gdzie ten współczynnik jest dodatni funkcja (umownie) rośnie,
a gdzie jest ujemny maleje. Zerowa wartość współczynnika nachylenia oznacza, że styczna jest pozioma. Może to świadczyć o lokalnej górce (lokalne maksimum)
lub lokalnym dołku (lokalne minimum). Pozioma styczna może też wystapić
˛ w miejcu, chwilowo przestaje rosnać
˛ badź
˛ maleć.
1.7.2
Pochodna funkcji
Dlatego dla danej funkcji f interesujace
˛ jest poszukiwanie miejsc zerowych nowej funkcji, która punktowi x przypisuje współczynnik nachylenia stycznej do
wykresu funkcji f w punkcie x. Funkcja taka nazywana jest pochodna˛ funkcji f i oznaczana f 0 . Wiemy, że współczynnik kierunkowy stycznej obliczamy jako
granic˛e przy h → 0 wyrażenia
f (x + h) − f (x)
h
zwanego ilorazem różnicowym. Zatem
f 0 (x) = lim
h→0
f (x + h) − f (x)
h
oczywiście przy założeniu, że ta granica istnieje. Wprowadzajac
˛ oznaczenia na różnice
(x + h) − x = h
∆x
:=
∆y
:= f (x + h) − f (x)
możemy iloraz różnicowy napisać w postaci
∆y
,
∆x
(1.8)
36
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
co wyjaśnia jego nazw˛e. Używajac
˛ nieprecyzyjnego j˛ezyka nieskończenie małych można powiedzieć, że pochodna˛ funkcji otrzymujemy zast˛epujac
˛ w ilorazie różnicowym róznice ∆y i ∆x nieskończenie małymi różnicami oznaczanymi dy i dx i zwanymi różniczkami. Wyjaśnia to używana˛ do dziś nazw˛e teorii pochodnych:
rachunek różniczkowy. Sama koncepcja różniczki doczekała si˛e precyzyjnej definicji i choć odbiega ona od pierwotnej idei, pozwala zapis
f 0 (x) =
dy
dx
uczynić precyzyjnym.
Jeśli potrafimy ze wzoru na funkcj˛e f wyprowadzić wzór na funkcj˛e f 0 oraz potrafimy znaleźć miejsca zerowe funkcji f 0 , to potrafimy wskazać miejsca
podejrzane o wyst˛epowanie lokalnych minimów i lub maksimów. Okazuje si˛e, że choć w definicji pochodnej wyst˛epuje granica, to w wielu przypadkach jest to
granica, która˛ możemy policzyć czysto analitycznie bez konieczności stosowania przybliżeń. Na przykład dla funkcji x 7→ f (x) := x2 − 4x + 5 mamy
(x + h)2 − 4(x + h) + 5 − (x2 − 4x + 5)
h→0
h
= lim (2x + h − 4) = 2x − 4,
f 0 (x)
=
lim
h→0
bo funkcja x 7→ 2x − 4 jest ciagła.
˛ Widać, że f 0 (2) = 0, zatem funkcja f , jeśli ma gdzieś minimu lokalne to w punkcie 2.
1.7.3
Podstawowe twierdzenie rachunku różniczkowego i całkowego
Perski matematyk Sharaf al-Din al-Tusi już z końcem XII w. potrafił pokazać, że (używajac
˛ współczesnego j˛ezyka) pochodna˛ wielomianu trzeciego stopnia
Q(x) := b0 + b1 x + b2 x2 + b3 x3
jest
Q0 (x) = b1 + 2b2 x + 3b3 x2 .
Przypomnijmy, że około 200 lat wcześniej, Alhacen policzył, że całka˛ nieoznaczona˛
f (x) := a0 + a1 x + a2 x2 ,
jest
Z
F (x) =
f (x)dx = a0 x +
a2 x3
a1 x2
+
.
2
3
Podstawiajac
˛
b1
= a0
2b2
= a1
3b3
= a2
możemy zaobserwować, że jest zwiazek
˛ mi˛edzy mi˛edzy liczeniem pochodnej i całkowaniem:
Z
Q0 (x)dx
Z
0
f (x)dx
=
b1 x + b2 x2 + b3 x3 = Q(x) − b0
=
F 0 (x) = f (x).
Zatem już w XII w. były podstawy do odkrycia tego zwiazku,
˛
ale udało si˛e to dopiero 500 lat później. Pod koniec XVII w. Anglik Isaac Newton oraz Niemiec
Gottfried Leibniz (rys. 1.22) pokazali nast˛epujace
˛ twierdzenie
1.7. POCHODNA FUNKCJI
37
Rysunek 1.22: Isaac Newton (1643 - 1727) i Gottfried Leibniz (1646 - 1716). Źródło: Wikipedia
Twierdzenie 1.7.1 Jeśli f jest pochodna˛ funkcji F , to F jest całka˛ nieoznaczona˛ funkcji f . Jeśli F jest całka˛ nieoznaczona˛ funkcji f , to pochodna˛
funkcji F jest f .
Twierdzenie to jest dzisiaj określane mianem podstawowego twierdzenia rachunku różniczkowego i całkowego. Do czasu odkrycia tego twierdzenia teorie
pochodnej i całki rozwijane były niezależnie, przy czym w liczeniu pochodnych notowano wi˛eksze post˛epy niż w liczeniu całek. Odkrycie Newtona i Leibniza
pokazało, że w istocie jest jedna teoria, a każdy wzór na pochodna˛ jest równocześnie wzorem na całk˛e. Umożliwiło to liczenie wielu nowych całek, dało impuls do
intensywnego rozwoju rachunku różniczkowego i całkowego i przyczyniło si˛e do szybkiego rozwoju nauk technicznych.
38
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Część I
Elementy logiki i teorii mnogości
39
Rozdział 2
Matematyka zbiorów skończonych
Osobom postronnym cz˛esto si˛e wydaje, że badania matematyczne nie maja˛ zwiazku
˛ z otaczajac
˛ a˛ nas rzeczywistościa.˛ Jest to konsekwencja wysoce sformalizowanegeo j˛ezyka, którym współcześnie posługuje si˛e matematyka. Za tym formalizmem kryje si˛e jednak bardzo bogaty świat matematycznych intuicji, bezpośrednio
inspirowany nie tylko konkretnymi problemami nauki i techniki, ale przede wszystkim doświadczeniem i wyobrażeniami z codziennego życia. Matematycy rozwijaja˛
swoja˛ intuicj˛e wymyślajac
˛ i analizujac
˛ liczne przykłady. W przykładach tych poszukuja˛ powtarzajacych
˛
si˛e prawidłowości. Jeśli taka˛ prawidłowość uda si˛e wykryć
i nie udaje si˛e znaleźć przykładu, w którym prawidłowość nie zachodzi, formułuje si˛e hipotez˛e, że prawidłowość taka zachodzi zawsze. Hipoteza nie musi być i
cz˛esto nie jest w pełni prawidłowym opisem rzeczywistości, choć przynajmniej źdźbło prawdy cz˛esto w niej twki.
W odróżnieniu od wielu innych nauk, matematycy odrzucaja˛ intuicj˛e i eksperyment jako metod˛e rozstrzygajac
˛ a˛ co jest prawda.˛ Hipotez˛e trzeba uzasadnić
poprzez wyprowadzenie jej droga˛ logicznego rozumowania z uznawanych za oczywiste faktów. Rozumowanie takie nazywa si˛e dowodem, a hipotez˛e, dla której
udało si˛e podać dowód, twierdzeniem. W tym miejscu pojawia si˛e sformalizowany j˛ezyk. Przeprowadzenie matematycznego dowodu wymaga bowiem stosownej
teorii. W teorii takiej ustala si˛e najpierw podstawowe poj˛ecia, czyli tak zwane poj˛ecia pierwotne teorii oraz fakty uznawane za oczywiste, nazywane aksjomatami
teorii. Wszystkie inne poj˛ecia teorii definiowane sa˛ w oparciu o poj˛ecia pierwotne, a twierdzenia dowodzone sa˛ w oparciu o przyj˛ete aksjomaty. Wysoki stopień
sformalizowania j˛ezyka matematycznego dowodu ma uniemożliwić, a przynajmniej utrudnić, świadome lub nieświadome przemycenie do dowodu fałszywego
argumentu.
Logiczne rozumowanie jako metoda dochodzenia do prawdy towarzyszy ludzkości co najmniej od starożytności. W cywilizacji zachodniej podwaliny logiki
stworzył w IV stuleciu p.n.e. grecki filozof Arystoteles (ryc. 2.2). W kolejnym stuleciu grecki matematyk Euklides, (ryc. 2.2) w słynnym dziele zatytułowanym
Elementy, po raz pierwszy przedstawił sformalizowana˛ teori˛e matematyczna˛ opisujac
˛ a˛ geometri˛e. Jako poj˛ecia pierwotne przyjał˛ punkt i prosta.˛ Sformułował
też 10 aksjomatów. Nast˛epnie z aksjomatów tych wyprowadził wi˛ekszość znanych ówcześnie twierdzeń geometrii, w szczególności twierdzenie Pitagorasa.
Jako przykład matematycznej hipotezy posłużyć nam może słynna hipoteza Goldbacha z 1742 roku: każda˛ parzysta˛ liczb˛e naturalna˛ wi˛eksza˛ od dwóch można
przedstawić jako sum˛e dwóch liczb pierwszych. Widzimy, że rzeczywiście: 4 = 2 + 2, 6 = 3 + 3, 8 = 3 + 5, 10 = 5 + 5, 12 = 5 + 7, 14 = 7 + 7,
16 = 5 + 11, 18 = 5 + 13, 20 = 3 + 17, ... . Do dziś nie udało si˛e znaleźć ani dowodu tej hipotezy, ani kontrprzykładu, a wi˛ec wi˛ekszej od dwóch parzystej
liczby naturalnej, dla której rozkład na sum˛e dwóch liczb pierwszych nie istnieje. Dzi˛eki komputerom udało si˛e natomiast przeprowadzić eksperymenty, które
potwierdzaja,˛ że wśród liczb naturalnych nie wi˛ekszych niż 4 × 1018 nie ma kontrprzykładu. Teoria, w której ewentualny dowód hipotezy Goldbacha można byłoby
przeprowadzić, obejmuje liczby naturalne i operacj˛e ich dodawania jako poj˛ecia pierwotne oraz kilka faktów zbierajacych
˛
podstawowe własności liczb naturalnych,
na przykład przemienność dodawania, jako aksjomaty.
Świeżo sformułowana˛ hipotez˛e nadzwyczaj rzadko udaje si˛e od razu udowodnić. Co wi˛ecej, jeśli hipoteza jest bł˛edna, dowód nie jest możliwy. Trudności w
skonstruowaniu dowodu cz˛esto daja˛ podpowiedź jak znaleźć tak zwany kontrprzykład, a wi˛ec przykład, dla którego hipoteza nie zachodzi. To z kolei pozwala
zmodyfikować hipotez˛e i ponownie podjać
˛ prób˛e dowodu. Ten proces oscylacji pomi˛edzy próbami dowodu, budowaniem kontrpzykładu i modyfikowaniem hipotezy
niejednokrotnie trzeba wiele razy powtórzyć nim osiagnie
˛
si˛e sukces, czyli udowodnione twierdzenie. Właśnie dlatego uprawianie matematyki wspiera si˛e na dwóch
jednakowo ważnych podporach: intuicji i formaliźmie.
Niestety, gdy studiujemy matematyk˛e, najcz˛eściej mamy do czynienia wyłacznie
˛
z twierdzeniami i gotowymi już formalnymi dowodami. Cz˛esto brakuje czasu
na przyjrzenie si˛e dużej liczbie przykładów. A dopiero przeanalizowanie licznych przykładów pozwala na wyrobienie sobie intuicji niezb˛ednych do rzeczywistego
zrozumienia konkretnego twierdzenia. Analizowanie przykładów jest jednak zaj˛eciem żmudnym. Na szcz˛eście mamy dzisiaj komputery i programy, które bardzo
ułatwiaja˛ konstruowanie i analizowanie przykładów.
Jedna˛ z metod dowodzenia jest przeanalizowanie wszystkich możliwych przypadków. Jest to jednak możliwe tylko wtedy, gdy przypadków jest skończona
41
42
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
Rysunek 2.1: Dawid Hilbert, 1862-1943 oraz Kurt Gödel, 1906-1978. Źródło: Wikipedia
Rysunek 2.2: Arystoteles, IV w. p.n.e., rzymska kopia greckiego popiersia oraz Euklides, IV-III w. p.n.e., przedstawiony na
posągu w Muzeum Historii Naturalnej w Oksfordzie. Źródło: Wikipedia
ilość. Do pewnego stopnia dzieje si˛e tak w tak zwanej matematyce dyskretnej, a wi˛ec zajmujacej
˛ si˛e wyłacznie
˛
zbiorami zawierajacymi
˛
skończona˛ ilość elementów.
Jednak nawet w tym przypadku cz˛esto chcemy udowodnić, że coś zachodzi dla każdego zbioru skończonego, a zbiorów skończonych jest już nieskończenie wiele.
√
Niewymierność liczby 2 uświadomiła matematykom, że maja˛ przed soba˛ dwie drogi: albo pogodzić si˛e z faktem, że przekatna
˛ √ kwadratu o boku długości
jeden sama√długości nie posiada, albo zaakceptować stosowanie w rozumowaniach obiektów nieskończonych. W przypadku liczby 2 jest to niekończony ciag
˛
przybliżeń 2 liczbami wymiernymi.
Rozważania na temat nieskończonych obiektów przez całe tysiaclecia
˛
sprawiały matematykom dużo trudności. W szczególności w odniesieniu do ciagów
˛
przybliżeń używano poj˛eć "nieskończenie mały" lub "nieskończenie wielki" choć widać było, że poj˛ecia te sa˛ problematyczne: dało si˛e z nich wywieść tak wnioski
pożadane
˛
jak i nonsensowne.
W XIX wieku, wraz ze wzrostem precyzji w fromułowaniu idei rachunku różniczkowego i całkowego i pojawiajacymi
˛
si˛e coraz cz˛eściej sprzecznościami
zwiazanymi
˛
z nieodpowiednim posługiwaniem si˛e nieskończonościa,˛ zacz˛eła narastać potrzeba usystematyzowania metod badawczych matematyki. W 1920 roku
niemiecki matematyk Dawid Hilbert (rys. 2.1) zaproponował swój program bardzo formalnego podejścia do matematyki. Jest on dziś znany pod nazwa˛ program
Hilberta. Hilbert zuważył, że choć analiza matematyczna wymaga operowania nieskończonościa,˛ to j˛ezyk, w którym mówi si˛e o matematyce jest skończony, bo
składa si˛e ze skończonej ilości słów.
Hilbert postulował, że wszystkie twierdzenia matematyki należy wyprowadzić droga˛ formalnego dowodu z dobrze dobranego zestawu aksjomatów, czyli
możliwie oczywistych stwierdzeń przyjmowanych bez dowodu. Nie był to pomysł nowy: jak wspomnieliśmy, takie podejście do geometrii zaproponował Euklides.
Zasługa˛ Hilberta była obserwacja, że takie podejście może rozwiazać
˛ problemy z nieskończonościa.˛ Każde twierdzenie daje si˛e zapisać jako skończony ciag
˛ słów,
2.1. ZBIORY SKOŃCZONE
43
a każdy dowód jest skończonym ciagiem
˛
formuł, również zbudowanych ze skończonej ilości słów. Zatem poprawność dowodu można sprawdzić droga˛ skończonej
inspekcji i to również w przypadku gdy samo twierdzenie dotyczy zbiorów nieskończonych.
Matematycznym uj˛eciem formalnego opisu teorii matematycznej, w tym dowodów, zajmuje si˛e logika matematyczna oraz tzw. metamatematyka. Zazwyczaj
j˛ezyk metamatematyki nie jest już tak sformalizowany jak j˛ezyk formalny, który metamatematyka opisuje. Ale, zgodnie z obserwacja˛ Hilberta, metamatematyka
bada obiekty skończone (formuły j˛ezyka formalnego), wi˛ec sam j˛ezyk metamatematyki nie musi być do końca sformalizowany.
By jednak podejście takie było przekonujace
˛ wypada najpierw udowodnić, że zestaw przyj˛etych bez dowodu aksjomatów nie jest sprzeczny sam w sobie.
Hilbert goraco
˛ wierzył, że jego program da si˛e zrealizować. Jednak już 11 lat później austriacki matematyk Kurt Gödel (rys. 2.1) pokazał, że nie istnieje niesprzeczny
układ aksjomatów, z którego dałoby si˛e wyprowadzić wszystkie twierdzenia dotyczace
˛ liczb naturalnych. Innymi słowy, jeśli teoria obejmujaca
˛ arytmetyk˛e liczb
naturalnych jest niesprzeczna (wywiedziona z niesprzecznego zestawu aksjomatów) to jest niezupełna (sa˛ w niej zdania p, dla których nie ma dowodu ani dla p,
ani dla nieprawda, że p).
Pomimo twierdzenia Gödla jak i trudności w realizacji postulatu sprawdzenia niesprzeczności program Hilberta szybko przyjał˛ si˛e i pozostaje do dziś powszechnie przyj˛eta˛ metoda˛ uprawiania matematyki.
2.1
Zbiory skończone
Zaczniemy od przedstawienia teorii zbiorów skończonych, przy okazji nieformalnie przygladaj
˛ ac
˛ si˛e niektórym zbiorom nieskończonym. Teoria zbiorów skończonych
w swoich elementach nie różni si˛e wiele od teorii zbiorów nieskończonych, nie wymaga jednak takiej ostrożności jak post˛epowanie ze zbiorami nieskończonymi.
Formalna˛ teori˛e zbiorów nieskończonych przedstawimy w rozdziale 4.
Zbiór skończony definiujemy wymieniając jego elementy, na przykład:
{ a, b, c }
oznacza zbiór, którego elementami są trzy litery: a, b, c. W niniejszym rozdziale, to jest w rozdziale 2, mówiąc zbiór mamy
na myśli zbiór skończony, chyba, że wyraźnie zaznaczymy inaczej.
Zbiory oznaczamy zazwyczaj dużymi literami. Pisząc
Z := { 2, 3, 5, 7, 11, 13, 17, 19 }
definiujemy zbiór składający się z liczb 2, 3, 5, 7, 11, 13, 17 i 19 i nadajemy mu nazwę Z. Fakt, że liczba 5 jest elementem
zbioru Z zapisujemy jako 5 ∈ Z. Jeśli coś nie jest elementem zbioru, używamy znaku 6∈, na przykład 15 ∈
6 Z. Zbiór Z
możemy też opisać słownie: zbiór liczb pierwszych mniejszych od 20, symbolicznie
Z = { x | x jest liczbą pierwszą i x < 20 }.
Przypomnijmy, że liczba pierwsza to liczba naturalna większa od jeden, która dzieli się bez reszty tylko przez siebie i przez
liczbę jeden. Nie jest nią więc ani 9, ani 15, bo liczby te dzielą się przez 3. Nie jest nią też żadna liczba parzysta większa od
2.
Zaznaczmy, że przy definiowaniu zbioru kolejność w jakiej wymieniamy elementy nie ma znaczenia. Tak więc na przykład zapisy { 2, 3, 5, 7, 11, 13, 17, 19 }, { 2, 3, 17, 19, 5, 7, 11, 13 } czy { 19, 17, 13, 11, 7, 5, 3, 2 } definiują ten sam zbiór. Również
kilkakrotne wymienienie elementu nie wpływa na zawartość zbioru. Tak więc zapisy
{1, 2, 2, 3, 3, 3} oraz {1, 2, 3}
oznaczają ten sam zbiór.
Zbiór nieskończony czasami też próbujemy definiować poprzez wypisanie jego elementów:
{ 2, 4, 6, 8, 12, 14 . . . },
jednak nie jesteśmy w stanie wypisać ich wszystkich, wi˛ec wypisujemy tylko cz˛eść, zakładajac,
˛ że czytelnik sam, w razie potrzeby ustali na zasadzie analogii
co jeszcze do tego zbioru należy. W rozważanym przykładzie można si˛e domyśleć, że chodzi nam o zbiór liczb naturalnych parzystych. Ustalenie na zasadzie
analogii co jest elementem zbioru w istocie oznacza określenie własności czy formuły, która rozstrzyga co do naszego zbioru należy, a co nie należy. Jest to jedyny
44
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
Rysunek 2.3: Zbiór { x | x = (x1 , x2 ) i x21 + x22 <= 1 } zwizualizowany w układzie współrzędnych na płaszczyźnie.
formalnie poprawny sposób definiowania zbiorów nieskończonych. Jednak, jak zobaczymy później, problemy ze zbiorami nieskończonymi biora˛ si˛e stad,
˛ że nie
każda własność definiuje zbiór.
Jako przykład zbioru nieskończonego zadanego poprzez własność rozważmy
x jest para˛ liczb (x1 , x2 ) takich, że x21 + x22 <= 1.
Zaleta˛ takiego przykładu jest, że zwiazany
˛
z ta˛ formuła˛ zbiór
{ x | x = (x1 , x2 ) i x21 + x22 <= 1 }
łatwo zwizualizować rysunkiem na płaszczyźnie (rys. 2.3).
Warto sobie uświadomić, że wizualizacja, w szczególności wizualizacja komputerowa zbioru nieskończonego jest sama w sobie zbiorem skończonym. Wynika
to stad,
˛ że obraz komputerowy jest zbudowany ze skończonej liczby pikseli. Wrażenie, że punktów jest nieskończenie wiele wynika z niedoskonałości naszego
oka. Tak wi˛ec każda wizualizacja jest tylko pewnym przybliżeniem idei jaka˛ jest zbiór nieskończony.
Jak zobaczymy, czasami wygodnie jest też posłużyć się zbiorem pozbawionym jakichkolwiek elementów. Zbiór taki
określamy mianem zbiór pusty i oznaczany ∅. Czasami stosujemy też oznaczenie {}.
Zbiór {a} ma dokładnie jeden element, mianowicie a. Zbiór taki określamy mianem singleton. Podobnie definiujemy
dubleton {a, b} jako zbiór złożony z dwóch elementów a, b. W zasadzie definicję tę stosujemy tylko wtedy gdy a 6= b, gdyż
dla a = b zbiór {a, b} pokrywa się z singletonem {a}.
2.1.1
Operacje mnogościowe
Na zbiorach można wykonywać kilka podstawowych operacji, które mają pewne, choć ograniczone, podobieństwo do operacji
arytmetycznych na liczbach.
2.1. ZBIORY SKOŃCZONE
45
Rysunek 2.4: Wierszami od lewego górnego rogu: zbiory A i B, zbiór A ∪ B, zbiór A ∩ B i zbiór A B.
Definicja 2.1.1 Niech A, B będą zbiorami. Definiujemy ich sumę oraz iloczyn, różnicę i różnicę symetryczną odpowiednio jako
A∪B
:= { x | x ∈ A lub x ∈ B },
A∩B
:= { x | x ∈ A i x ∈ B },
A\B
:= { x | x ∈ A i x 6∈ B },
AB
:=
(A \ B) ∪ (B \ A).
Sumę zbiorów określamy też mianem unia zbiorów, a iloczym zbiorów mianem przecięcie zbiorów.
Rozważmy zbiory na płaszczyźnie
A = { (x1 , x2 ) | (x1 + 0.5)2 + x22 <= 1 } B = { (x1 , x2 ) | (x1 − 0.5)2 + x22 <= 1 }.
Łatwo sprawdzamy, że
A∪B
=
{ (x1 , x2 ) | (x1 + 0.5)2 + x22 <= 1 lub (x1 − 0.5)2 + x22 <= 1 },
A∩B
=
AB
=
{ (x1 , x2 ) | (x1 + 0.5)2 + x22 <= 1 i (x1 − 0.5)2 + x22 <= 1 },
{ (x1 , x2 ) | (x1 + 0.5)2 + x22 <= 1 i (x1 − 0.5)2 + x22 > 1 lub (x1 + 0.5)2 + x22 > 11 i (x1 − 0.5)2 + x22 <= 1 }.
Wizualizacj˛e tych zbiorów na płaszczyźnie przedstawiono na rys. 2.4).
Mówimy, że A, B są rozłączne jeżeli A ∩ B = ∅.
46
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
2.1.2
Zawieranie się i równość zbiorów. Podzbiory.
Definicja 2.1.2 Mówimy, że zbiór A zawiera się w zbiorze B lub inaczej, że A jest podzbiorem B jeśli każdy element
zbioru A jest też elementem zbioru B. Piszemy wtedy A ⊂ B. Jeśli ⊂ B i B ⊂ A, to mówimy, że zbiory A i B są
równe i piszemy A = B. Mówimy, że A jest podzbiorem właściwym B jeśli A ⊂ B i nie jest prawdą, że A = B.
Definicja 2.1.3 Zbiór podzbiorów zbioru A definiujemy jako zbiór postaci
P(A) := { U | U ⊂ A }.
Na przykład dla zbioru A = {a, b, c} mamy
P(A) = { ∅, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c} }.
2.1.3
Uzupełnienie zbioru.
Gdy mówimy o jakiejś matematycznej rzeczywistości, wygodnie jest rozważać zbiór wszystkich obiektów tej rzeczywistości. Gdy uprawiamy arytmetyk˛e, wygodnie
jest mówić o zbiorze wszystkich liczb, na przykład wszystkich liczb całkowitych lub wszystkich liczb rzeczywistych. W geometrii płaszczyzny wygodnie jest mówić
o zbiorze wszystkich punktów płaszczyzny, w polityce mi˛edzynarodowej o zbiorze wszystkich państw, w biologii o zbiorze wsztstkich gatunków. W odniesieniu
do takiego zbioru wszystkich obiektów rozważanej rzeczywistości matematycy używaja˛ określenia przestrzeń. Od strony formalnej przestrzeń jest synonimem
słowa zbiór, jednak określenie przestrzeń niesie w sobie dodatkowa˛ nieformalna˛ informacj˛e, że zbiór ten zawiera w sobie wszelkie inne zbiory obiektów, które w
rozważanej rzeczywistości moga˛ nas interesować.
Warto od razu zaznaczyć, że interesujace
˛ przestrzenie matematyczne na ogół sa˛ nieskończone. Tym niemniej z poj˛eciem przestrzeni dobrze jest si˛e oswoić
już teraz.
Definicja 2.1.4 Jeśli A ⊂ X to zbiór X \A nazywamy uzupełnieniem A do X i oznaczamy CX A. Gdy X jest ustalony
i znany z kontekstu, to uzupełnienie A do X oznaczamy po prostu CA lub \A.
Poj˛ecie uzpełnienia jest szczególnie wygodnie w odniesieniu do przestrzeni. Na przykład jeśli X to przestrzeń wszystkich państw, a E oznacza państwa
europejskie, to \E oznacza państwa, które nie leża˛ w Europie.
Rysunki 2.3 oraz 2.4 uzyskano przy pomocy pakietu oprogramowania PSets napisanego w języku Mathematica. Pakiet ten
pozwala na definiowanie zbiorów na płaszczyźnie zadanych formami zdaniowymi zbudowanymi z nierówności algebraicznych.
Aby móc korzystać z pakietu, trzeba go najpierw wczytać instrukcją
<< PSets .m
Teraz wprowadzając
sA = PSet [ { x , y } , ( x + 0 . 5 ) ^ 2 + y^2 <= 1 ] ;
sB = PSet [ { x , y } , ( x − 0 . 5 ) ^ 2 + y^2 <= 1 ] ;
Print [ sA \ [ Union ] sB ] ;
Print [ sA \ [ Intersection ] sB ] ;
Print [ sA \ [ B a c k s l a s h ] sB ] ;
Print [ sA \ [ C i r l c e M i n u s ] sB ] ;
2.1. ZBIORY SKOŃCZONE
47
obliczymy sumę, iloczyn, różnicę i różnicę symetryczną zbiorów
A:
=
{ (x, y) | (x + 0.5)2 + y 2 ¬ 1 }
B:
=
{ (x, y) | (x − 0.5)2 + y 2 ¬ 1 }.
Możemy też sprawdzić, czy konkretny punkt, na przykład (1, 0) należy do zbioru, na przykład A, pisząc
{ 1 , 0 } \ [ Element ] sA
Użycie operatorów \back[Subset], \back[Superset] i \back[equal] pozwala na sprawdzanie zawierania się i równości
zbiorów. Warto wiedzieć, że różnego rodzaju operatory, w tym operatory mnogościowe w Mathematica można wprowadzać używając skrótów klawiaturowych. Wybrane skróty przedstawiono w tabeli poniżej. W tabeli tej znakiem :̇oznaczono
przyciśnięcie klawisza Esc w lewym górnym rogu klawiatury.
operator
\[Union]
\[Intersection]
\[Backslash]
\[CirlceMinus]
\[Subset]
\[Superset]
\[Equal]
\[Element]
\[SmallCirlce]
\[CenterDot]
\[CircleDot]
\[CirclePlus]
\[Cross]
\[Times]
skrót
:̇un:̇
:̇inter:̇
:̇\:̇
:̇c-:̇
:̇sub:̇
:̇sup:̇
:̇==:̇
:̇el:̇
:̇sc:̇
:̇.:̇
:̇c.:̇
:̇c+:̇
:̇cross:̇
:̇*:̇
forma graficzna
∪
∩
\
⊂
⊃
=
∈
◦
·
⊕
×
×
Pisząc
S e t P l o t [ ( sA \ [ Union ] sB ) , { −2 , 2 } , { −2 , 2 } ]
otrzymamy rysunek zbioru A ∪ B w domyślnych kolorach. Pisząc
S e t P l o t [ ( sA \ [ B a c k s l a s h ] sB ) , { −2 , 2 } , { −2 , 2 } , I n t e r i o r S t y l e −> Green ,
BoundaryStyle −> {RGBColor[ 0 , 0 . 5 , . 0 ] , Thick } ]
uzyskamy rysunek zbioru A \ B w kolorze i stylu dobranym przez nas. Pisząc
S e t P l o t [ ( sA \ [ C i r l c e M i n u s ] sB ) , { −2 , 2 } , { −2 , 2 } , Grid−>True ]
uzyskamy rysunek zbioru A B z naniesioną siatką poziomych i pionowych linii o współrzędnych całkowitych. Rysunek taki
pozwala w szczególności szybko policzyć ilość zawartych w zbiorze tzw. punktów kratowych, tj. punktów o obu współrzędnych
całkowitych.
Ćwiczenie komputerowe 2.1.5 Wykorzystując pakiet PSets oblicz i narysuj zbiory A, B, A ∪ B, A ∩ B, A \ B,
B \ A i A B dla różnych, zaproponowanych przez Ciebie podzbiorów płaszczyzny. Eksperymentując, ustal znacznie
parametrów instrukcji SetPlot. Zastanów się, czy otrzymane rysunki można zawsze uznać za w pełni poprawne.
Czasami warto kilka zbiorów umieścić razem na jednym wykresie (rysunku). Pisząc
pa = S e t P l o t [ sA , { −2 , 2 } , { −2 , 2 } ,
I n t e r i o r S t y l e −> {Red, Opacity [ 0 . 6 ] } ,
BoundaryStyle −> {Red, Thick } ] ;
48
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
pb = S e t P l o t [ sB , { −2 , 2 } , { −2 , 2 } ,
I n t e r i o r S t y l e −> {Blue , Opacity [ 0 . 6 ] } ,
BoundaryStyle −> {Blue , Thick } ] ;
Show [ pa , pb ]
uzyskamy oba zbiory A i B na jednym wykresie, tak jak to przedstawiono w lewym gónym rogu rys. 2.4.
Ćwiczenie komputerowe 2.1.6 Wykorzystaj instrukcję Show, by zilustrować: rozłączność zbiorów, zawieranie się
zbiorów jak również brak rozłączności i brak zawierania się.
Możemy również eksperymentować z pakietem FSets, który implementuje operacje mnogościowe na zbiorach skończonych. Na przykład pisząc
sA=FSet [ a , b , c ]
sB=FSet [ b , c , d ]
sC=sA \ [ Union ] sB
obliczymy, że sumą mnogościową zbiorów a, b, c i b, c, d jest a, b, c, d.
2.1.4
Elementarne własności operacji mnogościowych
Uwaga 2.1.7 Niech A, B, C będą zbiorami. Operacje mnogościowe mają następujące własności.
Jeśli A ⊂ B, B ⊂ C, to A ⊂ C,
A \ A = ∅,
A \ ∅ = A,
A ∪ B = B ∪ A,
A ∪ A = A,
A ∩ A = A,
A ∩ B = B ∩ A,
A ⊂ B wtedy i tylko wtedy gdy A ∪ B = B,
A ⊂ B wtedy i tylko wtedy gdy A ∩ B = A,
A ⊂ A ∪ B,
B ⊂ A ∪ B,
A ∪ (B ∪ C) = (A ∪ B) ∪ C,
A ∩ B ⊂ A,
A ∩ B ⊂ B,
A ∩ (B ∩ C) = (A ∩ B) ∩ C,
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C),
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
Uwaga 2.1.8 Niech A, B ⊂ X będą zbiorami w przestrzeni X. Uzupełnienie do przestrzeni X ma następujące własności.
A \ B = A ∩ (\B),
\(\A) = A,
\(A ∪ B) = (\A) ∩ (\B),
\(A ∩ B) = (\A) ∪ (\B),
A ⊂ B wtedy i tylko wtedy gdy \ A ⊃ \B.
Ćwiczenie komputerowe 2.1.9 Wykorzystaj pakiet FSets, by zilustrować wybrane elementarne własności operacji
mnogościowych.
2.2. ILOCZYN KARTEZJAŃSKI
2.2
2.2.1
49
Iloczyn kartezjański
Para
Wśród kluczowych poj˛eć analizy matematycznej jest poj˛ecie ciagu
˛ i funkcji. Funkcj˛e najprościej zdefiniować jak pewien zbiór par. Pierwszy element pary to
argument, a drugi to wartość funkcji dla tego argumentu. Zatem jeśli chcemy definicj˛e funkcji podać na gruncie teorii mnogości, musimy zdefiniować par˛e elementów
a i b, zwyczajowo oznaczana˛ (a, b). W poj˛eciu pary istotne jest, by było wiadomo, który element pary jest pierwszy, a który drugi. Tak wi˛ec roli pary nie może
pełnić dubleton, bo w dubletonie kolejność nie ma znaczenia. Mamy bowiem {a, b} = {b, a}. Nie jest oczywiste jak postawić definicj˛e pary na gruncie teorii
mnogości. Nie możemy zdefiniować pary jako dwuelementowego ciagu,
˛ gdyż ciag
˛ jest szczególnym przypadkiem funkcji, a na gruncie teorii mnogości funkcj˛e
definiuje si˛e jako pewien zbiór par (x, y) o stosownych własnościach.
Formalną definicję pary na gruncie teorii mnogości podamy w rozdziale 4.4.1. Na razie wystarczy nam intiucyjne pojęcie
pary jako zbioru dwuelementowego (dubletonu) {a, b}, w którym dodatkowo ustalono, że a jest pierwszy, a b jest drugi. Parę
elementów a, b zapisywać będziemy (a, b).
Kluczową własnością pary, której nie ma dubleton, jest
Uwaga 2.2.1
(a, b) = (c, d) wtedy i tylko wtedy gdy a = c i b = d.
Tak więc para (5, 11) nie jest równa parze (11, 5) chociaż, zgodnie z umową dotyczącą zbiorów, mamy {5, 11} = {11, 5}.
2.2.2
Iloczyn kartezjański
Zbiór wszystkich możliwych par (x, y), gdzie x ∈ X , a y ∈ Y tworzy tzw. iloczyn kartezjański zbiorów X i Y . Nazwa wywodzi si˛e od francuskiego matematyka
Kartezjusza (René Descartes, rys. 2.5), który jako pierwszy zaproponował algebraiczne podejście do geometrii poprzez potraktowanie płaszczyzny jako zbioru par
liczb.
Definicja 2.2.2 Iloczynem kartezjańskim zbiorów X i Y nazywamy zbiór
X × Y := { (x, y) | x ∈ X, y ∈ Y }.
Iloczyn kartezjański X × X oznaczamy krótko X 2 .
W pakiecie FSets iloczyn kartezjański zbiorów skończonych obliczamy instrukcją
sC=sA \ [ Cross ] sB
Ćwiczenie komputerowe 2.2.3 Wykorzystaj pakiet FSets, by zilustrować wyliczenie iloczynu kratezjańskiego wybranych przez siebie zbiorów skończonych.
2.3
Relacje
Poj˛ecie relacji znane jest nam dobrze z j˛ezyka codziennego. Mówi si˛e na przykład, że dwie osoby pozostaja˛ w relacji pokrewieństwa. Albo, że dwa państwa
pozostaja˛ w dobrych relacjach. Relacja oznacza pewien zwiazek
˛ pomi˛edzy dwoma elementami. Z abstrakcyjnego punktu widzenia relacja pomi˛edzy elementami
zbiorów X i Y to w pewien sposób wyróżniony podzbiór iloczynu kartezjańskiego X × Y . Wyróżnienie może nastapić
˛ poprzez podanie warunku wymaganego,
by elementy były w relacji, ale w przypadku zbiorów skończonych cz˛esto ograniczamy si˛e do wypisania par tworzacych
˛
relacj˛e bez merytorycznego wnikania co
elementy w te pary połaczyło.
˛
Poj˛ecie relacji jest punktem wyjścia do szeregu podstawowych poj˛eć współczesnej matematyki: w szczególnośc relacji równoważności oraz relacji cz˛eściowego
i liniowego porzadku.
˛
Jak zobaczymy, funkcje też traktowane sa˛ dziś przez matematyków jako szczególny przypadek relacji.
50
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
Rysunek 2.5: Kartezjusz, 1596-1650
2.3.1
Relacje
Definicja 2.3.1 Relacją w zbiorach X i Y nazywamy dowolny podzbiór R ⊂ X × Y .
Gdy X = Y , mówimy krótko o relacji w X. Tradycyjnie piszemy xRy zamiast (x, y) ∈ R. Zbiór pusty i X × X to
odpowiednio relacja pusta i relacja pełna w X. Relacją identycznościową w X jest
∆X := idX := { (x, x) | x ∈ X }.
Zazwyczaj wyrażajac
˛ w j˛ezyku naturalnym fakt, iż jakieś dwa obiekty pozostaja˛ w pewnej relacji, używamy rzeczowników odnoszac
˛ si˛e do obiektów, a czasownika odnoszac
˛ si˛e do relacji. Na przykład zdanie "Ala lubi Tomka" opisuje relacj˛e pomi˛edzy obiektami (osobami) ’Ala’ i ’Tomek’ (rzeczowniki) wyrażona˛ przy pomocy
czasownika ’lubić’. Czasownik, szczególnie czasownik ’być’, cz˛esto wyst˛epuje z przymiotnikiem lub przysłówkiem, tak jak w bardziej matematycznym przykładzie
’Liczba 5 jest wi˛eksza niż liczba 3’.
Zdanie ’Japonia zaatakowała USA’ opisuje relacj˛e pomi˛edzy obiektami (państwami) ’Japonia’ i ’USA’ wyrażona˛ przy pomocy czasownika ’zaatakować’. Jeśli
w zdaniu tym rzeczowniki ’Japonia’, ’Niemcy’ zastapimy
˛
zmiennymi x, y , otrzymamy zwrot ’x zaatakował y ’, określany mianem formy zdaniowej. Forma zdaniowa
nie jest zdaniem, bo nie można ocenić, czy wyraża prawd˛e czy fałsz. Można to zrobić, gdy za zmienne podstawimy konkretne obiekty. W uj˛eciu formalnym to
właśnie forma zdaniowa służy do określenia relacji, a sama relacja jest zbiorem par tych obiektów, które podstawione do formy zdaniowej daja˛ zdanie prawdziwe.
Rozważmy relację w zbiorze X := { 1, 2, 3, 4 } daną wzorem
R := { (1, 1), (1, 2), (1, 4), (2, 3), (3, 1), (4, 2) }.
(2.1)
Relacj˛e t˛e można zobrazować rysujac
˛ jej wykres oraz graf (rys. 2.6). Wykres relacji rysujemy podobnie jak wykres funkcji, zaznaczajac
˛ w układzie współrz˛ednych te punkty, których współrz˛edne odpowiadaja˛ parom pozostajacym
˛
w relacji. Rysowanie wykresu relacji jest możliwe tylko wtedy gdy zbiory X i Y sa˛
podzbiorami prostej lub w jakiś sposób daja˛ si˛e utożsamić z pewnymi podzbiorami prostej. Same zbiory X i Y nie musza˛ być skończone.
Narysowanie grafu relacji jest możliwe tylko wtedy gdy zbiór X (oba zbiory X i Y gdy relacja jest w zbiorach X i Y ) sa˛ skończone. Każdy z elementów
zbioru X (lub zbiorów X i Y ) zaznaczamy jako punkt na płaszczyźnie. Punkty łaczymy
˛
strzałka,˛ gdy odpowiadajace
˛ im elementy pozostaja˛ w relacji.
2.3. RELACJE
51
Rysunek 2.6: Wykres i graf relacji R w X
Pakiet Relations w języku Mathematica pozwala na rysowanie wykresów i grafów relacji w zbiorze skończonym X. Na
przykład instrukcja
R = R e l a t i o n [{1 ,2 ,3 ,4} ,{1 − >1 ,1 − >2 ,1 − >4 ,2 − >3 ,3 − >1 ,4 − >2}]
tworzy relację w zbiorze X := { 1, 2, 3, 4 } daną wzorem (2.1). Rysunek wykresu tej relacji uzyskamy pisząc
RChart [ r e ]
Natomiast graf uzyskamy pisząc
RGraph [ r e ]
Aby sprawdzić, czy dana para (a, b) jest w relacji R wystarczy napisać
a \ [ CenterDot ] R \ [ CenterDot ] b
Rozważmy relację w X := { a, b, c } i Y := { p, q, r, s } daną wzorem
R := { (a, p), (b, p), (b, q), (c, s) }.
Relacj˛e t˛e można zobrazować rysujac
˛ jej graf (rys. 2.7).
W przypadku relacji w zbiorach X i Y gdy X 6= Y rysowanie grafu jest bardziej skomplikowane, bo nie można się zdać
na automatyczne rozlokowanie wierzchołków. Rysunek 2.7 uzykano następującym ciągiem instrukcji
sx = 0 ; sy = 7 ;
g1 = GraphPlot [ { a −> p , b −> p , b −> q , c −> s , r −> r } ,
V e r t e x C o o r d i n a t e R u l e s −> { a −> { sx , 1 } , b −> { sx + 1 , 0 } ,
c −> { sx , −1} , p −> { sy + 1 , 2 } , q −> { sy , 1 } ,
r −> { sy + 1 , 0 } , s −> { sy , −1}} ,
V e r t e x L a b e l i n g −> True , D i r e c t e d E d g e s −> True ,
S e l f L o o p S t y l e −> False , PlotRange −> {{ −2 , 1 2 } , { −4 , 4 } } ] ;
g2 = R e g i o n P l o t [ x^2 + y^2 <= 3 , {x , −2, 1 2 } , {y , −4, 4 } ,
PlotRange −> {{ −2 , 1 2 } , { −4 , 4 } } , AspectRatio −> Automatic ,
PlotStyle −> { Opacity [ 0 . 0 5 ] , Darker [ Green ] } ] ;
g3 = R e g i o n P l o t [ ( x − 7)^2 + y^2 <= 8 , {x , −2, 1 2 } , {y , −4, 4 } ,
52
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
Rysunek 2.7: Graf relacji R w X i Y
PlotRange −> {{ −2 , 1 2 } , { −4 , 4 } } , AspectRatio −> Automatic ,
PlotStyle −> { Opacity [ 0 . 0 5 ] , Blue } ] ;
g4 = Graphics [ {
Text [ S t y l e [ "X" , Darker [ Green ] , Bold , 2 4 ] , { −1 , − 2 . 5 } ] ,
Text [ S t y l e [ "Y" , Blue , Bold , 2 4 ] , { sy + 2 . 5 , − 2 . 5 } ] } ,
PlotRange −> {{ −2 , 1 2 } , { −4 , 4 } } ] ;
u = Show [ g1 , g2 , g3 , g4 ]
2.3.2
Własności relacji
Niech R ⊂ X × X będzie relacją w X.
Definicja 2.3.2 Wyróżniamy następujące własności relacji R.
• Relacja R jest zwrotna jeśli dla każdego x ∈ X zachodzi x R x.
• Relacja R jest symetryczna jeśli dla dowolnych x, y ∈ X relacja x R y implikuje relację y R x.
• Relacja R jest antysymetryczna jeśli dla dowolnych x, y ∈ X zachodzenie tak relacji x R y jak i relacji y R x jest
możliwe tylko gdy x = y.
• Relacja R jest przechodnia jeśli dla dowolnych x, y, z ∈ X zachodzenie relacji x R y i y R z implikuje zachodzenie
relacji x R z.
• Relacja R jest spójna jeśli dla dowolnych x, y ∈ X zachodzi przynajmniej jedna z relacji x R y, y R x.
Pakiet Relations umożliwia proste sprawdzanie, czy dana relacja ma powyższe własności. Wprowadzając
IsReflexive [ re ]
IsSymmetric [ r e ]
IsAntisymmetric [ re ]
IsTransitive [ re ]
IsTotal [ re ]
2.4. RELACJE RÓWNOWAŻNOŚCI
53
dowiadujemy się, że relacja zadana wzorem (2.1) jest antysymetryczna, ale pozostałych rozważanych własności nie posiada.
Ćwiczenie komputerowe 2.3.3 Dla każdej z powyższych pięciu własności podaj przykład relacji w zbiorze pięcioelementowym, która ma dokładnie tę i, o ile to możliwe, żadną inną z powyższych własności. Przykład zilustruj
rysunkiem wykresu i grafu opracowanym w programie Mathematica. Zastanów się, które z powyższych własności łatwo
sprawdzić oglądając wykres, a które oglądając graf.
Iloczyn kartezjański n zbiorów i relacje n-argumentowe.
2.3.3
Pojęcie pary można uogólnić do pojęcia n-tki (trójki, czwórki, ...) elementów. Formalną definicję n-tki podamy w rozdziale 4.7.10. Na razie przyjmiemy, że n-tka elementów to zbiór n-elementowy {a1 , a2 , . . . an }, w którym ustalono kolejność
elementów. Taką n-tkę zapisujemy (a1 , a2 , . . . an ), w którym element pierwszy umieszczamy na pierwszej pozycji, drugi na
drugiej itd. Z trzech elementów 1, 2, 3 możemy zatem utworzyć jeden zbiór trzyelementowy, choć zapisać możemy go na sześć
różnych sposobów.
{1, 2, 3} = {1, 3, 2} = {2, 1, 3} = {2, 3, 1} = {3, 1, 2} = {3, 2, 1}.
Natomiast każda z sześciu trójek
(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1)
jest inna.
Definicja 2.3.4 Definiujemy iloczyn kartezjański zbiorów X1 , X2 , . . . Xn jako
X1 × X2 × · · · × Xn :=
{ (x1 , x2 , . . . , xn ) | gdzie xi ∈ Xi dla i = 1, 2, . . . , n }.
W przypadku gdy wszystkie zbiory Xi są tym samym zbiorem X mówimy o n-tej potędze kartezjańskiej zbioru X i
używamy skrótu X n . Wygodnie jest rozszerzyć tę konwencję na n = 1 i przyjąć, że X 1 := X.
Relacją n-argumentową w zbiorach X1 , X2 , . . . Xn nazywamy dowolny podzbiór zbioru X1 × X2 × · · · × Xn .
Podobnie jak relacja dwuargumentowa wyraża zwiazek
˛
pomi˛edzy dwoma elementami, relacja n-argumentowa wyraża zwiazek
˛
pomi˛edzy n-elementami.
Gdy w j˛ezyku naturalnym chcemy wyrazić relacj˛e wieloargumentowa,˛ na przykład trójelementowa,˛ wspomagamy si˛e najcz˛eściej okolicznikami. Na przykład forma
zdaniowa ’w zaatakował x w sojuszu z y ’ zadaje relacj˛e trójargumentowa,˛ w której trzeci argument został dodany przy wykorzystaniu okolicznika ’e sojuszu z w’.
Konsekwencja˛ przyj˛ecia umowy, że X 1 = X , jest dopuszczenie relacji jednoargumentowych. W konsekwencji każdy podzbiór X stanowi pewna˛ relacj˛e
jednoargumentowa.˛ Relacje jednoargumentowe określaja˛ własności obiektów. W j˛ezyku naturalnym wyrażane sa˛ przy pomocy czasownika ’być’ z przymiotnikiem.
Na przykład forma zdaniowa ’x jest zielonooki określa własność posiadania zielonych oczu.
2.4
Relacje równoważności
Relacja równoważności dokonuje utożsamienia obiektów pod pewnym wzgl˛edem przy zachowaniu różnic pod innym wzgl˛edem. Relacja˛ równoważności jest na
przykład bycie tej samej narodowości. Dwie osoby tej samej narodowości moga˛ si˛e różnić pod wieloma wzgl˛edami, ale pod wzgl˛edem narodowości sa˛ identyczne.
W matematyce relacje równoważności służa˛ jako narz˛edzie do definiowania nowych poj˛eć. Posłużymy si˛e nimi by z liczb naturalnych skonstruować liczby
całkowite, z liczb całkowitych liczby wymierne, a z liczb wymiernych liczby rzeczywiste.
54
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
2.4.1
Relacja równoważności
Definicja 2.4.1 Relację w zbiorze X, która jest zwrotna, symetryczna i przechodnia nazywamy relacją równoważności.
Dla x ∈ X klasę
[x]R := { y ∈ X | xRy }
nazywamy klasą równoważności elementu x.
W rozdziale ... udowodnimy następujące ważne twierdzenie opisujące podstawowe własności klas równoważności.
Twierdzenie 2.4.2 Niech R będzie relacją równoważności w X. Jeśli x, y ∈ X oraz xRy, to [x]R = [y]R . Innymi słowy,
klasy równoważności równoważnych elementów są identyczne. Ponadto dla dowolnych x, y ∈ X albo [x]R = [y]R , albo
[x]R ∩ [y]R = ∅, to znaczy klasy równoważności dwóch elementów są albo równe, albo rozłączne.
Pakiet Relations.m umożliwia sprawdzenie czy relacja jest relacją równoważności. Na przykład pisząc
rR = R e l a t i o n [ { a , b , c } , { a −> a , b −> b , c −> c , a −> b , b −> a } ]
I s E q u i v a l e n c e [ rR ]
otrzymamy odpowiedź True.
2.5
Funkcje
Poj˛ecie funkcji w matematyce przeszło znaczna˛ ewolucj˛e. Pierwtonie poj˛ecie funkcji wiazano
˛
ze wzorem, który pewnej zmiennej liczbowej przypisywał nowa˛
wartość wyliczana˛ ze wzoru. Na przykład, najprostsza funkcja kwadratowa przypisuje liczbie x wartość x2 . Z czasem wymóg algebraicznego wzoru rozluźniono,
wymagajac
˛ jedynie podania jakiegokolwiek, nie koniecznie wyrażajacego
˛
si˛e wzorem, sposobu przypisania argumentowi wartości funkcji. Na przykład liczbie
naturalnej n można przypisać najwi˛eksza˛ liczb˛e naturalna˛ k , taka,˛ że 2k dzieli liczb˛e n bez reszty. Nie ma wzoru na takie k , ale można podać algorytm,
który takie k nam wyznaczy. Mianowicie dzielimy nasza˛ liczb˛e przez 2. Jeśli wynik jest liczba˛ naturalna,˛ ponownie dzielimy przez 2. Proces ten powtarzamy
aż do momentu, gdy dzielenie bez reszty nie jest już możliwe, równocześnie zliczajac
˛ dzielenia bez reszty. Otrzymana liczba dzieleń bez reszty jest szukanym
najwi˛ekszym k .
W obu tych podejściach możemy utworzyć pary łacz
˛ ac
˛ argumenty ze zbioru X w par˛e z odpowiadajacymi
˛
im wartościami ze zbioru Y . Na funkcj˛e możemy
wi˛ec patrzeć jako na zbiór par, a wi˛ec relacj˛e w zbiorach X , Y .
W pewnym momencie matematycy uznali, że za funkcj˛e można uznać zbiór par nawet wtedy gdy nie widać żadnego wzoru, czy algorytmu pozwalajacego
˛
przypisać argumentowi x ∈ X wartość y ∈ Y . Ma to w szczególności sens w przypadku zbiorów skończonych, bo aby zadać relacj˛e, wystarczy wypisać
wszystkie pary, które w relacji pozostaja.˛
Trzeba jednak wyraźnie podkreślić, że nie każda relacja może być uznana za funkcj˛e. Aby tak si˛e stało potrzebujemy dwóch własności. Pierwsza z nich to
jednolistność.
Definicja 2.5.1 Niech R ⊂ X × Y będzie relacją. Mówimy, że R jest funkcją jeżeli dla każdego x ∈ X istnieje
dokładnie jeden y ∈ Y taki, że x R y.
Pakiet Relations.m umożliwia sprawdzenie czy relacja jest funkcją. Na przykład pisząc
rR = R e l a t i o n [ { a , b , c } , {a−>c , b −> b , c −> a } ]
I s F u n c t i o n [ rR ]
otrzymamy odpowiedź True.
Na zbiór funkcji z X do Y stosujemy oznaczenie
Y X := { f | f : X → Y - funkcja z X do Y }
2.5. FUNKCJE
Przykład 2.5.2
55
1. Niech c ∈ Y . Wtedy { (x, c) | x ∈ X } jest funkcją z X do Y . Nazywamy ją funkcją stałą.
2. Relacja identycznościowa ∆X jest funkcją ∆X : X → X.
3. Relacja pełna w przestrzeni X nie jest funkcją z wyjątkiem przypadku gdy X jest pusty lub jest singletonem.
2.5.1
Obrazy i przeciwobrazy
Niech f : X → Y , A ⊂ X, B ⊂ Y . Obrazem zbioru A nazywamy
f (A) := { f (x) | x ∈ A }.
Przeciwobrazem zbioru B nazywamy
f −1 (B) := { x ∈ X | f (x) ∈ B }.
Uwaga 2.5.3 Niech f : X → Y , a A, A1 , A2 ⊂ X i B, B1 , B2 ⊂ Y będą zbiorami. Wtedy
Jeśli A1 ⊂ A2 , to f (A1 ) ⊂ f (A2 ),
Jeśli B1 ⊂ B2 , to f (A1 )f −1 (B1 ) ⊂ f −1 (B2 ),
f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ),
f
−1
f
−1
(B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ),
f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 ),
(B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ),
f (f −1 (B)) = B ∩ im f,
f −1 (f (A)) ⊃ A.
2.5.2
Injekcje, surjekcje, i bijekcje.
Funkcję f : X → Y nazywamy injekcją, jeżeli dla dowolnych x1 , x2 ∈ X równość f (x1 ) = f (x2 ) implikuje równość x1 = x2 .
Funkcję f nazywamy surjekcją, jeżeli dla dowolnego y ∈ Y istnieje x ∈ X takie, że y = f (x). Funkcję f nazywamy bijekcją
jeśli jest injekcją i surjekcją.
Twierdzenie 2.5.4 Niech f : X → Y będzie funkcją. Relacja odwrotna f −1 jest jednolistna wtedy i tylko wtedy gdy f
jest injekcją. Relacja odwrotna f −1 jest funkcją wtedy i tylko wtedy gdy f jest bijekcją.
Relację odwrotną do bijekcji nazywamy funkcją odwrotną.
Pakiet Relations.m umożliwia sprawdzenie injektywności, surjektywności i bijektywności funkcji przy pomocy metod
IsInjective, IsSurjective i IsBijective.
56
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
Rozdział 3
Elementy logiki matematycznej
3.1
Program Hilberta
Przyjrzyjmy si˛e bliżej programowi Hilberta. Chcemy stworzyć j˛ezyk formalny b˛edacy
˛ opisem pewnej matematycznej rzeczywistości. Zastanówmy si˛e najpierw co
może składać si˛e na taka˛ rzeczywistość? Najlepiej zaczać
˛ od takich obiektów matematycznych, z którymi jesteśmy już oswojeni, na przykład od liczb całkowitych.
Obiektom przypisujemy pewne własności. Na przykład możemy stwierdzić, że pewna liczba całkowita z jest parzysta. Albo zauważyć, że liczba x jest mniejsza
od liczby y . Własność może dotyczyć jednego (jak w przypadku parzystości), dwóch (jak w przypadku mniejszości) lub trzech i wi˛ecej obiektów. Wiemy już, że
taka˛ własność dotyczac
˛ a˛ n obiektów określamy mianem n-argumentowej relacji. Oprócz analizowania własności obiektów, wykonujemy też pewne konstrukcje
obiektów. Na przykład dysponujac
˛ liczba˛ x możemy wziać
˛ liczb˛e do niej przeciwna˛ −x. Dysponujac
˛ liczbami x i y możemy obliczyć sum˛e x + y czy iloczyn xy .
Taka konstrukcja może wymagać dostarczenia jednego (jak w przypadku liczby przeciwnej), dwóch (jak w przypadku sumy czy iloczynu), badź
˛ trzech lub wi˛ecej
obiektów. Konstrukcj˛e nowego obiektu w oparciu o dane n obiektów określamy mianem n-argumentowej funkcji. Oprócz rozważania relacji i funkcji zazwyczaj
potrzebujemy też pewne wyróżnione obiekty o specjalnych własnościach, na przykład liczb˛e 0 i liczb˛e 1.
W j˛ezyku formalnym, który ma nasza˛ rzeczywistość opisywać, musimy zaplanować symbole, które b˛eda˛ kodować relacje, funkcje i wyróżnione obiekty. Chcemy,
by tych symboli było możliwie mało, dlatego w kodowaniu ograniczamy si˛e do pewnego niezb˛ednego minimum tak by wszystko inne co jest nam potrzebne dało
si˛e zdefiniować przy użyciu wybranego możliwie małego zestawu. Na przykład odejmowanie dwóch liczb całkowitych nie jest nam potrzebne, bo x − y można
zdefiniować jako dodawanie x + (−y), czyli dodanie x i liczby przeciwnej do y . Podobnie, trzyargumentowe dodawanie x + y + z zdefiniować można jako
dwukrotne dwuargumentowe dodawanie (x + y) + z . Wygodnie jest też dopuścić funkcje zeroargumentowe, co pozwala zrezygnować z wyróżnionych obiektów,
bo funkcja zeroargumentowa, ze wzgl˛edu na brak argumentów, zwraca zawsze ten sam wynik, który można utożsamić z wyróżnionym obiektem.
Te wyróżnione funkcje i relacje traktujemy jako poj˛ecia pierwotne teorii, która˛ b˛edziemy opisywać w j˛ezyku formalnym. W szczególności mówimy o pierwotnych
funkcjach i pierwotnych relacjach. W odniesieniu do pierwotnych funkcji cz˛esto używamy zamiennie określenia operacja z jedna˛ drobna,˛ zwyczajowa˛ różnica˛
j˛ezykowa:˛ operacje wykonujemy na obiektach, a funkcje wyliczamy dla obiektów.
3.1.1
Struktury matematyczne.
Formalny j˛ezyk sam w sobie nie niesie żadnych treści. Jest to jedynie zbiór poprawnie skonstruowanych napisów i nic wi˛ecej. Aby te napisy miały jakaś
˛ treść,
trzeba nadać znaczenie zmiennym, symbolom funkcyjnym i symbolom relacyjnym. W tym celu musimy im przypisać jakieś obiekty, funkcje i relacje z pewnej
matematycznej rzeczywistości, tak zwanej struktury matematycznej.
Przez strukturę matematyczną lub krótko strukturę rozumiemy zestaw, na który składają się:
• pewien typ interesujących nas obiektów, zwany dziedziną struktury, gwarantujący istnienie przynajmniej jednego
obiektu,
• pewien skończony zbiór relacji pomiędzy obiektami,
• pewien skończony zbiór operacji, które na obiektach można wykonywać,
• pewien skończony zbiór wyróżnionych obiektów dziedziny.
57
58
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
3.1.2
Alfabet, słowo i języki formalne.
Zastanówmy si˛e z kolei jak powinien wygladać
˛
j˛ezyk formalny. Ma on służyć formułowaniu stwierdzeń o pewnej strukturze matematycznej. Stwierdzenia powinny
przyjać
˛ form˛e napisu b˛edacego
˛
ciagiem
˛
symboli z pewnego ustalonego alfabetu. Warto zaznaczyć, że choć używamy określenia alfabet, to cz˛esto cały ciag
˛ liter
traktujemy jako oddzielny symbol. Powszechnie stosowanym przykładem sa˛ symbole funkcji trygonometrycznych: sin, cos, tg. Ta konwencja bierze si˛e stad,
˛
że matematykom ( a tym bardziej informatykom) zbiór liter j˛ezyka codziennego absolutnie nie wystarcza jako zbiór symboli. Stad
˛ stosowanie różnych rodzajów
znaków, liter opartych o różne czcionki
a, b, c, ..., A, B, C, ...,
A, B, C, ..., A, B, C, ...,
α, β, γ, ..., Γ, ∆, Λ...,
czy różnego rodzaju modyfikatorów jak daszki x̂, ŷ, ẑ . . . czy ptaszki x̌, y̌, ž . . ..
Niech Σ będzie skończonym zbiorem symboli, zwanym alfabetem.
Definicja 3.1.1
• Słowem nad Σ nazywamy dowolny skończony ciąg symboli.
• Zbiór słów nad alfabetem Σ oznaczamy Σ∗ .
• Językiem L nad Σ nazywamy pewien podzbiór zbioru słów Σ∗ .
Słowa należące do L nazywamy słowami dopuszczalnymi języka L, albo krótko formułami języka L.
Oczywiście, tylko niektóre z wszystkich możliwych napisów maja˛ jakiś sens. Dlatego, definiujac
˛ konkretny j˛ezyk musimy podać jakieś reguły, które pozwola˛
rozstrzygnać
˛ co jest, a co nie jest sensownym napisem, a wi˛ec tzw. formuła˛ j˛ezyka. Nim si˛e tym zajmiemy, przyjrzyjmy si˛e najpierw bliżej co powinno si˛e składać
na alfabet j˛ezyka formalnego. Przede wszystkim potrzebujemy odpowiednio bogatego zestawu nazw do oznaczania dowolnych obiektów dziedziny, tak zwanych
zmiennych. Zazwyczaj używamy do tego końcowych liter alfabetu x, y, z choć cz˛esto potrzebujemy znacznie wi˛ecej zmiennych, stosowane sa˛ wi˛ec też inne
konwencje, na przykład dodawanie indeksów x1 , x2 , x3 . . ., Natomiast przyda si˛e nam bardzo szeroki zbiór zmiennych opartych o różne czcionki:
Potrzebujemy też oddzielnych symboli dla wyróżnionych obiektów dziedziny, dla zestawu przyj˛etych operacji i dla zestawu przyj˛etych relacji. Ponadto potrzebujemy nawiasów i przecinka do zapisywania argumentów operacji i relacji. Taki zestaw symboli pozwala nam już na zapisanie pewnych prostych faktów dotyczacych
˛
struktury, która˛ j˛ezyk ma opisywać.
Dla przykładu rozważmy jeszcze raz struktur˛e, na która˛ składaja˛ si˛e: liczb całkowite jako dziedzina, wyróżnione liczby zero i jeden, dwuargumentowe relacje
równości i wi˛ekszości oraz dwuargumentowe operacje dodawania i mnożenia. Rozważmy j˛ezyk, w którym wyróżniona liczba zero oznaczana jest symbolem Z ,
liczba jeden symbolem ’J’, operacja dodawania symbolem D , operacja mnożenia symbolem M , relacja silnej wi˛ekszości symbolem W , a relacja równości
symbolem R. Oto prosty fakt zapisany w tym j˛ezyku
W (J, Z),
który łatwo rozszyfrujemy jako stwierdzenie, że jeden jest wi˛eksze niż zero. Używajac
˛ zwyczajowych symboli zapisujemy to jako 1 > 0. Nieco trudniej rozszyfrować
formuł˛e
R(D(D(J, J), D(J, J)), M (D(J, J), D(J, J))),
która˛ przy użyciu bardziej tradycyjnych oznaczeń zapisać można jako ((1 + 1) + (1 + 1)) = ((1 + 1) ∗ (1 + 1)), a po wprowadzeniu skrótu 2 na 1 + 1 i
pomini˛eciu zb˛ednych nawiasów jako 2 + 2 = 2 ∗ 2.
Widać, że zapisy w j˛ezyku formalnym sa˛ dla człowieka dość trudne do rozszyfrowania ze wzgl˛edu na ich złożoność nawet dla bardzo prostych faktów. By
uniknać
˛ tej złożoności przyjmuje si˛e szereg konwencji, których uczymy si˛e już od szkoły podstawowej. Taka˛ konwencja˛ jest na przykład zapisywanie operacji
i relacji dwuargumentowych przez wstawienie znaku operacji czy relacji pomi˛edzy argumenty, co pozwala pominać
˛ nawiasy. Tak wi˛ec piszemy 0 + 1 zamiast
+(0, 1) oraz 1 > 0 zamiast > (1, 0).
Inna˛ konwencja˛ jest przypisanie priorytetów symbolom funkcyjnym i relacyjnym, co też pozwala uniknać
˛ pisania wielu nawiasów. Na przykład przyjmujemy, że
mnożenie ma wi˛ekszy priorytet od dodawania co pozwala rozszyfrować zapis 1 + 1 ∗ 1 jako 1 + (1 ∗ 1), a nie jako (1 + 1) ∗ 1. Zazwyczaj przyjmujemy, że
wszystkie symbole funkcyjne maja˛ wyższy priorytet niż relacyjne.
Wreszcie, aby uprościć zapis formuły, dla cz˛esto powtarzajacych
˛
si˛e fragmentów wprowadzamy skrótowe oznacznia, na przykład 2 dla 1 + 1. Podkreślmy, że
oznaczenia takie nie sa˛ cz˛eścia˛ alfabetu j˛ezyka, a jedynie służa˛ ułatwieniu czytania skomplikowanych formuł. Jeśli chcemy zobaczyć formuł˛e j˛ezyka w jej czystej
formie, musimy konsekwentnie z niej wyrugować wszystkie skróty.
3.1. PROGRAM HILBERTA
59
W dalszym ciagu
˛ b˛edziemy cz˛esto używać raz przyj˛etych konwencji i skrótów bez uprzedzenia, zakładajac,
˛ że czytelnik je zna i jest w stanie, w razie potrzeby,
przekształcić zapis tak, by konwencji si˛e pozbyć.
Warto sobie uświadomić, że stworzenie koncepcji języka formalnego stworzyło grunt, bez którego nie powstałby współczesny komputer. Języki formalne, w takim czy innym ujęciu, stanowią podstawę programowania komputerów. W szczególności
język pakietu Mathematica jest językiem formalnym. Na szczęście, poprzez stworzenie szeregu konwencji i skrótów jest on
przyjazny użytkownikowi. Warto jednak czasem zapytać jak wygląda formuła w języku Mathematica ogołocona z konwencji
i skrótów. Pisząc
FullForm [ x + y∗ z < w ]
otrzymujemy odpowiedź
Less [ Plus [ x , Times [ y , z ] ] , w ]
która przestawia zapis fomuły x + y ∗ z < w pozbawiony konwencji i skrótów. W szczególności w, x, y, z są zmiennymi, Plus
i Times symbolami funkcyjnymi, a Less jest symbolem relacyjnym.
3.1.3
Spójniki logiczne
Wróćmy do naszej analizy alfabetu j˛ezyka. Ograniczyliśmy zestaw zakodowanych w symbolach j˛ezyka własności (relacji) do niezb˛ednego minimum. Aby móc w
j˛ezyku wyrażać takie własności jak x jest wi˛eksze lub równe od y potrzebujemy złożyć napisy x > y i x = y w jedna˛ całość przy użyciu spójnika logicznego
’lub’. W tym celu spójnik ’lub’ musimy dodać do alfabetu. Spójnik ten zwyczajowo kodujemy znakiem ∨. Dodanie tego spójnika do alfabetu pozwala na utworzenie
napisu x > y ∨ x = y . Dla wygody wprowadzamy skrót ­ przyjmujac,
˛ że x ­ y oznacza właśnie x > 0 ∨ x = 0.
W rozważanym przykładzie, ze wzgl˛edu na minimalistyczne podejście do zestawu poj˛eć, wśród relacji pierwotnych uwzgl˛edniliśmy tylko relacje > i =, ale
już nie <. Zauważmy jednak, że własność ’x jest mniejsze niż y ’ jest równoważna stwierdzeniu: ’niepawda, że zachodzi alternatywa x jest wi˛eksze od y lub x
jest równe y . Tak wi˛ec, aby móc zdefiniować własność mniejszości potrzebujemy jeszcze spójnika logicznego ’nieprawda, że’. Zwyczajowo kodujemy go znakiem
¬. Dodanie go do alfabetu umożliwia utworzenie napisu ¬x ­ y , co można przyjać
˛ jako definicj˛e skrótu x < y . Zwyczajowo przyjmujemy, że spójnik ¬ ma
najwyższy priorytet ze wszystkich spójników logicznych.
Spójniki logiczne ∨ oraz ¬ nie sa˛ jedynymi jakie si˛e przydaja.˛ Aby zapisać własność x > 0 i x < 2 potrzebujemy spójnika logicznego ’i’, zapisywanego ∧.
Nie musimy go dodawać do alfabetu, bo możemy przyjać,
˛ że dla formuł ϕ oraz ψ zapis ϕ ∧ ψ jest skrótem od zapisu ¬(¬ϕ ∨ ¬ψ). Innym cz˛esto używanym
spójnikem logicznym jest ’implikuje’, zapisywany jako ’⇒’. W j˛ezyku potocznym pojawia si˛e on w wielu różnych wariantach: ’ϕ implikuje ψ ’, ’jeśli ϕ, to ψ ’, ’ψ , chyba
że nie ϕ’, przy założeniu ϕ zachodzi ψ . Choć w pierwszej chwili wydaje si˛e to zaskakujace,
˛ spójnik ’⇒’ daje si˛e wyrazić poprzez spójniki ’∨’ oraz ’¬’. Dokładniej,
zapis ϕ ⇒ ψ oznacza tyle samo, co ¬ϕ ∨ ψ , tak wi˛ec spójnik ’⇒’ również traktujemy jako skrót. Ze spójnikiem tym wiaże
˛ si˛e troch˛e nieporozumień: bywa
mylnie traktowany jako stwierdzajacy
˛ możliwość wywnioskowania ψ z ϕ. J˛ezyk formalny nie służy jednak do stwierdzeń na temat możliwości przeprowadzania
wnioskowania. Stwierdzenie ’Jeśli na narty pojechałem w Dolomity, to słoneczna pogoda była zagwarantowana’ nie oznacza, że słoneczna pogoda w Dolomitach
jest jakaś
˛ konsekwencja˛ tego, że ktoś si˛e tam wybrał na narty. Jest tylko obserwacja˛ współistnienia pewnych faktów. Współistnienia wynikajacego
˛
z tego, że
słoneczna pogoda zima˛ w Dolomitach jest cz˛esto i nie trzeba dużo szcz˛eścia, by na taka˛ trafić.
Mamy też spójnik ’jest równoważne’, zapisywany jako ⇔. Zapis ϕ ⇔ ψ oznacza tyle samo, co (ϕ ⇒ ψ) ∧ (ψ ⇒ ϕ). W j˛ezyku potocznym jest
formułowany również zwrotem ’zachodzi wtedy i tylko wtedy gdy’.
3.1.4
Kwantyfikatory
Rozważane do tej pory przykłady formuł opisuja˛ własności wyróżnionych elementów dziedziny struktury matematycznej. Dla takich formuł można sprawdzić czy
zapisuja˛ prawd˛e, czy fałsz. O takich formułach mówimy, że sa˛ zdaniami.
Używajac
˛ zmiennych, możemy konstruować formuły opisujace
˛ własności bliżej nieokreślonych elementów dziedziny. Formuły, w których wyst˛epuja˛ zmienne
nazywamy formami zdaniowymi, bo staja˛ si˛e zdaniami dopiero po podstawieniu za zmienne konkretnych elementów dziedziny. Na przykład formuła x > y jest
prawdziwa, gdy za x podstawimy 1, a za y podstawimy 0. Natomiast podstawiajac
˛ 0 za x, a 1 za y otrzymujemy fałsz.
Jest jeszcze inny sposób przekształcenia formy zdaniowej w zdanie. Rozważmy na przykład form˛e x ∗ x ­ 0 w dziedzinie liczb całkowitych. Podstawiajac
˛
w tej formie dowolna˛ liczb˛e całkowita˛ dostajemy zdanie prawdziwe. Możemy t˛e obserwacj˛e wyrazić zdaniem: Dla każdego x zachodzi x ∗ x ­ 0. Wyrażenie ’dla
każdego’ nazywamy kwantyfikatorem ogólnym, albo inaczej uniwersalnym. Zapisujemy go przy pomocy symbolu ∀. Jest to odwrócona litera ’A’ od angielskiego
słowa ’all’. Nasz przykład zapisujemy zatem symbolicznie jako ∀x x ∗ x ­ 0.
60
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Ogólnie, rozważmy form˛e zdaniowa˛ ϕ, w której wyst˛epuje zmienna x, co zapisujemy ϕ(x). Stwierdzajac,
˛ że dla każdego x zachodzi ϕ(x) otrzymujemy
zdanie, które zapisujemy przy pomocy kwantyfikatora ogólnego jako ∀x ϕ(x). Jest ono prawdziwe jeśli rzeczywiście po podstawieniu za zmienna˛ x dowolnego
elementu z dziedziny otrzymujemy zdanie prawdziwe. Jeśli istnieje choć jeden element a z dziedziny, dla którego zdanie ϕ(a) jest fałszywe, to zdanie ∀x ϕ(x)
jest fałszywe.
Na przykład zdanie ∀x x > 0 jest fałszywe, bo podstawiajac
˛ za x liczb˛e całkowita˛ −1 otrzymujemy zdanie fałszywe. Natomiast zdanie ∀x x ∗ x ­ 0, jak
już zauważyliśmy, jest prawdziwe. Należy tu podkreślić, że niestety nie jesteśmy w stanie jego prawdziwości sprawdzić podstawiajac
˛ za x po kolei wszystkie liczby
całkowite, bo jest ich nieskończenie wiele. Wierzymy, że tak jest, bo dzieje si˛e tak dla dowolnie dużego zbioru liczb całkowitych jaki jesteśmy w stanie sprawdzić.
Jesteśmy też w stanie udowodnić ten fakt. I właśnie po to jest nam potrzebny j˛ezyk formalny.
Mamy jeszcze drugi kwantyfikator. Aby si˛e z nim zaznajomić rozważmy własność parzystości liczb całkowitych. Liczba x jest parzysta jeśli x = 2y dla
pewnej innej liczby całkowitej y . To samo inaczej: liczba x jest parzysta, jeżeli istnieje y takie, że x = 2y . Zwrot ’istnieje’ określamy mianem kwantyfikatora
szegółowego, albo egzystencjalnego. Oznaczamy go symbolem ’∃’. Jest to odwrócona litera ’E’ od angielskiego słowa ’exists’. Zatem własność parzystości liczby
x można zapisać w j˛ezyku formalnym jako ∃y x = 2y .
Ogólnie, z formy zdaniowej ϕ(x) możemy utworzyć zdanie przy użyciu kwantyfikatora szczegółowego, stwierdzajac,
˛ że istnieje x dla którego zachodzi ϕ(x),
co zapisujemy jako ∃x ϕ(x). Jest ono prawdziwe jeśli da si˛e znaleźć element a dziedziny taki, że ϕ(a) jest zdaniem prawdziwym. Jeśli takiego elementu nie
ma, zdanie ∃x ϕ(x) jest fałszywe.
Na przykład zdanie ∃x x > 0 jest prawdziwe, bo 1 > 0. Natomiast zdanie ∃x x ∗ x + 1 = 0 jest fałszywe. Oczywiście fałszywe dla struktury, którego
dziedzina˛ jest zbiór liczb całkowitych, bo w zbiorze liczb zespolonych jest ono akurat prawdziwe. Pami˛etać zatem należy, że prawdziwość lub fałszywość zdania w
j˛ezyku formalnym zależy od struktury, do którego zdania j˛ezyka odnosimy.
Zauważmy, że zaprzeczenie stwierdzenia ∀x ϕ(x) możemy wyrazić przy pomocy spójnika ∃, bo jeśli nie jest prawda,˛ że dla każdego x zachodzi ϕ(x),
to istnieje x taki, że nie zachodzi ϕ(x). Zatem stwierdzenie ¬∀x ϕ(x) jest równoważne stwierdzeniu ∃x ¬ϕ(x). Podobnie zauważamy, że stwierdzenie
¬∃x ϕ(x) jest równoważne stwierdzeniu ∀x ¬ϕ(x). Stad
˛ wnosimy, że ∃x ϕ(x) jest równoważne stwierdzeniu ¬∀x ¬ϕ(x). Oznacza to, że kwantyfikator
szczegółowy ∃ można traktować jako skrót wyrażenia ¬∀x ¬ϕ(x).
3.1.5
Termy i predykaty
Jak wiemy z gramatyki, wśród cz˛eści mowy wyróżniamy w szczególności rzeczowniki, czasowniki i przymiotniki. Rzeczowniki służa˛ do nazywania obiektów.
Przymiotniki pozwalaja˛ określać własności obiektów. Czasowniki określaja˛ zależności pomi˛edzy obiektami. Zauważyliśmy już w rozdziale ..., że przymiotniki i
czasowniki możemy wrzucić do jednego worka jako cz˛eści mowy wyrażajace
˛ relacje n argumentowe (jednoargumentowe dla przymiotników, wieloargumentowe
dla czasowników).
W j˛ezyku logiki odpowiednikiem rzeczownika jest określenie term, a odpowiednikiem przymiotnika i czasownika jest określenie predykat. W pewnym uproszczeniu, termy to nazwy obiektów, którymi si˛e zajmujemy, badź
˛ zmienne, pod które możemy obiekty podstawiać. Natomiast predykaty służa˛ do wyrażania własności
termów i relacji zachodzacych
˛
pomi˛edzy termami.
3.2
Język rachunku predykatów.
Formalizacja matematyki odbywa się przy użyciu tzw. języka rachunku predykatów. Alfabet języka rachunku predykatów
jest sumą rozłączną A = L ∪ V ∪ F ∪ R ∪ I, gdzie L to zbiór spójników logicznych, V to zbiór zmiennych, F to zbiór
symboli funkcyjnych, R to zbiór symboli relacyjnych, a I zbiór symboli interpunkcyjnych. Przyjmujemy, że zbiór symboli
logicznych L obejmuje dokładnie trzy symbole: ¬, ∨ i ∀, a zbiór symboli interpunkcyjnych obejmuje parę nawiasów (, )
oraz przecinek. Ponadto zakładamy, że z każdym symbolem funkcyjnym i każdym relacyjnym związana jest liczba naturalna
lub zero, zwana argumentowością symbolu. Zbiór symboli funkcyjnych o argumentowości k oznaczać będziemy Fk , a zbiór
symboli relacyjnych o argumentowości k oznaczać będziemy Rk .
Aby zdefiniować formuły języka rachunku predykatów, czyli jego słowa dopuszczalne, zdefiniujemy najpierw termy,
odpowiadające w językach naturalnych rzeczownikom.
3.2. JĘZYK RACHUNKU PREDYKATÓW.
61
Definicja 3.2.1 Termy języka określone są przez następujące dwie reguły:
t1) Termem języka jest każda nazwa będąca zmienną.
t2) Ponadto, jeśli t1 , t2 , . . . tk są termami języka, a f jest symbolem operacji k-argumentowej, to f (t1 , t2 , . . . tk ) jest
również termem języka. Przypadek ten obejmuje w szczególności wyróżnione elementy, które utożsamiamy z
funkcjami zero-argumetnowymi.
Definicja 3.2.2 Formuły języka predykatów określone są przez następujące dwie reguły:
p1) Jeśli t1 , t2 , . . . tk dla k ­ n są termami, a r jest symbolem relacji k-argumentowej, to r(t1 , t2 , . . . tk ) jest formułą.
Formułę taką nazywamy formułą atomową.
p2) Jeśli ϕ i ψ są formułami, to ¬(ϕ), (ϕ ∨ ψ) oraz ∀x ϕ również są formułami.
Potrzebne jest nam jeszcze pojęcie zmiennej wolnej w formule. Określają to następujące cztery reguły:
Definicja 3.2.3 w1) Zmienna jest zmienną wolną w formule atomowej f (t1 , t2 , . . . tk ) jeśli występuje ona wśród
termów t1 , t2 , . . . tn .
w2) Zmienna jest zmienną wolną w formule postaci ¬(ϕ) jeśli jest ona zmienną wolną w formule ϕ.
w3) Zmienna jest zmienną wolną w formule postaci (ϕ ∨ ψ) jeśli jest ona zmienną wolną przynajmniej w jednej z
formuł ϕ, ψ.
w4) Zmienna jest zmienną wolną w formule postaci ∀x(ϕ) jeśli jest ona zmienną wolną w formule ϕ i nie jest to
zmienna występująca bezpośrednio po znaku kwantyfikatora.
Aby zaznaczyć, że x jest zmienną wolną w formule ϕ, piszemy ϕ(x). Zbiór argumentów formuły to zbiór utworzony ze
wszystkich zmiennych wolnych tej formuły. Mówimy, że zmienna x jest zmienną związaną w formule jeśli nie jest to zmienna
wolna w tej formule. Na przykład w formule
∀x ∃y y > x + z
zmienne x i y są związane, a zmienna z jest wolna. Formułę pozbawioną zmiennych wolnych nazywamy zdaniem. Formułę,
która nie jest zdaniem nazywamy jest formą zdaniową. Formę zdaniową o niezwiązanych zmiennych x1 , x2 , . . . xn zapisujemy
często w postaci ϕ(x1 , x2 , . . . xn ).
Stosujemy również symbole ∧, ⇒, ⇔, ∃, ale traktujemy jako skróty:
ϕ∧ψ
ϕ⇒ψ
:= ¬ϕ ∨ ψ,
ϕ⇔ψ
:=
∃x ϕ(x)
3.2.1
Interpretacje.
:= ¬(¬ϕ ∨ ¬ψ),
(ϕ ⇒ ψ) ∧ (ψ ⇒ ϕ),
:= ¬∀x ¬ϕ(x).
62
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Definicja 3.2.4
• Interpretacją języka L w strukturze matematycznej A nazwiemy przypisanie λ, które z każdą
zmienną x wiąże pewien obiekt λ[x] w dziedzinie struktury A, z każdym k-argumentowym symbolem funkcyjnym f pewną k-argumentową funkcję λ[f ] w dziedzinie struktury A, a z każdym k-argumentowym symbolem
relacyjnym r pewną k-argumentową relację λ[r] w dziedzinie struktury A.
• Powiemy, że interpretacja κ jest zgodna z λ, jeśli κ i λ przypisują to samo wszystkim symbolom funkcyjnym i
relacyjnym.
• Powiemy, że interpretacja κ pokrywa się z λ poza x, jeśli κ jest zgodna z λ i przypisuje to samo wszystkim
zmiennym z wyjątkiem, co najwyżej, zmiennej x.
Przykładem może być struktura składajaca
˛ si˛e ze zbioru liczb całkowitych jako dziedziny, liczb zero i jeden jako wyróżnionych elementów dziedziny, dwuargumentowych operacji dodawania i mnożenia dwóch liczb całkowitych i jednoargumentowej operacji brania liczby przeciwnej do danej oraz dwuargumentowej
operacji silnej mniejszości liczb. Do jej opisania wystarczy j˛ezyk, w którym F0 = {0, 1}, F1 = {−}, F2 = {+, ∗}, R2 = {<}, a interpretacja przypisuje
tym symbolom ich tradycyjne znaczenia, a zmiennym jakieś liczby ze zbioru liczb całkowitych.
Zauważmy, że taki sam j˛ezyk wystarczy do opisania struktury obejmujacej
˛ liczby naturalne z zerem, liczby wymierne, czy liczby rzeczywiste. Jak zobaczymy,
różnica tkwi nie w samym j˛ezyku, ale w interpretacji. Na przykład formuła
∀x 0 < x ∨ x < 0 ⇒ ∃y x ∗ y = 1
jest spełniona przy interpretacji w zbiorze liczb wymiernych, ale nie w zbiorze liczb całkowitych. Doprecyzujemy teraz co dokładnie oznacza, że formuła jest
spełniona w pewnej interpretacji.
Interpretację rozszerzamy na termy, przyjmując, że
λ[f (t1 , t2 , . . . , tk )] := λ[f ](λ[t1 ], λ[t2 ], . . . , λ[tk ])].
Dla każdego k-argumentowego symbolu relacyjnego r i zestawu termów t1 , t2 , . . . , tk możemy postawić pytanie, czy w
dziedzinie struktury A zachodzi relacja λ[r](λ[t1 ], λ[t2 ], . . . , λ[tk ]). Możliwe odpowiedzi są tylko dwie: albo relacja ta zachodzi,
albo nie zachodzi. Wygodnie jest to kodować w zbiorze wartości logicznych B := {0, 1} poprzez rozszerzenie interpretacji λ
na formuły atomowe według wzoru.
(
1 gdy λ[r](λ[t1 ], λ[t2 ], . . . , λ[tk ])] zachodzi,
λ[r(t1 , t2 , . . . , tk )] :=
0 gdy λ[r](λ[t1 ], λ[t2 ], . . . , λ[tk ])] nie zachodzi.
Zróbmy jeszcze jeden krok dalej i rozszerzmy interpretację λ na dowolne formuły przyjmując:
λ[¬ϕ]
:=
λ[ϕ ∨ ψ]
:=
λ[∀x ϕ]
1 − λ[ϕ],
max(λ[ϕ], λ[ψ]),
(
1 gdy κ[ϕ] = 1 dla dowolnej interpretacji κ pokrywającej się z λ poza x,
:=
0 w przeciwnym razie.
Liczbę λ[ϕ] określać będziemy wartością logiczną formuły ϕ przy interpretacji λ.
Definicja 3.2.5 Będziemy mówili, że formuła ϕ przy interpretacji λ jest spełniona, jeśli λ[ϕ] = 1. W przeciwnym
razie będziemy mówili, że formuła nie jest spełniona.
Zatem zgodnie z przyjętym przez nas rozszerzeniem, formuła ¬ϕ jest spełniona przy interpretacji λ wtedy i tylko
wtedy, gdy formuła ϕ nie jest spełniona. Podobnie, formuła ϕ ∨ ψ jest spełniona przy interpretacji λ wtedy i tylko wtedy,
3.2. JĘZYK RACHUNKU PREDYKATÓW.
63
gdy przynajmniej jedna z formuł ϕ, ψ jest spełniona. Z kolei formuła ∀x ϕ jest spełniona przy interpretacji λ wtedy i
tylko wtedy, gdy formuła ϕ jest spełniona dla każdej interpretacji, która zmiennej x przypisuje dowolny obiekt z dziedziny
struktury A, a pozostałym zmiennym i wszytkim symbolom relacyjnym i funkcyjnym to samo co interpretacja λ. Obserwacje
te pokazują, że przyjęta przez nas interpretacja formuł nadaje symbolom ¬, ∨, ∀ znaczenie zgodne odpowiednio ze zwrotami
"nieprawda, że", "albo", "dla każdego" z języka potocznego.
Metatwierdzenie 3.2.6 Wartość logiczną formuł ¬ϕ, ϕ ∨ ψ, ϕ ∧ ψ, ϕ ⇒ ψ, ϕ ⇔ ψ przy interpretacji λ można
wyznaczyć w oparciu o wartości logiczne formuł ϕ i ψ przy interpretacji λ zgodnie z tabelą
ϕ
ψ
¬ϕ
ϕ∨ψ
ϕ∧ψ
ϕ⇒ψ
ϕ⇔ψ
0
0
1
0
0
1
1
1
0
0
1
0
0
0
0
1
1
1
1
0
1
0
1
1
1
1
(3.1)
Dowód: Dwa pierwsze wiersze powyższej tabeli otrzymujemy natychmiast podstawiając zera i jedynki do wzorów ... .
Pozostałe wiersze otrzymujemy prostym rachunkiem w podobny sposób.
Łatwo zauważyć, że przy pewnych interpretacjach ta sama formuła raz jest spełniona, a raz nie jest. Na przykład, rozważmy formuł˛e
∀x x + 1 > y.
Wyst˛epuje w niej dokładnie jedna zmienna wolna, mianowicie y . Rozważmy interpretacj˛e w strukturze liczb naturalnych {1, 2, 3, . . .} z relacja˛ wi˛ekszości w roli
> oraz operacja˛ dodawania w roli +, która zmiennej y przypisuje liczb˛e 5. Nie jest prawda,˛ że formuła x + 1 > 5 jest spełniona dla dowolnej liczby naturalnej x,
bo na przykład nie jest spełniona przy przypisaniu zmiennej x liczby 3. Jednak formuła ta jest spełniona przy przypisaniu zmiennej y liczby 1. Rzeczywiście, dla
dowolnej liczby naturalnej x zachodzi x + 1 > 1. Łatwo sprawdzić, że jest to jedyna liczba naturalna, która przypisana do y spełnia nasza˛ formuł˛e w dziedzinie
liczb naturalnych. Natomiast przy interpretacji w strukturze liczb całkowitych nie znajdziemy żadnego przypisania zmiennej y liczby całkowitej, dla którego formuła
∀x x + 1 > y byłaby spełniona.
Definicja 3.2.7
• Formułę ϕ nazywamy semantycznie prawdziwą w interpretacji λ, jeśli jest spełniona przy każdej
interpretacji κ zgodnej z λ.
• Formułę ϕ nazywamy semantycznie fałszywą w interpretacji λ, jeśli formuła ¬ϕ jest semantycznie prawdziwa w
interpretacji λ.
Zauważmy, że formuła, która nie jest semantycznie prawdziwa w interpretacji λ nie musi być logicznie fałszywa w tej
interpretacji. Na przykład nie jest semantycznie prawdziwa formuła
x>5
dla interpretacji λ przypisującej symbolowi > relację większości w dziedzinie liczb naturalnych, bo nie jest ona spełniona
przy interpretacji κ zgodnej z λ, przypisującej zmiennej x liczbę 3. Zaprzeczenie tej formuły przy interpretacji λ też nie jest
semantycznie prawdziwe, bo nie jest spełnione przy interpretacji przypisującej zmiennej x liczbę 8.
Jeśli formuła jest zdaniem, to przy zadanej interpretacji musi być albo semantycznie prawdziwa, albo semantycznie
fałszywa. Jest tak, bo w zdaniu nie ma zmiennych wolnych, a więc przypisanie obiektów zmiennym nie wpływa na spełnialność
zdania. Zatem każde zdanie przy zadanej interpretacji jest semantycznie rozstrzygalne przy tej interpretacji.
Definicja 3.2.8 Formułę nazywamy tautologią rachunku predykatów, jeśli jest semantycznie prawdziwa przy wszystkich interpretacjach. Mówimy też wtedy, że formuła jest logicznie prawdziwa.
64
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Natomiast, jeśli formuła ¬ϕ jest logicznie prawdziwa, to formułę ϕ nazywamy logicznie fałszywą. Podobnie jak w przypadku semantycznej prawdziwości, formuła, która nie jest logicznie prawdziwa nie musi być logicznie fałszywa. Może bowiem
być przy pewnych interpretacjach, a przy innych być fałszywa. W przeciwieństwie do semantycznej prawdziwości/fałszywości
dotyczny to również zdań. Na przykład zdanie
∀x x ­ 1
nie jest ani logicznie prawdziwe, ani logicznie fałszywe, bo jest semantycznie prawdziwe przy interpretacji ­ jako relacja
’większe lub równe’ w dziedzinie liczba naturalnych, ale nie jest semantycznie prawdziwe przy interpretacji ­ jako relacja
’większe lub równe’ w dziedzinie liczb całkowitych.
Tautologie rachunku predykatów są podstawą wszelkich matematycznych rozumowań. Niestety, nie ma automatycznej
metody rozstrzygania co jest, a co nie jest tautologią rachunku predykatów. Każda tautologia rachunku predykatów wymaga
podania oddzielnie dla niej opracowanego uzasadnienia. Można to robić na poziomie metajęzyka, podając metadowód,
odwołujący się do pojęcia interpretacji. Przykłady takich metadowodów podamy w rozdziale .... . Można to też robić na
poziomie samego języka, podając dowody formalne, o czym porozmawiamy w rozdziale .... .
Jest jednak pewna szczególna rodzina formuł, dla której jest możliwe automatyczne rozstrzygnięcie, czy formuła jest
tautologią. Zajmiemy się nimi najpierw.
3.3
Rachunek zdań
Niech ϕ będzie zdaniem języka L. Mówimy, że zdanie to jest złożone, jeśli ma postać ¬ψ lub ψ ∨ χ (ewentualnie ψ ∧ χ,
ψ ⇒ χ, ψ ⇔ χ, jeśli spójników tych nie traktujemy jako skróty). Łatwo zauważyć, że wtedy ψ i χ też są zdaniami. Zdania ψ,
χ nazywamy składnikami podstawowymi zdania ϕ. Składnik zdania φ definiujemy poprzez następujące dwie reguły: składnik
podstawowy jest składnikiem oraz składnik składnika jest składnikiem. Zdanie, które nie jest zdaniem złożonym nazywamy
zdaniem prostym. Składnik zdania ϕ, który jest zdaniem prostym nazywamy składnikiem prostym zdania φ.
Zdanie proste albo ma postać r(t1 , t2 , . . . , tk ), gdzie r jest symbolem relacyjnym k-argumentowym, a t1 , t2 , . . . , tk są
termami pozbawionymi zmiennych, albo ma postać ∀x ψ(x) (ewentualnie ∃x ψ(x), jeśli kwantyfikator ∃ nie jest traktowany
jako skrót).
W zdaniu złożonym kwantyfikatory, symbole relacyjne i termy, w szczególności zmienne, schowane są w jego składnikach
prostych. Ze wzorów ... wynika, że wartość logiczną zdania ϕ przy zadanej interpretacji λ można obliczyć, jeśli znane są
wartości logiczne jego składników prostych przy tej interpretacji. Obserwacja ta prowadzi do następującej koncepcji rachunku
zdań.
Definicja 3.3.1 Formułę nazywamy formułą rachunku zdań, jeśli nie ma w niej zmiennych, ani symboli funkcyjnych.
Łatwo zauważyć, że wtedy nie ma w niej również symboli kwantyfikatorów, a jedynymi symbolami relacyjnymi są symbole
relacyjne zeroargumentowe.
Definicja 3.3.2 Język rachunku zdań to przypadek szczególny języka rachunku predykatów, który obejmuje wyłącznie
formuły rachunku zdań.
Przede wszystkim zauważmy, że formuła rachunku zdań zawsze jest zdaniem, a jego składniki proste są symbolami
relacyjnymi zeroargumentowymi. W przpadku formuły rachunku zdań jej składniki proste określać będziemy też mianem
zmiennych zdaniowych, bo ich interpretacja pozostaje bez związku z interpretacją zwykłych zmiennych.
Tautologią rachunku zdań lub krótko tautologią nazywamy formułę rachunku zdań, która jest tautologią.
Stwierdzenie, czy dana formuła rachunku zdań jest tautologią może być wykonane automatycznym rachunkiem. Przyjmijmy, że formuła ϕ rachunku zdań ma k składników prostych (zmiennych zdaniowych). Każda z tych zmiennych zdaniowych
może przyjąć jedną z dwóch wartości logicznych. Łącznie mamy zatem 2k możliwych konfiguracji wartości tych zmiennych.
Jak zauważyliśmy, wartość logiczna formuły rachunku zdań może być wyliczona z wartości logicznej jej składników prostych.
3.4. TAUTOLOGIE RACHUNKU PREDYKATÓW
Prawo tożsamości:
Prawa przemienności:
Prawa łączności:
Prawa rozdzielności:
Prawa idempotentności:
Prawo wyłączonego środka:
Prawo podwójnej negacji:
Prawa De Morgana:
Prawo kontrapozycji:
Prawo sylogizmu:
Prawa pochłaniania:
Prawo odrywania:
65
α⇔α
α∨β⇔β∨α
α∧β⇔β∧α
(α ⇔ β) ⇔ (β ⇔ α)
(α ∨ β) ∨ γ ⇔ α ∨ (β ∨ γ)
(α ∧ β) ∧ γ ⇔ α ∧ (β ∧ γ)
(α ∨ β) ∧ γ ⇔ (α ∧ γ) ∨ (β ∧ γ)
(α ∧ β) ∨ γ ⇔ (α ∨ γ) ∧ (β ∨ γ)
α∨α⇔α
α∧α⇔α
α ∨ ¬α
¬¬α ⇔ α
¬(α ∨ β) ⇔ ¬α ∧ ¬β
¬(α ∧ β) ⇔ ¬α ∨ ¬β
α ⇒ β ⇔ ¬β ⇒ ¬α
(α ⇒ β) ∧ (β ⇒ γ) ⇒ (α ⇒ γ)
α ∧ (α ∨ β) ⇔ α
α ∨ (α ∧ β) ⇔ α
α ∧ (α ⇒ β) ⇒ β
Tabela 3.1: Wybrane tautologie rachunku zdań
Wystarczy zatem wyliczyć tę wartość dla wszystkich 2k możliwych konfiguracji. Jeśli w każdym przypadku otrzymamy wartość 1, to formuła ϕ jest tautologią rachunku zdań.
W ten sposób łatwo można udowodnić następujące twierdzenie:
Metatwierdzenie 3.3.3 Formy rachunku zdań w tabeli 3.1 są tautologiami.
Tautologie rachunku zdań sa˛ nieocenione w rozumowaniach. Można si˛e do nich odwołać zawsze, bez wzgl˛edu na to jakie konkretnie zdania podstawimy za
zmienne zdaniowe.
Łatwo sprawdzić, że podstawiając w formule rachunku zdań za zmienne zdaniowe formuły języka predykatów dostajemy
formułę języka predykatów. Mamy następujące twierdzenie.
Twierdzenie 3.3.4 Niech ϕ będzie tautologią rachunku zdań. Niech α1 , α2 , . . . , αk będą wszystkimi, parami różnymi
zmiennymi zdaniowymi tej tautologii. Dobierając do każdego αi pewną formułę rachunku predykatów ψi i podstawiając
wszędzie w formule ϕ formułę ψi za zmienną αi otrzymujemy tautologię rachunku predykatów.
Dowód: Niech ϕ0 będzie formułą otrzymaną z ϕ po podstawieniach i niech λ będzie ustaloną interpretacją. Niech λ0
oznacza interpretację, która zmiennej zdaniowej αi przypisuje wartość λ[ψi ]. Łatwo sprawdzić, że λ[ϕ0 ] = λ0 [ϕ]. Ale λ0 [ϕ] = 1,
ϕ jest tautologią. Zatem λ[ϕ0 ] = 1 dla dowolnej interpretacji λ, co dowodzi, że również ϕ0 jest tautologią.
3.4
Tautologie rachunku predykatów
Jak już wspomnieliśmy, w przypadku formuły rachunku predykatów nie ma mechanicznego sposobu sprawdzenia, czy jest
ona tautologią. Przyjrzymy się teraz kilku najważniejszym tautologiom rachunku predykatów i podamy dla wybranych
dowody na poziomie metajęzyka.
66
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Metatwierdzenie 3.4.1 Niech ϕ(x) będzie formułą, w której zmienna x jest wolna, a zmienna y nie występuje. Niech
ϕ(y) oznacza formułę otrzymaną z ϕ przez podstawienie zmiennej y za zmienną x wszędzie tam gdzie x występuje jako
zmienna wolna. Następujące formuły są tautologiami rachunku predykatów.
∀x ϕ(x) ⇔
∀y ϕ(y),
(3.2)
∃x ϕ(x) ⇔
∃y ϕ(y),
(3.3)
∀x ϕ(x) ⇒ ϕ(y).
(3.4)
Dowód: ...
Metatwierdzenie 3.4.2 Niech ϕ będzie formułą o zmiennej wolnej x. Następujące formuły są tautologiami rachunku
predykatów.
∀x ϕ(x) ⇔
∃x ϕ(x),
¬∀x ϕ(x) ⇔
∃x ¬ϕ(x),
¬∃x ϕ(x) ⇔
∀x ¬ϕ(x).
Metatwierdzenie 3.4.3 Niech ϕ, ψ będą formułami o zmiennej wolnej x. Następujące formuły są tautologiami rachunku predykatów.
∀x ϕ(x) ∧ ψ(x) ⇔
∀x ϕ(x) ∧ ∀x ψ(x),
∃x ϕ(x) ∨ ψ(x) ⇔
∃x ϕ(x) ∨ ∃x ψ(x),
∀x ϕ(x) ∨ ∀x ψ(x) ⇒
∃x ϕ(x) ∧ ψ(x) ⇒
∀x ϕ(x) ∨ ψ(x),
∃x ϕ(x) ∧ ∃x ψ(x).
Ponadto, w ostatnich dwóch formułach symbolu implikacji nie można zastąpić symbolem równoważności.
Metatwierdzenie 3.4.4 Niech ϕ będzie formułą o zmiennych wolnych x i y. Następujące formuły są tautologiami
rachunku predykatów.
∀x ∀y ϕ(x, y) ⇔
∀y ∀x ϕ(x, y),
∃x ∃y ϕ(x, y) ⇔
∃y ∃x ϕ(x, y),
∃x ∀y ϕ(x, y) ⇒
∀y ∃x ϕ(x, y).
Ponadto, w ostatniej formule symbolu implikacji nie można zastąpić symbolem równoważności.
Metatwierdzenie 3.4.5 Niech ϕ będzie formułą o zmiennej wolnej x, a ψ formułą, w której x nie występuje. Następujące formuły są tautologiami rachunku predykatów.
∀x (ϕ(x) ∧ ψ) ⇔ (∀x ϕ(x)) ∧ ψ,
∃x (ϕ(x) ∨ ψ) ⇔ (∃x ϕ(x)) ∨ ψ,
∀x (ϕ(x) ∨ ψ)
⇔ (∀x ϕ(x)) ∨ ψ,
∃x (ϕ(x) ∧ ψ)
⇔ (∃x ϕ(x)) ∧ ψ.
3.5. KONSEKWENCJA I DOWÓD FORMALNY
3.5
67
Konsekwencja i dowód formalny
Niech Φ będzie pewnym skończonym zbiorem formuł języka L. Mówimy, że formuła ψ jest konsekwencją semantyczną
zbioru Φ jeśli dla każdej interpretacji λ jeśli λ[φ] = 1 dla wszystkich φ ∈ Φ, to również λ[ψ] = 1. Fakt, że formuła ψ jest
konsekwencją semantyczną zbioru Φ zapisujemy jako Φ |= ψ.
Konsekwencji semantycznej nie jesteśmy w stanie sprawdzić w praktyce, bo wymaga to przeanalizowania nieskończonej
liczby interpretacji. Dlatego interesuje nas alternatywny, skończony sposób weryfikowania zachodzenia konsekwencji. W tym
celu zdefiniujemy konsekwencję syntaktyczną.
Niech ϕ, ψ będą dowolnymi formułami. Przyjmujemy następujące dwie reguły dowodzenia:
Reguła odrywania: Formuła ψ wynika z formuł ϕ i ϕ ⇒ ψ.
Reguła uogólniania: Formuła ∀x ϕ wynika z formuły ϕ poprzez generalizację względem zmiennej x
Wynikanie na mocy reguł dowodzenia określamy też mianem bezpośredniej konsekwencji.
Definicja 3.5.1 Dedukcją lub wywodem ψ z Φ nazywamy ciąg formuł ψ1 , ψ2 , . . . ψn taki, że ψn = ψ oraz każda formuła
ψk dla k = 1, 2, . . . n spełnia jeden z poniższych trzech warunków:
1) ψk ∈ Φ,
2) istnieją i, j < k takie, że ψk wynika z formuł ψi , ψj na mocy reguły odrywania,
3) istnieje i < k takie, że ψk wynika z formuły ψi na mocy reguły uogólniania poprzez generalizację względem
zmiennej, która nie jest zmienną wolną w żadnej formule należącej do Φ.
Ustalmy pewien zbiór formuł A, który nazywać będziemy zbiorem aksjomatów. Dedukcją lub wywodem ψ z Φ w oparciu
o aksjomaty z A nazywamy wywód ψ z Φ ∪ A. W tym kontekście elementy Φ nazywamy przesłankami wywodu.
Warto wyjaśnić, czemu przesłanki odróżniamy od aksjomatów. Od aksjomatów oczekujemy, by były semantycznie prawdziwe w pewnej interpretacji. Od przesłanek tego nie oczekujemy. Jak zobaczymy, przesłanki stanowia˛ wygodnie narz˛edzie pomocnicze w rozumowaniach, ale w ostatecznym rozrachunku interesuja˛
nas wywosy nie wykorzystujace
˛ przesłanek.
Jeśli istnieje dedukcja ψ z ϕ w oparciu o aksjomaty z A to mówimy, że ψ jest syntaktyczną konsekwencją Φ i piszemy
Φ `A ψ lub krótko Φ ` ψ gdy zbiór aksjomatów A jest znany z kontekstu.
W dalszym ciągu zakładamy, że zbiór aksjomatów A obejmuje wszystkie formuły podpadające pod następujące schematy,
w których ϕ, ψ, χ są formułami języka L:
(A1) ϕ ∨ ϕ ⇒ ϕ,
(A2) ϕ ⇒ ϕ ∨ ψ,
(A3) ϕ ∨ ψ ⇒ ψ ∨ ϕ,
(A4) (ϕ ⇒ ψ) ⇒ (χ ∨ ϕ ⇒ χ ∨ ψ),
(A5) (∀x ϕ(x)) ⇒ ϕ(y),
(A6) ∀x (ϕ ⇒ ψ) ⇒ (ϕ ⇒ ∀x ψ(x)),
przy czym zakładamy, że w (A8) x nie jest zmienną wolną w ϕ.
68
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Definicja 3.5.2
• Jeśli ψ ma dedukcję z samych aksjomatów, to znaczy ∅ ` ψ to piszemy krótko `ψ i mówimy,
że ψ jest twierdzeniem teorii opartej o aksjomaty ze zbioru A.
• Jeśli A obejmuje wyłącznie formuły ze schematów (A1) − (A6) to mówimy, że ψ jest twierdzeniem rachunku
predykatów.
Metatwierdzenie 3.5.3 (o dedukcji). Syntaktyczna konsekwencja Φ ` ϕ ⇒ ψ zachodzi wtedy i tylko wtedy gdy Φ ∪
{ϕ} ` ψ.
Zbiór formuł Φ nazywamy sprzecznym, jeżeli dla pewnej formuły χ jest Φ ` χ ∧ ¬χ.
Jak pokazuje poniższe metatwierdzenie, ze sprzecznego zbioru formuł można wydedukować dowolną formułę.
Metatwierdzenie 3.5.4 (o sprzeczności) Jeśli Φ jest sprzeczny, to dla dowolnej formuły χ jest Φ ` χ.
Tym niemniej pojęcie sprzecznego zbioru formuł jest użyteczne w dowodzeniu.
Metatwierdzenie 3.5.5 (o dedukcji nie wprost). Syntaktyczna konsekwencja Φ ` ψ zachodzi wtedy i tylko wtedy gdy
Φ ∪ {¬ψ} jest sprzeczny.
Metatwierdzenie 3.5.6 ( o dedukcji koniunkcji) Jeśli Φ ` ψ1 i Φ ` ψ2 to Φ ` ψ1 ∧ ψ2
Dowód: Zdanie ψ1 ∧ψ2 ⇔¬(ψ1 ⇒¬ψ2 ) jest tautologią wystarczy więc pokazać, że Φ`¬(ψ1 ⇒¬ψ2 ). Na mocy twierdzenia
o dedukcji nie wprost wystarczy pokazać, że Φ0 := Φ ∪ {ψ1 ⇒ ¬ψ2 } jest sprzeczny. Z założenia wiemy, że ψ1 oraz ψ2 mają
wywód z Φ. Wypisujemy te wywody jeden po drugim i na końcu dopisujemy
ψ1 ⇒ ¬ψ2 , ¬ψ2 ,
co pokazuje, że Φ0 ` ¬ψ2 . Oczywiście Φ0 ` ψ2 . Zatem Φ0 jest sprzeczny.
Metatwierdzenie 3.5.7 ( o dedukcji przez przypadki) Jeśli Φ ∪ {ϕ} ` ψ i Φ ∪ {¬ϕ} ` ψ to Φ ` ψ.
Dowód: Na mocy twierdzenia o dedukcji Φ ` ϕ ⇒ ψ oraz Φ ` ¬ϕ ⇒ ψ. Na mocy twierdzenia o dedukcji koniunkcji
Φ ` ϕ ⇒ ψ ∧ ¬ϕ ⇒ ψ. Wykorzystując tautologię
(ϕ ⇒ ψ ∧ ¬ϕ ⇒ ψ) ⇒ ψ
otrzymujemy Φ ⇒ ψ.
Następujące ważne metatwierdzenie, pochodzące od K. Gödela, pozostawimy bez dowodu.
Metatwierdzenie 3.5.8 (o pełności rachunku predykatów, K. Gödel, 1930) Dla dowolnego zbioru formuł Φ i formuły ψ formuła ψ jest semantyczną konsekwencją Φ wtedy i tylko wtedy gdy ψ jest syntaktyczną konsekwencją Φ.
W szczególności formuła jest twierdzdeniem rachunku predykatów wtedy i tylko wtedy gdy jest tautologią rachunku
predykatów.
3.6. TEORIE AKSJOMATYCZNE
69
Rysunek 3.1: Giuseppe Peano, 1858-1932. Źródło: Wikipedia
Metatwierdzenie 3.5.9 ( o nazywaniu istniejących obiektów ) Niech ϕ(u) i ψ(u) będą formułami o zmiennej wolnej
u Jeśli ϕ(u) ` ψ(u) i `∃u ϕ(u) to `∃u ϕ(u) ∧ ψ(u).
Dowód: Na mocy twierdzenia o dedukcji mamy `ϕ(u) ⇒ ψ(u). Ponieważ zbiór przesłanek jest pusty, więc w oparciu
o regułę uogólniania mamy też `∀u ϕ(u) ⇒ ψ(u) co jest równoważne `∀u ¬ϕ(u) ∨ ψ(u). Dowodząc nie wprost formułę
∃u ϕ(u) ∧ ψ(u), mamy ∀u ¬ϕ(u) ∨ ¬ψ(u). Zatem ∀u (¬ϕ(u) ∨ ¬ψ(u)) ∧ (¬ϕ(u) ∨ ψ(u)). Wykorzystując rozdzielność koniunkcji
względem alternatywy otrzymujemy ∀u ¬ϕ(u) ∧ ¬ϕ(u) ∨ ¬ϕ(u) ∧ ψ(u) ∨ ¬ψ(u) ∧ ¬ϕ(u) ∨ ¬ψ(u) ∧ ψ(u)). Stąd wnosimy, że
∀u ¬ϕ(u), czyli z praw de Morgana ¬∃u ϕ(u) co przeczy przyjętemu założeniu.
3.6
Teorie aksjomatyczne
Wiele matematycznych rozważań można sformalizować w oparciu o rachunek predykatów wzbogacony o dodatkowe, pozalogiczne aksjomaty, charakterystyczne dla rozważanej teorii.
Przykład 3.6.1 Jako pierwszy przykład rozważmy teorię identyczności, która sama w sobie nie jest bardzo ciekawa,
ale jest potrzebna praktycznie w każdej innej teorii, choć akurat, jak zobaczymy, w teorii mnogości identyczność
nie musi być pojęciem pierwotnym, ale można ją zdefiniować. Do opisania teorii identyczności przyjmuje się jeden
wyróżniony symbol relacyjny =∈ R2 natomiast dopuszcza się dowolne inne symbole relacyjne i dowolne symbole
funkcyjne. Przyjmuje się następujące aksjomaty
I1) ∀x x = x,
I2) ∀x∀x x = y ⇒ y = x,
I3) ∀x∀x∀z x = y ∧ y = z ⇒ x = z.
I4) dla każdego symbolu funcyjnego f ∈ Fn i dla każdego i = 1, 2, . . . n
ti = t0i ⇒ f (t1 , . . . , ti−1 , ti , ti+1 , . . . , tn ) = f (t1 , . . . , ti−1 , t0i , ti+1 , . . . , tn )
I5) dla każdego symbolu relacyjnego r ∈ Fn różnego od symbolu równości i dla każdego i = 1, 2, . . . n
ti = t0i ⇒ (r(t1 , . . . , ti−1 , ti , ti+1 , . . . , tn ) ⇔ r(t1 , . . . , ti−1 , t0i , ti+1 , . . . , tn )) .
70
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Przykład 3.6.2 Jako drugi przykład podajmy formalizację liczb naturalnych z zerem, pochodzącą od włoskiego
matematyka Giuseppe Peano (rys. 3.1). Do jej opisania wystarcza język z jednym symbolem relacyjnym =∈ R2 ,
z jednym symbolem funkcyjnym zeroargumentowym 0 ∈ F0 interpretowanym jako liczba zero i jednym symbolem
jednooargumentowym 0 ∈ F1 interpretowanym jako operacja wzięcia kolejnej liczby naturalnej. Peano wykazał, że
arytmetykę liczb naturalnych można opisać w takim języku, przyjmując, obok aksjomatów teorii identyczności dla
symbolu = zestaw aksjomatów
• ∀n ¬(n0 = 0),
• ∀n∀m n0 = m0 ⇒ n = m,
• dla każdej formuły ϕ zachodzi
(ϕ(0) ∧ ∀n ϕ(n) ⇒ ϕ(n0 )) ⇒ ∀n ϕ(n)
Na podstawie tych aksjomatów w szczególności można zdefiniować operacje dodawania, mnożenia i porównywania
liczb naturalnych i udowodnić ich własności.
Dowodem formuły w teorii aksjomatycznej jest jej dedukcja ze zbioru aksjomatów. Formułę posiadającą dowód nazywa
się twierdzeniem tej teorii. Teorię nazywa się niesprzeczną, jeżeli jej zbiór aksjomatów jest niesprzeczny. Teorię nazywa się
zupełną, jeśli dla każdego zdania tej teorii albo ono albo jego zaprzeczenie jest twierdzeniem tej teorii.
Program Hilberta zakładał, że po sformalizowaniu kluczowych teorii matematycznych uda się przeprowadzić dowody
ich niesprzeczności i zupełności w oparciu o samą analizę metamatematyczną formalnego języka te teorie opisującego. Są
dwie metody dowodzenia niesprzeczności: metamatematyczna, poprzez czysto formalną analizę języka opisującego teorię,
której niesprzeczność chcemy udowodnić oraz semantyczna, w której konstruujemy model dla teorii, której niesprzeczność
dowodzimy na gruncie innej, prostszej teorii, której niesprzeczność zakładamy. Ten drugi sposób jest relatywny: niesprzeczność jakiejś teorii, możliwie najprostszej, musimy założyć. W 1930 roku Kurt Gödel pokazał, że metamatematyczny dowód
niesprzeczności teorii matematycznej dostatecznie bogatej, by zawierać arytmetykę liczb naturalnych może być przeprowadzony jedynie na gruncie teorii bogatszej od tej, której niesprzeczność chcemy udowodnić. Jest to jeszcze gorsze od dowodu
relatywnego.
Co więcej, Gödel pokazał też, że każda sformalizowana teoria matematyczna dostatecznie bogata by zawierać arytmetykę
liczb naturalnych, jeśli jest niesprzeczna, to jest niezupełna. Te dwa twierdzenia Gödla spowodowały, że plan Hilberta
okazał się nie do zrealizowania w skali o jakiej Hilbert marzył. Tym niemniej, formalizacja teorii matematycznych została
przez matematyków zaakceptowana jako najlepszy sposób unikania paradoksów. Co więcej, dowodzenie niesprzeczności
matematycznych teorii poprzez konstrukcje modelu w teorii prostszej sprawiło, że dziś praktycznie cała matematyka została
osadzona na gruncie teorii mnogości, jako tej najbardziej elementarnej teorii matematycznej.
3.7
Formalizm w praktyce matematycznej.
Jedynie dowód formalny daje nam pewność, że formuła, którą udowodniliśmy rzeczywiście jest twierdzeniem. Z drugiej strony
dowód formalny, nawet jeśli zawiera komentarz wyjaśniający co z czego wynika, jest na ogół długi, męczący w czytaniu
i najczęściej nie pozwala zrozumieć jak został wymyślony, a w konsekwencji nie sprzyja budowaniu intuicji związanych
z dowodzonym twierdzeniem. Matematyk wprawny w konstruowaniu dowodów często woli wymyślić dowód własny niż
zrozumieć czyjś dowód zapisany czysto formalnie.
Dlatego zazwyczaj dowody w literaturze matematycznej są swego rodzaju kompromisem pomiędzy formalizmem i czytelnością. To, którędy przebiega kompromis zależy od przygotowania czytelnika, do którego adresowany jest tekst. Typowy
zapis dowodu jest raczej mniej lub bardziej szczegółowym szkicem, jak uzyskać dowód formalny. Szkic jednak powinien być
na tyle precyzyjny, by czytelnik w oparciu o swoje doświadczenie mógł bez problemu uzupełnić brakujące szczegóły.
Jak wspominaliśmy, matematycy stosują mnóstwo sztuczek, by mieć do dyspozycji bardzo dużo różnych symboli, a w
konsewkencji dużo różnych zmiennych. Choć teoretycznie może być on dowolnie duży (na przykład można dodać dowolnie
dużo ptaszków), w praktyce i tak jest on zbyt mały, by uniknąć kolizji. Dlatego wygodnie jest operować pojęciem zakresu
3.8. SCHEMATY DOWODOWE.
71
występowania zmiennej. Przyjmujemy, że zakresem występowania zmiennej związanej jest najmniejsza podformuła formuły,
której związanie dotyczy. W przypadku zmiennej wolnej zakres jej występowania będziemy rozpoczynać zwrotem "Niech
x będzie takie, że ..." lub x := ... czytane "Zdefiniujmy x jako ..." lub jakimś zwrotem o tym samym znaczeniu. Zakres
występowania takiej nazwy obejmuje wszsytkie formuły od użycia tego zwrotu aż do ponownego użycia tego zwrotu, które
to rozpoczyna nowy zakres. Teoretycznie, wymieniając zmienne w różnych zakresach na nowe tak by nie było powtórzeń,
możemy się pozbyć powtarzających się zmiennych o różnych znaczeniach.
Aby uniknąć powtarzania ciągle tych samych formuł, wprowadza się do tekstu matematycznego definicje. Od strony
formalnej definicje to tylko skróty. Do definiowania używać będziemy symbolu :⇔ lub ⇔ :, w którym po stronie dwukropka
umieszczać będziemy to co definiujemy, a po stronie drugiej to jak definiujemy. Od strony praktycznej dobrze dobrane
definicje są nieocenione, bo sprzyjają budowaniu stosownych intuicji.
W następnych rozdziałach przedstawimy w miarę formalnie zarys teorii mnogości. Oczywiście podstawowym celem będzie
dowodzenie twierdzeń. Będzie ich dużo więc wygodnie jest nieco rozszerzyć terminologię dotyczącą twierdznenia. Jeśli dowód
twierdzenia jest stosunkowo prosty to samo twierdzenie określa się mianem uwaga. Klasyczne słowo twierdzenie matematcy
rezerwują dla szczególnie ważnych twierdzeń. Twierdzenia, których rola jest głównie pomocnicza określa się mianem lematu.
Twierdzenia wynikające bezpośrednio z wcześniej udowodnionego innego twierdzenia określa się mianem wniosku.
3.8
Schematy dowodowe.
Jak już wspomnieliśmy, w codziennej praktyce matematycznej wypisywanie kompletnych formalnych dowodów jest niewykonalne. Najczęściej zamiast kompletnych dowodów podajemy mniej lub bardziej dokładne szkice dowodów, opierając się
o różnego rodzaju schematy dowodowe. Schemat dowodowy to pewien sposób rozumowania, o którym wiadomo, że może
zostać zastąpiony formalnym dowodem. Ponadto schemat dowodowy zazwyczaj zawiera komentarze, które czytelnikowi mają ułatwić ustalenie na jakiej podstawie konkretna formuła ma prawo znaleźć się w dowodzie. Co więcej, formuły często w
części lub całości zastępujemy ich słownymi opisami, bo ułatwia czytanie.
Do najważniejszych schematów należy zaliczyć
Dowód wprost. Ten schemat oznacza, że szkicujemy bezpośredni dowód, a więc podajemy kolejne, choć zazwyczaj
nie wszystkie, formuły jakie znajdują się w dowodzie formalnym.
Dowód implikacji. Jeśli formuła ma postać ϕ⇒ψ to na mocy metatwierdzenia 3.5.3 wystarczy podać wywód formuły
ψ z przesłanki ϕ.
Dowód przez przypadki. Jeśli podamy wywód formuły θ z przesłanki ϕ oraz wywód z formuły γ z przesłanki ψ i
udowodnimy ϕ ∨ ψ, to wiemy z metatwierdzenia 3.5.7, że formuła θ posiada dowód.
Dowód formuły ∀x ∈ A ϕ(x). Aby udowodnić taką formułę wystarczy podać wywód formuły ϕ(x) z przesłanki x ∈ A
i zastosować regułę generalizacji.
72
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Rozdział 4
Elementy teorii mnogości
4.1
Formalizm teorii mnogości
Jedna˛ z metod sprawdzania niesprzeczności aksjomatów teorii jest pokazanie, że aksjomaty te sa˛ twierdzeniami innej teorii, której niesprzeczność już udowodniono, albo przynajmniej teorii, w której niesprzeczność aksjomatów budzi mniej watpliwości.
˛
W pierwszym dwudziestoleciu XX wieku teoria zbiorów, w j˛ezyku polskim najcz˛eściej określana mianem teoria mnogości, stała si˛e fundamentem głównego
nurtu współczesnej matematyki, jako najbardziej elementarna teoria, w której weryfikować można aksjomaty bardziej zaawansowanych teorii.
Twórca˛ teorii mnogości był niemiecki matematyk Georg Cantor (rys. 4.1).
Formalizacja teorii mnogości opiera się na języku predykatów. Nie są potrzebne symbole funkcyjne i jest tylko jeden
symbol relacyjny: ∈ - symbol przynależności do zbioru. Tak więc formuła
x∈y
będzie przez nas intepretowana jako stwierdzenie, że x jest elementem zbioru y. Przyjmujemy też od razu skrót
x 6∈ y :⇔ ¬x ∈ y.
Aby nie mnożyć pojęć, wygodnie jest przyjąć, że wszystkie zmienne oznaczają zbiory. W szczególności, jeśli x ∈ y to nie
tylko y jest zbiorem, ale również x jest zbiorem. Takie podejście jest nieco zaskakujące, ale studiując teorię mnogości szybko
się z nim oswajamy, uświadamiając sobie, że jest wygodne, bo nie mnoży pojęć, a nie ma w nim nic niebezpiecznego.
4.1.1
Podstawowe definicje i oznaczenia.
Na początek w formalnych formułach będziemy używać wyłącznie małych liter z końca alfabetu: t, u, v, w, x, y, z dla oznaczenia zbiorów, dla podkreślenia, że chodzi o zmienne języka formalnego. Na codzień jest to jednak niewygodne, więc niebawem
trochę rozluźnimy tę konwencję.
Definicja 4.1.1 Mówimy, że zbiór x zawiera się w zbiorze y i piszemy x ⊂ y jeżeli
∀t t ∈ x ⇒ t ∈ y.
Uwaga 4.1.2 Mamy
∀x x ⊂ x.
73
74
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Rysunek 4.1: Georg Cantor, 1845-1918. Źródło: Wikipedia
Dowód: Oto kolejne formuły dowodu formalnego:
1. ¬w ∈ x ∨ w ∈ x
podstawienie do tautologii wyłączonego środka
2. w ∈ x ⇒ w ∈ x
rozpisanie przy pomocy znaku implikacji
3. ∀w w ∈ x ⇒ w ∈ x na podstawie reguły generalizacji
4. x ⊂ x
wykorzystanie definicji zawierania się zbiorów
5. ∀x x ⊂ x
ponownie na podstawie reguły generalizacji.
Uwaga 4.1.3 Mamy
∀x ∀y ∀z (x ⊂ y ∧ y ⊂ z ⇒ x ⊂ z).
Dowód: Pokażemy najpierw, że
{x ⊂ y ∧ y ⊂ z, w ∈ x} ` w ∈ z.
Dowód formalny tego wnioskowania wygląda następująco:
1. x ⊂ y ∧ y ⊂ z
przesłanka
2. w ∈ x
przesłanka
3. x ⊂ y ∧ y ⊂ z ⇒ x ⊂ y podstawienie do tautologii ϕ ∧ ψ ⇒ ϕ
4. x ⊂ y
z 1 i 3 na podstawie reguły odrywania
5. ∀t t ∈ x ⇒ t ∈ y
rozpisanie 4 z definicji
6. w ∈ x ⇒ w ∈ y
na podstawie tautologii (3.4)
7. w ∈ y
z 2 i 6 na podstawie reguły odrywania
8. x ⊂ y ∧ y ⊂ z ⇒ y ⊂ z podstawienie do tautologii ϕ ∧ ψ ⇒ ψ
9. y ⊂ z
z 1 i 8 na podstawie reguły odrywania
10. ∀t t ∈ y ⇒ t ∈ z
rozpisanie 9 z definicji
11. w ∈ y ⇒ w ∈ z
na podstawie tautologii (3.4)
12. w ∈ z
z 7 i 11 na podstawie reguły odrywania
Na podstawie metatwierdzenia 3.5.3 wnosimy, że
{x ⊂ y ∧ y ⊂ z} ` w ∈ x ⇒ w ∈ z.
Ponownie z metatwierdzenia 3.5.3 dostajemy
`(x ⊂ y ∧ y ⊂ z) ⇒ (w ∈ x ⇒ w ∈ z),
4.1. FORMALIZM TEORII MNOGOŚCI
75
czyli, że formuła
(x ⊂ y ∧ y ⊂ z) ⇒ (w ∈ x ⇒ w ∈ z)
posiada dowód. Na podstawie reguły generalizacji na końcu tego dowodu możemy dopisać formułę
∀w (x ⊂ y ∧ y ⊂ z) ⇒ (w ∈ x ⇒ w ∈ z).
Rozpisując pierwszą implikację z definicji mamy
∀w ¬(x ⊂ y ∧ y ⊂ z) ∨ (w ∈ x ⇒ w ∈ z).
Wykorzystując przemienność alternatywy oraz tautologię 3.5 mamy
¬(x ⊂ y ∧ y ⊂ z) ∨ ∀w (w ∈ x ⇒ w ∈ z)
co można ponownie zapisać przy pomocy implikacji jako
(x ⊂ y ∧ y ⊂ z) ⇒ ∀w (w ∈ x ⇒ w ∈ z),
a stosując definicję zawierania się zbiorów jako
(x ⊂ y ∧ y ⊂ z) ⇒ x ⊂ z.
Stusując teraz trzykrotnie regułę generalizacji otrzymujemy tezę.
W dalszym ciągu trochę rozluźnimy konwencję oznaczania zbiorów i uczynimy ją nieco bardziej intuicyjną. Nowa konwencja będzie następująca. O zbiorach, które jedynie formalnie są zbiorami, ale "nie zaglądamy im do środka", tzn. nie interesują
nas ich elementy, ale wyłącznie one same w roli elementów innych zbiorów, mówić będziemy ’obiekty’ lub ’elementy’. Dla
takich zbiorów używać będziemy liter małych podobnie jak do tej pory, choć niekoniecznie z końca alfabetu. Słowo ’zbiór’
rezerwujemy dla "zwykłych" zbiorów, a więc takich, których elementom nie zaglądamy do środka. Na oznaczenie takich zbiorów używać będziemy drukowanych dużych liter A, B, ... X, Y , Z. W przypadku zbiorów, których elementy są zbiorami w
tym znaczniu, że zaglądamy im do środka, a więc interesują nas ich elementy, używać będziemy określenia ’rodzina zbiorów’.
Rodziny zbiorów oznaczać będziemy dużymi literami pisanymi A, B, ... X , Y, Z. Oczywiście mogą się pojawić i pojawią
się rodziny zbiorów rzędu drugiego, a więc rodziny, których elementy same w sobie są rodzinami, rodziny rzędu trzeciego,
których elementy są rodzinami rzędu drugiego itd. W takich przypadkach nasz system oznaczeń będzie nieco odbiegać od
przyjętej konwencji, ale nie powinno to prowadzić do nieporozumień. Podkreślmy, że ten system oznaczeń ma jedynie na
celu ułatwienie czytania formalnego tekstu, bo dla samej treści to, jakie stosujemy oznacznia nie ma zupełnie znaczenia.
Definicja 4.1.4 Mówimy, że zbiory X i Y są identyczne lub równe jeżeli
X ⊂ Y ∧ Y ⊂ Y.
Piszemy wtedy X = Y . Mówimy, że zbiory X i Y są różne i piszemy X 6= Y jeżeli ¬X = Y .
Zauważmy, że
Uwaga 4.1.5
X = Y ⇔ (∀z z ∈ X ⇔ z ∈ Y )
76
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Uwaga 4.1.6 Identyczność zbiorów ma następujące trzy własności
∀x
∀x∀y
∀x∀y∀z
x = x,
(4.1)
x = y ⇒ y = x,
(4.2)
x = y ∧ y = z ⇒ x = z.
(4.3)
Dowód: ...
Wygodnie jest jeszcze wprowadzić dwa synonimy zwrotu ’zawiera się’.
Definicja 4.1.7 Mówimy, że X jest podzbiorem zbioru Y jeżeli X ⊂ Y . Mówimy, że X jest podzbiorem właściwym
zbioru Y i piszemy X ( Y , jeżeli X ⊂ Y i X 6= Y . Mówimy, że X jest nadzbiorem zbioru Y i piszemy X ⊃ Y jeżeli
Y ⊂ X. Mówimy, że X jest nadzbiorem właściwym zbioru Y i piszemy X ) Y , jeżeli X ⊃ Y i X 6= Y .
Często udaje się pokazać nie tylko istnienie obiektu x o własności ϕ(x), ale również fakt, że obiekt ten jest dokładnie jeden
w znaczeniu, że jeśli ϕ(x1 ) i ϕ(x2 ) to x1 = x2 . Wygodnie jest wprowadzić skrót na oznaczenie takiej sytuacji. Przyjmujemy
więc następujące oznaczenie
∃!x ϕ(x) :⇔ ∃x ϕ(x) ∧ (∀y∀z ϕ(y) ∧ ϕ(z) ⇒ y = z),
a znak ∃! czytamy ’istnieje dokładnie jeden’.
Wygodnie jest też wprowadzić oznaczenie na przypadek gdy kwantyfikator odnosimy tylko do elementów pewnego zbioru
X.
4.2
∀x ∈ X ϕ(x)
:⇔
∀x x ∈ X ⇒ ϕ(x)
∃x ∈ X ϕ(x)
:⇔
∃x x ∈ X ∧ ϕ(x)
Formuły zbiorotwórcze.
Rozważmy formułę ϕ(x) o dokładnie jednej zmiennej wolnej x. Naturalne jest pytanie, czy istnieje zbiór X, którego elementami są dokładnie takie x, dla których formuła ϕ(x) jest spełniona. Formalnie, jest to pytanie czy formuła
∃X ∀x x ∈ X ⇔ ϕ(x)
(4.4)
jest spełniona. Powiemy, że formuła ϕ jest zbiorotwórcza, jeżeli formuła (4.4) jest spełniona. Na wczesnym etapie tworzenia
teorii mnogości bezkrytycznie przyjmowano, że każda formuła jest zbiorotwórcza. Jednak w 1901 roku brytyjski filozof
Bertrand Russel (ryc. 4.2 zauważył, że może to prowadzić do sprzeczności. Dokładniej, Russel zauważył, że formuła
ϕ(x) := x 6∈ x
nie może być zbiorotwórcza. Rzeczywiście, załóżmy, że istnieje zbiór X takich zbiorów x, że x 6∈ x. Mamy dwa możliwe
przypadki: albo X jest swoim elementem, albo nie jest. Jeśli X ∈ X, to na mocy definicji X mamy X 6∈ X. Jeśli X 6∈ X
to znów na mocy definicji X mamy X ∈ X. Otrzymujemy więc sprzeczność, zwaną paradoksem Russela. Sprzeczności
związanych z paradoksem Russela udało się uniknąć poprzez aksjomatyzację teorii mnogości, w której jedynie dla wybranych
formuł na mocy aksjomatu przyjmuje się, że są zbiorotwórcze.
Uwaga 4.2.1 Jeśli ϕ jest zbiorotwórcza, to zbiór X w formule (4.4) jest wyznaczony jednoznacznie. Formalnie:
∃!X ∀x x ∈ X ⇔ ϕ(x)
4.2. FORMUŁY ZBIOROTWÓRCZE.
77
Rysunek 4.2: Bertrand Russell, 1872-1970. Źródło: Wikipedia
Dowód: Rozpisując oznaczenie ∃! stwierdzamy, że musimy pokazać koniunkcję dwóch formuł
∃X ∀x x ∈ X ⇔ ϕ(x)
oraz
∀X1 ∀X2 (∀x x ∈ X1 ⇔ ϕ(x)) ∧ (∀x x ∈ X2 ⇔ ϕ(x)) ⇒ X1 = X2 .
Pierwsza wynika z założenia, że formuła ϕ jest zbiorotwórcza. Aby pokazać drugi, przyjmijmy, że zbiory X1 i X2 są takie,
że ∀x x ∈ X1 ⇔ ϕ(x) i ∀x x ∈ X2 ⇔ ϕ(x). Wtedy ∀x x ∈ X1 ⇔ x ∈ X2 i z uwagi 4.1.5 dostajemy, że X1 = X2 .
Zbiór X, którego istnienie postuluje formuła (4.4) oznaczamy
{ x | ϕ(x) }.
(4.5)
Podkreślmy, że w oznaczeniu tym zmienną x należy traktować jak zmienną związaną, bo zastąpienie jej inną zmienną daje
ciągle ten sam zbiór.
Oznaczenie (4.5) zwane jest wyrażeniem klasowym. Nazwa ta bierze się stąd, że oznaczenie (4.5) bywa stosowane również
wtedy, gdy formuła ϕ nie jest zbiorotwórcza. Mówi się wtedy, że definiuje ono klasę. Pozwala to zastąpić zwrot ’formula ϕ
jest zbiorotwórcza’ równoważnym mu zwrotem ’klasa
{ x | ϕ(x) }
jest zbiorem’.
Pojęcie klasy też może być sformalizowane, my jednak nie będziemy tego robić ograniczając się jedynie do przyjęcia
zasady, że wprowadzając oznaczenie
F := { x | ϕ(x) }
w przypadku klasy, która nie jest zbiorem, ograniczymy się jedynie do zapisów x ∈ F, które są równoważne formalnemu
zapisowi ϕ(x).
W szczególności używać będziemy oznaczenia
V := { x | x = x }
na tak zwaną klasą pełną. Jak zobaczymy, klasa ta też nie jest zbiorem. Natomiast zapis x ∈ V oznacza po prostu tyle, że x
jest zbiorem.
Pojęcie zbiorotwórczości można rozważać dla formuły o wielu zmiennych wolnych. Dokładniej, jeśli zmiennymi wolnymi
w formule ϕ są: wyróżniona zmienna x oraz pozostałe zmienne x1 , x2 , . . . xk , to mówimy, że ϕ jest zbiorotwórcza względem
x jeśli spełniona jest formuła
∀x1 ∀x2 · · · ∀xk ∃X ∀x x ∈ X ⇔ ϕ(x, x1 , x2 , . . . xk ).
78
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Rysunek 4.3: Ernst Zermelo, 1871-1953 i Abraham Fraenkel, 1891-1965. Źródło: Wikipedia
4.3
Aksjomaty teorii mnogości.
Zbiór aksjomatów teorii mnogości, na którym się oprzemy, zaproponował matematyk niemiecki Ernst Zermelo w roku 1908.
W kształtowanie się aksjomatów teorii mnogości istotny wkład miał też izraelski matematyk Abraham Fraenkel (rys. 4.3). W
rozdziale tym zaprezentujemy jeden z wariantów wywodzącej się od tych matematyków aksjomatyki teorii mnogości zwanej
aksjomatyką Zermelo-Fraenkla.
ZF1. Aksjomat jednoznaczności.
∀x ∀y x = y ⇒ (∀A x ∈ A ⇔ y ∈ A).
Aksjomat jednoznaczności mówi, że jeśli dwa zbiory są identyczne, to jeden z nich może być elementem jakieś rodziny
wtedy i tylko wtedy gdy również drugi z nich jest elementem tej rodziny.
ZF2. Aksjomat zbioru pustego. Klasa { x | x 6= x } jest zbiorem. Formalnie
∃E ∀x x ∈ E ⇔ x 6= x.
Zbiór, którego istnienie postuluje aksjomat zbioru pustego oznaczamy ∅ i nazywamy zbiorem pustym. Nazwa tę uzasadnia
następująca uwaga.
Uwaga 4.3.1
∀x x 6∈ ∅.
Dowód: Ustalmy dowolne x. Ze wzoru (4.1) wnosimy, że x = x. Zatem x 6∈ ∅. Generalizując względem x otrzymujemy
tezę.
Powiemy, że formuła ϕ(x, y) o zmiennych wolnych x i y ma własność jednoznaczności względem y, jeżeli
∀x∃z∀y ϕ(x, y) ⇔ y = z.
Nasz kolejny aksjomat, to w rzeczywistości schemat, który dostarcza po jednym aksjomacie dla każdej formuły ϕ(x, y) z
własnością jednoznaczności względem y.
4.3. AKSJOMATY TEORII MNOGOŚCI.
79
ZF3. Schemat aksjomatów zastępowania. Dla każdej formuły ϕ o zmiennych wolnych x, y i własności jednoznaczności względem Y i dla każdego zbioru
A klasa
{ y | ∀x ∈ A ϕ(x, y) }
jest zbiorem. Formalnie:
(∀x∃z∀y ϕ(x, y) ⇔ y = z) ⇒ ∀A∃B∀y (y ∈ B ⇔ ∀x ∈ A ϕ(x, y)).
Schemat aksjomatów zastępowania mówi, że dla każdej rozważanej formuły i dla każdego zbioru A można utworzyć zbiór
B obejmujący dokładnie te elementy y, dla których istnieje element x ∈ A taki, że zachodzi ϕ(x, y).
Ważną konsekwencją tego schematu aksjomatów jest następujące metatwierdzenie będące schematem twierdzeń po jednym dla każdej formuły ϕ.
Metatwierdzenie 4.3.2 (o specyfikowaniu podzbiorów) Niech ϕ(y) będzie formułą o zmiennej wolnej y. Dla
dowolnego zbioru X klasa
{ y | y ∈ X ∧ ϕ(y) }
jest zbiorem. Formalnie:
∀X ∃Y ∀y y ∈ Y ⇔ y ∈ X ∧ ϕ(y).
Dowód: Rozważmy najpierw przypadek, gdy nie istnieje x ∈ X taki, że ϕ(x). Wtedy y ∈ X ∧ ϕ(y) ⇔ y ∈ ∅, zatem
poszukiwany zbiór Y istnieje, bo jest nim zbiór pusty. Natomiast jeśli istnieje x0 ∈ X taki, że ϕ(x0 ), to definiujemy formułę
ψ o zmiennych wolnych x i y następująco:
ψ(x, y) := (ϕ(x) ∧ x = y) ∨ (¬ϕ(x) ∧ x = x0 ).
Założenia aksjomatu zastępowania dla tej formuły są ewidentnie spełnione. Na mocy tego aksjomatu zbiorowi X odpowiada
zbiór, którego elementami są dokładnie takie y, że y ∈ X oraz ϕ(y).
Na mocy tego metatwierdzenia, nawet jeśli klasa { x | ϕ(x) } nie jest zbiorem, to analogiczna klasa, ale ograniczona do
pewnego zbioru daje już zbiór. Na podstawie tego metatwierdzenia dla danego zbioru X możemy wprowadzić oznaczenie
{ x ∈ X | ϕ(x) } := { x | x ∈ X ∧ ϕ(x) },
które zawsze definiuje zbiór. Podkreślmy jednak, że w oznaczeniu tym zakładamy, że X jest zbiorem. Jest to powszechan
metoda definiowania zbiorów w matematyce. Wymaga jednak dysponowania zbiorem X, do którego zawężamy nasze zainteresowanie formułą ϕ.
Zauważmy, że w szczególności z metatwierdzenia o specyfikowaniu podzbiorów wynika, że klasa pełna V nie może być
zbiorem. Gdyby bowiem była zbiorem, to klasa
{ x ∈ V | x 6∈ x }
byłaby zbiorem, a wiemy, że nie jest.
ZF4. Aksjomat zbioru podzbiorów. Jeśli X jest zbiorem, to klasa
{A | A ⊂ X }
jest zbiorem. Formalnie
∀X ∃A ∀A
A ∈ A ⇔ A ⊂ X.
80
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Aksjomat zbioru podzbiorów mówi, że dla każdego zbioru można utworzyć zbiór wszystkich jego podzbiorów. Oznaczamy
go P(X) lub 2X .
Zauważmy, że P(∅) ma dokładnie jeden element, mianowicie ∅ ∈ P(∅). Natomiast P(P(∅)) ma dokładnie dwa elementy:
∅, P(∅) ∈ P(P(∅)).
Twierdzenie 4.3.3 (o istnieniu singletona i dubletona) Dla dowolnych zbiorów a, b klasa
{x | x = a ∨ x = b}
jest zbiorem. Formalnie:
∀a ∀b ∃X ∀x x ∈ X ⇔ x = a ∨ x = b.
Dowód: Rozważmy formułę
ϕ(x, y) := (x = ∅ ∧ y = a) ∨ (x = P(∅) ∧ y = b).
Założenia aksjomatu zastępowania dla tej formuły są ewidentnie spełnione. Rozważmy zbiór A := P(P(∅)). Na mocy
aksjomatu zastępowania odpowiada mu zbiór, którego elementami są dokładnie a oraz b.
Twierdzenie 4.3.3 mówi, że dla dowolnych zbiorów a i b istnieje zbiór, którego elementami są dokładnie a oraz b. Oznaczamy go {a, b}. Gdy a 6= b nazywamy go dubletonem elementów a, b. W przeciwnym razie nazywamy go singletonem elementu
a.
ZF5. Aksjomat unii. Dla dowolnej rodziny zbiorów A klasa
{ x | ∃A ∈ A x ∈ A }
jest zbiorem. Formalnie
∀A ∃U ∀a
a ∈ U ⇔ ∃A ∈ A a ∈ A.
Aksjomat unii mówi, że jeśli A jest rodziną zbiorów, to można utworzyć zbiór U , którego elementami
są wszystkie elementy
S
zbiorów w rodzinie A i tylko te elementy. Nazywamy go unią lub sumą rodziny A i oznaczamy A. W szczególności, jeśli
A i B są zbiorami, to przyjmujemy oznaczenie
[
A ∪ B := {A, B},
a zbiór A ∪ B nazywamy sumą lub unią zbiorów A i B.
Rozważmy teraz wyrażenie klasowe
\
A := { x | ∀A ∈ A x ∈ A }.
T
T
Metatwierdzenie 4.3.4 Jeśli rodzina A jest niepusta, to A jest zbiorem. Natomiast ∅ jest klasą pełną V, a więc
nie jest zbiorem.
T
Dowód: Jeśli A0 ∈ A, to x ∈ A implikuje x ∈ A0 , więc
\
A := { x ∈ A0 | ∀A ∈ A x ∈ A },
T
a zatem A jest zbiorem na mocy metatwierdzenia o specyfikowaniu
zbiorów. Jeśli A = ∅ to implikacja A ∈ A ⇒ x T
∈A
T
zachodzi dla dowolnego x, bo poprzednik jest fałszywy. Zatem ∅ jest klasą pełną. Dla niepustej rodziny A zbiór A
nazywamy przecięciem lub iloczynem rodziny zbiorów A.
4.3. AKSJOMATY TEORII MNOGOŚCI.
81
Dla dwóch zbiorów A i B przyjmujemy oznaczenie
A ∩ B :=
\
{A, B},
a zbiór A ∩ B nazywamy iloczynem lub przecięciem zbiorów A i B. Definiujemy też różnicę i różnicę symetryczną zbiorów A
i B odpowiednio jako
A\B
:= { x ∈ A | x 6∈ B },
AB
:=
(A \ B) ∪ (B \ A).
Mówimy, że A, B są rozłączne jeżeli A ∩ B = ∅.
Przyjęte do tej pory aksjomaty ani nie wykluczają, ale też nie gwarantują istnienia zbiorów nieskończonych. Jeśli jednak
chcemy skonstruować na gruncie teorii mnogości liczby naturalne, musimy przyjąć jakiś aksjomat, który zagwarantuje
istnienie choć jednego zbioru nieskończonego. Jak zobaczymy, konstrukcja zbioru liczb naturalnych opiera się na operacji
następnika zbioru A zdefiniowanej następująco;
S(A) := A ∪ {A}.
Mamy
S(∅)
=
{∅}
S(S(∅))
=
{∅, {∅}}
S(S(S(∅)))
=
{∅, {∅}, {∅, {∅}}}
S(S(S(S(∅))))
=
{∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}}
...
Każdy kolejny zbiór jest nadzbiorem właściwym zbioru poprzedniego, więc w szczególności zbiory te są różne. Jest ich
nieskończenie wiele. W aksjomacie nieskończoności postulujemy, że istnieje zbiór, który te wszystkie zbiory zawiera.
ZF6. Aksjomat nieskończoności. Istnieje rodzina zbiorów A taka, że ∅ ∈ A
oraz dla każdego zbioru A ∈ A jego następnik S(A) ∈ A. Formalnie:
∃A ∅ ∈ X ∧ ∀A ∈ A ∃B ∈ A ∀x x ∈ B ⇔ x ∈ A ∨ x = A.
4.3.1
Elementarne własności operacji mnogościowych
Wzięcie sumy, iloczynu, różnicy czy różnicy symetrycznej dwóch zbiorów określamy ogólnie mianem operacji mnogościowej.
Uwaga 4.3.5 Niech A, B, C będą zbiorami. Operacje mnogościowe mają następujące własności.
A ⊂ B, B ⊂ C ⇒ A ⊂ C,
A \ A = ∅, A \ ∅ = A,
A ∪ B = B ∪ A,
A ∪ A = A, A ∩ A = A,
A ∩ B = B ∩ A,
A ⊂ B ⇔ A ∪ B = B ⇔ A ∩ B = A,
A ⊂ A ∪ B,
B ⊂ A ∪ B,
A ∪ (B ∪ C) = (A ∪ B) ∪ C,
A ∩ B ⊂ A,
A ∩ B ⊂ B,
A ∩ (B ∩ C) = (A ∩ B) ∩ C,
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C),
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
82
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Rysunek 4.4: Kazimierz Kuratowski, 1896-1980
Definicja 4.3.6 Jeśli A ⊂ X to zbiór X \A nazywamy uzupełnieniem A do X i oznaczamy CX A. Gdy X jest ustalony
i znany z kontekstu, to często nazywamy go przestrzeną a uzupełnienie A do X oznaczamy po prostu CA lub \A.
Uwaga 4.3.7 Niech A, B ⊂ X będą zbiorami w przestrzeni X. Uzupełnienie do przestrzeni X ma następujące własności.
A \ B = A ∩ (\B),
\(\A) = A,
\(A ∪ B) = (\A) ∩ (\B),
\(A ∩ B) = (\A) ∪ (\B),
A ⊂ B ⇔ \A ⊃ \B.
4.4
4.4.1
Iloczyn kartezjański
Para
Parą elementów a i b nazywamy zbiór {{a, b}, {b}} oznaczany krótko (a, b).
Powyższa,˛ powszechnie dziś używana˛ definicj˛e pary podał w 1921 roku polski matematyk Kazimierz Kuratowski (rys. 4.4). Wcześniejsze, bardziej skomplikowane definicje si˛e nie przyj˛eły.
Kluczową własnością pary, której nie ma dubleton, jest
Uwaga 4.4.1
(a, b) = (c, d) ⇔ a = c ∧ b = d.
4.4. ILOCZYN KARTEZJAŃSKI
83
W poniższym dowodzie trzykrotnie zastosowano schemat dowodowy zwany dowodem przez przypadki. W dowodzie przez przypadki zamiast jednego dowodu
przedstawiamy dwa lub wi˛ecej dowodów, każdy z pewnym dodatkowym nieudowodnionym założeniem. Dowód jest kompletny, jeśli dodatkowo potrafimy udowodnić,
że przynajmniej jedno z tych dodatkowych założeń musi być prawdziwe. Ten ostatni fakt cz˛esto sprawdzić jest bardzo łatwo, bo rozważane przypadki wzajemnie
si˛e dopełniaja:˛ na przykład jeden przypadek to x > 0, a drugi x ¬ 0. Zaleta˛ takiego podejścia jest możliwość odmiennego poprowadzenia dowodu w każdym z
przypadków.
Dowód: Choć własność wydaje się oczywista, to jednak jej w miarę formalny dowód jest pracochłonny. Aby udowodnić,
że
(a, b) = (c, d) ⇔ a = c ∧ b = d.
wystarczy podać oddzielnie dowód implikacji
(a, b) = (c, d) ⇒ a = c ∧ b = d
oraz implikacji
a = c ∧ b = d ⇒ (a, b) = (c, d).
Podamy dowód pierwszej z tych implikacji. Dowód drugiej jest znacznie łatwiejszy i zostawiamy go jako ćwiczenie.
Załóżmy zatem, że (a, b) = (c, d), co zgodnie z naszą definicją pary oznacza, że {{a, b}, {b}} = {{c, d}, {d}}. Ponieważ
{b} jest elementem zbioru {{a, b}, {b}}, więc jest on też elementem zbioru = {{c, d}, {d}}. Zatem albo {b} = {{c, d}} albo
{b} = {d}. Dalszą część dowodu możemy zatem poprowadzić przez przypadki.
Załóżmy najpierw, że {b} = {{c, d}}. Ponieważ tak c jak i d należą do dubletona {{c, d}}, a dubleton {{c, d}} jest w tym
przypadku równy singletonowi {b}, więc c i d należą do singletona {b}. Zgodnie z definicją singletona jest to możliwe tylko
wtedy gdy c = b i d = b. Zatem również c = d co oznacza w szczególności, że dubleton {c, d} pokrywa się z singletonem {d},
a w konsekwencji mamy
(c, d) = {{c, d}, {d}} = {{d}, {d}} = {{d}}.
Zatem {{a, b}, {b}} = {{d}}. Ponieważ {a, b} należy do lewej strony tej równości, więc należy też do prawej strony. Stąd
{a, b} = {d}. To oznacza, że d = a i d = b. Pokazaliśmy zatem, że a = b = c = d, więc w szczególności a = c i b = d. Kończy
to dowód w przypadku gdy {b} = {{c, d}}.
By rozważyć drugi przypadek przyjmijmy, że {b} = {d}. Wtedy b = d i pozostaje pokazać, że a = c. Z b = d wynika, że
(a, b) = (c, b). Ponieważ {a, b} ∈ (a, b), więc również {a, b} ∈ (c, b). Mamy zatem do rozpatrzenia dwa podprzypadki: albo
{a, b} = {c, b} albo {a, b} = {b}. W pierwszym podprzypadku dostajemy a = c lub a = b. Podpodprzypadek a = c nie
wymaga już dalszego rozumowania, bo chcieliśmy właśnie pokazać, że a = c. Natomiast jeśli a = b, to {a} = {c, b}, skąd
również wynika, że a = c.
Pozostaje jeszcze rozważyć podprzypadek {a, b} = {b}. Wtedy a = b, skąd (a, b) = {{a}}. Zatem {c, d} ∈ {{a}}, skąd
a = c = d. Tak więc w tym podprzypadku znów dostajemy, że wszsytkie cztery elementy są równe, skąd w szczególności
a = c i b = d.
4.4.2
Iloczyn kartezjański
Zauważmy, że jeśli X i Y są zbiorami, x ∈ X, y ∈ Y , to
(x, y) = {{x, y}, {y}} ∈ P(P(X ∪ Y )).
Iloczynem kartezjańskim zbiorów X i Y nazywamy zbiór
X × Y := { u ∈ P(P(X ∪ Y )) | ∃x ∈ X∃y ∈ Y u = (x, y) }.
Iloczyn kartezjański X × X oznaczamy krótko X 2 .
84
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Twierdzenie 4.4.2 Iloczyn kartezjański ma następujące własności.
(i) Jeśli A 6= ∅ 6= B, to
A × B ⊂ X × Y ⇔ A ⊂ X i B ⊂ Y,
(ii) Dla dowolnych zbiorów A1 , A2 , B mamy
(A1 × B) ∪ (A2 × B)
=
(A1 ∪ A2 ) × B,
(A1 × B) ∩ (A2 × B)
=
(A1 ∩ A2 ) × B,
(iii) Dla dowolnych zbiorów A, B, C, D mamy
(A × B) ∩ (C × D) = (A ∩ C) × (B ∩ D).
4.5
Relacje
4.5.1
Relacje
Relacją w zbiorach X i Y nazywamy dowolny podzbiór R ⊂ X × Y . Gdy X = Y , mówimy krótko o relacji w X. Tradycyjnie piszemy xRy zamiast (x, y) ∈ R. Zbiór pusty i X × X to odpowiednio relacja pusta i relacja pełna w X. Relacją
identycznościową w X jest
∆X := idX := { (x, x) | x ∈ X }.
4.5.2
Własności relacji
Niech R ⊂ X × X będzie relacją w X. Podane już w rozdziale ... własności relacji definiujemy przy użyciu następujących
wzorów formalnych.
R zwrotna : ⇔
x R x,
∀x, y ∈ X
x R y ⇒ y R x,
:⇔
∀x, y ∈ X
x R y ∧ y R x ⇒ x = y,
R antysymetryczna
R przechodnia : ⇔
R spójna
4.5.3
∀x ∈ X
R symetryczna : ⇔
:⇔
∀x, y, z ∈ X
∀x, y ∈ X
x R y ∧ y R z ⇒ x R z,
x R y ∨ y R x.
Złożenie relacji
Definicja 4.5.1 Dla relacji R w X × Y i relacji S w Y × Z definiujemy obłożenie relacji R przez relację S zwane
również podstawieniem relacji R w relacji S jako
S ◦ R := { (x, z) ∈ X × Z | ∃y ∈ Y xRy i ySz }.
Definiujemy również relację odwrotną do relacji R jako
R−1 := { (y, x) ∈ Y × X | xRy }.
4.6. RELACJE RÓWNOWAŻNOŚCI
85
Twierdzenie 4.5.2 Niech Q będzie relacją w W × X, R relacją w X × Y , a S relacją w Y × Z. Wtedy
(S ◦ R) ◦ Q = S ◦ (R ◦ Q),
(S ◦ R)−1 = R−1 ◦ S −1 ,
(R−1 )−1 = R,
∆−1
X = ∆X .
4.5.4
Charakterystyka własności relacji
Następujące twierdzenie opisuje własności relacji w języku zbiorów.
Twierdzenie 4.5.3 Niech R ⊂ X × X będzie relacją. Wtedy:
4.6
4.6.1
R zwrotna
⇔
∆X ⊂ R,
R symetryczna
⇔
R−1 = R,
R anysymetryczna
⇔
R ∩ R−1 ⊂ ∆X ,
R przechodnia
⇔
R ◦ R ⊂ R,
R spójna
⇔
R ∪ R−1 = X × X.
Relacje równoważności
Relacja równoważności
Definicja 4.6.1 Relację w klasie X, która jest zwrotna, symetryczna i przechodnia nazywamy relacją równoważności.
Dla x ∈ X zbiór
[x]R := { y ∈ X | xRy }
nazywamy klasą równoważności elementu x.
Twierdzenie 4.6.2 Niech R będzie relacją równoważności w X. Jeśli x, y ∈ X oraz xRy, to [x]R = [y]R . Innymi słowy,
klasy równoważności równoważnych elementów są identyczne. Ponadto dla dowolnych x, y ∈ X albo [x]R = [y]R , albo
[x]R ∩ [y]R = ∅, to znaczy klasy równoważności dwóch elementów są albo równe, albo rozłączne.
4.7
4.7.1
Funkcje
Relacje jednolistne
Definicja 4.7.1 Niech R ⊂ X × Y będzie relacją. Mówimy, że R jest jednolistna jeżeli
(x, y) ∈ R ∧ (x, y 0 ) ∈ R ⇒ y = y 0 .
86
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Rysunek 4.5: Graf relacji niejednolistnej i jednolistnej
Rysunek 4.6: Wykres relacji niejednolistnej i jednolistnej
4.7. FUNKCJE
87
Przykładowy graf relacji niejednolistnej (po lewej) i jednolistnej (po prawej) przedstawiono na rys. 4.5. Wykresy tych relacji (niejednolistnej po lewej, jednolistnej
po prawej) przedstawiono na rys. 4.6.
Relacja jednolistna nie może być jeszcze uznana za funkcj˛e, bo własność jednolistności nie gwarantuje, że każdy element x ∈ X pozostaje w relacji z jakimś
elementem y ∈ Y . Jednak nim zajmiemy si˛e definicja˛ funkcji zauważmy najpierw, że czasami mamy do czynienia z sytuacja,˛ w której pewnym argumentom nie
chcemy badź
˛ nie potrafimy w rozsadny
˛ sposób przypisać wartości. Mówimy wtedy o funkcjach cz˛eściowych.
4.7.2
Funkcje częściowe
Definicja 4.7.2 Mówimy, że trójka (X, f, Y ) jest funkcją częściową z X do Y
Tradycyjnie piszemy f : X−→
◦ Y na oznaczenie funkcji częściowej z X do Y .
częściowej f z X do Y , to element y jest wyznaczony jednoznacznie przez
nazywamy wartością funkcji częściowej f w x. Dziedzinę funkcji częściowej f
jeżeli f jest relacją jednolistną w X ×Y .
Jeśli para (x, y) jest elementem funkcji
element x. Oznaczamy go f (x) := y i
definiujemy jako
dom f := { x ∈ X | ∃y ∈ Y (x, y) ∈ f }.
Obraz funkcji częściowej f definiujemy jako
im f := { y ∈ Y | ∃x ∈ X (x, y) ∈ f }.
Uwaga 4.7.3 Dwie funkcje częściowe (X1 , f1 , Y1 ) i (X2 , f2 , Y2 ) są sobie równe wtedy i tylko wtedy gdy X1 = X2 i
f1 = f2 i Y1 = Y2 .
Pakiet Relations.m umożliwia sprawdzenie czy relacja jest funkcją częściową. Na przykład pisząc
rR = R e l a t i o n [ { a , b , c } , {b −> b , c −> c , b −> a } ]
I s P a r t i a l F u n c t i o n [ rR ]
otrzymamy odpowiedź False.
4.7.3
Funkcje
Aby funkcja cz˛eściowa f była funkcja˛ musimy jeszcze dodać warunek, że dla każdego x ∈ X istnieje y ∈ Y taki, że (x, y) ∈ f . Wykorzystujac
˛ poj˛ecie
dziedziny, możemy ten wymóg sformułować nast˛epujaco:
˛
Definicja 4.7.4 Jeżeli dla funkcji częściowej (X, f, Y ) spełniony jest warunek dom f = X, to piszemy
f :X→Y
i mówimy, że (X, f, Y ) jest funkcją z X do Y lub odwzorowaniem z X do Y lub przekształceniem X w Y . Często, od
strony formalnej niepoprawnie, mówimy, że to f jest funkcją, rozumiejąc, że jest jasne o jakie X i Y chodzi.
Na zbiór funkcji z X do Y stosujemy oznaczenie
Y X := { f | f : X → Y - funkcja z X do Y }
Przykład 4.7.5
1. Niech c ∈ Y . Wtedy { (x, c) | x ∈ X } jest funkcją z X do Y . Nazywamy ją funkcją stałą.
2. Relacja identycznościowa ∆X jest funkcją ∆X : X → X.
3. Relacja pełna w przestrzeni X nie jest funkcją z wyjątkiem przypadku gdy X jest pusty lub jest singletonem.
88
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Rysunek 4.7: Zawieranie funkcji
4.7.4
(*)Zawieranie się funkcji
Uwaga 4.7.6 Niech f, g : X−→
◦ Y . Wtedy warunek f ⊂ g jest równoważny koniunkcji warunków
dom f ⊂ dom g
i
∀x ∈ dom f
f (x) = g(x).
Przykład zawierania się funkcji przedstawiono na rys. 4.7
Definicja 4.7.7 Niech f, g będą fukcjami częściowymi z X do Y . Mówimy, że f jest zawężeniem g lub g jest rozszerzeniem f jeżeli f ⊂ g.
Niech f : X → Y , A ⊂ X. Zawężeniem funkcji f do A nazywamy funkcję
f|A := f ∩ A × Y.
4.7.5
Sklejenie funkcji
Uwaga 4.7.8 Niech f, g będą fukcjami częściowymi z X do Y . Suma f ∪ g jest funkcją częsciową z X do Y wtedy i
tylko wtedy gdy
∀x ∈ dom f ∩ dom g f (x) = g(x).
Definicja 4.7.9 Jeśli f, g : X−→
◦ Y są funkcjami częściowymi z X do Y i f ∪ g jest funkcją to nazywamy ją sklejeniem
funkcji f i g.
Przykładowe sklejenie funkcji przedstawiono na rys. 4.8
4.7. FUNKCJE
89
Rysunek 4.8: Sklejenie funkcji
4.7.6
(*)Zestawienie i iloczyn kartezjański funkcji
Definicja 4.7.10 Niech f : X → Y i g : X → Z. Zestawieniem funkcji f i g nazywamy funkcję
(f, g) : X 3 x 7→ (f (x), g(x)) ∈ X × Y.
Definicja 4.7.11 Niech f : X1 → Y1 , a g : X2 → Y2 . Iloczynem kartezjańskim funkcji f i g nazywamy funkcję
f × g : X1 × X2 3 (x1 , x2 ) → (f (x1 ), g(x2 )) ∈ Y1 × Y2 .
Oznaczenie na zestawienie i iloczyn kartezjański funkcji koliduje z parą funkcji i iloczynem kartezjańskim funkcji
potraktowanych jako zbiory. Jednak w tym drugim znaczeniu oznaczeń tych praktycznie się nie używa, więc ryzyko błędnej
interpretacji jest minimalne.
4.7.7
Obrazy i przeciwobrazy
Niech f : X → Y , A ⊂ X, B ⊂ Y . Obrazem zbioru A nazywamy
f (A) := { y ∈ Y | ∃x ∈ A y = f (x) }.
Przeciwobrazem zbioru B nazywamy
f −1 (B) := { x ∈ X | f (x) ∈ B }.
Uwaga 4.7.12 Niech f : X → Y , a A, A1 , A2 ⊂ X i B, B1 , B2 ⊂ Y będą zbiorami. Wtedy
A1 ⊂ A2 ⇒ f (A1 ) ⊂ f (A2 ),
B1 ⊂ B2 ⇒ f −1 (B1 ) ⊂ f −1 (B2 ),
f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ),
f
−1
f
−1
(B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ),
f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 ),
(B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ),
f (f −1 (B)) = B ∩ im f,
f −1 (f (A)) ⊃ A.
90
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
4.7.8
Złożenie funkcji
Twierdzenie 4.7.13 Niech f : X−→
◦ Y , g : Y −→
◦ Z będą funkcjami częściowymi. Wtedy g ◦ f jest funkcją częściową z
X do Z,
dom g ◦ f = f −1 (dom g),
oraz dla x ∈ dom g ◦ f
g ◦ f (x) = g(f (x)).
Co więcej, jeśli f i g są funkcjami, to g ◦ f jest funkcją.
4.7.9
Injekcje, surjekcje, i bijekcje.
Relacja odwrotna do relacji jednolistnej nie musi być jednolistna. Zatem relacja odwrotna do funkcji częściowej nie musi być
funkcją częściową.
Funkcję f : X → Y nazywamy injekcją, jeżeli dla dowolnych x1 , x2 ∈ X
f (x1 ) = f (x2 ) ⇒ x1 = x2 .
Funkcję f nazywamy surjekcją, jeżeli dla dowolnego y ∈ Y istnieje x ∈ X takie, że y = f (x). Funkcję f nazywamy bijekcją
jeśli jest injekcją i surjekcją.
Twierdzenie 4.7.14 Niech f : X → Y będzie funkcją. Relacja odwrotna f −1 jest jednolistna wtedy i tylko wtedy gdy
f jest injekcją. Relacja odwrotna f −1 jest funkcją wtedy i tylko wtedy gdy f jest bijekcją.
Relację odwrotną do bijekcji nazywamy funkcją odwrotną.
4.7.10
Iloczyn kartezjański n zbiorów
Iloczyn kartezjański nie jest łączny:
(X × Y ) × Z 6= X × (Y × Z),
bo ((a, b), c) 6= (a, (b, c)). Jest jednak naturalna bijekcja
(X × Y ) × Z 3 ((a, b), c) 7→ (a, (b, c)) ∈ X × (Y × Z),
która pozwala utożsamiać te zbiory. Pozwala to mówić o iloczynie kartezjańskim trzech (i analogicznie) więcej zbiorów bez
podawania nawiasów. Dla n-krotnego iloczynu kartezjańskiego zbioru X przez siebie stosujemy krótką notację X n .
4.7.11
Sumy i iloczyny indeksowane
Definicja 4.7.15 Często zdarza się, że rodzina podzbiorów zbioru X zadana jest jako kodziedzina odwzorowania, t.zw.
odwzorowania indeksującego A : J → P(X). Wtedy rodzinę tę zapisujemy często jako {Aj }j∈J oraz wprowadzamy
oznaczenia na sumę i przecięcie tej rodziny
\
[
[
\
Aj :=
{ Aj | j ∈ J },
Aj :=
{ Aj | j ∈ J }.
j∈J
j∈J
4.8. RÓWNOLICZNOŚĆ ZBIORÓW. TWIERDZENIE CANTORA I CANTORA-BERNSTEINA.
91
Twierdzenie 4.7.16 Niech A : J → P(X) będzie odwzorowaniem indeksującym rodzinę podzbiorów X. Jeśli J =
J1 ∪ J2 , to

 


 

[
[
[
\
\
\
Aj = 
Aj  ∪ 
Aj  ,
Aj = 
Aj  ∩ 
Aj  .
j∈J
Ponadto
j∈J1
j∈J2

j∈J

[
\
Aj  =
j∈J
j∈J1

\
\Aj ,
\
j∈J
j∈J2

\
Aj  =
j∈J
[
\Aj .
j∈J
Jeśli dodatkowo B : K → P(Y ) jest odwzorowaniem indeksującym rodzinę podzbiorów Y , to


!
[
[
[


Aj ×
Bk =
Aj × B k ,
j∈J

k∈K
[

Aj  ∩
j∈J

!
[
Bk

j∈J
=
k∈K
Aj  ∪
[
Aj ∩ B k ,
(j,k)∈J×K

\
4.8
(j,k)∈J×K

!
\
k∈K
Bk
=
\
Aj ∪ B k .
(j,k)∈J×K
Równoliczność zbiorów. Twierdzenie Cantora i Cantora-Bernsteina.
Definicja 4.8.1 Zbiory X, Y nazywamy równolicznymi jeśli istnieje bijekcja f : X → Y .
Twierdzenie 4.8.2 Relacja równoliczności zbiorów jest relacją równoważności w klasie pełnej.
Twierdzenie 4.8.3 (Cantora) Żaden zbiór nie jest równoliczny ze zbiorem swoich podzbiorów.
Dowód: Dla dowodu nie wprost przypuśćmy, że dla pewnego zbioru X istnieje bijekcja f : X 7→ 2X . Rozważmy zbiór
Z := { x ∈ X | x 6∈ f (x) }.
X
Z definicji zbioru Z wynika, że Z ∈ 2 . Zatem, ponieważ f jest bijekcją, wnosimy, że istnieje z ∈ X takie, że f (z) = Z.
Zachodzi jeden z dwóch przypadków: albo z ∈ Z, albo z 6∈ Z. W pierwszym przypadku wnosimy z definicji zbioru Z, że
z 6∈ f (z) = Z, otrzymujemy więc sprzeczność. Podobnie, w przypadku drugim, mamy z 6∈ Z. Ale wtedy z ∈ f (z) = Z, co
ponownie daje sprzeczność. Tak więc w każdym z możliwych dwóch przypadków otrzymujemy sprzeczność, co dowodzi, że
nasze przypuszczenie o istnieniu bijekcji było fałszywe.
Twierdzenie 4.8.4 (Cantora-Bernsteina) Jeśli zbiór A jest równoliczny z podzbiorem zbioru B, a zbiór B jest równoliczny z podzbiorem zbioru A, to zbiory A i B są równoliczne.
Dowód: ....
92
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Rozdział 5
Liczby naturalne. Indukcja i rekurencja.
Naszym celem w tym i nast˛epnym rozdziale jest naszkicowanie konstrukcji zbiorów liczbowych na gruncie teorii mnogości. Czasami, jak to zrobimy w przypadku zbioru liczb całkowitych, wymiernych, czy zespolonych wygodnie jest przeprowadzić bezpośrednie konstrukcje. Robimy tak zazwyczaj wtedy, gdy jest jakaś
szczególnie naturalna, narzucajaca
˛ si˛e konstrukcja. Jeśli możliwych, istotnie różnych konstrukcji jest wiele, preferujemy podanie ogólnej definicji wraz ze stwierdzeniem pokazujacym,
˛
że stosowny zbiór da si˛e skonstruować i to w jedyny, z dokładnościa˛ do pewnego utożsamienia, sposób. Tak postapimy
˛
w przypadku liczb
naturalnych i liczb rzeczywistych.
Ponadto w rozdziale tym zdefiniujemy poj˛ecie działania, grupy oraz ciała. Poj˛ecia te pozwalaja˛ uogólnić koncepcj˛e dodawania i mnożenia liczb i dowodzić
twierdzenia modelowane na własnościach liczb, a prawdziwe w znacznie szerszym zakresie. W przypadku takich ogólnych definicji cz˛esto używamy poj˛ecia
aksjomatyka. Należy jednak podkreślić, że użycie słowa aksjomatyka w odniesieniu do definicji nie oznacza, że rozszerzamy zbiór aksjomatów. W matematyce
budowanej w oparciu o teri˛e mnogości jedyne potrzebne aksjomaty to aksjomaty teorii mnogości.
5.1
5.1.1
Liczby naturalne
Aksjomatyka liczb naturalnych
Naturalne jest przyjać,
˛ że pierwotny pasterz, który wiedział, że ma stado owiec liczace
˛ n sztuk, był świadom, że może też mieć stado o jedna˛ sztuk˛e wi˛eksze. "O
jeden wi˛ecej" to bardzo naturalne i bardzo elementarne poj˛ecie w matematyce określane mianem nast˛epnika. Jest ono podstawa˛ nast˛epujacej
˛ definicji określanej
mianem aksjomatyki liczb naturanych.
Użycie zwrotu aksjomatyka w odniesieniu do tej definicji służy jedynie podkreśleniu, że wszystkie twierdzenia, które wywieść można z danej definicji stanowia˛
ważna˛ teori˛e, która może być rozwijana niezależnie od teorii mnogości.
Definicja 5.1.1 Struktura liczb naturalnych to trójka (N, 0, s) spełniająca warunki
(i)
N jest zbiorem,
(ii)
s : N → N jest injekcją,
(iii)
0 ∈ N \ s(N )
(iv)
(zasada indukcji) dla dowolnego K ⊂ N jeśli
(iv.1)
0 ∈ K,
(iv.2)
n ∈ K ⇒ s(n) ∈ K
to K = N .
93
94
ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA.
Rysunek 5.1: John von Neumann, 1903-1957, Źródło: Wikipedia
5.1.2
Konstrukcja von Neumanna
Postawienie powyższej definicji oczywiście nie gwarantuje, że coś co spełnia wymogi tej definicji rzeczywiście istnieje i jest w jakimś rozsadnym
˛
sensie dokładnie
jedno (nie chcielibyśmy mieć wielu istotnie różnych zbiorów liczb naturalnych). Dlatego potrzebna jest jakaś konstrukcja zbioru liczb naturalnych na gruncie teorii
mnogości oraz uzasadnienie jednoznaczności. Formalna˛ konstrukcj˛e zbioru liczb naturalnych na gruncie teorii mnogości, a dokładniej w oparciu o aksjomat
nieskończoności, podał amerykański matematyk w˛egierskiego pochodzenia, John von Neumann (rys. 5.1).
Rol˛e nast˛epnika pełni w niej funkcja S wykorzystywana w aksjomacie nieskończoności. Nie możemy skorzystać z operacji dodania jedynki, bo na tym etapie
formalizacji nie mamy jeszcze formalnie zdefiniowanego dodawania liczb. Dodawanie zdefiniujemy dopiero w oparciu o poj˛ecie nast˛epnika.
Twierdzenie 5.1.2 Trójka spełniająca warunki definicji 5.1.1 istnieje.
Dowód: Przypomnijmy, że następnikiem zbioru a nazywamy zbiór S(a) := a ∪ {a}. Powiemy, że zbiór A jest induktywny,
jeśli spełnia dwa warunki
∅∈A
a ∈ A ⇒ S(a) ∈ A.
Łatwo sprawdzić, że przecięcie dowolnej rodziny zbiorów induktywnych, w szczególności dwóch zbiorów induktywnych, też
jest zbiorem induktywnym. Na mocy aksjomatu nieskończoności przynajmniej jeden zbiór induktywny istnieje. Ustalmy jeden
taki zbiór i oznaczmy go L. To mógłby być nasz zbiór liczb naturalnych, ale może być w nim coś więcej, dlatego musimy się
tych ewentualnych,
niepotrzebnych elementów pozbyć. Niech L oznacza rodzinę wszystkich induktywnych podzbiorów L i
T
niech N := L. Łatwo sprawdzamy, że zbiór N też jest induktywny.
Co więcej, jeśli K jest zbiorem induktywnym, to K ∩ L jest zbiorem induktywnym zawartym w L. Stąd N ⊂ K ∩ L ⊂ K,
zatem N zawiera się w dowolnym innym zbiorze induktywnym. Zatem N jest najmniejszym zbiorem induktywnym w sensie
relacji inkluzji.
Przyjmujemy oznaczenia:
0
s(n)
:= ∅,
:= S(n) dla n ∈ N .
5.1. LICZBY NATURALNE
95
Sprawdzimy, że trójka (N, 0, s) spełnia warunki definicji 5.1.1. Wiemy już, że N jest zbiorem, więc własność (i) zachodzi.
Oczywiście 0 = ∅ ∈ N , a ponieważ n ∈ s(n), więc dla dowolnego n ∈ N mamy s(n) 6= ∅ = 0. co pokazuje własność (iii).
Własność (iv) definicji 5.1.1 stwierdza, że każdy induktywny podzbiór N jest równy N . Zatem wynika ona natychmiast z
naszej wcześniejszej obserwacji, że N zawiera się w każdym zbiorze induktywnym. Aby udowodnić własność (ii) pokażemy
najpierw, że
∀n ∈ N ∀m ∈ N m ∈ n ⇒ m ⊂ n.
(5.1)
Niech
N 0 := { n ∈ N | ∀m ∈ N m ∈ n ⇒ m ⊂ n }.
Wystarczy pokazać, że N 0 jest induktywny. Zauważmy, że implikacja
m∈∅ ⇒ m⊂∅
jest pusto spełniona. Zatem 0 = ∅ ∈ N 0 , co oznacza, że zbiór N 0 spełnia warunek (iv.1). Aby pokazać (iv.2) załóżmy, że
n ∈ N 0 . Aby pokazać, że s(n) ∈ N 0 weźmy m ∈ s(n). Ponieważ założyliśmy, że n ∈ N 0 , więc z definicji zbioru n0 wnosimy,
że w szczególności dla naszego m zachodzi implikacja
m ∈ n ⇒ m ⊂ n.
(5.2)
Z definicji s(n) i przesłanki m ∈ s(n) wnosimy, że albo m ∈ n albo m = n. W pierwszym przypadku z implikacji (5.2)
wnosimy, że m ⊂ n. W drugim przypadku ta inkluzja jest oczywista. Zatem dla dowolnego n ∈ N pokazaliśmy implikację
m ∈ s(n) ⇒ m ⊂ s(n),
co dowodzi, że s(n) ∈ N 0 . Zatem z przesłanki n ∈ N 0 wynika, że s(n) ∈ N 0 . Dowodzi to, że N 0 spełnia również warunek (iv.2),
czyli jest induktywny. Zatem z pokazanej już własności (iv) wnosimy, że N 0 = N , a to dowodzi prawdziwości formuły (5.1).
Możemy teraz pokazać własność (ii). Załóżmy, że dla pewnych n, m ∈ N mamy s(n) = s(m). Wtedy w szczególności
n ∈ s(n) = s(m), zatem albo n ∈ m albo n = m. Zatem z (5.1) w pierwszym przypadku, a w sposób oczywisty w drugim
przypadku, dostajemy n ⊂ m. Zamieniając m i n rolami dostajemy dowód, że m ⊂ n. Zatem m = n, czyli s jest iniekcją. Warto się przyjrzeć jak wygląda kilka początkowych liczb naturalnych według von Neumanna. I tak, mamy
0
:= ∅,
1
:= s(0) = {∅},
2
:= s(1) = {∅} ∪ {{∅}} = {∅, {∅}},
3
:= s(2) = {∅, {∅}} ∪ {{∅, {∅}}} = {∅, {∅}, {∅, {∅}}},
··· .
Konstrukcja von Neumanna nie jest jedyna˛ możliwa.˛ Na przykład można przyjać
˛
0
:= ∅,
1
:= {∅},
2
:= {{∅}},
3
:= {{{∅}}},
··· .
W tym momencie widać pożytek z postawienia formalnej definicji (aksjomatyki) zbioru liczb naturalnych. Pozwala ona na codzień nie myśleć o skomplikowanej
konstrukcji liczb naturalnych i badać ich własności jedynie poprzez odnoszenie si˛e do własności podanych w definicji.
Szczególna˛ rol˛e pełni własność 5.1.1(iv). Jest ona podstawa˛ schematu dowodowego zwanego dowodem przez indukcj˛e. Schemat ten mówi, że aby udowodnić
iż pewna własność przysługuje wszystkim liczbom naturalnym, wystarczy pokazać, że przysługuje ona liczbie 0 oraz udowodnić implikacj˛e, że jeśli przysługuje
liczbie naturalnej n to przysługuje liczbie nast˛epnej S(n).
Tradycyjnie zbiór liczb naturalnych oznaczamy przez N i stosujemy notację n∗ := S(n) dopóki nie zdefiniujemy formalnie
dodawania liczb naturalnych oraz liczby jeden.
96
ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA.
5.2
Ciągi i rekurencja.
Jesteśmy wreszcie gotowi podać formalna˛ definicj˛e ciagu.
˛ Do tego potrzebowaliśmy definicji funkcji oraz definicji zbioru liczb naturalnych. Ciag
˛ to po prostu funkcja
ze zbioru liczb naturalnych do dowolnego innego zbioru.
5.3
5.3.1
Ciągi i podciągi
Definicja ciągu i podciągu
Definicja 5.3.1 Ciągiem w zbiorze X nazywamy dowolne odwzorowanie a : N → X.
Dla ciągu a obok notacji funkcyjnej a(n) dla wartości a w n stosujemy też tradycyjną notację ciągową an := a(n). O an
mówimy często, że jest n-tym wyrazem ciągu a lub krótko wyrazem ciągu a.
Definicja 5.3.2 Niech X będzie zbiorem, c : N → X ciągiem o wartościach w X, a k : N → N ciągiem silnie rosnącym.
Wtedy ciąg będący złożeniem c ◦ k nazywamy podciągiem ciągu c. Jego n-tym wyrazem jest (c ◦ k)(n). Tradycyjnie
oznaczamy go ckn .
Rozważmy ciagi
˛
1
∈ Q,
1+n
k : N ∈ n → 2n ∈ N.
a:N3n→
Poczatkowe
˛
wyrazów ciagu
˛ a to
1 1 1
1, , , , . . .
2 3 4
Poczatkowe
˛
wyrazy ciagu
˛ k to
0, 2, 4, 6, . . .
Ciag
˛ k jest rosnacym
˛
ciagiem
˛
o wartościach w N. Zatem możemy rozważać złożenie b := a ◦ k : N → Q. Złożenie to jest ciagiem
˛
b : N 3 n → a(k(n)) = akn =
1
∈ Q.
1 + 2n
Kilka poczatkowych
˛
wyrazów ciagu
˛ b to
1,
1
1
= ,
1+2×1
3
1
1
= ,
1+2×2
5
1
1
= ,....
1+2×3
7
Widać wi˛ec, że ciag
˛ b jest zbudowany z wybranych wyrazów ciagu
˛ a, przy czym wyboru dokonujemy przy pomocy ciagu
˛ k . Wyjaśnia to nazw˛e podciag.
˛
5.3.2
Ciąg przybliżeń pierwiastka jeszcze raz.
Ciąg instrukcji, który wykorzystywaliśmy do liczenia przybliżeń pierwiastka wygodnie zapakować w postaci programu, z
którego można korzystać wielokrotnie. Program ten przedstawiono na listingu 5.1. Wystarczy teraz napisać
SqrtTwo [ 3 ]
i otrzymamy
{
707 283
,
}.
500 200
5.3. CIĄGI I PODCIĄGI
97
( ∗ D e f i n i u j e m y f u n k c j ę o nazwie SqrtTwoBf o b l i c z a j ą c ą p i e r w i a s t e k z dwóch
z jednym argumentem o k r e ś l a j ą c y m żądaną d o k ł a d n o ś ć ∗ )
SqrtTwoBf [ n_ ] := ( ∗ Znak p o d k r e ś l e n i a po n i n f o r m u j e , ż e n j e s t argumentem ∗ )
Module [ { i } , ( ∗ Moduł może z a w i e r a ć zmienne l o k a l n e .
I c h l i s t ę umieszczamy na p o c z ąt k u ∗ )
i = 1 ; ( ∗ I n i c j a l i z u j e m y zmienną i w a r t o ś c i ą j e d e n ∗ )
While [
( ∗ Początek p ę t l i ∗ )
i ^2 < 2∗100^n , ( ∗ P ę t l ę wykonujemy j a k długo s p e ł n i o n y j e s t warunek ∗ )
i = i + 1 ( ∗ Jedyna i n s t r u k c j a wewnątrz n a s z e j p ę t l i ∗ )
] ; ( ∗ Koniec p ę t l i ∗ )
( ∗ O s t a t n i e o b l i c z o n e w y r a ż e n i e t o w a r t o ś ć zwracana p r z e z f u n k c j ę ∗ )
( ∗ J e s t nim para ułamków s z a c u j ą c y c h p i e r w i a s t e k od dołu i góry ∗ )
{ ( i − 1)/10^ n , i /10^n}
] ( ∗ Koniec modułu d e f i n i u j ą c e g o f u n k c j ę ∗ )
Listing 5.1: Obliczania pierwiastka metodą brutalnej siły zademonstrowane w języku Mathematica. Tekst zamknięty w
parach dwuznaków (* i *) oznacza komentarz.
( ∗ Funkcja o b l i c z a j ą c a p i e r w i a s t e k z l i c z b y a>0 z d o k ł a d n o ś c i ą do d c y f r ∗ )
S q r t B f P l u s [ a_ , d_ ] :=
Module [ { i , n } ,
( ∗ Zmienne l o k a l n e : l i c z n i k i mianownik ∗ )
i = 1; n = 1;
While [ True , ( ∗ Główną p ę t l ę przerwiemy i n s t r u k c j ą Break p o n i ż e j ∗ )
( ∗ Wewnętrzna p ę t l a d o b i e r a w a r t o ś ć l i c z n i k a do a k t u a l n e g o mianownika ∗ )
While [ ( i + 1 ) ∗ ( i + 1 ) < a ∗n∗n , i = i + 1 ] ;
( ∗ Po o s i ą g n i ę c i u ż ą d a n e j d o k ł a d n o ś c i wychodzimy z p ę t l i ∗ )
I f [ n >= 10^d , Break [ ] ] ;
( ∗ Rozszerzamy r e p r e z e n t a c j ę ułamka p r z e d kolejnym p r z e j ś c i e m p ę t l i ∗ )
i = i ∗10;
n = n∗10;
];
{ i /n , ( i + 1 ) / n}
]
Listing 5.2: Usprawnione podejście do obliczania pierwiastka przedstawione w programie Mathematica.
Ćwiczenie komputerowe 5.3.3 Adaptuj nasz program SqrtTwoBf do SqrtBf tak by liczył pierwiastek z dowolnej
liczby naturalnej.
Ćwiczenie komputerowe 5.3.4 Sprawdź doświadczalnie jak rośnie czas obliczeń naszego algorytmu SqrtTwo przy
zwiększaniu dokładności. Warto wiedzieć, że obliczenie wyrażenia, którego wykonanie w programie Mathematica trwa
zbyt długo zawsze można przerwać wybierając w menu Evaluation opcję Abort evaluation.
Jak widać nasz algorytm liczenia pierwiastka jest daleki od doskonałości. Znacznie ulepszoną wersję przedstawiono na
listingu 5.2 Jak zobaczymy niebawem są jeszcze lepsze algorytmy. Warto jednak uświadomić sobie, że, choć tego nie jesteśmy
w stanie zaobserwować przy obliczaniu pojedynczego pierwiastka, jedną z przyczyn, dla których obliczenia przy dużej
dokładnosci są dość wolne jest przekroczenie pojemności maszynowego typu int i konieczność programowego symulowania
większej pojemności. Między innymi z tego powodu w tradycyjnych obliczeniach numerycznych zamiast dokładnych – ale na
ogół bardzo wolnych – obliczeń na liczbach całkowitych lub ułamkach preferuje się znacznie szybsze, ale obarczone pewnym
błędem, obliczenia na maszynowych liczbach zmiennopozycyjnych takich jak double, o których opowiemy w rozdziale 8.2.
98
ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA.
Ćwiczenie komputerowe 5.3.5 Adaptuj program z listingu 5.1 lub listingu 5.2 tak by wyznaczał ciąg przybliżeń
dodatniego pierwiastka równania
x2 + x = 3.
Listing 5.2 prezentuje nieco udoskonaloną wersję liczenia pierwiastka metodą brutalnej siły. Zastosowano tu pętlę w
pętli, by przy obliczeniach dla zwiększonej dokładności niepotrzebnie nie powtarzać tego co już jest wiadome na podstawie
obliczeń wcześniejszych.
Ćwiczenie komputerowe 5.3.6 Zmodyfikuj program z listingu 5.2 tak, by liczył
go dla liczb, dla których znasz prawidłową odpowiedź.
5.3.3
√
3
a dla zadanej liczby a. Przetestuj
Monotoniczność ciągu.
Twierdzenie 5.3.7 Niech X będzie przestrzenią uporządkowaną. Ciąg a : N → X jest słabo rosnący wtedy i tylko
wtedy gdy
∀n ∈ N an ¬ an+1 .
Jest on silnie rosnący wtedy i tylko wtedy gdy
∀n ∈ N
an < an+1 .
Analogicznie można scharakteryzować ciągi słabo i silnie malejące.
5.4
Rekurencyjne definiowanie ciągu.
Zobaczymy w rozdziale 5.4.1, że dla a > 1 funkcja
f : R+ 3 x 7→
ma t˛e sympatyczna˛ własność, iż jeśli x jest przybliżeniem
√
wyprodukować ciag
˛ coraz lepszych przybliżeń a
√
a + x2
∈ R+
2x
a, to f (x) jest jeszcze lepszym przybliżeniem
√
a. Zaczynajac
˛ od liczby jeden możemy zatem
1, f (1), f (f (1)), f (f (f (1))), . . . .
Cecha˛ tego ciagu
˛ jest to, że aby wyliczyć wyraz n-ty musimy już mieć policzony wyraz (n − 1)-szy. Podanie ogólnego wzoru na n-ty wyraz jest jednak trudne
o ile w ogóle możliwe. Może si˛e zatem pojawić watpliwość.
˛
Jeśli nie potrafimy podać wzoru na 4N4-ty wyraz, to czy rzeczywiście możemy mówić o dobrze
zdefiniowanym ciagu?
˛
Poniższe twierdzenie o rekurencyjnym definiowaniu ciagu
˛ upewnia nas, że takie post˛epowanie prowadzi do dobrze zdefiniowanego ciagu.
˛
Twierdzenie 5.4.1 (o rekurencyjnym definiowaniu ciągu) Niech f : X → X będzie funkcją i niech c ∈ X. Wtedy
istnieje dokładnie jeden ciąg a : N → X taki, że
a0
=
c,
∀n ∈ N an∗
=
f (an ).
5.4. REKURENCYJNE DEFINIOWANIE CIĄGU.
99
( ∗ S z y b k i e o b l i c z a n i e p i e r w i a s t k a z l i c z b y a z d o k l a d n o s c i a do e p s i l o n ∗ )
SqrtQuick [ a_ , d_ ] := Module [ { x , e p s } ,
e p s = 10^(−d ) ; ( ∗ żądana d o k ł a d n o ś ć ∗ )
x = 1 ; ( ∗ w a r t o ś ć początkowa c i ą g u r e k u r e n c y j n e g o ∗ )
While [ Abs [ x∗x − a ] / 2 > eps , ( ∗ j e ś l i n i e o s i ą g n i ę t o ż ą d a n e j d o k ł a d n o ś c i ∗ )
x = ( x∗x + a ) / ( 2 ∗ x ) ; ( ∗ nowa w a r t o ś ć c i ą g u r e k u r e n c y j n e g o ∗ )
Print [N[ { x − ( x∗x − a ) / 2 , x } , d + 1 ] ] ( ∗ wydruk k o n t r o l n y ∗ )
];
{x − ( x∗x − a ) / 2 , x} ( ∗ końcowy wynik ∗ )
]
Listing 5.3: Szybkie wyznaczenie ciągu przybliżeń pierwiastka w języku Mathematica.
Powyższe twierdzenie dowodzi si˛e przy pomocy zasady indukcji. Twierdzenie to pozwala definiować ciagi
˛ bez wypisywania jawnego wzoru na n-ty wyraz.
Wystarczy podać wyraz poczatkowy
˛
oraz recept˛e jak z wyrazu n-tego dostać wyraz (n + 1). Mówimy wtedy o rekurencyjnym definiowaniu ciagu.
˛
Twierdzenie 5.4.2 Trójka spełniająca warunki definicji 5.1.1 istnieje dokładnie jedna w tym sensie, że jeśli
(N1 , 01 , S1 ) i (N2 , 02 , S2 ) są dwiema takimi strukturami, to istnieje bijekcja f : N1 → N2 taka, że f (01 ) = (02 )
oraz dla każdego n ∈ N1 zachodzi f (S1 (n)) = S2 (f (n)).
Dowód: ....
5.4.1
Pierwiastek poprzez ciąg rekurencyjny.
Jako ilustracj˛e pożytków z ciagu
˛ zdefiniowanego rekurencyjnie rozważymy nast˛epujac
˛ a,˛ bardzo szybka˛ metod˛e liczenia pierwiastka z liczby a. Używamy w tym
celu ciagu
˛ zadanego rekurencyjnie wzorami
x0
xn
:=
1
a + x2n
:=
2xn
√
Można pokazać, że ciag
˛ ten jest zbieżny do a, i to bardzo szybko.
Program liczacy
˛ pierwiastek ta˛ metoda˛ napisany w j˛ezyku Mathematica przedstawiono na listingu 5.3.
Problem 5.4.3 Jak ocenić pr˛edkość zbieżności? Jak skonstruować ciag,
˛ który b˛edzie możliwie szybko zbieżny do poszukiwanej liczby?
Odpowiedzi na pytania tego typu daje analiza numeryczna oraz teoria aproksymacji.
Rekurencyjne definiowanie ciagów
˛
dost˛epne jest również w j˛ezykach programowania. Mówi si˛e tam o rekurencyjnym wywoływaniu funkcji, ale chodzi o funkcje
z argumentem b˛edacym
˛
liczba˛ naturalna,˛ a wi˛ec w terminologii przyj˛etej w matematyce o ciag.
˛ W j˛ezyku Mathematica definicj˛e rekurencyjna˛ podaje si˛e jako par˛e
wzorów. Na ogół bardzo upraszcza to pisanie programu, choć cz˛esto odbija si˛e to na jego efektywności. Na przykład wersja rekurencyjna szybkiego liczenia
pierwiastka z listingu 5.3 to
Q u i c k S q r t [ a_ , 0 ] = 1 ;
Q u i c k S q r t [ a_ , n_ ] : = Module [ { x } , x = Q u i c k S q r t [ a , n − 1 ] ; ( x ^ 2 + a ) / ( 2 ∗ x ) ] ;
Piszac
˛
QuickSqrt [2. ,4]
√
otrzymujemy przybliżenie 2 z dokładnościa˛ do 5 miejsc po przecinku. W rozwiazaniu
˛
tym jest jednak pewnym problemem jak dobrać wyraz ciagu
˛ by uzyskać
żadan
˛ a˛ dokładność.
Definicj˛e rekurencyjna QuickSqrt można zapisać jeszcze krócej, bez użycia modułu:
100
ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA.
Q u i c k S q r t [ a_ , 0 ] = 1 ;
Q u i c k S q r t [ a_ , n_ ] : =
( QuickSqrt [ a , n − 1]^2 + a )/(2∗ QuickSqrt [ a , n − 1 ] ) ;
Ćwiczenie komputerowe 5.4.4
˛
działa. Zastanów si˛e ile razy wywoływana jest funkcja QuickSqrt by obliczyć
√ Sprawdź czy i jak to rozwiazanie
2. Wyciagnij
˛ wnioski.
czwarty wyraz ciagu
˛ przybliżajacego
˛
5.4.2
(*)Arytmetyka liczb natualnych
Jesteśmy teraz gotowi podać formalne definicje dodawania i mnożenia liczb naturalnych. Sa˛ to definicje rekurencyjne. Wykorzystujemy w nich aksjomatycznie
dana˛ funkcj˛e nast˛epnika. Przypomnijmy, że nast˛epnik liczby n oznaczamy n∗ .
Operacje dodawania liczb naturalnych definiujemy rekurencyjnie:
m+0
m+n
m
:=
∗
(5.3)
∗
(m + n)
:=
(5.4)
Liczbę jeden, oznaczaną 1, definiujemy jako następnik zera. Tak więc 1 := 0∗ . Podstawiając zero w miejsce n we wzorze 5.4
i wykorzystując 5.3 ortzymujemy
m + 0∗ = (m + 0)∗ = m∗ .
Zatem definiując liczbę jeden jako następnik zera, to jest przyjmując 1 := 0∗ otrzymujemy
m + 1 = m∗ ,
co pozwala nam zapisywać następnik n w tradycyjnej formie n + 1.
Również rekurencyjnie definiujemy iloczyn:
m·0
m·n
∗
:=
0
:= m · n + m
Zwyczajowo znak mnożenia w iloczynie pomijamy, jeśli nie prowadzi to do nieporozumień.
Możemy teraz podać formalną definicję nierówności.
Definicja 5.4.5 Mówimy, że m jest nie większe (mniejsze lub równe) od n i piszemy m ¬ n jeżeli
∃k ∈ N m + k = n.
Mówimy, że m jest mniejsze niż n jeżeli m ¬ n i m 6= n.
Podobnie definiujemy podzielność.
Definicja 5.4.6 Mówimy, że m dzieli n i piszemy m|n jeżeli
∃k ∈ N m · k = n.
Można indukcyjnie pokazać, że w obu powyższych przypadkach jeśli k istnieje to jest jedyne. Nazywamy je odpowiednio
n
różnicą (dla nierówności) oraz ilorazem (dla podzielności) i oznaczamy odpowiednio n − m i m
.
Dla p ∈ N ędziemy stosować oznaczenia
Np
:= { n ∈ N | n ­ p },
Ip :
=
Zauważmy, że w szczególności N0 = N oraz I0 = ∅.
{ n ∈ N | 1 ¬ n ¬ p }.
5.5. ZBIORY SKOŃCZONE I PRZELICZALNE
5.5
101
Zbiory skończone i przeliczalne
Definicja 5.5.1 Mówimy, że zbiór X jest skończony, jeśli istnieje liczba naturalna n ∈ N taka, że zbiór X jest
równoliczny ze zbiorem In . Wtedy liczbę n nazywamy mocą zbioru X i piszemy card X = n. Mówimy, że zbiór X jest
przeliczalny, jeżeli X jest równoliczny ze zbiorem liczb naturalnych.
Definicja 5.5.2 Ciągiem skończonym w zbiorze X nazywamy dowolne odwzorowanie a : Ip → X.
5.6
Rozszerzona zasada indukcji
Czasami wzór czy twierdzenie, które chcemy dowieść przy pomocy zasady indukcji nie ma sensu dla liczby zero, czy kilku poczatkowych
˛
liczb naturalnych. Innymi
słowy odnosi si˛e do zbioru Np = {p, p + 1, p + 2, . . .}. Co wi˛ecej, przy dowodzeniu wzgl˛ednej prawdziwości twierdzenia dla n w drugim kroku indukcyjnym
wygodnie jest skorzystać z założenia indukcyjnego nie tylko dla n − 1, ale dla wszystkich k < n. Poprawność takiego post˛epowania uzasadnia nast˛epujaca
˛
rozszerzona zasada indukcji.
Twierdzenie 5.6.1 (Rozszerzona zasada indukcji) Niech p ∈ N oraz Z ⊂ N. Jeżeli zachodzą warunki
(i)
(ii)
p ∈ Z,
N p ∩ In ⊂ Z ⇒ n + 1 ∈ Z
to Z = Np .
Mamy też rozszerzone twierdzenie o rekurencyjnym definiowaniu ciągu.
Twierdzenie 5.6.2 (rozszerzone o rekurencyjnym definiowaniu ciągu) Niech f : X → X będzie funkcją, niech c ∈ X
i p ∈ N. Wtedy istnieje dokładnie jeden ciąg a : Np → X taki, że
ap
∀n ∈ Np an+1
5.7
= c,
= f (an ).
Silnia i symbol Newtona
Jednym z klasycznych pytań matematyki zbiorów skończonych jest pytanie na ile sposobów elementy zbioru n-elementowego X można ustawić w ciag.
˛ Każde
takie ustawienie to bijekcja z In do X . Pytamy wi˛ec ile jest możliwych takich bijekcji. Okazuje si˛e, że jest ich n!. Dokładniej, można pokazać nast˛epujace
˛
twierdzenie.
Dla n ∈ N definiujemy rekurencyjnie
(
1
n! :=
n(n − 1)!
n = 0,
n > 0.
Wyrażenie n! czytamy "n silnia".
Wyrażenie n! pojawia si˛e w kontekście klasycznego pytania na ile sposobów elementy zbioru n-elementowego X można ustawić w ciag.
˛ Każde takie
ustawienie to bijekcja z In do X . Pytamy wi˛ec ile jest możliwych takich bijekcji. Okazuje si˛e, że jest ich n!. Dokładniej, można pokazać nast˛epujace
˛ twierdzenie.
102
ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA.
Twierdzenie 5.7.1 Niech X będzie zbiorem skończonym i niech n := card X. Wtedy
card { f : In → X | f jest bijekcją } = n!
Dla n, k ∈ N definiujemy tzw. symbol Newtona wzorem
n
n!
:=
.
k
k!(n − k)!
Symbol Newtona ma również teoriomnogościową interpretację. Mamy bowiem następujące twierdzenie
Twierdzenie 5.7.2 Niech X będzie zbiorem skończonym o mocy n. Wtedy
n
card { A ⊂ X | card A = k } =
.
k
Z twierdzenia tego wynika w szczególności, że symbol Newtona jest zawsze liczbą naturalną, tzn. że k!(n − k)! dzieli n!.
W programie Mathematica silnię obliczamy stosując tradycyjną notację. Pisząc
50!
otrzymujemy
30414093201713378043612608166064768844377641568960512000000000000
Natomiast symbol Newtona obliczymy używając funkcji Binomial. Pisząc
Binomial[5, 2]
otrzymujemy 52 , czyli 10.
Rozdział 6
Struktury porządkowe
6.1
6.1.1
Relacje porządku
Częściowy i liniowy porządek
Definicja 6.1.1 Relację R w X nazywamy częściowym porządkiem lub krótko porządkiem jeżeli R jest relacją zwrotną, antysymetryczną i przechodnią, a liniowym porządkiem jeżeli dodatkowo R jest spójna. Parę (X, R) nazywamy
przestrzenią częściowo uporządkowaną lub krótko przestrzenią uporządkowaną jeżeli R jest częściowym porządkiem w
X, a przestrzenią liniowo uporządkowaną jeżeli R jest porządkiem liniowym.
Klasę przestrzeni częściowo uporządkowanych oznaczać będziemy Ord, a liniowo uporząkowanych LOrd. Jeśli R jest
częściowym porządkiem zwyczajowo będziemy pisać ¬ w miejsce R, a ­ w miejsce R−1 . Ponadto mówić będziemy, że x jest
mniejsze od y i pisać x < y jeżeli
x ¬ y i x 6= y.
Analogicznie mówić będziemy, że x jest większe od y i pisać x > y jeżeli
x ­ y i x 6= y.
W rozdziale 7.1.3 podamy formalna˛ definicj˛e porzadku
˛ linowego w zbiorze liczb całkowitych Z (wzór (7.4)), a w rozdziale 7.2.3 porzadku
˛ liniowego w zbiorze
liczb wymiernych Q (wzór (7.5)). W obu przypadkach b˛eda˛ to porzadki
˛ zgodne z codzienna˛ intuicja˛ zwiazan
˛ a˛ z porównywaniem liczb.
Uwaga 6.1.2 Jeśli R jest porządkiem w X, a Y ⊂ X, to RY := R ∩(Y ×Y ) jest porządkiem w Y . Jeśli R jest liniowy,
to RY jest liniowy.
Porządek RY nazywamy porządkiem indukowanym, a (Y, RY ) nazywamy podprzestrzenią przestrzeni uporządkowanej
(X, R).
Porzadek
˛ w Z ⊂ Q jest przykładem porzadku
˛ indukowanego z Q.
Ćwiczenie 6.1.3 Udowodnić uwagę 6.1.2
Aby zwi˛ekszyć przejrzystość rysunku, rysujac
˛ graf cz˛eściowego badź
˛ liniowego porzadku
˛
pomijamy kraw˛edzie, które sa˛ konsekwencja˛ własności przechodniości i własności zwrotności. Tak otrzymany graf cz˛eściowego porzaku
˛ nazywamy grafem zredukowanym. Jest on bardziej przejrzysty, bo zawiera mniej kraw˛edzi,
które w wyobraźni łatwo uzupełnić wykorzystujac
˛ własność zwrotności i przechodniości,
Rys. 6.1 przedstawia graf zredukowany przestrzeni liniowo uporzadkowanej
˛
(po lewej) oraz graf zredukowany przestrzeni cz˛eściowo uporzadkowanej
˛
(po
prawej).
103
104
ROZDZIAŁ 6. STRUKTURY PORZĄDKOWE
Rysunek 6.1: Graf liniowego i częściowego porządku
Rysunek 6.2: Przetrzeń częściowo uporządkowana i jej podzbiór A
6.1.2
Majoranty i minoranty
Definicja 6.1.4 Niech (X, ¬) będzie przestrzenią częściowo uporządkowaną i niech A będzie podzbiorem X. Mówimy,
że x ∈ X jest majorantą zbioru A jeżeli a ¬ x dla każdego elementu a ∈ A. Jeżeli x ∈ A i x jest majorantą A, to
x nazywamyelementem największym w A. Z kolei mówimy, że x jest elementem maksymalnym w A jeżeli x ∈ A
oraz w A nie istnieje element y większy od x. Analogicznie, odwracając kierunek nierówności, definiujemy minorantę,
element najmniejszy i element minimalny. Jeśli w podzbiorze A przestrzeni częściowo uporządkowanej istnieje element
największy (najmniejszy) to oznaczamy go max A, (min A).
Rys. 6.2 przedstawia przestrzeń cz˛eściowo uporzadkowan
˛
a˛ X oraz jej podzbiór A. W zbiorze A sa˛ dwa elementy maksymalne e oraz f , ale nie ma w nim
elementu najwi˛ekszego. Nie ma też majorant. Natomiast elementem najmniejszym zbioru A jest d. Jest to też jedyny element minimalny tego zbioru. Minorantami
zbioru A sa˛ elementy a, b, c, d.
6.2. PRZESTRZENIE CIĄGŁE
105
Twierdzenie 6.1.5 Niech (X, ¬) będzie przestrzenią częściowo uporządkowaną i niech A będzie podzbiorem X.
(i) Tak element największy jak i najmniejszy w zbiorze A istnieje co najwyżej jeden.
(ii) Podzbiór skończony niepusty A przestrzeni częściowo uporząkowanej posiada co najmniej jeden element minimalny i co najmniej jeden element maksymalny w A.
(iii) Element maksymalny (minimalny) zbioru liniowo uporządkowanego jest jego elementem największym (najmniejszym).
(iv) Podzbiór skończony niepusty przestrzeni liniowo uporządkowanej posiada element największy i element najmniejszy.
Dowód: Aby pokazać własnośc (i) przyjmijmy najpierw, że z1 i z2 są elementami największymi w zbiorze A. Z definicji
elementu największego wiemy, że z1 jest majorantą A, zatem
∀x ∈ A x ¬ z1 .
(6.1)
∀x ∈ A x ¬ z2 .
(6.2)
Ponieważ z2 też jest największy, więc również
Z definicji elementu największego wiemym że z1 , z2 ∈ A. Podstawiając z2 za x w (6.1) dostajemy z2 ¬ z1 . Podobnie z (6.2)
dostajemy z1 ¬ z2 . Wobec własności antysymetrii relacji porządku dostajemy z1 = z2 . Zatem element największy jest co
najwyżej jeden. Podobnie pokazujemy, że element najmniejszy jest co najwyżej jeden.
Własność (ii) pokażemy nie wprost. Przypuśćmy, że w A nie ma elementu maksymalnego. Zatem dla każdego x ∈ A
znajdziemy x∗ ∈ A taki, że x∗ > x. Ponieważ A 6= ∅, możemy wybrać element a ∈ A. Rozważmy elementy
a < a∗ < a∗∗ < · · ·
Ponieważ zbiór A jest skończony, więc w tym ciągu nierówności muszą znaleźć się dwa wyrazy równe. Ale równe być nie mogą,
bo nierówności są silne. Sprzeczność ta dowodzi, że przypuszcznie iż w A nie ma elementu maksymalnego było fałszywe.
Podobnie dowodzimy, że w A musi być element minimalny.
Aby pokazać własność (iii) przypuśćmy, że a jest maksymalny w liniowo uporządkowanym zbiorze A i równocześnie
nie jest on największy. Zatem istnieje b ∈ A taki, że nie jest prawdą iż b ¬ a. Ponieważ A jest liniowo uporządkowany, z
własności spójności wynika, że b > a. Ale to przeczy maksymalności a. Zatem a jest największy Podobnie pokazujemy, że
element minimalny zbioru liniowo uporządkowanego jest jego elementem najmniejszym.
Aby zakończyć dowód wystarczy zauważyć, że własność (iv) wynika natychmiast z własności (ii) i ( iii).
6.2
Przestrzenie ciągłe
Wiemy, że zbiór liczb wymiernych Q jest dziurawy. Brakuje w nim wielu liczb potrzebnych do mierzenia długości: na przykład długości przekatnej
˛
kwadratu lub
obwodu okr˛egu. Potrzebujemy "zakleić" te dziury. W tym rozdziale podamy formalna˛ definicj˛e przestrzeni liniowo uporzadkowanej
˛
bez dziur, tzw. przestrzeni ciagłej.
˛
Zbiór Q nie jest przestrzenia˛ ciagła.
˛ W rozdziale 7.3.3 skonstruujemy z liczb wymiernych zbiór liczb rzeczywistych R i pokażemy, że w przeciwieństwie do Q jest
on przestrzenia˛ ciagł
˛ a.˛
6.2.1
Kresy
Niech X będzie przestrzenią częściowo uporządkowaną i niech A ⊂ X.
Definicja 6.2.1 Mówimy, że zbiór A jest ograniczony od góry (od dołu) jeżeli posiada majorantę (minorantę).
106
ROZDZIAŁ 6. STRUKTURY PORZĄDKOWE
Definicja 6.2.2 Mówimy, że x jest kresem górnym (supremum) zbioru A i piszemy
x = sup A,
jeżeli A jest ograniczony od góry, a x jest jego najmniejszą majorantą.
Definicja 6.2.3 Mówimy, że x jest kresem dolnym (infimum) zbioru A i piszemy
x = inf A,
jeżeli A jest ograniczony od dołu, a x jest jego największą minorantą.
Ćwiczenie 6.2.4
• Podaj przykład ilustrujący, że w zbiorze skończonym częściowo uporządkowanym X może być
podzbiór A, którego kres dolny (górny) nie istnieje, albo istnieje, ale do A nie należy
• Pokaż, że jeśli X jest skończony, liniowo uporządkowany, to dla dowolnego A ⊂ X kres dolny (górny) istnieje i
zawsze należy do A.
Zobaczymy, że w zbiorach nieskończonych liniowo uporzadkowanych
˛
moga˛ być podzbiory ograniczone, których kresy nie istnieja,˛ badź
˛ istnieja,˛ ale do
podzbioru nie należa.˛
6.2.2
Przedziały
Definicja 6.2.5 Niech X będzie przestrzenią częściowo uporządkowaną i niech a, b ∈ X. Przedział otwarty, lewostronnie otwarty, prawostronnie otwarty oraz przedział domknięty o końcach a, b definiujemy odpowiednio wzorami
(a, b)
:= { x ∈ X | a < x i x < b },
(a, b]
:= { x ∈ X | a < x i x ¬ b },
[a, b)
:= { x ∈ X | a ¬ x i x < b },
[a, b]
:= { x ∈ X | a ¬ x i x ¬ b }.
Podobnie definiujemy lewy półprzedział otwarty, prawy półprzedział otwarty, lewy półprzedział domknięty, prawy półprzedział domknięty o końcu a odpowiednio wzorami wzorami
(−∞, a)
:= { x ∈ X | x < a },
(a, ∞)
:= { x ∈ X | a < x },
(−∞, a]
:= { x ∈ X | x ¬ a },
[a, ∞)
:= { x ∈ X | a ¬ x }.
Należy zwrócić uwagę, że oznaczenie (a, b) na przedział otwarty jest nieodróżnialne od oznaczenia na parę (a, b). Jednak
z kontekstu zawsze można będzie ustalić, o którą interpretację chodzi.
6.2. PRZESTRZENIE CIĄGŁE
6.2.3
107
Własność L
Mówimy, że niepusty podzbiór A przestrzeni liniowo uporządkowanej X ma własność (L) jeżeli A jest ograniczony od góry
oraz
x ∈ A i y ¬ x ⇒ y ∈ A.
Analogicznie mówimy, że A ma własność (R) jeżeli A jest ograniczony od dołu oraz
x ∈ A i y ­ x ⇒ y ∈ A.
Uwaga 6.2.6 Każdy lewy półprzedział ma własność (L), a każdy prawy półprzedział ma własność (R). Niepusty,
właściwy podzbiór A przestrzeni liniowo uporządkowanej X ma własność (L) wtedy i tylko wtedy gdy X \ A ma
własność (R).
Pojawia si˛e naturalne pytanie czy w jakiejś przestrzeni liniowo uprzadkowanej
˛
moga˛ istnieć zbiory, które maja˛ własność (L) lub (R), a nie sa˛ przedziałami.
Odpowiedź jest twierdzaca.
˛ Zbiór
A := { q ∈ Q | q ¬ 0 albo q 2 < 2 }
√
ma własność (L), ale nie jest przedziałem, bo ewentualnym końcem tego przedziału musiałby być 2, a wiemy już, że w zbiorze liczb wymiernych takiej liczby
nie ma. Zbiór ten jest równocześnie przykładem zbioru ograniczonego od góry, który nie ma (w Q) kresu górnego.
Ma on jednak kres górny, do tego zbioru nie
√
należacy,
˛ jeśli A potraktujemy jako podzbiór zbioru liczb rzeczywistych. Kresem tym jest w takim przypadku 2.
6.2.4
Przestrzenie ciągłe
Definicja 6.2.7 Mówimy, że przestrzeń liniowo uporządkowana X jest przestrzenią ciągłą jeżeli dla każdego niepustego, właściwego podzbioru A tej przestrzeni, który ma własność (L) istnieje a ∈ X takie, że
A = (−∞, a) lub A = (−∞, a]
co jest równoważne założeniu, że dla każdego niepustego, właściwego podzbioru A tej przestrzeni, który ma własność
(R) istnieje a ∈ X takie, że
A = (a, ∞) lub A = [a, ∞).
Od zbioru liczb rzeczywistych, jakkolwiek go zdefiniujemy, oczekujemy, żeby był przestrzenia˛ liniowo uporzadkowan
˛
a˛ ciagł
˛ a.˛
Twierdzenie 6.2.8 Następujące trzy warunki są parami równoważne.
(i) X jest przestrzenią ciągłą.
(ii) Każdy niepusty, ograniczony od góry podzbiór X posiada kres górny.
(iii) Każdy niepusty, ograniczony od dołu podzbiór X posiada kres dolny.
108
6.3
6.3.1
ROZDZIAŁ 6. STRUKTURY PORZĄDKOWE
Funkcje monotoniczne
Funkcje rosnące i malejące
Definicja 6.3.1 Niech X i Y będą przestrzeniami uporządkowanymi, a f : X → Y niech będzie funkcją. Mówimy, że
f jest słabo rosnąca, jeżeli
∀x1 , x2 ∈ X x1 < x2 ⇒ f (x1 ) ¬ f (x2 ),
a silnie rosnąca, jeżeli
∀x1 , x2 ∈ X
x1 < x2 ⇒ f (x1 ) < f (x2 ).
Podobnie, mówimy, że f jest słabo malejąca, jeżeli
∀x1 , x2 ∈ X
x1 < x2 ⇒ f (x1 ) ­ f (x2 ),
∀x1 , x2 ∈ X
x1 < x2 ⇒ f (x1 ) > f (x2 ).
a silnie malejąca, jeżeli
Twierdzenie 6.3.2 Niech X będzie przestrzenią liniowo uporząkowaną i niech f : X → X będzie odwracalna. Wtedy
jeśli f jest rosnąca (malejąca) to f −1 jest rosnąca (malejąca).
6.4
6.4.1
Liczby kardynalne i porządkowe.
Liczby kardynalne.
........................
6.4.2
Aksjomat wyboru.
........................
6.4.3
Liczby porządkowe.
........................
Rozdział 7
Struktury algebraiczne.
7.1
7.1.1
Liczby całkowite.
Działania
W rozdziale 8 podamy formalna˛ definicj˛e zbioru liczb rzeczywistych. Najpierw jednak przyjrzymy si˛e oddzielnie tzw. strukturom algebraicznym formalizujacym
˛
operacje dodawania i mnożenia.
Dodawanie i mnożenie liczb to operacje arytmetyczne znane nam dobrze ze szkoły. Z formalnego punktu widzenia operacje te to funkcje, które parom liczb
rzeczywistych przyporzadkowuj
˛
a˛ odpowiednio ich sum˛e lub iloczyn.
Działaniem dwuargumentowym w zbiorze X lub krótko działaniem nazywamy dowolne odwzorowanie d : X × X → X.
W przypadku działania dwuargumentowego zazwyczaj stosujemy tzw. notację infixową, w której symbol działania stawiamy
pomiędzy argumentami
x d y := d(x, y).
Mówimy o działaniach zamiast po prostu o funkcjach dwuargumentowych, bo w przypadku działań zazwyczaj oczekujemy spełnienia pewnych specjalnych
własności, modelowanych na własnościach dodawania i mnożenia liczb.
Definicja 7.1.1 Działanie d : X × X → X nazywamy łącznym jeżeli
∀x, y, z ∈ X
(x d y) d z = x d (y d z),
a przemiennym jeżeli
∀x, y ∈ X
x d y = y d x.
Element e ∈ X nazywamy elementem neutralnym dla działania d, jeżeli
∀x ∈ X
e d x = x d e = x.
Jeśli d : X × X → X ma element neutralny e to dla x ∈ X mówimy, że x0 jest jego elementem odwrotnym, jeżeli
x d x0 = x0 d x = e.
Uwaga 7.1.2 Jeśli działanie d : X × X → X ma element neutralny, to jest on dokładnie jeden. Jeśli działanie d jest
łączne i ma element neutralny, to element odwrotny do danego elementu może być co najwyżej jeden.
109
110
ROZDZIAŁ 7. STRUKTURY ALGEBRAICZNE.
Dowód: Aby pokazać, że element neutralny jest dokładnie jeden należy pokazać, że jeśli dwa elementy spełniają wymogi
elementu neutralnego, to są one sobie równe. Załóżmy zatem, że e oraz f są elementami neutralnymi dla działania d. Mamy
zatem
∀x ∈ X e d x = x d e = x
(7.1)
oraz
∀x ∈ X
f d x = x d f = x.
(7.2)
Ponieważ równości w (7.1) zachodzą dla każdego x, więc w szczególności dla x = f mamy
e d f = f.
Podobnie, po podstawieniu x = e, z równości (7.2) dostajemy
e d f = e.
Zatem e = f . Dowód drugiej części uwagi jest podobny i zostawiamy go jako ćwiczenie.
Tak dodawanie jak i mnożenie liczb możemy traktować jako działania, jeśli odpowiednio dobierzemy zbiór liczb, na przykład sa˛ to działania w zbiorze liczb
naturalnych, całkowitych, wymiernych, rzeczywistych, rzeczywistych dodatnich oraz w zbiorze ułamków (liczb wymiernych dodatnich). Mnożenie jest też działaniem
w zbiorze ułamków właściwych, czyli liczb wymiernych dodatnich i mniejszych niż jeden. Jednak dodawania nie można już traktować jako działania w tym zbiorze,
bo suma dwóch ułamków właściwych może nie być ułamkiem właściwym, np. 23 + 23 = 43 .
Tak dodawanie jak i mnożenie liczb sa˛ łaczne
˛
oraz przemienne. Elementem neutralnym dla dodawania liczb jest zero, a dla mnożenia jest jeden. W przypadku
mnożenia elementem odwrotnym do x jest x1 , oczywiście o ile x1 ma sens i jest elementem zbioru, w którym mnożenie rozważamy jako działanie. Zero nigdy
nie posiada elementu odwrotnego wzgl˛edem mnożenia. Dla pozostałych liczb istnienie elementu odwrotnego wzgl˛edem mnożenia zależy od zbioru, w którym
mnożenie rozważamy jako działanie. Na przykład liczba 2 posiada element odwrotny wzgl˛edem mnożenia w zbiorze liczb wymiernych, ale go nie posiada w
zbiorze liczb całkowitych.
W przypadku dodawania zwyczajowo zamiast o elemencie odwrotnym mówimy o elemecie przeciwnym. Dla liczby x jest nim −x, oczywiście o ile −x
jest elementem zbioru, w którym dodawanie rozważamy jako działanie. Elementy przeciwne istnieja˛ dla dodawania rozważanego jako działanie w zbiorze liczb
rzeczywistych, wymiernych, całkowitych.
Przykład 7.1.3 W zbiorze skończonym działanie można zadać przy pomocy tabelki. Na przykład poniższa tabelka
a
b
c
a
b
a
b
b
a
b
c
c
c
c
a
(7.3)
zadaje działanie w zbiorze trzyelementowym { a, b, c }. Wartość x d y jest elementem znajdującym się w przecięciu
wiersza oznaczonego x i kolumny oznaczonej y.
Pakiet Operations umożliwia definiowanie działań w zbiorach skończonych i sprawdzanie, czy działanie ma rozważane
własności. Instrukcja Operations ma dwa argumenty. Pierwszy to lista elementów zbioru, w którym określono działanie.
Drugi argument to tabelka zadająca działanie, zapisana jako lista wierszy. Wprowadzając
op = O p e r a t i o n [ { a , b , c } , { { b , a , c } , { a , b , c } , { b , c , a } } ]
definiujemy działanie zadane w tabelce (7.3). Z kolei wprowadzając
I s A s s o c i a t i v e [ op ]
HasNeutral [ op ]
H a s I n v e r s e s [ op ]
dowiadujemy się, że działanie to ma element neutralny, ale nie jest łączne i, przynajmniej dla pewnych elementów, nie ma
ono elementów odwrotnych.
7.1. LICZBY CAŁKOWITE.
111
Rysunek 7.1: Évariste Galois, 1811-1832, Źródło: Wikipedia
Ćwiczenie 7.1.4
odwrotnych.
(i) Ustal, które elementy w działaniu rozważanym w przykładzie 7.1.3 nie posiadają elementów
(ii) W tabelce (7.3) wystarzczy zamienić miejscami dwa elementy, by otrzymać działanie, które jest łączne, ma
element neutralny i wszystkie elementy odwrotne. Ustal jaka to zamiana.
7.1.2
Grupy
Wśród wielu różnych działań szczególna˛ rol˛e pełnia˛ działania łaczne
˛
posiadajace
˛ element neutralny oraz elementy odwrotne. Na przykład dodawanie w zbiorze
liczb całkowitych oraz mnożenie w zbiorze liczb wymiernych dodatnich sa˛ takimi działaniami. Okazuje si˛e, że jest bardzo wiele działań o takich własnościach,
określonych w bardzo różnych zbiorach, w szczególności w zbiorach skończonych. Dlatego warto wyróżnić takie działania wprowadzajac
˛ poj˛ecie grupy. Jednym z
pierwszych, którzy pokazali wag˛e tego poj˛ecia był francuski matematyk Évariste Galois (rys. 7.1). Posłużył si˛e on poj˛eciem grupy w celu określenia kiedy daje si˛e
wyrazić miejsca zerowe wielomianu przy użyciu czterech operacji arytmetycznych i pierwiastkowania.
Definicja 7.1.5 Trójkę (G, d, e) nazywamy grupą jeżeli d : G × G → G jest działaniem spełniającym następujące
warunki
G1) d jest łączne,
G2) e jest elementem neutralnym dla d,
G3) każdy element w G posiada element odwrotny.
W przypadku gdy spełniona jest jedynie własność G1) trójkę (G, d, e) nazywamy półgrupą. Jeśli spełnione są tylko
własności G1) i G2), półgrupę nazywamy półgrupą z jedynką lub monoidem. Grupę (półgrupę) nazywamy przemienną
albo abelową, jeżeli działanie d jest przemienne.
Przykładem grupy przemiennej jest (Z, +, 0) oraz (R, ·, 1). Grupa˛ przemienna˛ jest też (R+ , ·, 1), natomiast nie jest grupa˛ (N, +, 0), bo dodawanie nie
posiada w tym zbiorze elementu przeciwnego(odwrotnego). Z kolei (N, +, 0) jest przykładem półgrupy.
112
ROZDZIAŁ 7. STRUKTURY ALGEBRAICZNE.
Ćwiczenie 7.1.6 (*)Niech X będzie ustalonym zbiorem. Pokazać, że zbiór bijekcji X w X ze składaniem odwzorowań
jako działaniem jest grupą.
Jeśli rozważamy ustaloną grupę lub półgrupę tradycyjnie działanie d oznaczamy ’·’, element neutralny oznaczamy 1, a
element odwrotny do x oznaczmy x−1 . W praktyce ’·’ często w ogóle pomijamy. Ponadto dla n ∈ N stosujemy oznaczenia
n-krotnie
xn
x−n
z
}|
{
:= x · x · · · · · x
n
:= x−1 .
Ten system notacji określamy mianem notacji multyplikatywnej.
W przypadku grupy lub półgrupy przemiennej tradycyjnie działanie d oznaczamy ’+’, a element neutralny oznaczamy 0.
W przypadku tym zamiast o elemencie odwrotnym do x mówimy o elemencie przeciwnym do x i oznaczamy go −x. Ponadto
dla n ∈ N stosujemy oznaczenia
n-krotnie
nx
(−n)x
}|
{
z
:= x + x + · · · + x
:= n(−x).
Ten system notacji określamy mianem notacji addytywnej.
Choć formalnie grupa jest trójką składającą się, ze zbioru, działania i elementu zbioru, w praktyce często o samym
zbiorze mówimy, że jest grupą, zdając się na domyślność czytelnika co jest brane jako działanie, a co jako element neutralny.
7.1.3
Zbiór liczb całkowitych
Wiemy, że aby odejmować bez ograniczeń liczby naturalne, potrzebujemy rozszerzyć zbiór liczb naturalnych o liczby ujemne. Na przykład, żeby wykonać odejmowanie 3 − 5 potrzebujemy liczby −2. Jak formalnie zdefiniować liczb˛e −2 na gruncie tego co już mamy, to jest liczb naturalnych? Można na przykład przyjać,
˛ że
liczba −2 to para (3, 5). Przy takiej definicji nie wychodzimy poza poj˛ecia, które już mamy zdefiniowane. Pojawia si˛e jednak problem. Liczba −2 to również wynik
odejmowania 7 − 9. Zatem pary (3, 5) i (7, 9) trzeba jakoś utożsamić. Nie możemy postawić warunku 3 − 5 = 7 − 9, bo jeszcze nie zdefiniowaliśmy odejmowania gdy wynik jest ujemny. Ale warunek 3 − 5 = 7 − 9, po przeniesieniu 5 i 7 na druga˛ stron˛e równości, daje warunek równoważny 3 + 9 = 7 + 5, który
operuje jedynie dodawaniem liczb naturalnych, a to już mamy zdefiniowane. Sugeruje to, by par˛e (m, n) utożsamić z para˛ (m0 , n0 ) gdy m + n0 = m0 + n i
prowadzi do nast˛epujacej
˛ formalnej konstrukcji.
Zbiór liczb całkowitych definiujemy jako zbiór klas równoważności
Z := { [(m, n)]R | (m, n) ∈ N2 }
względem relacji
R := { ((m, n), (m0 , n0 )) ∈ N2 × N2 | m + n0 = m0 + n }.
Dla n ∈ N wprowadzamy oznaczenie −n := [(0, n)]R oraz utożsamiamy klasę [n, 0]R z liczbą n, co pozwala traktować Z
jako rozszerzenie N.
Ćwiczenie 7.1.7 (*)Rozszerzyć operację dodawania z N na Z tak by w Z uzyskać strukturę grupy przemiennej.
Rozszerzyć operację mnożenia z N \ {0} na Z \ {0} tak by w Z \ {0} uzyskać strukturę półgrupy przemiennej.
Dla m, n ∈ Z definiujemy
m ¬ n :⇔ n − m ∈ N.
(7.4)
Łatwo sprawdzić, że definicja ta rozszerza definicję 5.4.5 nierówności w N. Przedziałem w Z o końcach m, n ∈ Z nazywamy
zbiór
[m, n]Z := { x ∈ Z | m ¬ x ¬ n }.
Łatwo zauważyć, że zbiór ten jest niepusty wtedy i tylko wtedy gdy m ¬ n.
7.2. LICZBY WYMIERNE
7.1.4
113
Sumy i iloczyny
Niech G będzie półgrupą (w notacji addytywnej lub multyplikatywnej), m, n elementami Z, a
x : [m, n]Z → G
ciągiem. W przypadku notacji addytywnej definiujemy rekurencyjnie sumę elementów ciągu x wzorem
(
n
X
0
m>n
xi := Pn−1 w przeciwnym razie .
i=m xi + xn
i=m
Analogicznie dla notacji multyplikatywnej definiujemy rekurencyjnie iloczyn elementów ciągu x wzorem
(
n
Y
1
m>n
xi := Qn−1 w przeciwnym razie .
i=m xi · xn
i=m
Często stosujemy też mniej formalną, ale bardziej intuicyjną notację kropkową:
xm + xm+1 + . . . + xn
xm · xm+1 · . . . · xn
:=
:=
n
X
xi
i=m
Πni=m
xi .
Dla n ∈ N w przypadku n-krotnie wykonanego działania na elemencie x stosujemy oznaczenie
(
1
n = 0,
n
x :=
x · xn−1 n > 0
w przypadku notacji multyplikatywnej oraz oznaczenie
(
nx :=
0
x + (n − 1)x
n = 0,
n>0
w przypadku notacji addytywnej.
7.2
Liczby wymierne
Mamy już formalnie zdefiniowane liczby naturalne i całkowite. Po drodze wprowadziliśmy poj˛ecie grupy. Widzieliśmy, że choć liczby całkowite z dodawaniem tworza˛
grup˛e, to sa˛ również grupy, które niewiele maja˛ wspólnego z liczbami całkowitymi. Naszym nast˛epnym celem sa˛ liczby wymierne. Liczby wymierne z dodawaniem
też tworza˛ grup˛e, a z mnożeniem tworza˛ grup˛e gdy pominiemy zero. Ponadto, operacje dodawania i mnożenia liczb wymiernych sa˛ ze soba˛ powiazane:
˛
n-krotne
dodadnie do siebie liczby a to to samo co pomnożenie liczby a przez n, czego konsekwencja˛ jest rozdzielczość mnożenia wzgl˛edem dodawania (a + b) · c =
a · c + b · c. Powstaje pytanie, czy sformalizowanie tej koncepcji prowadzi już jednoznacznie do aksjomatyki liczb wymiernych, tak jak to przedstawiliśmy dla liczb
naturalnych?
7.2.1
Ciała
Definicja 7.2.1 Piątkę (F, +, ·, 0, 1) gdzie 0 6= 1 nazywamy ciałem jeżeli (F, +, 0) oraz (F \ {0}, ·, 1) są grupami
przemiennymi, a ponadto zachodzi tzw. prawo rozdzielności mnożenia względem dodawania
∀x, y, z ∈ F
(x + y) · z = x · z + y · z.
114
ROZDZIAŁ 7. STRUKTURY ALGEBRAICZNE.
Okazuje si˛e, że sa˛ ciała istotnie różne od ciała liczb wymiernych. Jak zobaczymy mamy ciało liczb rzeczywistych, ciało liczb zespolonych, ale co ciekawe,
podobnie jak w przypadku grup, sa˛ też ciała skończone.
Ćwiczenie 7.2.2 Pokazać, że zbiór {0, 1} z działaniami + i ∗ danymi tabelami
+
0
1
0
0
1
1
1
0
*
0
1
0
0
0
1
0
1
jest ciałem. Ciało to zwyczajowo oznaczamy Z2 .
7.2.2
Funkcja potęgowa i wielomian
Niech (F, +, ·, 0, 1) będzie ciałem. Dla n ∈ N definiujemy funkcję potęgową
·n : F 3 x 7→ xn ∈ F,
a dla a0 , a1 , . . . an ∈ F definiujemy wielomian A o współczynnikach a0 , a1 , . . . an
Qa0 ,a1 ,...an : F 3 x 7→ a0 + a1 x + a2 x2 + · · · + an xn ∈ F.
Największe n takie, że an 6= 0 nazywamy stopniem wielomianu Q.
7.2.3
Zbiór liczb wymiernych
Konstrukcja zbioru liczb wymiernych ze zbioru liczb całkowitych bardzo przypomina konstrukcj˛e liczb całkowitych z liczb naturalnych. Aby zapewnić sobie możliwość
dzielenia m/n rozważamy pary (p, q) liczb całkowitych oraz relacj˛e utożsamiajac
˛ a˛ pary (p, q)] i (p0 , q 0 ) gdy pq 0 = qp0 .
Zbiór liczb wymiernych definiujemy jako zbiór klas równoważności
Q := { [(p, q)]S | (p, q) ∈ Z × N1 }
względem relacji
S := { ((p, q), (p0 , q 0 )) ∈ (Z × N1 ) × (Z × N1 ) | pq 0 = qp0 }.
Dla liczb wymiernych [(p, q)]S , [(p0 , q 0 )]S definiujemy relację nierówności
[(p, q)]S ¬ [(p0 , q 0 )]S :⇔ pq 0 ¬ qp0 .
(7.5)
Łatwo sprawdzić, że definicja ta nie zależy od wyboru reprezentantów i rozszerza definicję nierówności zadaną wzorem (7.4)
dla liczb całkowitych.
Ćwiczenie 7.2.3 (*)Rozszerzyć operacje dodawania i mnożenia z Z na Q tak by w Q uzyskać strukturę ciała.
7.2.4
Wzory skróconego mnożenia
Niniejsze wzory obowiązujące w każdym ciele będą nam wielokrotnie pomocne. Ich indukcyjny dowód pomijamy.
Twierdzenie 7.2.4 Niech (F, +, ·, 0, 1) będzie ciałem, a, b ∈ F oraz n ∈ N1 . Wtedy
n
b −a
n
=
(b − a)
n−1
X
an−i−1 bi ,
(7.6)
i=0
n
(a + b)
=
n X
n
i=0
i
ai bn−i .
(7.7)
7.3. CIAŁO LICZB RZECZYWISTYCH
7.3
115
Ciało liczb rzeczywistych
Bardzo użyteczna˛ własnościa˛ dodawania liczb jest zachowywanie nierówności przy operacjach arytmetycznych. Jeśli x ¬ y to x + z ¬ y + z . Z mnożeniem
jest podobnie. Nierówność x ¬ y implikuje xz ¬ yz , ale pod dodatkowym warunkiem, że z > 0. Jeśli z < 0, to nie wszystko jest stracone: nierówność si˛e
nie zachowuje, ale pojawia si˛e nierówność przeciwna: xz ­ yz . Przypadek z = 0 jest specyficzny: przemnożenie przez zero powoduje, że po obu stronach
pojawia si˛e zero. Te użyteczne własności sa˛ konsekwencja˛ faktu, że definicja porzadku
˛ w zbiorach liczbowych posługuje si˛e operacja˛ dodawania, a mnożenie jest
powiazane
˛
z dodawaniem własnościa˛ rozdzielności. Jednak jeśli mamy jakieś ciało, a w nim jakiś porzadek,
˛
to nie mamy gwarancji, że nierówności si˛e zachowuja˛
przy wykonywaniu operacji dodawania lub mnożenia w ciele. Dlatego warto wyróżnić te ciała wyposażone w relacj˛e porzadkuj
˛ ac
˛ a,˛ dla których zachowywanie
nierówności ma miejsce.
7.3.1
Ciała uporządkowane
Definicja 7.3.1 Szóstkę (F, +, ·, 0, 1, ¬) nazywamy ciałem uporządkowanym, jeżeli (F, +, ·, 0, 1) jest ciałem, (F, ¬)
jest przestrzenią liniowo uporządkowaną oraz
(i) ∀x, y, z ∈ F
(ii) ∀x, y ∈ F
x ¬ y ⇒ x + z ¬ y + z,
x > 0, y > 0 ⇒ xy > 0.
Wprowadzamy oznaczenia
Q+ := { q ∈ Q | q > 0 },
Q− := { q ∈ Q | q < 0 }.
Ćwiczenie 7.3.2 Pokazać, że zbiór liczb wymiernych Q wraz z określonymi wcześniej działaniami dodawania i mnożenia oraz relacją porządku jest ciałem uporządkowanym.
Ćwiczenie 7.3.3 Pokazać, że ciało z ćw. 7.2.2 z porządkiem {0 ¬ 0, 0 ¬ 1, 1 ¬ 1} nie jest ciałem uporządkowanym.
7.3.2
Zbiór liczb rzeczywistych
Jakkolwiek zdefiniujemy zbiór liczb rzeczywistych, oczekujemy by miał on struktur˛e ciała uporzadkowanego.
˛
Wiemy, że ciało liczb wymiernych z naturalnym
porzadkiem
˛
jest ciałem uporzadkowanym.
˛
Pami˛etamy też, że od zbioru liczb rzeczywistych oczekujemy by, w przeciwieństwie do zbioru liczb wymiernych, był
przestrzenia˛ uporzadkowan
˛
a˛ ciagł
˛ a.˛ Powstaje pytanie, czy nie żadamy
˛
za dużo, to znaczy czy koncepcja ciała uporzadkowanego
˛
ciagłego
˛
nie jest sprzeczna sama
w sobie, a jeśli nie jest, to czy moga˛ być ciała uporzakowane
˛
istotnie różne od liczb rzeczywistych. Odpowiedź zgodna˛ z naszymi oczekiwaniami daje nast˛epujace
˛
twierdzenie.
Twierdzenie 7.3.4 Istnieje ciało uporządkowane ciągłe. Jeśli F1 i F2 są dwoma takimi ciałami, to istnieje silnie
rosnąca bijekcja f : F1 → F2 taka, że
∀x, y ∈ F1
f (x + y) = f (x) + f (y) oraz f (x · y) = f (x) · f (y).
Bijekcja f w powyższym twierdzeniu daje sposób utożsamienia dwóch formalnie różnych ciał uporzadkowanych.
˛
Można wi˛ec powiedzieć, że z dokładnościa˛
do utożsamienia poprzez bijekcj˛e f istnieje dokładnie jedno ciało uporzadkowane
˛
ciagłe.
˛
Jest nim intuicyjnie rozważany od rozdziału wst˛epnego zbiór liczb
rzeczywistych z naturalnymi działaniami dodawania i mnożenia oraz naturalnym porzadkiem.
˛
Definicja 7.3.5 Ciałem liczb rzeczywistych nazywamy ciało uporządkowane ciągłe. Ciało to oznaczamy R.
116
ROZDZIAŁ 7. STRUKTURY ALGEBRAICZNE.
7.3.3
(*)Konstrukcja Cauchy’ego
Dowód tw. 7.3.4 nie jest prosty. Ograniczymy się jedynie do podania szkicu konstrukcji liczb rzeczywistych pochodzącej od
Cauchy’ego.
Pierwsze konstrukcje ciała liczb rzeczywistych podali Cauchy, Dedekind i Weierstrass. Konstrukcja Cauchy’ego opiera
się na pojęciu ciągu Cauchy’ego.
Definicja 7.3.6 Ciąg x : N → Q nazywamy ciągiem Cauchy’ego jeżeli
∀ ∈ Q+ ∃N ∈ N ∀m, n ∈ N
m, n ­ N ⇒ |xm − xn | < .
Dla ciągów x, y : N → Q definiujemy sumę x + y i iloczyn x · y wzorami
x+y
x·y
: N 3 n 7→ xn + yn ∈ Q,
: N 3 n 7→ xn · yn ∈ Q
oraz nierówność
x ¬ y :⇔ ∀ ∈ Q+ ∃N ∈ N ∀n ∈ N
n ­ N ⇒ xn − ¬ yn .
W zbiorze ciągów Cauchy’ego wprowadzamy relację równoważności
x ∼ y :⇔ ∀ ∈ Q+ ∃N ∈ N ∀n ∈ N
n ­ N ⇒ |xn − yn | < .
Zbór liczb rzeczywistych według Cauchy’ego definiujemy jako
R := { [x]∼ | x : N → Q ciąg Cauchy’ego. }
Liczbę wymierną q ∈ Q utożsamiamy z klasą równoważności ciągu stale równego q.
Część II
Granice
117
Rozdział 8
Liczby rzeczywiste i liczby zespolone
8.1
Ciało liczb rzeczywistych.
W części pierwszej, na gruncie teorii mnogości naszkicowaliśmy jak konstruuje się liczby rzeczywiste i dowodzi ich własności.
Rozpoczynając czytanie bezpośrednio od części drugiej możemy się oprzeć na następujących definicjach.
Definicja 8.1.1 Ciało liczbowe F to zbiór liczb z dwuargumentowymi działaniami + (dodawanie), · (mnożenie) i
wyróżnionymi liczbami 0 (zero) i 1 (jeden) taki, że
• dla dowolnego x ∈ F
x+0
=
x·1
x
= x
• dla dowolnego x ∈ F istnieje x0 ∈ F , zwyczajowo oznaczane −x, takie że
x + x0
=
0
• dla dowolnego x ∈ F \ {0} istnieje x00 ∈ F , zwyczajowo oznaczane
x · x00
=
1
x,
takie że
1
• dla dowolnych x, y ∈ F
x+y
= y+x
x·y
= y·x
• dla dowolnych x, y, z ∈ F
(x + y) + z
(x · y) · z
(x + y) · z
119
= x + (y + z)
= x · (y · z)
= x·z+y·z
120
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Definicja 8.1.2 Ciało liczbowe uporządkowane to ciało liczbowe F dodatkowo z dwuargumentową relacją > (większe)
takie, że
• dla dowolnych x, y ∈ F
x>0∧y >0
⇒
x·y >0
• dla dowolnych x, y, z ∈ F
x>y
⇒
x + z > y + z.
Piszemy x ­ y jako skrót x > y ∨ x = y. Dla wygody wprowadzamy też oznaczenie x ¬ y dla y ­ x oraz x < y dla
y > x. Mówimy, że b ∈ F jest majorantą zbioru X ⊂ F jeśli dla każdego x ∈ X mamy x ¬ b. Mówimy, że zbiór X ⊂ F jest
ograniczony od góry, jeśli ma majorantę. Mówimy, że a ∈ F jest kresem górnym zbioru X i piszemy a = sup X jeżeli a jest
majorantą zbioru X i zbiór ten nie posiada mniejszej majoranty.
Analogicznie definiujemy minorantę, zbiór ograniczony od dołu i kres dolny, który oznaczamy inf A.
Definicja 8.1.3 Ciało liczb rzeczywistych R to ciało liczbowe uporządkowane o tej własności, że każdy niepusty
ograniczony podzbiór x ⊂ R posiada kres górny.
8.1.1
Podzbiory R
Zbiór naturlanych N utożsamiamy ze zbiorem liczb postaci
n razy
z
}|
{
{ x ∈ R | x = 1 + 1 + . . . + 1 }.
Zbiór Z utożsamiamy ze zbiorem
{ x ∈ R | x ∈ N lub − x ∈ N }.
Zbiór Q utożsamiamy ze zbiorem
{ x ∈ R | ∃p ∈ Z ∃q ∈ N1 x = p · q −1 }.
Wprowadzamy oznaczenia
R+
:= { x ∈ R | x > 0 },
−
:= { x ∈ R | x < 0 },
∗
:= { x ∈ R | x ­ 0 }.
R
R
8.2
Liczby reprezentowalne
W pamięci komputera możemy reprezentować jedynie pewien skończony podzbiór zbioru liczb. Używane są różne podzbiory.
W przypadku liczb, na których operuje procesor są to pewne podzbiory zbioru liczb całkowitych oraz pewne podzbiory
zbioru liczb wymiernych, najczęściej liczby całkowite typu int oraz wymierne typu double.
Do reprezentacji liczb typu int używa się zazwyczaj 32 cyfr dwójkowych, czyli inaczej bitów (rys.8.1). Sama liczba
zapisana jest przy pomocy 31 bitów, a 32-gi bit używany jest do zapisania znaku. Pozwala to na zapisywanie liczb całkowitych
z zakresu −2147483648 do +2147483647.
8.2. LICZBY REPREZENTOWALNE
121
Rysunek 8.1: 32-bitowe słowo (4 bajty) używane do reprezentacji liczb typu int.
Rysunek 8.2: 64-bitowe słowo (8 bajtów) używane do reprezentacji liczb typu double.
Liczby typu double przechowywane są zazwyczaj na 64 bitach, z czego jeden bit reprezentuje znak s, 11 bitów cechę N ,
a pozostałe 52 mantysę m będącą ułamkiem o mianowniku 252 z przedziału [1, 2) (rys.8.2). Umożliwa to zapisywanie liczb
w postaci
x = sm2N ,
a także, przy pomocy specjalnego kodu, liczby zero. Wykorzystanie cechy i mantysy pozwala na przybliżanie liczb o bardzo
dużym zakresie, od bardzo małych, rzędu 10−323 , do bardzo dużych, rzędu 10308 , przy zachowaniu w miarę stałej dokładności,
wynoszącej około 15 cyfr znaczących.
Większość języków programowania zadowala się takim systemem liczb reprezentowalnych jaki jest dostępny na poziomie
procesora. Tak jest na przykład w języku C++. Takie podejście jest wystarczające do większości zastosowań. Jeśli jednak
z jakiegoś powodu zachodzi potrzeba stosowania większej dokładności w obliczeniach, zawsze można skorzystać z biblioteki
udostępniającej liczby reprezentowalne reprezentowane na dowolnej ilości bitów, ograniczonej nie wielkością słowa maszynowego ale jedynie całkowitą ilością wolnej pamięci. Jedyne co przy takim rozwiązaniu tracimy to czas obliczeń, który jest
istotnie wolniejszy niż w przypadku obliczeń wykonywanych na pojedynczych słowach maszynowych.
Specjalizowane programy do matematyki obliczeniowej, takie jak Mathematica mają tego typu biblioteki wbudowane.
Na przykład, aby pomnożyć przez siebie dwie liczby 25-cyfrowe wystarczy napisać
1234567890123456789012345∗1234567890123456789012345.
Natychmiast otrzymujemy wynik
1524157875323883675049533479957338669120562399025
Pisząc
2^200
otrzymujemy
1606938044258990275541962092341162602522202993782792835301376
Możliwa jest też zamiana ułamka na liczbę dziesiętną o dowolnie wysokiej dokładności. Na przykład pisząc
N[ 1 / 2 3 , 5 0 ]
otrzymujemy przybliżenie ułamka
1
23
0.043478260869565217391304347826086956521739130434783
122
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
z dokładnością do 50 cyfr.
Tam gdzie liczy się prędkość obliczeń (na przykład, gdy musimy policzyć nie jeden pierwiastek, ale miliony pierwiastków
jako część innego zadania) zamiast języków interpretowanych, takich jak Mathematica, używamy języków kompilowanych.
Współcześnie wszędzie tam, gdzie kluczowa jest szybkość obliczeń prym wiedzie język C++, choć na przykład fizycy preferują
jeszcze szybszy, ale nieco już sędziwy język Fortran. Najszybszy kod można uzyskać stosując bezpośrednio język maszynowy,
ale pisanie w nim programów jest wyjątkowo żmudne.
Listingi 8.1 i 8.2 prezentują nasz algorytm liczenia pierwiastka metodą brutalnej siły napisany w języku C++. Działa
on z dokładnością do 10−4 . Większej dokładności w oparciu o użyty w nim standardowy typ całkowitoliczbowy int nie da
się uzyskać, bo dla n >= 100000 wyrażnie p ∗ n ∗ n nie może być policzone poprawnie gdy reprezentowane jest jako typ int.
Odpowiednik programu z listingu 5.3 napisany w języku C++ przedstawono na listingu 8.3.
8.3
Funkcja potęgowa w R
n razy
}|
{
z
Dla n ∈ N przyjmujemy oznaczenie xn := x · x · · · · · x. Funkcję
R 3 x 7→ xn ∈ R
nazywamy funkcją potęgową.
Uwaga 8.3.1 Mamy następujące własności funkcji potęgowej w R
(i) ∀x ∈ R
(ii) ∀x ∈ R
x2 ­ 0,
x2 = 0 ⇔ x = 0,
(iii) ∀x, y, z ∈ R
x > 0, y < z ⇒ xy < xz,
(iv) ∀x, y, z ∈ R
x < 0, y < z ⇒ xy > xz,
(v) ∀x ∈ R
x > 0 ⇒ x−1 > 0.
Dowód: ćwiczenie.
Twierdzenie 8.3.2 Funkcja potęgowa na zbiorze R∗ jest silnie rosnąca, tzn.
∀n ∈ N1 ∀x, y ∈ R∗ :
0 ¬ x < y ⇒ xn < y n
Dowód: Dowód poprowadzimy indukcyjnie względem n. Dla n = 1 teza pokrywa się z założeniem, więc implikacja jest
oczywiście prawdziwa. Załóżmy zatem, że dla pewnego k ∈ N mamy
∀x, y ∈ R∗ x < y ⇒ xk < y k .
(8.1)
Chcemy pokazać, że
∀x, y ∈ R∗ x < y ⇒ xk+1 < y k+1 .
(8.2)
k
k
Rozważmy więc x, y ∈ R takie, że x < y. Z założenia indukcyjnego (8.1) wnosimy, że x < y . Stosując dwukrotnie własność
(ii) ciała uporządkowanego dostajemy
xk+1 = xk x < y k x < y k y = y k+1 .
Zatem xk+1 < y k+1 co dowodzi, że implikacja (8.2) zachodzi. Zatem na mocy zasady indukcji twierdzenie zostało udowodnione.
8.3. FUNKCJA POTĘGOWA W R
123
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ SqrtTwoBf . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗
Obliczanie przybliżenia pierwiastka z 2
∗/
/∗
metodą b r u t a l n e j s i ł y
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗/
/∗ Tu włączamy standardową b i b l i o t e k ę w e j ś c i a w y j ś c i a ∗/
#include <i o s t r e a m >
/∗ I podpinamy tak zwaną standardową p r z e s t r z e ń nazw .
Bez t e g o nazwy t a k i e j a k c o u t p o n i ż e j m u s i e l i b y ś m y
p i s a ć j a k o s t d : : c o u t ∗/
using namespace s t d ;
/∗ Właściwy p o c z ą t e k programu .
Program główny w C++ ma zawsze nazwę main .
Pomiędzy nawiasami ( i ) może być l i s t a ewentualnych
argumentów ( danych w e j ś c i o w y c h ) . W naszym przypadku
j e s t ona p u s t a . Słowo i n t p r z e d main o z n a c z a typ
z w r a c a n e j w a r t o ś c i , k t ó r y musi tu być , a l e nas
n i e i n t e r e s u j e . Sam program m i e ś c i s i ę pomiędzy
nawiasami { i }
∗/
i n t main ( ) {
/∗ Deklarujemy i i n i c j a l i z u j e m y t r z y zmienne typu i n t ∗/
i n t a =2,n=10000 , i=n ;
/∗ Jak długo s p e ł n i o n y j e s t warunek zwiększamy zmienną i .
Taka k o n s t r u k c j a nazywana j e s t p ę t l ą w h i l e .
W t e j p ę t l i wykonywana j e s t t y l k o j e d n a i n s t r u k c j a ,
z w i ę k s z e n i a z m i e n n e j i o j e d e n . Znak = n i e p e ł n i tu
r o l i porównania ( wtedy d o s t a l i b y ś m y s p r z e c z n o ś ć 0=1)
t y l k o p r z y p i s a n i a : z a w a r t o ś ć i z a s t ą p p r z e z i +1 ∗/
while ( i ∗ i<=a ∗n∗n ) i=i +1;
/∗ O s t a t n i a dobra w a r t o ś ć z m i e n n e j i
była m n i e j s z a o j e d e n . Poprawiamy
i=i −1;
∗/
/∗ Wyprowadzamy zmienną i , t e k s t " / " , zmienną n
o r a z znak nowej l i n i i na standardowe w y j ś c i e ∗/
c o u t << i << "/" << n << e n d l ;
/∗ Koniec programu ∗/
}
Listing 8.1: Obliczania pierwiastka metodą brutalnej siły w C++
124
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ S q r t B f P l u s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ U s p r a w n i e n i e programu SqrtTwoBf . cpp
∗/
/∗ Zamiast z a c z y n a ć d o b i e r a n i e w a r t o ś c i z m i e n n e j i ∗/
/∗ od 1 , zaczynamy od p o p r z e d n i e j z n a l e z i o n e j
∗/
/∗ w a r t o ś c i
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗/
#include <i o s t r e a m >
/∗ Włączenie dodatkowej b i b l i o t e k i z a w i e r a j ą c e j
m. i n . s e t p r e c i s i o n w y j a ś n i o n e d a l e j ∗/
#include <iomanip>
using namespace s t d ;
/∗ Podprogram o b l i c z a j ą c y p i e r w i a s t e k z l i c z b y a .
Przyjmuje on w a r t o ś ć j a k o argument typu d o u b l e .
Wartość zwracana j e s t t e ż typu d o u b l e ∗/
double S q r t B f P l u s ( double a ) {
/∗ Ustawiamy p r e c y z j ę na 14 c y f r ∗/
double p = 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 . 0 ;
/∗ Deklarujemy dwie zmienne l o k a l n e typu z m i e n n o p o z y c y j n e g o ∗/
double n=1 , i =1;
/∗ P ę t l ę przerwiemy i n s t r u k c j ą break p o n i ż e j ∗/
while ( true ) {
/∗ Dopóki kwadrat z i /n n i e p r z e k r a c z a a zwiększamy i ∗/
while ( i ∗ i<=a ∗n∗n ) i=i +1;
/∗ O s t a t n i e dobre i b y l o m n i e j s z e o j e d e n ∗/
i=i −1;
/∗ i /n j e s t naszym kolejnym p r z y b l i ż e n i e m p i e r w i a s t k a ∗/
c o u t << i /n << e n d l ;
/∗ Gdy o s i ą g n i e m y żądaną p r e c y z j ę , przerywamy p ę t l ę ∗/
i f ( n>=p ) break ;
/∗ Zwiększamy n o r a z i 10− k r o t n i e ∗/
n=n ∗ 1 0 ;
i=i ∗ 1 0 ;
/∗ Koniec bloku . Zawracamy i podejmujemy próbę
k o l e j n e g o p r z e j ś c i a i n s t r u k c j i w bloku .
Ponieważ n w każdym kolejnym p r z e j ś c i u
j e s t 10− k r o t n i e w i ę k s z e , n i e będziemy
t e g o na s z c z ę ś c i e r o b i ć w n i e s k o ń c z o n o ś ć . . . ∗/
}
/∗ Zwracamy wynik ∗/
return i /n ;
/∗ Koniec podprogramu ∗/
}
/∗ Program główny ∗/
i n t main ( ) {
/∗ Ustalamy d o k ł a d n o ś ć wyprowadzanych wyników na 15 c y f r ∗/
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
/∗ Deklarujemy j e d n ą zmienną typu d o u b l e ∗/
double a ;
/∗ Wyprowadzamy t e k s t na standardowe w y j ś c i e ∗/
c o u t << " Podaj liczbe naturalna : " ;
/∗ Wprowadzamy w a r t o ś ć z m i e n n e j a z k l a w i a t u r y ∗/
c i n >> a ;
/∗ Uruchamiamy podprogram ∗/
c o u t << " Pierwiastek z " << a << " wynosi " << S q r t B f P l u s ( a ) << "\n" ;
/∗ Koniec programu ∗/
}
Listing 8.2: Usprawnione podejście do obliczania pierwiastka w C++
8.3. FUNKCJA POTĘGOWA W R
125
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗ SqrtBfQuick . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗
Szybki sposób l i c z e n i a p i e r w i a s t k a
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗/
#include <i o s t r e a m >
#include <iomanip>
using namespace s t d ;
/∗ Podprogram o b l i c z a j ą c y w a r t o ś ć bezwzględną ∗/
double abs ( double x ) {
i f ( x>=0) return x ;
e l s e return −x ;
}
/∗ Podprogram o b l i c z a j ą c y p i e r w i a s t e k z l i c z b y a ∗/
double SqrtBfQuick ( double a ) {
double x=a ;
/∗ Dopóki w a r t o ś ć bezwzględna r ó ż n i c y kwadratu p r z e k r a c z a 10
w p o t ę d z e −15 z a p i s a n e w p o s t a c i w y k ł a d n i c z e j j a k o 1 e −15
∗/
while ( abs ( x∗x−a)>1e −15){
x=(x∗x+a ) / ( 2 ∗ x ) ;
c o u t << x << e n d l ;
}
return x ;
}
/∗ Po czątek głównego programu ∗/
i n t main ( ) {
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
double a ;
c o u t << " Podaj liczbe dodatnia : " ;
c i n >> a ;
c o u t << " Pierwiastek z " << a << " wynosi " << SqrtBfQuick ( a ) << "\n" ;
}
Listing 8.3: Szybkie wyznaczenie ciągu przybliżeń pierwiastka w C++.
126
8.3.1
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Nierówność Bernoullego
Poniższa nierówność przyda si˛e nam w dowodzie twierdzenia 8.9.2, o zbieżności ciagu
˛ o wyrazach 1 +
Jacob Bernoulli(rys. 8.9).
1 n
.
n
Jej autorem jest słynny matematyk szwajcarski
Twierdzenie 8.3.3
∀n ∈ N1 ∀x ∈ R :
x > −1 ⇒ (1 + x)n ­ 1 + nx
Dowód: (*) Dowód poprowadzimy indukcyjnie względem n. Dla n = 1 nierówność jest oczywista. Załóżmy, że zachodzi
ona dla pewnego k ∈ N i wszystkich x > −1. Ustalmy y > −1. Na mocy założenia
(1 + y)k ­ 1 + ky.
(8.3)
Ponieważ y + 1 > 0, więc mnożąc nierówność (8.3) obustronnie przez y + 1 dostajemy
(1 + y)k+1 ­ (1 + ky)(1 + y) = 1 + (k + 1)y + ky 2 ­ 1 + (k + 1)y,
co dowodzi, że teza zachodzi dla n = k + 1 i kończy dowód indukcyjny.
8.4
Wartość bezwzględna
Definicja 8.4.1 Dla x ∈ R definiujemy wartość bezwzględną x jako
(
x
gdy x ­ 0,
|x| :=
−x gdy x < 0.
Twierdzenie 8.4.2 Niech x, y, a ∈ R. Wtedy
|x| = | − x|,
|x| ­ 0,
−|x| ¬ x ¬ |x|,
|x| = 0 ⇔ x = 0,
|x| ¬ a ⇔ −a ¬ x ¬ a,
|x| ­ a ⇔ x ¬ −a lub x ­ a,
||x| − |y|| ¬ |x ± y| ¬ |x| + |y|,
√
x2 = |x|.
|xy| = |x||y|,
(8.4)
(8.5)
(8.6)
(8.7)
(8.8)
Dowód: Własności (8.4), (8.5), (8.6) i (8.8) są oczywiste gdy rozważy się oddzielnie przypadki x ­ 0 i x < 0. Aby
pokazać (8.7) najpierw udowodnimy, że dla dowolnych x, y ∈ R mamy
|x + y| ¬ |x| + |y|.
(8.9)
Z własności (8.4) mamy
−|x| ¬ x ¬ |x| i
− |y| ¬ y ¬ |y|.
Z własności ciała uporządkowanego mamy zatem
−(|x| + |y|) ¬ x + y ¬ |x| + |y|.
Zatem z (8.6) dostajemy (8.9). Ponieważ (8.9) zachodzi dla dowolnych x, y ∈ R, więc w szczególności możemy podstawić w
(8.9) x − y za x. W efekcie dostajemy
|x| = |(x − y) + y| ¬ |x − y| + |y|.
8.5. TWIERDZENIE O ISTNIENIU PIERWIASTKA.
127
Podobnie otrzymujemy
|y| ¬ |y − x| + |x|,
skąd wnosimy, że
|x| − |y| ¬ |x − y| i |y| − |x| ¬ |y − x| = |x − y|.
Zatem z (8.6) dostajemy
||x| − |y|| ¬ |x − y|,
a także
||x| − |y|| = ||x| − | − y|| ¬ |x − (−y)| = |x + y|,
co kończy dowód własności (8.7).
8.5
Twierdzenie o istnieniu pierwiastka.
Naszym celem√w tym rozdziale jest udowodnienie, że w zbiorze liczb rzeczywistych dodatnich pierwiaski istnieja.˛ W szczególności ostatecznie zamkniemy spraw˛e
sensowności 2. Nim jednak twierdzenie to udowodnimy potrzebujemy dwa pomocniczne twierdzenia: własność Archimedesa oraz g˛estość Q w R.
8.5.1
Własność Archimedesa
Twierdzenie 8.5.1 Ciało liczb rzeczywistych ma własność Archimedesa, tzn.
∀a, b ∈ R+ ∃n ∈ N
na > b.
Dowód: (*) Dowód poprowadzimy nie wprost. Załóżmy zatem, że istnieją liczby rzeczywiste dodatnie a, b takie, że dla
każdej liczby naturalnej n zachodzi na ¬ b. Oznacza to, że b jest majorantą zbioru
A := { x ∈ R | ∃n ∈ N x = na }.
Niech c := sup A będzie jego kresem gónym. Ponieważ c − a < c, więc c − a nie jest majorantą zbioru A. Zatem znajdziemy
n0 ∈ N takie, że n0 a > c − a. Ale wtedy (n0 + 1)a > c, a w konsekwencji c nie jest majorantą A, a tym bardziej kresem
górnym zbioru A. Otrzymana sprzeczność dowodzi twierdzenia.
Wniosek 8.5.2 Ciało liczb wymiernych ma wartość Archimedesa.
Dowód: ćwiczenie.
8.5.2
Gęstość zbioru w zbiorze
Definicja 8.5.3 Niech X będzie przestrzenią liniowo uporządkowaną, a A niech będzie podzbiorem X. Mówimy, że
A jest gęsty w X jeżeli
∀x, y ∈ X x < y ⇒ ∃z ∈ A x < z < y.
Gdy A = X, mówimy, że A jest gęsty w sobie.
Twierdzenie 8.5.4 Zbiór liczb wymiernych jest gęsty w zbiorze liczb rzeczywistych.
128
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Dowód: Niech x, y ∈ R będą takie, że x < y. Możliwe są trzy przypadki
x < 0 < y lub 0 ¬ x < y lub x < y ¬ 0.
W pierwszym przypadku teza jest oczywista, bo zero jest liczbą wymierną. Rozważmy drugi przypadek. Niech a := y −x > 0.
Z własności Archimedesa znajdziemy liczbę naturalną n taką, że na > 1. Wtedy n1 < a. Również z własności Archimedesa
wniosimy, że zbiór
A := { k ∈ N | k n1 > x }
jest niepusty. Niech m := min A. Wtedy m − 1 6∈ A. W szczególności
m−1
n
¬ x oraz
m
m−1
1
1
=
+ ¬ x + < x + a = y.
n
n
n
n
m
Zatem x < m
n < y, a ponieważ oczywiście n ∈ Q, teza w tym przypadku zachodzi. Pozostaje rozważyć trzeci przypadek.
Wtedy 0 ¬ −y < −x, zatem z rozważonego już przypadku znajdziemy z ∈ Q takie, że −y < z < −x. Ale wtedy x < −z < y
i oczywiście −z ∈ Q co kończy dowód twierdzenia.
8.5.3
Pierwiastki
Teraz możemy już udowodnić twierdzenie o istnieniu n-tego pierwiastka
Twierdzenie 8.5.5 (o istnieniu n-tego pierwiastka)
∀n ∈ N1 ∀x ∈ R∗ ∃!y ∈ R∗ :
yn = x
Dowód: (*) Pokażemy najpierw, że pierwiastek istnieje co najwyżej jeden. Dla dowodu nie wprost, przyjmijmy, że
istnieją y1 , y2 ∈ R∗ takie, że y1 6= y2 oraz y1n = y2n . Dla ustalenia uwagi możemy przyjąć, że y1 < y2 (dowód gdy y1 > y2 jest
analogiczny). Na mocy twierdzenia 8.3.2 mamy y1n < y2n co przeczy y1n = y2n i dowodzi jednoznaczności.
Dla dowodu istnienia zauważmy najpierw, że 0n = 0, zatem teza jest oczywista gdy x = 0. Możemy więc założyć, że
x > 0. Rozważmy zbiór
E := { u ∈ R∗ | un < x }.
Oczekujemy, że kres górny tego zbioru jest poszukiwanym pierwiastkiem. Musimy jednak najpierw pokazać, że E jest zbiorem niepustym i ograniczonym od
góry.
x
Pokażemy, że E 6= ∅. Niech t := x+1
. Mamy 0 < t < 1 oraz t < x. Mnożąc nierówności 0 < t < 1 obustronnie przez t > 0
dostajemy z własności ciała uporządkowanego dostajemy 0 < t2 < t. Ale t < 1, zatem 0 < t2 < 1. Rozumując indukcyjnie
stwierdzamy, że również 0 < tn−1 < 1. Mnożąc tę nierówność obustronnie przez t >) dostajemy tn < t. Zatem tn < x co
oznacza, że t ∈ E. Tak więc E 6= ∅. Pokażemy z kolei, że 1 + x jest majorantą zbioru E. Gdyby tak nie było, znaleźlibyśmy
s ∈ E, takie, że s > 1 + x. Wtedy sn > s > x. Zatem s 6∈ E. Otrzymana sprzeczność pokazuje, że 1 + x rzeczywiście jest
majorantą zbioru E, zatem E jest ograniczony od góry. Zatem ma kres górny.
Połóżmy y := sup E. Pokażemy, że rzeczywiście y n = x. Dla dowodu nie wprost załóżmy, że y n 6= x. Mamy do rozważenia
dwa przypadki: y n < x lub y n > x. Rozważmy najpierw przypadek y n < x.
Liczymy teraz, że da si˛e skonstruować y1 > y takie, że y1n < y , co przeczyłoby y = sup E . Naturalne jest poszukiwać y1 w postaci y1 = y + h.
Pytanie jak dobrać h? Mamy mieć (y + h)n < x co jest równoważne
(y + h)n − y n < x − y n .
Wiemy ze wzoru (7.6), że
(y + h)n − y n = h (y + h)n−1 + (y + h)n−2 y + · · · y n−1 < hn(y + h)n .
Zatem, dla h < 1 mamy
(y + h)n − y n < hn(y + 1)n .
(8.10)
8.6. ROZSZERZONY ZBIÓR LICZB RZECZYWISTYCH
129
Stad,
˛ by zagwarantować (8.10), wystarczy zapewnić, że
hn(y + 1)n < x − y n ,
a w tym celu wystarczy wziać
˛ h<
x−y n
n(y+1)n . Jesteśmy teraz gotowi, by ze zrozumieniem wrócić do formalnego dowodu.
Dobierzmy h ∈ Q takie, że
0 < h < min{1,
x − yn
}.
n(y + 1)n
Istnienie takiego h zapewnia nam gęstość Q w R (twierdzenie 8.5.4). Łatwo sprawdzamy, że wtedy
(y + h)n − y n < hn(y + 1)n < x − y n .
Zatem (y + h) < x, czyli y + h ∈ E. Ale y + h > y = supE, skąd y + h 6∈ E. Otrzymana sprzeczność wyklucza nierówność
y n < x.
Pozostaje pokazać, że nierówność y n > x też prowadzi do sprzeczności.
Tym razem liczymy, że uda si˛e skonstruować y2 < y ,
również b˛edace
˛ majoranta˛ zbioru E , co doprowadzi do sprzeczności z faktem, że y jako kres górny jest najmniejsza˛ majoranta.˛ Poszukujemy y2 w postaci y − k .
Chcemy mieć (y − k)n > x co jest równoważne postulatowi
y n − (y − k)n < y n − x
Rozpisujac
˛ podobnie jak poprzednio mamy
y n − (y − k)n = k y n−1 + y n−2 (y − k) + · · · + (y − k)n−1 < kny n−1 .
Podpowiada to jak dobrać k .
Dobierzmy k ∈ Q takie, że
0<k<
yn − x
.
ny n−1
Łatwo sprawdzamy, że przy tak dobranym k mamy (y − k)n > x. Twierdzimy, że y − k jest majorantą zbioru E. Gdyby tak
nie było, znaleźlibyśmy v ∈ E takie, że v > y − k. Ale wtedy v n > (v − k)n > x, co przeczy v ∈ E. Zatem y − k rzeczywiście
jest majorantą zbioru E. Ale y − k < y, skąd y nie jest najmniejszą majorantą E< zatem y 6= sup E. Otrzymana sprzeczność
dowodzi, że y n = x.
√
Nieujemną liczbę, której n-ta potęga jest równa liczbie x ­ 0 nazywamy n-tym pierwiastkiem z x i oznaczamy n x.
Twierdzenie 8.5.6
∀n ∈ N1 ∀x, y ∈ R∗ :
√
n
xy =
√
√
n
xny
Dowód: ćwiczenie.
W programie Mathematica pierwiastek kwadratowy z√x zapisujemy jako Sqrt[x]. Nie ma natomiast podobnej notacji
n
dla pierwiastków stopnia wyższego niż dwa. Aby policzyć
x piszemy x^(1/n).
Notacja ta bierze si˛e stad,
˛ że, jak wkrótce zobaczymy,
√
1
n
funkcj˛e pot˛egowa˛ można rozszerzyć na wykładniki rzeczywiste i wtedy x = x n .
8.6
8.6.1
Rozszerzony zbiór liczb rzeczywistych
R uzupełniony o −∞ i +∞
Aby brać kres górny lub dolny podzbioru R trzeba sprawdzać czy jest on ograniczony odpowiednio od góry lub dołu. Jest to niewygodnie, dlatego przydaje si˛e
zbiór liczb rzeczywistych rozszerzony o plus i minus nieskończoność. W takim rozszerzonym zbiorze każdy podzbiór ma kres górny lub dolny. Jest nim zwykła
liczba gdy zbiór jest ograniczony, a plus lub minus nieskończoność jeśli jest nieograniczony od góry lub nieograniczony od dołu.
130
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Definicja 8.6.1 Definiujemy rozszerzony zbiór liczb rzeczywistych jako
R̄ := R ∪ {−∞, ∞}.
Ponadto przyjmujemy, że dla każdego x ∈ R
− ∞ < x < ∞.
Uwaga 8.6.2 Każdy niepusty podzbiór R̄ posiada kresy.
Definicja 8.6.3 W R̄ definiujemy następujące działania:
(i) Dla x ∈ R
x + ∞ := ∞, x − ∞ := −∞,
x
∞
(ii) Dla x ∈ R+
x · ∞ := ∞, x · (−∞) := −∞.
(iii) Dla x ∈ R−
x · ∞ := −∞, x · (−∞) := ∞.
:=
x
−∞
:= 0.
(iv) Ponadto ∞ · ∞ := (−∞) · (−∞) := ∞, ∞ · (−∞) := (−∞) · ∞ := −∞.
(v) Oraz ∞ + ∞ := ∞, (−∞) + (−∞) := −∞.
Uwaga 8.6.4 Jeśli A ⊂ R̄ jest zbiorem niepustym, to A jest ograniczony od góry (od dołu) wtedy i tylko wtedy gdy
sup A < ∞ (inf A > −∞).
8.6.2
Kresy funkcji
Definicja 8.6.5 Niech X będzie zbiorem, A ⊂ X jego podzbiorem, a f : X → R̄ funkcją. Definiujemy kres górny
funkcji f na zbiorze A jako
sup f (x) := sup f (A) = sup { f (x) | x ∈ A }.
x∈A
Definiujemy kres dolny funkcji f na zbiorze A jako
inf f (x) := inf f (A) = inf { f (x) | x ∈ A }.
x∈A
Mówimy, że f jest ograniczona od góry (od dołu) na zbiorze A gdy f (A) jest ograniczony od góry (od dołu) co jest
równoważne warunkowi supx∈A f (x) < ∞ (inf x∈A f (x) > −∞).
8.6. ROZSZERZONY ZBIÓR LICZB RZECZYWISTYCH
131
Twierdzenie 8.6.6 Mamy następujące własności kresów funkcji:
(i) Niech f : X → R̄ będzie funkcją, a A ⊂ X. Wtedy
inf (−f (x))
= − sup f (x),
sup (−f (x))
= − inf f (x).
x∈A
x∈A
x∈A
x∈A
(ii) Niech fi : X → R̄ dla i ∈ {1, 2} będą funkcjami, a A ⊂ Xi . Wtedy
sup (f1 (x) + f2 (x))
¬
x∈A
sup f1 (x) + sup f2 (x),
x∈A
inf (f1 (x) + f2 (x))
x∈A
­
x∈A
inf f1 (x) + inf f2 (x).
x∈A
x∈A
Dowód: (*)Aby udowodnić własność (i) połóżmy a := supx∈A f (x) oraz b := inf x∈A (−f (x)). Wystarczy pokazać, że
−a ¬ b i −a ­ b. Niech x ∈ A. Wtedy z definicji kresu górnego f (x) ¬ a. Zatem −a ¬ −f (x) dla wszystkich elementów
x ∈ A. Zatem −a jest minorantą zbioru { −f (x) | x ∈ A }, skąd −a ¬ inf x∈A (−f (x)) = b. Potrzebujemy jeszcze pokazać,
że −a ­ b. Ustalmy ponownie x ∈ A. Z definicji kresu dolnego mamy b ¬ −f (x), skąd f (x) ¬ −b. Zatem −b jest majorantą
zbioru { f (x) | x ∈ A }, co oznacza, że −b ­ a, czyli −a ­ b. Dowodzi to pierwszej równości własności (i). Drugą dowodzi
się analogicznie.
Dla dowodu pierwszej nierówności własności (ii) połóżmy a1 := supx∈A f1 (x), a2 := supx∈A f2 (x) oraz ustalmy x ∈ A. Z
definicji kresu górnego mamy
f1 (x) ¬ a1 f2 (x) ¬ a2 .
Zatem
f1 (x) + f2 (x) ¬ a1 + a2 .
Ponieważ x ∈ A jest dowolnie ustalone, wnosimy, że a1 + a2 jest majorantą zbioru { f1 (x) + f2 (x) | x ∈ A }. Ponieważ
supx∈A (f1 (x) + f2 (x)) jest najmniejszą majorantą tego zbioru, dostajemy
sup (f1 (x) + f2 (x)) ¬ a1 + a2 ,
x∈A
co dowodzi pierwszej nierówności we własności (ii). Drugą nierówność dowodzi się analogicznie.
W podobny sposób dowodzi się następujących twierdzeń.
Twierdzenie 8.6.7 Niech f : X1 × X2 → R̄ będzie funkcją, a Ai ⊂ Xi dla i ∈ {1, 2}. Wtedy
f (x1 , x2 ) = sup
sup f (x1 , x2 ) ,
sup
x1 ∈A1
(x1 ,x2 )∈A1 ×A2
x2 ∈A2
inf
(x1 ,x2 )∈A1 ×A2
f (x1 , x2 )
=
inf
x1 ∈A1
inf f (x1 , x2 ) .
x2 ∈A2
Twierdzenie 8.6.8 Niech fi : Xi → R̄ oraz Ai ⊂ Xi dla i ∈ {1, 2}. Jeśli inf xi ∈Ai fi (xi ) > −∞ oraz supxi ∈Ai fi (xi ) <
∞ to
sup
(f1 (x1 ) + f2 (x2 ))
=
inf
(x1 ,x2 )∈A1 ×A2
sup f1 (x1 ) + sup f2 (x2 ),
x1 ∈A1
(x1 ,x2 )∈A1 ×A2
(f1 (x1 ) + f2 (x2 ))
=
x2 ∈A2
inf f1 (x1 ) + inf f2 (x2 ).
x1 ∈A1
x2 ∈A2
132
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Twierdzenie 8.6.9 Niech f : X → R̄ będzie funkcją, A ⊂ X, a c ∈ R. Wtedy
sup (f (x) + c)
=
x∈A
inf (f (x) + c)
x∈A
8.7
8.7.1
sup f (x) + c,
x∈A
=
inf f (x) + c.
x∈A
Ciało liczb zespolonych
Liczby zespolone
Chcemy rozszerzyć ciało liczb rzeczywistych tak, by pozostało ciałem, ale była w nim liczba i o własności i2 = −1. Widać, że jeśli ma to być ciało to musi w nim
też być liczba a + bi dla dowolnych rzeczywistych a, b. Jednak suma i iloczyn liczb tej postaci nie wymaga już dalszego rozszerzania, bo
(a + bi) + (c + di)
=
(a + c) + (b + d)i,
(a + bi)(c + di)
=
ac + adi + bci + bdi2 = (ac − bd) + (ad + bc)i.
Niestety nie ma szans, by ciało to było uporzadkowane,
˛
bo wtedy albo i > 0, albo −i > 0, co na mocy własności ciała uporzadkowanego
˛
prowadzi do i2 > 0
2
sprzecznego z i = −1.
Pozostaje jednak pytanie, czy sam pomysł liczby i jako elementu ciała rozszerzajacego
˛
ciało liczb rzeczywistych też nie prowadzi do jakiejś sprzeczności,
której jeszcze nie widzimy. Aby przekonać si˛e, że tak nie jest, trzeba zbudować formalny model liczb zespolonych.
8.7.2
Ciało C
W C := R2 wprowadzamy działania
(a, b) + (c, d)
:=
(a + c, b + d),
(a, b)(c, d)
:=
(ac − bd, ad + bc).
Twierdzenie 8.7.1 Zbiór C := R2 z tak określonymi działaniami oraz parami (0, 0) i (1, 0) jako elementami neutralnymi odpowiednio dla dodawania i mnożenia jest ciałem.
Definicja 8.7.2 Ciało to nazywamy ciałem liczb zespolonych.
Dla dowolnych a, b ∈ R mamy (a, 0) + (b, 0) = (a + b, 0) oraz (a, 0)(b, 0) = (ab, 0), zatem parę (a, 0) możemy utożsamiać
z liczbą rzeczywistą a.
Zwyczajowo kładziemy i := (0, 1). Jest to tak zwana jednostka urojona. Łatwo sprawdzamy, że i2 = (−1, 0) = −1 oraz
(a, b) = (a, 0) + (b, 0)i = a + bi.
√
Dla liczby zespolonej z := a + bi definiujemy jej moduł |z| := a2 + b2 oraz jej sprzężenie z̄ := a − bi.
Dla liczby zespolonej z = a+bi liczby a, b ∈ R nazywamy odpowiednio częścią rzeczywistą i częścią urojoną z i oznaczamy
re z i im z.
W programie Mathematica jednostkę urojoną i oznaczamy I, a liczbę zespoloną a + bi zapisujemy jako a + b I.
Interpretacja geometryczna liczby zespolonej przedstawiona jest na rys. 8.3, interpretacja sumy na rys. 8.4, a interpretacja
iloczynu liczby zespolonej przez liczbę i na rys. 8.5.
8.7. CIAŁO LICZB ZESPOLONYCH
Rysunek 8.3: Interpretacja geometryczna liczby zespolonej z := a + bi, jej modułu oraz sprzężenia.
Rysunek 8.4: Interpretacja geometryczna sumy liczb zespolonych.
Rysunek 8.5: Interpretacja geometryczna iloczynu liczby zespolonej przez liczbę i.
133
134
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
8.7.3
Zespolona funkcja kwadratowa
Wiemy ze szkoły, że miejsca zerowe funkcji kwadratowej
x 7→ ax2 + bx + c
zależa˛ od tzw. wyróżnika ∆ := b2 −4ac, w szczególności miejsc zerowych nie ma, gdy wyróżnik jest ujemny. Sytuacja ulega zmianie, gdy w funkcji tej dopuścimy
argument zespolony.
Twierdzenie 8.7.3 Rozważmy zespoloną funkcją kwadratową o współczynnikach rzeczywistych tj. funkcję
Q : C 3 z 7→ az 2 + bz + c ∈ C,
gdzie a, b, c ∈ R są zadanymi współczynnikami rzeczywistymi. Niech ∆ := b2 − 4ac. Jeśli ∆ > 0, to Q ma dwa
rzeczywiste miejsca zerowe
√
−b ± ∆
.
z1,2 :=
2a
Gdy ∆ = 0 funkcja Q ma jeden pierwiatek rzeczywisty
z :=
−b
.
2a
Natomiast dla ∆ < 0 mamy dwa zespolone, wzajemnie sprzężone miejsca zerowe
√
−b ± i −∆
z1,2 :=
.
2a
8.7.4
Liczby zespolone o module jeden.
Półprosta poprowadzona z poczatku
˛ układu współrz˛ednych pod katem
˛
ϕ do osi X przecina okrag
˛ jednostkowy
S1 := { z ∈ C | |z| = 1 }
(rys. 8.6) w punkcie o współrz˛ednych
zϕ (cos ϕ, sin ϕ) ∈ C.
Wykorzystujac
˛ tożsamości trygonometryczne dla sumy katów
˛ można pokazać, że
zϕ+ψ
=
cos(ϕ + ψ) + i sin(ϕ + ψ)
=
(cos ϕ cos ψ − sin ϕ sin ψ) + i(sin ϕ cos ψ + cos ϕ sin ψ)
=
(cos ϕ + i sin ϕ)(cos ψ + i sin ψ)
=
zϕ zψ .
To przypomina fundamentalna˛ własność funkcji wykładniczej. Matematyk szwajcarski Leonard Euler pokazał, że rzeczywista˛ funkcj˛e wykładnicza˛ można
rozszerzyć na argumenty zespolone
ez :=
∞
X
zn
n!
n=0
i przy takiej definicji dla x ∈ R zachodzi słynny wzór o nawijaniu prostej na okrag
˛
8.8. GRANICE CIĄGÓW W R
135
Rysunek 8.6: Liczby zespolone o module jeden.
eix = cos x + i sin x,
który jest wygodna˛ podstawa˛ tak formalnej definicji jak i własności funkcji trygonometrycznych. Aby pójść ta˛ droga˛ potrzebujemy rozszerzyć poj˛ecie granicy
ciagu
˛ i zbieżności szeregu na liczby zespolone.
8.7.5
Odległość w R i C.
Wyst˛epujaca
˛ w definicji Cauchy’ego granicy ciagu
˛ wartość bezwzgl˛edna |a − b| dla a, b ∈ R może być interpretowana jako odległość pomi˛edzy liczbami a i b.
Uogólniajac
˛ poj˛ecie odległości możemy si˛e pokusić o uogólnienie poj˛ecia granicy.
Moduł liczby zespolonej pod wieloma względami przypomina wartość bezwzględną:
Twierdzenie 8.7.4 Moduł liczby zespolonej ma następujące własności
(i)
∀z ∈ C
|z| = 0 ⇔ z = 0,
(ii)
∀z1 , z2 ∈ C
|z1 z2 | = |z1 ||z2 |,
(iii)
∀z1 , z2 ∈ C
|z1 + z2 | ¬ |z1 | + |z2 |.
Dlatego |z1 − z2 | można interpretować jako odległość pomi˛edzy liczbami zespolonymi z1 i z2 .
Zilustrowano to na rys. 8.7
8.8
Granice ciągów w R
W rozdziale 1.2
˛ jako narz˛edzie do przybliżania liczb, które nie sa˛ liczbami wymiernymi i analizowaliśmy prosty algorytm pozwalajacy
˛ przy√ przedstawiliśmy ciagi
bliżać liczb˛e 2. Przedstawiliśmy też ide˛e granicy ciagu
˛ jako liczby, która˛ ciag
˛ przybliża. Teraz przyjrzymy si˛e temu poj˛eciu dokładniej, ale zaczniemy od dwóch
dodatkowych eksperymentów numerycznych.
8.8.1
Eksperymenty numeryczne
Listing 8.4 prezentuje program w j˛ezyku Mathematica obliczajacy
˛ wyrazy ciagu
˛ (1.2) rozważanego w rozdziale 1.2.5 jako narz˛edzie do przybliżania liczby π . Jego
odpowiednik w j˛ezyku C++ przedstawiono na listingu 8.5.
136
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Rysunek 8.7: Odległość liczb zespolonych z1 i z2 .
( ∗ P r z y b l i ż a n i e l i c z b y p i obwodem wpisanych w i e l o k ą t ó w ∗ )
P i B y C i rcumference [ d_ ] :=
Module [ { a , m, n , A} ,
( ∗ Zaczynamy od wpisanego kwadratu .
Jego bok a wynosi p ó ł p i e r w i s t k a z dwóch .
Do p o l i c z e n i a
p i e r w i a s t k a wykorzystujemy f u n k c j ę wbudowaną S q r t ∗ )
a = Sqrt [ 2 . ] / 2 ;
m = 4 ; ( ∗ I l o ś c boków w i e l o k ą t a , na p o c z ą t e k c z t e r y ∗ )
n = 1;
( ∗ Numer k o l e j n e g o wyrazu c i ą g u , na p o c z ą t e k j e d e n ∗ )
Do[ ( ∗ Początek p ę t l i Do∗ )
A=m∗ a ;
( ∗ Obliczamy d ł u g o ś ć obwodu ∗ )
( ∗ Domyślnie d l a l i c z b maszynowych Mathematica w y p i s u j e t y l k o 6 c y f r .
NumberForm pozwala wydobyć w i ę c e j c y f r ∗ )
Print [ n , " " , NumberForm[ A, 1 6 ] ] ;
( ∗ Wydruk k o n t r o l n y . ∗ )
n = n + 1;
( ∗ K o l e j n y wyraz c i ą g u ∗ )
m = m∗ 2 ; ( ∗ K o l e j n y w i e l o b o k b ę d z i e miał dwa r a z y w i ę c e j boków ∗ )
a = Sqrt [ 2 − Sqrt [ 4 − 4∗ a ∗ a ] ] / 2 , ( ∗ o t a k i e j d ł u g o ś c i ∗ )
{d} ( ∗ I l o ś ć powtórzeń p ę t l i Do ∗ )
] ; ( ∗ Koniec p ę t l i Do∗ )
a ∗m
]
Listing 8.4: Wyznaczenie ciągu przybliżeń liczby π w języku Mathematica w oparciu o obwody wielokątów
8.8. GRANICE CIĄGÓW W R
137
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ PiByCircumference . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z obwody
∗/
/∗ w i e l o k ą t ó w foremnych wpisanych w okrąg o ś r e d n i c y j e d e n ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <iomanip>
/∗ B i b l i o t e k a matematyczna , z a w i e r a standardowe i m p l e m e n t a c j e
w i e l u matematycznych , f u n k c j i . My sk orzys tamy p o n i ż e j
z f u n k c j i s q r t l i c z ą c e j p i e r w i a s t e k kwadratowy ∗/
#include <cmath>
using namespace s t d ;
i n t main ( ) {
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
c o u t << f i x e d << r i g h t ;
/∗ Zaczynamy od wpisanego kwadratu , k t ó r e g o
bok a wynosi p ó ł p i e r w i a s t k a z 2 . Do p o l i c z e n i a
p i e r w i a s t k a wykorzystujemy b i b l i o t e c z n y
podprogram s q r t ∗/
double a=s q r t ( 2 . 0 ) / 2 ;
/∗ I l o ś c boków w i e l o k ą t a , na p o c z ą t e k c z t e r y ∗/
i n t m=4;
/∗ Numer k o l e j n e g o wyrazu c i ą g u , i l o ś ć wyrazów do p o l i c z e n i a ∗/
i n t n=1 ,nmax=40;
/∗ Dla w s z y s t k i c h n od 1 do nmax ∗/
while ( n<nmax ) {
/∗ Obliczamy d ł u g o ś ć obwodu ∗/
double A=m∗ a ;
c o u t << "
A[" << setw ( 2 ) << n << "] =" ;
c o u t << setw ( 1 8 ) << A << e n d l ;
/∗ K o l e j n y w i e l o k ą t b ę d z i e miał dwa r a z y w i ę c e j boków ∗/
m=m∗ 2 ;
/∗ A t y l e w y n i e s i e d ł u g o ś ć j e g o boku ∗/
a=s q r t (2− s q r t (4−4∗ a ∗ a ) ) / 2 ;
/∗ K o l e j n y wyraz c i ą g u ∗/
n=n+1;
}
}
Listing 8.5: Wyznaczenie ciągu przybliżeń liczby π w C++ w oparciu o obwody wielokątów
138
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Uruchamiajac
˛ program w C++ z listingu 8.5 otrzymujemy nast˛epujacy
˛ ciag
˛ liczb (moga˛ wyst˛epować drobne różnice dla różnych platform), z których pierwszych
czternaście to:
A1
=
2.828427124746190
A2
=
3.061467458920719
A3
=
3.121445152258053
A4
=
3.136548490545940
A5
=
3.140331156954754
A6
=
3.141277250932759
A7
=
3.141513801144285
A8
=
3.141572940367515
A9
=
3.141587725275636
A10
=
3.141591421514008
A11
=
3.141592345563526
A12
=
3.141592576625775
A13
=
3.141592634298169
A14
=
3.141592650272843
Do tego miejsca ciag
˛ ten zachowuje si˛e bardzo przyzwoicie, a jego kolejne wyrazy rosna.˛ Jednak dalsze wyrazy pokazuja,˛ że nie do końca spełnia on nasze
oczekiwania.
A15
=
3.141592648934190
A16
=
3.141592684156058
A17
=
3.141592607672169
A18
=
3.141592910939673
A19
=
3.141591696683685
A20
=
3.141596553704820
A21
=
3.141596553704820
A22
=
3.141518840465548
A23
=
3.141207968282266
A24
=
3.142451272494134
A25
=
3.142451272494134
A26
=
3.162277660168380
A27
=
3.162277660168380
A28
=
2.828427124746190
A29
=
0.000000000000000
Poczynajac
˛ od wyrazu A15 ciag
˛ przestaje być rosnacy
˛ i zamiast przybliżać, zaczyna oddalać si˛e od π , a wyraz A29 wynosi wr˛ecz zero! I w tym przypadku
przyczyna˛ ograniczeń algorytmu jest skończona arytmetyka komputera. Efekt obliczeń z precyzja˛ maszynowa˛ w środowisku Mathematica jest analogiczny.
Wartość liczby π z dokładnościa˛ do 15-tu miejsc dziesi˛etnych wynosi
π = 3.141592653589793 . . . .
8.8. GRANICE CIĄGÓW W R
139
Zatem przy zastosowaniu 64-bitowego typu double przedstawiona metoda pozwala policzyć π z dokładnościa˛ do około 8 cyfr znaczacych.
˛
Warto podkreślić, że sama obserwacja numeryczna zachowania tego ciagu
˛ może prowadzić do bł˛ednego wniosku iż ciag
˛ ten jest zbieżny do zera. Aby mieć
praktyczny pożytek z ciagu
˛ jako narz˛edzia do przybliżania liczb, musimy umieć od strony teoretycznej przeanalizować jego zachowanie.
Mathematica radzi sobie łatwo z wyliczeniem π z duża˛ dokładnościa,˛ ale wymaga to obliczeń wysokiej precyzji, znacznie kosztowniejszych od obliczeń z
precyzja˛ maszynowa.˛ Na przykład piszac
˛
N [ Pi , 1 0 0 0 ]
otrzymujemy
3.14159265358979323846264338327950288419716939937510582097494459230781\
6406286208998628034825342117067982148086513282306647093844609550582231\
7253594081284811174502841027019385211055596446229489549303819644288109\
7566593344612847564823378678316527120190914564856692346034861045432664\
8213393607260249141273724587006606315588174881520920962829254091715364\
3678925903600113305305488204665213841469519415116094330572703657595919\
5309218611738193261179310511854807446237996274956735188575272489122793\
8183011949129833673362440656643086021394946395224737190702179860943702\
7705392171762931767523846748184676694051320005681271452635608277857713\
4275778960917363717872146844090122495343014654958537105079227968925892\
3542019956112129021960864034418159813629774771309960518707211349999998\
3729780499510597317328160963185950244594553469083026425223082533446850\
3526193118817101000313783875288658753320838142061717766914730359825349\
0428755468731159562863882353787593751957781857780532171226806613001927\
876611195909216420199
jako przybliżenie liczby π z dokładnościa˛ do 1000 cyfr.
Ćwiczenie komputerowe 8.8.1 Zmodyfikuj program z listingu 8.5 tak by przybliżał π wykorzystujac
˛ 2n -katy
˛ foremne opisane na okr˛egu (patrz
cw. 1.2.7). Wykorzystaj ten program do prześledzenia zachowania tego ciagu
˛ przybliżeń.
8.8.2
Granice pozorne
W poprzednim podrozdziale zaobserwowaliśmy, że wyciaganie
˛
wniosków na temat granicy ciagu
˛ z samego numerycznego eksperymentu może być niebezpieczne.
Okazuje si˛e, że ciag
˛ może robić wrażenie zbieżnego, a mimo wszystko zbieżnym nie być. Rozważmy ciag
˛ dany wzorem rekurencyjnym
x0
x1
=
=
136.462554878752
5.39650717129623
(8.11)
(8.12)
xn
=
0.3x0 + 1 − 1.4x21
(8.13)
Program w j˛ezyku Mathematica wyznaczajacy
˛ wyrazy tego ciagu
˛ przedstawiony jest na listingu 8.6. Wersja w C++ jest na listingu 8.7.
Przejrzenie pierwszych 15-tu wyrazów tego ciagu
˛ może robić wrażenie, że ciag
˛ ten jest zbieżny do granicy wynoszacej
˛ około 0.63135. Przejrzenie 50-ciu
wyrazów zaciera to pierwsze wrażenie. Jednakże, po doświadczeniach z ciagiem przybliżajacym
˛
π możemy być skłonni podejrzewać, że przyczyna˛ niestabilnego
zachowania dalszych wyrazów tego ciagu
˛ znów jest skończona arytmetyka komputera. Okazuje si˛e jednak, że obserwowana numerycznie zbieżność tego ciagu
˛
jest pozorna. Wykres pierwszych 100 wyrazów tego ciagu
˛ przedstawiono na rys. 8.8. Przykłady tego typu zaobserwowane zostały przez matematyków po raz
pierwszy dopiero w XX wieku. Rozważany przez nas przykład wywodzi si˛e z tzw. odwzorowania Hénona.
8.8.3
Definicja Cauchy’ego granicy ciągu
Niech x : N → R będzie ciągiem liczb rzeczywistych.
140
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
( ∗ Przykład z c i ą g i e m p o z o r n i e zbieżnym , zadanym r e k u r e n c y j n i e ∗ )
Henon [ n_ ] := Module [ { a , b , x0 , x1 , x2 , k } ,
a = 1 . 4 ; b = 0 . 3 ; ( ∗ Pomocnicze parametry a i b ∗ )
k = 0 ; ( ∗ L i c z n i k wyrazów c i ą g u ∗ )
( ∗ Dwa początkowe wyrazy c i ą g u ∗ )
x0 = 1 3 6 . 4 6 2 5 5 4 8 7 8 7 5 2 ;
x1 = 5 . 3 9 6 5 0 7 1 7 1 2 9 6 2 3 ;
Do[ k = k + 1 ;
( ∗ K o l e j n y wyraz c i ą g u wyliczamy w o p a r c i u o dwa p o p r z e d n i e ∗ )
x2 = b∗ x0 + 1 − a ∗ x1 ∗ x1 ;
( ∗ Nowe w a r t o ś c i dwóch p o r z e d n i c h wyrazów c i ą g u ∗ )
x0 = x1 ;
x1 = x2 ;
Print [ { k , NumberForm[ x2 , 1 6 ] } ] ,
{n}
];
]
Listing 8.6: Przykład ciągu pozornie zbieżnego w języku Mathematica.
Rysunek 8.8: Wykres pierwszych 100 wyrazów ciągu danego wzorami (8.11)-(8.13)
8.8. GRANICE CIĄGÓW W R
141
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ Henon . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ Przykład z zadanym r e k u r e n c y j n i e c i ą g i e m , p o z o r n i e zbieżnym . ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
/∗ Dla w i ę k s z e j c z y t e l n o ś c i wyników narzucamy s t a ł o p o z y c y j n y ,
wyrównywany w prawo z a p i s l i c z b ∗/
c o u t << f i x e d << r i g h t ;
/∗ Pomocnicze parametry a i b ∗/
double a =1.4 , b = 0 . 3 ;
/∗ Dwa początkowe wyrazy c i ą g u ∗/
double x0 = 1 3 6 . 4 6 2 5 5 4 8 7 8 7 5 2 ;
double x1 = 5 . 3 9 6 5 0 7 1 7 1 2 9 6 2 3 ;
/∗ I l o ś ć wyrazów c i ą g u do p o l i c z e n i a ∗/
i n t nmax=15;
/∗ Inna forma p ę t l i . I n s t r u k c j e w bloku { . . . } wykonujemy d l a w a r t o ś c i n
od j e d e n do nmax z w i ę k s z a j ą c n za każdym razem o j e d e n ∗/
f o r ( i n t n=1;n<=nmax ; n=n+1){
/∗ K o l e j n y wyraz c i ą g u wyliczamy w o p a r c i u o dwa p o p r z e d n i e ∗/
double x2=b∗ x0+1−a ∗ x1 ∗ x1 ;
/∗ Wyprowadzamy w y n i k i na standardowe w y j ś c i e . setw ( p ) u s t a l a i l o ś ć p ó l
d l a wyprowadzanej k o l e j n e j z m i e n n e j . Pozwala t o na l e p s z e
f o r m a t o w a n i e wypisywanych danych ∗/
c o u t << "x[" << setw ( 2 ) << n << " ]= " ;
c o u t << setw ( 2 0 ) << x0 << e n d l ;
/∗ Nowe w a r t o ś c i dwóch p o r z e d n i c h wyrazów c i ą g u ∗/
x0=x1 ;
x1=x2 ;
}
}
Listing 8.7: Przykład ciągu pozornie zbieżnego w C++.
142
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Definicja 8.8.2 Mówimy, że ciąg x jest zbieżny do granicy g ∈ R jeżeli
∀ > 0∃N ∈ N∀n > N
|xn − g| < .
Piszemy wtedy
lim xn = g.
n→∞
Mówimy, że ciąg x jest zbieżny, jeżeli istnieje g ∈ R takie, że x jest zbieżny do g.
Twierdzenie 8.8.3 Niech p ∈ N1 . Wtedy
lim
n→∞
1
= 0.
np
Dowód:
1
Niech ∈ R+ . Weźmy n ∈ N takie, że N > √
Niech n będzie większe od N . Wtedy n >
p
1
1
p
potęgowej n > i w konsekwencji np < . Zatem dla n > N mamy
|
1
√
p
i z monotoniczności funkcji
1
1
− 0| = p < .
p
n
n
Mówimy, że ciąg a : N → R jest ograniczony, jeśli istnieje M ∈ R takie, że |an | ¬ M dla wszystkich n ∈ N.
Twierdzenie 8.8.4 Ciąg zbieżny w R jest ograniczony.
Dowód:
Niech a∗ := limn→∞ an . Dla = 1 znajdziemy N ∈ N takie, że dla n > N mamy |an − a∗ | < 1. Zatem dla takich n jest
|an | = |an − a∗ + a∗ | ¬ |an − a∗ | + |a∗ | < 1 + |a∗ |.
W zbiorze skończonym { |an | | n ∈ N i n ¬ N } jest element największy. Oznaczmy go M0 i weźmy
M := max(1 + |a∗ |, M0 ).
Wtedy dla wszystkich n ∈ N mamy an ¬ M .
8.8.4
Granica ciągu, a struktura ciała w R
Niech a, b : N → R będą ciągami liczb rzeczywistych. Niech ∈ { +, −, · } będzie operatorem dodawania, odejmowania lub
mnożenia w R. Definiujemy nowy ciąg
a b : N 3 n 7→ an bn ∈ R.
Twierdzenie 8.8.5
(i)
Jeśli ciągi a, b są zbieżne to ciąg a b jest zbieżny oraz
lim (an bn ) = lim an lim bn .
n→∞
(ii)
n→∞
n→∞
Jeśli ciągi a, b są zbieżne i limn→∞ bn 6= 0 to ciąg a / b jest zbieżny oraz
lim
n→∞
an
limn→∞ an
=
.
bn
limn→∞ bn
8.8. GRANICE CIĄGÓW W R
143
Dowód:
Niech limn→∞ an = a∗ i limn→∞ bn = b∗ Przedstawimy dowód dla przypadku gdy jest iloczynem. Pozostałe dowody
są albo łatwiejsze (suma, różnica), albo wyglądają podobnie (iloraz).
Naszym celem jest oszacowanie różnicy
|an bn − a∗ b∗ |
dla dużych n, przy wykorzystaniu oszacowań na różnice |an − a∗ | i |bn − b∗ |, które możemy uzyskać ze zbieżności ciagów
˛
a i b. Sztuczka˛ powszechnie
stosowana˛ przy takich oszacowaniach jest dodanie i odj˛ecie wyrazu pomocniczego i skorzystanie z własności wartości bezwzgl˛ednej.
|an bn − a∗ b∗ | = |an bn − a∗ bn + a∗ bn − a∗ b∗ | = |(an − a∗ )bn + a∗ (bn − b∗ )| ¬ |an − a∗ ||bn | + |a∗ ||bn − b∗ |
˛ ac
˛ nierówność
Aby suma dwóch ostatnich składników była mniejsza od wystarczy, by każdy z nich był mniejszy od 2 . Rozwiazuj
|a∗ ||bn − b∗ | <
,
2
˛ b do stałej 2|a ∗ | . Wyjatkiem
˛
jest |a∗ | = 0,
widzimy, że wystarczy, by |bn − b∗ | < 2|a ∗ | , a to mamy zagwarantowane dla n > N1 dobranego dla ciagu
bo wtedy nie można dzielić przez |a∗ |, ale z tym nie ma problemu, bo przy |a∗ | = 0 lewa strona nierówności jest zero, wi˛ec nierówność jest spełniona dla
wszystkich n.
Troch˛e bardziej kłopotliwy jest przypadek nierówności
|an − a∗ ||bn | <
,
2
bo tu n wyst˛epuje w dwóch miejscach. Jednak wiemy, że ciag
˛ zbieżny jest ograniczony, wi˛ec możemy znaleźć stała˛ M > 0 taka,˛ że |bn | < M dla wszystkich
n. Zatem wystarczy, by
|an − a∗ | <
,
2M
a to mamy zagwarantowane dla n > N2 dobranego dla ciagu
˛ a do stałej 2M
.
Aby uniknać
˛ oddzielnego rozważania przypadku a∗ = 0 wystarczy zauważyć, że |a∗ | < |a∗ | + 1, a |a∗ | + 1 6= 0, wi˛ec można od razu dobrać N1 tak,
by |bn − b∗ | < 2(|a∗|+1) .
Weźmy ustalone > 0. Niech M będzie takie, że |bn | < M dla wszystkich n ∈ N. Niech N1 ∈ N oraz N2 ∈ N będą takie,
że
,
n > N1 ⇒ |bn − b∗ | <
2(|a∗ | + 1)
n > N2 ⇒ |an − a∗ | <
.
2M
Niech N := max{N1 , N2 }. Ustalmy n > N . Wtedy
|an bn − a∗ b∗ | ¬ |an − a∗ ||bn | + |a∗ ||bn − b∗ | ¬ |an − a∗ |M + (|a∗ | + 1)|bn − b∗ | <
M + (|a∗ | + 1)
= ,
2M
2(|a∗ | + 1)
co dowodzi, że
lim an bn = a∗ b∗ .
n→∞
8.8.5
Granica ciągu, a struktura porządkowa w R
Niech a, b, c : N → R będą ciągami liczb rzeczywistych.
Twierdzenie 8.8.6 Jeśli istnieje N ∈ N takie że dla wszystkich n > N ciągi an , bn , cn spełniają nierówność
an ¬ bn ¬ cn
i ciągi an oraz cn są zbieżne do granicy g, to ciąg bn też jest zbieżny do granicy g.
144
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Dowód:
Ustalmy > 0. Ze zbieżności ciągów a i c do g wynika, że możemy dobrać stałą N > 0 tak, by dla n > N zachodziły
nierówności
|an − g| < ,
|cn − g| < .
Oznacza to, że dla n ∈ N zachodzi
− < an − g < ,
− < cn − g < .
Zatem mamy dla n > N
− < an − g ¬ bn − g ¬ cn − g < ,
co oznacza, że dla takich n
|bn − g| < i dowodzi, że
lim bn = g.
n→∞
Twierdzenie 8.8.7 Niech a : N → R będzie ciągiem liczb rzeczywistych.
(i)
Jeśli a jest ciągiem rosnącym i ograniczonym od góry, to ciąg ten jest zbieżny oraz
lim an = sup { an | n ∈ N }.
n→∞
(ii)
Jeśli a jest ciągiem malejącym i ograniczonym od dołu, to ciąg ten jest zbieżny oraz
lim an = inf { an | n ∈ N }.
n→∞
Dowód:
Udowodnimy własność (i). Drugą własność dowodzi się analogicznie. Oznaczmy
a∗ := sup { an | n ∈ N }.
Ustalmy > 0. Z definicji kresu górnego wynika, że a∗ − nie jest majorantą zbioru { an | n ∈ N }, zatem istnieje takie
N ∈ N, że aN > a∗ − . Zatem dla n > N mamy
a∗ − < aN ¬ an ¬ a∗ < a∗ + ,
czyli
|an − a∗ | < ,
co dowodzi, że ciąg a jest zbieżny i jego granicą jest a∗ .
8.9. PRZYKŁADY I ZASTOSOWANIA GRANIC CIĄGÓW W R
8.9
8.9.1
145
Przykłady i zastosowania granic ciągów w R
Granice kilku ważnych ciągów
Twierdzenie 8.9.1
p ∈ R+
⇒
lim
√
n
p=1
(8.14)
lim
√
n
n=1
(8.15)
n→∞
n→∞
α
α ∈ Q, a > 1
⇒
p∈R
⇒
n
=0
an 
1

lim pn = 0
n→∞


nie istn. w R
(8.16)
lim
n→∞
p=1
p ∈ (−1, 1)
p ¬ −1 lub p > 1.
(8.17)
Dowód:
√
Dla pokazania własności (8.14) rozważmy najpierw przypadek p ­ 1. Niech xn := n p − 1. Wtedy xn ­ 0 oraz na mocy
nierówności Bernoulliego mamy
1 + nxn ¬ (1 + xn )n = p.
Zatem dla wszystkich n ∈ N mamy
p−1
.
n
Z twierdzenia o trzech ciągach wynika, że ciąg limn→∞ xn = 0. Tak więc własność (8.14) dla p ­ 1 otrzymujemy z twierdzenia
o granicy sumy ciągów. Gdy p ∈ (0, 1) wystarczy zauważyć, że dla q := p1 mamy z twierdzenia o granicy ilorazu ciągów
0 ¬ xn ¬
lim
√
n
n→∞
Aby udowodnić (8.15) oznaczmy xn :=
dwumianu Newtona mamy
√
n
p=
1
1
√ = = 1.
limn→∞ n q
1
n − 1. Wystarczy pokazać, że ciąg o wyrazach xn zmierza do zera. Z rozwinięcia
n = (1 + xn )n ­
1
n(n − 1)x2n ,
2
skąd wynika, że dla n ­ 2 mamy
r
0 < xn ¬
2
2
¬√ ,
n−1
n
a zatem limn→∞ xn = 0.
Dla dowodu (8.16) oznaczmy b := a − 1 wybierzmy k ∈ N, takie że k > α + 1. Mamy dla n > 2k
( n )k
n k
n(n − 1) · · · (n − k + 1) k
an = (1 + b)n >
b =
b > 2 bk ,
k
1 · 2···k
k!
zatem
0<
nα
2k k! α−k
2k k! 1
<
n
<
(1 + b)n
bk
bk n
i tezę znów dostajemy z twierdzenia o trzech ciągach.
Własność (8.17) jest prostym wnioskiem z (8.16) dla p ∈ (0, 1). Dla p ∈ {0, 1} własność jest oczywista. Dla p ∈ (−1, 0)
wynika z nierówności
−|p|n ¬ pn ¬ |p|n .
146
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
W pozostałym przypadku ciąg ma wartości dowolnie wielkie dla wykładników parzystych, jest więc nieograniczony, a więc
nie może być zbieżny.
Aby policzyć granicę ciągu a : N → R w programie Mathematica należy użyć instrukcji
Limit[a[n], n -> Infinity, Assumptions -> Element[n, Integers]]
Na przykład pisząc
Limit[Sqrt[(1 + n)/(1 + 3 n)], n -> Infinity, Assumptions -> Element[n, Integers]]
otrzymujemy
√1 .
3
Często ten sam wynik otrzymamy używając krótszej instrukcji
Limit[a[n], n -> Infinity]
która służy do liczenia granicy funkcji. Granica funkcji jest szerszym pojęciem, ale w przypadku argumentu zmierzającego
do nieskończoności często daje ten sam wynik. Jednak nie jest to dokładnie to samo, bo na przykład w przypadku ciągu
lim cos 2πn = 1,
n→∞
gdyż jest to ciąg stale równy jeden, ale granica funkcji
lim cos 2πx
x→∞
nie istnieje. Mathematica dla instrukcji
Limit[Cos[2 Pi n], n -> Infinity, Assumptions -> Element[n, Integers]]
zwraca liczbę 1, natomiast instrukcja
Limit[Cos[2 Pi n], n -> Infinity]
zwraca
Interval[{-1, 1}]
co oznacza, że granica nie istnieje, a zbiór punktów granicznych, czyli granic wszystkich możliwych podciągów, to przedział
[−1, 1]. Pojęciem zbioru punktów granicznych zajmiemy się w rozdziale 10.
8.9.2
Procent składany
Matematyk szwajcarski, Jakob Bernoulli (rys. 8.9) rozważał problem procentu składanego, który przedstawić można skrótowo nast˛epujaco.
˛ Wpłacamy do banku
1zł oprocentowane na 100%. Po roku odbieramy 1 + 1 = 2 zł. Jeśli bank jest gotowy wypłacać proporcjonalne oprocentowanie za dowolnie krótki okres, to po
pół roku wypłacimy 1 + 12 = 1.5 zł. Wpłacajac
˛ t˛e kwot˛e na kolejne pół roku odbierzemy (1 + 12 )(1 + 12 ) = 2.25 zł. Zadajac
˛ sobie trud wpłat i wypłat n-krotnie
w ciagu
˛ roku na koniec roku wypłacimy kwot˛e
1
1+
n
n
zł.
Powstaje pytanie: czy możemy zyskać w ten sposób dowolnie wiele, jeśli n b˛edzie odpowiednio duże? Programy w j˛ezyku Mathematica oraz w C++ realizujace
˛
stosowny eksperyment numeryczny przedstawiono na listingach 8.8 i 8.9.
8.9. PRZYKŁADY I ZASTOSOWANIA GRANIC CIĄGÓW W R
147
( ∗ O b l i c z a n i e p r z y b l i ż e ń l i c z b y e według i d e i p r o c e n t u s k ł a d a n e g o
( ang . compound i n t e r e s t ) ∗ )
CompoundInterest [ d_ ] := Module [ { n } ,
n = 1;
Do[
Print [ "e[" , n , " ]= " , NumberForm [ ( 1 . + 1 . / n )^ n , 1 6 ] ] ;
n = n + 1,
{d}
];
]
Listing 8.8: Eksperyment numeryczny z procentem składanym w języku Mathematica
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ CompoundInterest . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e p r z y b l i ż e ń l i c z b y e według i d e i p r o c e n t u
∗/
/∗ s k ł a d a n e g o ( ang . compound i n t e r e s t )
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
// Policzymy 1000 wyrazów c i ą g u
i n t nmax=1000;
f o r ( i n t n=1;n<=nmax ; n=n+1){
// Czynnik , k t ó r y t r z e b a przemnożyć n r a z y p r z e z s i e b i e
// Piszemy 1 . 0 / n , a n i e 1/n , bo w a r y t m e t y c e
// c a ł k o w i t o l i c z b o w e j 1/n d a j e z e r o .
double x=1+1.0/n ;
// W C++ brak wbudowanego potęgowania ,
// w i ę c l i c z y m y p o t ę g ę przy pomocy p ę t l i
double prod =1;
f o r ( i n t i =1; i<=n ; i=i +1) prod=prod ∗x ;
c o u t << "
s[" << setw ( 3 ) << n << "] =" << setw ( 1 8 ) << prod ;
c o u t << e n d l ;
}
}
Listing 8.9: Eksperyment numeryczny z procentem składanym w C++
148
8.9.3
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Liczba e
Twierdzenie 8.9.2 Ciąg 1 +
1 n
n
jest rosnący i ograniczony, a więc ma skończoną granicę.
Dowód: Pokażemy najpierw, że ciąg ten jest rosnący. Podstawiając w nierówności Bernoullego (tw. 8.3.3) − n12 za x i
przekształcając uzyskaną nierówność otrzymujemy dla n > 1
n
1
1
1− 2
­ 1−
n
n
n n
1
1
1
1−
1+
­ 1− .
n
n
n
n−1
n
Z kolei dzieląc obustronnie przez 1 − n1 , mnożąc przez n−1
i przekształcając dostajemy
1
1−
n
n−1 n
1
1+
n
n
1
1+
n
n
1
1+
n
­
1
­
­
n
n−1
1+
n−1
1
n−1
n−1
do dowodzi, że rozważany ciąg jest rosnący.
Aby pokazać, że jest on ograniczony, najpierw zauważmy, że podstawiając 1 za b oraz
1
1
1
1
+ n−2 + · · · + 1 .
1− n =
2
2 2n−1
2
1
2
za a we wzorze (7.6) otrzymujemy
(8.18)
Zatem podstawiając we wzorze (7.7) 1 za a oraz n1 za b, przekształcając i na koniec wykorzystując (8.18) otrzymujemy
n
1
n 1
n 1
n 1
n 1
1+
= 1+
+
+
+ ··· +
2
3
1 n
2 n
n
3 n
n nn
n(n − 1) 1
n(n − 1)(n − 2) 1
n(n − 1) · · · 1 1
n1
= 1+
+
+
+ ··· +
2
3
1n
1·2 n
1·2·3
n
1 · 2 · · · n nn
1
1
1
2
1(1 − n ) 1(1 − n )(1 − n )
1(1 − n ) · · · (1 − n−1
n )
+
+ ··· +
= 1+1+
1·2
1·2·3
1 · 2···n
1
1
1
< 1+1+
+
+ ··· +
1·2 1·2·3
1 · 2···n
1
1
1
< 1 + 1 + + 2 + · · · + n−1
2
2
2
1
= 1 + 2 1 − n < 1 + 2 = 3.
2
n
Zatem na mocy twierdzenia 8.8.7 ciąg 1 + n1
jest zbieżny.
n
Choć Bernoulli pierwszy zauważył, że ciag
˛ o wyrazach 1 + n1
jest zbieżny, jego granic˛e nazywamy liczba˛ Eulera i oznaczamy litera˛ e, bo to Leonard
Euler (rys. 8.9), inny szwajcarski matematyk, pokazał jak ważna jest ona w matematyce. On pierwszy oznaczał ja˛ litera˛ e i tak pozostało do dziś.
Liczba e w przybliżeniu wynosi
e = 2.71828182845904523536 . . .
8.9. PRZYKŁADY I ZASTOSOWANIA GRANIC CIĄGÓW W R
149
Rysunek 8.9: Jacob Bernoulli (1654 - 1705) i Leonard Euler (1707 - 1783)
n
Co ciekawe, ciag
˛ 1 + n1
nadaje liczbie e ważna˛ interpretacj˛e, jednak zupełnie nie nadaje si˛e do obliczania jej przybliżeń, bo jest bardzo wolno zbieżny. W
rozdziale 12 poznamy nieporównanie szybsza˛ metod˛e wyznaczania liczby e.
W programie Mathematica liczba e jest oznaczana E.
8.9.4
Funkcja wykładnicza
Wpłacajac
˛ kwot˛e 1zł na rachunek z oprocentowaniem nie 100%, tylko x (potraktowane jako liczba, 100%=1) po roku wypłacamy kwot˛e
exp(x) := lim
n→∞
1+
x n
zł.
n
Jest to przykład funkcji ciagłej,
˛
której wzrost (lub spadek) jest proporcjonalny do jej wartości.
Można to zapisać w postaci równania różniczkowego
f 0 (x) = af (x).
Rozwiazaniem
˛
tego równania jest funkcja wykładnicza i jej wielokrotności. Bardzo wiele zjawisk w fizyce (np. rozpad pierwiastków promieniotwórczych, biologii
(np. wzrost populacji przy nieograniczonych zasobach), ekonomii (np. piramidy finansowe) i innych dziedzinach opisywanych jest przy pomocy funkcji wykładniczej.
Można pokazać, że funkcja wykładnicza spełnia wzór
f (x + y) = f (x)f (y),
a stad,
˛ że jest postaci
R 3 x 7→ ax ∈ R+ .
W wyrażeniu tym a ∈ R+ , a ax jest rozszerzeniem wyrażenia an dla n ∈ N na dowolny wykładnik rzeczywisty. W szczególności łatwo stad
˛ wywnioskować,
że dla pq ∈ Q+
p
aq =
√
q
ap ,
150
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Rysunek 8.10: Wykres funkcji exp.
a0 = 1,
oraz dla r ∈ Q−
ar =
1
a−r
.
Przyjmujac
˛ powyższe wzory jako definicje, można zdefiniować funkcj˛e wykładnicza˛ dla dowolnego x ∈ R wzorem
ax := sup { ar | r ∈ Q, r < x }
i pokazać, że
exp(x) = ex .
W programie Mathematica funkcja exp jest oznaczana Exp. Natomiast wyrażenie ax wyst˛epujace
˛ w funkcji wykładniczej o podstawie a w programie
Mathematica zapisywane jest w postaci a^x.
Wykres funkcji wykładniczej przedstawiono na rys. 8.10
Od strony obliczeniowej wygodniejszy jest jednak wzór
exp(x) =
który nam posłuży jako podstawa do formalnej definicji funkcji wykładniczej.
∞
X
xn
,
n!
n=0
Rozdział 9
Topologia przestrzeni metrycznych
Jak widzieliśmy w poprzednim rozdziale jest potrzeba rozszerzenia poj˛ecia granicy tak, by przynajmniej obejmowało ono granice ciagów
˛
liczb zespolonych.
W rzeczywistości, jak już mówiliśmy, koncepcja granicy jest kluczowa dla całej analizy. Dlatego spróbujemy zastanowić si˛e co jest rzeczywiście niezb˛edne do
zdefiniowania granicy.
Intencja˛ zwrotu |xn − g| < w definicji Cauchy’ego granicy ciagu
˛ jest stwierdzenie, że xn leży nie dalej niż od g . Widzieliśmy, że również w przypadku
liczb zespolonych możemy mierzyć odległość mi˛edzy u, w ∈ C rozważajac
˛ funkcj˛e, która parze liczb zespolonych przyporzadkowuje
˛
moduł ich różnicy.
C 3 (u, w) 7→ |u − w| ∈ R∗ .
Ma ona własności analogiczne do funkcji, która parze liczb rzeczywistych przyporzadkowuje
˛
wartość bezwzgl˛edna˛ ich różnicy. W tym rozdziale przedstawimy ide˛e
odległości, która uogólnia obie te funkcje. Jak zobaczymy później jest to jednak tylko krok pośredni do uzyskania ogólnego poj˛ecia granicy.
9.1
9.1.1
Przestrzenie metryczne
Przestrzeń metryczna
Definicja 9.1.1 Odległością (metryką) w zbiorze X nazywamy odwzorowanie
ρ : X × X → R∗
spełniające własności
(i)
ρ(x, y) = 0 ⇔ x = y,
(ii)
ρ(x, y) = ρ(y, x),
(iii)
ρ(x, z) ¬ ρ(x, y) + ρ(y, z).
Parę (X, ρ) nazywamy przestrzenią metryczną.
151
152
ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH
Rysunek 9.1: Odległość punktów x, y ∈ R2 w metryce euklidesowej (zielony), Manhattan (niebieski) i maksimum (czerwony).
9.1.2
Przykłady metryk w Rn
Przestrzeń Rn to iloczyn kartezjański n kopii zbioru liczb rzeczywistych R. Element x ∈ Rn ma postać n-tki liczb: x =
(x1 , x2 , . . . , xn ), którą krótko zapisujemy x = (xi )i=1,n . Dla x = (xi )i=1,n , y = (yi )i=1,n ∈ Rn definiujemy
v
u n
uX
de (x, y) := t (xi − yi )2 ,
i=1
dmax (x, y)
:=
d1 (x, y)
:=
max { |xi − yi | | i = 1, 2, . . . n },
n
X
|xi − yi |.
i=1
Jak łatwo zauważyć, pierwsza z tych definicji uogólnia na przypadek Rn metrykę zadaną w R poprzez wartość bezwzględną
oraz metrykę w C zadaną poprzez moduł.
Twierdzenie 9.1.2
(i) (Rn , de ), (Rn , dmax ) i (Rn , d1 ) są przestrzeniami metrycznymi.
(ii) de w R2 = C pokrywa się z modułem, a w R z wartością bezwzględną różnicy argumentów.
Metryka de to metryka euklidesowa, metrykę dmax określa się mianem metryka maksimum, a metrykę d1 mianem metryka
Manhattan. Łatwo sprawdzić, że dla n = 1 wszystkie te trzy metryki są sobie równe, dane wzorem ρ(x, y) = |x − y| dla
x, y ∈ R.
Przykład liczenia odległości w R2 w różnych metrykach przedstawiono na rys. 9.1.
9.1.3
Metryka indukowana i podprzestrzenie przestrzeni metrycznej
Twierdzenie 9.1.3 Niech (X, ρ) będzie przestrzenią metryczną, a Y ⊂ X podzbiorem. Wtedy ρY := ρ|Y ×Y jest
metryką w Y .
Dowód: ćwiczenie.
9.1. PRZESTRZENIE METRYCZNE
153
Rysunek 9.2: Kule w R2 w metryce euklidesowej (zielony), Manhattan (niebieski) i maksimum (czerwony). Odpowiednie
sfery zaznaczono ciemniejszym kolorem.
Definicja 9.1.4 Metrykę ρY nazywamy metryką indukowaną z X w Y , a przestrzeń metryczną (Y, ρY ) nazywamy
podprzestrzenią przestrzeni (X, ρ).
Zatem każdy podzbiór przestrzeni metrycznej jest przestrzenią metryczną. Pokazuje to, że przestrzenie metryczne mogą
być bardzo różnorodne.
9.1.4
Kule
Definicja 9.1.5 Niech (X, ρ) będzie przestrzenią metryczną, x punktem w X, a r liczbą rzeczywistą dodatnią. Przez
kulę otwartą w X o środku w x i promieniu r rozumiemy zbiór
K(x, r) := { y ∈ X | ρ(y, x) < r }.
Podobnie definiujemy kulę domkniętą jako zbiór
K̄(x, r) := { y ∈ X | ρ(y, x) ¬ r },
a sferę jako zbiór
S(x, r) := { y ∈ X | ρ(y, x) = r }.
Dla ustalonej przestrzeni metrycznej (X, ρ) oraz x ∈ X będziemy używać oznaczenia
Ball(x) := Ball(x, X) := Ball(x, X, ρ) := { K(x, r) | r ∈ R+ }.
na rodzinę kul otwartych o środku w x.
Przykład kul domkniętych i sfer w R2 w różnych metrykach przedstawiono na rys. 9.2.
Różnica mi˛edzy kula˛ domkni˛eta,˛ a otwarta˛ jest analogiczna do różnicy mi˛edzy przedziałem domkni˛etym, a przedziałem otwartym. Na rysunku można ja˛
przedstawić tylko umownie, na przykład zaznaczajac
˛ sfer˛e ograniczajac
˛ a˛ kul˛e otwarta˛ linia˛ cienka,˛ a sfer˛e ograniczajac
˛ a˛ kul˛e domkni˛eta˛ linia˛ gruba˛ (rys.9.3).
Posługujac
˛ si˛e metryka,˛ można poj˛ecie granicy ciagu
˛ w przestrzeni metrycznej sformułować tak
154
ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH
Rysunek 9.3: Umowne przedstawienie różnicy między kulą domknięta, sferą i kulą otwartą.
lim xn = g
n→∞
:⇔
∀ > 0 ∃N ∈ N ∀n ∈ N n ­ N ⇒ ρ(xn , g) < ,
a posługujac
˛ si˛e poj˛eciem kuli tak
lim xn = g
n→∞
:⇔
∀K ∈ Ball(g) ∃N ∈ N ∀n ∈ N n ­ N ⇒ xn ∈ K.
Docelowo chcielibyśmy je przeformułować tak
lim xn = g
n→∞
:⇔
∀V ∈ Nb(g) ∃U ∈ Nb(∞) ∀n ∈ N n ∈ U ⇒ xn ∈ V,
gdzie Nb(g) to pewna rodzina zbiorów "zadajaca
˛ coraz wi˛eksze wymagania bliskości" do g , a Nb(∞) to pewna rodzina zbiorów "zadajaca
˛ coraz wi˛eksze
wymagania bliskości" do ∞. W naszym przypadku ta pierwsza rodzina to rodzina kul o środku w g , a ta druga to rodzina przedziałów [N, ∞). Tego typu rodziny
to tzw. bazy otoczeń. Sformalizujemy to poj˛ecie pod koniec tego rozdziału.
9.1.5
Zbiory ograniczone
W dalszym ciągu przyjmujemy, że X jest przestrzenią metryczną z metryką ρ.
Definicja 9.1.6 Podzbiór A ⊂ X nazywamy ograniczonym jeśli istnieje kula K(x, r) o środku w x i promieniu r taka,
że A ⊂ K(x, r).
Twierdzenie 9.1.7 Suma skończonej ilości zbiorów ograniczonych jest zbiorem ograniczonym.
9.2
9.2.1
Średnica zbiorów
Średnica zbioru
9.3. ZBIORY OTWARTE I DOMKNIĘTE, WNĘTRZE, DOMKNIĘCIE I BRZEG ZBIORU
155
Rysunek 9.4: Poszukiwanie punktów brzegowych (na górze po lewej) zbioru A, brzeg zbioru A (na górze po prawej), domknięcie zbioru A jako przykład zbioru domkniętego (na dole po lewej) i otwarcie zbioru A jako przykład zbioru otwartego
(na dole po prawej).
Definicja 9.2.1 Średnicę zbioru A ⊂ X definiujemy jako
ρ(A) := sup { ρ(x, y) | x, y ∈ A }
gdy A jest zbiorem niepustym, a jako zero w przeciwnym razie.
Zauważmy, że dla metryki euklidesowej de w R oraz x, y ∈ R takich, że x ¬ y średnica przedziału otwartego (x, y) oraz
domkniętego [x, y] wynosi y − x.
Uwaga 9.2.2 Średnica zbioru ma następujące własności.
(i) Zbiór A jest ograniczony wtedy i tylko wtedy, gdy jego średnica jest skończona.
(ii) Średnica zbioru A wynosi zero wtedy i tylko wtedy, gdy zbiór A ma nie więcej niż jeden element.
(iii) Jeśli A ⊂ B, to ρ(A) ¬ ρ(B).
(iv) Jeśli A : N → P(X) jest ciągiem zbiorów takich, że ρ(An ) <
9.3
1
n,
to ρ(
T∞
n=1
An ) = 0.
Zbiory otwarte i domknięte, wnętrze, domknięcie i brzeg zbioru
Poj˛ecia zbioru otwartego i domkni˛etego uogólniaja˛ poj˛ecia kuli otwartej i domkni˛etej. Intuicyjnie zbiór otwarty to taki, który jest rozłaczny
˛
ze swoim brzegiem, a
zbiór domkni˛ety to taki, który zawiera swój brzeg. Punkt x jest punktem brzegowym zbioru A jeżeli każda kula K ∈ Ball(x) zawiera tak punkty należace
˛ do A
jak i nie należace
˛ do A. Ide˛e t˛e przedstawiono na rys. 9.4.
Definicja 9.3.1 Niech A ⊂ X. Brzegiem zbioru A w X nazywamy zbiór
bd A := { x ∈ X | ∀K ∈ Ball(x) K ∩ A 6= ∅ i K \ A 6= ∅ }.
Mówimy, że A jest otwarty, jeżeli A ∩ bd A = ∅. Mówimy, że A jest domknięty, jeżeli bd A ⊂ A.
156
ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH
Twierdzenie 9.3.2 A jest otwarty wtedy i tylko wtedy gdy
∀x ∈ A ∃K ∈ Ball(x)
K ⊂ A.
A jest domknięty wtedy i tylko wtedy gdy
∀x 6∈ A ∃K ∈ Ball(x)
9.3.1
K ∩ A = ∅.
Wnętrze i domknięcie
Definicja 9.3.3 Niech A ⊂ X. Wnętrzem zbioru A nazywamy zbiór
int A := A \ bd A
Domknięciem zbioru A nazywamy zbiór
cl A := A ∪ bd A
Twierdzenie 9.3.4 Niech A ⊂ X. Wtedy
int A = { x ∈ X | ∃K ∈ Ball(x) K ⊂ A. }
oraz
cl A = { x ∈ X | ∀K ∈ Ball(x) K ∩ A 6= ∅. }
Niech X ∈ Metr, x ∈ X, r > 0.
Twierdzenie 9.3.5 Kula otwarta K(x, r) jest zbiorem otwartym, a kula domknięta K̄(x, r) jest zbiorem domkniętym.
Rodzinę zbiorów otwartych w przestrzeni metrycznej (X, ρ) oznaczać będziemy Open(X, ρ), a zbiorów domkniętych
Clos(X, ρ). W notacji tej będziemy pomijać metrykę i pisać Open(X), Clos(X) gdy metryka będzie znana z kontekstu.
9.3.2
Własności wnętrza i domknięcia
Uwaga 9.3.6 Niech A ⊂ X. Wtedy
(i) int A ⊂ A ⊂ cl A,
(ii) A jest otwarty wtedy i tylko wtedy gdy A = int A,
(iii) A jest domknięty wtedy i tylko wtedy gdy A = cl A,
(iv) \ int A = cl(\A),
\ cl A = int(\A),
(v) bd A = cl A ∩ cl(\A) jest zbiorem domkniętym.
9.4. OTOCZENIA, PUNKTY SKUPIENIA
157
Twierdzenie 9.3.7 Operacje wnętrza i domknięcia są monotoniczne względem relacji inkluzji, tzn. jeśli A ⊂ B ⊂ X,
to int A ⊂ int B oraz cl A ⊂ cl B.
Twierdzenie 9.3.8 Niech A ⊂ X. Wnętrze A jest zbiorem otwartym. Jest to największy zbiór otwarty zawarty w A.
Podobnie domknięcie A jest zbiorem domkniętym i jest to najmniejszy zbiór domknięty zawierający A.
Wniosek 9.3.9 Dla każdego A ⊂ X mamy
int(int A) = int A,
cl(cl A) = cl A.
Twierdzenie 9.3.10 Dla dowolnych A, B ⊂ X mamy
9.4
9.4.1
int(A ∩ B)
=
int A ∩ int B,
int(A ∪ B)
⊃ int A ∪ int B,
cl(A ∩ B)
⊂ cl A ∩ cl B,
cl(A ∪ B)
=
cl A ∪ cl B.
Otoczenia, punkty skupienia
Rodzina otoczeń punktu
Definicja 9.4.1 Mówimy, że zbiór A jest otoczeniem punktu x ∈ X jeżeli x ∈ int A. Mówimy, że A jest otoczeniem
otwartym punktu x jeżeli A jest otwarty i x ∈ A. Zbiór otoczeń punktu x oznaczamy Nb(x), a zbiór otoczeń otwartych
punktu x oznaczamy ONb(x).
9.4.2
Punkty skupienia zbioru
Definicja 9.4.2 Punkt x ∈ X nazywamy punktem skupienia zbioru A ⊂ X, jeżeli
∀V ∈ Nb(x) ∃y ∈ X
y 6= x i y ∈ V ∩ A.
Zbiór punktów skupienia zbioru A oznaczamy A0 .
Definicja 9.4.3 Mówimy, że x ∈ X jest punktem izolowanym zbioru A ⊂ X, jeżeli x ∈ A i x nie jest punktem
skupienia zbioru A.
Dla zbioru
n
A := { n1 | n ∈ N1 } ∪ { n+1
| n ∈ N1 }
jedynymi punktami skupienia są 0 i 1, z czego tylko 1 jest elementem A. Wszystkie pozostałe punkty zbioru A to jego punkty
izolowane.
158
9.5
9.5.1
ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH
Metryki równoważne, iloczyn kartezjański przestrzeni metrycznych
Równoważność metryk.
Definicja 9.5.1 Niech ρ1 i ρ2 będą metrykami w zbiorze X. Mówimy, że ρ1 i ρ2 są równoważne wtedy i tylko wtedy,
gdy zachodzą następujące dwa warunki
Open(X, ρ1 ) = Open(X, ρ2 ).
Twierdzenie 9.5.2 Metryki ρ1 , ρ2 na X są rówoważne wtedy i tylko wtedy gdy
∀x ∈ X ∀K1 ∈ Ball(x, X, ρ1 ) ∃K2 ∈ Ball(x, X, ρ2 )
K2
⊂
K1 ,
∀x ∈ X ∀K2 ∈ Ball(x, X, ρ2 ) ∃K1 ∈ Ball(x, X, ρ1 )
K1
⊂
K2 .
Twierdzenie 9.5.3 Metryki euklidesowa, maksimum i Manhattan w Rd są wzajemnie równoważne.
9.5.2
Iloczyn kartezjański przestrzeni metrycznych
Twierdzenie 9.5.4 Niech (Xi , ρi ) dla i = 1, 2, . . . d będą przestrzeniami metrycznymi. Dla x := (x1 , x2 , . . . , xd ) ∈
X1 × X2 × · · · × Xd i y := (y1 , y2 , . . . , yd ) ∈ X1 × X2 × · · · × Xd połóżmy
v
u n
uX
ρi (xi , yi )2 ,
ρe (x, y) := t
i=1
ρmax (x, y)
ρ1 (x, y)
max { ρi (xi , yi ) | i = 1, 2, . . . n },
n
X
:=
ρi (xi , yi ).
:=
i=1
Wtedy ρe , ρmax i ρ1 (x, y) są wzajemnie równoważnymi metrykami w X1 × X2 × · · · × Xd .
9.6
9.6.1
(*)Topologia przestrzeni metrycznej
Fundamentalne własności zbiorów otwartych i domkniętych
Twierdzenie 9.6.1 Niech (X, ρ) będzie przestrzenią metryczną. Wtedy
∅, X ∈ Open(X),
U1 , U2 ∈ Open(X) ⇒ U1 ∩ U2 ∈ Open(X),
[
{Uι }ι∈I ⊂ Open(X) ⇒
Uι ∈ Open(X).
ι∈I
9.7. (**)BAZY OTOCZEŃ
159
Twierdzenie 9.6.2 Niech (X, ρ) będzie przestrzenią metryczną. Wtedy
∅, X ∈ Clos(X),
U1 , U2 ∈ Clos(X) ⇒ U1 ∪ U2 ∈ Clos(X),
\
{Uι }ι∈I ⊂ Clos(X) ⇒
Uι ∈ Clos(X).
ι∈I
Definicja 9.6.3 Rodzinę zbiorów otwartych przestrzeni metrycznej nazywamy topologią tej przestrzeni.
Widzimy, że różne metryki moga˛ prowadzić do tej samej rodziny zbiorów otwartych, czyli topologii. I właśnie topologia jest tym co nas w tym wykładzie
interesuje bardziej niż metryka. Topologi˛e można studiować bez metryki. Wtedy przyjmuje si˛e jako aksjomaty własności rodziny zbiorów otwartych zawarte w tezie
twierdzenia 9.6.1. Przestrzeń z zadana˛ rodzina˛ takich zbiorów nazywa si˛e przestrzenia˛ topologiczna.˛ Okazuje si˛e, że istnieja˛ przestrzenie topologiczne, których
topologii nie da si˛e zadać przy pomocy metryki. Dziedzin˛e matematyki, która zajmuje si˛e badaniem przestrzeni topologicznych też określa si˛e mianem topologia.
9.7
(**)Bazy otoczeń
9.7.1
Baza otoczeń punktu
Niech (X, ρ) będzie ustaloną przestrzenią metryczną.
Definicja 9.7.1 Mówimy, że rodzina B ⊂ X jest bazą otoczeń punktu x ∈ X jeżeli zachodzą następujące dwa warunki
(i) ∀B ∈ B
x ∈ B,
(ii) ∀U ∈ Open(X) x ∈ U ⇒ ∃B ∈ B B ⊂ U .
Rodzinę rodzin zbiorów {B x }x∈X nazywamy bazą otoczeń w X jeżeli dla każdego x ∈ X rodzina B x jest bazą otoczeń
punktu x.
Dla x ∈ X zdefiniujmy
ONb(x)
Nb(x)
Ball0 (x)
:= { V ∈ Open(X) | x ∈ V },
:= { A ⊂ X | ∃V ∈ Open(X) x ∈ V ⊂ A },
:= { K(x, n1 ) | n ∈ N }.
Dla każdego x ∈ X mamy
Ball0 (x) ⊂ Ball(x) ⊂ ONb(x) ⊂ Nb(x).
Twierdzenie 9.7.2 Rodziny rodzin zbiorów {Ball0 (x)}x∈X , {Ball(x)}x∈X , {ONb(x)}x∈X , {Nb(x)}x∈X są bazami otoczeń w X.
Bazy otoczeń są przydatne, bo wiele warunków wystarczy sprawdzać jedynie na bazach. W szczególności mamy następujące
twierdzenie.
160
ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH
Rysunek 9.5: Rozdzielenie punktów kulami w przestrzeni metrycznej.
Twierdzenie 9.7.3 Niech {B x }x∈X będzie bazą otoczeń w X. Wtedy
(i) Zbiór A jest otwarty w X wtedy i tylko wtedy gdy dla każdego x ∈ A istnieje B ∈ B x takie, że B ⊂ A.
(ii) Zbiór A jest domknięty w X wtedy i tylko wtedy gdy dla każdego x 6∈ A istnieje B ∈ B x takie, że B ∩ A = ∅.
9.7.2
Własność Hausdorffa
Twierdzenie 9.7.4 Niech {B x }x∈X będzie bazą otoczeń w X. Jeśli x1 , x2 ∈ X i x1 6= x2 , to istnieją B1 ∈ B x1 oraz
B2 ∈ B x2 takie, że B1 ∩ B2 = ∅.
9.7.3
Metryka w R̄
Twierdzenie 9.7.5 Istnieje silnie rosnąca bijekcja f : R̄ → [−1, 1]. W szczególności jest taką funkcja zadana wzorem


x = −∞,
−1
x
x ∈ R,
f (x) := 1+|x|


1
x = ∞.
Jeśli f : R̄ → [−1, 1] jest silnie rosnącą bijekcją, to funkcja ρf : R̄ × R̄ → R∗ dana wzorem
ρf (x, y) := |f (x) − f (y)|
jest metryką w R̄. Co więcej, jeśli f1 , f2 : R̄ → [−1, 1] są dwoma silnie rosnącymi bijekcjami, to metryki ρf1 i ρf2 są
równoważne.
W dalszym ciągu zbiór R̄ traktować będziemy jako przestrzeń metryczną z metryką ρf .
Twierdzenie 9.7.6 Metryka indukowana z R̄ w R jest równoważna metryce euklidesowej w R.
Zbiór N̄ := N ∪ {∞} jest podzbiorem R̄, jest więc przestrzenią metryczną z metryką indukowaną z R̄. Łatwo sprawdzić,
że w przestrzeni tej wszystkie punkty są izolowane, z wyjątkiem punktu ∞, który jest punktem skupienia zbioru N ⊂ N̄.
Ponieważ kule w metryce ρf nie mają prostego opisu, wygodnie jest posługiwać się następującym twierdzeniem.
9.8. (**)PRZELICZALNE BAZY OTOCZEŃ PUNKTU
161
Twierdzenie 9.7.7 Dla x ∈ R̄ połóżmy


{ [−∞, −n) | n ∈ N }
B x := { (x − n1 , x + n1 ) | n ∈ N }


{ (n, ∞] | n ∈ N }
Wtedy {B x }
x∈R̄
9.8
x = −∞,
x ∈ R,
x = ∞.
stanowi bazę otoczeń w R̄.
(**)Przeliczalne bazy otoczeń punktu
Rodzina Ball0 (x) jest przeliczalna. Pozwala to w szczególności udowodnić następujące dwa twierdzenia.
Twierdzenie 9.8.1 Zbiór A ⊂ X jest domknięty wtedy i tylko wtedy gdy dla każdego ciągu x : N → A jeśli x jest
zbieżny do x0 ∈ X to x0 ∈ A.
Twierdzenie 9.8.2 Punkt x0 ∈ X jest punktem skupienia zbioru A ⊂ X wtedy i tylko wtedy gdy istnieje ciąg a : N →
A \ {x0 } zbieżny do x0 .
9.9
9.9.1
(*)Zupełność
Warunek Cauchy’ego
Definicja 9.9.1 Niech (X, ρ) będzie przestrzenią metryczną. Mówimy, że ciąg X : N → X spełnia warunek Cauchy’ego
jeżeli
∀ > 0∃N ∈ N∀n, m ­ N ρ(xn , xm ) < .
Twierdzenie 9.9.2 Każdy ciąg zbieżny jest ciągiem Cauchy’ego.
Dowód:
Twierdzenie 9.9.3 (*)Jeśli ciąg Cauchy’ego posiada podciąg zbieżny to jest zbieżny.
Dowód:
162
ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH
Twierdzenie 9.9.4 (*)Każdy ciąg Cauchy’ego jest ograniczony
Dowód:
Wniosek 9.9.5 Każdy ciąg Cauchy’ego w Rd jest zbieżny.
Dowód:
(*)
9.9.2
Przestrzenie zupełne
Definicja 9.9.6 Przestrzeń metryczną nazywamy zupełną, jeżeli każdy ciąg Cauchy’ego w tej przestrzeni jest zbieżny.
Wniosek 9.9.7 Rd jest przestrzenią zupełną.
Rozdział 10
Granica funkcji
10.1
Granica funkcji w przestrzeniach metrycznych
10.1.1
Eksperymenty numeryczne
Przy obliczeniach numerycznych granicy limx→x0 f (x) nie możemy rozważyć wszystkich wartości argumentu x, wi˛ec w praktyce wybieramy ciag
˛ xn zmierzajacy
˛ do x0 i obserwujemy zachowanie f (xn ). Program w j˛ezyku Mathematica obliczajacy
˛ przybliżenie granicy funkcji poprzez obliczanie wartości funkcji w ciagu
˛
punktów przedstawiono na listingu 10.1. Analogiczny przykład w C++ w odniesieniu do granicy limx→0 sinx x i ciagu
˛ xn := n1 przedstawiono w programie z
listingu 10.2.
Ćwiczenie komputerowe 10.1.1
wartosciach p.
• Sprawdź działanie programu z listingu 10.1 dla funkcji x 7→
sin x
x
i dla ciagu
˛ xn :=
1
np
przy różnych
˛
• Sprawdź działanie programu z listingu 10.1 dla funkcji x 7→ sin x1 i dla różnych ciagów.
• W programie z listingu 10.2 zmień ciag
˛ xn na xn :=
1
np
dla różnych wartości p i zaobserwuj zachowanie si˛e programu.
• Zmodyfikuj program z listingu 10.2 zast˛epujac
˛ funkcj˛e x 7→
sin x
x
funkcja˛ x 7→ sin
1
x
i zaobserwuj zachowanie si˛e programu dla różnych ciagów.
˛
Eksperymenty numeryczne pokazuja,˛ że definicj˛e granicy funkcji lepiej byłoby postawić uniezależniajac
˛ si˛e od ciagów,
˛
bo zachowanie funkcji może być różne,
przy podstawieniu w miejsce argumentów różnych ciagów.
˛
Taka˛ definicj˛e rozważaliśmy już w rozdziale wst˛epnym.
10.1.2
Definicja granicy funkcji w przestrzeniach metrycznych
Niech X, Y będą przestrzeniami metrycznymi odpowiednio z metrykami ρX i ρY . Niech A będzie podzbiorem X. Rozważmy
punkt skupienia x0 zbioru A, punkt y0 ∈ Y oraz funkcję f : A → Y .
Twierdzenie 10.1.2 Następujące warunki są równoważne:
∀ > 0 ∃δ > 0 ∀x ∈ A \ {x0 }
ρX (x, x0 ) < δ ⇒ ρY (f (x), y0 ) < ,
∀V ∈ Nb(y0 ) ∃U ∈ Nb(x0 ) ∀x ∈ U ∩ A \ {x0 }
f (x) ∈ V.
(10.1)
(10.2)
Dowód: Załóżmy, że warunek (10.1) zachodzi. Niech V będzie otoczeniem punktu y0 . Z definicji otoczenia znajdziemy
kulę K(y0 , r) w Y zawartą w V . Ponieważ r > 0, na mocy założenia (10.1) znajdziemy δ > 0 takie, że dla wszystkich
x ∈ A \ {x0 }
ρX (x, x0 ) < δ ⇒ ρY (f (x), y0 ) < r.
163
164
ROZDZIAŁ 10. GRANICA FUNKCJI
(∗ P r z y b l i ż a n i e granicy f u n k c j i f granicą ciągu n wartości f u n k c j i
w punktach c i ą g u x ∗ )
F u n c t i o n L i m i t [ f_ , x_ , n_ ] :=
Module [ { k } ,
k = 1;
Do[
Print [ f [ x [ k ] ] ] ;
k = k + 1,
{n}
];
]
( ∗ Funkcja , k t ó r e j g r a n i c ę w z e r z e l i c z y m y ∗ )
g [ x_ ] := Sin [ x ] / x ;
( ∗ Ciąg o wyrazach z m i e r z a j ą c y c h do z e r a ∗ )
x [ n_ ] := 1 . / n
( ∗ Test p r z y b l i ż a n i a w a r t o ś c i f u n k c j i ∗ )
FunctionLimit [ g , x , 100]
Listing 10.1: Przybliżanie granicy funkcji w języku Mathematica
Zatem dla x ∈ A \ {x0 } mamy
x ∈ K(x0 , δ) ⇒ y ∈ K(y0 , r) ⊂ V.
Ponieważ K(x0 , δ) jest otoczeniem x0 , więc dobraliśmy do V otoczenie U , którego istnienie jest postulowane w (10.2).
Dowodzi to, że warunek (10.1) implikuje warunek (10.2). Dowód implikacji przeciwnej jest podobny. Zostawiamy go jako
ćwiczenie.
Twierdzenie 10.1.2 pozwala postawić następującą ogólną definicję granicy w przestrzeniach metrycznych.
Definicja 10.1.3 Mówimy, że y0 ∈ Y jest granicą funkcji f w punkcie x0 i piszemy
lim f (x) = y0
x→x0
jeżeli zachodzi którykolwiek z równoważnych warunków (10.1) i (10.2).
10.1.3
Jednoznaczność granicy
Twierdzenie 10.1.4 (o jednoznaczności granicy) Niech X, Y będą przestrzeniami metrycznymi, A ⊂ X, f : X → Y
funkcją, a x0 punktem skupienia A w X. Jeśli dla pewnych y1 , y2 ∈ Y mamy
lim f (x) = y1 i lim f (x) = y2
x→x0
to y1 = y2 .
x→x0
10.1. GRANICA FUNKCJI W PRZESTRZENIACH METRYCZNYCH
165
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ F u n c t i o n L i m i t . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ P r z y b l i ż a n i e g r a n i c y f u n k c j i g r a n i c ą c i ą g u w a r t o ś c i
∗/
/∗ f u n k c j i
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;
/∗ Funkcja , k t ó r e j g r a n i c ę w z e r z e l i c z y m y ∗/
double f ( double x ) {
return s i n ( x ) / x ;
}
/∗ Ciąg o wyrazach z m i e r z a j ą c y c h do z e r a ∗/
double x ( i n t n ) {
return 1 . 0 / n ;
}
/∗ W p r o g r a m i e głównym wypisujemy c i ą g w a r t o ś c i f u n k c j i
w zadanym c i ą g u punktów ∗/
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
f o r ( i n t n=1;n<=20;n=n+1){
c o u t << "x[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << x ( n ) ;
c o u t << "
f(x[" << setw ( 2 ) << n << " ]) =" ;
c o u t << setw ( 1 8 ) << f ( x ( n ) ) << e n d l ;
}
}
Listing 10.2: Przybliżanie granicy funkcji w C++
166
ROZDZIAŁ 10. GRANICA FUNKCJI
Dowód: Dla dowodu nie wprost załóżmy, że y1 6= y2 . Wtedy r := ρ(y1 , y2 ) > 0. Z warunku (10.1) zastosowanego dla y1
i y2 do := 2r znajdziemy odpowiednio δ1 i δ2 takie, że dla x ∈ A \ {x0 }
ρ(x, x0 ) < δ1
⇒
ρ(f (x), y1 ) < (10.3)
ρ(x, x0 ) < δ2
⇒
ρ(f (x), y2 ) < .
(10.4)
Niech δ := min(δ1 , δ2 ). Ponieważ x0 jest punktem skupienia zbioru A w X, a K(x0 , δ) jest otoczeniem x0 w X, więc
znajdziemy punkt x∗ ∈ K(x0 , δ) ∩ A. Ponieważ w szczególności ρ(x∗ , x0 ) < δ1 i ρ(x∗ , x0 ) < δ2 , więc na mocy (10.3) i (10.4)
mamy ρ(f (x∗ ), y1 ) < i ρ(f (x∗ ), y2 ) < . Zatem z nierówności trójkąta
ρ(y1 , y2 ) ¬ ρ(y1 , f (x∗ )) + ρ(f (x∗ ), y2 ) < + = ρ(y1 , y2 ).
Otrzymana sprzeczność dowodzi tezy.
10.1.4
Granica złożenia funkcji
Twierdzenie 10.1.5 (O granicy złożenia funkcji) Niech X, Y, Z będą przestrzeniami metrycznymi, x0 ∈ X 0 , y0 ∈ Y 0 ,
z0 ∈ Z. Jeśli f : X → Y i g : Y → Z są takie, że y0 6∈ im f oraz limx→x0 f (x) = y0 i limy→y0 g(y) = z0 to
limx→x0 (g ◦ f )(x) = z0 .
Dowód:
W programie Mathematica granicę limx→u f (x) dla funkcji f : R̄−→
◦ R̄ i u ∈ R̄ liczymy przy pomocy instrukcji
Limit[f[x], x -> u]
Na przykład
Limit[1/(1 + x), x -> Infinity]
zwraca 0.
10.2
(**)Przypadki szczególne definicji granicy
Przypomnijmy, że ciag
˛ x : N → R ma granic˛e x∗ wtedy i tylko wtedy gdy
∀ > 0 ∃N ∈ N n > N ⇒ |xn − x∗ | < .
Natomiast funkcja f : R → R ma granic˛e f∗ przy x zmierzajacym
˛
do x∗ wtedy i tylko wtedy gdy
∀ > 0 ∃δ > 0 |x − x∗ | < δ, x 6= x∗ ⇒ |f (x) − f∗ | < .
Funkcja f może też mieć granic˛e nieskończona.˛ Mówimy, że funkcja f : R → R ma granic˛e ∞ przy x zmierzajacym
˛
do x∗ wtedy i tylko wtedy gdy
∀A > 0 ∃δ > 0 |x − x∗ | < δ, x 6= x∗ ⇒ f (x) > A.
10.2. (**)PRZYPADKI SZCZEGÓLNE DEFINICJI GRANICY
167
Powstaje naturalne pytanie, czy te trzy formalnie różne definicje nie daja˛ si˛e uogólnić do jednej definicji uniwersalnej. Podpowiedź jak to zrobić zawarta jest w
nast˛epujacym
˛
przeformułowaniu powyższych definicji.
lim xn = x∗
:⇔
∀ > 0 ∃N ∈ N ∀n ∈ (N, ∞] \ {∞} xn ∈ (x∗ − , x∗ + ),
lim f (x) = f∗
:⇔
∀ > 0 ∃δ > 0 ∀x ∈ (x − δ, x + δ) \ {x∗ } f (x) ∈ (f∗ − , f∗ + ),
lim f (x) = ∞
:⇔
∀A > 0 ∃δ > 0 ∀x ∈ (x − δ, x + δ) \ {x∗ } f (x) ∈ (A, ∞].
n→∞
x→x∗
x→x∗
Widać, że w każdym przypadku pojawiaja˛ si˛e otoczenia: albo postaci (x − r, x + r) dla x ∈ R, albo postaci (r, ∞] w przypadku punktu w nieskończoności.
Tak wi˛ec zast˛epujac
˛ te konkretne otoczenia w R̄ ogólnymi otoczeniami w przestrzeni metrycznej dostajemy dość ogólna˛ definicj˛e granicy.
10.2.1
Kryterium na granicę w bazach
Niech B 1 będzie bazą otoczeń x0 , a B 2 bazą otoczeń y0 .
Twierdzenie 10.2.1 Warunek
lim f (x) = y0
x→x0
jest równoważny warunkowi
∀V ∈ B 2 ∃U ∈ B 1 ∀x ∈ U ∩ A \ {x0 }
10.2.2
f (x) ∈ V.
Granica ciągu
Zobaczmy jak z naszego ogólnego kryterium na granicę w bazach można odzyskać naszą definicję granicy ciągu liczb. Jako
przestrzeń X bierzemy N̄. Jako przestrzeń Y bierzemy R. Jako metrykę w R bierzemy metrykę euklidesową. Jako zbiór A,
na którym jest określona funkcja f : A → Y bierzemy N. Funkcja określona na N to przecież ciąg, więc w miejsce f pisać
będziemy bardziej tradycyjnie a, a jako argumentu zamiast x używać będziemy n. Jako punkt x0 , w którym liczymy granicę
bierzemy ∞. Punkt ∞ jest rzeczywiście punktem skupienia zbioru A = N w przestrzeni X = N̄. Jako bazę otoczeń dla
x0 = ∞ bierzemy
B 1 := {B(N ) := (N, ∞] | N ∈ N}.
Jako bazę otoczeń dla y0 bierzemy B 2 := Ball(y0 ). Podstawiając to wszystko do naszej ogólnej definicji dostajemy
lim an = y0
n→∞
:⇔
∀K = K(y0 , ) ∈ Ball(y0 ) ∃B = B(N ) ∈ B 1 ∀n ∈ B ∩ A \ {∞}
⇔
∀ > 0 ∃N ∈ N ∀n > N
an ∈ K
|an − y0 | < ,
a więc dokładnie taki warunek jaki postawiliśmy jako definicję granicy ciągu.
10.2.3
Granica funkcji w przestrzeni metrycznej
Definicję Cauchy’ego granicy funkcji R w R odzyskujemy biorąc A = X = Y = R, jako metrykę biorąc metrykę euklidesową
w R, a jako bazy otoczeń B 1 i B 2 rodziny kul w x0 i y0 . Dostajemy
lim f (x) = y0
x→x0
:⇔
∀K = K(y0 , ) ∈ Ball(y0 ) ∃B = K(x0 , δ) ∈ Ball(x0 ) ∀x ∈ B ∩ A \ {x0 }
⇔
∀ > 0 ∃δ > 0 ∀x 6= x0
|x − x0 | < δ ⇒ |f (x) − y0 | < ,
f (x) ∈ K
168
ROZDZIAŁ 10. GRANICA FUNKCJI
10.2.4
Granica nieskończona w R̄
Przypadek nieskończonej wartości granicy funkcji uzyskujemy biorąc Y = R̄, y0 = ∞, B 1 = Ball(x0 ) i B 2 = {(E, ∞] | E ∈
R+ }. Dostajemy
lim f (x) = ∞
x→x0
:⇔
∀B = (E, ∞] ∈ B 1 ∃K = K(x0 , δ) ∈ Ball(x0 ) ∀x ∈ K ∩ A \ {x0 }
⇔
∀E > 0 ∃δ > 0 ∀x ∈ A \ {x0 }
f (x) ∈ B
ρ(x, x0 ) < δ ⇒ f (x) > E,
Podobnie wygląda przypadek granicy wynoszącej −∞. Za bazę otoczeń B 2 bierzemy jedynie {[−∞, −E) | E ∈ R+ }
10.2.5
Granica w nieskończoności
Przypadek granicy w nieskończoności dla funkcji f : X → R uzyskujemy biorąc X = R̄, A = R, x0 = ∞, B 1 =
{ (E, ∞] | E ∈ R+ }, B 2 = Ball(y0 ). Dostajemy
lim f (x) = y0
x→∞
:⇔
∀K = K(y0 , ) ∈ Ball(y0 ) ∃B = (E, ∞] ∈ B 1 ∀x ∈ B ∩ A \ {∞}
⇔
∀ > 0 ∃E > 0 ∀x ∈ R
f (x) ∈ K
x > E ⇒ |f (x) − y0 | < ,
Podobnie wygląda przypadek granicy w −∞. Za bazę otoczeń B 1 bierzemy jedynie {[−∞, −E) | E ∈ R+ }
10.3
Granice jednostronne
Niech Y będzie przestrzenią metryczną. Rozważmy f : R → Y i punkt x0 ∈ R.
Definicja 10.3.1 Mówimy, że f ma w x0 granicę lewostronną równą y ∈ Y i piszemy
lim f (x) = y,
x→x−
0
jeżeli f|(−∞,x0 ] : (−∞, x0 ] → Y ma w x0 granicę y. Analogicznie, mówimy, że f ma w x0 granicę prawostronną równą
y ∈ Y i piszemy
lim+ f (x) = y,
x→x0
jeżeli f|[x0 ,∞) : [x0 , ∞) → Y ma w x0 granicę y.
Twierdzenie 10.3.2 Funkcja f ma w x0 granicę y ∈ Y wtedy i tylko wtedy gdy obie granice jednostronne istnieją i
są sobie równe.
W programie Mathematica granicę jednostronną limx→u− f (x) liczymy przy pomocy instrukcji
Limit[f[x], x -> u, Direction -> 1]
a granicę jednostronną limx→u+ f (x) liczymy przy pomocy instrukcji
Limit[f[x], x -> u, Direction -> -1]
Na przykład
Limit[1/x, x -> 0, Direction -> 1]
zwraca −∞.
10.4. PUNKTY GRANICZNE
169
10.4
Punkty graniczne
10.4.1
Ciągowa charakterystyka granicy
Ustalmy dwie przestrzenie metryczne X, Y oraz funkcję f : X → Y i punkt x0 ∈ X 0 .
Twierdzenie 10.4.1 Następujące dwa warunki są sobie równoważne
(i)
istnieje granica
lim f (x) = y0 ,
x→x0
(ii)
dla każdego ciągu x : N1 → X \ {x0 } zachodzi
lim xn = x0 ⇒ lim f (xn ) = y0 .
n→∞
n→∞
Dowód:
10.4.2
Zbiór punktów granicznych
Definicja 10.4.2 Niech f : X → Y będzie funkcją odwzorowującą przestrzeń metryczną X w przestrzeń metryczną
Y . Niech x0 ∈ X będzie punktem skupienia X w X. Definiujemy zbiór punktów granicznych funkcji f w x0 jako
Lim f (x) := { y ∈ Y | ∃a : N → X limn→∞ an = x0 i limn→∞ f (an ) = y }.
x→x0
Twierdzenie 10.4.3 Zbiór Limx→x0 f (x) jest domknięty.
Dowód:
170
ROZDZIAŁ 10. GRANICA FUNKCJI
10.4.3
Ciągowa charakterystyka granicy ciągu
Twierdzenie 10.4.4 Niech a : N → Y będzie ciągiem w przestrzeni metrycznej Y , a y ∈ Y . Następujące warunki są
równoważne.
(i) limn→∞ an = y,
(ii) ∀k : N → N
limn→∞ kn = ∞ ⇒ limn→∞ (a ◦ k)(n) = y,
(iii) ∀k : N → N
k silnie rosnący ⇒ limn→∞ (a ◦ k)(n) = y,
(iv) Dla każdego a0 podciągu a jest limn→∞ a0n = y.
Twierdzenie 10.4.5 Niech a : N → Y będzie ciągiem w przestrzeni metrycznej Y . Wtedy
Lim an = { y ∈ Y | ∃kN → N silnie rosnący i taki, że lim akn = y }.
n→∞
10.5
Granica dolna i górna
10.5.1
Granica dolna i górna
Niech X będzie przestrzenią metryczną, Y ⊂ R̄ oraz f : X → Y . Załóżmy ponadto, że dla pewnego x0 ∈ X 0 zbiór
Limx→x0 f (x) jest niepusty.
Definicja 10.5.1 W przypadku gdy Limx→x0 f (x) jest ograniczony od góry, granicę górną definiujemy wzorem
lim sup f (x) := sup Lim f (x).
x→x0
x→x0
Analogicznie, gdy Limx→x0 f (x) jest ograniczony od dołu, granicę dolną definiujemy wzorem
lim inf f (x) := inf Lim f (x).
x→x0
x→x0
Zobaczymy później, że w przypadku Y = R̄ zbiór punktów granicznych jest zawsze niepusty, a ponieważ każdy zbiór w R̄ jest ograniczony tak od góry jak
i od dołu, wi˛ec granica górna i dolna sa˛ w tym przypadku zawsze określone.
Twierdzenie 10.5.2 Niech f : X → R̄ oraz x0 ∈ X 0 . Wtedy a = limx→x0 f (x) jest równoważne równości
lim inf f (x) = lim sup f (x).
x→x0
x→x0
10.5. GRANICA DOLNA I GÓRNA
171
W przypadku gdy Y = R̄ możemy podać przydatne kryterium na granicę górną i dolną, a także twierdzenie o zachowywaniu nierówności przez te granice. W dowodach wykorzystujemy nieudowodniony jeszcze fakt, że każdy ciąg w R̄ posiada
podciąg zbieżny. Fakt ten udowodnimy w rozdziale 11.
10.5.2
Własności granicy dolnej i górnej
Twierdzenie 10.5.3 Niech f : X → R̄ oraz x0 ∈ X 0 . Wtedy a = lim supx→x0 f (x) jest równoważne koniunkcji
następujących dwóch warunków.
a ∈ Lim f (x),
x→x0
∀b > a ∃V ∈ Nb(x0 )
x ∈ V ⇒ f (x) < b.
Dowód:
Twierdzenie 10.5.4 Niech f, g : X → R̄ oraz x0 ∈ X 0 . Jeśli istnieje V ∈ Nb(x0 ) takie, że dla każdego x ∈ V \ {x0 }
mamy f (x) ¬ g(x) to
lim inf f (x) ¬ lim inf g(x),
x→x0
x→x0
lim sup f (x) ¬ lim sup g(x).
x→x0
Dowód:
x→x0
172
ROZDZIAŁ 10. GRANICA FUNKCJI
10.6
Granica, a struktura algebraiczna
10.6.1
Sumy, różnica, iloczyn i iloraz funkcji
Niech X będzie przestrzenią metryczną, a x0 punktem skupienia X. Niech Y będzie ciałem R lub ciałem C.
Załóżmy, że dane są funkcje
f1 , f2 : X → Y.
Niech : Y × Y będzie działaniem w ciele Y . Definiujemy funkcję
f1 f2 : X 3 x 7→ f1 (x) f2 (x) ∈ Y.
Dla ∈ { +, −, ·, / } nazywamy ją odpowiednio sumą, różnicą, iloczynem i ilorazem funkcji f1 i f2 .
10.6.2
Granica sumy, różnicy i iloczynu
Twierdzenie 10.6.1 Załóżmy, że f1 , f2 mają w x0 odpowiednio granice a1 , a2 ∈ Y , tzn.
lim fi (x) = ai .
x→x0
Wtedy istnieją granice sumy, różnicy i iloczynu funkcji f1 , f2 w x0 i wynoszą odpowiednio
lim (f1 (x) + f2 (x))
= a1 + a2 ,
lim (f1 (x) − f2 (x))
= a1 − a2 ,
x→x0
x→x0
lim (f1 (x)f2 (x))
x→x0
Dowód:
10.6.3
Granica ilorazu
= a1 a2 .
10.7. GRANICA, A STRUKTURA PORZĄDKOWA
173
Twierdzenie 10.6.2 Przy założeniach poprzedniego twierdzenia, jeśli ponadto a2 6= 0, to istnieje też granica ilorazu
i wynosi
f1 (x)
a1
lim
= .
x→x0 f2 (x)
a2
Dowód:
Powyższe twierdzenia zachodzą też w przypadku Y = R̄, ale tylko wtedy, gdy odpowiednie działania mają sens.
10.7
Granica, a struktura porządkowa
10.7.1
Zachowywanie nierówności w granicy
Twierdzenie 10.7.1 Niech f, g : X → R̄, x ∈ X 0 . Jeśli istnieje otoczenie V punktu x0 takie, że dla każdego x ∈
X \ {x0 } mamy f (x) ¬ g(x), to
lim f (x) ¬ lim g(x).
x→x0
Dowód:
10.7.2
Twierdzenie o trzech funkcjach
x→x0
174
ROZDZIAŁ 10. GRANICA FUNKCJI
Twierdzenie 10.7.2 Niech f, g, h : X → R̄, x ∈ X 0 . Jeśli istnieje otoczenie V punktu x0 takie, że dla każdego
x ∈ X \ {x0 } mamy f (x) ¬ g(x) ¬ h(x) oraz istnieją granice
lim f (x),
x→x0
lim h(x)
x→x0
i obie są równe pewnemu a ∈ R̄, to istnieje granica limx→x0 g(x) i też wynosi a.
Dowód:
10.7.3
Granica funkcji monotonicznej
Twierdzenie 10.7.3 Niech A ⊂ R̄ i ω := sup A. Jeśli ω jest punktem skupienia zbioru A, a f : A → R̄ jest funkcją
rosnącą i ograniczoną od góry, to istnieje granica limx→ω f (x) i jest równa
sup { f (x) | x ∈ A, x < ω }.
Dowód:
10.8
Granice w produkcie kartezjańskim
Twierdzenie 10.8.1 Niech X oraz Y1 , Y2 , . . . Yn będą przestrzeniami metrycznymi, a f = (f1 , f2 , . . . fn ) : X →
Y1 × Y2 × · · · × Yn niech będzie zestawieniem funkcji fi : X → Yi dla i = 1, 2, . . . , n. Niech x0 będzie punktem skupienia
przestrzeni X oraz niech y := (y1 , y2 , . . . , yn ) ∈ Y1 × Y2 × · · · × Yn . Wtedy
lim f (x) = y ⇔ lim fi (x) = yi dla i = 1, 2, . . . n.
x→x0
x→x0
10.8.
GRANICE W PRODUKCIE KARTEZJAŃSKIM
Dowód: (**)Dowód przedstawimy dla przypadku n = 2.
175
176
ROZDZIAŁ 10. GRANICA FUNKCJI
Rozdział 11
Ciągłość funkcji
11.1
Koncepcja ciągłości
11.1.1
Definicja ciągłości
Niech f : X → Y będzie odwzorowaniem przestrzeni metrycznych.
Definicja 11.1.1 Mówimy, że f jest ciągła w punkcie x0 ∈ X jeżeli dla każdego otoczenia V ∈ Nb(f (x0 )) istnieje
otoczenie U ∈ Nb(x0 ) takie, że
x ∈ U ⇒ f (x) ∈ V.
Mówimy, że f jest ciągła jeśli jest ciągła w każdym punkcie x ∈ X.
Twierdzenie 11.1.2 Funkcja f jest ciągła w x0 wtedy i tylko wtedy gdy zachodzi jeden z następujących dwóch warunków
x0 6∈ X 0 lub x0 ∈ X 0 i lim f (x) = f (x0 ).
x→x0
Dowód:
Twierdzenie 11.1.3 Niech B 1 będzie bazą otoczeń x0 , a B 2 bazą otoczeń f (x0 ). Wtedy ciągłość f : X → Y w x0 jest
równoważna każdemu z trzech poniższych warunków
∀V ∈ B 2 ∃U ∈ B 1
∀V ∈ B 2 ∃U ∈ B 1
∀V ∈ B 2
f (U ) ⊂ V,
U ⊂ f −1 (V ),
f −1 (V ) ∈ Nb(x0 ).
177
178
ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI
Dowód:
11.1.2
Kryteria ciągłości
Twierdzenie 11.1.4 Funkcja f : X → Y jest ciągła wtedy i tylko wtedy gdy dla każdego zbioru otwartego V w Y
zbiór f −1 (V ) jest otwarty w X.
Dowód:
Twierdzenie 11.1.5 Funkcja f : X → Y jest ciągła wtedy i tylko wtedy gdy dla każdego zbioru domkniętego K w Y
zbiór f −1 (K) jest domknięty w X.
11.1.3
Ciągłość złożenia
Twierdzenie 11.1.6 Niech X, Y, Z będą przestrzeniami metrycznymi, a f : X → Y i g : Y → Z odwzorowaniami.
Jeśli f jest ciągłe w x0 ∈ X, a g jest ciągłe w f (x0 ), to g ◦ f jest ciągłe w x0 . Zatem jeśli f i g są ciągłe, to g ◦ f jest
ciągłe.
Dowód: łatwe ćwiczenie.
11.1.4
Ciągłość operacji arytmetycznych
Niech X będzie przestrzenią metryczną, a Y niech będzie ciałem liczb rzeczywistych lub ciałem liczb zespolonych.
Twierdzenie 11.1.7 Jeśli f, g : X → Y są ciągłe w x0 ∈ X to f + g, f − g, f · g są ciągłe w x0 . Jeśli dodatkowo
g(x0 ) 6= 0, to f /g jest ciągłe w x0 .
Dowód: łatwe ćwiczenie.
11.1.5
Twierdzenie o lokalnym zachowywaniu znaku
Twierdzenie 11.1.8 Niech f : X → R będzie funkcją ciągłą. Jeśli f (x0 ) > 0 dla pewnego x0 ∈ X, to istnieje U
otoczenie punktu x0 takie, że dla każdego x ∈ U mamy f (x) > 0.
11.1. KONCEPCJA CIĄGŁOŚCI
179
Dowód:
Twierdzenie 11.1.9 Niech X, Y będą przestrzeniami metrycznymi.
(i)
(ii)
Niech c ∈ Y . Funkcja stała cX : X 3 x 7→ c ∈ Y jest ciągła.
Niech X ⊂ Y . Inkluzja j : X 3 x 7→ x ∈ Y jest ciągła.
(iii)
Identyczność idX : X 3 x 7→ x ∈ X jest ciągła.
(iv)
Odwzorowania rzutowania
pX : X × Y 3 (x, y) 7→ x ∈ X
qX : X × Y 3 (x, y) 7→ y ∈ Y
są ciągłe.
(v)
Zawężenie f|A odwzorowania ciągłego f : X → Y do zbioru A ⊂ X jest ciągłe.
Dowód: łatwe ćwiczenie.
Twierdzenie 11.1.10 Niech P : C → C będzie wielomianem. Wtedy P jest ciągłe.
Dowód: łatwe ćwiczenie.
Niech P, Q : C → C będą wielomianami. Funkcją wymierną jest funkcja
P
P (x)
: C \ Q−1 (0) 3 x 7→
∈ C.
Q
Q(x)
Twierdzenie 11.1.11 Funkcja wymierna jest ciągła.
Dowód: łatwe ćwiczenie.
(*)Nieciągłości funkcji f : R → R
11.1.6
Niech f : (a, b) → R i niech x0 ∈ (a, b).
Definicja 11.1.12 Mówimy, że f ma w x0 nieciągłość pierwszego rodzaju, jeżeli f nie jest ciągła w x0 , ale istnieją
granice jednostronne limx→x− f (x) i limx→x+ f (x). W przeciwnym razie mówimy, że f ma w x0 nieciągłość drugiego
0
0
rodzaju.
Twierdzenie 11.1.13 Funkcja f ma w x0 nieciągłość pierwszego rodzaju wtedy i tylko wtedy gdy limx→x− f (x) 6=
0
limx→x+ f (x) lub limx→x− f (x) = limx→x+ f (x) 6= f (x0 ).
0
0
0
180
ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI
Twierdzenie 11.1.14 Jeśli f : (a, b) → R jest funkcją słabo rosnącą, to każdy jej punkt nieciągłości jest pierwszego
rodzaju. Ponadto
∀x0 ∈ (a, b)
∀x1 , x2 , x3 ∈ (a, b)
lim f (x) ¬ f (x0 ) ¬ lim+ f (x),
x→x−
0
x→x0
x1 < x2 < x3 ⇒ lim+ f (x) ¬ f (x2 ) ¬ lim− f (x).
x→x1
x→x3
Analogiczne własności ma funkcja słabo malejąca.
Dowód:
11.1.7
Ciągłość bijekcji monotonicznej
Twierdzenie 11.1.15 Niech (a, b) i (c, d) będą otwartymi przedziałami w R i niech f : (a, b) → (c, d) będzie bijekcją
rosnącą. Wtedy f jest ciągła.
Dowód:
11.2
Ciągłość, a zwartość
Funkcje ciągłe mają wiele pożytecznych własności. Jednakże wiele z tych własności wymaga, by zbiory na których funkcje
są określone miały pewne sprzyjające tym własnościom cechy. Do cech takich należą rozważane w tym rozdziale zwartość,
spójność oraz zupełność.
11.2.1
Zwartość podprzestrzeni Rd .
Przyczyny braku zbieżności mogą być różne. Ciąg
a : N1 3 n 7→
1
+ (−1)n → R
n
11.2. CIĄGŁOŚĆ, A ZWARTOŚĆ
181
Rysunek 11.1: Funkcja ciągła na zbiorze domkniętym i ograniczonym jest ograniczona
nie jest zbieżny, bo nie może się zdecydować czy zbiegać do 1 czy do −1. Inaczej: można z niego wybrać podciągi zbieżne
do dwóch różnych granic. Z kolei ciąg
a : N1 3 n 7→ 2n → R,
w ogóle nie posiada podciągu zbieżnego. Ale temu można zaradzić zmieniając przestrzeń R na R̄. Wtedy ten ciąg staje
się zbieżny do +∞. Można pokazać, że w R̄ każdy ciąg posiada podciąg zbieżny. Przestrzenie topologiczne, które mają
taką własność są z wielu powodów mile widziane. Do takich zaliczają się przestrzenie zwarte. Ponieważ ich ogólna definicja
jest nieco skomplikowana, podamy ją oddzielnie w rozdz. 11.2.3. Jednak w następującym ważnym przypadku szczególnym
definicja jest prosta.
Definicja 11.2.1 Niech X będzie podprzestrzenią przestrzeni metrycznej Rd z metryką euklidesową. Mówimy, że
przestrzeń X jest zwarta jeśli X jako podzbiór Rd jestdomknięty i ograniczony.
Domkni˛ete i ograniczone podzbiory w Rn maja˛ też inne przydatne własności. Rysunek 11.1 pokazuje, że należy oczekiwać iż funkcja ciagła
˛ f na domkni˛etym
i ograniczonym podzbiorze Rn jest ograniczona.
Rysunek 11.2 z kolei pokazuje, że założenie iż zbiór jest ograniczony jest istotne.
Co wi˛ecej, sama domkni˛etość przedziału nie wystarcza. Przedział [0, ∞), też jest domkni˛ety, ale funkcja
[0, ∞) 3 x 7→ x2 ∈ R
jest nieograniczona. Zatem istotne jest, by rozważać przedział domkni˛ety i ograniczony. Rozważania te sugeruja,˛ że prawdziwe powinno być nast˛epujace
˛
twierdzenie (formułujemy je dla najprostszego przypadku).
Twierdzenie 11.2.2 Niech f : [a, b] → R b˛edzie funkcja˛ ciagł
˛ a.˛ Wtedy f jest funkcja˛ ograniczona.˛
11.2.2
(*)Intuicja zwartości i ogólna definicja zwartości.
Potencjalny dowód tw. 11.2.2 mógłby przebiegać tak: Do y ∈ im f dobieram x ∈ [a, b] takie, że f (x) = y oraz Vx ∈ ONb(x) takie, że
u ∈ Vx ⇒ f (u) ∈ [y − 1, y + 1].
182
ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI
Rysunek 11.2: Funkcja ciągła na przedziale otwartym (a, b) nie musi być ograniczona
Mamy
[a, b] ⊂
[
{ Vx | x ∈ [a, b] }.
Mówimy, że rodzina zbiorów { Vx | x ∈ [a, b] } stanowi pokrycie otawrte przedziału [a, b]. Gdyby było możliwe zastapienie
˛
tego pokrycia podpokryciem skończonym, to znaczy wybranie skończonej ilości punktów x1 , x2 , . . . xk ∈ [a, b], tak, by
[a, b] ⊂
k
[
V xi ,
i=1
to otrzymalibyśmy
f ([a, b]) ⊂
k
[
[f (xi ) − 1, f (xi ) + 1]
i=1
a stad
˛ f ([a, b]) ⊂ [c, d], gdzie
c := min { f (xi ) − 1 | i = 1, 2, . . . k } d := max { f (xi ) + 1 | i = 1, 2, . . . k }
i dowód byłby zakończony. Okazuje si˛e, że jedynymi podzbiorami w Rn , które maja˛ własność istnienia podpokrycia skończonego dla dowolnego pokrycia otwartego
sa˛ zbiory domkni˛ete i ograniczone. Niestety nie jest to prawda˛ w dowolnej przestrzeni metrycznej. Ponieważ pomysł polegajacy
˛ na wybraniu z nieskończonego
pokrycia zbioru pewnego podpokrycia skończonego przydaje si˛e w wielu dowodach, dlatego warto wyróżnić klas˛e zbiorów majacych
˛
taka˛ własność. Zbiory takie
nazywane sa˛ zbiorami zwartymi.
Co wi˛ecej, okazuje si˛e, że zwartość zbioru nie zależy od topologii przestrzeni, w której zbiór jest zanurzony, a tylko od topologii indukowanej w zbiorze. Dlatego
mówimy też o przestrzeniach zwartych.
Niech X będzie przestrzenią metryczną i A ⊂ X.
Definicja 11.2.3 Mówimy, że zbiór A jestS
zwarty jeżeli dla każdej rodziny C ⊂ Open(X) takiej, że A ⊂
skończona podrodzina C 0 ⊂ C taka, że A ⊂ C 0 .
S
C istnieje
Definicja 11.2.4 Mówimy, że przestrzeń metryczna X jest zwarta, jeżeli X traktowane jako zbiór w przestrzeni X
jest zbiorem zwartym.
11.2. CIĄGŁOŚĆ, A ZWARTOŚĆ
183
Definicja 11.2.5 Klasę przestrzeni zwartych oznaczać będziemy Comp.
11.2.3
Przestrzenie zwarte
Niech X będzie ustaloną przestrzenią metryczną. Poniższe twierdzenie pokazuje, że zwartość jest własnością zbioru zależną
jedynie od metryki indukowanej w tym zbiorze, a nie od metryki w całej przestrzeni.
Twierdzenie 11.2.6 Niech Y ⊂ X będzie podprzestrzenią X, a A ⊂ Y . Zbiór A jest zwarty w Y wtedy i tylko wtedy
gdy jest zwarty w X.
Twierdzenie 11.2.7 Każdy zwarty zbiór A ⊂ X jest domknięty.
Twierdzenie 11.2.8 Podzbiór domknięty zbioru zwartego jest zbiorem zwartym.
Twierdzenie 11.2.9 Niech K ⊂ X będzie zbiorem zwartym, a E ⊂ K jego nieskończonym podzbiorem. Wtedy zbiór
punktów skupienia E 0 6= ∅.
Twierdzenie 11.2.10 Niech E ⊂ Rd . Następujące warunki są równoważne.
(i) E jest domknięty i ograniczony.
(ii) E jest zwarty.
(iii) Każdy nieskończony podzbiór zbioru E ma punkt skupienia należący do E.
Zatem ogólna definicja zwartości w przypadku podzbiorów Rd jest równoważna definicji, którą podaliśmy wcześniej.
Twierdzenie 11.2.11 Przestrzeń R̄ jest zwarta.
11.2.4
Obraz zbioru zwartego przez odwzorowanie ciągłe.
Ustalmy przestrzenie metryczne X, Y oraz funkcję f : X → Y .
Twierdzenie 11.2.12 Jeśli f jest ciągła, a A ⊂ X jest zwarty, to f (A) jest zwarty.
Dowód: (*)
184
ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI
Rysunek 11.3: Funkcja ciągła na przedziale zwartym osiąga swoje kresy
Wniosek 11.2.13 Zachodzą następujące własności.
(i) Jeśli f : X → Rd jest ciągła, a K ⊂ X jest zwarty, to f (K) jest domknięty i ograniczony.
(ii) Jeśli przestrzeń X jest zwarta, a f : X → Rd jest ciągła, to f jest ograniczona.
(iii) Jeśli f : [a, b] → Rd jest ciągła, to jest ograniczona.
11.2.5
Funkcja ciągła na przedziale zwartym osiąga swoje kresy
Twierdzenie 11.2.14 Jeśli X jest przestrzenią zwartą, a f : X → R jest ciągła oraz m := inf f (X), M := sup f (X),
to istnieją p, q ∈ X takie, że f (p) = m i f (q) = M .
Dowód:
11.2.6
Funkcja odwrotna do funkcji ciągłej
Twierdzenie 11.2.15 Jeśli f : X → Y jest ciągłą bijekcją, a X jest zwarty, to f −1 jest ciągłe.
Dowód:
11.3. JEDNOSTAJNA CIĄGŁOŚĆ
11.3
185
Jednostajna ciągłość
Definicja 11.3.1 Funkcja f : X → Y jest jednostajnie ciągła wtedy i tylko wtedy gdy
∀ > 0 ∃δ > 0 ∀x, y ∈ X
ρX (x, y) < δ ⇒ ρY (f (x), f (y)) < .
Twierdzenie 11.3.2 Jeśli f : X → Y jest jednostajnie ciągła, to f jest ciągła.
Twierdzenie 11.3.3 Jeśli f : X → Y jest ciągła, a X jest przestrzenią zwartą, to f jest jednostajnie ciągła.
Dowód:
11.3.1
Funkcje Lipschitza
Definicja 11.3.4 f : X → Y jest funkcją Lipschitza jeżeli istnieje stała L > 0 taka, że
∀x1 , x2 ∈ X
ρY (f (x1 ), f (x2 )) ¬ LρX (x1 , x2 ).
186
ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI
Rysunek 11.4: Funkcja jednostajnie ciągła, która nie jest funkcją Lipschitza
Twierdzenie 11.3.5 Jeśli f : X → Y jest funkcją Lipschitza, to jest funkcją jednostajnie ciągłą.
11.4
Ciągłość, a spójność
11.4.1
Spójne podzbiory R̄.
Intuicja przestrzeni spójnej jest bardzo prosta. Jest to taka przestrzeń, która nie rozpada si˛e na dwa lub wi˛ecej kawałków. Formalna definicja jest jednak nieco
skomplikowana. Dlatego najpierw podamy definicj˛e spójności dla przestrzeni metrycznych b˛edacych
˛
podzbiorami R̄
Definicja 11.4.1 Niech X ⊂ R̄ będzie podprzestrzenią. Mówimy, że X jest przestrzenią spójną jeżeli X jest przedziałem w R̄.
11.4.2
(*)Przestrzenie spójne
Niech X będzie przestrzenią metryczną.
Definicja 11.4.2 Mówimy, że zbiór E ⊂ X jest niespójny, jeżeli istnieją rozłączne zbiory A, B ∈ Open(X) takie, że
A ∩ E 6= ∅ 6= B ∩ E oraz E ⊂ A ∪ B. Jeśli takie zbiory nie istnieją, mówimy, że E jest spójny.
Twierdzenie 11.4.3 Niech E ⊂ R̄. E jest zbiorem spójnym, wtedy i tylko wtedy gdy
∀x, y, z ∈ E
z ∈ (x, y) ⇒ z ∈ E.
11.4. CIĄGŁOŚĆ, A SPÓJNOŚĆ
187
Wniosek 11.4.4 Zbiory spójne w R̄ to przedziały.
Zatem ogólna definicja spójności w przypadku podzbiorów R̄ jest równoważna definicji, którą już podaliśmy.
11.4.3
Obraz zbioru spójnego przez odwzorowanie ciągłe.
Twierdzenie 11.4.5 Niech f : X → Y będzie odwzorowaniem ciągłym. Jeśli E ⊂ X jest spójny, to f (E) jest zbiorem
spójnym.
Dowód:
Wniosek 11.4.6 Jeśli a, b ∈ R̄, a < b i f : [a, b] → R̄ jest odwzorowaniem ciągłym, to f ([a, b]) jest przedziałem
domkniętym.
11.4.4
Własność Darboux.
Wniosek 11.4.7 (własność Darboux) Jeśli a, b ∈ R̄, a < b, f : [a, b] → R̄ jest odwzorowaniem ciągłym oraz f (a) <
f (b) to dla każdego c ∈ [f (a), f (b)] istnieje ξ ∈ [a, b] takie, że f (ξ) = c.
Własność Darboux zobrazowano na rys. 11.5
188
ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI
Rysunek 11.5: Własność Darboux.
Rozdział 12
Szeregi
12.1
Eksperymenty numeryczne
12.1.1
Przybliżanie liczby π polami wielokątów wpisanych w koło.
W rozdziale 1.3.2 zaprezentowaliśmy metod˛e przybliżania liczby π poprzez pola wielokatów
˛
wpisanych w koło i zauważyliśmy, że stosowny ciag
˛ (1.4) jest
szeregiem. Przyjrzyjmy si˛e teraz zachowaniu tego szeregu od strony numerycznej Program wyznaczajacy
˛ wyrazy ciagu
˛ (1.4) w Mathematica jest przedstawiony
na listingu 12.1, a w j˛ezyku C++ na listingu 12.2
Uruchamiajac
˛ program łatwo sprawdzić, że metoda oparta o pola przy zastosowaniu tego samego typu double daje znacznie dokładniejsze wyniki niż
metoda poprzednia, bo już 26-ta suma cz˛esciowa daje wartość
s26 = 3.141592653589793,
która jest poprawnym przybliżeniem liczby π do ostatniej cyfry włacznie.
˛
12.1.2
Warunek konieczny zbieżności szeregu
Twierdzenie 12.1.1 Jeśli szereg
P∞
n=1 cn
jest zbieżny, to ciag
˛ cn zmierza do zera.
Nie jest to jednak warunek wystarczajacy,
˛ bo na przykład o szeregu
∞
X
1
n
n=1
zwanym szeregiem harmonicznym, można pokazać, że nie jest zbieżny w sensie definicji Cauchy’ego.
Pogrupujmy wyrazy szeregu harmonicznego w porcje kolejno po jeden, dwa, cztery itd.
∞
X
1
1 1
1 1 1 1
=1+
+
+
+ + +
+ ...
n
2 3
4 5 6 7
n=1
189
190
ROZDZIAŁ 12. SZEREGI
( ∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z p o l a w i e l o k ą t ó w foremnych
wpisanych w okrąg o ś r e d n i c y j e d e n
∗)
P i B y F i e l d [ d_ ] :=
Module [ { s , m, n , a } ,
n = 2;
m = 4 ; ( ∗ I l o ś ć boków w i e l o k ą t a , na p o c z ą t e k kwadrat ∗ )
a = Sqrt [ 2 . ] / 2 ;
( ∗ Bok k o l e j n y c h w i e l o k ą t ó w ∗ )
s = 2 ; (∗ c z t e r o k r o t n e pole ko lejnego wielokąta ∗)
Do[
Print [ "s[" , n , " ]= " , NumberForm[ s , 1 6 ] ] ;
s = s + m∗ a ∗ ( 1 − Sqrt [ 1 − a ∗ a ] ) ;
a = Sqrt [ 2 − Sqrt [ 4 − 4∗ a ∗ a ] ] / 2 ;
m = m∗ 2 ;
n = n + 1,
{d}
];
s
]
Listing 12.1: Wyznaczenie ciągu przybliżeń liczby π w języku Mathematica w oparciu o pola wielokątów
Tak wi˛ec sumy kolejnych porcji to
T0
T1
T2
T3
...
Tk
:=
1
1 1
+
:=
2 3
1 1 1 1
:=
+ + +
4 5 6 7
1 1
1
1
1
1
1
1
:=
+ +
+
+
+
+
+
8 9 10 11 12 13 14 15
...
2k+1
X−1 1
.
:=
n
k
n=2
Na listingach 12.3 i 12.4 przedstawiono program odpowiednio w Mathematica i w C++, który liczy sumy kolejnych porcji Tk dla szeregu harmonicznego.
Wynik działania programu sugeruje, że sumy te sa˛ wi˛eksze od pewnej stałej c > 0, co w dalszym toku udowodnimy formalnie. Na razie zaobserwujmy, że
konsekwencja˛ tego faktu jest
m
2
X
1
­ mc.
n
n=1
Zatem sumy cz˛eściowe szeregu harmonicznego moga˛ być wi˛eksze od dowolnie zadanej liczby.
12.1.3
Rozbieżność do nieskończoności
Mówimy, że ciag
˛ xn jest rozbieżny do nieskończoności, jeżeli zachodzi warunek
∀M > 0∃N > 0∀n ∈ N n > N ⇒ xn > M.
Możemy wi˛ec powiedzieć, że sumy cz˛eściowe szeregu
P∞
1
n=1 n
sa˛ rozbieżne do nieskończoności.
12.1. EKSPERYMENTY NUMERYCZNE
191
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ P i B y F i e l d . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z p o l a w i e l o k ą t ó w foremnych ∗/
/∗ wpisanych w okrąg o p r o m i e n i u j e d e n
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
i n t m=4; /∗ I l o ś ć boków w i e l o k ą t a , na p o c z ą t e k kwadrat . ∗/
/∗ Bok k o l e j n y c h w i e l o k ą t ó w wpisanych w k o ł o o ś r e d n i c y j e d e n .
Na p o c z ą t e k bok kwadratu ∗/
double a=s q r t ( 2 . 0 ) / 2 ;
/∗ Zmienna s z a w i e r a c z t e r o k r o t n e p o l e k o l e j n e g o w i e l o k ą t a .
Zaczynamy od kwadratu , k t ó r y ma p o l e 1 / 2 . ∗/
double s =2;
i n t nmax=30;
f o r ( i n t n=2;n<nmax ; n=n+1){
c o u t << "
s[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << s ;
c o u t << e n d l ;
/∗ C z t e r o k r o t n e p o l e k o l e j n e g o w i e l o k ą t a
p r z y r a s t a o c z t e r o k r o t n e p o l e m t ró k ąt ów równobocznych ∗/
s=s+m∗ a∗(1− s q r t (1−a ∗ a ) ) ;
m=m∗ 2 ; /∗ Podwajamy i l o ś ć boków ∗/
a=s q r t (2− s q r t (4−4∗ a ∗ a ) ) / 2 ; /∗ I wyznaczamy k o l e j n y bok ∗/
}
}
Listing 12.2: Wyznaczenie ciągu przybliżeń liczby π w C++ w oparciu o pola wielokątów
192
ROZDZIAŁ 12. SZEREGI
( ∗ A n a l i z a zachowania s z e r e g u harmonicznego ∗ )
H a r m o n i c S e r i e s [ d_ ] := Module [ { s , n , k } ,
k = 0;
Do[
s = 0.;
n = 2^k ;
( ∗ Obliczamy sumę wyrazów s z e r e g u od 2^k do 2^{ k+1}−1 ∗ )
Do[
s = s + 1./n ;
n = n + 1,
{2^ k}
];
Print [ "T[" , k , " ]= " , NumberForm[ s , 1 6 ] ] ;
k = k + 1,
{d}
];
]
Listing 12.3: Obliczanie sumy
P2k+1 −1
n=2k
1
n
w Mathematica
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ H a r m o n i c S e r i e s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ A n a l i z a zachowania s z e r e g u harmonicznego
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
double m=1; /∗ Będziemy sumować w p o r c j a c h po m d l a m= 1 , 2 , 4 , . . . ∗/
f o r ( i n t k=0;k <25; k=k+1){
double s =0;
/∗ Obliczamy sumę wyrazów s z e r e g u od m=2^k do 2m−1=2^{k+1}−1 ∗/
f o r ( double n=m; n<m∗2;++n ) {
s=s +1/n ;
}
c o u t << "T[" << k << " ]= " << s << e n d l ;
m=m∗ 2 ; /∗ K o l e j n a p o r c j a b ę d z i e dwa r a z y w i ę k s z a ∗/
}
}
Listing 12.4: Obliczanie sumy
P2k+1 −1
n=2k
1
n
w C++
12.2. WŁASNOŚCI PODSTAWOWE
193
Co ciekawe, szereg
∞
X
(−1)n
n=1
1
n
jest zbieżny.
Ćwiczenie komputerowe 12.1.2 Adaptuj program z listingu 12.3 i/lub listingu 12.4 do prześledzenia zachowania szeregów
∞
X
1
√
n
n=1
i
∞
X
1
.
n2
n=1
Co sadzisz
˛
na temat ich zbieżności?
12.2
Własności podstawowe
12.2.1
Pojęcie szeregu
Niech X będzie albo ciałem R albo ciałem C.
Definicja 12.2.1 Dla k ∈ N parę ciągów x, s : Nk → X nazywamy szeregiem jeżeli
sn =
n
X
xi .
i=k
Element xn nazywamy n-tym wyrazem szeregu, a element sn nazywamy n-tą sumą częściową szeregu. Mówimy, że
szereg jest zbieżny, jeżeli ciąg jego sum częściowych jest zbieżny. Jeśli ciąg sum częściowych jest zbieżny, to jego granicę
nazywamy sumą szeregu i oznaczamy
∞
X
xi .
i=k
P∞
W praktyce symbolem i=k xi zazwyczaj oznaczamy nie tylko sumę szeregu, co jest sensowne tylko jeśli szereg jest
zbieżny, ale także sam szereg. To czy mamy na myśli szereg, czy jego sumę, rozstrzygamy na podstawie kontekstu.
Twierdzenie 12.2.2 Szereg
P∞
i=k
xi jest zbieżny wtedy i tylko wtedy gdy
∀ > 0∃N ∈ Nk ∀m ­ n ­ N
|
m
X
xi | < .
i=n
Dowód:
Własność ta oznacza, że ciąg sum częściowych szeregu spełnia warunek Cauchy’ego. Zatem teza wynika z zupełności
przestrzeni R lub C.
P∞
Wniosek 12.2.3 Jeśli szereg n=1 xn jest zbieżny, to limn→∞ xn = 0.
Definicja 12.2.4 Szereg
P∞
i=k
xi nazywamy bezwzględnie zbieżnym, jeżeli szereg
P∞
i=k
|xi | jest zbieżny.
194
ROZDZIAŁ 12. SZEREGI
Twierdzenie 12.2.5 Jeśli szereg
P∞
i=k
xi jest bezwzględnie zbieżny to jest zbieżny oraz
|
∞
X
xi | ¬
∞
X
i=k
|xi |.
i=k
Dowód:
Ponieważ ciąg sum częściowych dla szeregu wartości bezwzględnych spełnia warunek Cauchy’ego, więc, jak łatwo sprawdzić, również ciąg sum częściowych wyjściowego szeregu spełnia ten warunek i teza wynika z zupełności R lub C.
12.2.2
Szereg geometryczny
Definicja 12.2.6 Niech a, q ∈ C, a 6= 0. Szereg
P∞
n=0
aq n , nazywamy szeregiem geometrycznym.
Twierdzenie 12.2.7 Szereg geometryczny jest zbieżny gdy |q| < 1. W przeciwnym razie jest on rozbieżny.
Dowód: Wiemy, że
sn = a
1 − q n+1
.
1−q
Zatem, jeśli |q| < 1, to
lim sn =
n→∞
a
,
1−q
czyli szereg jest zbieżny. Natomiast jeśli |q| ­ 1, to ciąg aq n na pewno nie jest zbieżny do zera, więc nie jest spełniony
warunek konieczny zbieżności.
Twierdzenie 12.2.8 (Kryterium porównawcze) Jeśli ciągi a, b : N → R mają wyrazy nieujemne i istnieje N ∈ N
takie, że an ¬ bn dla n ­ N , to:
P∞
P∞
• jeśli n=1 bn jest zbieżny, to n=1 an jest zbieżny,
P∞
P∞
• jeśli n=1 an jest rozbieżny, to n=1 bn jest rozbieżny.
Dowód:
Jest to wniosek z zupełności przestrzeni R.
P∞
P∞
Wniosek 12.2.9 Niech n=k zn będzie szeregiem liczb zespolonych,
P∞a n=k xn zbieżnym szeregiem liczb rzeczywistych. Jeśli istnieje n ∈ N takie, że |zn | ¬ xn dla n ­ N , to szereg n=k zn jest bezwzględnie zbieżny.
12.3. KRYTERIA ZBIEŻNOŚCI
195
12.3
Kryteria zbieżności
12.3.1
Szereg
P∞
1
n=1 np .
Twierdzenie 12.3.1 Niech a : N → R będzie ciągiem o wyrazach nieujemnych. Szereg
tylko wtedy gdy jego ciąg sum częściowych jest ograniczony.
Dowód:
Twierdzenie 12.3.2 Niech ciąg a : N1 → R+ będzie słabo malejący. Rozważmy ciąg
b : N0 3 n 7→ 2n a2n ∈ R+ .
P∞
P∞
Wtedy zbieżność szeregu n=1 an jest równoważna zbieżności szeregu n=0 bn .
Dowód:
Wniosek 12.3.3 Szereg
Dowód:
P∞
1
n=1 np
jest zbieżny dla p > 1, a rozbieżny dla p ¬ 1.
P∞
n=1
an jest zbieżny wtedy i
196
ROZDZIAŁ 12. SZEREGI
12.3.2
Kryterium Leibniza
Twierdzenie 12.3.4 (Leibniza P
o szeregu naprzemiennym) Niech a : N0 → R+ będzie ciągiem słabo malejącym i
∞
zbieżnym do zera. Wtedy szereg n=0 (−1)n an jest zbieżny oraz dla dowolnego m ∈ N1
2m−1
X
(−1)n an ¬
n=0
∞
X
(−1)n an ¬
n=0
2m
X
(−1)n an .
n=0
Dowód:
12.3.3
Kryterium Cauchy’ego i kryterium d’Alemberta
Badaniem zbieżności szeregów zajmowali się w szczególności matematycy francuscy: najpierw Jean le Rond d’Alembert
(rys. 12.1), a następnie Augustin Louis Cauchy (rys. 1.5). Podali oni następujące kryteria zbieżności szeregów.
Twierdzenie 12.3.5 (Kryterium Cauchy’ego i d’Alemberta) Niech a : N → C będzie ciągiem oraz
α := lim sup
n→∞
p
n
|an |,
β := lim sup
n→∞
|an+1 |
.
|an |
Wtedy:
• jeśli α < 1 to
P∞
an jest zbieżny,
• jeśli β < 1 to
P∞
an jest zbieżny,
• jeśli α > 1 to
P∞
n=0
n=0
an jest rozbieżny,
P∞
• jeśli istnieje N ∈ N takie, że aan+1
> 1 dla n ­ N , to n=0 an jest rozbieżny.
n
Dowód:
n=0
12.3. KRYTERIA ZBIEŻNOŚCI
197
Rysunek 12.1: Jean le Rond d’Alembert, 1717-1783, Źródło: Wikipedia
12.3.4
Szeregi potęgowe
P∞
Definicja 12.3.6 Szeregiem potęgowym nazywamy szereg postaci n=0 cn z n , gdzie z ∈ C jest ustalonym parametrem,
a ciąg c : N0 → C jest tzw. ciągiem współczynników szeregu potęgowego.
198
ROZDZIAŁ 12. SZEREGI
Twierdzenie 12.3.7 Niech
Wtedy szereg
|z| = R.
P∞
n=0 cn z
n
P∞
n=0 cn z
n
będzie szeregiem potęgowym, α := lim supn→∞

1

 α gdy 0 < α < ∞,
R := 0
gdy α = ∞,


∞ gdy α = 0.
p
n
|cn |, a
jest zbieżny dla |z| < R, a rozbieżny dla |z| > R. Kryterium nie rozstrzyga zbieżności gdy
Dowód:
Jest to wniosek z kryterium Cauchy’ego dla szeregów.
12.4
Operacje na szeregach
12.4.1
Suma i iloczyn szeregów
Dowód:
Stosujemy do sum częściowych tw. granicy sumy i iloczynu ciągów.
12.4. OPERACJE NA SZEREGACH
Dowód:
12.4.2
(**)Permutacja szeregu i zbieżność bezwarunkowa
199
200
ROZDZIAŁ 12. SZEREGI
12.4.3
(**)Twierdzenie Riemanna
12.4.4
Szeregi w programie Mathematica
Program Mathematica dość dobrze
radzi sobie z liczeniem sum szeregów, a w przypadku braku zbieżności sygnalizuje ten
P∞
fakt. Do policzenia sumy szeregu i=p an używamy instrukcji
Sum[a[n],{n,p,Infinity}]
Na przykład
Sum[1/n!, {n, 2, Infinity}]
P∞ 1
zwraca n=2 n!
= −2 + e. Oznacza to, że Mathematica, w miarę swoich umiejętności, stara się zwrócić wynik dokładny,
używając symbolicznych oznaczeń na stałe matematyczne.
Rozdział 13
Funkcje wykładnicza, logarytmiczna i
trygonometryczne
13.1
Funkcja wykładnicza i logarytmiczna
13.1.1
Zespolona funkcja wykładnicza
Następujące twierdzenie pozwala przybliżać liczbę e za pomocą szeregów i to znacznie szybciej niż w przypadku ciągu,
którym posłużyliśmy się przy jej definiowaniu
Twierdzenie 13.1.1
∞
X
1
= e.
n!
n=0
Dowód:
Łatwo sprawdzić za pomocą kryterium d’Alemberta, że dla dowolnego z ∈ C szereg
∞
X
zn
n!
n=0
jest zbieżny. Rozważać zatem możemy funkcję
E : C 3 z 7→ E(z) :=
201
∞
X
zn
∈ C.
n!
n=0
202
ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
Twierdzenie 13.1.2 Funkcja E ma następujące własności:
(i) E(0) = 1 oraz E(1) = e,
(ii) dla dowolnych z1 , z2 ∈ C
E(z1 + z2 ) = E(z1 )E(z2 ),
(iii) dla dowolnego z ∈ C mamy E(z) 6= 0 oraz
E(−z) =
1
,
E(z)
(iv) E jest funkcją ciągłą,
(v) dla dowolnego z ∈ C
¯
E(z̄) = E(z).
Dowód:
Definicja 13.1.3 Funkcję E nazywamy zespoloną funkcją wykładniczą. Stosujemy dla niej również tradycyjną notację
ez := E(z) :=
13.1.2
Funkcja wykładnicza ex
∞
X
zn
∈ C.
n!
n=0
13.1. FUNKCJA WYKŁADNICZA I LOGARYTMICZNA
203
Twierdzenie 13.1.4 Istnieje dokładnie jedna funkcja ciągła f : R → R+ taka, że f (1) = e oraz dla dowolnych
x, y ∈ R zachodzi f (x + y) = f (x)f (y). Jest ona zwana funkcją wykładniczą o podstawie e. Powszechnie stosowaną
notacją dla f (x) jest ex , a sama funkcja f jest oznaczana
exp : R 3 x 7→ ex ∈ R+ .
Funkcja ta ma również następujące własności:
(i) dla dowolnych p ∈ Z oraz q ∈ N1
p
eq =
√
q
ep ,
(ii) jest silnie rosnąca,
(iii) limx→∞ ex = ∞, limx→−∞ ex = 0,
(iv) dla dowolnego n ∈ N mamy limx→∞ xn e−x = 0.
Dowód:
13.1.3
Logarytm naturalny
Funkcja exp, jako bijekcja silnie rosnąca z R do R+ , ma funkcję odwrotną, która jest bijekcją silnie rosnącą z R+ do R.
Definicja 13.1.5 Funkcję tę nazywamy logarytmem naturalnym i oznaczamy
ln : R+ 3 x 7→ ln x ∈ R.
Z definicji tej wynika w szczególności, że dla dowlnych x ∈ R+ i y ∈ R równość y = ln x jest równoważna równości
x = ey .
204
ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
Twierdzenie 13.1.6 Funcja ln ma następujące własności:
(i) jest silnie rosnąca,
(ii) ln 1 = 0, ln e = 1,
(iii) dla dowolnych x, y ∈ R+ , n ∈ N
ln(xy) = ln x + ln y,
ln
x
= ln x − ln y,
y
ln xn = n ln x,
ln
√
n
x=
ln x
,
n
(iv) limx→∞ ln x = ∞, limx→0 ln x = −∞,
(v) dla dowolnych p ∈ N, q ∈ Z+ , x ∈ R+
p
e q ln x =
√
q
p
xp = x q .
Dowód:
W programie Mathematica logarytm naturalny oznaczany jest Log.
13.1.4
Funkcja wykładnicza ax
Przy pomocy logarytmu naturalnego możemy zdefiniować funkcję wykładniczą o dowolnej podstawie a ∈ R+ .
Definicja 13.1.7 Funkcję wykładniczą o podstawie a ∈ R+ definiujemy wzorem
R 3 x 7→ ax := ex ln a ∈ R+ .
13.2
Funkcje trygonometryczne
13.2.1
Nawijanie prostej na okrąg
Zespolona funkcja wykładnicza pozwoli nam też podać formalną i czysto analityczną definicję funkcji trygonometrycznych.
Zacznijmy od następującej uwagi:
Uwaga 13.2.1 Funkcja
R 3 x 7→ eix ∈ S 1
jest dobrze określona i ciągła.
(13.1)
13.2. FUNKCJE TRYGONOMETRYCZNE
205
Rysunek 13.1: Wykres funkcji R 3 t 7→ eit ∈ S1 .
Dowód:
Funkcję daną wzorem (13.1) określa się często mianem nawijania prostej na okrąg. Terminologię tę wyjaśnia rys. 13.1
13.2.2
Funkcje sin i cos
Możemy teraz podać czysto analityczną definicję funkcji sin oraz cos. Analizując własności tych funkcji stopniowo przekonamy
się, że pokrywają się one z funkcjami sin i cos zdefiniowanymi geometrycznie.
Definicja 13.2.2 Funkcje cos i sin definiujemy wzorami
eix + e−ix
∈ [−1, 1]
2
eix − e−ix
=
∈ [−1, 1].
2i
cos
: R 3 x 7→ re eix =
sin
:
R 3 x 7→ im eix
206
ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
( ∗ O b l i c z a n i e f u n k c j i s i n u s za pomocą r o z w i n i ę c i a w s z e r e g ∗ )
S i n S e r i e s [ x_ , d_ ] :=
Module [ { s , znak , s i l n i a , y , n } ,
s = 0 ; znak = 1 ; s i l n i a = 1 ; y = x ; n = 0 ;
Do[
s = s + znak ∗y/ s i l n i a ;
znak = −znak ;
s i l n i a = s i l n i a ∗(2∗n + 2)∗(2∗ n + 3 ) ;
y = y∗x∗x ;
n = n + 1,
{d}
];
s
]
Listing 13.1: Wyznaczenie wartości funkcji sin w programie Mathematica w oparciu o rozwinięcie w szereg
Uwaga 13.2.3 Funkcje sin i cos są ciągłe. Ponadto dla każdego x ∈ R zachodzą wzory:
cos x =
∞
X
(−1)k
k=0
e
x2k
(2k)!
ix
sin x =
∞
X
k=0
(−1)k
x2k+1
(2k + 1)!
= cos x + i sin x
2
cos x + sin2 x = 1.
Dowód:
Program, który przybliża wartości funkcji sin w oparciu o szereg w uwadze 13.2.3 przedstawiono na listingach 13.1
(Mathematica) i 13.2 (C++).
13.2. FUNKCJE TRYGONOMETRYCZNE
207
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ S i n S e r i e s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e f u n k c j i s i n u s za pomocą r o z w i n i ę c i a w s z e r e g ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
double p i = 3 . 1 4 1 5 9 2 6 5 3 5 8 9 7 9 3 ;
double x=p i / 6 ;
double y=x ;
i n t nmax=10 , znak =1 , s i l n i a =1;
double s =0;
f o r ( i n t n=0;n<nmax ; n=n+1){
s=s+znak ∗y/ s i l n i a ;
c o u t << "
s[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << s ;
c o u t << e n d l ;
s i l n i a = s i l n i a ∗ ( 2 ∗ n +2)∗(2∗ n +3);
y=y∗x∗x ;
znak=−znak ;
}
}
Listing 13.2: Wyznaczenie wartości funkcji sin w C++ w oparciu o rozwinięcie w szereg
208
ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
Ćwiczenie komputerowe 13.2.4
• Sprawdź zachowanie się programu z listingu 13.2 dla zmiennej x inicjalizowanej wartościami π4 , π3 , π2 , π, 2π. Co obserwujesz w zachowaniu się ciągu przybliżeń? Jakie rodzą się pytania?
• Adaptuj program z listingów 13.1 i 13.2 do liczenia wartości funkcji cos wykorzystując fakt, że
cos x = 1 −
∞
X
x2
x4
x2n
+
− ... =
.
(−1)n
1·2 1·2·3·4
(2n)!
n=0
Oceń poprawność i przydatność implementacji wykorzystując argument, w którym wartość funkcji cos jest Ci
znana.
Lemat 13.2.5 Zachodzą następujące wzory
cos 0 = 1,
sin 0 = 0,
cos 2 < 0,
x ∈ (0, 2] ⇒ sin x > 0.
Dowód:
13.2.3
Liczba π
Dysponujemy teraz wystarczającą maszynerią, by podać analityczną, a nie geometryczną definicję liczby π.
Wniosek 13.2.6 Zbiór dodatnich miejsc zerowych funkcji cos jest domknięty i niepusty. W szczególności jego kres
dolny jest dodatni i też jest miejscem zerowym funkcji cos.
Definicja 13.2.7 Liczbę π definiujemy jako podwojone najmniejsze dodatnie miejsce zerowe funkcji cos. Innymi słowy
π := 2 inf { x ∈ R+ | cos x = 0 }.
13.2.4
Okresowość
Definicja 13.2.8 Niech F oznacza ciało liczb rzeczywistych lub ciało liczb zespolonych. Mówimy, że funkcja f : F −→
◦ F
jest okresowa wtedy i tylko wtedy gdy istnieje takie t ∈ F , że dla każdego x ∈ dom f mamy x + t ∈ dom f oraz
f (x + t) = f (x). Liczbę t nazywamy wtedy okresem funkcji f . Jeśli istnieje najmniejszy okres dodatni funkcji f
nazywamy go okresem podstawowym funkcji f
13.2. FUNKCJE TRYGONOMETRYCZNE
209
Twierdzenie 13.2.9 Mamy następujące własności:
(i) funkcja exp : C → C jest okresowa o okresie 2πi,
(ii) funkcje sin, cos : R → [−1, 1] są okresowe o okresie 2π,
(iii) t ∈ (0, 2π) ⇒ eit 6= 1,
(iv) dla każdego z ∈ S 1 istnieje dokładnie jedno t ∈ [0, 2π) takie, że eit = z.
Dowód:
Wniosek 13.2.10 Okresem podstawowym funkcji sin i cos jest 2π.
Dowód:
13.2.5
Wzory trygonometryczne
Twierdzenie 13.2.11 Dla dowolnych x, y ∈ R zachodzą wzory
sin(x + y)
=
sin x cos y + cos x sin y,
cos(x + y)
=
cos x cos y − sin x sin y.
210
ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
Dowód:
Twierdzenie 13.2.12 (wzór de Moivre’a) Dla dowolnego x ∈ R oraz n ∈ N zachodzi wzór
n
(cos x + i sin x) = cos nx + i sin nx.
Dowód:
Część III
Rachunek różniczkowy i całkowy
211
Rozdział 14
Przestrzenie wektorowe
14.1
Definicja przestrzeni wektorowej
Zaproponowana przez Kartezjusza algebraizacja geometrii poprzez wprowadzenie układu współrz˛ednych na płaszczyźnie oraz geometryczna interpretacja liczb
zespolonych zaowocowały wprowadzeniem w XIXw. koncepcji wektorów jako zaczepionych w poczatku
˛ układu n-wymiarowej przestrzeni zorientowanych odcinków, które można dodawać podobnie jak dodaje si˛e liczby rzeczywiste i zespolone. Intuicyjne wyobrażenie geometryczne wektora możliwe jest jedynie w
przestrzeni dwu- i trójwymiarowej, bo jedynie z takimi przestrzeniami maja˛ do czynienia nasze zmysły. Od strony algebraicznej wektor to po prostu układ n liczb
zwanych współrz˛ednymi wektora. Dodawanie wektorów metoda˛ geometryczna˛ sprowadza si˛e do konstrukcji przekatnej
˛ rozpi˛etego na wektorach równoległoboku.
W przypadu płaszczyzny pokrywa si˛e to z geometryczna˛ interpretacja˛ sumy liczb zespolonych przedstawiona˛ na rysunku 8.4. Wektory wraz z operacja˛ dodawania
stanowia˛ grup˛e. Poza wymiarem dwa wektory nie da si˛e jednak zdefiniować mnożenia wektorów tak, by uzyskać struktur˛e ciała. Możliwe jest jednak mnożenie
wektora przez liczb˛e, które sprowadza si˛e do stosownej zmiany jego długości i, w przypadku mnożenia liczby ujemnej, symetrycznego odbicia wzgl˛edem poczatku
˛
układu.
Powyższe idee prowadza˛ do koncepcji przestrzeni wektorowej nad zadanym ciałem.
14.1.1
Przestrzeń wektorowa
Definicja 14.1.1 Niech F będzie ciałem i niech 1 oznacza element neutralny względem mnożenia w ciele F . Przestrzenią wektorową nad F nazywamy piątkę (X, F, +, ·, 0) taką, że (X, +, 0) jest grupą abelową, a
·:F ×X →X
jest działaniem (tzw. działaniem zewnętrznym) spełniającym dla dowolnych α, β ∈ F oraz x, y ∈ X warunki
(W1) (α + β)x = αx + βx,
(W2) α(x + y) = αx + αy,
(W3) α(βx) = (αβ)x,
(W4) 1.x = x.
Elementy ciała F określa się często mianem skalarów, a o działaniu zewnętrznym mówi się, że jest to mnożenie przez
skalary. Klasę przestrzeni wektorowych nad ciałem F oznaczać będziemy Vect(F ).
213
214
ROZDZIAŁ 14. PRZESTRZENIE WEKTOROWE
Przykład 14.1.2 Klasycznym przykładem przestrzeni wektorowej jest Rn nad ciałem R. Elementami tej przestrzeni
są n-tki (zwane również krotkami lub po prostu wektorami) postaci x = (x1 , x2 , . . . xn ), gdzie xi ∈ R są liczbami
rzeczywistymi. Sumę x = (x1 , x2 , . . . xn ) i y = (y1 , y2 , . . . yn ) definiuje się wzorem
x + y := (x1 + y1 , x2 + y2 , . . . xn + yn ),
a mnożenie wektora x przez skalar α ∈ R wzorem
αx := (αx1 , αx2 , . . . αxn ).
Łatwo sprawdzić, że jest to rzeczywiście przestrzeń wektorowa. W podobny sposób konstruujemy przestrzeń wektorową
F n dla dowolnego ciała F , na przykład dla ciała liczb zespolonych.
Przykład 14.1.3 Niech A będzie dowolnym ustalonym zbiorem. Niech F (A, R) oznacza zbiór wszystkich funkcji
f : A → R. Dla f, g ∈ F (A, R) definiujemy sumę f + g jako funkcję
f + g : A 3 x 7→ f (x) + g(x) ∈ R,
a mnożenie funkcji f przez skalar α ∈ R jako funkcję
αf : A 3 x 7→ αf (x) ∈ R.
Łatwo sprawdzić, że jest to rzeczywiście przestrzeń wektorowa. Jeśli X jest przestrzenią topologiczną, to w podobny
sposób konostruujemy przestrzeń funkcji ciągłych z X do R oznaczaną jako C(A, R)
Przykład z przestrzenią wektorową funkcji ograniczonych sygnalizuje, że pożytki ze stosowania tego pojęcia mogą wykraczać poza wektory na płaszczyźnie i ich uogólnienia na Rn . W istocie, można pokazać, że przestrzeń B(A) nie jest
izomorficzna z przestrzenią Rn dla żadnego n.
14.2
Przestrzenie wektorowe z iloczynem skalarnym
Poprzez interpretacj˛e wektorów na płaszczyźnie jako liczb zespolonych wiemy, że można je nie tylko dodawać, ale i mnożyć z zachowaniem własności ciała.
Uzyskanie struktury ciała dla wektorów w przestrzeni trówymiarowej i wyższych wymiarach nie jest możliwe. Natomiast bardzo pożyteczny jest iloczyn skalarny.
Jest to odwzorowanie, które parze wektorów (v, w) przyporzadkowuje
˛
liczb˛e v · w b˛edac
˛ a˛ iloczynem długości wektora w przez długość rzutu prostopadłego
wektora v na prosta,˛ w której zawiera si˛e wektor w, wzi˛eta ze znakiem plus, jeśli kat˛ mi˛edzy wektorami jest ostry i znakiem minus w przeciwnym razie. Łatwo
sprawdzić, że tak zdefiniowany iloczyn skalarny jest przemienny i wyraża si˛e wzorem
v · w = |v||w| cos α
gdzie |v| i |w| oznaczaja˛ długości wektorów v i w, a α jest katem
˛
pomi˛edzy nimi. Ze wzoru tego wynikaja˛ od razu najważniejsze własności iloczynu skalarnego:
wektory v i w sa˛ prostopadłe wtedy i tylko wtedy gdy v · w = 0 oraz v · v = |v|2 .
W praktyce wygodne jest przyj˛ecie aksjomatycznej definicji iloczynu skalarnego.
14.2.1
Iloczyn skalarny
14.3. PRZESTRZENIE WEKTOROWE UNORMOWANE
215
Definicja 14.2.1 Niech X będzie przestrzenią wektorową nad R. Odwzorowanie ϕ : X × X → R nazywamy iloczynem
skalarnym jeżeli dla wszystkich x, y, z ∈ X oraz α ∈ R spełnione są następujące warunki:
(IS1) ϕ(x + y, z) = ϕ(x, z) + ϕ(y, z),
(IS2) ϕ(αx, y) = αϕ(x, y),
(IS1) ϕ(x, y) = ϕ(y, x),
(IS1) ϕ(x, x) ­ 0 i ϕ(x, x) = 0 ⇔ x = 0.
Iloczynem skalarnym w Rd jest odwzorowanie
(x1 , x2 , . . . , xd ), (y1 , y2 , . . . , yd ) 7→
d
X
xi yi .
i=1
Wzór na iloczyn skalarny w Rd jest podstawa˛ definiowania ilocznu skalarnego w innych przestrzeniach. W szczególności w pewnych przestrzeniach ciagów
˛
Rb
P∞
iloczynem skalarnym jest i=1 xi yi , a w pewnych przestrzeniach funkcyjnych iloczynem skalarnym jest a f (x)g(x)dx.
14.2.2
Nierówność Cauchy-Schwartza
Twierdzenie 14.2.2 (Nierówność Cauchy-Schwartza) Niech X będzie przestrzenią wektorową nad R z iloczynem
skalarnym ϕ. Dla dowolnych x, y ∈ X mamy
p
p
|ϕ(x, y)| ¬ ϕ(x, x) ϕ(y, y).
Dowód: Rozważmy funkcję
µ : R 3 t 7→ ϕ(x + ty, x + ty) ∈ [0, ∞).
Wykorzystując własności iloczynu skalarnego dostajemy dla dowolnego t ∈ [0, ∞)
0 ¬ µ(t) = t2 ϕ(x, x) + 2tϕ(x, y) + ϕ(y, y).
Zatem wyróżnik w tej nierówności kwadratowej musi być niedodatni, tj.
4ϕ(x, y)2 − 4ϕ(x, x)ϕ(y, y) ¬ 0
co dowodzi tezy.
Wniosek 14.2.3 Dla (x1 , x2 , . . . , xd ), (y1 , y2 , . . . , yd ) ∈ Rd mamy
v
v
u d
u d
d
uX uX
X
t
2
|
xi yi | ¬
xi t
yi2 .
i=1
14.3
i=1
i=1
Przestrzenie wektorowe unormowane
W przestrzeniach wektorowych przydałoby się pojęcie odległości, tak byśmy mogli nadać jej strukturę przestrzeni metrycznej
i rozważać zbiory otwarte i domknięte oraz granice. Jeśli mamy do dyspozycji koncepcję długości wektora, to odległość dwóch
wektorów można zdefiniować jako długość ich różnicy. Dlatego przydałaby się aksjomatyczna definicja długości wektora, która
gwarantowałaby, że wydobyć z niej można odległość.
216
ROZDZIAŁ 14. PRZESTRZENIE WEKTOROWE
14.3.1
Norma
Definicja 14.3.1 Niech X będzie przestrzenią wektorową nad R. Odwzorowanie || · || : X → R∗ nazywamy normą w
X jeżeli dla wszystkich x, y ∈ X oraz α ∈ R
(N1) ||x|| = 0 ⇔ x = 0,
(N2) ||αx|| = |α| ||x||,
(N3) ||x + y|| ¬ ||x|| + ||y||.
Twierdzenie 14.3.2 Jeśli ϕ jest iloczynem skalarnym w przestrzeni wektorowej X, to
p
||x||ϕ := ϕ(x, x)
zadaje w tej przestrzeni normę.
Dowód: Własności (N1) i (N2) są oczywiste. Aby sprawdzić własność (N3) zauważmy, że
p
p
||x + y||2ϕ = ϕ(x + y, x + y) = ϕ(x, x) + 2ϕ(x, y) + ϕ(y, y) ¬ ϕ(x, x) + 2 ϕ(x, y) ϕ(x, y) + ϕ(y, y) = (||x||ϕ + ||y||ϕ )2
14.3.2
Norma euklidesowa
Definicja
14.3.3 Normę w Rd pochodzącą od iloczynu skalarnego
qP
d
2
i=1 xi nazywamy normą euklidesową.
Pd
i=1
xi yi , tj. normę daną wzorem ||x|| :=
W Rd zadać można również normy nie pochodzące od iloczynu skalarnego, na przykład normą jest ||x||1 :
Pd
i=1
|xi |.
Definicja 14.3.4 Przestrzeń wektorową nad ciałem F z zadaną normą nazywamy przestrzenią wektorową unormowaną. Klasę takich przestrzeni oznaczać będziemy NVect(F ).
14.3.3
Przestrzenie Hilberta i Banacha
Twierdzenie 14.3.5 Niech ||.|| będzie normą w przestrzeni wektorowej X. Wtedy wzór
ρ(x, y) := ||x − y||
określa w X metrykę.
14.3. PRZESTRZENIE WEKTOROWE UNORMOWANE
217
Rysunek 14.1: Stefan Banach, 1892 - 1945
Definicja 14.3.6 Przestrzeń wektorową z iloczynem skalarnym, zupełną nazywamy przestrzenią Hilberta. Przestrzeń
wektorową unormowaną, zupełną nazywamy przestrzenią Banacha.
Poj˛ecie przestrzeni Hilberta i przestrzeni Banacha pozwala metody opracowane dla przestrzeni Rn stosować w przestrzeniach funkcyjnych. Sa˛ to różnego
rodzaju przestrzenie, w których rol˛e wektorów pełnia˛ funkcje.
218
ROZDZIAŁ 14. PRZESTRZENIE WEKTOROWE
Rozdział 15
Pochodne i różniczki.
15.1
Pochodna funkcji
15.1.1
Definicja pochodnej
W rozdziale wst˛epnym wprowadziliśmy intuicyjna˛ koncepcj˛e pochodnej funkcji f : R → R w punkcie x0 jako współczynnika kierunkowego nachylenia stycznej
do wykresu poprowadzonej w punkcie (x0 , f (x0 )). Współczynnik kierunkowy prostej w układzie współrz˛ednych x i y to tangens kata
˛ jaki tworzy ta prosta z osia˛
x. Łatwo jest policzyć ten współczynnik dla siecznej poprowadzonej przez punkty (x0 , f (x0 )) i (x1 , f (x1 )). Z rysunku 15.1 wnosimy, że tangens ten to iloraz
f (x1 ) − f (x0 )
,
x1 − x0
zwany ilorazem różnicowym. Ustalajac
˛ x0 i przybliżajac
˛ x1 do x0 przybliżamy sieczna˛ do stycznej w (x0 , f (x0 )). Można zatem oczekiwać, że współczynnik
kierunkowy siecznej zmierza do współczynnika kierunkowego stycznej. Niech h := x1 − x0 b˛edzie przyrostem zmiennej x wzgl˛edem punktu x0 . Iloraz
różnicowy można wtedy zapisać jako
f (x0 + h) − f (x0 )
,
h
a współczynnik kierunkowy stycznej w (x0 , f (x0 )) jako
lim
h→0
f (x0 + h) − f (x0 )
h
(15.1)
co prowadzi do definicji pochodnej funkcji f w punkcie x0 .
Choć powyższa interpretacja dotyczy funkcji o wartościach w zbiorze liczb rzeczywistych, granica (15.1) ma sens również wtedy, gdy funkcja f ma wartości
w przestrzeni wektorowej Rm , zatem nasza formalna definicja b˛edzie nieco ogólniejsza.
Niech f : (a, b) → Rm będzie funkcją określoną na przedziale otwartym (a, b) ⊂ R o wartościach w Rm . Ustalmy punkt
x0 ∈ (a, b)
Definicja 15.1.1 Mówimy, że funkcja f jest różniczkowalna w punkcie x0 jeżeli w Rm istnieje granica
lim
h→0
f (x0 + h) − f (x0 )
.
h
Granicę tę nazywamy pochodną funkcji f w punkcie x0 i oznaczamy f 0 (x0 ). Jeśli f ma pochodną w każdym punkcie
x ∈ (a, b) to mówimy, że f jest różniczkowalna na przedziale (a, b) i definiujemy również funkcję
f 0 : (a, b) 3 x 7→ f 0 (x) ∈ Rm ,
którą nazywamy funkcją pochodną funkcji f .
219
220
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Rysunek 15.1: Styczna i sieczna do krzywej.
Pochodzenie określenia "różniczkowalna" wyjaśnimy w rozdziale 15.2.4.
15.1.2
Pochodna funkcji stałej i identycznościowej.
Twierdzenie 15.1.2 (o pochodnej funkcji stałej) Funkcja stała
cR : (∞, ∞) 3 x 7→ c ∈ R.
ma pochodną w każdym punkcie oraz
(cR )0 = 0R
co czasami zapisujemy mniej formalnie, ale krócej jako
c0 = 0.
Dowód: Rzeczywiście, dla funkcji stałej iloraz różnicowy wynosi
cR (x + h) − cR (x)
c−c
=
= 0,
h
h
więc granica ilorazu różnicowego jako granica funkcji stale równej zero wynosi zero. Dowodzi to naszej tezy.
15.1. POCHODNA FUNKCJI
221
Twierdzenie 15.1.3 (o pochodnej identyczności) Funkcja identycznościowa
idR : R 3 x 7→ x ∈ R.
ma pochodną w każdym punkcie oraz
(idR )0 = 1R
co czasami zapisujemy mniej formalnie, ale krócej jako
x0 = 1.
Dowód: Dla funkcji identycznościowej iloraz różnicowy wynosi
idR (x + h) − idR (x)
(x + h) − x
h
=
= = 1,
h
h
h
więc granica ilorazu różnicowego jako granica funkcji stale równej jeden wynosi jeden. Dowodzi to naszej tezy.
Przykład 15.1.4 Rozważmy funkcję
f : R 3 x 7→ |x| ∈ R.
Jeśli x jest dodatnie, to dla dostatecznie małych h również x + h jest dodatnie, zatem wtedy |x| = x, |x + h| = x + h
czyli w tym przypadku iloraz różnicowy wynosi
|x + h| − |x|
(x + h) − x
h
f (x + h) − f (x)
=
=
= = 1.
h
h
h
h
Jeśli x jest ujemne, to dla dostatecznie małych h również x + h jest ujemne, zatem wtedy |x| = −x, |x + h| = −x − h
czyli w tym przypadku iloraz różnicowy wynosi
f (x + h) − f (x)
|x + h| − |x|
(−x − h) − (−x)
−h
=
=
=
= −1.
h
h
h
h
Dla x = 0 iloraz różnicowy może wynosić tak jeden jak i minus
Podsumowując,


−1
0
f (x) = nie istnieje


1
15.1.3
jeden, w zależności od znaku h, więc nie ma granicy.
gdy x < 0,
gdy x = 0,
gdy x > 0.
Pochodna lewo- i prawostronna.
Ostatni przykład podpowiada, że, podobnie jak w przypadku granicy, warto też rozważać pochodne lewo- i prawostronne.
Niech f : [a, b] → Rm będzie funkcją określoną na przedziale domkniętym [a, b].
222
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Definicja 15.1.5 Niech x0 ∈ (a, b]. Mówimy, że f ma pochodną lewostronną w x0 jeśli w Rm istnieje granica lewostronna
f (x0 + h) − f (x0 )
lim−
.
(15.2)
h
h→0
0
Granicę tę nazywamy pochodną lewostronną funkcji f w x0 i oznaczamy f−
(x0 ). Podobnie, jeśli x0 ∈ [a, b) to mówimy,
m
że f ma pochodną prawostronną w x0 jeśli w R istnieje granica prawostronna
f (x0 + h) − f (x0 )
.
h
lim
h→0+
(15.3)
0
Granicę tę nazywamy pochodną prawostronną funkcji f w x0 i oznaczamy f+
(x0 ).
Przykład 15.1.6 Funkcja f w przykładzie 15.1.4 ma w zerze pochodną lewostronną równą -1 oraz pochodną prawostronną równą 1.
Ćwiczenie 15.1.7 Pokaż, że funkcja f : (a, b) → Rm ma w punkcie x0 ∈ (a, b) pochodną wtedy i tylko wtedy gdy
ma w tym punkcie tak pochodną lewostronną jak i prawostronną i są one sobie równe.
W dalszym ciągu wygodnie będzie również rozważać różniczkowalność funkcji określonej na przedziale domkniętym.
Definicja 15.1.8 Mówimy, że funkcja f : [a, b] → Rm jest różniczkowalna jeśli ma pochodną w każdym punkcie
przedziału (a, b), pochodną prawostronną w a i pochodną lewostronną w b.
W przypadku funkcji różniczkowalnej f : [a, b] → Rm wygodnie jest mówić krótko o pochodnej f w a i w b rozumiejąc
przez to odpowiednio pochodną prawostronną w a i lewostronną w b.
15.1.4
Ciągłość funkcji różniczkowalnej
W dalszych rozdziałach podamy szereg twierdzeń gwarantujących istnienie pochodnej, co pozwoli nam konstruować znacznie
bardziej zaawansowane przykłady. Na koniec tego rozdziału podajmy następujące twierdzenie określające warunek konieczny
istnienia pochodnej.
Twierdzenie 15.1.9 Jeśli funkcja f : (a, b) → Rm ma w punkcie x0 ∈ (a, b) pochodną to jest w tym punkcie ciągła.
Dowód: Aby pokazać ciągłość f w x0 ustalmy > 0. Na mocy definicji pochodnej istnieje granica
lim
h→0
f (x0 + h) − f (x0 )
.
h
Z definicji granicy dla 0 = 1 znajdziemy δ 0 > 0 takie, że jeśli h ∈ (−δ 0 , δ 0 ) to
f (x0 + h) − f (x0 )
0
− f (x0 ) < 1.
h
W szczególności
f (x0 + h) − f (x0 ) f (x0 + h) − f (x0 )
0
¬
− f (x0 ) + |f 0 (x0 )| < 1 + |f 0 (x0 )|.
h
h
(15.4)
Weźmy δ := min(δ 0 , 1+|f 0 (x0 )| ). Z (15.4) dla h ∈ (−δ, δ) mamy
|f (x0 + h) − f (x0 )| < (1 + |f 0 (x0 )|)|h| ¬ co pokazuje, że limh→0 f (x) = f (x0 ) i dowodzi, że f jest ciągła w x0 .
15.2. RÓŻNICZKA FUNKCJI
223
Rysunek 15.2: Aproksymacja liniowa funkcji f w punkcie (x0 , f (x0 )) w lokalnym układzie współrzędnych (x̄, ȳ).
Ćwiczenie 15.1.10 Uogólnić twierdzenie 15.1.9 na przypadek funkcji f : [a, b] → Rm .
15.2
Różniczka funkcji
15.2.1
Aproksymacja liniowa
Interpretacja pochodnej jako współczynnika kierunkowego nachylenia stycznej w danym punkcie do wykresu nie jest jedyna˛ użyteczna˛ intuicja˛ w tym kontekście.
Poj˛ecie pochodnej wiaże
˛ si˛e również z idea˛ przybliżania funkcji funkcja˛ liniowa.˛
Definicja 15.2.1 Funkcja liniowa R → Rn jednej zmiennej to funkcja postaci
R 3 t 7→ tv ∈ Rn
dla ustalonego v ∈ Rn . Wektor v (liczbę w przypadku n = 1) nazywać będziemy współczynnikiem funkcji liniowej
jednej zmiennej.
Funkcję taką oznaczać będziemy Lv , lub krótko L, jeśli współczynnik v jest nieistotny. Łatwo sprawdzić, że funkcja
liniowa jest ciągła i w zerze ma wartość zero.
Uwaga 15.2.2 Jeśli L : R → Rm jest funkcją liniową, to L = Lv dla v = L(1). Innymi słowy wartość funkcji liniowej
dla argumentu jeden jest równa jej współczynnikowi.
Funkcja liniowa daje si˛e bardzo prosto wyliczać, wi˛ec jest dobrym kandydatem na przybliżanie (lokalne) innych funkcji. Idea jest nast˛epujaca.
˛ Wiemy, że
pewna funkcja f ma w punkcie x0 wartość y0 := f (x0 ). Interesuje nas wartość funkcji f w punkcie x1 bliskm x0 , czyli y1 := f (x1 ). Czy dysponujac
˛
przyrostem zmiennej x, czyli róznica˛ x1 − x0 , możemy przy pomocy pewnej funkcji liniowej wyliczyć przybliżenie przyrostu zmiennej y , czyli różnic˛e y1 − y0 =
f (x1 ) − f (x0 )? Podkreślmy, że chodzi nam o funkcj˛e liniowa˛ w układzie współrz˛ednych przesuni˛etym do punktu (x0 , y0 ), a wi˛ec w układzie (x̄, ȳ), gdzie
x̄ := x − x0 , ȳ := y − y0 , zwanym lokalnym układem współrz˛ednych wzgl˛edem punktu (x0 , y0 ). Zwróćmy uwag˛e, że punkt o współrz˛ednych (x0 , y0 ) w
lokalnym układzie współrz˛ednych ma współrz˛edne (0, 0). Nasze pytanie można wi˛ec sformułować nast˛epujaco
˛ (rys. 15.2):
224
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Czy istnieje funkcja liniowa L w lokalnym układzie współrz˛ednych (x̄, ȳ), taka że
y1 − y0 ≈ ȳ = L(x̄) = L(x1 − x0 )?
Zwróćmy uwag˛e, że to pytanie należy uściślić. Jeśli przybliżenie rozumieć b˛edziemy jako wymóg, by w granicy, przy x → x0 , popełniony bład,
˛ czyli wyrażenie
y1 − y0 − L(x1 − x0 ) = f (x1 ) − f (x0 ) − L(x1 − x0 )
zmierzało do zera, to wymóg ten spełni każda funkcja liniowa, bo jako ciagła
˛ ma w zerze granic˛e równa˛ wartości, czyli zero. Naturalne jest jednak oczekiwanie, że
im bliżej znajdziemy si˛e x0 , tym przybliżenie b˛edzie lepsze.
Miara˛ jakości przybliżenia jest bład
˛ wzgl˛edem przyrostu x̄ = x1 − x0 mierzony ilorazem
f (x0 + x̄) − f (x0 ) − L(x̄)
y1 − y0 − L(x1 − x0 )
=
.
x1 − x0
x̄
Chcemy, by ten bład
˛ zmierzał do zera przy x̄ → 0. Niech L = Lv . Przy użyciu bardziej tradycyjnego oznaczenia h w miejsce x̄, nasz wymóg można zapisać
jako
lim
h→0
f (x0 + h) − f (x0 ) − hv
= 0,
h
co jak łatwo sprawdzić, sprowadza si˛e do żadania,
˛
by
f (x0 + h) − f (x0 )
= v.
h
Tak wi˛ec, jeśli stosowne przybliżenie liniowe istnieje, to współczynnik v jest pochodna˛ funkcji w punkcie x0 .
lim
h→0
Czasami wygodnie jest patrzeć na problem sprowadzony do zera. Jak widzieliśmy wygodnie jest przesunać
˛ układ współrz˛ednych tak, by interesujacy
˛ nas
punkt był w poczatku
˛ układu. Wygodnie jest też sprowadzić definiowania pochodnej do definiowania pochodnej równej zero. Z naszych wcześniejszych rozważań
wynika, że pochodna równa zero oznacza, że przybliżajaca
˛ funkcja liniowa ma współczynnik v równy zero. Funkcja liniowa z R do R o współczynniku zero ma
wykres b˛edacy
˛ linia˛ pozioma˛ przechodzac
˛ a˛ przez poczatek
˛ układu współrz˛ednych. Z drugiej strony, jeśli pochodna wynosi zero, to mamy
f (x0 + h) − f (x0 )
= 0.
h→0
h
lim
Zwrócmy uwag˛e, że funkcja,˛ której granic˛e tu rozważamy jest ϕ : h 7→ f (x0 + h) − f (x0 ), gdzie x0 traktujemy jako parametr. Przy tych oznaczeniach mamy
ϕ(h)
= 0.
h→0 h
lim
Z definicji granicy wiemy, że wtedy dla dowolnego > 0 istnieje δ > 0 taka, że dla |h| < δ mamy
ϕ(h) h <
lub równoważnie
|ϕ(h)| < |h|.
Funkcj˛e o tej własności nazywamy płaska˛ w zerze. Poj˛ecie to wyjaśnia rysunek 15.3.
Używajac
˛ j˛ezyka funkcji płaskich w zerze możemy powiedzieć, że f 0 (x) = a wtedy i tylko wtedy gdy funkcja
h 7→ f (x + h) − f (x) − ah
jest płaska w zerze. Jest tak, bo dla h = 0 mamy
f (x + 0) − f (x) − a · 0 = 0,
a, jak niebawem b˛edziemy w stanie policzyć formlnie, pochodna tej funkcji w zerze wynosi f 0 (x) − a.
15.2. RÓŻNICZKA FUNKCJI
225
Rysunek 15.3: Funkcja płaska w zerze. Każdy ze stożków po zawężeniu do stosownego otocznia zera zawiera fragment
wykresu.
15.2.2
Relacja "o małe"
Aby sformalizować opisane w poprzednim podrozdziale intuicje zaczniemy od podania definicji relacji "o małe", która przyda
się nie tylko w podaniu formalnej definicji płaskości w zerze, ale również w następnych rozdziałach.
Rozważmy f : (a, b) → Rm i g : (a, b) → R. Załóżmy ponadto, że istnieje V otoczenie x0 takie, że g(x) 6= 0 dla
x ∈ V \ {x0 }. Stawiamy definicję ogólną, ale warto zaznaczyć, że na początku interesować nas będzie głównie przypadek
szczególny gdy g jest funkcją identycznościową, t.j. gdy g(x) = x.
Definicja 15.2.3 Mówimy, że funkcja f jest o małe od funkcji g w otoczeniu punktu x0 i piszemy
f (x) = o(g(x)) przy x → x0 ,
jeżeli
∀ > 0 ∃δ > 0
|x − x0 | < δ ⇒ ||f (x)|| < |g(x)|.
Następującą uwagę można wywnioskować wprost z definicji granicy.
Uwaga 15.2.4 Relacja f (x) = o(g(x)) przy x → x0 zachodzi wtedy i tylko wtedy gdy
f (x0 ) = 0 i lim
x→x0
||f (x)||
= 0.
|g(x)|
Z uwagi tej łatwo wyprowadzić następujący wniosek
Wniosek 15.2.5 Relacja f (x) = o(g(x)) przy x → x0 zachodzi wtedy i tylko wtedy gdy istnieje funkcja ciągła ϕ : V →
Rm taka, że ϕ(x0 ) = 0 oraz f (x) = ϕ(x)g(x) dla x ∈ V .
Dowód: Wystarczy przyjąć
(
ϕ(x) :=
f (x)
g(x)
dla x 6= 0,
0
dla x = 0.
Z kolei z twierdzenia o granicy sumy i różnicy natychmiast dostajemy następujący wniosek.
226
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Wniosek 15.2.6 Jeśli istnieje V otoczenie x0 takie, że g(x) 6= 0 dla x ∈ V \ {x0 } oraz funkcje fi : R−→
◦ R spełniają
fi (x) = o(g(x)) przy x → x0 to również (f1 + f2 )(x) = o(g(x)) i (f1 − f2 )(x) = o(g(x)) przy x → x0
15.2.3
Płaskość w zerze
Podamy teraz formalną definicję płaskości funkcji w zerze. Niech f : (a, b) → Rm będzie funkcją o wartościach w Rm ,
określoną na przedziale otwartym (a, b) ⊂ R takim, że 0 ∈ (a, b).
Definicja 15.2.7 Mówimy, że f jest płaska w zerze jeżeli f (x) = o(x) przy x → 0.
Następująca uwaga wynika wprost z uwagi 15.2.4.
Uwaga 15.2.8 Funkcja f jest płaska w zerze wtedy i tylko wtedy gdy f (0) = 0 oraz
lim
x→0
f (x)
= 0.
x
Jeśli f jest płaska w zerze, to funkcja ϕ : (a, b) → Rm zdefiniowana wzorem
(
f (x)
gdy x 6= 0,
x
ϕ(x) :=
0
dla x = 0.
jest ciągła w zerze oraz f (x) = xϕ(x). Łatwo sprawdzić, że również na odwrót, jeśli funkcja ϕ o takich własnościach istnieje,
to f jest płaska w zerze. Mamy zatem następującą uwagę.
Uwaga 15.2.9 Funkcja f jest płaska w zerze wtedy i tylko wtedy gdy istnieje funkcja ϕ : (a, b) → Rm ciągła w zerze
taka, że ϕ(0) = 0 oraz f (x) = xϕ(x) dla x ∈ (a, b).
15.2.4
Różniczkowalność
Wróćmy teraz do idei przybliżania przyrostu funkcji funkcja˛ liniowa.˛ Wprowadźmy tradycyjne oznaczenia na przyrost wartości argumentu i przyrost wartości funkcji
(różnice) w punkcie x0 :
∆x := x − x0 ,
∆y
:= f (x) − f (x0 ).
Niech L = Lf 0 (x0 ) b˛edzie funkcja˛ liniowa˛ przybliżajac
˛ a˛ w loklanym układzie współrz˛ednych przyrost funkcji f . Wtedy
∆y ≈ L(∆x) = f 0 (x0 )∆x,
(15.5)
przy czym popełniony bład
˛ wzgl˛edny jest tym mniejszy im mniejsze jest ∆x. Leibniz nie dysponował precyzyjnym aparatem i mówił, że jeśli ∆x jest nieskończenie
małe, to przybliżona równość (15.5) staje si˛e równościa.˛ Takie nieskończenie małe różnice ∆x i ∆y nazywał różniczkami (malusieńkimi różnicami) i oznaczał
dy i dx. Używajac
˛ jego j˛ezyka napisalibyśmy, że różniczki dx i dy spełniaja˛ równanie
dy = f 0 (x)dx.
(15.6)
Problem w tym, że różniczki jako wielkości nieskończenie małe trudno jest precyzyjnie zdefiniować. Poj˛ecie różniczki odczarował A. Cauchy, traktujac
˛ równanie
(15.6) jako równanie odwzorowania liniowego przybliżajacego
˛
przyrost funkcji, a sama˛ różniczk˛e definiujac
˛ jako to przybliżajace
˛ odwzorowanie liniowe. I tak do
dziś rozumiemy różniczk˛e. Natomiast termin różniczkowalność, ze wzgl˛edu na bezpośredni zwiazek
˛ pomi˛edzy różniczka˛ i pochodna,˛ jest odnoszony zarówno do
istnienia pochodnej jak i różniczki, bo, jak zobaczymy, sa˛ to fakty równoważne.
15.2. RÓŻNICZKA FUNKCJI
227
Jak poprzednio, niech f : (a, b) → Rm będzie funkcją określoną na przedziale otwartym (a, b) ⊂ R o wartościach w Rm .
Rozważmy przyrost funkcji f w punkcie x0 ∈ (a, b), t.j. funkcję ∆x0 f : (a − x0 , b − x0 ) → Rm określoną wzorem
∆x0 f (h) := f (x0 + h) − f (x0 ).
Definicja 15.2.10 Funkcję f nazywamy różniczkowalną w punkcie x0 jeżeli istnieje funkcja liniowa L : R → Rm taka,
że funkcja ∆x0 f − L, czyli różnica funkcji ∆x0 f i funkcji L jest płaska w zerze. Odwzorowanie L nazywamy wtedy
różniczką funkcji f w punkcie x0 i oznaczamy dx0 f .
Aby powyższa definicja miała sens, musimy wiedzieć, że różniczka jest wyznaczona jednoznacznie. W istocie różniczka
jest wyznaczona przez pochodną, jak pokazuje następujące rozumowanie. Jeśli L jest różniczką fukcji f w punkcie x0 to z
płaskości w zerze funkcji ∆x0 f − L wnosimy, że
lim
h→0
∆x0 f (h) − L(h)
= 0.
h
Ponieważ L(h) = L(1)h, jest to równoważne warunkowi
∆x0 f (h)
− L(1) = 0
h→0
h
lim
oraz warunkowi
∆x0 f (h)
= L(1).
h→0
h
lim
Ponieważ ∆x0 f (h) = f (x0 + h) − f (x0 ), powyższa granica pokrywa się z granicą (15.1). Pokazaliśmy zatem następującą
uwagę.
Uwaga 15.2.11 Funkcja liniowa L : R → Rm jest różniczką funkcji f w punkcie x0 wtedy i tylko wtedy gdy L(1) jest
pochodną tej funkcji w punkcie x0 . W szczególności f jest różniczkowalna w puncie x0 wtedy i tylko wtedy gdy f ma
pochodną w punkcie x0 .
Tak więc, jeśli odwzorowanie liniowe L spełniające wymogi definicji 15.2.10 istnieje, to współczynnik L(1), a zatem i samo
odwzorowanie L są wyznaczone jednoznacznie.
Z uwagi 15.2.11 wynika, że stwierdzenia "f jest różniczkowalna" i "f ma pochodna"˛ moga˛ być używane zamiennie. Jednak poj˛ecia różniczki i pochodnej nie
sa˛ tożsame, choć sa˛ ściśle powiazane:
˛
wartość różniczki dla argumentu jeden jest pochodna.˛ Różniczka jest odwzorowaniem liniowym, które przemnaża argument
przez pochodna.˛ Koncepcja różniczki bazuje na aproksymacji liniowej funkcji w punkcie. Koncepcja pochodnej bazuje na stycznej do wykresu funkcji w punkcie.
Zwiazek
˛ mi˛edzy różniczka,˛ a pochodna˛ można wi˛ec też wyrazić stwierdzajac,
˛ że wykres aproksymacji liniowej funkcji f w zadanym punkcie jest prosta,˛ która
pokrywa si˛e ze styczna˛ do wykresu funkcji f w tym punkcie.
Zauważmy, że jeśli funkcja jest płaska w zerze, to ma pochodną w zerze równą zero. Rzeczywiście, na mocy uwagi 15.2.8
jeśli f jest płaska w zerze, to f (0) = 0 oraz limx→0 f (x)
x = 0. Tę ostanią granicę można przepisać jako
0 = lim
x→0
f (x)
f (0 + h) − f (0)
= lim
h→0
x
h
co oznacza, że f ma w zerze pochodną zero. Łatwo zauważyć, że można przeprowadzić również odwrotne wnioskowanie.
Prowadzi to do następującej uwagi.
Uwaga 15.2.12 Niech f : R−→
◦ Rm będzie funkcją określoną w otoczeniu zera. Funkcja f jest płaska w zerze wtedy i
tylko wtedy gdy f (0) = 0 i f 0 (0) = 0.
228
15.3
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Różniczkowanie sumy, różnicy, iloczynu i ilorazu
Naturalne jest pytanie czy znając pochodną dwóch funkcji możemy wyznaczyć pochodną sumy, różnicy, iloczynu i ilorazu
tych funkcji. Jest tak w istocie, jak pokazują następujące twierdzenia.
Twierdzenie 15.3.1 (o pochodnej sumy i różnicy) Niech f, g : (a, b) → Rm będą różniczkowalne w punkcie
x0 ∈ (a, b). Wtedy funkcje f + g i f − g są różniczkowalne w x0 oraz
(f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 )
i
(f − g)0 (x0 ) = f 0 (x0 ) − g 0 (x0 ).
Dowód: Iloraz różnicowy dla sumy f + g to
f (x0 + h) − f (x0 ) g(x0 + h) − g(x0 )
(f + g)(x0 + h) − (f + g)(x0 )
=
+
.
h
h
h
Ponieważ
lim
h→0
f (x0 + h) − f (x0 )
= f 0 (x0 )
h
i
lim
h→0
(15.7)
g(x0 + h) − g(x0 )
= g 0 (x0 ),
h
więc z (15.7) wnosimy, że
(f + g)(x0 + h) − (f + g)(x0 )
= f 0 (x0 ) + g 0 (x0 ),
h
co dowodzi tezy dla sumy. Dla różnicy dowód jest analogiczny.
Twierdzenie o pochodnej iloczynu przedstawimy dla funkcji o wartościach w zbiorze liczb zespolonych C. Oczywiście
twierdzenie to obejmuje również przypadek funkcji o wartościach rzeczywistych, bo zbiór liczb rzeczywistych traktujemy jako
podzbiór zbioru liczb zespolonych. Jako ćwiczenie zostawimy przypadek, gdy jedna funkcja przyjmuje wartości skalarne, a
druga wektorowe, a iloczyn funkcji jest rozumiany jako mnożenie skalara przez wektor oraz przypadek, gdy obie funkcje są
wektorowe, a iloczyn jest rozumiany jako iloczyn skalarny wektorów.
lim
h→0
Twierdzenie 15.3.2 (o pochodnej iloczynu) Niech f, g : (a, b) → C będą różniczkowalne w punkcie x0 ∈ (a, b).
Wtedy funkcja f g jest różniczkowalna w x0 oraz
(f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ).
Dowód: Iloraz różnicowy dla iloczynu f g to
(f g)(x0 + h) − (f g)(x0 )
h
=
=
=
f (x0 + h)g(x0 + h) − f (x0 )g(x0 )
h
f (x0 + h)g(x0 + h) − f (x0 + h)g(x0 ) + f (x0 + h)g(x0 ) − f (x0 )g(x0 )
h
g(x0 + h) − g(x0 ) f (x0 + h) − f (x0 )
f (x0 + h)
+
g(x0 )
h
h
Funkcja f jako różniczkowalna w x0 jest również ciągła w x0 , więc
g(x0 + h) − g(x0 ) f (x0 + h) − f (x0 )
+
g(x0 ) = f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 ).
lim f (x0 + h)
h→0
h
h
Zatem z otrzymanego wyżej przedstawienia ilorazu różnicowego dla iloczynu również
(f g)0 (x0 ) = lim
h→0
(f g)(x0 + h) − (f g)(x0 )
= f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 )
h
15.3. RÓŻNICZKOWANIE SUMY, RÓŻNICY, ILOCZYNU I ILORAZU
229
co dowodzi naszej tezy.
Z twierdzenia o pochodnej iloczynu i z faktu, że pochodna funkcji stałej wynosi zero dostajemy natychmiast następujący
wniosek.
Wniosek 15.3.3 Niech f : (a, b) → C będzie różniczkowalne w punkcie x0 ∈ (a, b) i niech c ∈ C będzie stałą. Wtedy
funkcja cf jest różniczkowalna w x0 oraz
(cf )0 (x0 ) = cf 0 (x0 ).
Z twierdzenia o pochodnej iloczynu wyprowadzimy też następujące twierdzenie
Twierdzenie 15.3.4 (o pochodnej funkcji potęgowej) Niech n ∈ N0 będzie ustaloną liczbą naturalną. Funkcja
potęgowa
R 3 x 7→ xn ∈ R
jest różniczkowalna. Jej pochodną jest funkcja
R 3 x 7→ nxn−1 ∈ R
co zapisujemy mniej formalnie, ale krócej jako
(xn )0 = nxn−1 .
Dowód: Dowód poprowadzimy indukcyjnie względem n. Dla n ∈ {0, 1} twierdzenie wynika natychmiast z twierdzeń 15.1.2 i 15.1.3. Załóżmy, że n > 1 oraz że twierdzenie zachodzi dla k < n. Funkcja x 7→ xn jest wtedy iloczynem
funkcji identycznościowej oraz funkcji x 7→ xn−1 . Z założenia indukcyjnego mamy 0 xn−1 )0 = (n − 1)xn−2 , bo n − 1 < n.
Zatem z twierdzenia o pochodnej iloczynu mamy
(xn )0 = (xxn−1 )0 = x0 xn−1 + x(n − 1)xn−2 = nxn−1
co dowodzi tezy.
Ćwiczenie 15.3.5 Niech α : (a, b) → R i f : (a, b) → Rm będą różniczkowalne w x0 ∈ (a, b). Pokaż, że funkcja
αf : (a, b) 3 x 7→ α(x)f (x) ∈ Rm
jest różniczkowalna w x0 oraz
(αf )0 (x0 ) = α0 (x0 )f (x0 ) + α(x0 )f 0 (x0 ).
Wyprowadź stosowny wniosek gdy funkcja α lub funkcja f jest stała.
Ćwiczenie 15.3.6 Niech f, g : (a, b) → Rm będą różniczkowalne w x0 ∈ (a, b). Pokaż, że funkcja
f · g : (a, b) 3 x 7→ f (x) · g(x) ∈ R
jest różniczkowalna w x0 oraz
(f · g)0 (x0 ) = f 0 (x0 ) · g(x0 ) + f (x0 ) · g 0 (x0 ).
Wyprowadź stosowny wniosek gdy funkcja f lub funkcja g jest stała.
230
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Twierdzenie 15.3.7 (o pochodnej ilorazu) Niech f, g : (a, b) → C będą różniczkowalne w x0 ∈ (a, b) i niech
g(x0 ) 6= 0. Wtedy funkcja
f (x)
x 7→
g(x)
jest dobrze określona w pewnym otoczeniu x0 i różniczkowalna w x0 oraz
0
f
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
(x0 ) =
.
2
g
(g(x0 ))
Dowód: Zauważmy, że funkcja g jako różniczowalna w x0 jest ciągła w x0 , skąd wnosimy, że własność g(x0 ) 6= 0 przenosi
się na pewne otoczenie x0 . Zatem iloraz funkcji f i g jest dobrze określony w pewnym otoczeniu punktu x0 . Iloraz różnicowy
dla ilorazu funkcji f i g to
f
f
f (x0 )
f (x0 +h)
(x
+
h)
−
0
g
g (x0 )
g(x0 +h) − g(x0 )
=
h
h
f (x0 + h)g(x0 ) − f (x0 )g(x0 + h)
=
hg(x0 )g(x0 + h)
f (x0 + h)g(x0 ) − f (x0 )g(x0 ) + f (x0 )g(x0 ) − f (x0 )g(x0 + h)
=
hg(x0 )g(x0 + h)
(f (x0 + h) − f (x0 )) g(x0 ) − f (x0 ) (g(x0 + h) − g(x0 ))
=
hg(x0 )g(x0 + h)
=
f (x0 +h)−f (x0 )
g(x0 )
h
0)
− f (x0 ) g(x0 +h)−g(x
h
g(x0 )g(x0 + h)
Przechodząc w otrzymanej równości z h do granicy w zerze dostajemy tezę.
Twierdzenie 15.3.8 (o pochodnej zestawienia) Niech fi : (a, b) → C będą funkcjami różniczkowalnymi w x0 ∈
(a, b) dla i = 1, 2, . . . m. Wtedy zestawienie f := (f1 , f2 , . . . fm ) : (a, b) → Cm jest różniczkowalne w x0 oraz
0
f 0 (x0 ) = (f10 (x0 ), f20 (x0 ), . . . , fm
(x0 ))
Dowód: Teza wynika natychmiast z twierdzenia o granicy zestawienia funkcji (tw. 10.8.1), gdyż
m
fi (x0 + h) − fi (x0 )
f (x0 + h) − f (x0 )
=
h
h
i=1
15.4
Różniczkowanie funkcji złożonej
Bardzo przydatna w liczeniu pochodnych jest informacja jak pochodna złożenia funkcji wyraża się poprzez pochodne funkcji
składanych. Nim przedstawimy stosowne twierdzenie, zajmiemy się twierdzeniem pomocniczym, które przyda się nam później
w dowodzie twierdzenia o różniczkowaniu złożenia.
∆ f (h)
Zauważmy, że jeśli f : R−→
◦ Rm jest różniczkowalna w x0 ∈ R, to funkcja h 7→ x0h
− f 0 (x0 ) ma w zerze granic˛e zero, choć sama w zerze
∆
f (h)
nie jest zdefiniowana, bo ułamek x0h
dla h = 0 nie ma sensu. Możemy jednak rozszerzyć t˛e funkcj˛e do funkcji r : R−→
◦ Rm , która z definicji w zerze
przyjmuje wartość zero. B˛edzie to funkcja ciagła
˛ i b˛edzie spełniać wzór
∆x0 f (h) − hv = hr(h).
15.4. RÓŻNICZKOWANIE FUNKCJI ZŁOŻONEJ
231
Okazuje si˛e, że implikacja odwrotna również zachodzi, co prowadzi do nast˛epujacego
˛
twierdzenia.
Twierdzenie 15.4.1 Niech f : R−→
◦ Rm będzie funkcją określoną w otoczeniu x0 ∈ R. Wtedy różniczkowalność f w
x0 jest równoważna istnieniu funkcji r : R−→
◦ Rm określonej i ciągłej w otoczeniu zera oraz wektora v ∈ Rm takich, że
r(0)
=
0
∆x0 f (h) − hv
=
hr(h).
Dowód: Załóżmy najpierw, że f jest różniczkowalna w x0 . Połóżmy v := f 0 (x0 ) oraz zdefiniujmy funkcję r wzorem
(
∆x0 f (h)
− v gdy x 6= 0
h
r(h) :=
0
w przeciwnym razie.
Oczywiście r jest określona w otoczeniu zera i spełnia wzór (15.8) Ponieważ f 0 (x0 ) = v, więc
∆x0 f (h)
−v =0
h→0
h
lim
co oznacza, że r jest również ciągła. Na odwrót, jeśli funkcja o postulowanych własnościach istnieje, to z jej ciągłości w zerze
wynika, że istnieje granica
∆x0 f (h)
,
lim
h→0
h
a tym samym f jest różniczkowalna w x0 .
Twierdzenie 15.4.2 (o pochodnej złożenia funkcji) Niech f : (a, b) → (c, d) będzie funkcją różniczkowalną w
x0 ∈ (a, b), a g : (c, d) → Rm funkcją różniczkowalną w f (x0 ). Wtedy złożenie g ◦ f jest różniczkowalne w x0 oraz
(g ◦ f )0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ).
Dowód: Z założenia o różniczkowalności f w x0 i g w f (x0 ) oraz z twierdzenia 15.4.1 wnosimy, że istnieje V otoczenie
zera oraz ciągłe, zerujące się w zerze funkcje ϕ, ψ : V → R takie, że dla h, k ∈ V
∆x0 f (h)
∆f (x0 ) g(k)
= f (x0 + h) − f (x0 ) = (f 0 (x0 ) + ϕ(h)) h
(15.8)
= g(f (x0 ) + k) − g(f (x0 )) = (g 0 (f (x0 )) + ψ(k)) k.
(15.9)
Ponieważ funkcja h 7→ (f 0 (x0 ) + ϕ(h)) h jest ciągła i zeruje się w zerze, więc istnieje W otoczenie zera takie, że dla h ∈ W
mamy
(f 0 (x0 ) + ϕ(h)) h ∈ V.
Zatem wzór (15.9) zachodzi również dla k = (f 0 (x0 ) + ϕ(h)) h przy h ∈ V . Mamy zatem dla h ∈ V
g(f (x0 ) + (f 0 (x0 ) + ϕ(h)) h) − g(f (x0 )) = (g 0 (f (x0 )) + ψ(f 0 (x0 ) + ϕ(h)) h) (f 0 (x0 ) + ϕ(h)) h.
(15.10)
Wykorzystując (15.8) oraz (15.10) otrzymujemy
∆x0 (g ◦ f )(h)
= g(f (x0 + h)) − g(f (x0 )) = g(f (x0 ) + (f 0 (x0 ) + ϕ(h)) h) − g(f (x0 ))
= (g 0 (f (x0 )) + ψ(f 0 (x0 ) + ϕ(h)) h) (f 0 (x0 ) + ϕ(h)) h.
Stąd
∆x0 (g ◦ f )(h)
= (g 0 (f (x0 )) + ψ(f 0 (x0 ) + ϕ(h)) h) (f 0 (x0 ) + ϕ(h)) .
h
Ponieważ tak ψ jak i ϕ zmierzają do zera przy h zmierzającym do zera, prawa strona powyższej równości zmierza do
g 0 (f (x0 ))f 0 (x0 ). Zatem również lewa strona jest zbieżna do g 0 (f (x0 ))f 0 (x0 ). Dowodzi to tezy, bo lewa strona to iloraz
różnicowy dla funkcji g ◦ f w x0 .
232
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
15.5
Różniczkowanie funkcji wykładniczej i funkcji trygonometrycznych
W rozdziale tym podamy wzory na pochodna˛ funkcji wykładniczej oraz funkcji trygonometrycznych. Wzory te uzyskamy badajac
˛ pochodna˛ funkcji
R 3 t 7→ etz ∈ C
(15.11)
dla ustalonej liczby zespolonej z ∈ C. Stosowny wzór podamy dla dowolnego zespolonego z , ale interesować nas b˛eda˛ głównie przypadki gdy z jest liczba˛
rzeczywista˛ badź
˛ liczba˛ urojona˛ i.
Zauważmy, że iloraz róznicowy dla funkcji (15.11) ma postać
ehz − 1
e(t+h)z − etz
= etz
,
h
h
wi˛ec interesować nas b˛edzie granica limh→0
ehz −1
h .
Lemat 15.5.1 Funkcja
C \ {0} 3 u 7→
eu − 1
∈C
u
ma w zerze granicę równą jeden.
Dowód: Przypomnijmy, że zgodnie z definicją 13.1.3 mamy
eu =
∞
X
un
,
n!
n=0
skąd
eu − 1 =
bo
u0
0!
∞
X
un
,
n!
n=1
= 1. Zatem dla dowolnego u ∈ C \ {0} mamy
P
P
u
∞
∞ un − 1
∞ un
X
n−1
e − 1
u
n=0
n=1
n!
n!
= −
1
−
1
=
−
1
=
−
1
u
u
u
n!
n=1
∞
∞
∞
X un−1 X
X
|u|n−1
|u|n−2
= = |u|
¬
n! n=2 n!
n!
n=2
n=2
Ponieważ interesuje nas tylko otoczenie zera, możemy założyć, że |u| < 1. Dla takich u dostajemy
u
∞
X
e − 1
1
¬ |u|
−
1
¬ |u|e.
u
n!
n=2
Tak więc dla |u| < 1 mamy
u
e − 1
0¬
− 1 ¬ |u|e.
u
Ponieważ prawa strona tej nierówności zmierza do zera przy u zmiarzającym do zera, z twierdzenia o trzech funkcjach
wnosimy, że
u
e − 1
lim − 1 = 0,
u→0
u
co dowodzi tezy.
15.5. RÓŻNICZKOWANIE FUNKCJI WYKŁADNICZEJ I FUNKCJI TRYGONOMETRYCZNYCH
233
Twierdzenie 15.5.2 Funkcja
R 3 t 7→ etz ∈ C
jest różniczkowalna, a jej pochodną jest funkcja
R 3 t 7→ zetz ∈ C
Dowód: Dla z = 0 rozważana funkcja jest stale równa jeden, zatem jest różniczkowalna, a jej pochodną jest funkcja stale
równa zero, co jest zgodne z tezą twierdzenia. Załóżmy zatem, że z 6= 0. Pochodną rozważanej funkcji w punkcie z jest
e(t+h)z − ez
ehz − 1
ehz − 1
= etz lim
= zetz lim
= zetz ,
h→0
h→0
h→0
h
h
hz
lim
bo z lematu 15.5.1 wiemy, że
ehz − 1
eu − 1
= lim
= 1.
u→0
h→0
hz
u
lim
Wniosek 15.5.3 (o różniczkowaniu rzeczywistej funkcji wykładniczej) Rzeczywista funkcja wykładnicza
R 3 x 7→ ex ∈ R+
jest różniczkowalna, a jej pochodną jest ona sama, co nieprecyzyjnie, ale zwięźle zapisujemy jako
(ex )0 = ex .
Dowód: Tezę dostajemy natychmiast z twierdzenia 15.5.2 po podstawieniu za z stałej jeden.
Twierdzenie 15.5.4 (o różniczkowaniu funkcji trygonometrycznych) Funkcje trygonometryczne: sin, cos, tg,
ctg są różniczkowalne w swojej dziedzinie i zachodzą wzory
(sin t)0 = cos t,
(cos t)0 = − sin t,
(tg t)0 =
1
,
cos2 x
(ctg t)0 = −
1
.
sin2 x
Dowód: Z twierdzenia 15.5.2 dla z = i oraz dla z = −i mamy
it
0
eit + e−it
e − e−it
1
1
(sin t)0 =
=
(eit )0 − (e−it )0 =
ieit + ie−it =
= cos t.
2i
2i
2i
2
Podobnie
0
(cos t) =
eit + e−it
2
0
=
1
1
eit − e−it
(eit )0 + (e−it )0 =
ieit − ie−it = −
= − sin t.
2
2
2i
Z twierdzenia o granicy ilorazu mamy
0
sin t
(sin t)0 cos t − sin t(cos t)0
cos t cos t − sin t(− sin t)
1
(tg t)0 =
=
=
=
.
cos t
cos2 t
cos2 t
cos2 t
Podobnie
(ctg t)0 =
cos t
sin t
0
=
(cos t)0 sin t − cos t(sin t)0
− sin t sin t − cos t(cos t)
1
=
=− 2 .
sin2 t
sin2 t
sin t
234
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
15.6
Nieciągłości pochodnej i funkcje klasy C 1 .
W przykładzie 15.1.4 pokazaliśmy, że funkcja x 7→ |x| nie posiada w zerze pochodnej. Oczywiście poza zerem jest różniczkowalna. Jej nieróżniczkowalność w zerze bierze się stąd, że pochodne lewostronna i prawostronna, choć istnieją, nie są sobie
równe. Poniższy przykład pokazuje, że nawet pochodne jednostronne mogą w pewnym punkcie nie istnieć.
Przykład 15.6.1 Rozważmy funkcję
(
x sin x1
R 3 x 7→
0
gdy x 6= 0,
dla x = 0.
Funkcja ta jest ciągła, a dla x 6= 0 różniczkowalna na podstawie twierdzenia o różniczkowaniu iloczynu, funkcji złożonej
i ilorazu. Dla x = 0 iloraz różnicowy ma postać
h sin h1
1
= sin .
h
h
Wiemy, że granica limh→0 sin h1 nie istnieje. Nie istnieją nawet stosowne granice jednostronne. Zatem rozważana funkcja
nie jest różniczowalna w zerze i nie posiada w zerze pochodnych jednostronnych.
Interesujące jest pytanie, czy jeśli funkcja jest różniczkowalna w każdym punkcie, to jej pochodna musi być funkcją
ciągłą. Okazuje się, że niekoniecznie, jak pokazuje poniższy przykład.
Przykład 15.6.2 Rozważmy funkcję
(
R 3 x 7→
x2 sin x1
0
gdy x 6= 0,
dla x = 0.
Funkcja ta jest ciągła, a dla x 6= 0 różniczkowalna na podstawie twierdzenia o różniczkowaniu iloczynu, funkcji złożonej
i ilorazu. Dla x = 0 iloraz różnicowy ma postać
h2 sin h1
1
= h sin .
h
h
Granica limh→0 h sin h1 istnieje i wynosi zero. Zatem również w zerze nasza funkcja jest różniczkowalna. Jej pochodną
jest funkcja
(
2x sin x1 − cos x1
gdy x =
6 0,
R 3 x 7→
0
dla x = 0.
Pokażemy, że pochodna ta nie jest ciągła w zerze. Gdyby była ciągła w zerze, to dla każdego ciągu xn zbieżnego do
1
zera ciąg wartości byłby zbieżny do pochodnej w zerze, czyli do zera. Ale ciąg xn = 2πn
jest zbieżny do zera, a ciąg
wartości pochodnej w punktach tego ciągu wynosi stale −1, więc jest zbieżny do −1, a nie do zera.
Definicja 15.6.3 Funkcję f : (a, b) → Rm , która jest różniczkowalna i ma ciągłą pochodną nazywamy funkcją klasy
C 1 . Zbiór takich funkcji oznaczamy C 1 ((a, b), Rm ).
Nazwa "klasa C 1 " wyjaśni si˛e później, gdy zdefiniujemy również funkcje klasy C n .
W programie Mathematica pochodną funkcji f zmiennej x obliczamy używając instrukcji
D[f[x],x]
15.7. METODA NEWTONA
235
Na przykład pochodną funkcji
1
f (x) := log
4
x2 − 1
x2 + 1
obliczymy pisząc
D[(1/4) Log[(x^2 - 1)/(x^2 + 1)], x]
Jako wynik program Mathematica zwraca
2
x +1
2x
x2 +1
−
2x(x2 −1)
(x2 +1)2
4 (x2 − 1)
.
Nie jest to czytelna postać pochodnej. Instrukcja Simplify pozwala uzyskać najbardziej zwartą postać wyrażenia. Jako
argumentu można użyć znaku %, który odnosi się do ostatniego wyrażenia obliczonego przez program Mathematica.
Simplify[%]
daje w wyniku
15.7
x
.
x4 − 1
Metoda Newtona
Rozwiazywanie
˛
równań interesowało matematyków już od starożytności. Pierwotnie stosowano głównie metody geometryczne, które pozwalały rozwiazywać
˛
równania liniowe i wybrane równania wyższych stopni, głównie kwadratowe. Po raz pierwszy podejście algebraiczne w rozwiazywaniu
˛
równania kwadratowego
zastosowano w VII wieku w Indiach. W XVIw. metod˛e rozwiazywania
˛
równania trzeciego i czwartego stopnia znaleźli włoscy matematycy Niccolo Fontana Tartaglia
i Lodovico Ferrari. Liczne próby ogólnego rowiazania
˛
równań wyższych stopni spełzły na niczym, a na poczatku
˛ XIXw. norwerski matematyk Niels Henrik Abel
udowodnił, że nie da si˛e podać ogólnego algorytmu rozwiazania
˛
równania stopnia wi˛ekszego niż cztery za pomoca˛ skończonej ilości operacji arytmetycznych
+, −, ∗, / oraz pierwiastkowania.
Pozostały zatem metody przybliżone. Wsród nich prym wiedzie wywodzaca
˛ si˛e z prac Izaaka Newtona i nazywana jego imieniem metoda iteracyjna wykorzystujaca
˛ przybliżanie funkcji styczna˛ do wykresu.
Załóżmy, że chcemy rozwiazać
˛ równanie postaci
f (x) = 0,
gdzie f : [a, b] → R jest funkcja˛ różniczkowalna.˛ Rozwiazania
˛
takiego równania nazywane sa˛ również miejscami zerowymi funkcji f .
Załóżmy, że dany jest punkt x0 ∈ [a, b], a y = cx + d jest równaniem prostej stycznej do wykresu f w punkcie x0 .
Wiemy, że c, czyli współczynnik kierunkowy tej prostej jest równy f 0 (x0 ). Ponieważ punkt (x0 , f (x0 )) należy do stycznej, wi˛ec f (x0 ) = f 0 (x0 )x0 + d,
skad
˛ wyliczamy d co pozwala przepisać nam równanie stycznej w postaci
y = f (x0 ) + f 0 (x0 ) (x − x0 ) .
Przyjmujac
˛ y = 0 i rozwiazuj
˛ ac
˛ wzgl˛edem x znajdujemy
x = x0 −
f (x0 )
.
f 0 (x0 )
Jest to przybliżenie miejsca zerowego funkcji f tym lepsze im bliżej x0 było miejsca zerowego. Dlatego iterujac
˛ ten proces, to znaczy liczac
˛ wyrazy ciagu
˛
danego rekurencyjnie wzorem
xn+1 := xn −
f (xn )
f 0 (xn )
236
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
/∗ ∗∗∗∗∗∗∗∗∗∗ newton . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗
P i e r w i a s t e k wielomianu
∗/
/∗
metodą Newtona
∗/
/∗ ∗ ∗ ∗ ∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
#include <i o s t r e a m >
using namespace s t d ;
/∗ S t o p i e ń wielomianu ∗/
const i n t d e g r e e =2;
/∗ T a b l i c a współczynników wielomianu ∗/
double c o e f [ d e g r e e + 1 ] ;
/∗ maksymalna l i c z b a i t e r a c j i ∗/
i n t l i m i t =30;
/∗ o c z e k i w a n a d o k ł a d n o ś ć ∗/
double e p s i l o n = 0 . 0 0 1 ;
/∗ W y l i c z e n i e w a r t o ś c i wielomianu w x ∗/
double f ( double x ) {
double s=c o e f [ d e g r e e ] ;
f o r ( i n t i=d e g r e e −1; i >=0; i −−) s=c o e f [ i ]+x∗ s ;
return s ;
}
/∗ W y l i c z e n i e p o c h o d n e j wielomianu w x ∗/
double d e r f ( double x ) {
double s=d e g r e e ∗ c o e f [ d e g r e e ] ;
f o r ( i n t i=d e g r e e −1; i >=1; i −−) s=i ∗ c o e f [ i ]+x∗ s ;
return s ;
}
/∗ Program główny ∗/
i n t main ( ) {
/∗ Wczytujemy w s p ó ł c z y n n i k i wielomianu ∗/
f o r ( i n t i =0; i <d e g r e e +1;++ i ) {
c o u t << "c[" << i << " ]= " ; c i n >> c o e f [ i ] ;
}
/∗ o r a z w y j ś c i o w e p r z y b l i ż e n i e p i e r w i a s t k a ∗/
double x ;
c o u t << " x0 =" ; c i n >> x ;
/∗ P ę t l a główna ∗/
f o r ( i n t i =0; i <l i m i t ;++ i ) {
double v a l=f ( x ) ;
c o u t << "
x
=" << x
<< "\n" ;
c o u t << "
f(x )= " << v a l << "\n" ;
/∗ J e ś l i o s i ą g n i ę t o żądaną d o k ł a d n o ś ć można p r z e r w a ć p ę t l ę ∗/
i f ( v a l <e p s i l o n && v a l >−e p s i l o n ) break ;
/∗ Nowe p r z y b l i ż e n i e ∗/
x=x−v a l / d e r f ( x ) ;
}
}
Listing 15.1: Wyznaczanie miejsc zerowych wielomianu w C++.
15.7. METODA NEWTONA
237
Rysunek 15.4: Interpretacja geometryczna metody Newtona
możemy si˛e spodziewać, że b˛edzie on zbieżny do miejsca zerowego funkcji f w przedziale [a, b]. Nie zawsze tak jest, ale dzieje si˛e tak na tyle cz˛esto,
że metoda Newtona jest do dziś bardzo powszechnie stosowanym narz˛edziem. Interpretacja geometryczna zwiazku
˛
xn i xn+1 z pochodna˛ funkcji f jest
przedstawiona na rys. (15.4).
Program w C++ znajdujacy
˛ miejsca zerowe wielomianu przedstawiono na listingu 15.1.
W programie Mathematica rozwiazanie
˛
równania metoda˛ Newtona umożliwia insturkcja FindRoot. Ponieważ program Mathematica sam potrafi znaleźć
pochodna,˛ jedyne co musimy zrobić to zapisać równanie i podać wartość, od której należy rozpoczać
˛ poszukiwanie pierwiastka. Na przykład piszac
˛
FindRoot[Cos[x] == x^3, {x, 1}]
otrzymujemy jako rozwiazanie
˛
{x -> 0.865474}
Program Mathematica przekształca równanie cos x = x3 do postaci f (x) = 0, gdzie
f (x) := cos x − x3 ,
znajduje pochodna˛ f 0 (x) = − sin x − 3x2 i nast˛epnie liczy wyrazy ciagu
˛ danego wzorem rekurencyjnym
x0
xn+1
:=
1
:= xn −
cos xn − x3n
− sin xn − 3x2n
aż do osiagni˛
˛ ecia przybliżenia granicy o domyślnie ustawionej dokładności.
Ćwiczenie 15.7.1 Pokaż, że zaprezentowana w rozdziale 5.4.1 metoda liczenia pierwiastka kwadratowego
sowana˛ do równania
x2 − a = 0.
√
a jest w istocie metoda˛ Newtona zasto-
238
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
15.8
Ekstrema lokalne, a różniczkowalność.
15.8.1
Maksima i minima lokalne
Pochodna funkcji przydaje się przy poszukiwaniu lokalnych minimów i maksimów funkcji.
Definicja 15.8.1 Mówimy, że funkcja f : (a, b) → R ma w x0 ∈ (a, b) minimum lokalne jeżeli istnieje otoczenie
U ⊂ (a, b) punktu x0 takie, że dla wszystkich x ∈ U zachodzi f (x) ­ f (x0 ). Podobnie mówimy, że f ma w x0 ∈ (a, b)
maksimum lokalne jeżeli istnieje otoczenie U ⊂ (a, b) punktu x0 takie, że dla wszystkich x ∈ U zachodzi f (x) ¬ f (x0 ).
Mówimy, że f ma w x0 ∈ (a, b) ekstremum lokalne jeśli f ma w x0 minimum lokalne lub maksimum lokalne.
Twierdzenie 15.8.2 (o ekstremum lokalnym funkcji różniczkowalnej) Jeśli f : (a, b) → R jest różniczkowalna
w x0 ∈ (a, b) i ma w x0 ekstremum lokalne, to f 0 (x0 ) = 0.
Dowód: Załóżmy, że f ma w x0 maksimum lokalne. Zatem istnieje δ > 0 taka, że (x0 −δ, x0 +δ) ⊂ (a, b) oraz f (x) ¬ f (x0 )
dla x ∈ (x0 − δ, x0 + δ). W szczególności dla h ∈ (−δ, δ) mamy f (x0 + h) − f (x0 ) ¬ 0. Zatem dla h ∈ (−δ, 0) jest
f (x0 + h) − f (x0 )
­ 0,
h
skąd wnosimy, że pochodna lewostronna f w x0 jest nieujemna. Z drugiej strony dla h ∈ (0, δ) jest
f (x0 + h) − f (x0 )
¬ 0,
h
skąd wnosimy, że pochodna prawostronna f w x0 jest niedodatnia. Ale pochodna f w x0 istnieje, więc jest równa tak
pochodnej lewostronnej jak i prawostronnej. Zatem f 0 (x0 ) = 0.
15.8.2
Twierdzenie Rolle’a.
Francuski matematyk Michel Rolle (1652-1719) uważany jest za autora pierwszego w miarę współczesnego dowodu następującego twierdzenia.
Twierdzenie 15.8.3 (Rolle’a) Załóżmy, że f : [a, b] → R jest ciągła oraz, że jest różniczkowalna dla x ∈ (a, b). Jeśli
f (a) = f (b) to istnieje ξ ∈ (a, b) takie, że f 0 (ξ) = 0.
Dowód: Funkcja f , jako funkcja ciągła na przedziale zwartym, osiąga wartość największą oraz najmniejszą. Jeśli tak
wartość największa jak i najmniejsza są osiągane na końcach przedziału [a, b], to założenie f (a) = f (b) implikuje, że f jest
stała, a więc ma pochodną zero w każdym punkcie przedziału (a, b). Załóżmy zatem, że wartość największa lub wartość
najmniejsza jest osiągnięta w pewnym punkcie ξ ∈ (a, b). Wtedy f ma w ξ ekstremum lokalne, zatem z twierdzenia o
ekstremum lokalnym funkcji różniczkowalnej wynika, że f 0 (ξ) = 0.
15.9
Twierdzenie o wartości średniej
15.9.1
Uogólnione twierdzenie o wartości średniej
W twierdzeniu Rolle’a sieczna do wykresu poprowadzona przez punkty (a, f (a)) i (b, f (b)) jest pozioma. Styczna do wykresu w punkcie osiagania
˛
ekstremum
też jest pozioma. Zatem można stwierdzić, że istnieje punkt wewnatrz
˛ przedziału (a, b) taki, że styczna do wykresu w tym punkcie jest równoległa do siecznej
15.9. TWIERDZENIE O WARTOŚCI ŚREDNIEJ
239
Rysunek 15.5: Sieczna i równoległa do niej styczna.
przez punkty (a, f (a)) i (b, f (b)). Okazuje si˛e, że to stwierdzenie jest prawdziwe również wtedy gdy f (a) 6= f (b). Fakt ten, znany jako twierdzenie o wartości
średniej, ilustruje rysunek 15.5. W polskiej literaturze z twierdzeniem tym kojarzony jest francuski matematyk Joseph Louis Lagrange (1736-1813), Udowodnimy
najpierw jeszcze ogólniejsze twierdzenie, pochodzace
˛ od Augustina Cauchy’ego, z którego twierdzenie o wartości średniej wyprowadzimy jako wniosek.
Twierdzenie 15.9.1 (uogólnione o wartości średniej) Niech f, g : [a, b] → R będą ciągłymi funkcjami, różniczkowalnymi w przedziale (a, b). Wtedy istnieje punkt ξ ∈ (a, b) taki, że
(f (b) − f (a)) g 0 (ξ) = (g(b) − g(a)) f 0 (ξ).
Dowód: Rozważmy funkcję ϕ : [a, b] → R daną wzorem ϕ(x) := (f (b) − f (a)) g(x) − (g(b) − g(a)) f (x). Funkcja ta jest
ciągła na przedziale [a, b] i różniczkowalna na przedziale (a, b). Co więcej, prostym rachunkiem sprawdzamy, że
ϕ(a) = f (b)g(a) − f (a)g(b) = ϕ(b),
zatem stosując do ϕ twierdzenie Rolle’a znajdziemy punkt ξ ∈ (a, b) taki, że ϕ0 (ξ) = 0. Ale ϕ0 (ξ) = (f (b) − f (a)) g 0 (ξ) −
(g(b) − g(a)) f 0 (ξ). Zatem (f (b) − f (a)) g 0 (ξ) − (g(b) − g(a)) f 0 (ξ) = 0, co dowodzi naszej tezy.
15.9.2
Twierdzenie Lagrange’a o wartości średniej
Przyjmując w twierdzeniu 15.9.1 za funkcję g identyczność otrzymujemy jako wniosek następujące klasyczne twierdzenie o
wartości średniej.
Twierdzenie 15.9.2 (Lagrange’a o wartości średniej) Niech f : [a, b] → R będzie funkcją ciągłą, różniczkowalną
w przedziale (a, b). Wtedy istnieje punkt ξ ∈ (a, b) taki, że
(f (b) − f (a)) = (b − a) f 0 (ξ).
240
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
15.9.3
Twierdzenie o przyrostach skończonych
Twierdzenia o wartości średniej nie dają się przenieść w dosłownej formie na przypadek funkcji o wartościach wektorowych,
na przykład zespolonych, jak pokazuje następujący przykład.
Przykład 15.9.3 Rozważmy funkcję
f : [0, 1] 3 t 7→ e2tπi ∈ C.
Mamy f [0] = f [1] = 1, zatem gdyby twierdzenie o wartości średniej zachodziło, to istniałby punkt ξ ∈ (0, 1) taki, że
f 0 (ξ) = 0. Taki punkt jednak nie istnieje, bo z twierdzenia 15.5.2 wiemy, że pochodną jest f 0 (t) = 2πie2tπi 6= 0.
Mamy jednak pokrewne twierdzenie.
Twierdzenie 15.9.4 (o przyrostach skończonych) Niech f : [a, b] → Rm będzie funkcją ciągłą, różniczkowalną na
(a, b). Wtedy istnieje ξ ∈ (a, b) takie, że
||f (b) − f (a)|| ¬ ||f 0 (ξ)||(b − a).
Dowód: Oznaczmy z := f (b) − f (a). Jeśli z = 0, teza jest oczywista. Zatem załóżmy, że z 6= 0 i rozważmy funkcję
ϕ : [a, b] 3 t 7→ z · f (t) ∈ R.
Funkcja ϕ jest funkcją o wartościach rzeczywistych, jest ciągła, a na podstawie ćwiczenia 15.3.6 wiemy też, że jest różniczkowalna i ϕ0 (t) = z · f 0 (t). Możemy więc do niej zastosować twierdzenie o wartości średniej. Zatem istnieje ξ ∈ (a, b) takie,
że
ϕ(b) − ϕ(a) = ϕ0 (ξ)(b − a) = (b − a)z · f 0 (ξ).
Z drugiej strony
ϕ(b) − ϕ(a) = z · (f (b) − f (a)) = z · z = ||z||2 .
Zatem z nierówności Schwartza dostajemy
||z||2 = (b − a)z · f 0 (ξ) = |(b − a)z · f 0 (ξ)| ¬ (b − a)||z||||f 0 (ξ)||.
Dzieląc powyższą nierówność obustronnie przez ||z|| otrzymujemy tezę.
15.10
Zastosowania twierdzenia o wartości średniej
15.10.1
Pochodna, a monotoniczność
Monotoniczność funkcji różniczkowalnej znajduje odwzierciedlenie w znaku jej pochodnej. Dokładniej, mamy następujące
twierdzenie.
Twierdzenie 15.10.1 Niech f : (a, b) → R będzie funkcją różniczkowalną. Mają miejsce następujące równoważności
(i) f 0 ­ 0 wtedy i tylko wtedy gdy f jest słabo rosnąca,
(ii) f 0 > 0 wtedy i tylko wtedy gdy f jest silnie rosnąca,
(iii) f 0 ¬ 0 wtedy i tylko wtedy gdy f jest słabo malejąca,
(iv) f 0 < 0 wtedy i tylko wtedy gdy f jest silnie malejąca.
Dowód: Załóżmy najpierw, że f 0 ­ 0. Niech x1 , x2 ∈ (a, b) oraz x1 < x2 . Z twierdzenia o wartości średniej wiemy, że
f (x2 )−f (x1 ) = f 0 (ξ)(x2 −x1 ) dla pewnego ξ ∈ (x1 , x2 ). Ale z założenia f 0 (ξ) ­ 0, skąd f (x2 )−f (x1 ) ­ 0, a to dowodzi, że f
jest słabo rosnąca. Z kolei jeśli f jest słabo rosnąca, to iloraz różnicowy w każdym punkcie przedziału (a, b) jest nieujemny.
Zatem i pochodna jest nieujemna, jako granica ilorazu różnicowego. To dowodzi równoważności (i). Dowód pozostałych
równoważności jest podobny, więc zostawiamy go jako ćwiczenie.
15.10. ZASTOSOWANIA TWIERDZENIA O WARTOŚCI ŚREDNIEJ
15.10.2
241
Twierdzenie o wartościach pośrednich dla pochodnej
Widzieliśmy w przykładzie 15.6.2, że istnienie pochodnej w każdym punkcie dziedziny funkcji f nie gwarantuje ciągłości
pochodnej. Tym niemniej, pochodna, nawet jeśli jest nieciągła, ma własność przyjmowania wartości pośrednich, podobnie
jak funkcja ciągła.
Twierdzenie 15.10.2 Niech f : (a, b) → R będzie funkcją różniczkowalną. Niech c, d ∈ (a, b) będą takie, że c < d oraz
f 0 (c) < f 0 (d). Wtedy dla każdego λ ∈ (f 0 (c), f 0 (d)) istnieje ξ ∈ (c, d) takie, że f 0 (ξ) = λ.
Dowód: Rozważmy funkcję g : (a, b) → R daną wzorem g(t) := f (t) − λt. Jest ona ciągła różniczkowalna oraz g 0 (c) =
f (c) − λ < 0 i g 0 (d) = f 0 (d) − λ > 0. Zatem g(c) > g(c + h1 ) dla pewnego h1 ∈ (0, d − c), bo w przeciwnym razie iloraz
różnicowy g(c+h)−g(c)
>= 0 dla h > 0 co prowadzi do sprzeczności z g 0 (c) < 0. Podobnie stwierdzamy, że g(d) > g(d − h2 )
h
dla pewnego h2 ∈ (0, d − c). Wynika stąd, że maksium, które g na przedziale [c, d] musi osiągać na mocy tw. 11.2.14 , nie
może być osiągnięte na końcach tego przedziału lecz w pewnym punkcie ξ ∈ (c, d). Zatem jest to maksimum lokalne. Z
tw. 15.8.2 g 0 (ξ) = f 0 (ξ) − λ = 0, skąd f 0 (ξ) = λ.
Z udowodnionego twierdzenia wynika następujący ważny wniosek.
0
Wniosek 15.10.3 Niech f : (a, b) → R będzie funkcją różniczkowalną. Jeśli f 0 (x) 6= 0 dla wszystkich x ∈ (a, b), to f 0
przyjmuje wyłącznie wartości dodatnie lub wyłącznie wartości ujemne.
Ćwiczenie 15.10.4 Wywnioskuj z tw. 15.10.2, że jeśli f : (a, b) → R jest funkcją różniczkowalną, to f 0 nie posiada
punktów nieciągłości pierwszego rodzaju.
15.10.3
Reguła de l’Hospitala
Jeśli f : R → R zeruje si˛e w zerze, to
f (x)
f (x) − f (0)
=
x
x−0
może być traktowane jako przybliżenie f 0 (0), oczywiście przy założeniu, że pochodna ta istnieje. Zatem jeśli mamy dwie takie funkcje, f, g : R → R i obie
zeruja˛ si˛e w zerze, to mamy
f (x)
=
g(x)
f (x)
x
g(x)
x
f 0 (0)
f (0)
g 0 (0) . Lewa strona nie jest przybliżeniem g(0) , bo jest to pozbawiony sensu ułamek o zerze
f (x)
ułamków g(x) przy x zmierzajacym
˛
do zera o ile ta granica istnieje. Zatem, przy odpowiednich
Prawa˛ stron˛e tego wyrażenia można traktować jako przybliżenie
w liczniku i mianowniku. Jest to jednak przybliżenie granicy
założeniach, możemy si˛e spodziewać wzoru
f 0 (0)
f (x)
= 0 .
x→0 g(x)
g (0)
lim
Udowodnimy teraz nawet nieco ogólniejsze twierdzenie. Z twierdzeniem tym kojarzony jest francuski matematyk Guillaume de l’Hospital (rys. 15.6), który pierwszy
je opublikował. Jednak sa˛ argumenty za tym, że autorem twierdzenia jest szwajcarski matematyk Johann Bernoulli (rys. 15.6), brat Jacoba Bernoullego (rys. 8.9).
Okazuje si˛e ono bardzo pomocne przy wyznaczaniu granic ilorazów, do których nie możemy zastosować twierdzenia o granicy ilorazu. Przypomnijmy bowiem, że
twierdzenie o granicy ilorazu wymaga, by mianownik miał granic˛e różna˛ od zera.
242
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Rysunek 15.6: Guillaume de l’Hospital (1661 - 1704) i Johann Bernoulli (1667 - 1748) Źródło: Wikipedia
Twierdzenie 15.10.5 (reguła de l’Hospitala). Niech f, g : (a, b) → R będą różniczkowalne oraz g 0 (x) =
6 0 dla
x ∈ (a, b). Załóżmy, że
lim f (x) = 0 = lim g(x)
(15.12)
x→a
x→a
lub
lim g(x) ∈ {−∞, ∞}.
(15.13)
f 0 (x)
x→a g 0 (x)
(15.14)
f (x)
g(x)
(15.15)
x→a
Jeśli istnieje granica
lim
to istnieje granica
lim
x→a
i obie te granice są sobie równe.
Twierdzenie 15.10.5 wyprowadzimy z następującego lematu
Lemat 15.10.6 Przy założeniach twierdzenia 15.10.5 mamy nierówności
lim sup
x→a
oraz
lim inf
x→a
f (x)
f 0 (x)
¬ lim sup 0
g(x)
x→a g (x)
(15.16)
f (x)
f 0 (x)
­ lim inf 0
x→a g (x)
g(x)
(15.17)
Dowód: (twierdzenia 15.10.5) Ponieważ granica dolna jest niewiększa od granicy górnej, z (15.16) i (15.17) mamy ciąg
nierówności
f 0 (x)
f (x)
f (x)
f 0 (x)
lim inf 0
¬ lim inf
¬ lim sup
¬ lim sup 0
.
(15.18)
x→a g(x)
x→a g (x)
x→a g(x)
x→a g (x)
W twierdzeniu 15.10.5 zakładamy istnienie granicy (15.14). Zatem stosowna granica dolna i granica górna są sobie równe.
Zatem pierwsze i ostatnie wyrażenie w ciągu nierówności (15.18) są sobie równe. Jest to możliwe tylko wtedy, gdy wszystkie
15.10. ZASTOSOWANIA TWIERDZENIA O WARTOŚCI ŚREDNIEJ
243
wyrażenia są sobie równe. W szczególności drugie i trzecie wyrażenie są sobie równe. Wynika stąd istnienie granicy (15.15)
i równość obu granic.
Dowód: (lematu 15.10.6) Rozważmy dowód wzoru (15.16). Oznaczmy
A := lim sup
x→a
f 0 (x)
.
g 0 (x)
Jeśli A = ∞, to wzór (15.16) oczywiście zachodzi, załóżmy więc, że A < ∞. Wystarczy pokazać, że
∀q > A
lim sup
x→a
f (x)
¬ q.
g(x)
(15.19)
Ustalmy zatem liczbę q > A. Z definicji granicy znajdziemy c ∈ (a, b) takie, że
∀ x ∈ (a, c)
f 0 (x)
< q.
g 0 (x)
(15.20)
Niech x, y ∈ (a, c) oraz x < y. Zwężenia f|[x,y] i g|[x,y] spełniają założenia uogólonionego twierdzenia o wartości średniej
(tw. 15.9.1) zatem znajdziemy ξ ∈ (x, y) takie, że
(f (y) − f (x)) g 0 (ξ) = (g(y) − g(x)) f 0 (ξ).
Wykorzystując założenie o niezerowaniu się pochodnej funkcji g przepisujemy powyższą równość w postaci
f (y) − f (x)
f 0 (ξ)
f (x) − f (y)
=
= 0 .
g(x) − g(y)
g(y) − g(x)
g (ξ)
Zatem z (15.20) wnosimy, że dla x, y ∈ (a, c)
f (y) − f (x)
f (x) − f (y)
=
< q.
g(x) − g(y)
g(y) − g(x)
(15.21)
Rozważmy przypadek założenia (15.12). Przechodząc ze zmienną y w (15.21) do granicy w a dostajemy
f (x)
¬q
g(x)
dla x ∈ (a, c), skąd natychmiast wynika (15.19).
Przypadek (15.13) jest nieco bardziej zagmatwany. Dowód zaprezentujemy przy założeniu limx→a g(x) = ∞. Rozumowanie dla limx→a g(x) = −∞ jest analogiczne. Zauważmy najpierw, że z limx→a g(x) = ∞ znajdziemy c0 ∈ (a, c) takie,
że g(x) > 0 dla x < c0 . Założenie o niezerowaniu się pochodnej funkcji g implikuje, że g jest funkcją monotoniczną, a w
konsekwencji, ze względu na założenie limx→a g(x) = ∞, jest funkcją silnie malejącą. Zatem g(x) − g(y) > 0. Mnożąc (15.21)
przez g(x) − g(y) i przenosząc f (y) na prawą stronę dostajemy
f (x) < f (y) + q (g(x) − g(y)) = qg(x) + f (y) − qg(y).
Dla x ∈ (a, c0 ) mamy g(x) > 0, więc dzieląc ostatnią nierówność przez g(x) dostajemy
f (x)
f (y)
g(y)
<q+
−q
.
g(x)
g(x)
g(x)
Ze względu na założenie limx→a g(x) = ∞, dla zadanego > 0 i przy ustalonym y ∈ (a, c) znajdziemy c00 ∈ (a, c0 ) takie, że
dla x ∈ (a, c00 )
f (y)
g(y)
−q
< .
g(x)
g(x)
244
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Zatem z ostatnich dwóch nierówności dla x ∈ (a, c00 ) i dowolnego > 0 mamy
f (x)
< q + .
g(x)
Ze względu na dowolność > 0 dla x ∈ (a, c00 ) mamy
f (x)
¬ q,
g(x)
skąd wnosimy (15.19) również dla przypadku założenia (15.13).
Dowód własności (15.17) jest podobny. Pozostawiamy go jako ćwiczenie.
Regułę de l’Hospitala zaprezentowaliśmy dla granicy w lewym końcu przedziału. Oczywiście analogiczna reguła obowiązuje również dla prawego końca przedziału, a tym samym dla granicy lewostronnej, prawostronnej i zwykłej granicy.
Przykład 15.10.7 Granica limx→0 sinx x nie daje się policzyć z twierdzenia o granicy ilorazu, bo mianownik zmierza do
zera. Ponieważ jednak również licznik zmierza do zera oraz tak licznik jak i mianownik są różniczkowalne w otoczeniu
zera, a mianownik ma pochodną stale równą jeden, więc możemy zastosować regułę de l’Hospitala. Dostajemy
sin x
(sin x)0
cos x
cos 0
= lim
= lim
=
= 1.
x→0 x
x→0
x→0
x0
1
1
lim
15.11
Różniczkowanie funkcji odwrotnej
15.11.1
Wzór na pochodną funkcji odwrotnej
Twierdzenie 15.11.1 Załóżmy, że f : (a, b) → R jest funkcją różniczkowalną oraz f 0 (x) 6= 0 dla wszystkich x ∈ (a, b).
Wtedy f jest bijekcją przedziału (a, b) w pewien przedział (c, d). Co więcej, bijekcja odwrotna f −1 : (c, d) → (a, b) jest
różniczkowalna oraz
1
(f −1 )0 (f (x)) = 0
(15.22)
f (x)
dla wszystkich x ∈ (a, b).
Dowód: Z wniosku 15.10.3 wnosimy, że f 0 jest wszędzie dodatnia lub wszędzie ujemna, zatem z tw. 15.10.1 funkcja jest
silnie rosnąca lub silnie malejąca. W szczególności jest zatem injekcją. Niech Γ := im f będzie obrazem przedziału (a, b) w
funkcji f . Ponieważ zbiory spójne w R pokrywają się z przedziałami (wn. 11.4.4), z tw. 11.4.5 wnosimy, że Γ jest również
przedziałem. Pokażemy, że przedział ten jest otwarty. Rzeczywiście, jeśli d jest lewym lub prawym końcem przedziału Γ i
d ∈ Γ, to d jest elementem największym lub najmniejszym w Γ. Równocześnie d = f (t) dla pewnego t ∈ (a, b). Wybierzmy
t0 , t00 ∈ (a, b) takie, że t0 < t < t00 . Z monotoniczności f mamy f (t0 ) < d < f (t00 ) lub f (t0 ) > d > f (t00 ). Ponieważ
f (t0 ), f (t00 ) ∈ Γ, wykluczone jest by d było elementem największym lub najmniejszym w Γ. Zatem Γ jest przedziałem
otwartym. Przyjmijmy, że Γ = (c, d).
Ustalmy x ∈ (a, b) oraz połóżmy y := f (x). Wtedy x = f −1 (y). Niech k będzie takie, że y + k ∈ (c, d). Połóżmy
h := f −1 (y + k) − f −1 (y). Wtedy f −1 (y + k) = f −1 (y) + h = x + x, zatem y + k = f (x + h). Mamy
f −1 (y + k) − f −1 (y)
h
f −1 (y + k) − f −1 (y)
=
=
=
k
(y + k) − y
f (x + h) − f (x)
1
f (x+h)−f (x)
h
.
15.11. RÓŻNICZKOWANIE FUNKCJI ODWROTNEJ
245
Zauważmy, że jeśli k → 0 to również h → 0. Zatem przechodząc w powyższej równości z k do granicy w zerze dostajemy
1
(f −1 )0 (y) =
f 0 (x)
co dowodzi różniczkowalności f −1 oraz równości (15.22).
15.11.2
Pochodna funkcji logarytmicznej
Stosując twierdzenie 15.11.1 do funkcji wykładniczej dostajemy twierdzenie o różniczkowaniu funkcji logarytmicznej.
Twierdzenie 15.11.2 Funkcja ln : R+ → R jest funkcją różniczkowalną oraz
1
.
x
(ln x)0 =
(15.23)
Dowód: Z wniosku 15.5.3 wiemy pochodną funkcji x → ex jest ona sama. Ponieważ funkcja wykładnicza nie przyjmuje wartości zero, możemy do niej zastosować twierdzenie 15.11.1. Funkcją odwrotną do funkcji wykładniczej jest funkcja
logarytmiczna x → ln x, zatem funkcja ta jest różniczkowalna oraz
(ln x)0 (ex ) =
1
1
= x.
x
0
(e )
e
Przyjmując y := ex dostajemy zatem
1
y
co pokrywa się ze wzorem (15.23), gdyż w obu wzorach występujące w nich zmienne są związane.
(ln y)0 =
15.11.3
Funkcje kołowe (odwrotne do trygonometrycznych)
Funkcje sin, cos i tg nie są bijekcjami, więc nie mają funkcji odwrotnych. Jednak po zawężeniu do odpowiednio małego
przedziału stają się bijekcjami. Zwyczajowo rozważamy zawężenia sin|[−π/2,π/2] , cos|[0,π] , tg|[−π/2,π/2] . Pochodne tych funkcji
na wnętrzach tych przedziałów są niezerowe, zatem zawężęnia do wnętrz są odwracalne. Łatwo pokazać, że w konsekwencji
odwracalne są również zawężenia do przedziałów domkniętych.
Definicja 15.11.3 Funkcje odwrotne do funkcji sin|[−π/2,π/2] , cos|[0,π] , tg|[−π/2,π/2] oznaczamy odpowiednio arc sin,
arc cos i arc tg. Nazywamy je funkcjami kołowymi lub cyklometrycznymi.
Jako prosty wniosek z tw. 15.11.1 dostajemy następujące twierdzenie
Twierdzenie 15.11.4 Funkcja arc sin : [−1, 1] → [−π/2, π/2] jest różniczkowalna dla x ∈ (−1, 1) oraz
(arc sin x)0 = √
1
.
1 − x2
Funkcja arc cos : [−1, 1] → [0, π] jest różniczkowalna dla x ∈ (−1, 1) oraz
(arc cos x)0 = − √
1
.
1 − x2
Funkcja arc tg : R → (−π/2, π/2) jest różniczkowalna dla x ∈ R oraz
(arc tg x)0 =
1
.
1 + x2
246
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Funkcje kołowe w programie Mathematica oznaczane są ArcSin, ArcCos, ArcTan.
15.11.4
Pochodna funkcji potęgowej
Wiemy już, że dla n ∈ N1 mamy (xn )0 = nxn−1 . Wzór ten uogólnić można na przypadek funkcji x → xα dla dowolnego
α ∈ R.
Twierdzenie 15.11.5 Dla dowolnego α ∈ R funkcja potęgowa
R+ 3 x 7→ xα ∈ R+
jest różniczkowalna oraz
(xα )0 = αxα−1 .
Dowód: Ponieważ xα = eα ln x , więc funkcja x 7→ xα jest złożeniem funkcji x 7→ α ln x oraz funkcji u 7→ eu . Zatem z
twierdzenia o różniczkowaniu złożenia funkcji mamy
(xα )0 = eα ln x
α
α
= xα = αxα−1 .
x
x
15.12
Pochodne wyższych rzędów
15.12.1
n-ta pochodna
Jeśli pochodna f 0 funkcji f sama ma pochodną, to nazywamy ją drugą pochodną funkcji f i oznaczamy f 00 . Proces brania
kolejnych pochodnych możemy kontynuować. Precyzyjniej, definicję różniczkowalności i pochodnej rozszerzamy rekurencyjnie
w następujący sposób.
Definicja 15.12.1 Mówimy, że funkcja f : (a, b) → Rm jest 1-różniczkowalna jeśli jest różniczkowalna. Jej pochodną
f 0 nazywamy pierwszą pochodną i zapisujemy jako f (1) . Mówimy, że funkcja f jest n-różniczkowalna jeśli jej (n − 1)-sza
pochodna f (n−1) jest różniczkowalna. Pochodną f (n−1) nazywamy n-tą pochodną funkcji f i zapisujemy jako f (n) .
Dla małych n zamiast f (n) piszemy czasem f 00 , f 000 itd. Dodatkowo wygodnie jest samą funkcję nazywać zerową pochodną
i zapisywać jako f (0) := f .
Definicja 15.12.2 Mówimy, że funkcja f : (a, b) → Rm jest klasy C n jeżeli jest n-różniczkowalna we wszystkich
punktach przedziału (a, b) oraz f (n) jest ciągła. Zbiór takich funkcji oznaczamy C n ((a, b), Rm ).
W programie Mathematica n-tą pochodną funkcji f zmiennej x obliczamy używając instrukcji
D[f[x],{x,n}]
Na przykład drugą pochodną funkcji
f (x) :=
obliczymy pisząc
1
ln
4
x2 − 1
x2 + 1
15.12. POCHODNE WYŻSZYCH RZĘDÓW
247
Rysunek 15.7: Wykres funkcji f (niebieski), prostej stycznej do wykresu f w punkcie x0 (fioletowy) i paraboli stycznej do
wykresu w punkcie x0 (zielony).
D[(1/4) Log[(x^2 - 1)/(x^2 + 1)], {x,2}]
Jako wynik program Mathematica zwraca skomplikowane wyrażenie, ale po zastosowaniu do niego Simplify dostajemy
−3x4 − 1
2.
(x4 − 1)
Aproksymacja liniowa poprzez różniczk˛e jest prosta, ale cz˛esto nie jest wystarczajaco
˛ dokładna. Możemy wtedy rozważać aproksymacj˛e krzywa˛ drugiego
stopnia (parabola)˛ zadana˛ wzorem y = a0 + a1 h + a2 h2 gdzie h = x − x0 jest przyrostem zmiennej niezależnej (rys. 15.7). Możemy też przybliżać
wielomianem n-ego stopnia postaci
W (h) := a0 + a1 h + a2 h2 + . . . + an hn .
Różnica
f (x) − W [h) = f (x0 + h) − a0 + a1 h + a2 h2 + . . . + an hn
powinna być o(hn ), bo oczekujemy bł˛edu, który szybciej zmierza do zera niż wielomian aproksymacyjny. Pokażemy, że jeśli funkcja r jest n-różniczkowalna w
zerze, to własność r(h) = o(hn ) jest równoważna zerowaniu si˛e pochodnych r do n-tej włacznie,
˛
tzn. warunkowi
r(0) = r0 (0) = r00 (0) = . . . = r(n) (0) = 0.
W odniesieniu do naszego problemu aproksymacyjnego oznacza to, że funkcja
h 7→ f (x0 + h) − W (h)
powinna mieć zerowe pochodne w zerze do n-tej włacznie
˛
co jest równoważne postulatowi by funkcje h 7→ f (x0 + h) i h 7→ W (h) miały te same
pochodne do n-tej włacznie.
˛
Jak zobaczymy pochodne wielomianu jest stosunkowo łatwo policzyć: W (i) (0) = i!ai . Zatem tyle musza˛ wynosić pochodne
funkcji h 7→ f (x0 + h) w zerze. Sa˛ one równe pochodnym x 7→ f (x) w x0 , zatem poszukiwana aproksymacja ma postać
f (x0 + h) = f (x0 ) +
f 0 (x0 )
f 00 (x0 ) 2
f (n) (x0 ) n
h+
h + ... +
h + r(h)
1!
2!
n!
gdzie r(h) = o(hn ). Otrzymany w ten sposób wielomian aproksymacyjny nazywany jest wielomianem Taylora funkcji f w x0 , bo pochodzi od angielskiego
matematyka Brooka Taylora (rys. 15.8).
248
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Rysunek 15.8: Brook Taylor, 1685-1731. Źródło: Wikipedia
Twierdzenie 15.12.3 Wielomian
W : R 3 x 7→ a0 + a1 h + a2 h2 + . . . + an hn ∈ R.
(15.24)
jest funkcją i-różniczkowalną dla wszystkich i ∈ N oraz
W (i) (0) = i!ai
(15.25)
gdzie przyjmujemy ai = 0 dla i > n.
Dowód: Pokażemy indukcyjnie, że dla k ∈ N zachodzi ogólniejszy wzór
W (k) (x) =
n
X
i=k
i!
ai xi−k .
(i − k)!
(15.26)
Rzeczywiście, dla k = 0 wzór (15.26) pokrywa się z definicją (15.24) wielomianiu W . Natomiast jeśli (15.26) zachodzi dla
pewnego k, to biorąc pochodną obu stron dostajemy
W
(k+1)
(x)
=
W
(k)
0
(x) =
k!ak +
n
X
i=k+1
=
n
X
i=k+1
i!
ai xi−k
(i − k)!
i!
(i − k)ai xi−k−1 =
(i − k)!
Podstawiając we wzorze (15.26) za x zero dostajemy (15.25).
15.12.2
Wielomian Taylora
Niech f : (a, b) → R będzie n-różniczkowalna w x0 ∈ (a, b).
n
X
i=k+1
!0
0
= (k!ak ) +
n
X
i=k+1
i!
(ai xi−k )0
(i − k)!
i!
ai xi−(k+1) .
(i − (k + 1))!
15.12. POCHODNE WYŻSZYCH RZĘDÓW
249
Definicja 15.12.4 Wielomianem Taylora funkcji f w punkcie x0 stopnia n nazywamy wielomian
Txn0 f : R 3 h 7→ f (x0 ) +
f 0 (x0 )
f 00 (x0 ) 2
f (n) (x0 ) n
h+
h + ... +
h ∈ R.
1!
2!
n!
Z twierdzenia 15.12.3 łatwo wyprowadzamy następujący wniosek.
Wniosek 15.12.5 Funkcja f i jej wielomian Taylora Txn0 f mają takie same pochodne do n-tej włącznie odpowiednio
w zerze i w x0 , tzn. dla i = 0, 1, 2, . . . n zachodzi
Txn0 f
(i)
(0) = f (i) (x0 ).
15.12.3
n-płaskość w zerze.
Uogólnieniem pojęcia płaskości w zerze jest n-płaskość w zerze.
Definicja 15.12.6 Mówimy, że funkcja r : R−→
◦ R określona w otoczeniu zera jest n-płaska w zerze, jeżeli r(h) = o(hn )
przy h → 0.
Lemat 15.12.7 Jeśli W : R → R jest wielomianem stopnia co najwyżej n oraz
W (h)
=0
h→0 hn
lim
(15.27)
to W = 0.
Dowód: Dowód poprowadzimy indukcyjnie względem n. Rozważmy najpierw przypadek n = 0. Wtedy W (h) = a0 jest
wtedy funkcją stałą. Z (15.27) mamy
W (h)
0=
= lim a0 = a0 ,
h→0
h0
skąd W = 0.
Przyjmijmy z kolei, że lemat jest spełniony dla m < n i rozważmy wielomian
W : R 3 h 7→ a0 + a1 h + a2 h2 + . . . + an hn ∈ R
spełniający (15.27). Mamy
a0 = lim W (h) = lim
h→0
h→0
W (h) n
W (h)
h = lim
lim hn = 0.
h→0 hn h→0
hn
Zatem W (h) = a1 h + a2 h2 + . . . + an hn = hW1 (h), gdzie W1 (h) := a1 + a2 h + . . . + an hn−1 . Ale W1 jest wielomianem
stopnia co najwyżej (n − 1) oraz
W1 (h)
hW1 (h)
W (h)
lim
= lim
= lim
= 0,
h→0 hn−1
h→0
h→0 hn
hn
zatem z założenia inducyjnego W1 = 0, skąd W = 0.
250
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Rysunek 15.9: Joseph Louis Lagrange (1736 - 1813) i Giuseppe Peano (1858 - 1932). Źródło: Wikipedia
15.13
Wzory Taylora i szereg Taylora.
15.13.1
Wzór Taylora z resztą Peano.
Przedstawimy teraz dwa, powiązane ze sobą twierdzenia. Pierwsze uogólnia uwagę 15.2.12 na przypadek n-płaskości w
zerze. Drugie precyzuje jak wielomian Talora funkcji n-różniczkowalnej przybliża samą funkcję. Pochodzą one od włoskiego
matematyka Giuseppe Peano (rys. 15.9).
Twierdzenie 15.13.1 (Peano o funkcji n-płaskiej) Niech r : R−→
◦ R będzie funkcją n-różniczkowalną w zerze.
Funkcja ta jest n-płaska w zerze wtedy i tylko wtedy gdy
r(i) (0) = 0 dla i = 0, 1, 2, . . . n.
(15.28)
Twierdzenie 15.13.2 (wzór Taylora z resztą Peano) Niech f : (a, b) → R będzie funkcją (n − 1)-różniczkowalną
na przedziale (a, b) oraz n-różniczkowalną w x0 ∈ (a, b). Wtedy istnieje dokładnie jeden wielomian W : R → R stopnia
co najwyżej n taki, że dla h ∈ (a − x0 , b − x0 )
f (x0 + h) = W (h) + r(h)
dla pewnej n-płaskiej w zerze funkcji r : R−→
◦ R. Co więcej, wielomianem tym jest Txn0 f , czyli wielomian Taylora funkcji
f w x0 stopnia n. W szczególności h 7→ f (x0 + h) − Txn0 f (h) jest funkcją n-płaską w zerze.
Dowód: (twierdzenia 15.13.1 i twierdzenia 15.13.2) Najpierw pokażemy indukcyjnie, że warunek (15.28) implikuje
n-płaskość w zerze funkcji r. Dla n = 1 wynika to wprost z uwagi 15.2.12. Załóżmy, że implikacja zachodzi dla m < n oraz
warunek (15.28) jest spełniony. Ponieważ r(0) = 0, z uwagi 15.2.4 wnosimy, że wystarczy pokazać, iż
r(h)
= 0.
h→0 hn
lim
(15.29)
Wtedy (r0 )(i) (0) = 0 dla i = 0, 1, 2, . . . n − 1, a zatem z założenia indukcyjnego zastosowanego do funkcji r0 wnosimy, że
15.13. WZORY TAYLORA I SZEREG TAYLORA.
251
r0 (h) = o(hn−1 ) przy h → 0. Zatem również z uwagi 15.2.4 wynika, iż
r0 (h)
= 0,
h→0 hn−1
lim
a stąd, przy wykorzystaniu reguły de l’Hospitala
r0 (h)
1
r(h)
r0 (h)
= lim
= lim n−1 = 0,
n
n−1
h→0 nh
h→0 h
n h→0 h
lim
co dowodzi (15.29).
Rozważmy z kolei funkcję f spełniającą założenia twierdzenia 15.13.2. Niech r(h) := f (x0 + h) − Txn0 f (h). Wtedy
(i)
r (0) = 0 dla i = 0, 1, 2, . . . n. Zatem na mocy już udowodnionej części twierdzenia 15.13.1 funkcja r jest n-płaska w zerze.
Dowodzi to, że za postulowany w twierdzeniu 15.13.2 wielomian W można wziąć wielomian Taylora Txn0 f . W szczególności
zatem taki wielomian W istnieje, choć nie możemy jeszcze twierdzić, że jest wyznaczony jednoznacznie.
Aby pokazać jednoznaczność załóżmy, że istnieją wielomiany W1 i W2 stopnia co najwyżej n oraz n-płaskie w zerze
funkcje r1 i r2 takie, że
f (x0 + h) = Wi (h) + ri (h) przy h → 0.
W szczególności
W1 (h) + r1 (h) = W2 (h) + r2 (h).
Wielomian W (h) := W1 (h) − W2 (h) spełnia zatem W (h) = r2 (h) − r1 (h). Z wniosku 15.2.6 wynika, że W (h) = o(hn ) przy
h → 0. W szczególności z uwagi 15.2.4 wnosimy, że
W (h)
= 0,
h→0 hn
lim
a więc lemat 15.12.7 implikuje, że W = 0.
Pozostaje jeszcze uzupełnić dowód twierdzenia 15.13.1. Niech r : R−→
◦ R będzie funkcją n-różniczkowalną i n-płaską w
zerze. Z udowodnionej już części twierdzenia 15.13.2 wiemy, że h 7→ r(h) − T0n r(h) jest funkcją n-płaską w zerze. Zatem
z wniosku 15.2.6 wnosimy, że wielomia T0n r = r − (r − T0n r) jest n-płaska w zerze. Z uwagi 15.2.4 oraz lematu 15.12.7
wnosimy, że T0n r =, a stąd, że zachodzi (15.28).
15.13.2
Wzór Taylora z resztą Lagrange’a
Szczególnie interesujacy
˛ jest przypadek, gdy funkcja f : (a, b) → R jest n-różniczkowalna dla każdego n ∈ N. Wtedy możemy zbudować wielomian Taylora
Txn0 f dowolnie wysokiego stopnia. Kolejne wielomiany Taylora tworza˛ wi˛ec sumy cz˛eściowe szeregu
∞
X
f (i) (x0 )
i=0
i!
hi .
(15.30)
Naturalne jest zatem pytanie czy i kiedy ten szereg jest zbieżny do f (x0 + h). W tym celu trzeba zbadać kiedy
rn (h) := f (x0 + h) −
n
X
f (i) (x0 )
i=0
i!
hi = f (x0 + h) − Txn0 f (h),
zwane n-ta˛ reszta,˛ zmierza do zera przy n zmierzajacym
˛
do nieskończoności. W pierwszej chwili może si˛e wydawać, że wzór Taylor z reszta˛ Peano pozwoli
odpowiedzieć na to pytanie, bo ze wzoru tego wiemy, że
rn (h) = f (x0 + h) − Txn0 f (h) = o(hn ) przy h → 0,
252
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
zatem na podstawie wniosku 15.2.5
rn (h) = f (x0 + h) − Txn0 f (h) = ϕ(h)hn
(15.31)
n
dla pewnej ciagłej
˛ i zerujacej
˛ si˛e w zerze funkcji ϕ. Ponieważ dla |h| < 1 wyrażenie h zmierza do zera przy n zmierzajacym
˛
do nieskończoności, może si˛e
wydawać, że dowodzi to iż n-ta reszta rn (h) zmierza do zera. Problem w tym, że funkcja ϕ we wzorze (15.31) zależy od n, zatem wzór ten powinien być
zapisany jako
rn (h) = f (x0 + h) − Txn0 f (h) = ϕn (h)hn .
Widać teraz, że chociaż hn zmierza do zera przy n daż
˛ acym
˛
do nieskończoności, to o granicy limn→∞ ϕn (h) nic nie potrafimy powiedzieć i nasze rozumowanie
si˛e rozsypuje. Aby je uratować musimy coś wi˛ecej wiedzieć o reszcie rn (h).
Niech f : (c, d) → R będzie funcją (n + 1)-różniczkowalną. Ustalmy a, b ∈ (c, d) takie, że a < b.
Zaczniemy od lematu, który uogólnia twierdzenie Rolle’a (tw. 15.8.3).
Lemat 15.13.3 Jeśli f jest n-płaska w a oraz f (b) = 0 to dla każdego i = 1, 2, . . . , n + 1 istnieje ξi ∈ (a, b) takie, że
f (i) (ξi ) = 0.
Dowód: Z twierdzenia Peano o funkcji płaskiej wnosimy, że f (i) (a) = 0 dla i = 1, 2, . . . n. Dowód poprowadzimy
indukcyjnie względem n. Dla n = 0 lemat wynika wprost z twierdzenia Rolle’a (tw. 15.8.3). Załóżmy zatem, że twierdzenie
zachodzi dla m < n. Stosując je dla m = n otrzymujemy istnienie potrzebnych ξi dla i = 1, 2, . . . , n. W szczególności
f (n) (ξn ) = 0. Ponieważ również f (n) (a) = 0, więc stosując twierdzenie Rolle’a do f (n) na przedziale [a, ξn ] znajdziemy
0
ξn+1 ∈ (a, ξn ) takie, że f (n) (ξn+1 ) = 0. Zatem f (n+1) (ξn+1 ) = 0.
Uogólnimy teraz twierdzenie o wartości średniej.
Twierdzenie 15.13.4 Jeśli f jest n-płaska w a to istnieje ξ ∈ (a, b) takie, że
f (b) =
Dowód: Połóżmy M :=
f (b)
(b−a)n+1
f (n+1) (ξ)
(b − a)n+1 .
(n + 1)!
i rozważmy funkcję g : t 7→ f (t) − M (t − a)n+1 . Prostym rachunkiem sprawdzamy,
że g(a) = g(b) = 0 oraz g (i) (a) = 0 dla i = 1, 2, . . . n. Zatem z twierdzenia Peano o funkcji płaskiej g spełnia założenia
lematu 15.13.3. Istnieje więc ξ ∈ (a, b) takie, że g (n+1) (ξ) = 0. Ale g (n+1) (t) = f (n+1) (t) − (n + 1)!M , więc f (n+1) (ξ) =
(n + 1)!M , skąd wynika teza.
Jesteśmy teraz gotowi podać wzór Taylora ze zmodyfikowaną resztą, zwaną resztą Lagrange’a. Twierdzenie to pochodzi
od francuskiego matematyka włoskiego pochodzenia, J.L. Lagrange’a (rys. 15.9).
Twierdzenie 15.13.5 (wzór Taylora z resztą Lagrange’a) Niech f : (c, d) → R będzie funcją n + 1różniczkowalną. Niech a, b ∈ (c, d) spełniają a < b. Wtedy istnieje ξ ∈ (a, b) takie, że
f (b) = Tan f (b − a) +
f (n+1) (ξ)
(b − a)n+1 .
(n + 1)!
(15.32)
Przyjmując oznaczenie h := b − a oraz rozpisując wielomian Taylora możemy też powyższą tezę zapisać jako
f (a + h) = f (a) +
f 0 (a)
f 00 (a) 2
f (n) (a) n f (n+1) (ξ) n+1
h+
h + ... +
h +
h
.
1!
2!
n!
(n + 1)!
Dowód: Rozważmy funkcję r : x 7→ f (x) − Tan f (x − a). Funkcja ta jest n-płaska w a, bo jej pochodne w a do n-tej
włącznie się zerują. Zatem z twierdzenia 15.13.4 istnieje ξ ∈ (a, b) takie, że
r(b) =
r(n+1) (ξ)
(b − a)n+1 .
(n + 1)!
15.13. WZORY TAYLORA I SZEREG TAYLORA.
253
Ale r(n+1) (x) = f (n+1) (x), bo (n + 1)-sza pochodna wielomianu stopnia co najwyżej n zeruje się, Zatem
f (n+1) (ξ)
(b − a)n+1 = r(b) = f (b) − Tan f (b − a),
(n + 1)!
skąd wynika (15.32).
W programie Mathematica n-ty wielomian Taylora funkcji f w punkcie u wyliczony dla argumentu (x − u) uzyskamy
instrukcją
Series[f[x],{x,u,n}]
Na przykład pisząc
Series[Exp[x], {x, 0, 6}]
otrzymujemy
1+x+
x2
x3
x4
x5
x6
7
+
+
+
+
+ O [x]
2
6
24 120 720
7
Wyrażenie O [x] jest tutaj niezbyt fortunnym, choć dającym się wytłumaczyć, sposobem zapisania reszty Lagrange’a.
15.13.3
Punkty przegięcia
Definicja 15.13.6 Mówimy, że funkcja f : (a, b) → R ma punkt przegięcia w x0 ∈ (a, b) jeżeli f jest różniczkowalna
w x0 oraz istnieje δ > 0 taka, że dla 0 < |h| < δ funkcja
h 7→ sgn [∆x0 f (h) − f 0 (x0 )h] sgn h
jest stała, to znaczy stale równa jeden lub stale równa minus jeden.
Twierdzenie 15.13.7 Niech f : (a, b) → R będzie klasy C n oraz niech f (i) (x0 ) = 0 dla i = 1, 2, . . . n−1 i f (n) (x0 ) 6= 0.
Jeśli n jest parzyste, to f ma w x0 maksimum lokalne gdy f (n) (x0 ) < 0 bądź minimum lokalne gdy f (n) (x0 ) > 0.
Natomiast jeśli n jest nieparzyste, to f ma w x0 punkt przegięcia.
Dowód: Ponieważ f jest klasy C n , więc f (n) jest funkcją ciągłą, zatem w pewnym otoczeniu punktu x0 ma stały znak.
Wybierzmy δ > 0 tak, by sgn f (n) (x) było stałe dla 0 < |x − x0 | < δ. Załóżmy, że 0 < |h| < δ. Ze wzoru Taylora z resztą
Lagrange’a dla pewnego θ ∈ (0, 1)
f (n) (x0 + θh) n
f (x0 + h) − f (x0 ) =
h ,
n!
skąd otrzymujemy tezę, ponieważ znak wyrażenia f (n) (x0 + θh) jest stały.
15.13.4
Szereg Taylora
Dysponujemy teraz narzędziami do badania zbieżności szeregu (15.30). Zacznijmy od formalnej definicji.
Definicja 15.13.8 Mówimy, że funkcja f : (a, b) → R jest klasy C ∞ jeżeli jest klasy C n dla każdego n ∈ N.
254
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Definicja 15.13.9 Niech f : (a, b) → R będzie funkcją klasy C ∞ i niech x0 ∈ (a, b). Szereg formalny (bez pytania o
zbieżność)
∞
X
f (i) (x0 ) i
h
i!
i=0
nazywamy szeregiem Taylora funkcji f w punkcie x0 dla argumentu h i oznaczamy Tx0 f (h).
Przykład 15.13.10 Pochodną rzeczywistej funkcji wykładniczej exp : R 3 x → ex ∈ R jest ona sama. Zatem
wszystkie jej pochodne są jej równe. W szczególności funkcja wykładnicza jest klasy C ∞ oraz exp(n) (0) = exp(0) = 1.
Zatem łatwo sprawdzamy, że szeregiem Taylora rzeczywistej funkcji wykładniczej w zerze jest
∞
X
1 i
h,
i!
i=0
a więc ten sam szereg, który posłużył nam do zdefiniowania funkcji wykładniczej. O szeregu tym wiemy, że jest zbieżny
do exp(h).
Wzór Taylora z resztą Lagrange’a podpowiada nam jak zagwarantować zbieżność szeregu Taylora.
Twierdzenie 15.13.11 Niech f : (a, b) → R będzie klasy C ∞ i niech x0 ∈ (a, b). Jeżeli istnieją stałe > 0 oraz
M > 0 takie, że dla wszystkich n ∈ N
|f (n) (x)| ¬ M dla x ∈ (x0 − , x0 + ),
to dla |h| < szereg Taylora Tx0 f (h) jest zbieżny do f (x0 + h), co możemy też zapisać w postaci
f (x0 + h) =
∞
X
f (i) (x0 )
i=0
i!
hi .
Dowód: Niech |h| < i niech sn := Txn0 f (h) oraz rn := f (a + h) − sn . Ze wzoru Taylora z resztą Lagrange’a (tw. 15.13.5)
dla pewnego ξ ∈ (a, b) mamy
(n+1)
f
(ξ) n+1 M n+1
|rn | = h
.
¬ n! |h|
n!
Prawa strona powyższej nierówności zmierza do zera przy n dążącym do nieskończoności. Zatem limn→∞ rn = 0, skąd
limn→∞ sn = f (a + h).
Nie w każdej sytuacji powyższe twierdzenie działa. Czasami, tak jak w poniższym przykładzie, musimy sobie radzić na
piechotę.
15.13. WZORY TAYLORA I SZEREG TAYLORA.
255
Przykład 15.13.12 Skonstruujemy szereg Taylora funkcji ln w otoczeniu jedynki. Indukcyjnie sprawdzamy, że dla
n­1
(n − 1)!
ln(n) (x) = (−1)n−1
.
xn
Zatem ln(n) (1) = (−1)n (n − 1)!. Stąd
(T1 ln)(h) = ln 1 +
∞
X
(−1)i−1 (i − 1)!
i=1
i!
hi =
∞
X
(−1)i−1
i=1
i
hi .
Ze wzoru Taylora z resztą Lagrange’a mamy dla |h| < 1 i pewnego ξ pomiędzy 1 i 1 + h
n
X
(−1)n
(−1)i−1 i 1
1
|h|n+1
1
n+1 ln(1
+
h)
−
=
h
¬
¬
.
h
n+1
n+1
n+1
i
(n
+
1)(1
+
ξ)
n
+
1
(1
−
|ξ|)
n
+
1
(1
−
|h|)
i=1
Ponieważ prawa strona otrzymanej nierówności zmierza do zera przy n zmierzającym do nieskończoności otrzymujemy
n
X
(−1)i−1 i lim ln(1 + h) −
h=0
n→∞ i
i=1
Zatem dla |h| < 1 szereg T1 ln(h) jest zbieżny oraz
ln(1 + h) =
h h2
h3
−
+
− ....
1
2
3
256
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Rozdział 16
Całka oznaczona
16.1
Całka Riemanna funkcji jednej zmiennej
16.1.1
Pole obszaru.
Gdy potrzebujemy pokryć pewien obszar (na przykład plac lub podłog˛e łazienki) kwadratowymi płytkami o boku jednostkowej długości (na przykład 10cm), musimy
umieć policzyć ile płytek do tego celu potrzebujemy. Zakładajac,
˛ że obszar ma kształt prostokata
˛ o bokach długości m, n ∈ N łatwo stwierdzamy, że potrzebujemy
mn płytek. Jeśli boki prostokata
˛ nie sa˛ liczbami całkowitymi lub obszar ma kształt inny niż prostokatny,
˛ sprawa robi si˛e bardziej skommplikowana, bo bez ci˛ecia
płytek sobie nie poradzimy. Zawsze jednak możemy zapytać ile maksymalnie płytek daje si˛e ułożyć w granicach obszaru tak, by nie zachodziły one na siebie, a
także ile minimalnie potrzeba płytek, by pokryć cały obszar (rys. 16.1). Te dwie liczby stanowia˛ oszacowanie od dołu i od góry tego co intuicyjnie określamy jako
powierzchni˛e obszaru. Lepsze przybliżenia powierzchni dostaniemy posługujac
˛ si˛e płytkami o mniejszym boku. Kontynuujac
˛ proces szacowania powierzchni
przy użyciu płytek o coraz krótszych bokach otrzymujemy dwa ciagi
˛ szacujace
˛ powierzchni˛e obszaru: jeden rosnacy
˛ i szacujacy
˛ powierzchni˛e od dołu, drugi
malejacy
˛ i szacujacy
˛ powierzchni˛e od góry. Wiemy, że takie ciagi,
˛ jako monotoniczne i ograniczone, maja˛ granice. Intuicja podpowiada nam, że oba te ciagi
˛ maja˛
t˛e sama˛ granic˛e i jest nia˛ pole powierzchni rozważanego obszaru. Intuicja jest tu zawodna, bo można podać przykład zbiorów, dla których granice te sa˛ różne, co
oznacza, że intuicyjne poj˛ecie powierzchni obszaru nie zawsze ma sens.
Do zagadnień zwiazanych
˛
z definicja˛ pola powierzchni podzbioru R2 (ogólniej miary podzbioru Rd ) jeszcze wrócimy, a na razie ograniczymy si˛e do szczególnego przypadku obszaru postaci
{ (x, y) ∈ R2 | a ¬ x ¬ b, 0 ¬ y ¬ f (x) },
gdzie a < b sa˛ liczbami rzeczywistymi, a f : [a, b] → R∗ jest pewna˛ funkcja.˛ Pole powierzchni takiego obszaru można oszacować dzielac
˛ przedział [a, b]
na mniejsze przedziały i sumujac
˛ pola prostokatów
˛
zbudowanych nad tymi przedziałami tak, by mieściły si˛e pod wykresem funkcji lub by pokrywały obszar.
Otrzymujemy w ten sposób odpowiednio przybliżenie pola powierzchini od dołu lub od góry (rys. 16.2).
16.1.2
Przedziały w R i ich podziały.
W niniejszym rozdziale rozważać będziemy przedziały zwarte w R, a więc przedziały postaci [a, b], gdzie a, b ∈ R i a < b.
Zbiór takich przedziałów oznaczać będziemy Przedz(R). Liczby a oraz b nazywamy końcami przedziału [a, b]. Długością
przedziału I = [a, b] ∈ Przedz(R) nazywamy liczbę b − a. Jest to liczba dodatnia, którą oznaczać będziemy len I.
Mówimy, że dwa przedziały I, J ∈ Przedz(R) są rozgraniczone jeżeli mają rozłączne wnętrza. Skończony zbiór przedziałów
P ⊂S
Przedz(R) nazywamy podziałem przedziału I ∈ Przedz(R), jeżeli dowolne dwa różne elementy P są rozgraniczone oraz
I = P. Średnicą podziału P nazywamy liczbę
δ(P) := max { len P | P ∈ P }.
Zbiór wszystkich podziałów przedziału I oznaczać będziemy Podz(I).
257
258
ROZDZIAŁ 16. CAŁKA OZNACZONA
Rysunek 16.1: Przybliżanie pola figury poprzez zliczanie kwadratów wpisanych w figurę i pokrywających figurę w sieci
kwadratowej na płaszczyźnie.
Rysunek 16.2: Po lewej obszar pod wykresem funkcji. Po prawej aproksymacja pola powierzchni tego obszaru od dołu sumą
pól prostokątów zawartych w obszarze oraz aproksymacja od góry sumą pól prostokątów pokrywających obszar.
16.1. CAŁKA RIEMANNA FUNKCJI JEDNEJ ZMIENNEJ
259
Niech x : { 0, 1, 2, . . . n } → [a, b] będzie silnie rosnącym, skończonym ciągiem takim, że x0 = a i xn = b. Łatwo sprawdzić,
że wtedy rodzina
P x := { [xi−1 , xi ] | i = 1, 2, . . . n }
jest podziałem przedziału [a, b], zwanym podziałem zadanym ciągiem x.
Łatwo zauważyć, że każdy podział P ∈ Podz(I) przedziału I = [a, b] ∈ Przedz(R) jest zadany pewnym ciągiem x :
{ 0, 1, 2, . . . n } → [a, b]. W istocie ciąg x zadający podział P otrzymamy biorąc zbiór końców przedziałów w P ustawiony w
ciąg rosnący. Ciąg ten nazywać będziemy ciągiem zadającym podział P i oznaczać xP .
Zatem podziały przedziału I = [a, b] ∈ Przedz(R) możemy utożsamiać ze skończonymi, silnie rosnącymi ciągami liczb
rozpoczynającymi się od liczby a i kończącymi się na liczbie b.
Uwaga 16.1.1 Jeśli P jest podziałem przedziału I, to
len I =
X
len P.
P ∈P
Definicja 16.1.2 Niech P 1 , P 2 ∈ Podz(I) będą podziałami przedziału I ∈ Przedz(R). Mówimy, że podział P 2 jest
podpodziałem podziału P 1 i piszemy P 2 @ P 1 jeżeli dla każdego przedziału P2 ∈ P 2 istnieje przedział P1 ∈ P 1 taki,
że P2 ⊂ P1 .
Łatwo zaobserwować, że podział P 2 ∈ Podz(I) jest podpodziałem podziału P 1 ∈ Podz(I) wtedy i tylko wtedy gdy ciąg
zadający podział P 1 jest podciągiem ciągu zadającego podział P 2 .
Uwaga 16.1.3 Niech P 1 , P 2 będą dwoma dowolnymi podziałami przedziału I ∈ Przedz(R). Istnieje podział P 3 przedziału I taki, że P 3 @ P 1 i P 3 @ P 2 .
Dowód: Jako podział P 3 wystarczy wziąć podział zadany przez zbiór końców przedziałów w P 1 ∪ P 2 posortowany w
ciąg rosnący.
16.1.3
Całkowalność w sensie Riemanna
Niech I = [a, b] ∈ Przedz(R) będzie ustalonym przedziałem, a f : [a, b] → R niech będzie funkcją ograniczoną. Dla podzbioru
P ⊂ [a, b] przyjmujemy oznaczenia
m(f, P )
:=
inf { f (x) | x ∈ P },
M (f, P )
:=
sup { f (x) | x ∈ P }.
Zwróćmy uwagę, że ograniczoność funkcji f gwarantuje iż liczby m(f, P ) i M (f, P ) są dobrze określone.
Definicja 16.1.4 Niech P będzie podziałem przedziału [a, b]. Wyrażenia
X
L(f, P) :=
m(f, P ) len P,
P ∈P
U (f, P)
:=
X
M (f, P ) len P
P ∈P
nazywamy odpowiednio dolną i górną sumą Darboux dla funkcji f i podziału P.
260
ROZDZIAŁ 16. CAŁKA OZNACZONA
Łatwo zauważyć, że jeżeli x : { 0, 1, 2, . . . n } → [a, b] jest ciągiem zadającym podział P, to mamy
L(f, P)
n
X
=
U (f, P)
i=1
n
X
=
m(f, [xi−1 , xi ])(xi − xi−1 ),
M (f, [xi−1 , xi ])(xi − xi−1 ).
i=1
Jeśli funkcja f ma wartości nieujemne, to iloczyny m(f, [xi−1 , xi ])(xi − xi−1 ) i M (f, [xi−1 , xi ])(xi − xi−1 ) odpowiadaja˛ polu prostokatów
˛
o
podstawie [xi−1 , xi ] i wysokości równej odpowiednio kresowi dolnemu i kresowi górnemu funkcji f na przedziale [xi−1 , xi ]. Zatem suma dolna Darboux i
suma górna Darboux daja˛ odpowiednio przybliżenie od dołu i od góry pola pod wykresem funkcji f .
Definicja 16.1.5 Wyrażenia
L(f )
:=
sup { L(f, P) | P ∈ Podz([a, b]) },
U (f )
:=
inf { L(f, P) | P ∈ Podz([a, b]) }.
nazywamy odpowiednio całką dolną i całką górną funkcji f . Jeżeli L(f ) = U (f ), to funkcję f nazywamy całkowalną
Rb
w sensie Riemanna, a liczbę L(f ) = U (f ) nazywamy całką Riemanna funkcji f i oznaczamy a f . Zbiór funkcji
ograniczonych f : [a, b] → R, które są całkowalne w sensie Riemanna oznaczamy Riem([a, b]).
Przykład 16.1.6 Najprostszym przykładem funkcji całkowalnej w sensie Riemanna jest funkcja stała c[a,b] . Rzeczywiście, dla dowolnego przedziału P ⊂ [a, b] mamy m(c[a,b] , P ) = M (c[a,b] , P ) = c, zatem dla dowolnego podziału
P ∈ Podz([a, b]) jest
X
X
L(c[a,b] , P) = U (c[a,b] , P) =
c len P = c
len P = c(b − a).
P ∈P
P ∈P
Zatem L(c[a,b] ) = U (c[a,b] ) = c(b − a) i w konsekwencji
Z
b
c[a,b] = c(b − a).
a
Przykład 16.1.7 Rozważmy funkcję Dirichleta
(
fD : [0, 1] 3 x 7→
0 x ∈ Q,
1 x∈
6 Q.
Jeśli P ⊂ [0, 1] jest przedziałem o niepustym wnętrzu, to m(fD , P ) = 0 i M (fD , P ) = 1. Stąd dla dowolnego P ∈
Podz([0, 1]) mamy L(fD , P) = 0 i U (fD , P) = 1. W konsekwencji L(fD ) = 0 6= 1 = U (fD ). Zatem funkcja Dirichleta
nie jest całkowalna w sensie Riemanna.
16.1.4
Epsilonowe kryterium całkowalności
16.1. CAŁKA RIEMANNA FUNKCJI JEDNEJ ZMIENNEJ
261
Lemat 16.1.8 Jeśli P 1 , P 2 ∈ Podz([a, b]) oraz P 2 @ P 1 , to
L(f, P 1 ) ¬ L(f, P 2 ) i U (f, P 2 ) ¬ U (f, P 1 ).
Dowód: Niech P ∈ P 1 . Z uwagi 16.1.1 mamy
m(f, P ) len P = m(f, P )
X
P 0 ⊂P, P 0 ∈P
len P 0 =
X
P 0 ⊂P, P 0 ∈P
2
X
m(f, P ) len P 0 ¬
2
P 0 ⊂P, P 0 ∈P
m(f, P 0 ) len P 0 .
2
Sumując lewą i prawą stronę powyższych nierówności dla P ∈ P 1 dostajemy
L(f, P 1 ) ¬ L(f, P 2 ).
Dowód nierówności dla sum górnych jest analogiczny.
Z lematu 16.1.8 i uwagi 16.1.3 dostajemy następujący wniosek
Wniosek 16.1.9 Dla dowolnych podziałów P 1 , P 2 ∈ Podz([a, b]) mamy
L(f, P 1 ) ¬ U (f, P 2 ).
Z powyższgo wniosku dostajemy natychmiast następujący wniosek
Wniosek 16.1.10 Dla dowolnej funkcji ograniczonej f : [a, b] → R mamy
L(f ) ¬ U (f ).
Jesteśmy teraz przygotowani, by pokazać następującą charakteryzację funkcji całkowalnych w sensie Riemanna.
Twierdzenie 16.1.11 Funkcja ograniczona f : [a, b] → R jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy
dla każdego > 0 istnieje podział P ∈ Podz([a, b]) przedziału [a, b] taki, że
U (f, P) − L(f, P) < .
(16.1)
Dowód: Przyjmijmy najpierw, że f jest całkowalna w sensie Riemanna. Ustalmy > 0. Z definicji całki dolnej i górnej
do /2 znajdziemy podziały P 1 , P 2 ∈ Podz([a, b]) takie, że
L(f, P 1 ) > L(f ) −
oraz U (f, P 2 ) < U (f ) + .
2
2
Na mocy uwagi 16.1.3 możemy wybrać podział P 3 ∈ Podz([a, b]) taki, że P 3 @ P 1 oraz P 3 @ P 2 . Z lematu 16.1.8 oraz z
(16.1.4) dostajemy
U (f, P 3 ) − L(f, P 3 ) ¬ U (f, P 2 ) − L(f, P 1 ) < U (f ) + − (L(f ) − ) = ,
2
2
bo z założenia L(f ) = U (f ). Zatem podział P 3 spełnia wymóg (16.1).
Dla dowodu przeciwnej implikacji przyjmijmy nie wprost, że f nie jest całkowalna w sensie Riemanna. Wtedy L(f ) 6=
U (f ), zatem z wniosku 16.1.10 wynika, że L(f ) < U (f ). Z definicji sum dolnych i górnych wnosimy, że dla dowolnego
P ∈ Podz([a, b]) mamy
U (f, P) − L(f, P) ­ U (f ) − L(f ).
)
W szczególności wynika stąd, że dla := U (f )−L(f
, które na mocy przyjętego założenia jest dodatnie, nie znajdziemy
2
podziału P spełniającego warunek (16.1). A to dowodzi, że implikacja przeciwna również zachodzi.
262
ROZDZIAŁ 16. CAŁKA OZNACZONA
16.2
Własności całki Riemanna
16.2.1
Monotoniczność całki
Twierdzenie 16.2.1 Niech f, g : [a, b] → R będą funkcjami ograniczonymi. Jeśli f ¬ g to
L(f ) ¬ L(g) oraz U (f ) ¬ U (g).
W szczególności, jeśli tak f jak i g są całkowalne w sensie Riemanna, to
Z
b
Z
b
f¬
a
16.2.2
g.
a
Przestrzeń wektorowa funkcji całkowalnych w sensie Riemanna.
Twierdzenie 16.2.2 Jeśli f, g : [a, b] → R są całkowalne w sensie Riemanna to f + g oraz f − g są całkowalne w
sensie Riemanna oraz
Z b
Z b
Z b
Z b
Z b
Z b
(f + g) =
f+
g
i
(f − g) =
f−
g.
a
a
a
a
a
a
Ponadto, dla dowolnego α ∈ R funkcja αf jest całkowalna w sensie Riemanna oraz
Z
b
b
Z
(αf ) = α
a
f.
a
Uwaga 16.2.3 Jeśli f : [a, b] → R jest całkowalna w sensie Riemanna, to
Z
b f ¬ (b − a) sup |f (x)|.
a x∈[a,b]
Twierdzenie 16.2.4 Przestrzeń Riem([a, b]) funkcji całkowalnych w sensie Riemanna na przedziale zwartym [a, b] z
działaniem dodawania funkcji oraz możenia funkcji przez liczbę jest przestrzenią wektorową. Ponadto, odwzorowanie
Riem([a, b]) 3 f 7→ ||f || := sup |f (x)| ∈ R∗
x∈[a,b]
jest normą, która zadaje w Riem([a, b]) strukturę przestrzeni wektorowej unormowanej, a tym samym strukturę przestrzeni metrycznej. Co więcej, odwzorowanie
Z
Riem([a, b]) 3 f 7→
b
f ∈R
a
jest odwzorowaniem liniowym oraz Lipschitzowskim ze stałą len[a, b], a więc w szczególności odwzorowaniem ciągłym.
16.2. WŁASNOŚCI CAŁKI RIEMANNA
16.2.3
263
Miarowe kryterium całkowalności.
Definicja 16.2.5 Miarą zewnętrzną podzbiorów R nazywamy funkcję
P
S
µ∗ : P(R) 3 E 7→ inf { A∈A len A | A ⊂ Przedz(R) oraz E ⊂ A }.
Mówimy, że zbiór E ⊂ R jest miary zero jeżeli µ∗ (E) = 0.
Twierdzenie 16.2.6 Miara zewnętrzna ma następujące własności:
(i) µ∗ (∅) = 0,
(ii) E ⊂ F ⇒ µ∗ (E) ¬ µ∗ (F ),
S∞
P∞
(iii) µ∗ ( i=1 Ei ) ¬ i=1 µ∗ (Ei ),
Przykład 16.2.7 Zbiorem miary zero jest każdy skończony zbiór punktów.
Wniosek 16.2.8 Suma co najwyżej przeliczalnej rodziny zbiorów miary zero jest zbiorem miary zero.
Twierdzenie 16.2.9 Funkcja ograniczona f : [a, b] → R jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy
zbiór punktów, w których nie jest ciągła ma miarę zero. W szczególności, jeśli f jest ciągła, to jest całkowalna w sensie
Riemanna.
16.2.4
Całkowalność złożenia i iloczynu
Twierdzenie 16.2.10 Całka Riemanna ma następujące własności:
(i) jeśli f ∈ Riem(I) jest całkowalna w sensie Riemanna, a ϕ : R → R jest ciągła, to ϕ ◦ f ∈ Riem(I),
(ii) jeśli f, g ∈ Riem(I), to ich ich iloczyn f · g ∈ Riem(I),
(i) jeśli f ∈ Riem(I), to |f | ∈ Riem(I).
16.2.5
Całka Riemanna na podprzedziale
Definicja 16.2.11 Niech f : R−→
◦ R będzie funkcją ograniczoną i niech [a, b] ⊂ dom f . Mówimy, że f jest całkowalna
w sensie Riemanna na przedziale [a, b], jeżeli zwężenie f|[a,b] jest funkcją całkowalną w sensie Riemanna. W takim
Rb
przypadku całkę a f|[a,b] nazywamy całką Riemanna funkcji f na przedziale [a, b] lub całką oznaczoną funkcji f od a
do b i oznaczamy
Z b
Z b
f :=
f|[a,b] .
a
a
264
ROZDZIAŁ 16. CAŁKA OZNACZONA
Twierdzenie 16.2.12 Niech f : R−→
◦ R będzie funkcją ograniczoną i niech [a, b] będzie przedziałem zwartym zawartym
w dziedzinie funkcji f . Jeśli P jest podziałem przedziału [a, b] zadanym ciągiem x : { 0, 1, 2, . . . k } → [a, b], to f jest
całkowalna w sensie Riemanna na przedziale [a, b] wtedy i tylko wtedy gdy dla każdego i = 1, 2, . . . k funkcja f jest
całkowalna w sensie Riemanna na przedziale [xi−1 , xi ]. Co więcej, gdy którykolwiek z tych warunków zachodzi, to
Z
b
f=
a
16.2.6
k Z
X
i=1
xi
f.
xi−1
Całka oznaczona
Definicja 16.2.13 Niech f : R−→
◦ R będzie funkcją ograniczoną całkowalną w sensie Riemanna na przedziale [a, b].
Całkę Riemanna z f na przedziale [a, b] określa się też mianem całki oznaczonej z f na przedziale [a, b] i oznacza się
bardziej tradycyjnym symbolem
Z b
Z b
Z
f (x)dx :=
f :=
f.
a
a
[a,b]
Wniosek 16.2.14 Jeśli f jest całkowalna w sensie Riemanna na przedziale [a, b] oraz c ∈ (a, b), to f jest całkowalna
w sensnie Riemanna na przdziałach [a, c] i [c, b] oraz
Z
b
Z
f (x)dx =
a
c
Z
f (x)dx +
a
b
f (x)dx.
c
W programie Mathematica całkę oznaczoną z funkcji f na przedziale [a, b] obliczamy używając instrukcji
Integrate[f[x], {x, a, b}]
W miarę swoich możliwości Mathematica stara się zwrócić dokładny wynik. Na przykład
Integrate[Sqrt[1 - x^2], {x, 0, 1}]
zwraca
16.2.7
π
4.
Twierdzenie Riemanna
Niech f : R−→
◦ R będzie funkcją ograniczoną i niech [a, b] będzie przedziałem zwartym zawartym w dziedzinie funkcji f .
Niech P będzie podziałem przedziału [a, b] zadanym ciągiem x : { 0, 1, 2, . . . k } → [a, b].
Definicja 16.2.15 Niech Ξ := { ξ1 , ξ2 , . . . ξk } ⊂ [a, b] będzie zbiorem punktów takich, że ξi ∈ [xi−1 , xi ] dla i =
1, 2, . . . k. Parę (P, Ξ) nazywamy parą aproksymacyjną dla f na przedziale [a, b], a wyrażenie
S(f, P, Ξ) :=
k
X
f (ξi )(xi − xi−1 )
i=1
nazywamy sumą aproksymacyjną dla f na przedziale [a, b]. Ciąg par aproksymacyjnych (P n , Ξn )∞
n=1 nazywamy ciągiem
normalnym, jeżeli ciąg średnic podziałów P n zmierza do zera.
16.2. WŁASNOŚCI CAŁKI RIEMANNA
265
Twierdzenie 16.2.16 (Riemanna). Niech f : [a, b] → R będzie funkcją ograniczoną. Funkcja ta jest całkowalna w
sensie Riemanna wtedy i tylko wtedy gdy istnieje liczba g ∈ R taka, że dla każdego > 0 istnieje δ > 0 taka, że dla
każdej pary aproksymacyjnej (P, Ξ) dla f na przedziale [a, b] mamy
δ(P) < δ ⇒ |S(f, P, Ξ) − g| < .
Liczba g jest wyznaczona jednoznacznie i jest równa całce
Program, który liczy przybliżenie całki
Rb
a
f.
x
Z
f (t)dt
0
w oparciu o sumy Riemanna
sn :=
n
X
1 i
f ( x)
n
n
i=1
przedstawia listing 16.1. Podobny program w języku C++ przedstawia listing 16.2.
Wyrazy ciągu sn powinny przybliżać pole ćwiartki koła, czyli
π
= 0.7853981633974483...,
4
natomiast 20-ty wyraz ciągu sn wyliczony przez program to
s20 = 0.785397208948704.
Widzimy więc, że z punktu widzenia liczenia liczby π ta technika jest gorsza niż zastosowana wcześniej technika szeregów.
Jednak pożytki z niej leżą gdzie indziej.
Ćwiczenie komputerowe 16.2.17 Adaptuj program z listingu 16.2 do policzenia przybliżenia pola soczewkowatej
figury na rys. 1.13.
266
ROZDZIAŁ 16. CAŁKA OZNACZONA
( ∗ P r z y b l i ż a n i e c a ł k i o z n a c z o n e j z f u n k c j i f od 0 do x p o p r z e z
p o l a m p r o s t o k ą t ó w pod wykresem ∗ )
R i e m I n t e g r a l [ f_ , x_ , m_] :=
Module [ { s , k , y } ,
s = 0 . ; k = 0;
( ∗ Sumujemy w z m i e n n e j s w a r t o ś c i f u n k c j i w punktach x∗k/m ∗ )
Do[
y = x∗k/m;
s = s + f [y];
k = k + 1,
{m}
];
( ∗ Zwracamy sumę pomnożoną p r z e z wspólną d ł u g o ś ć podstawy wynoszącą 1/m ∗ )
s /m
]
( ∗ Wykres p o n i ż s z e j f u n k c j i nad p r z e d z i a ł e m [ 0 , 1 ] t o ć w i a r t k a okręgu ∗ )
a r c [ x_ ] := Sqrt [ 1 − x ^ 2 ] ;
( ∗ Przybliżymy p o l e pod ć w i a r t k ą okręgu danego f u n k c j ą a r c nad [ 0 , 1 ]
Wykonamy 20 prób za każdym razem p o d w a j a j ą c i l o ś ć p r z e d z i a ł ó w ∗ )
m = 1; d = 1;
Do[
p = R i e m I n t e g r a l [ arc , 1 . , m ] ;
( ∗ Wydruk k o n t r o l n y : c a ł k a powinna być b l i s k a p i /4 ∗ )
Print [ "s[" , d , " ]= " , NumberForm[ p , 1 6 ] ] ;
m = m∗ 2 ; d = d + 1 ,
{20}
]
Listing 16.1: Przybliżanie całki oznaczonej w języku Mathematica
16.2. WŁASNOŚCI CAŁKI RIEMANNA
267
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ R i e m I n t e g r a l . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ P r z y b l i ż a n i e c a ł k i o z n a c z o n e j p o p r z e z p o l a p r o s t o k ą t ó w ∗/
/∗ pod wykresem
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include <i o s t r e a m >
#include <cmath>
#include <iomanip>
using namespace s t d ;
/∗ Wykres p o n i ż s z e j f u n k c j i nad p r z e d z i a ł e m [ 0 , 1 ] t o ć w i a r t k a okręgu ∗/
double a r c ( double x ) {
return s q r t (1−x∗x ) ;
}
/∗ P r z y b l i ż a n i e c a ł k i Riemanna f u n k c j i f od 0 do x sumą m p r o s t o k ą t ó w
Z a p i s d o u b l e ( ∗ f ) ( d o u b l e ) oznacza , ż e argumentem f j e s t f u n k c j a ∗/
double R i e m I n t e g r a l ( double ( ∗ f ) ( double ) , double x , i n t m) {
double s =0;
/∗ Sumujemy w z m i e n n e j s w a r t o ś c i f u n k c j i w punktach x∗k/m ∗/
f o r ( i n t k=0;k<m; k=k+1){
double y=x∗k/m;
s=s+f ( y ) ;
}
/∗ Zwracamy sumę pomnożoną p r z e z wspólną d ł u g o ś ć podstawy wynoszącą 1/m ∗/
return s=s /m;
}
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
i n t m=1;
/∗ Przybliżymy p o l e pod ć w i a r t k ą okręgu danego f u n k c j ą a r c nad [ 0 , 1 ]
Wykonamy 20 prób za każdym razem p o d w a j a j ą c i l o ś ć p r z e d z i a ł ó w ∗/
f o r ( i n t d=1;d<=20;d=d+1){
double p=R i e m I n t e g r a l ( arc , 1 . ,m) ;
/∗ Wydruk k o n t r o l n y : c a ł k a powinna być b l i s k a p i /4 ∗/
c o u t << "s[" << setw ( 2 ) << d << "] =" << setw ( 1 8 ) << p ;
c o u t << e n d l ;
m=m∗ 2 ;
}
}
Listing 16.2: Przybliżanie całki oznaczonej w C++
268
ROZDZIAŁ 16. CAŁKA OZNACZONA
Rozdział 17
Funkcja pierwotna i całka nieoznaczona
Jak wspomnieliśmy w rozdziale wst˛epnym Newton i Leibniz odkryli, że poj˛ecie pochodnej i poj˛ecie całki sa˛ ze soba˛ powiazane.
˛
Wzi˛ecie całki z pochodnej oraz
pochodnej z całki prowadza˛ do wyjściowej funkcji. W niniejszym rozdziale doprecyzujemy co to oznacza oraz zajmiemy si˛e pożytkami jakie z tego faktu płyna.˛
17.1
Podstawowe twierdzenie rachunku różniczkowego i całkowego
17.1.1
Pochodna całki
Twierdzenie 17.1.1 Niech f : [a, b] → R będzie funkcją całkowalną w sensie Riemanna. Rozważmy funkcję
Z x
F : [a, b] 3 x 7→
f (t)dt.
a
Wtedy
(i) funkcja F jest funkcją Lipschitza,
(ii) jeśli f jest ciągła w punkcie x0 ∈ [a, b] to F jest różniczkowalna w x0 oraz F 0 (x0 ) = f (x0 ).
Dowód: Aby pokazać własność (i) rozważmy x, y ∈ (a, b) spełniające x < y. Niech M := supx∈[a,b] f (x)|. Mamy
Z
y
x
Z
f ¬
y
|f | ¬ M (y − x) = M |y − x|.
x
Zatem F rzeczywiście jest funkcją Lipschitza.
Dla dowodu własności (ii) ustalmy > 0. Z ciągłości f w x0 znajdziemy δ > 0 takie, ze
|x − x0 | < δ ⇒ |f (x) − f (x0 | < .
Zatem dla |h| < δ
Z
Z x0 +h
Z x0 +h
Z x0 +h
x0 +h
F (x0 + h) − F )x0 )
h 1
1
1
= ,
f
(t)dt
−
f
(x
)dt
|f
(t)
−
f
(x
)|
¬
dt
=
¬
−
f
(x
)
=
0 0
0
h
|h| x0
h
|h| x0
|h| x0
x0
co dowodzi, że F jest różniczkowalna w x0 oraz F 0 (x0 ) = f (x0 ).
269
270
17.1.2
ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Funkcja pierwotna i całka nieoznaczona.
Definicja 17.1.2 Niech f : [a, b] → R. Mówimy, że F : [a, b] → R jest funkcją pierwotną funkcji f jeżeli F jest
różniczkowalna oraz F 0 (x) = f (x) dla każdego x ∈ [a, b].
Z twierdzenia 17.1.1 łatwo wyprowadzamy następujacy wniosek.
Wniosek 17.1.3 Jeśli f : [a, b] → R jest ciągła to funkcja
Z
[a, b] 3 x 7→
x
f (t)dt ∈ R
a
jest funkcją pierwotna funkcji f .
Naturalne jest pytanie czy funkcja f moze mieć więcej niż jedną pierwotną. Dodając do pierwotnej funkcję stałą dostajemy
inną pierwotną tej samej funkcji, bo pochodna funkcji stałej jest zero. Okazuje się, że więcej pierwotnych już nie ma jak
wynika z następującego twierdzenia.
Twierdzenie 17.1.4 Jeśli F1 i F2 są pierwotnymi funkcji f , to różnica F1 − F2 jest funkcja stałą.
Dowód: Niech F := F1 − F2 . Funkcja F jest różniczkowalna oraz F 0 = F10 − F20 = 0. Niech x, y ∈ [a, b] i x < y. Z
twierdzenia o wartości średniej wiemy, że istnieje ξ ∈ (x, y) takie, że
F (x) − F (y) = F 0 (ξ)(x − y) = 0.
Zatem F (x) = F (y), a ponieważ x, y są dowolne, otrzymujemy tezę.
Wygodnie jest zebrać wszystkie pierwotne razem.
Definicja 17.1.5 Niech f : [a, b] → R będzie funkcją całkowalną
w sensie Riemanna. Zbiór wszystkich pierwotnych
R
funkcji f nazywamy całką nieoznaczoną f i oznaczamy f .
R
W szczególności zapis F ∈ f oznacza, że F jest fukcją pierwotną f . Stosowany jest również tradycyjny, choć mało
precyzyjny zapis
Z
F (x) = f (x)dx + C,
który należy interpretować tak, że wybierając jakąś pierwotną z całki nieoznaczonej i dodając do niej stałą dostaniemy inną
pierwotną.
17.1.3
Podstawowe twierdzenie rachunku różniczkowego i całkowego
Leibniz i Newton odkryli, że znajomość pierwotnej pozwala wygodnie obliczać pole pod wykresem funkcji. Jest to nieporównalnie łatwiejsze od liczenia sum aproksymacyjnych Riemanna. Natomiast maszynką dostarczające liczne (choć niestety
nie wszystkie potrzebne) wzory na funkcje pierwotne są wszelkie wzory na pochodne.
Twierdzenie 17.1.6 (podstawowe twierdzenie rachunku różniczkowego i całkowego) Niech f : [a, b] → R
będzie całkowalna w sensie Riemanna. Jeśli F jest pierwotną funkcji f to
Z x
F (x) =
f (t)dt + F (a).
(17.1)
a
W szczególności
Z
b
f (t)dt = F (b) − F (a).
a
(17.2)
17.2. PODSTAWOWE TECHNIKI CAŁKOWANIA.
271
Dla wygody w dalszym ciągu stosować będziemy zapis F |ba := F (b) − F (a).
Dowód: Pokażemy najpierw (17.2). Dla k ∈ N1 wybierzmy podział P k przedziału [a, b] o średnicy nie większej niż
zadanym ciągiem xk : {0, 1, . . . nk } → R. Z twierdzenia o wartości średniej zastosowanego do F mamy
F (b) − F (a) =
n
X
F 0 (ξik )(xki − xki−1 )
1
k,
(17.3)
i=1
dla pewnych punktów ξik ∈ (xki−1 , xki ). Ponieważ F 0 (xki ) = f (xki ), więc prawa strona równości (17.3) jest sumą aproksymacyjRb
ną dla f na [a, b]. Zatem z twierdzenia Riemanna (tw. 16.2.16) prawa strona (17.3) zmierza do a f przy k → ∞, bo podziały
P k dobraliśmy tak, by ich średnice zmierzały do zera. Ale na mocy równości (17.3) wszystkie te sumy aproksymacyjne są
równe F (b) − F (a), zatem i granica jest równa F (b) − F (a) co dowodzi (17.2).
Aby pokazać (17.1) wystarczy zastosować pokazany już wzór (17.2) do zawężenia f|[a,x] .
17.2
Podstawowe techniki całkowania.
17.2.1
Własności całki nieoznaczonej.
Podamy teraz kilka podstawowych wzorów dla całki nieoznaczonej. Pojawiające się w nich funkcje rozważać będziemy na
przedziale [a, b]. Symbolem Const oznaczać będziemy rodzinę funkcji stałych na przedziale [a, b].
Twierdzenie 17.2.1 (liniowość całki nieoznaczonej). Niech f, g : [a, b] → R będą całkowalne w sensie Riemanna.
Wtedy f + g jest całkowalna w sensie Riemanna oraz
Z
Z
Z
(f + g) = f + g.
(17.4)
Ponadto αf jest całkowalna w sensie Riemanna dla dowolnego α ∈ R oraz
Z
Z
(αf ) = α f.
(17.5)
Zauważmy, że wzory (17.4) i (17.5) należy rozumieć jako równość zbiorów, ponieważ całka nieoznaczona jest zbiorem, a
dokładniej zbiorem funkcji pierwotnych.
Dowód: Całkowalność funkcji αf + βg i funkcji αf dostajemy wprost z twierdzenia 16.2.2. Zauważmy, że jeżeli F jest
pierwotną f , a G jest pierwotną g, to F +G jest pierwotną f +g na podstawie twierdzenia o pochodnej sumy funkcji. Dowodzi
to zawieranie się strony prawej w lewej we wzorze (17.4). Aby pokazać inkluzję przeciwną załóżmy, że H jest elementem
lewej strony równości (17.4). Wtedy H jest pierwotną funkcji f + g. Niech F będzie dowolnie ustaloną pierwotną funkcji f .
Połóżmy G : H − F . Mamy G0 = H 0 − F 0 = (f + g) − f = g. Zatem G jest pierwotną funkcji g, a ponieważ H = F + G,
więc H jest sumą pierwotnej funkcji f i pierwotnej funkcji g. Zatem H należy do prawej strony (17.4).
Dowód (17.5) jest podobny i zostawiamy go jako ćwiczenie.
Następujące twierdzenia są natychmiastową konsekwencją stosownych wzorów dla pochodnych i definicji całki nieoznaczonej.
272
ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Twierdzenie 17.2.2 Zachodzą następujące wzory
Z
0[a,b] dx = Const,
Z
1
dx = ln x + Const,
x
Z
ex dx =
Z
1[a,b] dx = x + Const,
Z
xα dx =
xα+1
+ Const dla α 6= −1,
α+1
ex + Const .
Twierdzenie 17.2.3 Zachodzą następujące wzory
Z
sin xdx = − cos x + Const,
Z
1
dx = tg x + Const,
cos2 x
Z
1
dx
1 + x2
Z
cos xdx = sin x + Const,
Z
=
√
1
dx = arc sin x + Const,
1 − x2
arc tg x + Const .
17.2.2
Całkowanie przez części
Widzieliśmy, że całkowanie sumy dwóch funkcji jest proste. Jest tak, bo pochodna sumy jest suma˛ pochodnych i w efekcie również całka sumy jest suma˛ całek.
Niestety pochodna iloczynu nie jest iloczynem pochodnych, a w efekcie całka iloczynu nie jest iloczynem całek. Dlatego nie jest oczywiste jak liczyć całki iloczynu
dwóch funkcji. Jednak wzór na pochodna˛ iloczynu jest w tym przypadku pomocny, chociaż nie bezpośrednio i nie automatycznie. Całkujac
˛ wzór na pochodna˛
iloczynu dostajemy
Z
Z
Z
(f g)0 =
f 0g +
f g0 .
Ponieważ f g jest pierwotna˛ (f g)0 , dostajemy
Z
f g + Const =
f 0g +
Z
f g0 .
˛ a˛ liczenie całki
RJeśli0 jedna z dwóch całek
R po prawej stronie jest łatwiejsza do policzenia niż druga, to wzór ten mozemy potraktować jako metod˛e sprowadzajac
f g do liczenia całki f g 0 . Jak zobaczymy, metoda ta może być użyteczna. Określana jest mianem całkowania przez cz˛eści.
Twierdzenie 17.2.4 Załóżmy, że f, g : [a, b] → R są klasy C 1 . Wtedy
Z
Z
0
f g = f g − f g0
(17.6)
W szczególności mamy też wzór dla całek oznaczonych:
Z
a
b
f 0 (x)g(x)dx = f (x)g(x)|ba −
Z
a
b
f (x)g 0 (x)dx.
(17.7)
17.2. PODSTAWOWE TECHNIKI CAŁKOWANIA.
273
Dowód: Niech F będzie elementem lewej strony wzoru (17.6). Wtedy F 0 = f 0 g. Mamy
F = f g − (f g − F ).
Zatem aby pokazać, że F jest elementem prawej strony wzoru (17.6), wystarczy pokazać, że f g − F jest pierwotną funkcji
f g 0 . Jest tak w istocie, bo
(f g − F )0 = (f g)0 − F 0 = f 0 g + f g 0 − f 0 g = f g 0 .
Rozważmy teraz element prawej strony równości (17.6). Ma on postać f g − G, gdzie G jest pierwotną f g 0 . Musimy pokazać,
że f g − G jest pierwotną f 0 g. Rzeczywiście tak jest, bo
(f g − G)0 = f 0 g + f g 0 − f g 0 = f 0 g.
Aby pokazać (17.7) wybierzmy F pierwotną dla f 0 g. Ze wzoru (17.6) wiemy, że F = f g − G, gdzie G jest pewną pierwotną
f g 0 . W szczególności
F (b)
=
f (b)g(b) − G(b)
F (a)
=
f (a)g(a) − G(a).
Odejmując te równości stronami dostajemy
F (b) − F (a) = f (b)g(b) − f (a)g(a) − (G(b) − G(a)).
(17.8)
W oparciu o przyjętą konwencję zapisywania różnic mamy
f (b)g(b) − f (a)g(a) = f (x)g(x)|ba .
Z podstawowego twierdzenia rachunku różniczkowego i całkowego (tw. 17.1.6) oraz z definicji F i G jako funkcji pierwotnych
odpowiednio f 0 g oraz f g 0 otrzymujemy
Z
F (b) − F (a)
b
f 0 (x)g(x)dx
=
a
Z
G(b) − G(a)
=
b
f (x)g 0 (x)dx.
a
Wstawiając otrzymane trzy równości do (17.8) otrzymujemy (17.7).
274
ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Przykład 17.2.5 Metodę całkowania przez części zastosujemy do policzenia całki
Z
x sin xdx.
Musimy w tym celu przedstawić funkcję x 7→ x sin x jako iloczyn pewnej funkcji przez pochodną innej funkcji. Mamy
dwie możliwości:
x sin x = x(− cos x)0
lub
x sin x =
x2
2
0
sin x
i nie jest oczywiste, z której lepiej skorzystać. Pierwsza sprowadzi problem do policzenia całki
Z
(x)0 (− cos x)dx,
a druga do całki
Z x2
2
(sin x)0 dx.
Z tych dwóch całek zdecydowanie łatwiejsza jest pierwsza, bo
Z
Z
(x)0 (− cos x)dx = − cos xdx = − sin x + Const .
Zatem wstawiając do wzoru (17.6) za f funkcję x 7→ − cos x, a za g funkcję identycznościową x 7→ x dostajemy
Z
Z
Z
Z
x sin xdx = (− cos x)0 xdx = −x cos x − (− cos x)x0 dx = −x cos x + cos xdx = −x cos x + sin x + Const .
17.2.3
Całkowanie przez podstawienie
Podobnie jak w przypadku iloczynu nie jest oczywiste jak całkować złożenie funkcji. Pochodna złożenia nie jest złożeniem pochodnych zatem i całka złożenia nie
jest złożeniem całek. Jednak całkujac
˛ wzór na pochodna˛ złożenia dostajemy wzór dostarczajacy
˛ metod˛e liczenia całek przydatna˛ w przypadku złożeń i zwana˛
całkowaniem przez podstawienie.
Twierdzenie 17.2.6 Załóżmy, że f : [a, b] → R jest funkcją ciągłą, a g : [α, β] → [a, b] jest klasy C 1 . Jeśli F jest
pierwotną funkcji f to F ◦ g jest pierwotną funkcji (f ◦ g)g 0 . W konsekwencji
Z Z
(f ◦ g)g 0 =
f ◦ g.
(17.9)
W szczególności
Z
β
α
f (g(t))g 0 (t)dt =
Z
g(β)
f (x)dx.
(17.10)
g(α)
Dowód: Jeśli F jest pierwotną funkcji f to oczywiście F ◦ g jest pierwotną funkcji (f ◦ g)g 0 , zatem prawa strona
zawiera się w lewej w (17.9). Aby pokazać, że lewa strona zawiera się w prawej przyjmijmy, że G jest pierwotną funkcji
(f ◦ g)g 0 . Wybierzmy też pewną pierwotną F funkcji f . Wiemy już, że wtedy F ◦ g jest pierwotną (f ◦ g)g 0 , zatem na mocy
17.2. PODSTAWOWE TECHNIKI CAŁKOWANIA.
275
twierdzenia 17.1.4 istnieje stała C taka, że G = F ◦ g + C. Mamy
G = F ◦ g + C = F ◦ g + C ◦ g = (F + C) ◦ g = F̄ ◦ g,
gdzie F̄ = F + C jest inną pierwotną f . Zatem G jako podstawienie g w pierwotnej F̄ funkcji f należy do prawej strony
równości (17.9).
Pozostaje pokazać (17.10). Wiemy, że jeśli F jest pierwotną f to F ◦ g jest pierwotną (f ◦ g)g 0 . Zatem z podstawowego
twierdzenia rachunku różniczkowego i całkowego (tw. 17.1.6) mamy
Z g(β)
Z β
0
f (x)dx.
f (g(t))g (t)dt = (F ◦ g)(α) − (F ◦ g)(β) = F (g(α)) − F (g(β)) =
g(α)
α
R
x
R
x
R
x ln a
Przykład 17.2.7
Policzymy całkę
dx. Chcielibyśmy sprowadzić poR
R nieoznaczoną a dx. Mamy a dx = e
liczenie całki ex ln a dx do całki eu du. Funkcja x 7→ ex ln a jest podstawieniem funkcji g : x 7→ x ln a w funkcji
f : u 7→ eu . Ponieważ pochodną g jest funkcja stała ln a, więc z twierdzenia 17.2.6 mamy
Z
Z
Z
Z
1
1
ax dx =
ex ln a dx =
ex ln a ln adx =
eu du ◦ (x 7→ x ln a) =
ln a
ln a
1
ax
1
(eu + Const) ◦ (x 7→ x ln a) =
ex ln a + Const =
+ Const .
ln a
ln a
ln a
17.2.4
Twierdzenia o wartości średniej dla całek
Twierdzenie 17.2.8 (o wartości średniej dla całek) Niech f : [a, b] → R będzie funkcją klasy C 1 , a g : [a, b] → R
funkcją całkowalną w sensie Riemanna. Jeśli g ma stały znak na [a, b] to istnieje ξ ∈ [a, b] takie, że
Z
b
Z
f g = f (ξ)
a
b
g.
(17.11)
a
Dowód: Rozważmy przypadek g ­ 0. Połóżmy m := inf { f (x) | x ∈ [a, b] }, M := sup { f (x) | x ∈ [a, b] } i ustalmy
x ∈ [a, b]. Wtedy m ¬ f (x) ¬ M , a zatem również mg(x) ¬ f (x)g(x) ¬ M g(x). Całkując dostajemy
Z b
Z b
Z b
m
g(t)dt ¬
f (t)g(t)dt ¬
M g(t)dt.
a
Rb
a
a
Rb
g = 0, to również a f g = 0 i w konsekwencji (17.11) zachodzi dla dowolnie
Rb
dobranego ξ. Pozostaje zatem rozważyć przypadek a g 6= 0. Wtedy
Rb
fg
m ¬ Ra b ¬ M.
g
a
Z otrzymanej nierówności wynika, że jeśli
a
Zatem z twierdzenia 11.2.14 i wniosku 11.4.7 znajdziemy ξ ∈ [a, b] takie, że
Rb
fg
f (ξ) = Ra b
g
a
co dowodzi (17.11) dla g ­ 0. Rozumowanie dla g ¬ 0 jest analogiczne.
Przyjmując w twierdzeniu 17.2.8 za g funkcję stale równą jeden dostajemy następujący wniosek.
276
ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Wniosek 17.2.9 Jeśli f : [a, b] → R jest klasy C 1 , to istnieje ξ ∈ [a, b] takie, że
b
Z
f = f (ξ)(b − a).
a
W programie Mathematica całkę nieoznaczoną (a dokładniej jedną z funkcji pierwotnych) funkcji f obliczamy używając
instrukcji
Integrate[f[x], x]
Na przykład
Integrate[Sin[3 x]^7, x]
zwraca
−
17.3
35
7
7
cos(21x)
cos(3x) +
cos(9x) −
cos(15x) +
192
192
960
1344
Całkowanie funkcji wektorowych
Rozważmy funkcję f : [a, b] → Rm . Funkcję taką określać będziemy mianem krzywej. Wtedy f = (f1 , f2 , . . . , fm ) gdzie
fi : [a, b] → R dla i = 1, 2, . . . , m.
Definicja 17.3.1 Mówimy, że f jest całkowalna w sensie Riemanna jeżeli funkcje fi są całkowalne w sensie Riemanna
dla wszystkich i = 1, 2, . . . , m. W takim przypadku jako całkę Riemanna f przyjmujemy
Z
b
b
Z
f := (
a
Z
f1 ,
a
b
Z
f2 , . . . ,
a
b
fm ).
a
Twierdzenie 17.3.2 Niech f : [a, b] → Rm będzie całkowalna w sensie Riemanna. Wtedy funkcja
||f || : [a, b] 3 x 7→ ||f (x)|| ∈ R
jest całkowalna w sensie Riemanna oraz
Z
||
b
Z
f || ¬
a
b
||f ||.
a
Dowód: Niech f = (f1 , f2 , . . . fm ). Z założenia funkcje fi są całkowalne w sensie Riemanna. Ponieważ funkcja
Rm 3 x 7→ ||x|| ∈ R
jest ciągła, zbiór punktów nieciągłości funkcji ||f || zawiera się w sumie mnogościowej zbiorów punktów nieciągłości funkcji
fi . Na mocy twierdzenia 16.2.9 całkowalność funkcji fi implikuje, że zbiór punktów nieciągłości funkcji fi jest miary zero.
Zatem również zbiór punktów nieciągłości funkcji ||f || jest miary zero, a więc z twierdzenia 16.2.9 wnosimy, że funkcja ta
jest całkowalna w sensie Riemanna.
Rb
Połóżmy vi := a fi i v = (v1 , v2 , . . . vn ). Jeśli v = 0 to teza jest oczywista. Załóżmy zatem, że v 6= 0. Dla x ∈ [a, b] mamy
z nierówności Schwartza
|v · f (x)| ¬ ||v|| ||f (x)||.
17.4. ZASTOSOWANIA GEOMETRYCZNE CAŁEK
277
Funkcja
[a, b] 3 x 7→ v · f (x) =
m
X
vi fi (x) ∈ R
i=1
jest całkowalna w sensie Riemanna. Zatem
2
||v|| =
m
X
vi vi =
i=1
m
X
i=1
Z
vi
b
Z
Z
b
v·f ¬
fi =
a
b
Z
||v|| ||f (x)||dx = ||v||
a
a
b
||f (x)||dx.
a
Dzieląc otrzymaną nierówność obustronnie przez ||v|| otrzymujemy
b
Z
||v|| ¬
||f (x)||dx.
a
Ponieważ v =
Rb
a
f , dowodzi to tezy.
17.4
Zastosowania geometryczne całek
17.4.1
Długość krzywej
Niech γ : [a, b] → Rm będzie krzywą i niech P będzie podziałem przedziału [a, b] zadanym ciągiem punktów (x0 , x1 , . . . xn ).
Liczba
m
X
Λ(γ, P) :=
||γ(xi ) − γ(xi−1 )||
i=1
określa długość łamanej rozpiętej na punktach γ(xi ).
Definicja 17.4.1 Mówimy, że krzywa γ jest prostowalna jeżeli istnieje kres górny
Λ(γ) := sup { Λ(γ, P) | P podział przedziału [a,b] }.
Mówimy wtedy, że liczba Λ(γ) jest długością krzywej γ.
Twierdzenie 17.4.2 Niech γ : [a, b] → Rm będzie krzywą klasy C 1 . Wtedy γ jest prostowalna oraz
b
Z
||γ 0 (t)||dt.
Λ(γ) =
(17.12)
a
Dowód: Pokażemy najpierw, że w (17.12) lewa strona jest niewiększa od prawej. Niech P będzie podziałem przedziału
[a, b] wyznaczonym przez punkty x0 , x1 , . . . xn . Wtedy
Z xi
Z xi
0
||γ(xi ) − γ(xi−1 )|| = ||
γ (t)dt|| ¬
||γ 0 (t)dt||
xi−1
xi−1
dla i = 1, 2, . . . n. Sumując po i dostajemy
Z
Λ(γ, P) ¬
a
b
||γ 0 (t)dt||,
278
ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
a ponieważ P jest dowolnym podziałem [a, b] otrzymujemy
Z
b
Λ(γ) ¬
||γ 0 (t)||dt.
a
Dla dowodu nierówności przeciwnej ustalmy > 0. Założyliśmy, że γ jest klasy C 1 , więc γ 0 jest funkcją ciągłą. Jako
funkcja ciągła na zbiorze zwartym jest ona jednostajnie ciągła. Zatem znajdziemy δ > 0 takie, że dla s, t ∈ [a, b]
|s − t| < δ ⇒ ||γ 0 (s) − γ 0 (t)|| < 0 :=
.
2(b − a)
(17.13)
Niech P będzie podziałem przedziału [a, b] wyznaczonym przez punkty x0 , x1 , . . . xn o średnicy nie przekraczającej δ. Z
(17.13) wnosimy, że dla t ∈ [xi−1 , xi ]
||γ 0 (t)|| ¬ ||γ 0 (t) − γ 0 (xi )|| + ||γ 0 (xi )|| ¬ ||γ 0 (xi )|| + 0 .
Niech ∆xi := xi − xi−1 . Z (17.14) mamy
Z xi
Z xi
Z
0
0
0
0
0
||γ (t)dt|| ¬
(||γ (xi )|| + ) dt = ||γ (xi )||∆xi + ∆xi = ||
xi−1
xi−1
Z xi
||
xi−1
Z xi
||
xi
(17.14)
γ 0 (xi )dt|| + 0 ∆xi =
xi−1
(γ 0 (t) + γ 0 (xi ) − γ 0 (t)) dt|| + 0 ∆xi ¬
γ 0 (t)dt|| + ||
Z
xi−1
xi
(γ 0 (xi ) − γ 0 (t)) dt|| + 0 ∆xi ¬
xi−1
0
||γ(xi ) − γ(xi−1 )|| + 2 ∆xi .
Sumując po i dostajemy
Z
b
||γ 0 (t)||dt ¬ Λ(γ, P) + 20 (b − a) = Λ(γ, P) + ¬ Λ(γ) + .
a
Ponieważ otrzymana nierówność zachodzi dla każdego > 0, otrzymujemy
Z
b
||γ 0 (t)||dt ¬ Λ(γ).
a
Przykład 17.4.3 Rozważmy krzywą
γ : [0, 2π] 3 t 7→ eit ∈ R2 .
Krzywa ta jest klasy C 1 oraz γ 0 (t) = ieit . Zatem ||γ 0 (t)|| = 1. Stąd
Z
Λ(γ) =
2π
||γ 0 (t)||dt =
0
17.4.2
Z
2π
dt = 2π − 0 = 2π.
0
Bryła obrotowa
Niech f : [a, b] → R+ będzie funkcją ciągłą. Rozważmy bryłę
V := { (x, y, z) ∈ R3 | a ¬ x ¬ b, y 2 + z 2 ¬ f (x)2 }
17.4. ZASTOSOWANIA GEOMETRYCZNE CAŁEK
279
Nazywamy ją bryłą obrotową zadaną przez funkcję f .
Bryła ta powstaje poprzez obrót trapezu krzywoliniowego pod wykresem funkcji f wokół osi x.
17.4.3
Obętość bryły obrotowej
Twierdzenie 17.4.4 Objętość bryły obrotowej dana jest wzorem
Z
π
b
f (x)2 dx.
a
17.4.4
Pole powierzchni bocznej bryły obrotowej
Powierzchnią boczną bryły obrotowej jest zbiór
S := { (x, y, z) ∈ R3 | a ¬ x ¬ b, y 2 + z 2 = f (x)2 }
280
ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Twierdzenie 17.4.5 Jeśli funkcja f jest klasy C 1 , to pole powierzchni bocznej bryły obrotowej dane jest wzorem
Z
2π
a
b
p
f (x) 1 + f 0 (x)2 dx.
Rozdział 18
Ciągi i szeregi funkcyjne
18.1
Zbieżność punktowa i jednostajna
18.1.1
Zbieżność punktowa
Niech X będzie ustalonym zbiorem, a Y ustaloną przestrzenią metryczną. Rozważmy ciąg funkcji sn : X → Y .
Definicja 18.1.1 Mówimy, że ciąg sn jest zbieżny punktowo do funkcji s : X → Y , jeżeli dla każdego punktu x ∈ X
ciąg sn (x) jest zbieżny do s(x).
Rozpisując warunek na zbieżność ciągu możemy zatem zbieżność punktową zapisać
∀x ∈ X ∀ > 0 ∃N ∈ N ∀n ­ N
ρ(sn (x), s(x)) < .
Przykład 18.1.2 Rozważmy ciąg funkcji
fn : [0, 1] 3 x 7→ xn ∈ [0, 1].
Łatwo policzyć, że ciąg ten jest zbieżny punktowo do funkcji f : [0, 1] → [0, 1] danej wzorem
(
0 gdy x ∈ [0, 1),
f (x) :=
1 gdy x = 1.
Choć funkcje fn są ciągłe, funkcja graniczna f nie jest ciągła. Widzimy zatem, że zbieżność punktowa funkcji ciągłych
nie gwarantuje, że funkcja graniczna będzie ciągła.
281
282
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Przykład 18.1.3 Rozważmy ciąg funkcji
fn : [0, 1] 3 x 7→ lim (cos(n!πx))2m ∈ [0, 1].
m→∞
Łatwo policzyć, że dla każdego n funkcja fn przyjmuje wartość zero wszędzie poza skończoną ilością punktów, gdzie
przyjmuje wartość jeden. Zatem każda z funkcji fn jest całkowalna w sensie Riemanna. Ciąg fn jest zbieżny punktowo
do funkcji f : [0, 1] → [0, 1] danej wzorem
(
0 gdy x 6∈ [0, 1] ∩ Q,
f (x) :=
1 gdy x ∈ [0, 1] ∩ Q.
Nie jest to funkcja całkowalna w sensie Riemanna, zatem zbieżność punktowa nie gwarantuje również zachowania
całowalności w sensie Riemanna.
Przykład 18.1.4 Rozważmy ciąg funkcji
sin nx
fn : R 3 x 7→ √
∈ R.
n
Łatwo sprawdzić, że ciąg ten jest punktowo zbieżny do funkcji stale równej zero. Wszystkie funkcje fn są różniczkowalne,
a ich pochodne tworzą ciąg
√
fn0 : R 3 x 7→ n cos nx ∈ R.
Ciąg pochodnych nie jest ciągiem punktowo zbieżnym. Na przykład dla x = π dostajemy ciąg
√
n 7→ (−1)n n,
który nie jest zbieżny. Zatem zbieżność punktowa funkcji nie gwarantuje zachowania ich różniczkowalności w granicy.
Przedstawione przykłady pokazują, że punktowa zbieżność ciągu funkcji nie gwarantuje naturalnych własności, które w
wielu sytuacjach byłyby przydatne. Pojawia się pytanie, czy nie ma jakiegoś bardziej użytecznego pojęcia zbieżności ciągu
funkcji. Jak zobaczymy odpowiedź na to pytanie jest pozytywna. W tym celu potraktujemy funkcje jako punkty stosownie
zdefiniowanej przestrzeni metrycznej.
18.1.2
Zbieżność jednostajna
Niech ρ, ρ0 będą dwoma metrykami w zbiorze Y .
Definicja 18.1.5 Mówimy, że metryki ρ i ρ0 są jednostajnie równoważne, jeżeli zachodzą następujące dwa symetryczne
warunki
∀ > 0
∃δ > 0
ρ(x, y) < δ ⇒ ρ0 (x, y) < ,
∀ > 0
∃δ > 0
ρ0 (x, y) < δ ⇒ ρ(x, y) < .
Definicja 18.1.6 Niech (Y, ρ) będzie przestrzenią metryczną. Mówimy, że ρ jest metryką ograniczoną, jeżeli istnieje
stała M > 0 taka, że dla dowolnych x, y ∈ Y mamy ρ(x, y) < M .
Mamy następującą użyteczną własność:
18.1. ZBIEŻNOŚĆ PUNKTOWA I JEDNOSTAJNA
283
Lemat 18.1.7 « Dla dowolnej przestrzeni metrycznej (Y, ρ) istnieje metryka ograniczona ρ0 jednostajnie równoważna metry-
ce ρ. »
284
18.1.3
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Kryterium Cauchy’ego zbieżności jednostajnej
18.2. ZBIEŻNOŚĆ JEDNOSTAJNA, A CIĄGŁOŚĆ, RÓŻNICZKA I CAŁKA
18.2
Zbieżność jednostajna, a ciągłość, różniczka i całka
18.2.1
Granica, a zbieżność jednostajna
285
286
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
18.2.2
Całkowanie i różniczkowanie, a zbieżność jednostajna
18.3
Aproksymacja funkcji ciągłych
18.4
Szeregi potęgowe
18.4. SZEREGI POTĘGOWE
18.4.1
Twierdzenie o szeregu Taylora
18.4.2
Funkcje analityczne
287
288
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
18.5. SZEREGI FOURIERA
289
Rysunek 18.1: Joseph Fourier (1768-1830)
18.5
Szeregi Fouriera
18.5.1
Wielomiany trygonometryczne
290
18.5.2
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Zespolony iloczyn skalarny
18.5. SZEREGI FOURIERA
18.5.3
Przestrzeń wektorowa z zespolonym iloczynem skalarnym
291
292
18.5.4
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Układ ortonormalny
18.5. SZEREGI FOURIERA
18.5.5
Szereg Fouriera
293
294
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
18.5. SZEREGI FOURIERA
295
296
18.5.6
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Rzut ortonormalny
18.5. SZEREGI FOURIERA
18.5.7
Jądro Dirichleta
297
298
18.5.8
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Zbieżność punktowa szeregu Fouriera
18.5. SZEREGI FOURIERA
299
300
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Bibliografia
[1] F. Leja, Rachunek różniczkowy i całkowy, Państwowe Wydawnictwo Naukowe, Warszawa 1969.
[2] W. Rudin, Podstawy analizy matematycznej, Państwowe Wydawnictwo Naukowe, Warszawa 1982.
[3] W. Rudnicki, Wykłady z analizy matematycznej, Państwowe Wydawnictwo Naukowe, Warszawa 2001.
[4] G.M. Fichtenholz, Rachunek różniczkowy i całkowy, tom I, II i III. Państwowe Wydawnictwo Naukowe, Warszawa 1978.
[5] W. Krysicki, L. Włodarski, Analiza matematyczna w zadaniach, część I i II, Państwowe Wydawnictwo Naukowe, Warszawa 1986.
[6] J. Banaś, S. Wędrychowicz, Zbiór zadań z analizy matematycznej, Wydawnictwo Naukowo-Techniczne, Warszawa 2001.
301
Download
Study collections