Wstęp do Analizy Matematycznej z elementami Logiki i Teorii

Wstęp do Analizy Matematycznej z elementami Logiki i Teorii Mnogości
Notatki do wykładów dla studentów kierunku Matematyka Komputerowa
Marian Mrozek
Uniwersytet Jagielloński
3 października 2014
2
Spis treści
1 Wprowadzenie do analizy matematycznej
1.1 Rozwój pojęcia liczby . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Liczby naturalne . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.2 Ułamki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.3 Liczby ujemne, całkowite i wymierne . . . . . . . . . . . . . .
1.1.4 Liczby niewymierne . . . . . . . . . . . . . . . . . . . . . . .
1.1.5 Liczby rzeczywiste . . . . . . . . . . . . . . . . . . . . . . . .
1.1.6 Liczby urojone i zespolone . . . . . . . . . . . . . . . . . . . .
1.1.7 Liczby w komputerze . . . . . . . . . . . . . . . . . . . . . . .
1.2 Ciągi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Przybliżanie pierwiastka . . . . . . . . . . . . . . . . . . . . .
1.2.2 Ciągi przybliżeń . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.3 Granice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.4 Obliczanie granic ciągu. . . . . . . . . . . . . . . . . . . . . .
1.2.5 Liczba π . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Szeregi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Pole koła . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.2 Liczba π poprzez szereg. . . . . . . . . . . . . . . . . . . . . .
1.3.3 Szeregi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.1 Koncepcja funkcji . . . . . . . . . . . . . . . . . . . . . . . .
1.4.2 Miejsca zerowe funkcji . . . . . . . . . . . . . . . . . . . . . .
1.4.3 Wykres funkcji . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.4 Geometryczne konstrukcje funkcji . . . . . . . . . . . . . . .
1.4.5 Rozwijanie funkcji w szereg . . . . . . . . . . . . . . . . . . .
1.5 Pola figur i całkowanie . . . . . . . . . . . . . . . . . . . . . . . . . .
1.5.1 Całka oznaczona . . . . . . . . . . . . . . . . . . . . . . . . .
1.5.2 Całka nieoznaczona . . . . . . . . . . . . . . . . . . . . . . .
1.6 Styczna do krzywej i granica funkcji . . . . . . . . . . . . . . . . . .
1.6.1 Styczna do krzywej . . . . . . . . . . . . . . . . . . . . . . . .
1.6.2 Granica funkcji . . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.3 Funkcje ciągłe . . . . . . . . . . . . . . . . . . . . . . . . . .
1.6.4 Obliczanie granic. . . . . . . . . . . . . . . . . . . . . . . . .
1.7 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.7.1 Lokalne maksima i minima . . . . . . . . . . . . . . . . . . .
1.7.2 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . .
1.7.3 Podstawowe twierdzenie rachunku różniczkowego i całkowego
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
13
13
13
14
15
15
15
17
17
17
19
20
21
22
22
22
23
24
24
24
25
25
27
28
28
29
31
31
31
33
33
35
35
35
36
4
I
SPIS TREŚCI
Elementy logiki i teorii mnogości
39
2 Matematyka zbiorów skończonych
2.1 Zbiory skończone . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Operacje mnogościowe . . . . . . . . . . . . . . . . . . .
2.1.2 Zawieranie się i równość zbiorów. Podzbiory. . . . . . .
2.1.3 Uzupełnienie zbioru. . . . . . . . . . . . . . . . . . . . .
2.1.4 Elementarne własności operacji mnogościowych . . . . .
2.2 Iloczyn kartezjański . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 Para . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 Iloczyn kartezjański . . . . . . . . . . . . . . . . . . . .
2.3 Relacje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Relacje . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.2 Własności relacji . . . . . . . . . . . . . . . . . . . . . .
2.3.3 Iloczyn kartezjański n zbiorów i relacje n-argumentowe.
2.4 Relacje równoważności . . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Relacja równoważności . . . . . . . . . . . . . . . . . . .
2.5 Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.1 Obrazy i przeciwobrazy . . . . . . . . . . . . . . . . . .
2.5.2 Injekcje, surjekcje, i bijekcje. . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
41
43
44
46
46
48
49
49
49
49
50
52
53
53
54
54
55
55
3 Elementy logiki matematycznej
3.1 Program Hilberta . . . . . . . . . . . . .
3.1.1 Struktury matematyczne. . . . .
3.1.2 Alfabet, słowo i języki formalne.
3.1.3 Spójniki logiczne . . . . . . . . .
3.1.4 Kwantyfikatory . . . . . . . . . .
3.1.5 Termy i predykaty . . . . . . . .
3.2 Język rachunku predykatów. . . . . . . .
3.2.1 Interpretacje. . . . . . . . . . . .
3.3 Rachunek zdań . . . . . . . . . . . . . .
3.4 Tautologie rachunku predykatów . . . .
3.5 Konsekwencja i dowód formalny . . . . .
3.6 Teorie aksjomatyczne . . . . . . . . . . .
3.7 Formalizm w praktyce matematycznej. .
3.8 Schematy dowodowe. . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
57
57
57
58
59
59
60
60
61
64
65
67
69
70
71
4 Elementy teorii mnogości
4.1 Formalizm teorii mnogości . . . . . . . . . . . . . . . .
4.1.1 Podstawowe definicje i oznaczenia. . . . . . . .
4.2 Formuły zbiorotwórcze. . . . . . . . . . . . . . . . . .
4.3 Aksjomaty teorii mnogości. . . . . . . . . . . . . . . .
4.3.1 Elementarne własności operacji mnogościowych
4.4 Iloczyn kartezjański . . . . . . . . . . . . . . . . . . .
4.4.1 Para . . . . . . . . . . . . . . . . . . . . . . . .
4.4.2 Iloczyn kartezjański . . . . . . . . . . . . . . .
4.5 Relacje . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1 Relacje . . . . . . . . . . . . . . . . . . . . . .
4.5.2 Własności relacji . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
73
73
73
76
78
81
82
82
83
84
84
84
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
SPIS TREŚCI
4.6
4.7
4.8
5
4.5.3 Złożenie relacji . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.4 Charakterystyka własności relacji . . . . . . . . . . . . . . .
Relacje równoważności . . . . . . . . . . . . . . . . . . . . . . . . .
4.6.1 Relacja równoważności . . . . . . . . . . . . . . . . . . . . .
Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.7.1 Relacje jednolistne . . . . . . . . . . . . . . . . . . . . . . .
4.7.2 Funkcje częściowe . . . . . . . . . . . . . . . . . . . . . . . .
4.7.3 Funkcje . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.7.4 (*)Zawieranie się funkcji . . . . . . . . . . . . . . . . . . . .
4.7.5 Sklejenie funkcji . . . . . . . . . . . . . . . . . . . . . . . .
4.7.6 (*)Zestawienie i iloczyn kartezjański funkcji . . . . . . . . .
4.7.7 Obrazy i przeciwobrazy . . . . . . . . . . . . . . . . . . . .
4.7.8 Złożenie funkcji . . . . . . . . . . . . . . . . . . . . . . . . .
4.7.9 Injekcje, surjekcje, i bijekcje. . . . . . . . . . . . . . . . . .
4.7.10 Iloczyn kartezjański n zbiorów . . . . . . . . . . . . . . . .
4.7.11 Sumy i iloczyny indeksowane . . . . . . . . . . . . . . . . .
Równoliczność zbiorów. Twierdzenie Cantora i Cantora-Bernsteina.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
84
85
85
85
85
85
87
87
88
88
89
89
90
90
90
90
91
5 Liczby naturalne. Indukcja i rekurencja.
5.1 Liczby naturalne . . . . . . . . . . . . . . . . .
5.1.1 Aksjomatyka liczb naturalnych . . . . .
5.1.2 Konstrukcja von Neumanna . . . . . . .
5.2 Ciągi i rekurencja. . . . . . . . . . . . . . . . .
5.3 Ciągi i podciągi . . . . . . . . . . . . . . . . . .
5.3.1 Definicja ciągu i podciągu . . . . . . . .
5.3.2 Ciąg przybliżeń pierwiastka jeszcze raz.
5.3.3 Monotoniczność ciągu. . . . . . . . . . .
5.4 Rekurencyjne definiowanie ciągu. . . . . . . . .
5.4.1 Pierwiastek poprzez ciąg rekurencyjny. .
5.4.2 (*)Arytmetyka liczb natualnych . . . .
5.5 Zbiory skończone i przeliczalne . . . . . . . . .
5.6 Rozszerzona zasada indukcji . . . . . . . . . . .
5.7 Silnia i symbol Newtona . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
93
93
93
94
96
96
96
96
98
98
99
100
101
101
101
6 Struktury porządkowe
6.1 Relacje porządku . . . . . . . . . . .
6.1.1 Częściowy i liniowy porządek
6.1.2 Majoranty i minoranty . . . .
6.2 Przestrzenie ciągłe . . . . . . . . . .
6.2.1 Kresy . . . . . . . . . . . . .
6.2.2 Przedziały . . . . . . . . . . .
6.2.3 Własność L . . . . . . . . . .
6.2.4 Przestrzenie ciągłe . . . . . .
6.3 Funkcje monotoniczne . . . . . . . .
6.3.1 Funkcje rosnące i malejące . .
6.4 Liczby kardynalne i porządkowe. . .
6.4.1 Liczby kardynalne. . . . . . .
6.4.2 Aksjomat wyboru. . . . . . .
6.4.3 Liczby porządkowe. . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
103
103
103
104
105
105
106
107
107
108
108
108
108
108
108
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
SPIS TREŚCI
7 Struktury algebraiczne.
7.1 Liczby całkowite. . . . . . . . . . . . .
7.1.1 Działania . . . . . . . . . . . .
7.1.2 Grupy . . . . . . . . . . . . . .
7.1.3 Zbiór liczb całkowitych . . . .
7.1.4 Sumy i iloczyny . . . . . . . . .
7.2 Liczby wymierne . . . . . . . . . . . .
7.2.1 Ciała . . . . . . . . . . . . . .
7.2.2 Funkcja potęgowa i wielomian .
7.2.3 Zbiór liczb wymiernych . . . .
7.2.4 Wzory skróconego mnożenia . .
7.3 Ciało liczb rzeczywistych . . . . . . . .
7.3.1 Ciała uporządkowane . . . . .
7.3.2 Zbiór liczb rzeczywistych . . .
7.3.3 (*)Konstrukcja Cauchy’ego . .
II
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Granice
8 Liczby rzeczywiste i liczby zespolone
8.1 Ciało liczb rzeczywistych. . . . . . . . . . . . . . .
8.1.1 Podzbiory R . . . . . . . . . . . . . . . . .
8.2 Liczby reprezentowalne . . . . . . . . . . . . . . . .
8.3 Funkcja potęgowa w R . . . . . . . . . . . . . . . .
8.3.1 Nierówność Bernoullego . . . . . . . . . . .
8.4 Wartość bezwzględna . . . . . . . . . . . . . . . . .
8.5 Twierdzenie o istnieniu pierwiastka. . . . . . . . .
8.5.1 Własność Archimedesa . . . . . . . . . . . .
8.5.2 Gęstość zbioru w zbiorze . . . . . . . . . . .
8.5.3 Pierwiastki . . . . . . . . . . . . . . . . . .
8.6 Rozszerzony zbiór liczb rzeczywistych . . . . . . .
8.6.1 R uzupełniony o −∞ i +∞ . . . . . . . . .
8.6.2 Kresy funkcji . . . . . . . . . . . . . . . . .
8.7 Ciało liczb zespolonych . . . . . . . . . . . . . . . .
8.7.1 Liczby zespolone . . . . . . . . . . . . . . .
8.7.2 Ciało C . . . . . . . . . . . . . . . . . . . .
8.7.3 Zespolona funkcja kwadratowa . . . . . . .
8.7.4 Liczby zespolone o module jeden. . . . . . .
8.7.5 Odległość w R i C. . . . . . . . . . . . . . .
8.8 Granice ciągów w R . . . . . . . . . . . . . . . . .
8.8.1 Eksperymenty numeryczne . . . . . . . . .
8.8.2 Granice pozorne . . . . . . . . . . . . . . .
8.8.3 Definicja Cauchy’ego granicy ciągu . . . . .
8.8.4 Granica ciągu, a struktura ciała w R . . . .
8.8.5 Granica ciągu, a struktura porządkowa w R
8.9 Przykłady i zastosowania granic ciągów w R . . . .
8.9.1 Granice kilku ważnych ciągów . . . . . . . .
8.9.2 Procent składany . . . . . . . . . . . . . . .
8.9.3 Liczba e . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
109
109
109
111
112
113
113
113
114
114
114
115
115
115
116
117
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
119
119
120
120
122
126
126
127
127
127
128
129
129
130
132
132
132
134
134
135
135
135
139
139
142
143
145
145
146
148
SPIS TREŚCI
8.9.4
7
Funkcja wykładnicza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
9 Topologia przestrzeni metrycznych
9.1 Przestrzenie metryczne . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.1 Przestrzeń metryczna . . . . . . . . . . . . . . . . . . . . . .
9.1.2 Przykłady metryk w Rn . . . . . . . . . . . . . . . . . . . . .
9.1.3 Metryka indukowana i podprzestrzenie przestrzeni metrycznej
9.1.4 Kule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.5 Zbiory ograniczone . . . . . . . . . . . . . . . . . . . . . . . .
9.2 Średnica zbiorów . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2.1 Średnica zbioru . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3 Zbiory otwarte i domknięte, wnętrze, domknięcie i brzeg zbioru . . .
9.3.1 Wnętrze i domknięcie . . . . . . . . . . . . . . . . . . . . . .
9.3.2 Własności wnętrza i domknięcia . . . . . . . . . . . . . . . .
9.4 Otoczenia, punkty skupienia . . . . . . . . . . . . . . . . . . . . . . .
9.4.1 Rodzina otoczeń punktu . . . . . . . . . . . . . . . . . . . . .
9.4.2 Punkty skupienia zbioru . . . . . . . . . . . . . . . . . . . . .
9.5 Metryki równoważne, iloczyn kartezjański przestrzeni metrycznych .
9.5.1 Równoważność metryk. . . . . . . . . . . . . . . . . . . . . .
9.5.2 Iloczyn kartezjański przestrzeni metrycznych . . . . . . . . .
9.6 (*)Topologia przestrzeni metrycznej . . . . . . . . . . . . . . . . . .
9.6.1 Fundamentalne własności zbiorów otwartych i domkniętych .
9.7 (**)Bazy otoczeń . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.7.1 Baza otoczeń punktu . . . . . . . . . . . . . . . . . . . . . . .
9.7.2 Własność Hausdorffa . . . . . . . . . . . . . . . . . . . . . . .
9.7.3 Metryka w R̄ . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.8 (**)Przeliczalne bazy otoczeń punktu . . . . . . . . . . . . . . . . .
9.9 (*)Zupełność . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.9.1 Warunek Cauchy’ego . . . . . . . . . . . . . . . . . . . . . . .
9.9.2 Przestrzenie zupełne . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
151
151
151
152
152
153
154
154
154
155
156
156
157
157
157
158
158
158
158
158
159
159
160
160
161
161
161
162
10 Granica funkcji
10.1 Granica funkcji w przestrzeniach metrycznych . . . . . . . . . .
10.1.1 Eksperymenty numeryczne . . . . . . . . . . . . . . . .
10.1.2 Definicja granicy funkcji w przestrzeniach metrycznych .
10.1.3 Jednoznaczność granicy . . . . . . . . . . . . . . . . . .
10.1.4 Granica złożenia funkcji . . . . . . . . . . . . . . . . . .
10.2 (**)Przypadki szczególne definicji granicy . . . . . . . . . . . .
10.2.1 Kryterium na granicę w bazach . . . . . . . . . . . . . .
10.2.2 Granica ciągu . . . . . . . . . . . . . . . . . . . . . . . .
10.2.3 Granica funkcji w przestrzeni metrycznej . . . . . . . .
10.2.4 Granica nieskończona w R̄ . . . . . . . . . . . . . . . . .
10.2.5 Granica w nieskończoności . . . . . . . . . . . . . . . . .
10.3 Granice jednostronne . . . . . . . . . . . . . . . . . . . . . . . .
10.4 Punkty graniczne . . . . . . . . . . . . . . . . . . . . . . . . . .
10.4.1 Ciągowa charakterystyka granicy . . . . . . . . . . . . .
10.4.2 Zbiór punktów granicznych . . . . . . . . . . . . . . . .
10.4.3 Ciągowa charakterystyka granicy ciągu . . . . . . . . .
10.5 Granica dolna i górna . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
163
163
163
163
164
166
166
167
167
167
168
168
168
169
169
169
170
170
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
SPIS TREŚCI
10.5.1 Granica dolna i górna . . . . . . . . .
10.5.2 Własności granicy dolnej i górnej . . .
10.6 Granica, a struktura algebraiczna . . . . . . .
10.6.1 Sumy, różnica, iloczyn i iloraz funkcji
10.6.2 Granica sumy, różnicy i iloczynu . . .
10.6.3 Granica ilorazu . . . . . . . . . . . . .
10.7 Granica, a struktura porządkowa . . . . . . .
10.7.1 Zachowywanie nierówności w granicy .
10.7.2 Twierdzenie o trzech funkcjach . . . .
10.7.3 Granica funkcji monotonicznej . . . .
10.8 Granice w produkcie kartezjańskim . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
170
171
172
172
172
172
173
173
173
174
174
11 Ciągłość funkcji
11.1 Koncepcja ciągłości . . . . . . . . . . . . . . . . . . . . . . . . . .
11.1.1 Definicja ciągłości . . . . . . . . . . . . . . . . . . . . . .
11.1.2 Kryteria ciągłości . . . . . . . . . . . . . . . . . . . . . . .
11.1.3 Ciągłość złożenia . . . . . . . . . . . . . . . . . . . . . . .
11.1.4 Ciągłość operacji arytmetycznych . . . . . . . . . . . . . .
11.1.5 Twierdzenie o lokalnym zachowywaniu znaku . . . . . . .
11.1.6 (*)Nieciągłości funkcji f : R → R . . . . . . . . . . . . . .
11.1.7 Ciągłość bijekcji monotonicznej . . . . . . . . . . . . . . .
11.2 Ciągłość, a zwartość . . . . . . . . . . . . . . . . . . . . . . . . .
11.2.1 Zwartość podprzestrzeni Rd . . . . . . . . . . . . . . . . .
11.2.2 (*)Intuicja zwartości i ogólna definicja zwartości. . . . . .
11.2.3 Przestrzenie zwarte . . . . . . . . . . . . . . . . . . . . . .
11.2.4 Obraz zbioru zwartego przez odwzorowanie ciągłe. . . . .
11.2.5 Funkcja ciągła na przedziale zwartym osiąga swoje kresy .
11.2.6 Funkcja odwrotna do funkcji ciągłej . . . . . . . . . . . .
11.3 Jednostajna ciągłość . . . . . . . . . . . . . . . . . . . . . . . . .
11.3.1 Funkcje Lipschitza . . . . . . . . . . . . . . . . . . . . . .
11.4 Ciągłość, a spójność . . . . . . . . . . . . . . . . . . . . . . . . .
11.4.1 Spójne podzbiory R̄. . . . . . . . . . . . . . . . . . . . . .
11.4.2 (*)Przestrzenie spójne . . . . . . . . . . . . . . . . . . . .
11.4.3 Obraz zbioru spójnego przez odwzorowanie ciągłe. . . . .
11.4.4 Własność Darboux. . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
177
177
177
178
178
178
178
179
180
180
180
181
183
183
184
184
185
185
186
186
186
187
187
. . . . .
w koło.
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
189
189
189
189
190
193
193
194
195
195
196
196
197
12 Szeregi
12.1 Eksperymenty numeryczne . . . . . . . . . . . . . . . . . .
12.1.1 Przybliżanie liczby π polami wielokątów wpisanych
12.1.2 Warunek konieczny zbieżności szeregu . . . . . . .
12.1.3 Rozbieżność do nieskończoności . . . . . . . . . . .
12.2 Własności podstawowe . . . . . . . . . . . . . . . . . . . .
12.2.1 Pojęcie szeregu . . . . . . . . . . . . . . . . . . . .
12.2.2 Szereg geometryczny . . . . . . . . . . . . . . . . .
12.3 Kryteria zbieżności
P∞ . . . . . . . . . . . . . . . . . . . . . .
12.3.1 Szereg n=1 n1p . . . . . . . . . . . . . . . . . . . .
12.3.2 Kryterium Leibniza . . . . . . . . . . . . . . . . .
12.3.3 Kryterium Cauchy’ego i kryterium d’Alemberta . .
12.3.4 Szeregi potęgowe . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
SPIS TREŚCI
12.4 Operacje na szeregach . . . . . . . . . . .
12.4.1 Suma i iloczyn szeregów . . . . . .
12.4.2 (**)Permutacja szeregu i zbieżność
12.4.3 (**)Twierdzenie Riemanna . . . .
12.4.4 Szeregi w programie Mathematica
9
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
198
198
199
200
200
13 Funkcje wykładnicza, logarytmiczna i trygonometryczne
13.1 Funkcja wykładnicza i logarytmiczna . . . . . . . . . . . . .
13.1.1 Zespolona funkcja wykładnicza . . . . . . . . . . . .
13.1.2 Funkcja wykładnicza ex . . . . . . . . . . . . . . . .
13.1.3 Logarytm naturalny . . . . . . . . . . . . . . . . . .
13.1.4 Funkcja wykładnicza ax . . . . . . . . . . . . . . . .
13.2 Funkcje trygonometryczne . . . . . . . . . . . . . . . . . . .
13.2.1 Nawijanie prostej na okrąg . . . . . . . . . . . . . .
13.2.2 Funkcje sin i cos . . . . . . . . . . . . . . . . . . . .
13.2.3 Liczba π . . . . . . . . . . . . . . . . . . . . . . . . .
13.2.4 Okresowość . . . . . . . . . . . . . . . . . . . . . . .
13.2.5 Wzory trygonometryczne . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
201
201
201
202
203
204
204
204
205
208
208
209
III
. . . . . . . . .
. . . . . . . . .
bezwarunkowa
. . . . . . . . .
. . . . . . . . .
Rachunek różniczkowy i całkowy
14 Przestrzenie wektorowe
14.1 Definicja przestrzeni wektorowej . . . . . . . .
14.1.1 Przestrzeń wektorowa . . . . . . . . . .
14.2 Przestrzenie wektorowe z iloczynem skalarnym
14.2.1 Iloczyn skalarny . . . . . . . . . . . . .
14.2.2 Nierówność Cauchy-Schwartza . . . . .
14.3 Przestrzenie wektorowe unormowane . . . . . .
14.3.1 Norma . . . . . . . . . . . . . . . . . . .
14.3.2 Norma euklidesowa . . . . . . . . . . . .
14.3.3 Przestrzenie Hilberta i Banacha . . . . .
211
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
213
213
213
214
214
215
215
216
216
216
15 Pochodne i różniczki.
15.1 Pochodna funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15.1.1 Definicja pochodnej . . . . . . . . . . . . . . . . . . . . . .
15.1.2 Pochodna funkcji stałej i identycznościowej. . . . . . . . . .
15.1.3 Pochodna lewo- i prawostronna. . . . . . . . . . . . . . . . .
15.1.4 Ciągłość funkcji różniczkowalnej . . . . . . . . . . . . . . .
15.2 Różniczka funkcji . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15.2.1 Aproksymacja liniowa . . . . . . . . . . . . . . . . . . . . .
15.2.2 Relacja "o małe" . . . . . . . . . . . . . . . . . . . . . . . .
15.2.3 Płaskość w zerze . . . . . . . . . . . . . . . . . . . . . . . .
15.2.4 Różniczkowalność . . . . . . . . . . . . . . . . . . . . . . . .
15.3 Różniczkowanie sumy, różnicy, iloczynu i ilorazu . . . . . . . . . .
15.4 Różniczkowanie funkcji złożonej . . . . . . . . . . . . . . . . . . . .
15.5 Różniczkowanie funkcji wykładniczej i funkcji trygonometrycznych
15.6 Nieciągłości pochodnej i funkcje klasy C 1 . . . . . . . . . . . . . . .
15.7 Metoda Newtona . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15.8 Ekstrema lokalne, a różniczkowalność. . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
219
219
219
220
221
222
223
223
225
226
226
228
230
232
234
235
238
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
10
SPIS TREŚCI
15.8.1 Maksima i minima lokalne . . . . . . . . . . . . . . .
15.8.2 Twierdzenie Rolle’a. . . . . . . . . . . . . . . . . . .
15.9 Twierdzenie o wartości średniej . . . . . . . . . . . . . . . .
15.9.1 Uogólnione twierdzenie o wartości średniej . . . . . .
15.9.2 Twierdzenie Lagrange’a o wartości średniej . . . . .
15.9.3 Twierdzenie o przyrostach skończonych . . . . . . .
15.10Zastosowania twierdzenia o wartości średniej . . . . . . . .
15.10.1 Pochodna, a monotoniczność . . . . . . . . . . . . .
15.10.2 Twierdzenie o wartościach pośrednich dla pochodnej
15.10.3 Reguła de l’Hospitala . . . . . . . . . . . . . . . . .
15.11Różniczkowanie funkcji odwrotnej . . . . . . . . . . . . . . .
15.11.1 Wzór na pochodną funkcji odwrotnej . . . . . . . . .
15.11.2 Pochodna funkcji logarytmicznej . . . . . . . . . . .
15.11.3 Funkcje kołowe (odwrotne do trygonometrycznych) .
15.11.4 Pochodna funkcji potęgowej . . . . . . . . . . . . . .
15.12Pochodne wyższych rzędów . . . . . . . . . . . . . . . . . .
15.12.1 n-ta pochodna . . . . . . . . . . . . . . . . . . . . .
15.12.2 Wielomian Taylora . . . . . . . . . . . . . . . . . . .
15.12.3 n-płaskość w zerze. . . . . . . . . . . . . . . . . . . .
15.13Wzory Taylora i szereg Taylora. . . . . . . . . . . . . . . . .
15.13.1 Wzór Taylora z resztą Peano. . . . . . . . . . . . . .
15.13.2 Wzór Taylora z resztą Lagrange’a . . . . . . . . . . .
15.13.3 Punkty przegięcia . . . . . . . . . . . . . . . . . . .
15.13.4 Szereg Taylora . . . . . . . . . . . . . . . . . . . . .
16 Całka oznaczona
16.1 Całka Riemanna funkcji jednej zmiennej . . . . . . .
16.1.1 Pole obszaru. . . . . . . . . . . . . . . . . . .
16.1.2 Przedziały w R i ich podziały. . . . . . . . . .
16.1.3 Całkowalność w sensie Riemanna . . . . . . .
16.1.4 Epsilonowe kryterium całkowalności . . . . .
16.2 Własności całki Riemanna . . . . . . . . . . . . . . .
16.2.1 Monotoniczność całki . . . . . . . . . . . . .
16.2.2 Przestrzeń wektorowa funkcji całkowalnych w
16.2.3 Miarowe kryterium całkowalności. . . . . . .
16.2.4 Całkowalność złożenia i iloczynu . . . . . . .
16.2.5 Całka Riemanna na podprzedziale . . . . . .
16.2.6 Całka oznaczona . . . . . . . . . . . . . . . .
16.2.7 Twierdzenie Riemanna . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
238
238
238
238
239
240
240
240
241
241
244
244
245
245
246
246
246
248
249
250
250
251
253
253
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
sensie Riemanna.
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
257
257
257
257
259
260
262
262
262
263
263
263
264
264
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
269
269
269
270
270
271
271
272
274
17 Funkcja pierwotna i całka nieoznaczona
17.1 Podstawowe twierdzenie rachunku różniczkowego i całkowego . . . .
17.1.1 Pochodna całki . . . . . . . . . . . . . . . . . . . . . . . . . .
17.1.2 Funkcja pierwotna i całka nieoznaczona. . . . . . . . . . . . .
17.1.3 Podstawowe twierdzenie rachunku różniczkowego i całkowego
17.2 Podstawowe techniki całkowania. . . . . . . . . . . . . . . . . . . . .
17.2.1 Własności całki nieoznaczonej. . . . . . . . . . . . . . . . . .
17.2.2 Całkowanie przez części . . . . . . . . . . . . . . . . . . . . .
17.2.3 Całkowanie przez podstawienie . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
SPIS TREŚCI
17.2.4 Twierdzenia o wartości średniej dla całek
17.3 Całkowanie funkcji wektorowych . . . . . . . . .
17.4 Zastosowania geometryczne całek . . . . . . . . .
17.4.1 Długość krzywej . . . . . . . . . . . . . .
17.4.2 Bryła obrotowa . . . . . . . . . . . . . . .
17.4.3 Obętość bryły obrotowej . . . . . . . . . .
17.4.4 Pole powierzchni bocznej bryły obrotowej
11
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
275
276
277
277
278
279
279
18 Ciągi i szeregi funkcyjne
18.1 Zbieżność punktowa i jednostajna . . . . . . . . . . . . . . . . . .
18.1.1 Zbieżność punktowa . . . . . . . . . . . . . . . . . . . . .
18.1.2 Zbieżność jednostajna . . . . . . . . . . . . . . . . . . . .
18.1.3 Kryterium Cauchy’ego zbieżności jednostajnej . . . . . . .
18.2 Zbieżność jednostajna, a ciągłość, różniczka i całka . . . . . . . .
18.2.1 Granica, a zbieżność jednostajna . . . . . . . . . . . . . .
18.2.2 Całkowanie i różniczkowanie, a zbieżność jednostajna . . .
18.3 Aproksymacja funkcji ciągłych . . . . . . . . . . . . . . . . . . .
18.4 Szeregi potęgowe . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.4.1 Twierdzenie o szeregu Taylora . . . . . . . . . . . . . . . .
18.4.2 Funkcje analityczne . . . . . . . . . . . . . . . . . . . . .
18.5 Szeregi Fouriera . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18.5.1 Wielomiany trygonometryczne . . . . . . . . . . . . . . .
18.5.2 Zespolony iloczyn skalarny . . . . . . . . . . . . . . . . .
18.5.3 Przestrzeń wektorowa z zespolonym iloczynem skalarnym
18.5.4 Układ ortonormalny . . . . . . . . . . . . . . . . . . . . .
18.5.5 Szereg Fouriera . . . . . . . . . . . . . . . . . . . . . . . .
18.5.6 Rzut ortonormalny . . . . . . . . . . . . . . . . . . . . . .
18.5.7 Jądro Dirichleta . . . . . . . . . . . . . . . . . . . . . . .
18.5.8 Zbieżność punktowa szeregu Fouriera . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
281
281
281
282
284
285
285
286
286
286
287
287
289
289
290
291
292
293
296
297
298
12
SPIS TREŚCI
Wstęp
Niniejsze notatki do kursów Elementy Logiki i Teorii Mnogości oraz Analiza Matematyczna I przeznaczonego dla studentów kierunku Matematyka Komputerowa stanowią roboczą wersję i w trakcie kursu mogą podlegać aktualizacji. Punktem
wyjścia tych notatek jest rękopis moich materiałów do wykładu z analizy matematycznej prowadzonego w latach 1984-1990
dla studentów informatyki UJ. W owym czasie był to bardzo obszerny kurs obejmujący 240h wykładów i 240h ćwiczeń.
Wykładało i studiowało się wtedy zupełnie inaczej, bo wykładowca miał do dyspozycji tylko tablicę i kredę, a studenci to
co zdołali w trakcie wykładu zanotować.
Dziś możliwości są zupełnie inne, stąd i te notatki są inne, choć w dużym stopniu wykorzystują jeszcze mój dawny
rękopis. Już wtedy starałem się o to, by część odnosząca się do intuicji była obszerna i równocześnie wyraźnie oddzielona
od części formalnej. Wydaje się, że takie podejście jest szczególnie ważne dla studentów specjalności Matematyka Komputerowa, dlatego planuję je kontynuować również w ramach obecnego wykładu. Część materiału poświęcona intuicjom ma
charakter całkowicie nieformalny. Dla wyraźnego odróżnienia od części formalnej jest złożona brązową, pochyloną czcionką.
W szczególności cały pierwszy rozdział jest nieformalny. Nieformalne mówienie o matematyce rodzi często więcej pytań niż
daje odpowiedzi. Ale takie właśnie jest jej zadanie: sprowokować do myślenia. Dociekliwy czytelnik, który czyta najpierw
nieformalny tekst matematyczny wyrabia sobie pewne idee, które wymagają dopracowania. W moim przekonaniu takie podejście powoduje, że studiowanie tekstu formalnego, który to dopracowanie dostarcza, staje się w efekcie bardziej naturalne i
znacznie łatwiejsze. Najważniejsze pytania jakie rodzi tekst nieformalny zostały w tekście wyróżnione poprzez umieszczenie
w ramce o różowym tle. Pytań jest oczywiście dużo więcej niż tych, które w tekście zostały jawnie postawione.
Różne kolory tła tekstu oznaczają: blado pomarańczowy - twierdzenia, blado zielony - definicje, różowy - problemy,
blado niebieski (C++) i blado fioletowy (Mathematica) - listingi programów komputerowych, żółłty - ćwiczenia tablicowe,
niebieski - ćwiczenia kokmputerowe.
W notatkach odręcznych
• znak i oznacza początek dowodu indukcyjnego,
• znak s oznacza początek dowodu nie wprost,
• znak x oznacza sprzeczność,
• znak p oznacza początek dowodu przez przypadki,
• znak
oznacza koniec fragmentu dowodu,
• znak
oznacza koniec dowodu,
• wytłuszczony wykrzyknik zastępuje słowo "niech",
• dwie pionowe kreski po lewej stronie tekstu oznaczają materiał nieformalny.
Aspekty obliczeniowe analizy matematycznej, ilustrowane programami komputerowymi w języku C++ oraz instrukcjami
programu Mathematica złożone są czcionką w kolorze niebieskim.
Znajomość rozdziałów, podrozdziałów i dowodów oznaczonych (*) obowiązuje jedynie studentów mierzących w ocenę
bdb. Rozdziały i podrozdziały oznaczone (**) są nieobowiązkowe.
Życzę wszystkim uczestnikom kursu udanego studiowania matematyki komputerowej na Wydziale Matematyki i Informatyki UJ.
Rozdział 1
Wprowadzenie do analizy matematycznej
Nim zabierzemy si˛e do studiowania analizy matematycznej w szczegółach, warto sobie zadać pytanie czym analiza matematyczna si˛e zajmuje. Nie da si˛e na nie
dać dobrej odpowiedzi bez przyjrzenia si˛e jak koncepcje, które ukształtowały współczesna˛ analiz˛e matematyczna˛ stopniowo kształtowały si˛e na przestrzeniach
dziejów. Niniejszy rozdział wprowadzajacy
˛ stanowi krótki przeglad
˛ podstawowych problemów analizy matematycznej oraz ich umiejscowienia w historii matematyki.
1.1
1.1.1
Rozwój pojęcia liczby
Liczby naturalne
Umiej˛etność posługiwania si˛e liczbami rozwijała si˛e u człowieka stopniowo. Pierwotny zbiór liczebników ograniczał si˛e do trzech: jeden, dwa i wiele. Wraz z
rozwojem ludzkiej cywilizacji pojawiła si˛e konieczność dokładnego rozeznania w liczebności oddziału wojowników, stada bydła, czy zestawu strzał. Tak zrodziła si˛e
umiej˛etność porównywania liczności zbiorów, która doprowadziła do pojawienia si˛e abstrakcyjnego poj˛ecia liczby naturalnej. Zapewne niedługo potem człowiek
nauczył si˛e te liczby dodawać, odejmować i mnożyć. Operacje te wymagały opanowania stosownych algorytmów post˛epowania, a ich efektywność silnie zależała
od stosowanego sposobu zapisu liczb. Używany przez nas dziś dziesiatkowy
˛
system pozycyjny wywodzi si˛e z Indii, gdzie pojawił si˛e około VIII w. To tam też po raz
piewrwszy zaakceptowano zero jako pełnoprawna˛ liczb˛e, przydatna˛ w rachunkach.
1.1.2
Ułamki
Pojawienie si˛e ułamków wiaże
˛ si˛e z rozwojem handlu, który wymagał doskonalenia umiej˛etności mierzenia. Do mierzenia używano miary. Na przykład w przypadku
płynów i materiałów sypkich mogła to być gliniana amfora o ustalonej obj˛etości. Poczatkowo
˛
zaniedbywano powstajace
˛ przy odmierzaniu cz˛eści ułamkowe, ale
gdy z biegiem czasu rosła potrzeba dokładności, wprowadzano miary pomocnicze b˛edace
˛ cz˛eścia˛ wyjściowej miary, na przykład połowa,˛ jedna˛ trzecia˛ czy jedna˛
czwarta.˛ Co charakterystyczne, były to tzw. ułamki proste, czyli ułamki o liczniku jeden. Gdy handel zaczał˛ przekraczać granice pojedynczych plemion pojawiła si˛e
konieczność wprowadzania przelicznika dla różnych systemów miar obowiazuj
˛ acych
˛
w różnych rejonach. To zapewne przyczyniło si˛e do powstania abstrakcyjnej
postaci ułamka.
1.1.3
Liczby ujemne, całkowite i wymierne
Dwie liczby naturalne i dwa ułamki można zawsze do siebie dodać i w wyniku powstaje inna liczba naturalna lub inny ułamek. Jednakże od liczby a nie można odjać
˛
liczby b gdy b a bez rozszerzenia zbioru liczb o liczby ujemne i zero. Jak wiemy z każda˛ liczba˛ a powiazać
˛ można liczb˛e do niej przeciwna,˛ oznaczana˛ −a,
tak że ich suma daje zero. Zbiór liczb naturalnych rozszerzony o zero i liczby przeciwne do liczb naturalnych nazywamy zbiorem liczb całkowitych, a analogicznie
rozszerzony zbiór ułamków nazywamy zbiorem liczb wymiernych. Zwyczajowo stosujemy oznaczenia N dla liczb naturalnych, Z dla liczb całkowitych oraz Q dla
liczb wymiernych. Natomiast zbiór liczb wymiernych dodatnich, czyli po prostu zbiór klasycznych ułamków oznaczamy Q+ .
Liczby ujemne w pewnym stopniu były znane już w starożytnych Chinach i Indiach, gdzie interpretowane były w kategoriach długu. Jednak nie były specjalnie
doceniane i na codzień radzono sobie bez nich. Matematyka europejska zaakceptowała liczby ujemne dopiero w XVII w, ale nawet dziś w życiu codziennym
13
14
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.1: Pitagoras z Samos, VI w. przed Chrystusem. Źródło: Wikipedia
2
2
Rysunek 1.2: c2 = (a + b)2 − 4 ab
2 =a +b
jesteśmy w stanie radzić sobie bez liczb ujemnych. Najwi˛ekszy pożytek z liczb ujemnych jest przy ujednolicaniu algorytmów, gdyż dzi˛eki nim nie musimy rozważać
różnych przypadków, by zagwarantować, że wszystkie rozważane w trakcie pracy algorytmu liczby sa˛ dodatnie.
1.1.4
Liczby niewymierne
Odkrycie, że ułamki nie wystarczaja˛ do mierzenia dowolnych wielkości przypisuje si˛e szkole pitagorejskiej, wywodzacej
˛ si˛e od żyjacego
˛
w VI w. przed Chrystusem
w Grecji Pitagorasa z Samos (rys.1.1). Pitagorejczycy świ˛ecie wierzyli, że ułamki wystarczaja˛ do zmierzenia dowolnych długości. Dlatego dokonane przez nich
odkrycie było dla nich ciosem, tym wi˛ekszym, że było konsekwnecja˛ słynnego twierdzenia udowodnionego przez Pitagorasa (rys.1.2).
Twierdzenie 1.1.1 (Pitagoras z Samos) W trójkacie
˛ prostokatnym
˛
suma kwadratów przyprostokatnych
˛
jest równa kwadratowi przeciwprostokatnej.
˛
Z twierdzenia Pitagorasa wynika, że przekatna
˛ kwadratu o boku długości jeden jest liczba,˛ która podniesiona do kwadratu wynosi dwa, czyli tak zwanym
pierwiastkiem z dwóch (rys. 1.3). Pitagorejczycy pierwsi zauważyli, że żaden ułamek podniesiony do kwadratu nie może dać liczby dwa. Było to szokujace
˛
1.1. ROZWÓJ POJĘCIA LICZBY
15
Rysunek 1.3: Przekątna kwadratu to
√
2. Ale ile to jest
√
2?
spostrzeżenie, z którym niełatwo było si˛e pogodzić. Tak pojawiły si˛e liczby niewymierne, a wraz nimi problem ich przybliżania ułamkami.
• Rozkładajac
˛ na czynniki pierwsze licznik i mianownik ułamka spróbuj uzasadnić, dlaczego
√
• Czy podobne rozumowanie może być przeprowadzone dla 3 2? dla innych pierwiastków?
Ćwiczenie 1.1.2
√
2 nie może być ułamkiem.
√
Problem 1.1.3 Czy wiemy czym naprawd˛e jest liczba 2? Czy ona rzeczywiście ma sens? Jakich liczb jeszcze brakuje wśród ułamków, by wszystkie
długości dało si˛e wymierzyć? W jaki sposób je zdefiniować?
1.1.5
Liczby rzeczywiste
Precyzyjna definicja liczby niewymiernej jest skomplikowana. Stwierdzenie, że liczby niewymierne, to wszystkie liczby, które nie sa˛ wymierne jest dobra˛ definicja˛
tylko wtedy gdy wiemy co oznacza zwrot "wszystkie liczby". Intuicyjnie chodzi nam o taki zbiór liczb, który pozwala mierzyć długości tak odcinków jak i krzywych.
Zbiór takich liczb został precyzyjnie zdefiniowany dopiero w XIX wieku. Określa si˛e go mianem zbioru liczb rzeczywistych i oznacza symbolem R. Natomiast zbiór
liczb rzeczywistych dodatnich oznacza si˛e symbolem R+ .
1.1.6
Liczby urojone i zespolone
Określenie liczby rzeczywiste zrodziło si˛e w kontraście do tzw. liczb urojonych. Liczba urojona to liczba, której kwadrat jest liczba˛ ujemna.˛ Kwadrat liczby rzeczywistej nie może być ujemny, tak wi˛ec liczb urojona nie jest liczba˛ rzeczywista.˛ Sensowność takich liczb długo budziła watpliwości,
˛
co wyjaśnia ich nazw˛e.
Liczby zespolone, b˛edace
˛ sumami liczb rzeczywistych i urojonych, maja˛ wiele cech podobnych do liczb rzeczywistych, a także wiele zalet, których liczby
rzeczywiste nie maja.˛ Dzi˛eki temu pozwalaja˛ rozwiazywać
˛
pewne problemy "na skróty". Jednym z pierwszych pożytków z liczb zespolonych było podanie w XVI
wieku algorytmów wyznaczania miejsc zerowych równania trzeciego i czwartego stopnia.
1.1.7
Liczby w komputerze
Rachunki liczbowe na papierze wykonywane sa˛ zazwyczaj na ułamkach zwykłych, a cz˛eściej na ułamkach dziesi˛etnych.
Wraz ze zbudowaniem w połowie XX w. pierwszych komputerów stworzono też koncepcj˛e przechowywania i przetwarzania liczb w komputerze. Było to
konieczne, bo wszystko co przetwarza współczesny komputer na poziomie procesora sprowadza si˛e do wykonywania obliczeń na liczbach. Typowy użytkownik
16
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
komputera oglada
˛ filmy, słucha muzyki, przeglada
˛ strony internetowe albo po prostu gra na komputerze i nie uświadamia sobie, że wszystko to sprowadza si˛e do
przetwarzania liczb. Zazwyczaj sa˛ to liczby całkowite, ale wiele pozamatematycznych zastosowań wymaga też obliczeń na liczbach wymiernych.
Komputer jest oczywiście równie niezastapiony
˛
jeśli naszym celem jest przeprowadzenie mniej lub bardziej skomplikowanych obliczeń matematycznych, inżynierskich badź
˛ naukowych. Jeśli obliczenia sa˛ bardzo specjalistyczne, jest ich szczególnie dużo, a nam zależy na efektywności, piszemy własny lub zamawiamy
stosowny program w kompilowanym j˛ezyku wysokiego poziomu. Jeśli obliczenia sa˛ typowe, a ich ilość jest umiarkowana, si˛egamy po specjalistyczne oprogramowanie takie jak Mathematica, Maple, Matlab czy Scilab.
W ramach niniejszego kursu aspekty numeryczne analizy matematycznej demonstrować b˛edziemy programami napisanymi dla środowiska Mathematica, a
także programami napisanymi w j˛ezyku C++.
Mathematica to bogaty pakiet oprogramowania bardzo ułatwiajacy
˛ wszelkie obliczenia matematyczne. Umożliwia on tak prosta˛ prac˛e interaktywna˛ jak i pisanie
własnego oprogramowania. Na przykład, aby pomnożyć przez siebie liczby 123 i 456 wystarczy napisać
123∗456
i przycisnać
˛ rówcznocześnie klawisze ’Shift’ i ’Enter’. Przyciśni˛ecie ’Shift’ wraz ’Enter’ jest sygnałem, że oczekujemy przeprowadzenia obliczeń. Natychmiast
otrzymujemy wynik
56088
W programie Mathematica operacje arytmetyczne dodawania, odejmowania, mnożenia, dzielenia i pot˛egowania oznaczamy odpowiednio znakami +,-,*,/,^.
Tak wi˛ec piszac
˛
3^4
otrzymujemy
81
W podobny sposób przeprowadzamy obliczenia na ułamkach dziesi˛etnych. Na przykład
3.14 + 2.72
daje wynik 5.86. Trzeba jedynie pami˛etać, że zgodnie z anglosaskim zwyczajem używamy kropki dziesi˛etnej, a nie przecinka. Obliczenia na liczbach dziesi˛etnych
zwiazane
˛
sa˛ niestety z bł˛edami zaokragleń.
˛
Na przykład
1.0/3.0
daje 0.333333 co jest wynikiem przybliżonym. Bł˛edu zaokragleń
˛
można uniknać
˛ przeprowadzajac
˛ obliczenia na liczbach wymiernych. Jeśli napiszemy
1/3
Mathematica zwróci ułamek
1
,
3
a piszac
˛
7/3+3/11
otrzymamy jako wynik ułamek
86
.
33
co , w przeciwieństwie do obliczeń na liczbach dziesi˛etnych, jest wynikiem dokładnym. Jeśli potrzebujemy jednak przybliżenia dziesi˛etnego, zawsze możemy je
otrzymać. Piszac
˛
N[ 1 / 2 3 ]
otrzymujemy przybliżenie ułamka
1
23
0.0434783.
1.2. CIĄGI
1.2
17
Ciągi
1.2.1
Przybliżanie pierwiastka
Choć wśród ułamków brak jest takiego, który podniesiony do kwadratu daje liczb˛e dwa, to rozważajac
˛ wszystkie ułamki o mianowniku m znajdziemy taki, postaci
i
,
że
m
i
m
2
<2<
i+1
m
2
.
Dla danego m licznik taki jest dokładnie jeden. Sam pierwiastek z dwóch, czymkolwiek jest, leży gdzieś pomi˛edzy
1
dokładnościa˛ co najmniej m
. Na przykład, dla m = 5 mamy
i
m,
a
i+1
m ,
zatem
i
m
jest przybliżeniem
√
2z
2
2
7
49
64
8
=
<2<
=
5
25
25
5
zatem
7
5
1.2.2
jest przybliżeniem
√
2 z dokładnoscia˛ wi˛eksza˛ niż 15 . Aby dostać lepsza˛ dokładność wystarczy wziać
˛ odpowiednio duży mianownik m.
Ciągi przybliżeń
W praktyce wygodnie ograniczyć si˛e do mianowników postaci m = 10n . Niestety r˛eczne poszukiwanie stosownego licznika jest bardzo żmudne, a dla dużych
n praktycznie niewykonalne. Potrzebujemy algorytmu, który dla zadanego mianownika 10n pozwoli nam wyznaczyć stosowny licznik in oraz komputera, który
sprawnie wykona obliczenia w tym algorytmie. Łatwo zauważyć, że
in = max { i | i ∗ i < 2 ∗ 100n }.
n
Sugeruje to algorytm, który przy zadanym n sprawdza nierówność
√ i ∗ i < 2 ∗ 100 dla kolejnych liczb naturalnych i i zwraca in jako ostatnie i, dla którego
in
nierówność ta zachodzi. Wtedy xn := 10n jest przybliżeniem 2, które, jak łatwo sprawdzić, spełnia
|xn −
√
2| ¬
1
.
10n
Kolejne liczby xn tworza˛ tzw. ciag
˛ liczbowy, w tym przypadku tzw. ciag
˛ przybliżeń. Ciag
˛ przybliżeń, to ciag
˛ skonstruowany w celu przybliżania pewnej liczby
niewymiernej liczbami wymiernymi. Ciagi
˛ przybliżeń to nie jedyne ciagi
˛ rozważane w matematyce, choć ich rola praktyczna jest bardzo istotna. Badanie ciagów
˛
to
jeden z głównych obiektów zainteresowań analizy matematycznej.
Wprowadźmy w programie Mathematica rozdzielony średnikami ciag
˛ instrukcji
n = 3 ; i = 1 ; While [ i ^ 2 < 2 ∗ 1 0 0 ^ n , i = i + 1 ] ;
{ ( i −1)/10^ n , i / 1 0 ^ n }
Pojawiaja˛ si˛e tu zmienne i oraz n. Instrukcja While to instrukcja p˛etli. Jak długo spełniony jest warunek i^2 < 2*100^n wykonywana jest instrukcja
i = i + 1. Ponieważ przed wykonaniem instrukcji While ustawiliśmy zmienna˛ n na 3, a i na 1, p˛etl˛e wykonujemy dla kolejnych wartości i = 1, 2, . . . aż
zajdzie nierówność i^2 2000000. Mathematica wyprowadza jako wynik ostatnie obliczone wyrażenie, którym jest para ułamków {(i-1)/10^n,i/10^n}.
W rozważanym przypadku otrzymamy
{
√
707 283
,
}.
500 200
1
2 z dokładnościa˛ do 1000
.
√
Podstawiajac
˛ w powyższym listingu za n kolejne liczby naturalne i wykonujac
˛ obliczenia otrzymamy przybliżenia 2 od dołu i od góry o coraz lepszej
jako oszacowanie od dołu i od góry
18
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
dokładności:
14 15
,
10 10
141 142
,
100 100
1414 1415
,
1000 1000
14142 14143
,
10000 10000
141421 141421
,
100000 100000
1414213 1414213
,
1000000 1000000
···
Obliczenia
˛ przybliżeń od dołu i ciagu
˛ przybliżeń od
√ te, przynajmniej teoretycznie, możemy kontynuować w nieskończoność. Otrzymujemy w ten sposób ciag
góry liczby 2.
W tym miejscu trzeba zrobić uwag˛e na temat stosowanej w programie Mathematica notacji. Mathematica używa nawiasów wasiastych
˛
{, } do oznaczania list.
Zwyczajowo w matematyce nawiasów wasiastych
˛
używa si˛e do oznaczania zbiorów. Różnica ta ma znaczenie, bo przy wypisywaniu elementów listy kolejność jest
istotna, a przy wypisywaniu elementów zbioru nie jest. Innymi słowy, dwie listy, które różnia˛ si˛e tylko kolejnościa˛ elementów sa˛ różne, a dwa zbiory, które różnia˛ si˛e
tylko kolejnościa˛ w jakiej wymieniono ich elementy sa˛ traktowane jako identyczne. Korzystajac
˛ z programu Mathematica musimu o tej różnicy pami˛etać.
Zaproponowana tu metoda liczenia pierwiastka należy do najprostszych, ale oczywiście jest daleka od doskonałości. Mathematica radzi sobie doskonale
nie tylko z liczeniem pierwiastków, ale również innych funkcji elementarnych, w szczególności funkcji trygonometrycznych i funkcji logarytmicznej. Trzeba jednak
pami˛etać, że jeśli jako argument podamy liczb˛e dokładna,˛ na przykład naturalna˛ lub ułamek, a wynik nie jest liczba˛ naturalna˛ badź
˛ ułamkiem, aby zachować
dokładność Mathematica nie przeprowadzi obliczeń. Na przykład piszac
˛
Sqrt [ 2 ]
otrzymamy jako wynik
√
2. Ale piszac
˛
Sqrt [ 2 . ]
otrzymamy 1.41421.
Do zagadnienia obliczania pierwiastka b˛edziemy jeszcze wracać w dalszych rozdziałach.
Oczywiście ciagi
˛ nie musza˛ być zadawane w tak skomplikowany sposób jak nasz ciag
˛ przybliżeń. Najprościej zadać ciag
˛ podajac
˛ wzór na jego n-ty wyraz.
Na przykład ciag
˛ dany wzorem
xn =
1
n
to tak zwany ciag
˛ harmoniczny.
Problem 1.2.1 Czy ciag
˛ harmoniczny przybliża jakaś
˛ liczb˛e? Jeśli tak to jaka?
˛
Gdy ciag
˛ określony jest wzorem, na przykład wzorem (1.1), wystarczy napisać
Table [ 1 / n , { n , 1 . ,
10.}]
a otrzymamy przybliżenia poczatkowych
˛
wyrazów tego ciagu
˛
{1., 0.5, 0.333333, 0.25, 0.2, 0.166667, 0.142857, 0.125, 0.111111, 0.1}
(1.1)
1.2. CIĄGI
19
Rysunek 1.4: Wykres początkowych wyrazów ciągu 1 +
(−1)n
n .
Można też łatwo uzyskać wizualizacj˛e (wykres) ciagu.
˛ Na przykład wykres poczatkowych
˛
wyrazów ciagu
˛ danego wzorem
un = 1 +
(−1)n
n
uzyskamy piszac
˛
D i s c r e t e P l o t [ 1 + ( −1)^ n / n , { n , 1 , 5 0 } ]
Uzyskamy w ten sposób wykres przedstawiony na rys. 1.4.
1.2.3
Granice
√
√
Obrazowo mówimy, że ciag
˛ ten osiaga
˛ liczb˛e 2 w granicy, albo krócej, że zmierza do 2. Właśnie
√ w tym celu go skonstruowaliśmy. Ale czy możemy mieć
pewność, że nasz ciag
˛ dla dużych wartości n nie zmieni zdania i na przykład zamiast zmierzać do 2 zacznie uciekać do nieskończoności? Jesteśmy w stanie
policzyć tylko skończona˛ ilość wyrazów tego ciagu.
˛ Zawsze zostanie nieskończenie wiele wyrazów, których nie policzyliśmy. Czy możemy mieć pewność, że nasz
ciag
˛ przybliżeń nigdy nas nie zawiedzie?
Problem 1.2.2 Co to znaczy, że ciag
˛ osiaga
˛ jakaś
˛ liczb˛e w granicy (zmierza do granicy)? Jakie ciagi
˛ maja˛ granic˛e? Czy, kiedy i jak granic˛e daj˛e si˛e
policzyć?
Odpowiedź na te pytania to jedno z fundamantalnych zadań analizy matematycznej. Poj˛eciem granicy w takim badź
˛ innym sensie posługiwano si˛e już od
czasów starożytnych, jednak aż do wieku XIX matematycy nie umieli sobie poradzić z postawieniem precyzyjnej definicji. Dopiero czeski matematyk Bernard
Bolzano (rys.1.5) oraz niezależnie francuski matematyk, Augustin-Louis Cauchy (rys.1.5) pierwsi postawili precyzyjna˛ definicj˛e. Ponieważ prace Bolzano długo
pozostawały mało znane, przyj˛eło si˛e mówić o definicji Cauchy’ego.
Według definicji Cauchy’ego ciag
˛ liczb xn jest zbieżny do granicy g jeżeli dla każdego > 0 istnieje taka liczba naturalna N , że dla wszystkich liczb
naturalnych n N zachodzi nierówność
|xn − g| < .
20
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.5: Augustin Louis Cauchy (1789 - 1857) i Bernard Bolzano (1781 - 1844) Źródło: Wikipedia
Piszemy wtedy
lim xn = g.
n→∞
Ćwiczenie komputerowe 1.2.3 Dla każdego z poniższych ciagów
˛
postaw hipotez˛e, czy ma on granic˛e. Jeśli uważasz, że ma granic˛e, spróbuj
odgadnać
˛ jaka.˛ Wcześniej przeprowadź eksperymenty wykorzystujac
˛ instrukcj˛e Table w Mathematica.
1.
n
n+1
2. 1 + (−1)n
3. 1 +
(−1)n
n
4. (*) cos nπ
5. (*) sin n
6. (*)
1.2.4
sin n
n
Obliczanie granic ciągu.
W praktyce niewiele granic liczy si˛e wprost z definicji, choć najprostsze granice właśnie tak si˛e wyznacza. Znajac
˛ już granice jakichś ciagów
˛
liczymy granice innych
ciagów
˛
korzystajac
˛ z różnych twierdzeń. Do najważniejszych należa˛
Twierdzenie 1.2.4 Jeśli ciagi
˛ an , bn sa˛ zbieżne odpowiednio do a i b to ich suma, różnia, iloczyn oraz iloraz sa˛ zbieżne odpowiednio do a + b,
a − b, ab, ab , przy czym w przypadku ilorazu trzeba dodatkowo założyć, że b 6= 0.
1.2. CIĄGI
21
Rysunek 1.6: Archimedes z Syrakuz (ok. 287–212 pne.) (medal Fieldsa). Źródło: Wikipedia
Twierdzenie 1.2.5 Jeśli ciagi
˛ an , bn , cn spełniaja˛ nierówność
an ¬ bn ¬ cn
i ciagi
˛ an oraz cn sa˛ zbieżne i to do tej samej granicy, to ciag
˛ bn też jest zbieżny i też do tej granicy.
Ćwiczenie 1.2.6
wielkości a.
1
• Posługujac
˛ si˛e definicja˛ granicy oblicz granice ciagów
˛
n,
• (*) Oblicz granice ciagów
˛
1.2.5
√1 , 1n
n 2
oraz ciagu,
˛ którego wszystkie wyrazy sa˛ stale równe stałej
2−3n+5n2
, 1+1√n .
n2
Liczba π
Wśród ważnych problemów rozważanych już w starożytności było wyznaczanie obwodu i pola koła o zadanym promieniu. Kluczowy w tych obliczeniach jest
obwód koła o średnicy jeden, zwyczajowo oznaczany grecka˛ litera˛ π . Koło o innej średnicy ma proporcjonalnie wi˛ekszy badź
˛ mniejszy obwód, w szególności koło
o promieniu r , a wi˛ec średnicy
2r
ma
obwód
2πr
.
√
Liczba π , podobnie jak 2, jest liczba˛ niewymierna,˛ ale o tym starożytni nie wiedzieli. Udowodniono to dopiero w XVIII w. Co wi˛ecej, w wieku XIX udowodniono, że π jest liczba˛ transcendentna,˛ to znaczy, że nie jest pierwiastkiem żadnego wielomianu o współczynnikach wymiernych. Oznacza to w szczególności, że
nawet jeśli zbiór ułamków rozszerzymy o wszystkie możliwe pierwiastki, to nadal nie wystarczy on do mierzenia wszelkich długości.
W starożytności przyjmowano różne liczby pomi˛edzy 3 i 3.16 jako przybliżenie liczby π bez przywiazywania
˛
szczególnej wagi do popełnianego bł˛edu. Dopiero
grecki matematyk Archimedes (rys. 1.6) zaproponował algorytmiczna˛ metod˛e wyznaczania π , która przez ponad 1000 lat dostarczała coraz lepszych przybliżeń.
Jest to metoda geometryczna, oparta o wpisywanie w okrag
˛ i opisywanie na okr˛egu wielokatów
˛ (rys.1.7). Posługujac
˛ si˛e 96-katem
˛
Archimedes oszacował, że
223/71 < π < 22/7 (3.1408 < π < 3.1429), co daje dobre przybliżenie π do dwóch miejsc po przecinku. Co ciekawe, w 1596 roku, ciagle
˛ w oparciu o
metod˛e metod˛e Archimedesa, holenderski matematyk Ludolph van Ceulen policzył π z dokładnościa˛ do 35 cyfr.
Oznaczmy przez an bok 2n -kata
˛ foremnego wpisanego w okrag
˛ o średnicy jeden. W oparciu o twierdzenie Pitagorasa można pokazać, że
√
2
a2 =
,
2
an+1
1
=
2
q
p
2 − 4 − 4a2n .
(1.2)
Zatem obwód tego 2n -kata
˛ wynosi An := 2n an .
Można si˛e spodziewać, że ciag
˛ An powinien zmierzać do liczby π , bo tyle wynosi obwód koła o średnicy jeden. W rozdziale 8.8.1 przyjrzymy si˛e bliżej
zachowaniu ciagu
˛ (1.2).
22
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.7: Przybliżanie obwodu i pola koła wielokątami
Ćwiczenie 1.2.7
• (*) Opierajac
˛ si˛e na swojej wiedzy z geometrii spróbuj uzasadnić wzór (1.2).
• (*) Uzasadnij stwierdzenie, że bok 2n -kata
˛ foremnego opisanego na okr˛egu o średnicy jeden wyraża si˛e wzorem
an
bn := p
.
1 − a2n
W programie Mathematica liczb˛e π zapisuje si˛e jako Pi.
1.3
1.3.1
Szeregi
Pole koła
Archimedesowi zawdzi˛eczamy również sposób liczenia pola koła. Zastosował on tu również metod˛e wielokatów.
˛
Najpierw zauważył, że pole n-kata
˛ foremnego
wpisanego w okrag
˛ można policzyć sumujac
˛ pola n trójkatów
˛ równoramiennych. Maja˛ one wszystkie jednakowa˛ podstaw˛e xn i jednakowa˛ wyskość hn , zatem
pole wielokata
˛ wynosi Pn := nxn2 hn co równe jest Ln2hn , gdzie Ln := nxn jest obwodem wielokata.
˛ Przy n zmierzajacym
˛
do nieskończoności wysokości
˛
hn zmierzaja˛ do promienia r koła, a obwody Ln zmierzaja˛ do obwodu koła, o którym wiemy już, że wynosi 2πr. Zatem pola Pn zmierzaja˛ do 2πrr
2 skad
wnosimy, że pole koła o promieniu r to
P := πr2 .
1.3.2
(1.3)
Liczba π poprzez szereg.
Powróćmy do obliczania liczby π . Widzieliśmy, że metoda oparta o przybliżanie obwodu koła daje niezbyt zadowalajacy
˛ wynik. Cz˛esto jednak, jeśli jeden algorytm
zastapimy
˛
innym, to możemy uzyskać lepsze wyniki przy zastosowaniu tej samej arytmetyki komputerowej. Wiemy, że liczba π jest nie tylko obwodem koła o
średnicy jeden, ale również polem koła o promieniu jeden.
Zast˛epujac
˛ pole tego koła polami wpisanych w nie 2n -katów
˛
foremnych również otrzymamy ciag
˛ przybliżeń liczby π . Oznaczmy przez Pn pole 2n -kata
˛
foremnego wpisanego w koło. Dla n = 1 rozważamy 2 − kt jako zdegenerowana,˛ pozbawiona˛ pola figur˛e redukujac
˛ a˛ si˛e do średnicy koła, zatem P1 = 0.
1.3. SZEREGI
23
Rysunek 1.8: Kolejne dodatki do pola koła.
Zauważmy, że 2n+1 -kat˛ powstaje z 2n -kata
˛ poprzez dorysowanie figury złożonej z 2n trójkatów
˛ równoramiennych wpisanych w koło o podstawach leżacych
˛
na
bokach 2n -kata
˛ (patrz rys. 1.8). Niech An oznacza pole tej figury. Zatem Zatem
Pn+1 = Pn + An ,
czyli An+1 jest poprawka,˛ która dodana do pola 2n -kata
˛ daje pole 2n+1 -kata.
˛ Stad
˛
Pn = A1 + A2 + A3 + A4 + . . . + An−1 ,
a pole koła PK otrzymamy sumujac
˛ wszystkie poprawki:
PK = A 1 + A 2 + A 3 + A 4 + . . . .
Wartości Ai można wyliczyć. Aby wykorzystać wzory z podrozdziału 1.2.5, zamiast koła o promieniu jeden rozważymy ponownie koło o średnicy jeden, a
wi˛ec o promieniu 1/2. Zatem ze wzoru (1.3) jego pole to π4 . Zatem jako przybliżenie π interesuje nas ciag
˛ sn := 4Pn . Niech Tn oznacza pole trójkata
˛
równoramiennego o podstawie równej bokowi 2n -kata,
˛ a ramionach równych bokowi 2n+1 -kata.
˛ Mamy
An = 2n Tn
Można policzyć, że Tn =
an (1−
√
4
1−a2n )
, gdzie an , jak poprzednio, oznacza bok 2n -kata
˛ foremnego wpisanego w koło o średnicy jeden. Zatem
Pn+1 = Pn + 2
n an (1
−
p
1 − a2n )
4
oraz
sn+1 = sn + 2n an (1 −
1.3.3
p
1 − a2n ).
(1.4)
Szeregi
Warto zwrócić uwag˛e, że ciag
˛ sn jest specyficzny. Jego m-ty wyraz może zostać zapisany w postaci
sm =
m
X
cn ,
(1.5)
n=1
gdzie


0
cn = 2
p

 n
2 an (1 − 1 − a2n )
dla n = 1,
dla n = 2,
dla n > 2.
24
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Ciag
˛ takiego typu nazywamy szeregiem o wyrazach cn .
Zazwyczaj (choć bardzo nieściśle) używamy zapisu
∞
X
cn
n=1
na oznaczenie szeregu o wyrazach cn , a sm dane wzorem (1.5) nazywamy m-ta˛ suma˛ cz˛eściowa˛ szeregu.
Mówimy, że szereg jest zbieżny, jeżeli ciag
˛ sn jest zbieżny. W takim przypadku granic˛e ciagu
˛ sn nazywamy suma˛ szeregu i oznaczamy tym samym symbolem
co sam szereg.
Szeregi odgrywaja˛ ważna˛ rol˛e w wielu zastosowaniach, dlatego badaniu ich zbieżności poświ˛eca si˛e w analizie matematycznej szczególna˛ uwag˛e. Szczególnie
ważne sa˛ narz˛edzia, które pozwalaja˛ określić, czy szereg jest zbieżny, czy nie. Jeśli nie wiemy czy szereg jest zbieżny, to nie możemy z pożytkiem wykorzystywać
w obliczeniach numerycznych.
1.4
1.4.1
Funkcje
Koncepcja funkcji
Koncepcja funkcji, jedna z fundamentalnych idei współczesnej matematyki, jako samodzielny obiekt badań pojawiła si˛e w drugiej połowie XVII w. W tym pierwotnym
uj˛eciu funkcja była rozumiana jako wartość, tzw. zmienna zależna, która˛ można obliczyć rachunkiem algebraicznym badź
˛ poprzez konstrukcje geometryczne w
oparciu o inna˛ wartość, tzw. zmienna˛ niezależna˛ oraz pewne stałe. Jako przykład pierwszej kategorii może tu posłużyć funkcja kwadratowa
x 7→ x2 ,
funkcja wyznaczajaca
˛ pole koła o promieniu r
r 7→ πr2 ,
czy ogólnie wielomian
x 7→ a0 + a1 x + a2 x2 + · · · + an xn .
1.4.2
Miejsca zerowe funkcji
Wśród ważnych zagadnień praktycznych jakie pojawiaja˛ si˛e w kontekście funkcji jest pytanie czy i dla jakich wartości zmiennej niezależnej, albo inaczej argumentu,
funkcja przyjmuje wartość zero. Argument taki nazywa si˛e miejscem zerowym funkcji.
Jedna˛ z prostych metod poszukiwania miejsca zerowego funkcji jest tzw. metoda bisekcji. Wymaga ona dysponowania dwoma argumentami a < b, w których
funkcja przyjmuje wartości o znakach przeciwnych. Konstruujemy wtedy rekurencyjnie dwa ciagi
˛
x1
:= a
y1
:= b
(
xn
:=
xn +yn
xn+1
2
(
yn+1
:=
n
)<0
if f (xn )f ( xn +y
2
otherwise.
yn
n
if f (yn )f ( xn +y
)<0
2
xn +yn
2
otherwise.
W wielu przypadkach, choć niestety nie zawsze, ciagi
˛ te daż
˛ a˛ do wspólnej granicy b˛edacej
˛ miejscem zerowym funkcji f .
1.4. FUNKCJE
25
Rysunek 1.9: Wykres wielomianu Q(x) := −16 + 16x2 − 4x3 − 3x4 + x5 .
Ćwiczenie komputerowe 1.4.1 (*) Zaimplementuj metod˛e bisekcji w j˛ezyku Mathematica. Przetestuj ja˛ dla funkcji
(1) x 7→ x2 − 3 dla a = 1 i b = 3
(2) x 7→
x+cos x
sin x
− 1 dla a = −1 i b = 1.
Postaw hipotezy na temat zbieźności ciagów
˛
xn i yn . Jeśli uznasz, że sa˛ one zbieżne do wspólnej granicy, zastanów si˛e, czy jest ona poszukiwanym
miejscem zerowym, a jeśli nie jest, to co jest tego przyczyna.˛
1.4.3
Wykres funkcji
Jeśli zadawala nas zgrubne przybliżenie miejsc zerowych funkcji, wystarczy narysować wykres funkcji. Z wykresu, obok miejsc zerowych możemy też odczytać
tzw. ekstrema, czyli najwi˛eksze i jakie najmniejsze wartości osiaga
˛ funkcja w zadanym zbiorze. Rys. 1.9 przedstawia wykres wielomianu Q(x) := −16 +
16x2 − 4x3 − 3x4 + x5 , z którego na przykład odczytać możemy, że wartościa˛ najmniejsza˛ w przedziale [−1, 1] jest −16. Analizowanie funkcji poprzez
narysowanie wykresu wystarcza jednak tylko do pobieżnego zapoznania si˛e z funkcja.˛ Jak zobaczymy, analiza matematyczna dostarcza znacznie lepsze metody
do analizowania własności funkcji.
Wykresy funkcji jednej zmiennej bardzo łatwo uzyskać przy pomocy programu Mathematica. Na przykład wykres wielomianu Q(x) := −16 + 16x2 −
3
4x − 3x4 + x5 na rys. 1.9 uzyskano instrukcja˛
P l o t [ − 16+16 x ^2 − 4 x ^3 − 3 x ^ 4 + x ^ 5 , { x , − 2 . 5 , 3 . 5 } ]
1.4.4
Geometryczne konstrukcje funkcji
Funkcje pierwotnie definiowane poprzez konstrukcje geometryczne, to przede wszystkim funkcje trygonometryczne, na przykład
x 7→ sin x.
26
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.10: Geometryczna definicja funkcji sin i cos: w wycinku koła o promieniu 1 i długości łuku x wartość sin x definiuje
się jako długość odcinka spuszczonego z końca łuku prostopadle do ramienia wycinka koła ze znakiem plus, gdy koniec łuku
jest ponad ramieniem, a znakiem minus, gdy koniec łuku jest poniżej ramienia.
Rysunek 1.11: Wykres funkcji sin.
Konstrukcj˛e geometryczna˛ sin x i cos x pokazano na rys. 1.10. W konstrukcji tej |x| jest interpretowane jako długość łuku wycinka koła o promieniu jeden, a
znak x rozstrzyga o wzajemnym położeniu poczatku
˛ i końca łuku. Przyj˛ete jest, że znak plus oznacza iż poczatek
˛ łuku wyst˛epuje przed końcem łuku przy ruchu
przeciwnym do ruchu wskazówek zegara. Wykres funkcji sin przedstawiono na rys. 1.11.
W wielu zastosowaniach bardziej od funkcji sin i cos przydaje si˛e funkcja tangens
tg : x 7→
sin x
cos x
ctg : x 7→
cos x
.
sin x
oraz funkcja cotangens
Ponieważ dzielenie przez zero nie ma sensu, funkcja tangens nie ma określonej wartości dla argumentów x, dla których funkcja cos przyjmuje wartość zero, a
funkcja cotangens dla argumentów, dla których funkcja sinus si˛e zeruje. Wykres funkcji tg przedstawiono na rys. 1.12.
W programie Mathematica zwyczajowo nazwy funkcji rozpoczyna si˛e od dużej litery. Sin, Cos, Tan, Cot to nazwy funkcji sinus, cosinus, tangens i cotangens.
Wykres funkcji sinus na rys. 1.11 uzyskano instrukcja˛
P l o t [ Sin [ x ] , { x , −2 Pi , 2 Pi } ]
1.4. FUNKCJE
27
Rysunek 1.12: Wykres funkcji tg.
Możemy też definiować własne funkcje, na przykład
f [ x_ ] : = x ^2
definiuje funkcj˛e, która zmiennej x przypisuje wartość x2 . Teraz piszac
˛
f [3]
otrzymamy wartość 9.
Co ciekawe, możemy też definiować funkcje, które w różnych przypadkach zdefiniowane sa˛ różnymi wzorami. Na przykład
g [ x _ ] : = I f [ x ^ 2 > 1 , x ^ 2 , − 1]
definiuje funkcj˛e, która˛ przy zastosowaniu tradycyjnej matematycznej notacji zapisalibyśmy wzorem
(
x2
x 7→
−1
gdy x2 > 1,
w przeciwnym razie.
Instrukcja If j˛ezyka Mathematica to tak zwana instrukcja warunkowa. Ma ona trzy argumenty. Zwraca drugi, gdy pierwszy ewaluuje si˛e do prawdy. W przeciwnym
razie zwraca argument trzeci.
1.4.5
Rozwijanie funkcji w szereg
Jednym z ważniejszych osiagni˛
˛ eć analizy matematycznej było odkrycie, że funkcje trygonometryczne nie musza˛ być obliczane metoda˛ geometryczna,˛ ale moga˛
być wyznaczone przez przybliżanie wartości szeregu. Na przykład
sin x = x −
∞
X
x3
x5
x2n+1
+
− ... =
(−1)n
,
1·2·3 1·2·3·4·5
(2n + 1)!
n=0
gdzie m! = 1·2·3 · · · n, czytane m silnia, to iloczyn kolejnych liczb naturalnych od 1 do m. Wzór ten oraz podobne wzory dla innych funkcji trygonometrycznych
odkrył w wieku XIV hinduski matematyk Madhavan of Sangamagramam.
Dzisiejsza definicja funkcji jest nieporównanie szersza od pierwotnej koncepcji i obejmuje ciagi
˛ jako szczególny przypadek. W stosowanej dzisiaj definicji nie
wnikamy w jaki sposób (algebraiczny, geometryczny czy jakikolwiek inny) określono jak zmiennej niezależnej przypisano zmienna˛ zależna,˛ traktujac
˛ ja˛ po prostu
jako skadś
˛ dana.˛ Taka˛ jest na przykład funkcja Dirichleta
(
x 7→
1 x∈Q
0 x∈
6 Q,
w której definicji nie interesujemy si˛e jak w praktyce sprawdzić, czy liczba jest wymierna czy nie jest.
28
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.13: Pole soczewkowatej figury jest różnicą pól pod wykresami funkcji.
1.5
1.5.1
Pola figur i całkowanie
Całka oznaczona
Widzieliśmy, że koncepcja granicy jest pomocna przy obliczaniu pola koła. W podobny sposób możemy post˛epować z innymi figurami. Problem można sprowadzić
do liczenia pola pod wykresem funkcji. Rozważmy na przykład figur˛e o soczewkowatym kształcie przedstawiona˛ na rys. 1.13.
Jak łatwo zauważyć pole tej figury jest różnica˛ pól pod wykresami funkcji
y
= −x2 + 2x,
y
= x2 .
Pole pod wykresem funkcji f na przedziale [a, b] określane jest mianem całki oznaczonej. Do policzenia całki oznaczonej z funkcji f na przedziale [a, b]
też możemy zastosować technik˛e przejścia granicznego. W tym celu dzielimy przedział [a, b] punktami a = x0 < x1 < x2 < . . . < xn = b na n
podprzedziałów, niekoniecznie równych, i nad każdym z nich budujemy prostokat˛ o wysokości równej wartości funkcji f w prawym końcu przedziału. Oznaczajac
˛
przez ∆xi := xi − xi−1 długość i-tego przedziału (i-ta˛ różnic˛e) i sumujac
˛ pola prostokatów
˛ otrzymujemy przybliżenie pola pod wykresem równe:
f (x1 )∆x1 + f (x2 )∆x2 + . . . f (xn )∆xn =
n
X
f (xi )∆Xi .
i=1
Biorac
˛ coraz wi˛ecej punktów i coraz krótsze przedziały, w granicy otrzymujemy poszukiwane pole. Oznaczamy je dość tajemniczym symbolem
Z
b
f (x)dx,
a
w którym znak sumy przekształcił si˛e w wydłużona˛ liter˛e ’S’, a różnica ∆xi w "nieskończonie mała˛ różnic˛e", czyli różniczk˛e, oznaczona˛ symbolem dx.
(1.6)
1.5. POLA FIGUR I CAŁKOWANIE
29
Rysunek 1.14: Pole pod wykresem ćwiartki okręgu.
Przykładowy efekt takiego post˛epowania dla funkcji
y=
p
1 − x2
na przedziale [0, 1] przy n = 5 przedstawiono na rys. 1.14.
Podobnie jak poprzednio naturalne jest oczekiwanie, że takie post˛epowanie w granicy da poszukiwane pole pod wykresem funkcji.
Ten sposób liczenia pól stosowano już w starożytności, choć zrozumienie przyczyn jego poprawności bardzo długo pozostawało mgliste. Proces przejścia
granicznego opisywano jako zastapienie
˛
skończonego podziału podziałem na nieskończona˛ ilość przedziałów o nieskończenie małej lecz dodatniej długości dx.
Ta tajemnicza liczba dx dawała po przemnożeniu przez wartość funkcji na tym przedziale kolejna˛ nieskończenie mała˛ lecz dodatnia˛ wartość f (x)dx. Dopiero
wysumowanie nieskończonej ilości tych nieskończenie małych wartości dawało poszukiwane pole. Opis ten oczywiście wyjaśnia zapis i nazw˛e całki (całkowita
suma, powstała przez wysumowanie wszystkich nieskończenie małych f (x)dx), ale w żadnym przypadku nie może być uznany za definicj˛e całki oznaczonej.
Dopiero niemiecki matematyk, Georg Friedrich Bernhard Riemann (rys. 1.15) podał jako pierwszy precyzyjna˛ definicj˛e całki oznaczonej oraz warunki, kiedy ta
definicja ma sens. Dziś wyrażenie (1.6) określa si˛e mianem sumy Riemanna.
1.5.2
Całka nieoznaczona
Zakładajac,
˛ że całka oznaczona z funkcji f jest dobrze zdefiniowana (do czego potrzebujemy sum Riemanna i granicy), możemy zdefiniować funkcj˛e
Z
F (u) :=
u
f (x)dx,
0
dla której zachodzi wzór
Z
b
f (x)dx = F (b) − F (a).
a
30
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.15: Georg Friedrich Bernhard Riemann, 1826-1866. Źródło: Wikipedia
Funkcja F spełniajaca
˛ powyższy wzór nosi nazw˛e całki nieoznaczonej funkcji f . Oznaczamy ja˛ (nieprecyzyjnie) symbolem
Z
f (x)dx
Jeśli potrafilibyśmy znaleźć analityczny sposób na znalezienie całki nieoznaczonej w oparciu o funkcj˛e f , liczenie pól znacznie ułatwiłoby si˛e. Żyjacy
˛ na
przełomie X i XI w. naukowiec arabski znany w Europie jako Alhacen potrafił pokazać (oczywiście w ówczesnym j˛ezyku matematyki), że jeśli f jest wielomianem
stopnia drugiego
f (x) := a0 + a1 x + a2 x2 ,
to jego całka˛ nieoznaczona˛ jest
F (x) := a0 x +
a1 x2
a2 x3
+
.
2
3
Alhacen potrafił też podać wzór na całk˛e nieoznaczona˛ dla wielomianów stopnia trzeciego i czwartego. Wykorzystujac
˛ ten wzór, możemy bardzo szybko
policzyć pole naszej soczewki z rys.1.13, bo przyjmujac
˛ wygodne oznaczenie
b
[F (u)]a := F (b) − F (u)
otrzymujemy
Z
1
x2 dx
0
Z
0
1
(−x2 + 2x)dx
=
x3
3
1
=
0
1
3
3
1
x
2x2
2
=
− +
= .
3
2 0
3
Płyna˛ z tego dwa ważne wnioski. Po pierwsze, granica skomplikowanego ciagu
˛ wcale nie musi być trudna˛ w wyliczeniu liczba˛ niewymierna.˛ Po drugie i
ważniejsze, poj˛ecie granicy może być pomocne nie tylko w obliczeniach liczb niewymiernych. Nie mniej, a może nawet wi˛ecej, przydaje si˛e ono do definiowania
nowych poj˛eć, trudnych do zdefiniowania inaczej.
1.6. STYCZNA DO KRZYWEJ I GRANICA FUNKCJI
31
Rysunek 1.16: Styczna do okręgu
1.6
1.6.1
Styczna do krzywej i granica funkcji
Styczna do krzywej
Problem wyznaczenia stycznej do krzywej w zadanym punkcie to też jeden z problemów rozwiazywanych
˛
już w starożytności przy wykorzystaniu przejścia granicznego. W uproszczeniu, styczna do krzywej w danym punkcie krzywej, to prosta przechodzaca
˛ przez zadany punkt, która w jego pobliżu nie przecina krzywej w
żadnym innym punkcie. Rys. 1.16 przedstawia styczna˛ do łuku okr˛egu.
Styczna˛ można wyznaczać geometrycznie, przykładajac
˛ do krzywej linijk˛e, ale nie jest to metoda dokładna. Lepiej jest wyliczyć kat˛ jaki styczna tworzy z prosta˛
pozioma,˛ albo tak zwany współczynnik nachylenia prostej, czyli tangens tego kata.
˛
Jeśli krzywa zadana jest funkcja˛ f , to współczynnik nachylenia stycznej w punkcie wykresu o współrz˛ednych (x0 , f (x0 )) można przybliżyć, analizujac
˛
sieczna˛ poprowadzona˛ z punktu (x0 , f (x0 )). Jest to prosta, która przecina krzywa˛ w punkcie (x0 , f (x0 )) oraz dodatkowo w punkcie (x1 , f (x1 )), gdzie
x1 = x0 + h jest bliskie x0 .
Rysujac
˛ stosowny trójkat˛ prostokatny
˛ (rys. 1.17), łatwo zauważyć, że tangens kata,
˛ jaki sieczna tworzy z osia˛ x wynosi
f (x1 ) − f (x0 )
f (x0 + h) − f (x0 )
.
=
x1 − x0
h
Zmierzajac
˛ z h do zera zbliżamy sieczna˛ do stycznej, a wi˛ec w granicy dostać powinniśmy współczynnik nachylenia stycznej. I rzeczywiście dostajemy, jeśli
tylko funkcja jest odpowiednio porzadna.
˛
Należy zwrócić uwag˛e, że mamy tu do czynienia z innego typu granica˛ niż rozważane do tej pory, bo nie rozważamy ciagu,
˛ lecz funkcj˛e
h 7→
f (x0 + h) − f (x0 )
h
(1.7)
zmiennej h (x0 traktujemy jako parametr). Jak definiuje si˛e granic˛e ciagu
˛ już mniej wi˛ecej wiemy. A jak si˛e to robi w przypadku granicy funkcji?
1.6.2
Granica funkcji
Chociaż poj˛eciem granicy funkcji operowano co najmniej od XVII w., to pierwsza˛ precyzyjna˛ definicj˛e postawił czeski matematyk Bernard Bolzano dopiero w 1817
roku, a używana˛ współcześnie definicj˛e podał niemiecki matematyk Karol Weierstrass (rys. 1.18).
32
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.17: Styczna i sieczna do krzywej.
Rysunek 1.18: Karol Weierstrass (1815-1897). Źródło: Wikipedia
1.6. STYCZNA DO KRZYWEJ I GRANICA FUNKCJI
33
Według Weierstrassa funkcja f ma w punkcie x0 granic˛e g jeżeli dla każdego > 0 istnieje δ > 0 takie, że dla wszystkich x 6= x0
|x − x0 | < δ ⇒ |f (x) − g| < .
Piszemy wtedy
lim f (x) = g.
x→x0
1.6.3
Funkcje ciągłe
Warto sobie od razu powiedzieć, że w przeciwieństwie do ciagów,
˛
typowa funkcja, z jaka˛ spotykamy si˛e na co dzień, jeśli jest określona w punkcie x0 , to ma w
nim granic˛e równa˛ swojej wartości w x0 . Może to robić wrażenie, że teoria granicy funkcji jest mniej użyteczna od granicy ciagu.
˛ Ale właśnie ten fakt, którego
bez poj˛ecia granicy funkcji nie da si˛e zaobserwować, jest interesujacy
˛ sam w sobie. Funkcje o tej własności określamy mianem ciagłych.
˛
Obrazowo mówimy, że
funkcja ciagła
˛ to taka funkcja, której wykres można narysować bez odrywania ołówka od papieru. Nie jest to do końca prawda,˛ bo dotyczy jedynie funkcji, których
dziedzina jest odcinkiem domkni˛etym.
1.6.4
Obliczanie granic.
Granica funkcji może być liczona w punkcie x0 , w którym funkcja jest nieokreślona, ale jest określona dla wartości różnych od x0 . Wtedy ciagłość
˛
funkcji w
punktach różnych od x0 nie wystarcza, by wyznaczyć granic˛e. Mimo to cz˛esto można ja˛ łatwo policzyć. Na przykład funkcja
f :x→
2x + x2
x
jest nieokreślona w zerze, ale określona dla wartości wi˛ekszych i mniejszych od zera. Dla wartości tych jest ona równa funkcji
x → 2 + x,
która jest ciagła
˛ i określona w zerze, a zatem ma w zerze granic˛e dwa. Zatem
lim f (x) = 2.
x→0
Przykład ten może wydawać si˛e sztuczny, ale docenimy jego wartość, gdy uświadomimy sobie, że dokładnie taka granica pojawia si˛e przy obliczaniu współczynnika
kierunkowego stycznej do wykresu funkcji x 7→ x2 w punkcie 1, bo zgodnie ze wzorem (1.7) jest to funkcja
h 7→
2h + h2
(x0 + h)2 − x20
=
,
h
h
czyli funkcja f . Oczywiście nie wszystkie granice funkcji daja˛ si˛e tak łatwo policzyć. I tu, jak w przypadku ciagów,
˛
korzystamy z różnych twierdzeń. W szczególności
dla funkcji można udowodnić odpowiedniki twierdzenia o trzech ciagach
˛
oraz o granicy sumy, różnicy, iloczynu i ilorazu.
Problem 1.6.1 Jak uogólnić poj˛ecie granicy, tak by granica ciagu
˛ i funkcji wpadały "do jednego worka" i odpowiednie twierdzenia obejmowały tak ciagi
˛
jak i funkcje? Jak dołaczyć
˛
do takiej definicji przypadek ciagu
˛ lub funkcji zmierzajacej
˛ do nieskończoności?
Oczywiście granica funkcji nie musi istnieć. Jest tak na przykład w przypadku funkcji
1
x 7→ sin ,
x
która jest określona i ciagła
˛ dla wszystkich x z wyjatkiem
˛
zera, ale w zerze nie ma granicy.
Z kolei funkcja
x 7→
sin x
,
x
która też jest określona i ciagła
˛ dla wszystkich x z wyjatkiem
˛
zera, w zerze ma granic˛e wynoszac
˛ a˛ jeden, ale nie jest oczywiste jak to pokazać. Jednak z z wykresu
(rys. 1.20) widać, że należy si˛e tego spodziewać.
34
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Rysunek 1.19: Wykres funkcji x 7→ sin x1 . Granica tej funkcji w zerze nie istnieje
Rysunek 1.20: Wykres funkcji x 7→
sin x
x .
Granica tej funkcji w zerze wynosi jeden.
1.7. POCHODNA FUNKCJI
35
Rysunek 1.21: Wybrane styczne do wykresu funkcji. Na czerwono zaznaczono styczne w miejscach gdzie wykres się wznosi,
na zielono gdzie opada, a na żółto miejsca gdzie styczna jest pozioma.
1.7
1.7.1
Pochodna funkcji
Lokalne maksima i minima
Współczynnik nachylenia stycznej do wykresu funkcji niesie w sobie informacje o samej funkcji. Tam gdzie ten współczynnik jest dodatni funkcja (umownie) rośnie,
a gdzie jest ujemny maleje. Zerowa wartość współczynnika nachylenia oznacza, że styczna jest pozioma. Może to świadczyć o lokalnej górce (lokalne maksimum)
lub lokalnym dołku (lokalne minimum). Pozioma styczna może też wystapić
˛ w miejcu, chwilowo przestaje rosnać
˛ badź
˛ maleć.
1.7.2
Pochodna funkcji
Dlatego dla danej funkcji f interesujace
˛ jest poszukiwanie miejsc zerowych nowej funkcji, która punktowi x przypisuje współczynnik nachylenia stycznej do
wykresu funkcji f w punkcie x. Funkcja taka nazywana jest pochodna˛ funkcji f i oznaczana f 0 . Wiemy, że współczynnik kierunkowy stycznej obliczamy jako
granic˛e przy h → 0 wyrażenia
f (x + h) − f (x)
h
zwanego ilorazem różnicowym. Zatem
f 0 (x) = lim
h→0
f (x + h) − f (x)
h
oczywiście przy założeniu, że ta granica istnieje. Wprowadzajac
˛ oznaczenia na różnice
(x + h) − x = h
∆x
:=
∆y
:= f (x + h) − f (x)
możemy iloraz różnicowy napisać w postaci
∆y
,
∆x
(1.8)
36
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
co wyjaśnia jego nazw˛e. Używajac
˛ nieprecyzyjnego j˛ezyka nieskończenie małych można powiedzieć, że pochodna˛ funkcji otrzymujemy zast˛epujac
˛ w ilorazie różnicowym róznice ∆y i ∆x nieskończenie małymi różnicami oznaczanymi dy i dx i zwanymi różniczkami. Wyjaśnia to używana˛ do dziś nazw˛e teorii pochodnych:
rachunek różniczkowy. Sama koncepcja różniczki doczekała si˛e precyzyjnej definicji i choć odbiega ona od pierwotnej idei, pozwala zapis
f 0 (x) =
dy
dx
uczynić precyzyjnym.
Jeśli potrafimy ze wzoru na funkcj˛e f wyprowadzić wzór na funkcj˛e f 0 oraz potrafimy znaleźć miejsca zerowe funkcji f 0 , to potrafimy wskazać miejsca
podejrzane o wyst˛epowanie lokalnych minimów i lub maksimów. Okazuje si˛e, że choć w definicji pochodnej wyst˛epuje granica, to w wielu przypadkach jest to
granica, która˛ możemy policzyć czysto analitycznie bez konieczności stosowania przybliżeń. Na przykład dla funkcji x 7→ f (x) := x2 − 4x + 5 mamy
(x + h)2 − 4(x + h) + 5 − (x2 − 4x + 5)
h→0
h
= lim (2x + h − 4) = 2x − 4,
f 0 (x)
=
lim
h→0
bo funkcja x 7→ 2x − 4 jest ciagła.
˛ Widać, że f 0 (2) = 0, zatem funkcja f , jeśli ma gdzieś minimu lokalne to w punkcie 2.
1.7.3
Podstawowe twierdzenie rachunku różniczkowego i całkowego
Perski matematyk Sharaf al-Din al-Tusi już z końcem XII w. potrafił pokazać, że (używajac
˛ współczesnego j˛ezyka) pochodna˛ wielomianu trzeciego stopnia
Q(x) := b0 + b1 x + b2 x2 + b3 x3
jest
Q0 (x) = b1 + 2b2 x + 3b3 x2 .
Przypomnijmy, że około 200 lat wcześniej, Alhacen policzył, że całka˛ nieoznaczona˛
f (x) := a0 + a1 x + a2 x2 ,
jest
Z
F (x) =
f (x)dx = a0 x +
a2 x3
a1 x2
+
.
2
3
Podstawiajac
˛
b1
= a0
2b2
= a1
3b3
= a2
możemy zaobserwować, że jest zwiazek
˛ mi˛edzy mi˛edzy liczeniem pochodnej i całkowaniem:
Z
Q0 (x)dx
Z
0
f (x)dx
=
b1 x + b2 x2 + b3 x3 = Q(x) − b0
=
F 0 (x) = f (x).
Zatem już w XII w. były podstawy do odkrycia tego zwiazku,
˛
ale udało si˛e to dopiero 500 lat później. Pod koniec XVII w. Anglik Isaac Newton oraz Niemiec
Gottfried Leibniz (rys. 1.22) pokazali nast˛epujace
˛ twierdzenie
1.7. POCHODNA FUNKCJI
37
Rysunek 1.22: Isaac Newton (1643 - 1727) i Gottfried Leibniz (1646 - 1716). Źródło: Wikipedia
Twierdzenie 1.7.1 Jeśli f jest pochodna˛ funkcji F , to F jest całka˛ nieoznaczona˛ funkcji f . Jeśli F jest całka˛ nieoznaczona˛ funkcji f , to pochodna˛
funkcji F jest f .
Twierdzenie to jest dzisiaj określane mianem podstawowego twierdzenia rachunku różniczkowego i całkowego. Do czasu odkrycia tego twierdzenia teorie
pochodnej i całki rozwijane były niezależnie, przy czym w liczeniu pochodnych notowano wi˛eksze post˛epy niż w liczeniu całek. Odkrycie Newtona i Leibniza
pokazało, że w istocie jest jedna teoria, a każdy wzór na pochodna˛ jest równocześnie wzorem na całk˛e. Umożliwiło to liczenie wielu nowych całek, dało impuls do
intensywnego rozwoju rachunku różniczkowego i całkowego i przyczyniło si˛e do szybkiego rozwoju nauk technicznych.
38
ROZDZIAŁ 1. WPROWADZENIE DO ANALIZY MATEMATYCZNEJ
Część I
Elementy logiki i teorii mnogości
39
Rozdział 2
Matematyka zbiorów skończonych
Osobom postronnym cz˛esto si˛e wydaje, że badania matematyczne nie maja˛ zwiazku
˛ z otaczajac
˛ a˛ nas rzeczywistościa.˛ Jest to konsekwencja wysoce sformalizowanegeo j˛ezyka, którym współcześnie posługuje si˛e matematyka. Za tym formalizmem kryje si˛e jednak bardzo bogaty świat matematycznych intuicji, bezpośrednio
inspirowany nie tylko konkretnymi problemami nauki i techniki, ale przede wszystkim doświadczeniem i wyobrażeniami z codziennego życia. Matematycy rozwijaja˛
swoja˛ intuicj˛e wymyślajac
˛ i analizujac
˛ liczne przykłady. W przykładach tych poszukuja˛ powtarzajacych
˛
si˛e prawidłowości. Jeśli taka˛ prawidłowość uda si˛e wykryć
i nie udaje si˛e znaleźć przykładu, w którym prawidłowość nie zachodzi, formułuje si˛e hipotez˛e, że prawidłowość taka zachodzi zawsze. Hipoteza nie musi być i
cz˛esto nie jest w pełni prawidłowym opisem rzeczywistości, choć przynajmniej źdźbło prawdy cz˛esto w niej twki.
W odróżnieniu od wielu innych nauk, matematycy odrzucaja˛ intuicj˛e i eksperyment jako metod˛e rozstrzygajac
˛ a˛ co jest prawda.˛ Hipotez˛e trzeba uzasadnić
poprzez wyprowadzenie jej droga˛ logicznego rozumowania z uznawanych za oczywiste faktów. Rozumowanie takie nazywa si˛e dowodem, a hipotez˛e, dla której
udało si˛e podać dowód, twierdzeniem. W tym miejscu pojawia si˛e sformalizowany j˛ezyk. Przeprowadzenie matematycznego dowodu wymaga bowiem stosownej
teorii. W teorii takiej ustala si˛e najpierw podstawowe poj˛ecia, czyli tak zwane poj˛ecia pierwotne teorii oraz fakty uznawane za oczywiste, nazywane aksjomatami
teorii. Wszystkie inne poj˛ecia teorii definiowane sa˛ w oparciu o poj˛ecia pierwotne, a twierdzenia dowodzone sa˛ w oparciu o przyj˛ete aksjomaty. Wysoki stopień
sformalizowania j˛ezyka matematycznego dowodu ma uniemożliwić, a przynajmniej utrudnić, świadome lub nieświadome przemycenie do dowodu fałszywego
argumentu.
Logiczne rozumowanie jako metoda dochodzenia do prawdy towarzyszy ludzkości co najmniej od starożytności. W cywilizacji zachodniej podwaliny logiki
stworzył w IV stuleciu p.n.e. grecki filozof Arystoteles (ryc. 2.2). W kolejnym stuleciu grecki matematyk Euklides, (ryc. 2.2) w słynnym dziele zatytułowanym
Elementy, po raz pierwszy przedstawił sformalizowana˛ teori˛e matematyczna˛ opisujac
˛ a˛ geometri˛e. Jako poj˛ecia pierwotne przyjał˛ punkt i prosta.˛ Sformułował
też 10 aksjomatów. Nast˛epnie z aksjomatów tych wyprowadził wi˛ekszość znanych ówcześnie twierdzeń geometrii, w szczególności twierdzenie Pitagorasa.
Jako przykład matematycznej hipotezy posłużyć nam może słynna hipoteza Goldbacha z 1742 roku: każda˛ parzysta˛ liczb˛e naturalna˛ wi˛eksza˛ od dwóch można
przedstawić jako sum˛e dwóch liczb pierwszych. Widzimy, że rzeczywiście: 4 = 2 + 2, 6 = 3 + 3, 8 = 3 + 5, 10 = 5 + 5, 12 = 5 + 7, 14 = 7 + 7,
16 = 5 + 11, 18 = 5 + 13, 20 = 3 + 17, ... . Do dziś nie udało si˛e znaleźć ani dowodu tej hipotezy, ani kontrprzykładu, a wi˛ec wi˛ekszej od dwóch parzystej
liczby naturalnej, dla której rozkład na sum˛e dwóch liczb pierwszych nie istnieje. Dzi˛eki komputerom udało si˛e natomiast przeprowadzić eksperymenty, które
potwierdzaja,˛ że wśród liczb naturalnych nie wi˛ekszych niż 4 × 1018 nie ma kontrprzykładu. Teoria, w której ewentualny dowód hipotezy Goldbacha można byłoby
przeprowadzić, obejmuje liczby naturalne i operacj˛e ich dodawania jako poj˛ecia pierwotne oraz kilka faktów zbierajacych
˛
podstawowe własności liczb naturalnych,
na przykład przemienność dodawania, jako aksjomaty.
Świeżo sformułowana˛ hipotez˛e nadzwyczaj rzadko udaje si˛e od razu udowodnić. Co wi˛ecej, jeśli hipoteza jest bł˛edna, dowód nie jest możliwy. Trudności w
skonstruowaniu dowodu cz˛esto daja˛ podpowiedź jak znaleźć tak zwany kontrprzykład, a wi˛ec przykład, dla którego hipoteza nie zachodzi. To z kolei pozwala
zmodyfikować hipotez˛e i ponownie podjać
˛ prób˛e dowodu. Ten proces oscylacji pomi˛edzy próbami dowodu, budowaniem kontrpzykładu i modyfikowaniem hipotezy
niejednokrotnie trzeba wiele razy powtórzyć nim osiagnie
˛
si˛e sukces, czyli udowodnione twierdzenie. Właśnie dlatego uprawianie matematyki wspiera si˛e na dwóch
jednakowo ważnych podporach: intuicji i formaliźmie.
Niestety, gdy studiujemy matematyk˛e, najcz˛eściej mamy do czynienia wyłacznie
˛
z twierdzeniami i gotowymi już formalnymi dowodami. Cz˛esto brakuje czasu
na przyjrzenie si˛e dużej liczbie przykładów. A dopiero przeanalizowanie licznych przykładów pozwala na wyrobienie sobie intuicji niezb˛ednych do rzeczywistego
zrozumienia konkretnego twierdzenia. Analizowanie przykładów jest jednak zaj˛eciem żmudnym. Na szcz˛eście mamy dzisiaj komputery i programy, które bardzo
ułatwiaja˛ konstruowanie i analizowanie przykładów.
Jedna˛ z metod dowodzenia jest przeanalizowanie wszystkich możliwych przypadków. Jest to jednak możliwe tylko wtedy, gdy przypadków jest skończona
41
42
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
Rysunek 2.1: Dawid Hilbert, 1862-1943 oraz Kurt Gödel, 1906-1978. Źródło: Wikipedia
Rysunek 2.2: Arystoteles, IV w. p.n.e., rzymska kopia greckiego popiersia oraz Euklides, IV-III w. p.n.e., przedstawiony na
posągu w Muzeum Historii Naturalnej w Oksfordzie. Źródło: Wikipedia
ilość. Do pewnego stopnia dzieje si˛e tak w tak zwanej matematyce dyskretnej, a wi˛ec zajmujacej
˛ si˛e wyłacznie
˛
zbiorami zawierajacymi
˛
skończona˛ ilość elementów.
Jednak nawet w tym przypadku cz˛esto chcemy udowodnić, że coś zachodzi dla każdego zbioru skończonego, a zbiorów skończonych jest już nieskończenie wiele.
√
Niewymierność liczby 2 uświadomiła matematykom, że maja˛ przed soba˛ dwie drogi: albo pogodzić si˛e z faktem, że przekatna
˛ √ kwadratu o boku długości
jeden sama√długości nie posiada, albo zaakceptować stosowanie w rozumowaniach obiektów nieskończonych. W przypadku liczby 2 jest to niekończony ciag
˛
przybliżeń 2 liczbami wymiernymi.
Rozważania na temat nieskończonych obiektów przez całe tysiaclecia
˛
sprawiały matematykom dużo trudności. W szczególności w odniesieniu do ciagów
˛
przybliżeń używano poj˛eć "nieskończenie mały" lub "nieskończenie wielki" choć widać było, że poj˛ecia te sa˛ problematyczne: dało si˛e z nich wywieść tak wnioski
pożadane
˛
jak i nonsensowne.
W XIX wieku, wraz ze wzrostem precyzji w fromułowaniu idei rachunku różniczkowego i całkowego i pojawiajacymi
˛
si˛e coraz cz˛eściej sprzecznościami
zwiazanymi
˛
z nieodpowiednim posługiwaniem si˛e nieskończonościa,˛ zacz˛eła narastać potrzeba usystematyzowania metod badawczych matematyki. W 1920 roku
niemiecki matematyk Dawid Hilbert (rys. 2.1) zaproponował swój program bardzo formalnego podejścia do matematyki. Jest on dziś znany pod nazwa˛ program
Hilberta. Hilbert zuważył, że choć analiza matematyczna wymaga operowania nieskończonościa,˛ to j˛ezyk, w którym mówi si˛e o matematyce jest skończony, bo
składa si˛e ze skończonej ilości słów.
Hilbert postulował, że wszystkie twierdzenia matematyki należy wyprowadzić droga˛ formalnego dowodu z dobrze dobranego zestawu aksjomatów, czyli
możliwie oczywistych stwierdzeń przyjmowanych bez dowodu. Nie był to pomysł nowy: jak wspomnieliśmy, takie podejście do geometrii zaproponował Euklides.
Zasługa˛ Hilberta była obserwacja, że takie podejście może rozwiazać
˛ problemy z nieskończonościa.˛ Każde twierdzenie daje si˛e zapisać jako skończony ciag
˛ słów,
2.1. ZBIORY SKOŃCZONE
43
a każdy dowód jest skończonym ciagiem
˛
formuł, również zbudowanych ze skończonej ilości słów. Zatem poprawność dowodu można sprawdzić droga˛ skończonej
inspekcji i to również w przypadku gdy samo twierdzenie dotyczy zbiorów nieskończonych.
Matematycznym uj˛eciem formalnego opisu teorii matematycznej, w tym dowodów, zajmuje si˛e logika matematyczna oraz tzw. metamatematyka. Zazwyczaj
j˛ezyk metamatematyki nie jest już tak sformalizowany jak j˛ezyk formalny, który metamatematyka opisuje. Ale, zgodnie z obserwacja˛ Hilberta, metamatematyka
bada obiekty skończone (formuły j˛ezyka formalnego), wi˛ec sam j˛ezyk metamatematyki nie musi być do końca sformalizowany.
By jednak podejście takie było przekonujace
˛ wypada najpierw udowodnić, że zestaw przyj˛etych bez dowodu aksjomatów nie jest sprzeczny sam w sobie.
Hilbert goraco
˛ wierzył, że jego program da si˛e zrealizować. Jednak już 11 lat później austriacki matematyk Kurt Gödel (rys. 2.1) pokazał, że nie istnieje niesprzeczny
układ aksjomatów, z którego dałoby si˛e wyprowadzić wszystkie twierdzenia dotyczace
˛ liczb naturalnych. Innymi słowy, jeśli teoria obejmujaca
˛ arytmetyk˛e liczb
naturalnych jest niesprzeczna (wywiedziona z niesprzecznego zestawu aksjomatów) to jest niezupełna (sa˛ w niej zdania p, dla których nie ma dowodu ani dla p,
ani dla nieprawda, że p).
Pomimo twierdzenia Gödla jak i trudności w realizacji postulatu sprawdzenia niesprzeczności program Hilberta szybko przyjał˛ si˛e i pozostaje do dziś powszechnie przyj˛eta˛ metoda˛ uprawiania matematyki.
2.1
Zbiory skończone
Zaczniemy od przedstawienia teorii zbiorów skończonych, przy okazji nieformalnie przygladaj
˛ ac
˛ si˛e niektórym zbiorom nieskończonym. Teoria zbiorów skończonych
w swoich elementach nie różni si˛e wiele od teorii zbiorów nieskończonych, nie wymaga jednak takiej ostrożności jak post˛epowanie ze zbiorami nieskończonymi.
Formalna˛ teori˛e zbiorów nieskończonych przedstawimy w rozdziale 4.
Zbiór skończony definiujemy wymieniając jego elementy, na przykład:
{ a, b, c }
oznacza zbiór, którego elementami są trzy litery: a, b, c. W niniejszym rozdziale, to jest w rozdziale 2, mówiąc zbiór mamy
na myśli zbiór skończony, chyba, że wyraźnie zaznaczymy inaczej.
Zbiory oznaczamy zazwyczaj dużymi literami. Pisząc
Z := { 2, 3, 5, 7, 11, 13, 17, 19 }
definiujemy zbiór składający się z liczb 2, 3, 5, 7, 11, 13, 17 i 19 i nadajemy mu nazwę Z. Fakt, że liczba 5 jest elementem
zbioru Z zapisujemy jako 5 ∈ Z. Jeśli coś nie jest elementem zbioru, używamy znaku 6∈, na przykład 15 ∈
6 Z. Zbiór Z
możemy też opisać słownie: zbiór liczb pierwszych mniejszych od 20, symbolicznie
Z = { x | x jest liczbą pierwszą i x < 20 }.
Przypomnijmy, że liczba pierwsza to liczba naturalna większa od jeden, która dzieli się bez reszty tylko przez siebie i przez
liczbę jeden. Nie jest nią więc ani 9, ani 15, bo liczby te dzielą się przez 3. Nie jest nią też żadna liczba parzysta większa od
2.
Zaznaczmy, że przy definiowaniu zbioru kolejność w jakiej wymieniamy elementy nie ma znaczenia. Tak więc na przykład zapisy { 2, 3, 5, 7, 11, 13, 17, 19 }, { 2, 3, 17, 19, 5, 7, 11, 13 } czy { 19, 17, 13, 11, 7, 5, 3, 2 } definiują ten sam zbiór. Również
kilkakrotne wymienienie elementu nie wpływa na zawartość zbioru. Tak więc zapisy
{1, 2, 2, 3, 3, 3} oraz {1, 2, 3}
oznaczają ten sam zbiór.
Zbiór nieskończony czasami też próbujemy definiować poprzez wypisanie jego elementów:
{ 2, 4, 6, 8, 12, 14 . . . },
jednak nie jesteśmy w stanie wypisać ich wszystkich, wi˛ec wypisujemy tylko cz˛eść, zakładajac,
˛ że czytelnik sam, w razie potrzeby ustali na zasadzie analogii
co jeszcze do tego zbioru należy. W rozważanym przykładzie można si˛e domyśleć, że chodzi nam o zbiór liczb naturalnych parzystych. Ustalenie na zasadzie
analogii co jest elementem zbioru w istocie oznacza określenie własności czy formuły, która rozstrzyga co do naszego zbioru należy, a co nie należy. Jest to jedyny
44
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
Rysunek 2.3: Zbiór { x | x = (x1 , x2 ) i x21 + x22 <= 1 } zwizualizowany w układzie współrzędnych na płaszczyźnie.
formalnie poprawny sposób definiowania zbiorów nieskończonych. Jednak, jak zobaczymy później, problemy ze zbiorami nieskończonymi biora˛ si˛e stad,
˛ że nie
każda własność definiuje zbiór.
Jako przykład zbioru nieskończonego zadanego poprzez własność rozważmy
x jest para˛ liczb (x1 , x2 ) takich, że x21 + x22 <= 1.
Zaleta˛ takiego przykładu jest, że zwiazany
˛
z ta˛ formuła˛ zbiór
{ x | x = (x1 , x2 ) i x21 + x22 <= 1 }
łatwo zwizualizować rysunkiem na płaszczyźnie (rys. 2.3).
Warto sobie uświadomić, że wizualizacja, w szczególności wizualizacja komputerowa zbioru nieskończonego jest sama w sobie zbiorem skończonym. Wynika
to stad,
˛ że obraz komputerowy jest zbudowany ze skończonej liczby pikseli. Wrażenie, że punktów jest nieskończenie wiele wynika z niedoskonałości naszego
oka. Tak wi˛ec każda wizualizacja jest tylko pewnym przybliżeniem idei jaka˛ jest zbiór nieskończony.
Jak zobaczymy, czasami wygodnie jest też posłużyć się zbiorem pozbawionym jakichkolwiek elementów. Zbiór taki
określamy mianem zbiór pusty i oznaczany ∅. Czasami stosujemy też oznaczenie {}.
Zbiór {a} ma dokładnie jeden element, mianowicie a. Zbiór taki określamy mianem singleton. Podobnie definiujemy
dubleton {a, b} jako zbiór złożony z dwóch elementów a, b. W zasadzie definicję tę stosujemy tylko wtedy gdy a 6= b, gdyż
dla a = b zbiór {a, b} pokrywa się z singletonem {a}.
2.1.1
Operacje mnogościowe
Na zbiorach można wykonywać kilka podstawowych operacji, które mają pewne, choć ograniczone, podobieństwo do operacji
arytmetycznych na liczbach.
2.1. ZBIORY SKOŃCZONE
45
Rysunek 2.4: Wierszami od lewego górnego rogu: zbiory A i B, zbiór A ∪ B, zbiór A ∩ B i zbiór A B.
Definicja 2.1.1 Niech A, B będą zbiorami. Definiujemy ich sumę oraz iloczyn, różnicę i różnicę symetryczną odpowiednio jako
A∪B
:= { x | x ∈ A lub x ∈ B },
A∩B
:= { x | x ∈ A i x ∈ B },
A\B
:= { x | x ∈ A i x 6∈ B },
AB
:=
(A \ B) ∪ (B \ A).
Sumę zbiorów określamy też mianem unia zbiorów, a iloczym zbiorów mianem przecięcie zbiorów.
Rozważmy zbiory na płaszczyźnie
A = { (x1 , x2 ) | (x1 + 0.5)2 + x22 <= 1 } B = { (x1 , x2 ) | (x1 − 0.5)2 + x22 <= 1 }.
Łatwo sprawdzamy, że
A∪B
=
{ (x1 , x2 ) | (x1 + 0.5)2 + x22 <= 1 lub (x1 − 0.5)2 + x22 <= 1 },
A∩B
=
AB
=
{ (x1 , x2 ) | (x1 + 0.5)2 + x22 <= 1 i (x1 − 0.5)2 + x22 <= 1 },
{ (x1 , x2 ) | (x1 + 0.5)2 + x22 <= 1 i (x1 − 0.5)2 + x22 > 1 lub (x1 + 0.5)2 + x22 > 11 i (x1 − 0.5)2 + x22 <= 1 }.
Wizualizacj˛e tych zbiorów na płaszczyźnie przedstawiono na rys. 2.4).
Mówimy, że A, B są rozłączne jeżeli A ∩ B = ∅.
46
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
2.1.2
Zawieranie się i równość zbiorów. Podzbiory.
Definicja 2.1.2 Mówimy, że zbiór A zawiera się w zbiorze B lub inaczej, że A jest podzbiorem B jeśli każdy element
zbioru A jest też elementem zbioru B. Piszemy wtedy A ⊂ B. Jeśli ⊂ B i B ⊂ A, to mówimy, że zbiory A i B są
równe i piszemy A = B. Mówimy, że A jest podzbiorem właściwym B jeśli A ⊂ B i nie jest prawdą, że A = B.
Definicja 2.1.3 Zbiór podzbiorów zbioru A definiujemy jako zbiór postaci
P(A) := { U | U ⊂ A }.
Na przykład dla zbioru A = {a, b, c} mamy
P(A) = { ∅, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c} }.
2.1.3
Uzupełnienie zbioru.
Gdy mówimy o jakiejś matematycznej rzeczywistości, wygodnie jest rozważać zbiór wszystkich obiektów tej rzeczywistości. Gdy uprawiamy arytmetyk˛e, wygodnie
jest mówić o zbiorze wszystkich liczb, na przykład wszystkich liczb całkowitych lub wszystkich liczb rzeczywistych. W geometrii płaszczyzny wygodnie jest mówić
o zbiorze wszystkich punktów płaszczyzny, w polityce mi˛edzynarodowej o zbiorze wszystkich państw, w biologii o zbiorze wsztstkich gatunków. W odniesieniu
do takiego zbioru wszystkich obiektów rozważanej rzeczywistości matematycy używaja˛ określenia przestrzeń. Od strony formalnej przestrzeń jest synonimem
słowa zbiór, jednak określenie przestrzeń niesie w sobie dodatkowa˛ nieformalna˛ informacj˛e, że zbiór ten zawiera w sobie wszelkie inne zbiory obiektów, które w
rozważanej rzeczywistości moga˛ nas interesować.
Warto od razu zaznaczyć, że interesujace
˛ przestrzenie matematyczne na ogół sa˛ nieskończone. Tym niemniej z poj˛eciem przestrzeni dobrze jest si˛e oswoić
już teraz.
Definicja 2.1.4 Jeśli A ⊂ X to zbiór X \A nazywamy uzupełnieniem A do X i oznaczamy CX A. Gdy X jest ustalony
i znany z kontekstu, to uzupełnienie A do X oznaczamy po prostu CA lub \A.
Poj˛ecie uzpełnienia jest szczególnie wygodnie w odniesieniu do przestrzeni. Na przykład jeśli X to przestrzeń wszystkich państw, a E oznacza państwa
europejskie, to \E oznacza państwa, które nie leża˛ w Europie.
Rysunki 2.3 oraz 2.4 uzyskano przy pomocy pakietu oprogramowania PSets napisanego w języku Mathematica. Pakiet ten
pozwala na definiowanie zbiorów na płaszczyźnie zadanych formami zdaniowymi zbudowanymi z nierówności algebraicznych.
Aby móc korzystać z pakietu, trzeba go najpierw wczytać instrukcją
<< PSets .m
Teraz wprowadzając
sA = PSet [ { x , y } , ( x + 0 . 5 ) ^ 2 + y^2 <= 1 ] ;
sB = PSet [ { x , y } , ( x − 0 . 5 ) ^ 2 + y^2 <= 1 ] ;
Print [ sA \ [ Union ] sB ] ;
Print [ sA \ [ Intersection ] sB ] ;
Print [ sA \ [ B a c k s l a s h ] sB ] ;
Print [ sA \ [ C i r l c e M i n u s ] sB ] ;
2.1. ZBIORY SKOŃCZONE
47
obliczymy sumę, iloczyn, różnicę i różnicę symetryczną zbiorów
A:
=
{ (x, y) | (x + 0.5)2 + y 2 ¬ 1 }
B:
=
{ (x, y) | (x − 0.5)2 + y 2 ¬ 1 }.
Możemy też sprawdzić, czy konkretny punkt, na przykład (1, 0) należy do zbioru, na przykład A, pisząc
{ 1 , 0 } \ [ Element ] sA
Użycie operatorów \back[Subset], \back[Superset] i \back[equal] pozwala na sprawdzanie zawierania się i równości
zbiorów. Warto wiedzieć, że różnego rodzaju operatory, w tym operatory mnogościowe w Mathematica można wprowadzać używając skrótów klawiaturowych. Wybrane skróty przedstawiono w tabeli poniżej. W tabeli tej znakiem :̇oznaczono
przyciśnięcie klawisza Esc w lewym górnym rogu klawiatury.
operator
\[Union]
\[Intersection]
\[Backslash]
\[CirlceMinus]
\[Subset]
\[Superset]
\[Equal]
\[Element]
\[SmallCirlce]
\[CenterDot]
\[CircleDot]
\[CirclePlus]
\[Cross]
\[Times]
skrót
:̇un:̇
:̇inter:̇
:̇\:̇
:̇c-:̇
:̇sub:̇
:̇sup:̇
:̇==:̇
:̇el:̇
:̇sc:̇
:̇.:̇
:̇c.:̇
:̇c+:̇
:̇cross:̇
:̇*:̇
forma graficzna
∪
∩
\
⊂
⊃
=
∈
◦
·
⊕
×
×
Pisząc
S e t P l o t [ ( sA \ [ Union ] sB ) , { −2 , 2 } , { −2 , 2 } ]
otrzymamy rysunek zbioru A ∪ B w domyślnych kolorach. Pisząc
S e t P l o t [ ( sA \ [ B a c k s l a s h ] sB ) , { −2 , 2 } , { −2 , 2 } , I n t e r i o r S t y l e −> Green ,
BoundaryStyle −> {RGBColor[ 0 , 0 . 5 , . 0 ] , Thick } ]
uzyskamy rysunek zbioru A \ B w kolorze i stylu dobranym przez nas. Pisząc
S e t P l o t [ ( sA \ [ C i r l c e M i n u s ] sB ) , { −2 , 2 } , { −2 , 2 } , Grid−>True ]
uzyskamy rysunek zbioru A B z naniesioną siatką poziomych i pionowych linii o współrzędnych całkowitych. Rysunek taki
pozwala w szczególności szybko policzyć ilość zawartych w zbiorze tzw. punktów kratowych, tj. punktów o obu współrzędnych
całkowitych.
Ćwiczenie komputerowe 2.1.5 Wykorzystując pakiet PSets oblicz i narysuj zbiory A, B, A ∪ B, A ∩ B, A \ B,
B \ A i A B dla różnych, zaproponowanych przez Ciebie podzbiorów płaszczyzny. Eksperymentując, ustal znacznie
parametrów instrukcji SetPlot. Zastanów się, czy otrzymane rysunki można zawsze uznać za w pełni poprawne.
Czasami warto kilka zbiorów umieścić razem na jednym wykresie (rysunku). Pisząc
pa = S e t P l o t [ sA , { −2 , 2 } , { −2 , 2 } ,
I n t e r i o r S t y l e −> {Red, Opacity [ 0 . 6 ] } ,
BoundaryStyle −> {Red, Thick } ] ;
48
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
pb = S e t P l o t [ sB , { −2 , 2 } , { −2 , 2 } ,
I n t e r i o r S t y l e −> {Blue , Opacity [ 0 . 6 ] } ,
BoundaryStyle −> {Blue , Thick } ] ;
Show [ pa , pb ]
uzyskamy oba zbiory A i B na jednym wykresie, tak jak to przedstawiono w lewym gónym rogu rys. 2.4.
Ćwiczenie komputerowe 2.1.6 Wykorzystaj instrukcję Show, by zilustrować: rozłączność zbiorów, zawieranie się
zbiorów jak również brak rozłączności i brak zawierania się.
Możemy również eksperymentować z pakietem FSets, który implementuje operacje mnogościowe na zbiorach skończonych. Na przykład pisząc
sA=FSet [ a , b , c ]
sB=FSet [ b , c , d ]
sC=sA \ [ Union ] sB
obliczymy, że sumą mnogościową zbiorów a, b, c i b, c, d jest a, b, c, d.
2.1.4
Elementarne własności operacji mnogościowych
Uwaga 2.1.7 Niech A, B, C będą zbiorami. Operacje mnogościowe mają następujące własności.
Jeśli A ⊂ B, B ⊂ C, to A ⊂ C,
A \ A = ∅,
A \ ∅ = A,
A ∪ B = B ∪ A,
A ∪ A = A,
A ∩ A = A,
A ∩ B = B ∩ A,
A ⊂ B wtedy i tylko wtedy gdy A ∪ B = B,
A ⊂ B wtedy i tylko wtedy gdy A ∩ B = A,
A ⊂ A ∪ B,
B ⊂ A ∪ B,
A ∪ (B ∪ C) = (A ∪ B) ∪ C,
A ∩ B ⊂ A,
A ∩ B ⊂ B,
A ∩ (B ∩ C) = (A ∩ B) ∩ C,
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C),
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
Uwaga 2.1.8 Niech A, B ⊂ X będą zbiorami w przestrzeni X. Uzupełnienie do przestrzeni X ma następujące własności.
A \ B = A ∩ (\B),
\(\A) = A,
\(A ∪ B) = (\A) ∩ (\B),
\(A ∩ B) = (\A) ∪ (\B),
A ⊂ B wtedy i tylko wtedy gdy \ A ⊃ \B.
Ćwiczenie komputerowe 2.1.9 Wykorzystaj pakiet FSets, by zilustrować wybrane elementarne własności operacji
mnogościowych.
2.2. ILOCZYN KARTEZJAŃSKI
2.2
2.2.1
49
Iloczyn kartezjański
Para
Wśród kluczowych poj˛eć analizy matematycznej jest poj˛ecie ciagu
˛ i funkcji. Funkcj˛e najprościej zdefiniować jak pewien zbiór par. Pierwszy element pary to
argument, a drugi to wartość funkcji dla tego argumentu. Zatem jeśli chcemy definicj˛e funkcji podać na gruncie teorii mnogości, musimy zdefiniować par˛e elementów
a i b, zwyczajowo oznaczana˛ (a, b). W poj˛eciu pary istotne jest, by było wiadomo, który element pary jest pierwszy, a który drugi. Tak wi˛ec roli pary nie może
pełnić dubleton, bo w dubletonie kolejność nie ma znaczenia. Mamy bowiem {a, b} = {b, a}. Nie jest oczywiste jak postawić definicj˛e pary na gruncie teorii
mnogości. Nie możemy zdefiniować pary jako dwuelementowego ciagu,
˛ gdyż ciag
˛ jest szczególnym przypadkiem funkcji, a na gruncie teorii mnogości funkcj˛e
definiuje si˛e jako pewien zbiór par (x, y) o stosownych własnościach.
Formalną definicję pary na gruncie teorii mnogości podamy w rozdziale 4.4.1. Na razie wystarczy nam intiucyjne pojęcie
pary jako zbioru dwuelementowego (dubletonu) {a, b}, w którym dodatkowo ustalono, że a jest pierwszy, a b jest drugi. Parę
elementów a, b zapisywać będziemy (a, b).
Kluczową własnością pary, której nie ma dubleton, jest
Uwaga 2.2.1
(a, b) = (c, d) wtedy i tylko wtedy gdy a = c i b = d.
Tak więc para (5, 11) nie jest równa parze (11, 5) chociaż, zgodnie z umową dotyczącą zbiorów, mamy {5, 11} = {11, 5}.
2.2.2
Iloczyn kartezjański
Zbiór wszystkich możliwych par (x, y), gdzie x ∈ X , a y ∈ Y tworzy tzw. iloczyn kartezjański zbiorów X i Y . Nazwa wywodzi si˛e od francuskiego matematyka
Kartezjusza (René Descartes, rys. 2.5), który jako pierwszy zaproponował algebraiczne podejście do geometrii poprzez potraktowanie płaszczyzny jako zbioru par
liczb.
Definicja 2.2.2 Iloczynem kartezjańskim zbiorów X i Y nazywamy zbiór
X × Y := { (x, y) | x ∈ X, y ∈ Y }.
Iloczyn kartezjański X × X oznaczamy krótko X 2 .
W pakiecie FSets iloczyn kartezjański zbiorów skończonych obliczamy instrukcją
sC=sA \ [ Cross ] sB
Ćwiczenie komputerowe 2.2.3 Wykorzystaj pakiet FSets, by zilustrować wyliczenie iloczynu kratezjańskiego wybranych przez siebie zbiorów skończonych.
2.3
Relacje
Poj˛ecie relacji znane jest nam dobrze z j˛ezyka codziennego. Mówi si˛e na przykład, że dwie osoby pozostaja˛ w relacji pokrewieństwa. Albo, że dwa państwa
pozostaja˛ w dobrych relacjach. Relacja oznacza pewien zwiazek
˛ pomi˛edzy dwoma elementami. Z abstrakcyjnego punktu widzenia relacja pomi˛edzy elementami
zbiorów X i Y to w pewien sposób wyróżniony podzbiór iloczynu kartezjańskiego X × Y . Wyróżnienie może nastapić
˛ poprzez podanie warunku wymaganego,
by elementy były w relacji, ale w przypadku zbiorów skończonych cz˛esto ograniczamy si˛e do wypisania par tworzacych
˛
relacj˛e bez merytorycznego wnikania co
elementy w te pary połaczyło.
˛
Poj˛ecie relacji jest punktem wyjścia do szeregu podstawowych poj˛eć współczesnej matematyki: w szczególnośc relacji równoważności oraz relacji cz˛eściowego
i liniowego porzadku.
˛
Jak zobaczymy, funkcje też traktowane sa˛ dziś przez matematyków jako szczególny przypadek relacji.
50
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
Rysunek 2.5: Kartezjusz, 1596-1650
2.3.1
Relacje
Definicja 2.3.1 Relacją w zbiorach X i Y nazywamy dowolny podzbiór R ⊂ X × Y .
Gdy X = Y , mówimy krótko o relacji w X. Tradycyjnie piszemy xRy zamiast (x, y) ∈ R. Zbiór pusty i X × X to
odpowiednio relacja pusta i relacja pełna w X. Relacją identycznościową w X jest
∆X := idX := { (x, x) | x ∈ X }.
Zazwyczaj wyrażajac
˛ w j˛ezyku naturalnym fakt, iż jakieś dwa obiekty pozostaja˛ w pewnej relacji, używamy rzeczowników odnoszac
˛ si˛e do obiektów, a czasownika odnoszac
˛ si˛e do relacji. Na przykład zdanie "Ala lubi Tomka" opisuje relacj˛e pomi˛edzy obiektami (osobami) ’Ala’ i ’Tomek’ (rzeczowniki) wyrażona˛ przy pomocy
czasownika ’lubić’. Czasownik, szczególnie czasownik ’być’, cz˛esto wyst˛epuje z przymiotnikiem lub przysłówkiem, tak jak w bardziej matematycznym przykładzie
’Liczba 5 jest wi˛eksza niż liczba 3’.
Zdanie ’Japonia zaatakowała USA’ opisuje relacj˛e pomi˛edzy obiektami (państwami) ’Japonia’ i ’USA’ wyrażona˛ przy pomocy czasownika ’zaatakować’. Jeśli
w zdaniu tym rzeczowniki ’Japonia’, ’Niemcy’ zastapimy
˛
zmiennymi x, y , otrzymamy zwrot ’x zaatakował y ’, określany mianem formy zdaniowej. Forma zdaniowa
nie jest zdaniem, bo nie można ocenić, czy wyraża prawd˛e czy fałsz. Można to zrobić, gdy za zmienne podstawimy konkretne obiekty. W uj˛eciu formalnym to
właśnie forma zdaniowa służy do określenia relacji, a sama relacja jest zbiorem par tych obiektów, które podstawione do formy zdaniowej daja˛ zdanie prawdziwe.
Rozważmy relację w zbiorze X := { 1, 2, 3, 4 } daną wzorem
R := { (1, 1), (1, 2), (1, 4), (2, 3), (3, 1), (4, 2) }.
(2.1)
Relacj˛e t˛e można zobrazować rysujac
˛ jej wykres oraz graf (rys. 2.6). Wykres relacji rysujemy podobnie jak wykres funkcji, zaznaczajac
˛ w układzie współrz˛ednych te punkty, których współrz˛edne odpowiadaja˛ parom pozostajacym
˛
w relacji. Rysowanie wykresu relacji jest możliwe tylko wtedy gdy zbiory X i Y sa˛
podzbiorami prostej lub w jakiś sposób daja˛ si˛e utożsamić z pewnymi podzbiorami prostej. Same zbiory X i Y nie musza˛ być skończone.
Narysowanie grafu relacji jest możliwe tylko wtedy gdy zbiór X (oba zbiory X i Y gdy relacja jest w zbiorach X i Y ) sa˛ skończone. Każdy z elementów
zbioru X (lub zbiorów X i Y ) zaznaczamy jako punkt na płaszczyźnie. Punkty łaczymy
˛
strzałka,˛ gdy odpowiadajace
˛ im elementy pozostaja˛ w relacji.
2.3. RELACJE
51
Rysunek 2.6: Wykres i graf relacji R w X
Pakiet Relations w języku Mathematica pozwala na rysowanie wykresów i grafów relacji w zbiorze skończonym X. Na
przykład instrukcja
R = R e l a t i o n [{1 ,2 ,3 ,4} ,{1 − >1 ,1 − >2 ,1 − >4 ,2 − >3 ,3 − >1 ,4 − >2}]
tworzy relację w zbiorze X := { 1, 2, 3, 4 } daną wzorem (2.1). Rysunek wykresu tej relacji uzyskamy pisząc
RChart [ r e ]
Natomiast graf uzyskamy pisząc
RGraph [ r e ]
Aby sprawdzić, czy dana para (a, b) jest w relacji R wystarczy napisać
a \ [ CenterDot ] R \ [ CenterDot ] b
Rozważmy relację w X := { a, b, c } i Y := { p, q, r, s } daną wzorem
R := { (a, p), (b, p), (b, q), (c, s) }.
Relacj˛e t˛e można zobrazować rysujac
˛ jej graf (rys. 2.7).
W przypadku relacji w zbiorach X i Y gdy X 6= Y rysowanie grafu jest bardziej skomplikowane, bo nie można się zdać
na automatyczne rozlokowanie wierzchołków. Rysunek 2.7 uzykano następującym ciągiem instrukcji
sx = 0 ; sy = 7 ;
g1 = GraphPlot [ { a −> p , b −> p , b −> q , c −> s , r −> r } ,
V e r t e x C o o r d i n a t e R u l e s −> { a −> { sx , 1 } , b −> { sx + 1 , 0 } ,
c −> { sx , −1} , p −> { sy + 1 , 2 } , q −> { sy , 1 } ,
r −> { sy + 1 , 0 } , s −> { sy , −1}} ,
V e r t e x L a b e l i n g −> True , D i r e c t e d E d g e s −> True ,
S e l f L o o p S t y l e −> False , PlotRange −> {{ −2 , 1 2 } , { −4 , 4 } } ] ;
g2 = R e g i o n P l o t [ x^2 + y^2 <= 3 , {x , −2, 1 2 } , {y , −4, 4 } ,
PlotRange −> {{ −2 , 1 2 } , { −4 , 4 } } , AspectRatio −> Automatic ,
PlotStyle −> { Opacity [ 0 . 0 5 ] , Darker [ Green ] } ] ;
g3 = R e g i o n P l o t [ ( x − 7)^2 + y^2 <= 8 , {x , −2, 1 2 } , {y , −4, 4 } ,
52
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
Rysunek 2.7: Graf relacji R w X i Y
PlotRange −> {{ −2 , 1 2 } , { −4 , 4 } } , AspectRatio −> Automatic ,
PlotStyle −> { Opacity [ 0 . 0 5 ] , Blue } ] ;
g4 = Graphics [ {
Text [ S t y l e [ "X" , Darker [ Green ] , Bold , 2 4 ] , { −1 , − 2 . 5 } ] ,
Text [ S t y l e [ "Y" , Blue , Bold , 2 4 ] , { sy + 2 . 5 , − 2 . 5 } ] } ,
PlotRange −> {{ −2 , 1 2 } , { −4 , 4 } } ] ;
u = Show [ g1 , g2 , g3 , g4 ]
2.3.2
Własności relacji
Niech R ⊂ X × X będzie relacją w X.
Definicja 2.3.2 Wyróżniamy następujące własności relacji R.
• Relacja R jest zwrotna jeśli dla każdego x ∈ X zachodzi x R x.
• Relacja R jest symetryczna jeśli dla dowolnych x, y ∈ X relacja x R y implikuje relację y R x.
• Relacja R jest antysymetryczna jeśli dla dowolnych x, y ∈ X zachodzenie tak relacji x R y jak i relacji y R x jest
możliwe tylko gdy x = y.
• Relacja R jest przechodnia jeśli dla dowolnych x, y, z ∈ X zachodzenie relacji x R y i y R z implikuje zachodzenie
relacji x R z.
• Relacja R jest spójna jeśli dla dowolnych x, y ∈ X zachodzi przynajmniej jedna z relacji x R y, y R x.
Pakiet Relations umożliwia proste sprawdzanie, czy dana relacja ma powyższe własności. Wprowadzając
IsReflexive [ re ]
IsSymmetric [ r e ]
IsAntisymmetric [ re ]
IsTransitive [ re ]
IsTotal [ re ]
2.4. RELACJE RÓWNOWAŻNOŚCI
53
dowiadujemy się, że relacja zadana wzorem (2.1) jest antysymetryczna, ale pozostałych rozważanych własności nie posiada.
Ćwiczenie komputerowe 2.3.3 Dla każdej z powyższych pięciu własności podaj przykład relacji w zbiorze pięcioelementowym, która ma dokładnie tę i, o ile to możliwe, żadną inną z powyższych własności. Przykład zilustruj
rysunkiem wykresu i grafu opracowanym w programie Mathematica. Zastanów się, które z powyższych własności łatwo
sprawdzić oglądając wykres, a które oglądając graf.
Iloczyn kartezjański n zbiorów i relacje n-argumentowe.
2.3.3
Pojęcie pary można uogólnić do pojęcia n-tki (trójki, czwórki, ...) elementów. Formalną definicję n-tki podamy w rozdziale 4.7.10. Na razie przyjmiemy, że n-tka elementów to zbiór n-elementowy {a1 , a2 , . . . an }, w którym ustalono kolejność
elementów. Taką n-tkę zapisujemy (a1 , a2 , . . . an ), w którym element pierwszy umieszczamy na pierwszej pozycji, drugi na
drugiej itd. Z trzech elementów 1, 2, 3 możemy zatem utworzyć jeden zbiór trzyelementowy, choć zapisać możemy go na sześć
różnych sposobów.
{1, 2, 3} = {1, 3, 2} = {2, 1, 3} = {2, 3, 1} = {3, 1, 2} = {3, 2, 1}.
Natomiast każda z sześciu trójek
(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1)
jest inna.
Definicja 2.3.4 Definiujemy iloczyn kartezjański zbiorów X1 , X2 , . . . Xn jako
X1 × X2 × · · · × Xn :=
{ (x1 , x2 , . . . , xn ) | gdzie xi ∈ Xi dla i = 1, 2, . . . , n }.
W przypadku gdy wszystkie zbiory Xi są tym samym zbiorem X mówimy o n-tej potędze kartezjańskiej zbioru X i
używamy skrótu X n . Wygodnie jest rozszerzyć tę konwencję na n = 1 i przyjąć, że X 1 := X.
Relacją n-argumentową w zbiorach X1 , X2 , . . . Xn nazywamy dowolny podzbiór zbioru X1 × X2 × · · · × Xn .
Podobnie jak relacja dwuargumentowa wyraża zwiazek
˛
pomi˛edzy dwoma elementami, relacja n-argumentowa wyraża zwiazek
˛
pomi˛edzy n-elementami.
Gdy w j˛ezyku naturalnym chcemy wyrazić relacj˛e wieloargumentowa,˛ na przykład trójelementowa,˛ wspomagamy si˛e najcz˛eściej okolicznikami. Na przykład forma
zdaniowa ’w zaatakował x w sojuszu z y ’ zadaje relacj˛e trójargumentowa,˛ w której trzeci argument został dodany przy wykorzystaniu okolicznika ’e sojuszu z w’.
Konsekwencja˛ przyj˛ecia umowy, że X 1 = X , jest dopuszczenie relacji jednoargumentowych. W konsekwencji każdy podzbiór X stanowi pewna˛ relacj˛e
jednoargumentowa.˛ Relacje jednoargumentowe określaja˛ własności obiektów. W j˛ezyku naturalnym wyrażane sa˛ przy pomocy czasownika ’być’ z przymiotnikiem.
Na przykład forma zdaniowa ’x jest zielonooki określa własność posiadania zielonych oczu.
2.4
Relacje równoważności
Relacja równoważności dokonuje utożsamienia obiektów pod pewnym wzgl˛edem przy zachowaniu różnic pod innym wzgl˛edem. Relacja˛ równoważności jest na
przykład bycie tej samej narodowości. Dwie osoby tej samej narodowości moga˛ si˛e różnić pod wieloma wzgl˛edami, ale pod wzgl˛edem narodowości sa˛ identyczne.
W matematyce relacje równoważności służa˛ jako narz˛edzie do definiowania nowych poj˛eć. Posłużymy si˛e nimi by z liczb naturalnych skonstruować liczby
całkowite, z liczb całkowitych liczby wymierne, a z liczb wymiernych liczby rzeczywiste.
54
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
2.4.1
Relacja równoważności
Definicja 2.4.1 Relację w zbiorze X, która jest zwrotna, symetryczna i przechodnia nazywamy relacją równoważności.
Dla x ∈ X klasę
[x]R := { y ∈ X | xRy }
nazywamy klasą równoważności elementu x.
W rozdziale ... udowodnimy następujące ważne twierdzenie opisujące podstawowe własności klas równoważności.
Twierdzenie 2.4.2 Niech R będzie relacją równoważności w X. Jeśli x, y ∈ X oraz xRy, to [x]R = [y]R . Innymi słowy,
klasy równoważności równoważnych elementów są identyczne. Ponadto dla dowolnych x, y ∈ X albo [x]R = [y]R , albo
[x]R ∩ [y]R = ∅, to znaczy klasy równoważności dwóch elementów są albo równe, albo rozłączne.
Pakiet Relations.m umożliwia sprawdzenie czy relacja jest relacją równoważności. Na przykład pisząc
rR = R e l a t i o n [ { a , b , c } , { a −> a , b −> b , c −> c , a −> b , b −> a } ]
I s E q u i v a l e n c e [ rR ]
otrzymamy odpowiedź True.
2.5
Funkcje
Poj˛ecie funkcji w matematyce przeszło znaczna˛ ewolucj˛e. Pierwtonie poj˛ecie funkcji wiazano
˛
ze wzorem, który pewnej zmiennej liczbowej przypisywał nowa˛
wartość wyliczana˛ ze wzoru. Na przykład, najprostsza funkcja kwadratowa przypisuje liczbie x wartość x2 . Z czasem wymóg algebraicznego wzoru rozluźniono,
wymagajac
˛ jedynie podania jakiegokolwiek, nie koniecznie wyrażajacego
˛
si˛e wzorem, sposobu przypisania argumentowi wartości funkcji. Na przykład liczbie
naturalnej n można przypisać najwi˛eksza˛ liczb˛e naturalna˛ k , taka,˛ że 2k dzieli liczb˛e n bez reszty. Nie ma wzoru na takie k , ale można podać algorytm,
który takie k nam wyznaczy. Mianowicie dzielimy nasza˛ liczb˛e przez 2. Jeśli wynik jest liczba˛ naturalna,˛ ponownie dzielimy przez 2. Proces ten powtarzamy
aż do momentu, gdy dzielenie bez reszty nie jest już możliwe, równocześnie zliczajac
˛ dzielenia bez reszty. Otrzymana liczba dzieleń bez reszty jest szukanym
najwi˛ekszym k .
W obu tych podejściach możemy utworzyć pary łacz
˛ ac
˛ argumenty ze zbioru X w par˛e z odpowiadajacymi
˛
im wartościami ze zbioru Y . Na funkcj˛e możemy
wi˛ec patrzeć jako na zbiór par, a wi˛ec relacj˛e w zbiorach X , Y .
W pewnym momencie matematycy uznali, że za funkcj˛e można uznać zbiór par nawet wtedy gdy nie widać żadnego wzoru, czy algorytmu pozwalajacego
˛
przypisać argumentowi x ∈ X wartość y ∈ Y . Ma to w szczególności sens w przypadku zbiorów skończonych, bo aby zadać relacj˛e, wystarczy wypisać
wszystkie pary, które w relacji pozostaja.˛
Trzeba jednak wyraźnie podkreślić, że nie każda relacja może być uznana za funkcj˛e. Aby tak si˛e stało potrzebujemy dwóch własności. Pierwsza z nich to
jednolistność.
Definicja 2.5.1 Niech R ⊂ X × Y będzie relacją. Mówimy, że R jest funkcją jeżeli dla każdego x ∈ X istnieje
dokładnie jeden y ∈ Y taki, że x R y.
Pakiet Relations.m umożliwia sprawdzenie czy relacja jest funkcją. Na przykład pisząc
rR = R e l a t i o n [ { a , b , c } , {a−>c , b −> b , c −> a } ]
I s F u n c t i o n [ rR ]
otrzymamy odpowiedź True.
Na zbiór funkcji z X do Y stosujemy oznaczenie
Y X := { f | f : X → Y - funkcja z X do Y }
2.5. FUNKCJE
Przykład 2.5.2
55
1. Niech c ∈ Y . Wtedy { (x, c) | x ∈ X } jest funkcją z X do Y . Nazywamy ją funkcją stałą.
2. Relacja identycznościowa ∆X jest funkcją ∆X : X → X.
3. Relacja pełna w przestrzeni X nie jest funkcją z wyjątkiem przypadku gdy X jest pusty lub jest singletonem.
2.5.1
Obrazy i przeciwobrazy
Niech f : X → Y , A ⊂ X, B ⊂ Y . Obrazem zbioru A nazywamy
f (A) := { f (x) | x ∈ A }.
Przeciwobrazem zbioru B nazywamy
f −1 (B) := { x ∈ X | f (x) ∈ B }.
Uwaga 2.5.3 Niech f : X → Y , a A, A1 , A2 ⊂ X i B, B1 , B2 ⊂ Y będą zbiorami. Wtedy
Jeśli A1 ⊂ A2 , to f (A1 ) ⊂ f (A2 ),
Jeśli B1 ⊂ B2 , to f (A1 )f −1 (B1 ) ⊂ f −1 (B2 ),
f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ),
f
−1
f
−1
(B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ),
f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 ),
(B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ),
f (f −1 (B)) = B ∩ im f,
f −1 (f (A)) ⊃ A.
2.5.2
Injekcje, surjekcje, i bijekcje.
Funkcję f : X → Y nazywamy injekcją, jeżeli dla dowolnych x1 , x2 ∈ X równość f (x1 ) = f (x2 ) implikuje równość x1 = x2 .
Funkcję f nazywamy surjekcją, jeżeli dla dowolnego y ∈ Y istnieje x ∈ X takie, że y = f (x). Funkcję f nazywamy bijekcją
jeśli jest injekcją i surjekcją.
Twierdzenie 2.5.4 Niech f : X → Y będzie funkcją. Relacja odwrotna f −1 jest jednolistna wtedy i tylko wtedy gdy f
jest injekcją. Relacja odwrotna f −1 jest funkcją wtedy i tylko wtedy gdy f jest bijekcją.
Relację odwrotną do bijekcji nazywamy funkcją odwrotną.
Pakiet Relations.m umożliwia sprawdzenie injektywności, surjektywności i bijektywności funkcji przy pomocy metod
IsInjective, IsSurjective i IsBijective.
56
ROZDZIAŁ 2. MATEMATYKA ZBIORÓW SKOŃCZONYCH
Rozdział 3
Elementy logiki matematycznej
3.1
Program Hilberta
Przyjrzyjmy si˛e bliżej programowi Hilberta. Chcemy stworzyć j˛ezyk formalny b˛edacy
˛ opisem pewnej matematycznej rzeczywistości. Zastanówmy si˛e najpierw co
może składać si˛e na taka˛ rzeczywistość? Najlepiej zaczać
˛ od takich obiektów matematycznych, z którymi jesteśmy już oswojeni, na przykład od liczb całkowitych.
Obiektom przypisujemy pewne własności. Na przykład możemy stwierdzić, że pewna liczba całkowita z jest parzysta. Albo zauważyć, że liczba x jest mniejsza
od liczby y . Własność może dotyczyć jednego (jak w przypadku parzystości), dwóch (jak w przypadku mniejszości) lub trzech i wi˛ecej obiektów. Wiemy już, że
taka˛ własność dotyczac
˛ a˛ n obiektów określamy mianem n-argumentowej relacji. Oprócz analizowania własności obiektów, wykonujemy też pewne konstrukcje
obiektów. Na przykład dysponujac
˛ liczba˛ x możemy wziać
˛ liczb˛e do niej przeciwna˛ −x. Dysponujac
˛ liczbami x i y możemy obliczyć sum˛e x + y czy iloczyn xy .
Taka konstrukcja może wymagać dostarczenia jednego (jak w przypadku liczby przeciwnej), dwóch (jak w przypadku sumy czy iloczynu), badź
˛ trzech lub wi˛ecej
obiektów. Konstrukcj˛e nowego obiektu w oparciu o dane n obiektów określamy mianem n-argumentowej funkcji. Oprócz rozważania relacji i funkcji zazwyczaj
potrzebujemy też pewne wyróżnione obiekty o specjalnych własnościach, na przykład liczb˛e 0 i liczb˛e 1.
W j˛ezyku formalnym, który ma nasza˛ rzeczywistość opisywać, musimy zaplanować symbole, które b˛eda˛ kodować relacje, funkcje i wyróżnione obiekty. Chcemy,
by tych symboli było możliwie mało, dlatego w kodowaniu ograniczamy si˛e do pewnego niezb˛ednego minimum tak by wszystko inne co jest nam potrzebne dało
si˛e zdefiniować przy użyciu wybranego możliwie małego zestawu. Na przykład odejmowanie dwóch liczb całkowitych nie jest nam potrzebne, bo x − y można
zdefiniować jako dodawanie x + (−y), czyli dodanie x i liczby przeciwnej do y . Podobnie, trzyargumentowe dodawanie x + y + z zdefiniować można jako
dwukrotne dwuargumentowe dodawanie (x + y) + z . Wygodnie jest też dopuścić funkcje zeroargumentowe, co pozwala zrezygnować z wyróżnionych obiektów,
bo funkcja zeroargumentowa, ze wzgl˛edu na brak argumentów, zwraca zawsze ten sam wynik, który można utożsamić z wyróżnionym obiektem.
Te wyróżnione funkcje i relacje traktujemy jako poj˛ecia pierwotne teorii, która˛ b˛edziemy opisywać w j˛ezyku formalnym. W szczególności mówimy o pierwotnych
funkcjach i pierwotnych relacjach. W odniesieniu do pierwotnych funkcji cz˛esto używamy zamiennie określenia operacja z jedna˛ drobna,˛ zwyczajowa˛ różnica˛
j˛ezykowa:˛ operacje wykonujemy na obiektach, a funkcje wyliczamy dla obiektów.
3.1.1
Struktury matematyczne.
Formalny j˛ezyk sam w sobie nie niesie żadnych treści. Jest to jedynie zbiór poprawnie skonstruowanych napisów i nic wi˛ecej. Aby te napisy miały jakaś
˛ treść,
trzeba nadać znaczenie zmiennym, symbolom funkcyjnym i symbolom relacyjnym. W tym celu musimy im przypisać jakieś obiekty, funkcje i relacje z pewnej
matematycznej rzeczywistości, tak zwanej struktury matematycznej.
Przez strukturę matematyczną lub krótko strukturę rozumiemy zestaw, na który składają się:
• pewien typ interesujących nas obiektów, zwany dziedziną struktury, gwarantujący istnienie przynajmniej jednego
obiektu,
• pewien skończony zbiór relacji pomiędzy obiektami,
• pewien skończony zbiór operacji, które na obiektach można wykonywać,
• pewien skończony zbiór wyróżnionych obiektów dziedziny.
57
58
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
3.1.2
Alfabet, słowo i języki formalne.
Zastanówmy si˛e z kolei jak powinien wygladać
˛
j˛ezyk formalny. Ma on służyć formułowaniu stwierdzeń o pewnej strukturze matematycznej. Stwierdzenia powinny
przyjać
˛ form˛e napisu b˛edacego
˛
ciagiem
˛
symboli z pewnego ustalonego alfabetu. Warto zaznaczyć, że choć używamy określenia alfabet, to cz˛esto cały ciag
˛ liter
traktujemy jako oddzielny symbol. Powszechnie stosowanym przykładem sa˛ symbole funkcji trygonometrycznych: sin, cos, tg. Ta konwencja bierze si˛e stad,
˛
że matematykom ( a tym bardziej informatykom) zbiór liter j˛ezyka codziennego absolutnie nie wystarcza jako zbiór symboli. Stad
˛ stosowanie różnych rodzajów
znaków, liter opartych o różne czcionki
a, b, c, ..., A, B, C, ...,
A, B, C, ..., A, B, C, ...,
α, β, γ, ..., Γ, ∆, Λ...,
czy różnego rodzaju modyfikatorów jak daszki x̂, ŷ, ẑ . . . czy ptaszki x̌, y̌, ž . . ..
Niech Σ będzie skończonym zbiorem symboli, zwanym alfabetem.
Definicja 3.1.1
• Słowem nad Σ nazywamy dowolny skończony ciąg symboli.
• Zbiór słów nad alfabetem Σ oznaczamy Σ∗ .
• Językiem L nad Σ nazywamy pewien podzbiór zbioru słów Σ∗ .
Słowa należące do L nazywamy słowami dopuszczalnymi języka L, albo krótko formułami języka L.
Oczywiście, tylko niektóre z wszystkich możliwych napisów maja˛ jakiś sens. Dlatego, definiujac
˛ konkretny j˛ezyk musimy podać jakieś reguły, które pozwola˛
rozstrzygnać
˛ co jest, a co nie jest sensownym napisem, a wi˛ec tzw. formuła˛ j˛ezyka. Nim si˛e tym zajmiemy, przyjrzyjmy si˛e najpierw bliżej co powinno si˛e składać
na alfabet j˛ezyka formalnego. Przede wszystkim potrzebujemy odpowiednio bogatego zestawu nazw do oznaczania dowolnych obiektów dziedziny, tak zwanych
zmiennych. Zazwyczaj używamy do tego końcowych liter alfabetu x, y, z choć cz˛esto potrzebujemy znacznie wi˛ecej zmiennych, stosowane sa˛ wi˛ec też inne
konwencje, na przykład dodawanie indeksów x1 , x2 , x3 . . ., Natomiast przyda si˛e nam bardzo szeroki zbiór zmiennych opartych o różne czcionki:
Potrzebujemy też oddzielnych symboli dla wyróżnionych obiektów dziedziny, dla zestawu przyj˛etych operacji i dla zestawu przyj˛etych relacji. Ponadto potrzebujemy nawiasów i przecinka do zapisywania argumentów operacji i relacji. Taki zestaw symboli pozwala nam już na zapisanie pewnych prostych faktów dotyczacych
˛
struktury, która˛ j˛ezyk ma opisywać.
Dla przykładu rozważmy jeszcze raz struktur˛e, na która˛ składaja˛ si˛e: liczb całkowite jako dziedzina, wyróżnione liczby zero i jeden, dwuargumentowe relacje
równości i wi˛ekszości oraz dwuargumentowe operacje dodawania i mnożenia. Rozważmy j˛ezyk, w którym wyróżniona liczba zero oznaczana jest symbolem Z ,
liczba jeden symbolem ’J’, operacja dodawania symbolem D , operacja mnożenia symbolem M , relacja silnej wi˛ekszości symbolem W , a relacja równości
symbolem R. Oto prosty fakt zapisany w tym j˛ezyku
W (J, Z),
który łatwo rozszyfrujemy jako stwierdzenie, że jeden jest wi˛eksze niż zero. Używajac
˛ zwyczajowych symboli zapisujemy to jako 1 > 0. Nieco trudniej rozszyfrować
formuł˛e
R(D(D(J, J), D(J, J)), M (D(J, J), D(J, J))),
która˛ przy użyciu bardziej tradycyjnych oznaczeń zapisać można jako ((1 + 1) + (1 + 1)) = ((1 + 1) ∗ (1 + 1)), a po wprowadzeniu skrótu 2 na 1 + 1 i
pomini˛eciu zb˛ednych nawiasów jako 2 + 2 = 2 ∗ 2.
Widać, że zapisy w j˛ezyku formalnym sa˛ dla człowieka dość trudne do rozszyfrowania ze wzgl˛edu na ich złożoność nawet dla bardzo prostych faktów. By
uniknać
˛ tej złożoności przyjmuje si˛e szereg konwencji, których uczymy si˛e już od szkoły podstawowej. Taka˛ konwencja˛ jest na przykład zapisywanie operacji
i relacji dwuargumentowych przez wstawienie znaku operacji czy relacji pomi˛edzy argumenty, co pozwala pominać
˛ nawiasy. Tak wi˛ec piszemy 0 + 1 zamiast
+(0, 1) oraz 1 > 0 zamiast > (1, 0).
Inna˛ konwencja˛ jest przypisanie priorytetów symbolom funkcyjnym i relacyjnym, co też pozwala uniknać
˛ pisania wielu nawiasów. Na przykład przyjmujemy, że
mnożenie ma wi˛ekszy priorytet od dodawania co pozwala rozszyfrować zapis 1 + 1 ∗ 1 jako 1 + (1 ∗ 1), a nie jako (1 + 1) ∗ 1. Zazwyczaj przyjmujemy, że
wszystkie symbole funkcyjne maja˛ wyższy priorytet niż relacyjne.
Wreszcie, aby uprościć zapis formuły, dla cz˛esto powtarzajacych
˛
si˛e fragmentów wprowadzamy skrótowe oznacznia, na przykład 2 dla 1 + 1. Podkreślmy, że
oznaczenia takie nie sa˛ cz˛eścia˛ alfabetu j˛ezyka, a jedynie służa˛ ułatwieniu czytania skomplikowanych formuł. Jeśli chcemy zobaczyć formuł˛e j˛ezyka w jej czystej
formie, musimy konsekwentnie z niej wyrugować wszystkie skróty.
3.1. PROGRAM HILBERTA
59
W dalszym ciagu
˛ b˛edziemy cz˛esto używać raz przyj˛etych konwencji i skrótów bez uprzedzenia, zakładajac,
˛ że czytelnik je zna i jest w stanie, w razie potrzeby,
przekształcić zapis tak, by konwencji si˛e pozbyć.
Warto sobie uświadomić, że stworzenie koncepcji języka formalnego stworzyło grunt, bez którego nie powstałby współczesny komputer. Języki formalne, w takim czy innym ujęciu, stanowią podstawę programowania komputerów. W szczególności
język pakietu Mathematica jest językiem formalnym. Na szczęście, poprzez stworzenie szeregu konwencji i skrótów jest on
przyjazny użytkownikowi. Warto jednak czasem zapytać jak wygląda formuła w języku Mathematica ogołocona z konwencji
i skrótów. Pisząc
FullForm [ x + y∗ z < w ]
otrzymujemy odpowiedź
Less [ Plus [ x , Times [ y , z ] ] , w ]
która przestawia zapis fomuły x + y ∗ z < w pozbawiony konwencji i skrótów. W szczególności w, x, y, z są zmiennymi, Plus
i Times symbolami funkcyjnymi, a Less jest symbolem relacyjnym.
3.1.3
Spójniki logiczne
Wróćmy do naszej analizy alfabetu j˛ezyka. Ograniczyliśmy zestaw zakodowanych w symbolach j˛ezyka własności (relacji) do niezb˛ednego minimum. Aby móc w
j˛ezyku wyrażać takie własności jak x jest wi˛eksze lub równe od y potrzebujemy złożyć napisy x > y i x = y w jedna˛ całość przy użyciu spójnika logicznego
’lub’. W tym celu spójnik ’lub’ musimy dodać do alfabetu. Spójnik ten zwyczajowo kodujemy znakiem ∨. Dodanie tego spójnika do alfabetu pozwala na utworzenie
napisu x > y ∨ x = y . Dla wygody wprowadzamy skrót przyjmujac,
˛ że x y oznacza właśnie x > 0 ∨ x = 0.
W rozważanym przykładzie, ze wzgl˛edu na minimalistyczne podejście do zestawu poj˛eć, wśród relacji pierwotnych uwzgl˛edniliśmy tylko relacje > i =, ale
już nie <. Zauważmy jednak, że własność ’x jest mniejsze niż y ’ jest równoważna stwierdzeniu: ’niepawda, że zachodzi alternatywa x jest wi˛eksze od y lub x
jest równe y . Tak wi˛ec, aby móc zdefiniować własność mniejszości potrzebujemy jeszcze spójnika logicznego ’nieprawda, że’. Zwyczajowo kodujemy go znakiem
¬. Dodanie go do alfabetu umożliwia utworzenie napisu ¬x y , co można przyjać
˛ jako definicj˛e skrótu x < y . Zwyczajowo przyjmujemy, że spójnik ¬ ma
najwyższy priorytet ze wszystkich spójników logicznych.
Spójniki logiczne ∨ oraz ¬ nie sa˛ jedynymi jakie si˛e przydaja.˛ Aby zapisać własność x > 0 i x < 2 potrzebujemy spójnika logicznego ’i’, zapisywanego ∧.
Nie musimy go dodawać do alfabetu, bo możemy przyjać,
˛ że dla formuł ϕ oraz ψ zapis ϕ ∧ ψ jest skrótem od zapisu ¬(¬ϕ ∨ ¬ψ). Innym cz˛esto używanym
spójnikem logicznym jest ’implikuje’, zapisywany jako ’⇒’. W j˛ezyku potocznym pojawia si˛e on w wielu różnych wariantach: ’ϕ implikuje ψ ’, ’jeśli ϕ, to ψ ’, ’ψ , chyba
że nie ϕ’, przy założeniu ϕ zachodzi ψ . Choć w pierwszej chwili wydaje si˛e to zaskakujace,
˛ spójnik ’⇒’ daje si˛e wyrazić poprzez spójniki ’∨’ oraz ’¬’. Dokładniej,
zapis ϕ ⇒ ψ oznacza tyle samo, co ¬ϕ ∨ ψ , tak wi˛ec spójnik ’⇒’ również traktujemy jako skrót. Ze spójnikiem tym wiaże
˛ si˛e troch˛e nieporozumień: bywa
mylnie traktowany jako stwierdzajacy
˛ możliwość wywnioskowania ψ z ϕ. J˛ezyk formalny nie służy jednak do stwierdzeń na temat możliwości przeprowadzania
wnioskowania. Stwierdzenie ’Jeśli na narty pojechałem w Dolomity, to słoneczna pogoda była zagwarantowana’ nie oznacza, że słoneczna pogoda w Dolomitach
jest jakaś
˛ konsekwencja˛ tego, że ktoś si˛e tam wybrał na narty. Jest tylko obserwacja˛ współistnienia pewnych faktów. Współistnienia wynikajacego
˛
z tego, że
słoneczna pogoda zima˛ w Dolomitach jest cz˛esto i nie trzeba dużo szcz˛eścia, by na taka˛ trafić.
Mamy też spójnik ’jest równoważne’, zapisywany jako ⇔. Zapis ϕ ⇔ ψ oznacza tyle samo, co (ϕ ⇒ ψ) ∧ (ψ ⇒ ϕ). W j˛ezyku potocznym jest
formułowany również zwrotem ’zachodzi wtedy i tylko wtedy gdy’.
3.1.4
Kwantyfikatory
Rozważane do tej pory przykłady formuł opisuja˛ własności wyróżnionych elementów dziedziny struktury matematycznej. Dla takich formuł można sprawdzić czy
zapisuja˛ prawd˛e, czy fałsz. O takich formułach mówimy, że sa˛ zdaniami.
Używajac
˛ zmiennych, możemy konstruować formuły opisujace
˛ własności bliżej nieokreślonych elementów dziedziny. Formuły, w których wyst˛epuja˛ zmienne
nazywamy formami zdaniowymi, bo staja˛ si˛e zdaniami dopiero po podstawieniu za zmienne konkretnych elementów dziedziny. Na przykład formuła x > y jest
prawdziwa, gdy za x podstawimy 1, a za y podstawimy 0. Natomiast podstawiajac
˛ 0 za x, a 1 za y otrzymujemy fałsz.
Jest jeszcze inny sposób przekształcenia formy zdaniowej w zdanie. Rozważmy na przykład form˛e x ∗ x 0 w dziedzinie liczb całkowitych. Podstawiajac
˛
w tej formie dowolna˛ liczb˛e całkowita˛ dostajemy zdanie prawdziwe. Możemy t˛e obserwacj˛e wyrazić zdaniem: Dla każdego x zachodzi x ∗ x 0. Wyrażenie ’dla
każdego’ nazywamy kwantyfikatorem ogólnym, albo inaczej uniwersalnym. Zapisujemy go przy pomocy symbolu ∀. Jest to odwrócona litera ’A’ od angielskiego
słowa ’all’. Nasz przykład zapisujemy zatem symbolicznie jako ∀x x ∗ x 0.
60
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Ogólnie, rozważmy form˛e zdaniowa˛ ϕ, w której wyst˛epuje zmienna x, co zapisujemy ϕ(x). Stwierdzajac,
˛ że dla każdego x zachodzi ϕ(x) otrzymujemy
zdanie, które zapisujemy przy pomocy kwantyfikatora ogólnego jako ∀x ϕ(x). Jest ono prawdziwe jeśli rzeczywiście po podstawieniu za zmienna˛ x dowolnego
elementu z dziedziny otrzymujemy zdanie prawdziwe. Jeśli istnieje choć jeden element a z dziedziny, dla którego zdanie ϕ(a) jest fałszywe, to zdanie ∀x ϕ(x)
jest fałszywe.
Na przykład zdanie ∀x x > 0 jest fałszywe, bo podstawiajac
˛ za x liczb˛e całkowita˛ −1 otrzymujemy zdanie fałszywe. Natomiast zdanie ∀x x ∗ x 0, jak
już zauważyliśmy, jest prawdziwe. Należy tu podkreślić, że niestety nie jesteśmy w stanie jego prawdziwości sprawdzić podstawiajac
˛ za x po kolei wszystkie liczby
całkowite, bo jest ich nieskończenie wiele. Wierzymy, że tak jest, bo dzieje si˛e tak dla dowolnie dużego zbioru liczb całkowitych jaki jesteśmy w stanie sprawdzić.
Jesteśmy też w stanie udowodnić ten fakt. I właśnie po to jest nam potrzebny j˛ezyk formalny.
Mamy jeszcze drugi kwantyfikator. Aby si˛e z nim zaznajomić rozważmy własność parzystości liczb całkowitych. Liczba x jest parzysta jeśli x = 2y dla
pewnej innej liczby całkowitej y . To samo inaczej: liczba x jest parzysta, jeżeli istnieje y takie, że x = 2y . Zwrot ’istnieje’ określamy mianem kwantyfikatora
szegółowego, albo egzystencjalnego. Oznaczamy go symbolem ’∃’. Jest to odwrócona litera ’E’ od angielskiego słowa ’exists’. Zatem własność parzystości liczby
x można zapisać w j˛ezyku formalnym jako ∃y x = 2y .
Ogólnie, z formy zdaniowej ϕ(x) możemy utworzyć zdanie przy użyciu kwantyfikatora szczegółowego, stwierdzajac,
˛ że istnieje x dla którego zachodzi ϕ(x),
co zapisujemy jako ∃x ϕ(x). Jest ono prawdziwe jeśli da si˛e znaleźć element a dziedziny taki, że ϕ(a) jest zdaniem prawdziwym. Jeśli takiego elementu nie
ma, zdanie ∃x ϕ(x) jest fałszywe.
Na przykład zdanie ∃x x > 0 jest prawdziwe, bo 1 > 0. Natomiast zdanie ∃x x ∗ x + 1 = 0 jest fałszywe. Oczywiście fałszywe dla struktury, którego
dziedzina˛ jest zbiór liczb całkowitych, bo w zbiorze liczb zespolonych jest ono akurat prawdziwe. Pami˛etać zatem należy, że prawdziwość lub fałszywość zdania w
j˛ezyku formalnym zależy od struktury, do którego zdania j˛ezyka odnosimy.
Zauważmy, że zaprzeczenie stwierdzenia ∀x ϕ(x) możemy wyrazić przy pomocy spójnika ∃, bo jeśli nie jest prawda,˛ że dla każdego x zachodzi ϕ(x),
to istnieje x taki, że nie zachodzi ϕ(x). Zatem stwierdzenie ¬∀x ϕ(x) jest równoważne stwierdzeniu ∃x ¬ϕ(x). Podobnie zauważamy, że stwierdzenie
¬∃x ϕ(x) jest równoważne stwierdzeniu ∀x ¬ϕ(x). Stad
˛ wnosimy, że ∃x ϕ(x) jest równoważne stwierdzeniu ¬∀x ¬ϕ(x). Oznacza to, że kwantyfikator
szczegółowy ∃ można traktować jako skrót wyrażenia ¬∀x ¬ϕ(x).
3.1.5
Termy i predykaty
Jak wiemy z gramatyki, wśród cz˛eści mowy wyróżniamy w szczególności rzeczowniki, czasowniki i przymiotniki. Rzeczowniki służa˛ do nazywania obiektów.
Przymiotniki pozwalaja˛ określać własności obiektów. Czasowniki określaja˛ zależności pomi˛edzy obiektami. Zauważyliśmy już w rozdziale ..., że przymiotniki i
czasowniki możemy wrzucić do jednego worka jako cz˛eści mowy wyrażajace
˛ relacje n argumentowe (jednoargumentowe dla przymiotników, wieloargumentowe
dla czasowników).
W j˛ezyku logiki odpowiednikiem rzeczownika jest określenie term, a odpowiednikiem przymiotnika i czasownika jest określenie predykat. W pewnym uproszczeniu, termy to nazwy obiektów, którymi si˛e zajmujemy, badź
˛ zmienne, pod które możemy obiekty podstawiać. Natomiast predykaty służa˛ do wyrażania własności
termów i relacji zachodzacych
˛
pomi˛edzy termami.
3.2
Język rachunku predykatów.
Formalizacja matematyki odbywa się przy użyciu tzw. języka rachunku predykatów. Alfabet języka rachunku predykatów
jest sumą rozłączną A = L ∪ V ∪ F ∪ R ∪ I, gdzie L to zbiór spójników logicznych, V to zbiór zmiennych, F to zbiór
symboli funkcyjnych, R to zbiór symboli relacyjnych, a I zbiór symboli interpunkcyjnych. Przyjmujemy, że zbiór symboli
logicznych L obejmuje dokładnie trzy symbole: ¬, ∨ i ∀, a zbiór symboli interpunkcyjnych obejmuje parę nawiasów (, )
oraz przecinek. Ponadto zakładamy, że z każdym symbolem funkcyjnym i każdym relacyjnym związana jest liczba naturalna
lub zero, zwana argumentowością symbolu. Zbiór symboli funkcyjnych o argumentowości k oznaczać będziemy Fk , a zbiór
symboli relacyjnych o argumentowości k oznaczać będziemy Rk .
Aby zdefiniować formuły języka rachunku predykatów, czyli jego słowa dopuszczalne, zdefiniujemy najpierw termy,
odpowiadające w językach naturalnych rzeczownikom.
3.2. JĘZYK RACHUNKU PREDYKATÓW.
61
Definicja 3.2.1 Termy języka określone są przez następujące dwie reguły:
t1) Termem języka jest każda nazwa będąca zmienną.
t2) Ponadto, jeśli t1 , t2 , . . . tk są termami języka, a f jest symbolem operacji k-argumentowej, to f (t1 , t2 , . . . tk ) jest
również termem języka. Przypadek ten obejmuje w szczególności wyróżnione elementy, które utożsamiamy z
funkcjami zero-argumetnowymi.
Definicja 3.2.2 Formuły języka predykatów określone są przez następujące dwie reguły:
p1) Jeśli t1 , t2 , . . . tk dla k n są termami, a r jest symbolem relacji k-argumentowej, to r(t1 , t2 , . . . tk ) jest formułą.
Formułę taką nazywamy formułą atomową.
p2) Jeśli ϕ i ψ są formułami, to ¬(ϕ), (ϕ ∨ ψ) oraz ∀x ϕ również są formułami.
Potrzebne jest nam jeszcze pojęcie zmiennej wolnej w formule. Określają to następujące cztery reguły:
Definicja 3.2.3 w1) Zmienna jest zmienną wolną w formule atomowej f (t1 , t2 , . . . tk ) jeśli występuje ona wśród
termów t1 , t2 , . . . tn .
w2) Zmienna jest zmienną wolną w formule postaci ¬(ϕ) jeśli jest ona zmienną wolną w formule ϕ.
w3) Zmienna jest zmienną wolną w formule postaci (ϕ ∨ ψ) jeśli jest ona zmienną wolną przynajmniej w jednej z
formuł ϕ, ψ.
w4) Zmienna jest zmienną wolną w formule postaci ∀x(ϕ) jeśli jest ona zmienną wolną w formule ϕ i nie jest to
zmienna występująca bezpośrednio po znaku kwantyfikatora.
Aby zaznaczyć, że x jest zmienną wolną w formule ϕ, piszemy ϕ(x). Zbiór argumentów formuły to zbiór utworzony ze
wszystkich zmiennych wolnych tej formuły. Mówimy, że zmienna x jest zmienną związaną w formule jeśli nie jest to zmienna
wolna w tej formule. Na przykład w formule
∀x ∃y y > x + z
zmienne x i y są związane, a zmienna z jest wolna. Formułę pozbawioną zmiennych wolnych nazywamy zdaniem. Formułę,
która nie jest zdaniem nazywamy jest formą zdaniową. Formę zdaniową o niezwiązanych zmiennych x1 , x2 , . . . xn zapisujemy
często w postaci ϕ(x1 , x2 , . . . xn ).
Stosujemy również symbole ∧, ⇒, ⇔, ∃, ale traktujemy jako skróty:
ϕ∧ψ
ϕ⇒ψ
:= ¬ϕ ∨ ψ,
ϕ⇔ψ
:=
∃x ϕ(x)
3.2.1
Interpretacje.
:= ¬(¬ϕ ∨ ¬ψ),
(ϕ ⇒ ψ) ∧ (ψ ⇒ ϕ),
:= ¬∀x ¬ϕ(x).
62
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Definicja 3.2.4
• Interpretacją języka L w strukturze matematycznej A nazwiemy przypisanie λ, które z każdą
zmienną x wiąże pewien obiekt λ[x] w dziedzinie struktury A, z każdym k-argumentowym symbolem funkcyjnym f pewną k-argumentową funkcję λ[f ] w dziedzinie struktury A, a z każdym k-argumentowym symbolem
relacyjnym r pewną k-argumentową relację λ[r] w dziedzinie struktury A.
• Powiemy, że interpretacja κ jest zgodna z λ, jeśli κ i λ przypisują to samo wszystkim symbolom funkcyjnym i
relacyjnym.
• Powiemy, że interpretacja κ pokrywa się z λ poza x, jeśli κ jest zgodna z λ i przypisuje to samo wszystkim
zmiennym z wyjątkiem, co najwyżej, zmiennej x.
Przykładem może być struktura składajaca
˛ si˛e ze zbioru liczb całkowitych jako dziedziny, liczb zero i jeden jako wyróżnionych elementów dziedziny, dwuargumentowych operacji dodawania i mnożenia dwóch liczb całkowitych i jednoargumentowej operacji brania liczby przeciwnej do danej oraz dwuargumentowej
operacji silnej mniejszości liczb. Do jej opisania wystarczy j˛ezyk, w którym F0 = {0, 1}, F1 = {−}, F2 = {+, ∗}, R2 = {<}, a interpretacja przypisuje
tym symbolom ich tradycyjne znaczenia, a zmiennym jakieś liczby ze zbioru liczb całkowitych.
Zauważmy, że taki sam j˛ezyk wystarczy do opisania struktury obejmujacej
˛ liczby naturalne z zerem, liczby wymierne, czy liczby rzeczywiste. Jak zobaczymy,
różnica tkwi nie w samym j˛ezyku, ale w interpretacji. Na przykład formuła
∀x 0 < x ∨ x < 0 ⇒ ∃y x ∗ y = 1
jest spełniona przy interpretacji w zbiorze liczb wymiernych, ale nie w zbiorze liczb całkowitych. Doprecyzujemy teraz co dokładnie oznacza, że formuła jest
spełniona w pewnej interpretacji.
Interpretację rozszerzamy na termy, przyjmując, że
λ[f (t1 , t2 , . . . , tk )] := λ[f ](λ[t1 ], λ[t2 ], . . . , λ[tk ])].
Dla każdego k-argumentowego symbolu relacyjnego r i zestawu termów t1 , t2 , . . . , tk możemy postawić pytanie, czy w
dziedzinie struktury A zachodzi relacja λ[r](λ[t1 ], λ[t2 ], . . . , λ[tk ]). Możliwe odpowiedzi są tylko dwie: albo relacja ta zachodzi,
albo nie zachodzi. Wygodnie jest to kodować w zbiorze wartości logicznych B := {0, 1} poprzez rozszerzenie interpretacji λ
na formuły atomowe według wzoru.
(
1 gdy λ[r](λ[t1 ], λ[t2 ], . . . , λ[tk ])] zachodzi,
λ[r(t1 , t2 , . . . , tk )] :=
0 gdy λ[r](λ[t1 ], λ[t2 ], . . . , λ[tk ])] nie zachodzi.
Zróbmy jeszcze jeden krok dalej i rozszerzmy interpretację λ na dowolne formuły przyjmując:
λ[¬ϕ]
:=
λ[ϕ ∨ ψ]
:=
λ[∀x ϕ]
1 − λ[ϕ],
max(λ[ϕ], λ[ψ]),
(
1 gdy κ[ϕ] = 1 dla dowolnej interpretacji κ pokrywającej się z λ poza x,
:=
0 w przeciwnym razie.
Liczbę λ[ϕ] określać będziemy wartością logiczną formuły ϕ przy interpretacji λ.
Definicja 3.2.5 Będziemy mówili, że formuła ϕ przy interpretacji λ jest spełniona, jeśli λ[ϕ] = 1. W przeciwnym
razie będziemy mówili, że formuła nie jest spełniona.
Zatem zgodnie z przyjętym przez nas rozszerzeniem, formuła ¬ϕ jest spełniona przy interpretacji λ wtedy i tylko
wtedy, gdy formuła ϕ nie jest spełniona. Podobnie, formuła ϕ ∨ ψ jest spełniona przy interpretacji λ wtedy i tylko wtedy,
3.2. JĘZYK RACHUNKU PREDYKATÓW.
63
gdy przynajmniej jedna z formuł ϕ, ψ jest spełniona. Z kolei formuła ∀x ϕ jest spełniona przy interpretacji λ wtedy i
tylko wtedy, gdy formuła ϕ jest spełniona dla każdej interpretacji, która zmiennej x przypisuje dowolny obiekt z dziedziny
struktury A, a pozostałym zmiennym i wszytkim symbolom relacyjnym i funkcyjnym to samo co interpretacja λ. Obserwacje
te pokazują, że przyjęta przez nas interpretacja formuł nadaje symbolom ¬, ∨, ∀ znaczenie zgodne odpowiednio ze zwrotami
"nieprawda, że", "albo", "dla każdego" z języka potocznego.
Metatwierdzenie 3.2.6 Wartość logiczną formuł ¬ϕ, ϕ ∨ ψ, ϕ ∧ ψ, ϕ ⇒ ψ, ϕ ⇔ ψ przy interpretacji λ można
wyznaczyć w oparciu o wartości logiczne formuł ϕ i ψ przy interpretacji λ zgodnie z tabelą
ϕ
ψ
¬ϕ
ϕ∨ψ
ϕ∧ψ
ϕ⇒ψ
ϕ⇔ψ
0
0
1
0
0
1
1
1
0
0
1
0
0
0
0
1
1
1
1
0
1
0
1
1
1
1
(3.1)
Dowód: Dwa pierwsze wiersze powyższej tabeli otrzymujemy natychmiast podstawiając zera i jedynki do wzorów ... .
Pozostałe wiersze otrzymujemy prostym rachunkiem w podobny sposób.
Łatwo zauważyć, że przy pewnych interpretacjach ta sama formuła raz jest spełniona, a raz nie jest. Na przykład, rozważmy formuł˛e
∀x x + 1 > y.
Wyst˛epuje w niej dokładnie jedna zmienna wolna, mianowicie y . Rozważmy interpretacj˛e w strukturze liczb naturalnych {1, 2, 3, . . .} z relacja˛ wi˛ekszości w roli
> oraz operacja˛ dodawania w roli +, która zmiennej y przypisuje liczb˛e 5. Nie jest prawda,˛ że formuła x + 1 > 5 jest spełniona dla dowolnej liczby naturalnej x,
bo na przykład nie jest spełniona przy przypisaniu zmiennej x liczby 3. Jednak formuła ta jest spełniona przy przypisaniu zmiennej y liczby 1. Rzeczywiście, dla
dowolnej liczby naturalnej x zachodzi x + 1 > 1. Łatwo sprawdzić, że jest to jedyna liczba naturalna, która przypisana do y spełnia nasza˛ formuł˛e w dziedzinie
liczb naturalnych. Natomiast przy interpretacji w strukturze liczb całkowitych nie znajdziemy żadnego przypisania zmiennej y liczby całkowitej, dla którego formuła
∀x x + 1 > y byłaby spełniona.
Definicja 3.2.7
• Formułę ϕ nazywamy semantycznie prawdziwą w interpretacji λ, jeśli jest spełniona przy każdej
interpretacji κ zgodnej z λ.
• Formułę ϕ nazywamy semantycznie fałszywą w interpretacji λ, jeśli formuła ¬ϕ jest semantycznie prawdziwa w
interpretacji λ.
Zauważmy, że formuła, która nie jest semantycznie prawdziwa w interpretacji λ nie musi być logicznie fałszywa w tej
interpretacji. Na przykład nie jest semantycznie prawdziwa formuła
x>5
dla interpretacji λ przypisującej symbolowi > relację większości w dziedzinie liczb naturalnych, bo nie jest ona spełniona
przy interpretacji κ zgodnej z λ, przypisującej zmiennej x liczbę 3. Zaprzeczenie tej formuły przy interpretacji λ też nie jest
semantycznie prawdziwe, bo nie jest spełnione przy interpretacji przypisującej zmiennej x liczbę 8.
Jeśli formuła jest zdaniem, to przy zadanej interpretacji musi być albo semantycznie prawdziwa, albo semantycznie
fałszywa. Jest tak, bo w zdaniu nie ma zmiennych wolnych, a więc przypisanie obiektów zmiennym nie wpływa na spełnialność
zdania. Zatem każde zdanie przy zadanej interpretacji jest semantycznie rozstrzygalne przy tej interpretacji.
Definicja 3.2.8 Formułę nazywamy tautologią rachunku predykatów, jeśli jest semantycznie prawdziwa przy wszystkich interpretacjach. Mówimy też wtedy, że formuła jest logicznie prawdziwa.
64
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Natomiast, jeśli formuła ¬ϕ jest logicznie prawdziwa, to formułę ϕ nazywamy logicznie fałszywą. Podobnie jak w przypadku semantycznej prawdziwości, formuła, która nie jest logicznie prawdziwa nie musi być logicznie fałszywa. Może bowiem
być przy pewnych interpretacjach, a przy innych być fałszywa. W przeciwieństwie do semantycznej prawdziwości/fałszywości
dotyczny to również zdań. Na przykład zdanie
∀x x 1
nie jest ani logicznie prawdziwe, ani logicznie fałszywe, bo jest semantycznie prawdziwe przy interpretacji jako relacja
’większe lub równe’ w dziedzinie liczba naturalnych, ale nie jest semantycznie prawdziwe przy interpretacji jako relacja
’większe lub równe’ w dziedzinie liczb całkowitych.
Tautologie rachunku predykatów są podstawą wszelkich matematycznych rozumowań. Niestety, nie ma automatycznej
metody rozstrzygania co jest, a co nie jest tautologią rachunku predykatów. Każda tautologia rachunku predykatów wymaga
podania oddzielnie dla niej opracowanego uzasadnienia. Można to robić na poziomie metajęzyka, podając metadowód,
odwołujący się do pojęcia interpretacji. Przykłady takich metadowodów podamy w rozdziale .... . Można to też robić na
poziomie samego języka, podając dowody formalne, o czym porozmawiamy w rozdziale .... .
Jest jednak pewna szczególna rodzina formuł, dla której jest możliwe automatyczne rozstrzygnięcie, czy formuła jest
tautologią. Zajmiemy się nimi najpierw.
3.3
Rachunek zdań
Niech ϕ będzie zdaniem języka L. Mówimy, że zdanie to jest złożone, jeśli ma postać ¬ψ lub ψ ∨ χ (ewentualnie ψ ∧ χ,
ψ ⇒ χ, ψ ⇔ χ, jeśli spójników tych nie traktujemy jako skróty). Łatwo zauważyć, że wtedy ψ i χ też są zdaniami. Zdania ψ,
χ nazywamy składnikami podstawowymi zdania ϕ. Składnik zdania φ definiujemy poprzez następujące dwie reguły: składnik
podstawowy jest składnikiem oraz składnik składnika jest składnikiem. Zdanie, które nie jest zdaniem złożonym nazywamy
zdaniem prostym. Składnik zdania ϕ, który jest zdaniem prostym nazywamy składnikiem prostym zdania φ.
Zdanie proste albo ma postać r(t1 , t2 , . . . , tk ), gdzie r jest symbolem relacyjnym k-argumentowym, a t1 , t2 , . . . , tk są
termami pozbawionymi zmiennych, albo ma postać ∀x ψ(x) (ewentualnie ∃x ψ(x), jeśli kwantyfikator ∃ nie jest traktowany
jako skrót).
W zdaniu złożonym kwantyfikatory, symbole relacyjne i termy, w szczególności zmienne, schowane są w jego składnikach
prostych. Ze wzorów ... wynika, że wartość logiczną zdania ϕ przy zadanej interpretacji λ można obliczyć, jeśli znane są
wartości logiczne jego składników prostych przy tej interpretacji. Obserwacja ta prowadzi do następującej koncepcji rachunku
zdań.
Definicja 3.3.1 Formułę nazywamy formułą rachunku zdań, jeśli nie ma w niej zmiennych, ani symboli funkcyjnych.
Łatwo zauważyć, że wtedy nie ma w niej również symboli kwantyfikatorów, a jedynymi symbolami relacyjnymi są symbole
relacyjne zeroargumentowe.
Definicja 3.3.2 Język rachunku zdań to przypadek szczególny języka rachunku predykatów, który obejmuje wyłącznie
formuły rachunku zdań.
Przede wszystkim zauważmy, że formuła rachunku zdań zawsze jest zdaniem, a jego składniki proste są symbolami
relacyjnymi zeroargumentowymi. W przpadku formuły rachunku zdań jej składniki proste określać będziemy też mianem
zmiennych zdaniowych, bo ich interpretacja pozostaje bez związku z interpretacją zwykłych zmiennych.
Tautologią rachunku zdań lub krótko tautologią nazywamy formułę rachunku zdań, która jest tautologią.
Stwierdzenie, czy dana formuła rachunku zdań jest tautologią może być wykonane automatycznym rachunkiem. Przyjmijmy, że formuła ϕ rachunku zdań ma k składników prostych (zmiennych zdaniowych). Każda z tych zmiennych zdaniowych
może przyjąć jedną z dwóch wartości logicznych. Łącznie mamy zatem 2k możliwych konfiguracji wartości tych zmiennych.
Jak zauważyliśmy, wartość logiczna formuły rachunku zdań może być wyliczona z wartości logicznej jej składników prostych.
3.4. TAUTOLOGIE RACHUNKU PREDYKATÓW
Prawo tożsamości:
Prawa przemienności:
Prawa łączności:
Prawa rozdzielności:
Prawa idempotentności:
Prawo wyłączonego środka:
Prawo podwójnej negacji:
Prawa De Morgana:
Prawo kontrapozycji:
Prawo sylogizmu:
Prawa pochłaniania:
Prawo odrywania:
65
α⇔α
α∨β⇔β∨α
α∧β⇔β∧α
(α ⇔ β) ⇔ (β ⇔ α)
(α ∨ β) ∨ γ ⇔ α ∨ (β ∨ γ)
(α ∧ β) ∧ γ ⇔ α ∧ (β ∧ γ)
(α ∨ β) ∧ γ ⇔ (α ∧ γ) ∨ (β ∧ γ)
(α ∧ β) ∨ γ ⇔ (α ∨ γ) ∧ (β ∨ γ)
α∨α⇔α
α∧α⇔α
α ∨ ¬α
¬¬α ⇔ α
¬(α ∨ β) ⇔ ¬α ∧ ¬β
¬(α ∧ β) ⇔ ¬α ∨ ¬β
α ⇒ β ⇔ ¬β ⇒ ¬α
(α ⇒ β) ∧ (β ⇒ γ) ⇒ (α ⇒ γ)
α ∧ (α ∨ β) ⇔ α
α ∨ (α ∧ β) ⇔ α
α ∧ (α ⇒ β) ⇒ β
Tabela 3.1: Wybrane tautologie rachunku zdań
Wystarczy zatem wyliczyć tę wartość dla wszystkich 2k możliwych konfiguracji. Jeśli w każdym przypadku otrzymamy wartość 1, to formuła ϕ jest tautologią rachunku zdań.
W ten sposób łatwo można udowodnić następujące twierdzenie:
Metatwierdzenie 3.3.3 Formy rachunku zdań w tabeli 3.1 są tautologiami.
Tautologie rachunku zdań sa˛ nieocenione w rozumowaniach. Można si˛e do nich odwołać zawsze, bez wzgl˛edu na to jakie konkretnie zdania podstawimy za
zmienne zdaniowe.
Łatwo sprawdzić, że podstawiając w formule rachunku zdań za zmienne zdaniowe formuły języka predykatów dostajemy
formułę języka predykatów. Mamy następujące twierdzenie.
Twierdzenie 3.3.4 Niech ϕ będzie tautologią rachunku zdań. Niech α1 , α2 , . . . , αk będą wszystkimi, parami różnymi
zmiennymi zdaniowymi tej tautologii. Dobierając do każdego αi pewną formułę rachunku predykatów ψi i podstawiając
wszędzie w formule ϕ formułę ψi za zmienną αi otrzymujemy tautologię rachunku predykatów.
Dowód: Niech ϕ0 będzie formułą otrzymaną z ϕ po podstawieniach i niech λ będzie ustaloną interpretacją. Niech λ0
oznacza interpretację, która zmiennej zdaniowej αi przypisuje wartość λ[ψi ]. Łatwo sprawdzić, że λ[ϕ0 ] = λ0 [ϕ]. Ale λ0 [ϕ] = 1,
ϕ jest tautologią. Zatem λ[ϕ0 ] = 1 dla dowolnej interpretacji λ, co dowodzi, że również ϕ0 jest tautologią.
3.4
Tautologie rachunku predykatów
Jak już wspomnieliśmy, w przypadku formuły rachunku predykatów nie ma mechanicznego sposobu sprawdzenia, czy jest
ona tautologią. Przyjrzymy się teraz kilku najważniejszym tautologiom rachunku predykatów i podamy dla wybranych
dowody na poziomie metajęzyka.
66
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Metatwierdzenie 3.4.1 Niech ϕ(x) będzie formułą, w której zmienna x jest wolna, a zmienna y nie występuje. Niech
ϕ(y) oznacza formułę otrzymaną z ϕ przez podstawienie zmiennej y za zmienną x wszędzie tam gdzie x występuje jako
zmienna wolna. Następujące formuły są tautologiami rachunku predykatów.
∀x ϕ(x) ⇔
∀y ϕ(y),
(3.2)
∃x ϕ(x) ⇔
∃y ϕ(y),
(3.3)
∀x ϕ(x) ⇒ ϕ(y).
(3.4)
Dowód: ...
Metatwierdzenie 3.4.2 Niech ϕ będzie formułą o zmiennej wolnej x. Następujące formuły są tautologiami rachunku
predykatów.
∀x ϕ(x) ⇔
∃x ϕ(x),
¬∀x ϕ(x) ⇔
∃x ¬ϕ(x),
¬∃x ϕ(x) ⇔
∀x ¬ϕ(x).
Metatwierdzenie 3.4.3 Niech ϕ, ψ będą formułami o zmiennej wolnej x. Następujące formuły są tautologiami rachunku predykatów.
∀x ϕ(x) ∧ ψ(x) ⇔
∀x ϕ(x) ∧ ∀x ψ(x),
∃x ϕ(x) ∨ ψ(x) ⇔
∃x ϕ(x) ∨ ∃x ψ(x),
∀x ϕ(x) ∨ ∀x ψ(x) ⇒
∃x ϕ(x) ∧ ψ(x) ⇒
∀x ϕ(x) ∨ ψ(x),
∃x ϕ(x) ∧ ∃x ψ(x).
Ponadto, w ostatnich dwóch formułach symbolu implikacji nie można zastąpić symbolem równoważności.
Metatwierdzenie 3.4.4 Niech ϕ będzie formułą o zmiennych wolnych x i y. Następujące formuły są tautologiami
rachunku predykatów.
∀x ∀y ϕ(x, y) ⇔
∀y ∀x ϕ(x, y),
∃x ∃y ϕ(x, y) ⇔
∃y ∃x ϕ(x, y),
∃x ∀y ϕ(x, y) ⇒
∀y ∃x ϕ(x, y).
Ponadto, w ostatniej formule symbolu implikacji nie można zastąpić symbolem równoważności.
Metatwierdzenie 3.4.5 Niech ϕ będzie formułą o zmiennej wolnej x, a ψ formułą, w której x nie występuje. Następujące formuły są tautologiami rachunku predykatów.
∀x (ϕ(x) ∧ ψ) ⇔ (∀x ϕ(x)) ∧ ψ,
∃x (ϕ(x) ∨ ψ) ⇔ (∃x ϕ(x)) ∨ ψ,
∀x (ϕ(x) ∨ ψ)
⇔ (∀x ϕ(x)) ∨ ψ,
∃x (ϕ(x) ∧ ψ)
⇔ (∃x ϕ(x)) ∧ ψ.
3.5. KONSEKWENCJA I DOWÓD FORMALNY
3.5
67
Konsekwencja i dowód formalny
Niech Φ będzie pewnym skończonym zbiorem formuł języka L. Mówimy, że formuła ψ jest konsekwencją semantyczną
zbioru Φ jeśli dla każdej interpretacji λ jeśli λ[φ] = 1 dla wszystkich φ ∈ Φ, to również λ[ψ] = 1. Fakt, że formuła ψ jest
konsekwencją semantyczną zbioru Φ zapisujemy jako Φ |= ψ.
Konsekwencji semantycznej nie jesteśmy w stanie sprawdzić w praktyce, bo wymaga to przeanalizowania nieskończonej
liczby interpretacji. Dlatego interesuje nas alternatywny, skończony sposób weryfikowania zachodzenia konsekwencji. W tym
celu zdefiniujemy konsekwencję syntaktyczną.
Niech ϕ, ψ będą dowolnymi formułami. Przyjmujemy następujące dwie reguły dowodzenia:
Reguła odrywania: Formuła ψ wynika z formuł ϕ i ϕ ⇒ ψ.
Reguła uogólniania: Formuła ∀x ϕ wynika z formuły ϕ poprzez generalizację względem zmiennej x
Wynikanie na mocy reguł dowodzenia określamy też mianem bezpośredniej konsekwencji.
Definicja 3.5.1 Dedukcją lub wywodem ψ z Φ nazywamy ciąg formuł ψ1 , ψ2 , . . . ψn taki, że ψn = ψ oraz każda formuła
ψk dla k = 1, 2, . . . n spełnia jeden z poniższych trzech warunków:
1) ψk ∈ Φ,
2) istnieją i, j < k takie, że ψk wynika z formuł ψi , ψj na mocy reguły odrywania,
3) istnieje i < k takie, że ψk wynika z formuły ψi na mocy reguły uogólniania poprzez generalizację względem
zmiennej, która nie jest zmienną wolną w żadnej formule należącej do Φ.
Ustalmy pewien zbiór formuł A, który nazywać będziemy zbiorem aksjomatów. Dedukcją lub wywodem ψ z Φ w oparciu
o aksjomaty z A nazywamy wywód ψ z Φ ∪ A. W tym kontekście elementy Φ nazywamy przesłankami wywodu.
Warto wyjaśnić, czemu przesłanki odróżniamy od aksjomatów. Od aksjomatów oczekujemy, by były semantycznie prawdziwe w pewnej interpretacji. Od przesłanek tego nie oczekujemy. Jak zobaczymy, przesłanki stanowia˛ wygodnie narz˛edzie pomocnicze w rozumowaniach, ale w ostatecznym rozrachunku interesuja˛
nas wywosy nie wykorzystujace
˛ przesłanek.
Jeśli istnieje dedukcja ψ z ϕ w oparciu o aksjomaty z A to mówimy, że ψ jest syntaktyczną konsekwencją Φ i piszemy
Φ `A ψ lub krótko Φ ` ψ gdy zbiór aksjomatów A jest znany z kontekstu.
W dalszym ciągu zakładamy, że zbiór aksjomatów A obejmuje wszystkie formuły podpadające pod następujące schematy,
w których ϕ, ψ, χ są formułami języka L:
(A1) ϕ ∨ ϕ ⇒ ϕ,
(A2) ϕ ⇒ ϕ ∨ ψ,
(A3) ϕ ∨ ψ ⇒ ψ ∨ ϕ,
(A4) (ϕ ⇒ ψ) ⇒ (χ ∨ ϕ ⇒ χ ∨ ψ),
(A5) (∀x ϕ(x)) ⇒ ϕ(y),
(A6) ∀x (ϕ ⇒ ψ) ⇒ (ϕ ⇒ ∀x ψ(x)),
przy czym zakładamy, że w (A8) x nie jest zmienną wolną w ϕ.
68
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Definicja 3.5.2
• Jeśli ψ ma dedukcję z samych aksjomatów, to znaczy ∅ ` ψ to piszemy krótko `ψ i mówimy,
że ψ jest twierdzeniem teorii opartej o aksjomaty ze zbioru A.
• Jeśli A obejmuje wyłącznie formuły ze schematów (A1) − (A6) to mówimy, że ψ jest twierdzeniem rachunku
predykatów.
Metatwierdzenie 3.5.3 (o dedukcji). Syntaktyczna konsekwencja Φ ` ϕ ⇒ ψ zachodzi wtedy i tylko wtedy gdy Φ ∪
{ϕ} ` ψ.
Zbiór formuł Φ nazywamy sprzecznym, jeżeli dla pewnej formuły χ jest Φ ` χ ∧ ¬χ.
Jak pokazuje poniższe metatwierdzenie, ze sprzecznego zbioru formuł można wydedukować dowolną formułę.
Metatwierdzenie 3.5.4 (o sprzeczności) Jeśli Φ jest sprzeczny, to dla dowolnej formuły χ jest Φ ` χ.
Tym niemniej pojęcie sprzecznego zbioru formuł jest użyteczne w dowodzeniu.
Metatwierdzenie 3.5.5 (o dedukcji nie wprost). Syntaktyczna konsekwencja Φ ` ψ zachodzi wtedy i tylko wtedy gdy
Φ ∪ {¬ψ} jest sprzeczny.
Metatwierdzenie 3.5.6 ( o dedukcji koniunkcji) Jeśli Φ ` ψ1 i Φ ` ψ2 to Φ ` ψ1 ∧ ψ2
Dowód: Zdanie ψ1 ∧ψ2 ⇔¬(ψ1 ⇒¬ψ2 ) jest tautologią wystarczy więc pokazać, że Φ`¬(ψ1 ⇒¬ψ2 ). Na mocy twierdzenia
o dedukcji nie wprost wystarczy pokazać, że Φ0 := Φ ∪ {ψ1 ⇒ ¬ψ2 } jest sprzeczny. Z założenia wiemy, że ψ1 oraz ψ2 mają
wywód z Φ. Wypisujemy te wywody jeden po drugim i na końcu dopisujemy
ψ1 ⇒ ¬ψ2 , ¬ψ2 ,
co pokazuje, że Φ0 ` ¬ψ2 . Oczywiście Φ0 ` ψ2 . Zatem Φ0 jest sprzeczny.
Metatwierdzenie 3.5.7 ( o dedukcji przez przypadki) Jeśli Φ ∪ {ϕ} ` ψ i Φ ∪ {¬ϕ} ` ψ to Φ ` ψ.
Dowód: Na mocy twierdzenia o dedukcji Φ ` ϕ ⇒ ψ oraz Φ ` ¬ϕ ⇒ ψ. Na mocy twierdzenia o dedukcji koniunkcji
Φ ` ϕ ⇒ ψ ∧ ¬ϕ ⇒ ψ. Wykorzystując tautologię
(ϕ ⇒ ψ ∧ ¬ϕ ⇒ ψ) ⇒ ψ
otrzymujemy Φ ⇒ ψ.
Następujące ważne metatwierdzenie, pochodzące od K. Gödela, pozostawimy bez dowodu.
Metatwierdzenie 3.5.8 (o pełności rachunku predykatów, K. Gödel, 1930) Dla dowolnego zbioru formuł Φ i formuły ψ formuła ψ jest semantyczną konsekwencją Φ wtedy i tylko wtedy gdy ψ jest syntaktyczną konsekwencją Φ.
W szczególności formuła jest twierdzdeniem rachunku predykatów wtedy i tylko wtedy gdy jest tautologią rachunku
predykatów.
3.6. TEORIE AKSJOMATYCZNE
69
Rysunek 3.1: Giuseppe Peano, 1858-1932. Źródło: Wikipedia
Metatwierdzenie 3.5.9 ( o nazywaniu istniejących obiektów ) Niech ϕ(u) i ψ(u) będą formułami o zmiennej wolnej
u Jeśli ϕ(u) ` ψ(u) i `∃u ϕ(u) to `∃u ϕ(u) ∧ ψ(u).
Dowód: Na mocy twierdzenia o dedukcji mamy `ϕ(u) ⇒ ψ(u). Ponieważ zbiór przesłanek jest pusty, więc w oparciu
o regułę uogólniania mamy też `∀u ϕ(u) ⇒ ψ(u) co jest równoważne `∀u ¬ϕ(u) ∨ ψ(u). Dowodząc nie wprost formułę
∃u ϕ(u) ∧ ψ(u), mamy ∀u ¬ϕ(u) ∨ ¬ψ(u). Zatem ∀u (¬ϕ(u) ∨ ¬ψ(u)) ∧ (¬ϕ(u) ∨ ψ(u)). Wykorzystując rozdzielność koniunkcji
względem alternatywy otrzymujemy ∀u ¬ϕ(u) ∧ ¬ϕ(u) ∨ ¬ϕ(u) ∧ ψ(u) ∨ ¬ψ(u) ∧ ¬ϕ(u) ∨ ¬ψ(u) ∧ ψ(u)). Stąd wnosimy, że
∀u ¬ϕ(u), czyli z praw de Morgana ¬∃u ϕ(u) co przeczy przyjętemu założeniu.
3.6
Teorie aksjomatyczne
Wiele matematycznych rozważań można sformalizować w oparciu o rachunek predykatów wzbogacony o dodatkowe, pozalogiczne aksjomaty, charakterystyczne dla rozważanej teorii.
Przykład 3.6.1 Jako pierwszy przykład rozważmy teorię identyczności, która sama w sobie nie jest bardzo ciekawa,
ale jest potrzebna praktycznie w każdej innej teorii, choć akurat, jak zobaczymy, w teorii mnogości identyczność
nie musi być pojęciem pierwotnym, ale można ją zdefiniować. Do opisania teorii identyczności przyjmuje się jeden
wyróżniony symbol relacyjny =∈ R2 natomiast dopuszcza się dowolne inne symbole relacyjne i dowolne symbole
funkcyjne. Przyjmuje się następujące aksjomaty
I1) ∀x x = x,
I2) ∀x∀x x = y ⇒ y = x,
I3) ∀x∀x∀z x = y ∧ y = z ⇒ x = z.
I4) dla każdego symbolu funcyjnego f ∈ Fn i dla każdego i = 1, 2, . . . n
ti = t0i ⇒ f (t1 , . . . , ti−1 , ti , ti+1 , . . . , tn ) = f (t1 , . . . , ti−1 , t0i , ti+1 , . . . , tn )
I5) dla każdego symbolu relacyjnego r ∈ Fn różnego od symbolu równości i dla każdego i = 1, 2, . . . n
ti = t0i ⇒ (r(t1 , . . . , ti−1 , ti , ti+1 , . . . , tn ) ⇔ r(t1 , . . . , ti−1 , t0i , ti+1 , . . . , tn )) .
70
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Przykład 3.6.2 Jako drugi przykład podajmy formalizację liczb naturalnych z zerem, pochodzącą od włoskiego
matematyka Giuseppe Peano (rys. 3.1). Do jej opisania wystarcza język z jednym symbolem relacyjnym =∈ R2 ,
z jednym symbolem funkcyjnym zeroargumentowym 0 ∈ F0 interpretowanym jako liczba zero i jednym symbolem
jednooargumentowym 0 ∈ F1 interpretowanym jako operacja wzięcia kolejnej liczby naturalnej. Peano wykazał, że
arytmetykę liczb naturalnych można opisać w takim języku, przyjmując, obok aksjomatów teorii identyczności dla
symbolu = zestaw aksjomatów
• ∀n ¬(n0 = 0),
• ∀n∀m n0 = m0 ⇒ n = m,
• dla każdej formuły ϕ zachodzi
(ϕ(0) ∧ ∀n ϕ(n) ⇒ ϕ(n0 )) ⇒ ∀n ϕ(n)
Na podstawie tych aksjomatów w szczególności można zdefiniować operacje dodawania, mnożenia i porównywania
liczb naturalnych i udowodnić ich własności.
Dowodem formuły w teorii aksjomatycznej jest jej dedukcja ze zbioru aksjomatów. Formułę posiadającą dowód nazywa
się twierdzeniem tej teorii. Teorię nazywa się niesprzeczną, jeżeli jej zbiór aksjomatów jest niesprzeczny. Teorię nazywa się
zupełną, jeśli dla każdego zdania tej teorii albo ono albo jego zaprzeczenie jest twierdzeniem tej teorii.
Program Hilberta zakładał, że po sformalizowaniu kluczowych teorii matematycznych uda się przeprowadzić dowody
ich niesprzeczności i zupełności w oparciu o samą analizę metamatematyczną formalnego języka te teorie opisującego. Są
dwie metody dowodzenia niesprzeczności: metamatematyczna, poprzez czysto formalną analizę języka opisującego teorię,
której niesprzeczność chcemy udowodnić oraz semantyczna, w której konstruujemy model dla teorii, której niesprzeczność
dowodzimy na gruncie innej, prostszej teorii, której niesprzeczność zakładamy. Ten drugi sposób jest relatywny: niesprzeczność jakiejś teorii, możliwie najprostszej, musimy założyć. W 1930 roku Kurt Gödel pokazał, że metamatematyczny dowód
niesprzeczności teorii matematycznej dostatecznie bogatej, by zawierać arytmetykę liczb naturalnych może być przeprowadzony jedynie na gruncie teorii bogatszej od tej, której niesprzeczność chcemy udowodnić. Jest to jeszcze gorsze od dowodu
relatywnego.
Co więcej, Gödel pokazał też, że każda sformalizowana teoria matematyczna dostatecznie bogata by zawierać arytmetykę
liczb naturalnych, jeśli jest niesprzeczna, to jest niezupełna. Te dwa twierdzenia Gödla spowodowały, że plan Hilberta
okazał się nie do zrealizowania w skali o jakiej Hilbert marzył. Tym niemniej, formalizacja teorii matematycznych została
przez matematyków zaakceptowana jako najlepszy sposób unikania paradoksów. Co więcej, dowodzenie niesprzeczności
matematycznych teorii poprzez konstrukcje modelu w teorii prostszej sprawiło, że dziś praktycznie cała matematyka została
osadzona na gruncie teorii mnogości, jako tej najbardziej elementarnej teorii matematycznej.
3.7
Formalizm w praktyce matematycznej.
Jedynie dowód formalny daje nam pewność, że formuła, którą udowodniliśmy rzeczywiście jest twierdzeniem. Z drugiej strony
dowód formalny, nawet jeśli zawiera komentarz wyjaśniający co z czego wynika, jest na ogół długi, męczący w czytaniu
i najczęściej nie pozwala zrozumieć jak został wymyślony, a w konsekwencji nie sprzyja budowaniu intuicji związanych
z dowodzonym twierdzeniem. Matematyk wprawny w konstruowaniu dowodów często woli wymyślić dowód własny niż
zrozumieć czyjś dowód zapisany czysto formalnie.
Dlatego zazwyczaj dowody w literaturze matematycznej są swego rodzaju kompromisem pomiędzy formalizmem i czytelnością. To, którędy przebiega kompromis zależy od przygotowania czytelnika, do którego adresowany jest tekst. Typowy
zapis dowodu jest raczej mniej lub bardziej szczegółowym szkicem, jak uzyskać dowód formalny. Szkic jednak powinien być
na tyle precyzyjny, by czytelnik w oparciu o swoje doświadczenie mógł bez problemu uzupełnić brakujące szczegóły.
Jak wspominaliśmy, matematycy stosują mnóstwo sztuczek, by mieć do dyspozycji bardzo dużo różnych symboli, a w
konsewkencji dużo różnych zmiennych. Choć teoretycznie może być on dowolnie duży (na przykład można dodać dowolnie
dużo ptaszków), w praktyce i tak jest on zbyt mały, by uniknąć kolizji. Dlatego wygodnie jest operować pojęciem zakresu
3.8. SCHEMATY DOWODOWE.
71
występowania zmiennej. Przyjmujemy, że zakresem występowania zmiennej związanej jest najmniejsza podformuła formuły,
której związanie dotyczy. W przypadku zmiennej wolnej zakres jej występowania będziemy rozpoczynać zwrotem "Niech
x będzie takie, że ..." lub x := ... czytane "Zdefiniujmy x jako ..." lub jakimś zwrotem o tym samym znaczeniu. Zakres
występowania takiej nazwy obejmuje wszsytkie formuły od użycia tego zwrotu aż do ponownego użycia tego zwrotu, które
to rozpoczyna nowy zakres. Teoretycznie, wymieniając zmienne w różnych zakresach na nowe tak by nie było powtórzeń,
możemy się pozbyć powtarzających się zmiennych o różnych znaczeniach.
Aby uniknąć powtarzania ciągle tych samych formuł, wprowadza się do tekstu matematycznego definicje. Od strony
formalnej definicje to tylko skróty. Do definiowania używać będziemy symbolu :⇔ lub ⇔ :, w którym po stronie dwukropka
umieszczać będziemy to co definiujemy, a po stronie drugiej to jak definiujemy. Od strony praktycznej dobrze dobrane
definicje są nieocenione, bo sprzyjają budowaniu stosownych intuicji.
W następnych rozdziałach przedstawimy w miarę formalnie zarys teorii mnogości. Oczywiście podstawowym celem będzie
dowodzenie twierdzeń. Będzie ich dużo więc wygodnie jest nieco rozszerzyć terminologię dotyczącą twierdznenia. Jeśli dowód
twierdzenia jest stosunkowo prosty to samo twierdzenie określa się mianem uwaga. Klasyczne słowo twierdzenie matematcy
rezerwują dla szczególnie ważnych twierdzeń. Twierdzenia, których rola jest głównie pomocnicza określa się mianem lematu.
Twierdzenia wynikające bezpośrednio z wcześniej udowodnionego innego twierdzenia określa się mianem wniosku.
3.8
Schematy dowodowe.
Jak już wspomnieliśmy, w codziennej praktyce matematycznej wypisywanie kompletnych formalnych dowodów jest niewykonalne. Najczęściej zamiast kompletnych dowodów podajemy mniej lub bardziej dokładne szkice dowodów, opierając się
o różnego rodzaju schematy dowodowe. Schemat dowodowy to pewien sposób rozumowania, o którym wiadomo, że może
zostać zastąpiony formalnym dowodem. Ponadto schemat dowodowy zazwyczaj zawiera komentarze, które czytelnikowi mają ułatwić ustalenie na jakiej podstawie konkretna formuła ma prawo znaleźć się w dowodzie. Co więcej, formuły często w
części lub całości zastępujemy ich słownymi opisami, bo ułatwia czytanie.
Do najważniejszych schematów należy zaliczyć
Dowód wprost. Ten schemat oznacza, że szkicujemy bezpośredni dowód, a więc podajemy kolejne, choć zazwyczaj
nie wszystkie, formuły jakie znajdują się w dowodzie formalnym.
Dowód implikacji. Jeśli formuła ma postać ϕ⇒ψ to na mocy metatwierdzenia 3.5.3 wystarczy podać wywód formuły
ψ z przesłanki ϕ.
Dowód przez przypadki. Jeśli podamy wywód formuły θ z przesłanki ϕ oraz wywód z formuły γ z przesłanki ψ i
udowodnimy ϕ ∨ ψ, to wiemy z metatwierdzenia 3.5.7, że formuła θ posiada dowód.
Dowód formuły ∀x ∈ A ϕ(x). Aby udowodnić taką formułę wystarczy podać wywód formuły ϕ(x) z przesłanki x ∈ A
i zastosować regułę generalizacji.
72
ROZDZIAŁ 3. ELEMENTY LOGIKI MATEMATYCZNEJ
Rozdział 4
Elementy teorii mnogości
4.1
Formalizm teorii mnogości
Jedna˛ z metod sprawdzania niesprzeczności aksjomatów teorii jest pokazanie, że aksjomaty te sa˛ twierdzeniami innej teorii, której niesprzeczność już udowodniono, albo przynajmniej teorii, w której niesprzeczność aksjomatów budzi mniej watpliwości.
˛
W pierwszym dwudziestoleciu XX wieku teoria zbiorów, w j˛ezyku polskim najcz˛eściej określana mianem teoria mnogości, stała si˛e fundamentem głównego
nurtu współczesnej matematyki, jako najbardziej elementarna teoria, w której weryfikować można aksjomaty bardziej zaawansowanych teorii.
Twórca˛ teorii mnogości był niemiecki matematyk Georg Cantor (rys. 4.1).
Formalizacja teorii mnogości opiera się na języku predykatów. Nie są potrzebne symbole funkcyjne i jest tylko jeden
symbol relacyjny: ∈ - symbol przynależności do zbioru. Tak więc formuła
x∈y
będzie przez nas intepretowana jako stwierdzenie, że x jest elementem zbioru y. Przyjmujemy też od razu skrót
x 6∈ y :⇔ ¬x ∈ y.
Aby nie mnożyć pojęć, wygodnie jest przyjąć, że wszystkie zmienne oznaczają zbiory. W szczególności, jeśli x ∈ y to nie
tylko y jest zbiorem, ale również x jest zbiorem. Takie podejście jest nieco zaskakujące, ale studiując teorię mnogości szybko
się z nim oswajamy, uświadamiając sobie, że jest wygodne, bo nie mnoży pojęć, a nie ma w nim nic niebezpiecznego.
4.1.1
Podstawowe definicje i oznaczenia.
Na początek w formalnych formułach będziemy używać wyłącznie małych liter z końca alfabetu: t, u, v, w, x, y, z dla oznaczenia zbiorów, dla podkreślenia, że chodzi o zmienne języka formalnego. Na codzień jest to jednak niewygodne, więc niebawem
trochę rozluźnimy tę konwencję.
Definicja 4.1.1 Mówimy, że zbiór x zawiera się w zbiorze y i piszemy x ⊂ y jeżeli
∀t t ∈ x ⇒ t ∈ y.
Uwaga 4.1.2 Mamy
∀x x ⊂ x.
73
74
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Rysunek 4.1: Georg Cantor, 1845-1918. Źródło: Wikipedia
Dowód: Oto kolejne formuły dowodu formalnego:
1. ¬w ∈ x ∨ w ∈ x
podstawienie do tautologii wyłączonego środka
2. w ∈ x ⇒ w ∈ x
rozpisanie przy pomocy znaku implikacji
3. ∀w w ∈ x ⇒ w ∈ x na podstawie reguły generalizacji
4. x ⊂ x
wykorzystanie definicji zawierania się zbiorów
5. ∀x x ⊂ x
ponownie na podstawie reguły generalizacji.
Uwaga 4.1.3 Mamy
∀x ∀y ∀z (x ⊂ y ∧ y ⊂ z ⇒ x ⊂ z).
Dowód: Pokażemy najpierw, że
{x ⊂ y ∧ y ⊂ z, w ∈ x} ` w ∈ z.
Dowód formalny tego wnioskowania wygląda następująco:
1. x ⊂ y ∧ y ⊂ z
przesłanka
2. w ∈ x
przesłanka
3. x ⊂ y ∧ y ⊂ z ⇒ x ⊂ y podstawienie do tautologii ϕ ∧ ψ ⇒ ϕ
4. x ⊂ y
z 1 i 3 na podstawie reguły odrywania
5. ∀t t ∈ x ⇒ t ∈ y
rozpisanie 4 z definicji
6. w ∈ x ⇒ w ∈ y
na podstawie tautologii (3.4)
7. w ∈ y
z 2 i 6 na podstawie reguły odrywania
8. x ⊂ y ∧ y ⊂ z ⇒ y ⊂ z podstawienie do tautologii ϕ ∧ ψ ⇒ ψ
9. y ⊂ z
z 1 i 8 na podstawie reguły odrywania
10. ∀t t ∈ y ⇒ t ∈ z
rozpisanie 9 z definicji
11. w ∈ y ⇒ w ∈ z
na podstawie tautologii (3.4)
12. w ∈ z
z 7 i 11 na podstawie reguły odrywania
Na podstawie metatwierdzenia 3.5.3 wnosimy, że
{x ⊂ y ∧ y ⊂ z} ` w ∈ x ⇒ w ∈ z.
Ponownie z metatwierdzenia 3.5.3 dostajemy
`(x ⊂ y ∧ y ⊂ z) ⇒ (w ∈ x ⇒ w ∈ z),
4.1. FORMALIZM TEORII MNOGOŚCI
75
czyli, że formuła
(x ⊂ y ∧ y ⊂ z) ⇒ (w ∈ x ⇒ w ∈ z)
posiada dowód. Na podstawie reguły generalizacji na końcu tego dowodu możemy dopisać formułę
∀w (x ⊂ y ∧ y ⊂ z) ⇒ (w ∈ x ⇒ w ∈ z).
Rozpisując pierwszą implikację z definicji mamy
∀w ¬(x ⊂ y ∧ y ⊂ z) ∨ (w ∈ x ⇒ w ∈ z).
Wykorzystując przemienność alternatywy oraz tautologię 3.5 mamy
¬(x ⊂ y ∧ y ⊂ z) ∨ ∀w (w ∈ x ⇒ w ∈ z)
co można ponownie zapisać przy pomocy implikacji jako
(x ⊂ y ∧ y ⊂ z) ⇒ ∀w (w ∈ x ⇒ w ∈ z),
a stosując definicję zawierania się zbiorów jako
(x ⊂ y ∧ y ⊂ z) ⇒ x ⊂ z.
Stusując teraz trzykrotnie regułę generalizacji otrzymujemy tezę.
W dalszym ciągu trochę rozluźnimy konwencję oznaczania zbiorów i uczynimy ją nieco bardziej intuicyjną. Nowa konwencja będzie następująca. O zbiorach, które jedynie formalnie są zbiorami, ale "nie zaglądamy im do środka", tzn. nie interesują
nas ich elementy, ale wyłącznie one same w roli elementów innych zbiorów, mówić będziemy ’obiekty’ lub ’elementy’. Dla
takich zbiorów używać będziemy liter małych podobnie jak do tej pory, choć niekoniecznie z końca alfabetu. Słowo ’zbiór’
rezerwujemy dla "zwykłych" zbiorów, a więc takich, których elementom nie zaglądamy do środka. Na oznaczenie takich zbiorów używać będziemy drukowanych dużych liter A, B, ... X, Y , Z. W przypadku zbiorów, których elementy są zbiorami w
tym znaczniu, że zaglądamy im do środka, a więc interesują nas ich elementy, używać będziemy określenia ’rodzina zbiorów’.
Rodziny zbiorów oznaczać będziemy dużymi literami pisanymi A, B, ... X , Y, Z. Oczywiście mogą się pojawić i pojawią
się rodziny zbiorów rzędu drugiego, a więc rodziny, których elementy same w sobie są rodzinami, rodziny rzędu trzeciego,
których elementy są rodzinami rzędu drugiego itd. W takich przypadkach nasz system oznaczeń będzie nieco odbiegać od
przyjętej konwencji, ale nie powinno to prowadzić do nieporozumień. Podkreślmy, że ten system oznaczeń ma jedynie na
celu ułatwienie czytania formalnego tekstu, bo dla samej treści to, jakie stosujemy oznacznia nie ma zupełnie znaczenia.
Definicja 4.1.4 Mówimy, że zbiory X i Y są identyczne lub równe jeżeli
X ⊂ Y ∧ Y ⊂ Y.
Piszemy wtedy X = Y . Mówimy, że zbiory X i Y są różne i piszemy X 6= Y jeżeli ¬X = Y .
Zauważmy, że
Uwaga 4.1.5
X = Y ⇔ (∀z z ∈ X ⇔ z ∈ Y )
76
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Uwaga 4.1.6 Identyczność zbiorów ma następujące trzy własności
∀x
∀x∀y
∀x∀y∀z
x = x,
(4.1)
x = y ⇒ y = x,
(4.2)
x = y ∧ y = z ⇒ x = z.
(4.3)
Dowód: ...
Wygodnie jest jeszcze wprowadzić dwa synonimy zwrotu ’zawiera się’.
Definicja 4.1.7 Mówimy, że X jest podzbiorem zbioru Y jeżeli X ⊂ Y . Mówimy, że X jest podzbiorem właściwym
zbioru Y i piszemy X ( Y , jeżeli X ⊂ Y i X 6= Y . Mówimy, że X jest nadzbiorem zbioru Y i piszemy X ⊃ Y jeżeli
Y ⊂ X. Mówimy, że X jest nadzbiorem właściwym zbioru Y i piszemy X ) Y , jeżeli X ⊃ Y i X 6= Y .
Często udaje się pokazać nie tylko istnienie obiektu x o własności ϕ(x), ale również fakt, że obiekt ten jest dokładnie jeden
w znaczeniu, że jeśli ϕ(x1 ) i ϕ(x2 ) to x1 = x2 . Wygodnie jest wprowadzić skrót na oznaczenie takiej sytuacji. Przyjmujemy
więc następujące oznaczenie
∃!x ϕ(x) :⇔ ∃x ϕ(x) ∧ (∀y∀z ϕ(y) ∧ ϕ(z) ⇒ y = z),
a znak ∃! czytamy ’istnieje dokładnie jeden’.
Wygodnie jest też wprowadzić oznaczenie na przypadek gdy kwantyfikator odnosimy tylko do elementów pewnego zbioru
X.
4.2
∀x ∈ X ϕ(x)
:⇔
∀x x ∈ X ⇒ ϕ(x)
∃x ∈ X ϕ(x)
:⇔
∃x x ∈ X ∧ ϕ(x)
Formuły zbiorotwórcze.
Rozważmy formułę ϕ(x) o dokładnie jednej zmiennej wolnej x. Naturalne jest pytanie, czy istnieje zbiór X, którego elementami są dokładnie takie x, dla których formuła ϕ(x) jest spełniona. Formalnie, jest to pytanie czy formuła
∃X ∀x x ∈ X ⇔ ϕ(x)
(4.4)
jest spełniona. Powiemy, że formuła ϕ jest zbiorotwórcza, jeżeli formuła (4.4) jest spełniona. Na wczesnym etapie tworzenia
teorii mnogości bezkrytycznie przyjmowano, że każda formuła jest zbiorotwórcza. Jednak w 1901 roku brytyjski filozof
Bertrand Russel (ryc. 4.2 zauważył, że może to prowadzić do sprzeczności. Dokładniej, Russel zauważył, że formuła
ϕ(x) := x 6∈ x
nie może być zbiorotwórcza. Rzeczywiście, załóżmy, że istnieje zbiór X takich zbiorów x, że x 6∈ x. Mamy dwa możliwe
przypadki: albo X jest swoim elementem, albo nie jest. Jeśli X ∈ X, to na mocy definicji X mamy X 6∈ X. Jeśli X 6∈ X
to znów na mocy definicji X mamy X ∈ X. Otrzymujemy więc sprzeczność, zwaną paradoksem Russela. Sprzeczności
związanych z paradoksem Russela udało się uniknąć poprzez aksjomatyzację teorii mnogości, w której jedynie dla wybranych
formuł na mocy aksjomatu przyjmuje się, że są zbiorotwórcze.
Uwaga 4.2.1 Jeśli ϕ jest zbiorotwórcza, to zbiór X w formule (4.4) jest wyznaczony jednoznacznie. Formalnie:
∃!X ∀x x ∈ X ⇔ ϕ(x)
4.2. FORMUŁY ZBIOROTWÓRCZE.
77
Rysunek 4.2: Bertrand Russell, 1872-1970. Źródło: Wikipedia
Dowód: Rozpisując oznaczenie ∃! stwierdzamy, że musimy pokazać koniunkcję dwóch formuł
∃X ∀x x ∈ X ⇔ ϕ(x)
oraz
∀X1 ∀X2 (∀x x ∈ X1 ⇔ ϕ(x)) ∧ (∀x x ∈ X2 ⇔ ϕ(x)) ⇒ X1 = X2 .
Pierwsza wynika z założenia, że formuła ϕ jest zbiorotwórcza. Aby pokazać drugi, przyjmijmy, że zbiory X1 i X2 są takie,
że ∀x x ∈ X1 ⇔ ϕ(x) i ∀x x ∈ X2 ⇔ ϕ(x). Wtedy ∀x x ∈ X1 ⇔ x ∈ X2 i z uwagi 4.1.5 dostajemy, że X1 = X2 .
Zbiór X, którego istnienie postuluje formuła (4.4) oznaczamy
{ x | ϕ(x) }.
(4.5)
Podkreślmy, że w oznaczeniu tym zmienną x należy traktować jak zmienną związaną, bo zastąpienie jej inną zmienną daje
ciągle ten sam zbiór.
Oznaczenie (4.5) zwane jest wyrażeniem klasowym. Nazwa ta bierze się stąd, że oznaczenie (4.5) bywa stosowane również
wtedy, gdy formuła ϕ nie jest zbiorotwórcza. Mówi się wtedy, że definiuje ono klasę. Pozwala to zastąpić zwrot ’formula ϕ
jest zbiorotwórcza’ równoważnym mu zwrotem ’klasa
{ x | ϕ(x) }
jest zbiorem’.
Pojęcie klasy też może być sformalizowane, my jednak nie będziemy tego robić ograniczając się jedynie do przyjęcia
zasady, że wprowadzając oznaczenie
F := { x | ϕ(x) }
w przypadku klasy, która nie jest zbiorem, ograniczymy się jedynie do zapisów x ∈ F, które są równoważne formalnemu
zapisowi ϕ(x).
W szczególności używać będziemy oznaczenia
V := { x | x = x }
na tak zwaną klasą pełną. Jak zobaczymy, klasa ta też nie jest zbiorem. Natomiast zapis x ∈ V oznacza po prostu tyle, że x
jest zbiorem.
Pojęcie zbiorotwórczości można rozważać dla formuły o wielu zmiennych wolnych. Dokładniej, jeśli zmiennymi wolnymi
w formule ϕ są: wyróżniona zmienna x oraz pozostałe zmienne x1 , x2 , . . . xk , to mówimy, że ϕ jest zbiorotwórcza względem
x jeśli spełniona jest formuła
∀x1 ∀x2 · · · ∀xk ∃X ∀x x ∈ X ⇔ ϕ(x, x1 , x2 , . . . xk ).
78
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Rysunek 4.3: Ernst Zermelo, 1871-1953 i Abraham Fraenkel, 1891-1965. Źródło: Wikipedia
4.3
Aksjomaty teorii mnogości.
Zbiór aksjomatów teorii mnogości, na którym się oprzemy, zaproponował matematyk niemiecki Ernst Zermelo w roku 1908.
W kształtowanie się aksjomatów teorii mnogości istotny wkład miał też izraelski matematyk Abraham Fraenkel (rys. 4.3). W
rozdziale tym zaprezentujemy jeden z wariantów wywodzącej się od tych matematyków aksjomatyki teorii mnogości zwanej
aksjomatyką Zermelo-Fraenkla.
ZF1. Aksjomat jednoznaczności.
∀x ∀y x = y ⇒ (∀A x ∈ A ⇔ y ∈ A).
Aksjomat jednoznaczności mówi, że jeśli dwa zbiory są identyczne, to jeden z nich może być elementem jakieś rodziny
wtedy i tylko wtedy gdy również drugi z nich jest elementem tej rodziny.
ZF2. Aksjomat zbioru pustego. Klasa { x | x 6= x } jest zbiorem. Formalnie
∃E ∀x x ∈ E ⇔ x 6= x.
Zbiór, którego istnienie postuluje aksjomat zbioru pustego oznaczamy ∅ i nazywamy zbiorem pustym. Nazwa tę uzasadnia
następująca uwaga.
Uwaga 4.3.1
∀x x 6∈ ∅.
Dowód: Ustalmy dowolne x. Ze wzoru (4.1) wnosimy, że x = x. Zatem x 6∈ ∅. Generalizując względem x otrzymujemy
tezę.
Powiemy, że formuła ϕ(x, y) o zmiennych wolnych x i y ma własność jednoznaczności względem y, jeżeli
∀x∃z∀y ϕ(x, y) ⇔ y = z.
Nasz kolejny aksjomat, to w rzeczywistości schemat, który dostarcza po jednym aksjomacie dla każdej formuły ϕ(x, y) z
własnością jednoznaczności względem y.
4.3. AKSJOMATY TEORII MNOGOŚCI.
79
ZF3. Schemat aksjomatów zastępowania. Dla każdej formuły ϕ o zmiennych wolnych x, y i własności jednoznaczności względem Y i dla każdego zbioru
A klasa
{ y | ∀x ∈ A ϕ(x, y) }
jest zbiorem. Formalnie:
(∀x∃z∀y ϕ(x, y) ⇔ y = z) ⇒ ∀A∃B∀y (y ∈ B ⇔ ∀x ∈ A ϕ(x, y)).
Schemat aksjomatów zastępowania mówi, że dla każdej rozważanej formuły i dla każdego zbioru A można utworzyć zbiór
B obejmujący dokładnie te elementy y, dla których istnieje element x ∈ A taki, że zachodzi ϕ(x, y).
Ważną konsekwencją tego schematu aksjomatów jest następujące metatwierdzenie będące schematem twierdzeń po jednym dla każdej formuły ϕ.
Metatwierdzenie 4.3.2 (o specyfikowaniu podzbiorów) Niech ϕ(y) będzie formułą o zmiennej wolnej y. Dla
dowolnego zbioru X klasa
{ y | y ∈ X ∧ ϕ(y) }
jest zbiorem. Formalnie:
∀X ∃Y ∀y y ∈ Y ⇔ y ∈ X ∧ ϕ(y).
Dowód: Rozważmy najpierw przypadek, gdy nie istnieje x ∈ X taki, że ϕ(x). Wtedy y ∈ X ∧ ϕ(y) ⇔ y ∈ ∅, zatem
poszukiwany zbiór Y istnieje, bo jest nim zbiór pusty. Natomiast jeśli istnieje x0 ∈ X taki, że ϕ(x0 ), to definiujemy formułę
ψ o zmiennych wolnych x i y następująco:
ψ(x, y) := (ϕ(x) ∧ x = y) ∨ (¬ϕ(x) ∧ x = x0 ).
Założenia aksjomatu zastępowania dla tej formuły są ewidentnie spełnione. Na mocy tego aksjomatu zbiorowi X odpowiada
zbiór, którego elementami są dokładnie takie y, że y ∈ X oraz ϕ(y).
Na mocy tego metatwierdzenia, nawet jeśli klasa { x | ϕ(x) } nie jest zbiorem, to analogiczna klasa, ale ograniczona do
pewnego zbioru daje już zbiór. Na podstawie tego metatwierdzenia dla danego zbioru X możemy wprowadzić oznaczenie
{ x ∈ X | ϕ(x) } := { x | x ∈ X ∧ ϕ(x) },
które zawsze definiuje zbiór. Podkreślmy jednak, że w oznaczeniu tym zakładamy, że X jest zbiorem. Jest to powszechan
metoda definiowania zbiorów w matematyce. Wymaga jednak dysponowania zbiorem X, do którego zawężamy nasze zainteresowanie formułą ϕ.
Zauważmy, że w szczególności z metatwierdzenia o specyfikowaniu podzbiorów wynika, że klasa pełna V nie może być
zbiorem. Gdyby bowiem była zbiorem, to klasa
{ x ∈ V | x 6∈ x }
byłaby zbiorem, a wiemy, że nie jest.
ZF4. Aksjomat zbioru podzbiorów. Jeśli X jest zbiorem, to klasa
{A | A ⊂ X }
jest zbiorem. Formalnie
∀X ∃A ∀A
A ∈ A ⇔ A ⊂ X.
80
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Aksjomat zbioru podzbiorów mówi, że dla każdego zbioru można utworzyć zbiór wszystkich jego podzbiorów. Oznaczamy
go P(X) lub 2X .
Zauważmy, że P(∅) ma dokładnie jeden element, mianowicie ∅ ∈ P(∅). Natomiast P(P(∅)) ma dokładnie dwa elementy:
∅, P(∅) ∈ P(P(∅)).
Twierdzenie 4.3.3 (o istnieniu singletona i dubletona) Dla dowolnych zbiorów a, b klasa
{x | x = a ∨ x = b}
jest zbiorem. Formalnie:
∀a ∀b ∃X ∀x x ∈ X ⇔ x = a ∨ x = b.
Dowód: Rozważmy formułę
ϕ(x, y) := (x = ∅ ∧ y = a) ∨ (x = P(∅) ∧ y = b).
Założenia aksjomatu zastępowania dla tej formuły są ewidentnie spełnione. Rozważmy zbiór A := P(P(∅)). Na mocy
aksjomatu zastępowania odpowiada mu zbiór, którego elementami są dokładnie a oraz b.
Twierdzenie 4.3.3 mówi, że dla dowolnych zbiorów a i b istnieje zbiór, którego elementami są dokładnie a oraz b. Oznaczamy go {a, b}. Gdy a 6= b nazywamy go dubletonem elementów a, b. W przeciwnym razie nazywamy go singletonem elementu
a.
ZF5. Aksjomat unii. Dla dowolnej rodziny zbiorów A klasa
{ x | ∃A ∈ A x ∈ A }
jest zbiorem. Formalnie
∀A ∃U ∀a
a ∈ U ⇔ ∃A ∈ A a ∈ A.
Aksjomat unii mówi, że jeśli A jest rodziną zbiorów, to można utworzyć zbiór U , którego elementami
są wszystkie elementy
S
zbiorów w rodzinie A i tylko te elementy. Nazywamy go unią lub sumą rodziny A i oznaczamy A. W szczególności, jeśli
A i B są zbiorami, to przyjmujemy oznaczenie
[
A ∪ B := {A, B},
a zbiór A ∪ B nazywamy sumą lub unią zbiorów A i B.
Rozważmy teraz wyrażenie klasowe
\
A := { x | ∀A ∈ A x ∈ A }.
T
T
Metatwierdzenie 4.3.4 Jeśli rodzina A jest niepusta, to A jest zbiorem. Natomiast ∅ jest klasą pełną V, a więc
nie jest zbiorem.
T
Dowód: Jeśli A0 ∈ A, to x ∈ A implikuje x ∈ A0 , więc
\
A := { x ∈ A0 | ∀A ∈ A x ∈ A },
T
a zatem A jest zbiorem na mocy metatwierdzenia o specyfikowaniu
zbiorów. Jeśli A = ∅ to implikacja A ∈ A ⇒ x T
∈A
T
zachodzi dla dowolnego x, bo poprzednik jest fałszywy. Zatem ∅ jest klasą pełną. Dla niepustej rodziny A zbiór A
nazywamy przecięciem lub iloczynem rodziny zbiorów A.
4.3. AKSJOMATY TEORII MNOGOŚCI.
81
Dla dwóch zbiorów A i B przyjmujemy oznaczenie
A ∩ B :=
\
{A, B},
a zbiór A ∩ B nazywamy iloczynem lub przecięciem zbiorów A i B. Definiujemy też różnicę i różnicę symetryczną zbiorów A
i B odpowiednio jako
A\B
:= { x ∈ A | x 6∈ B },
AB
:=
(A \ B) ∪ (B \ A).
Mówimy, że A, B są rozłączne jeżeli A ∩ B = ∅.
Przyjęte do tej pory aksjomaty ani nie wykluczają, ale też nie gwarantują istnienia zbiorów nieskończonych. Jeśli jednak
chcemy skonstruować na gruncie teorii mnogości liczby naturalne, musimy przyjąć jakiś aksjomat, który zagwarantuje
istnienie choć jednego zbioru nieskończonego. Jak zobaczymy, konstrukcja zbioru liczb naturalnych opiera się na operacji
następnika zbioru A zdefiniowanej następująco;
S(A) := A ∪ {A}.
Mamy
S(∅)
=
{∅}
S(S(∅))
=
{∅, {∅}}
S(S(S(∅)))
=
{∅, {∅}, {∅, {∅}}}
S(S(S(S(∅))))
=
{∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}}
...
Każdy kolejny zbiór jest nadzbiorem właściwym zbioru poprzedniego, więc w szczególności zbiory te są różne. Jest ich
nieskończenie wiele. W aksjomacie nieskończoności postulujemy, że istnieje zbiór, który te wszystkie zbiory zawiera.
ZF6. Aksjomat nieskończoności. Istnieje rodzina zbiorów A taka, że ∅ ∈ A
oraz dla każdego zbioru A ∈ A jego następnik S(A) ∈ A. Formalnie:
∃A ∅ ∈ X ∧ ∀A ∈ A ∃B ∈ A ∀x x ∈ B ⇔ x ∈ A ∨ x = A.
4.3.1
Elementarne własności operacji mnogościowych
Wzięcie sumy, iloczynu, różnicy czy różnicy symetrycznej dwóch zbiorów określamy ogólnie mianem operacji mnogościowej.
Uwaga 4.3.5 Niech A, B, C będą zbiorami. Operacje mnogościowe mają następujące własności.
A ⊂ B, B ⊂ C ⇒ A ⊂ C,
A \ A = ∅, A \ ∅ = A,
A ∪ B = B ∪ A,
A ∪ A = A, A ∩ A = A,
A ∩ B = B ∩ A,
A ⊂ B ⇔ A ∪ B = B ⇔ A ∩ B = A,
A ⊂ A ∪ B,
B ⊂ A ∪ B,
A ∪ (B ∪ C) = (A ∪ B) ∪ C,
A ∩ B ⊂ A,
A ∩ B ⊂ B,
A ∩ (B ∩ C) = (A ∩ B) ∩ C,
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C),
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
82
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Rysunek 4.4: Kazimierz Kuratowski, 1896-1980
Definicja 4.3.6 Jeśli A ⊂ X to zbiór X \A nazywamy uzupełnieniem A do X i oznaczamy CX A. Gdy X jest ustalony
i znany z kontekstu, to często nazywamy go przestrzeną a uzupełnienie A do X oznaczamy po prostu CA lub \A.
Uwaga 4.3.7 Niech A, B ⊂ X będą zbiorami w przestrzeni X. Uzupełnienie do przestrzeni X ma następujące własności.
A \ B = A ∩ (\B),
\(\A) = A,
\(A ∪ B) = (\A) ∩ (\B),
\(A ∩ B) = (\A) ∪ (\B),
A ⊂ B ⇔ \A ⊃ \B.
4.4
4.4.1
Iloczyn kartezjański
Para
Parą elementów a i b nazywamy zbiór {{a, b}, {b}} oznaczany krótko (a, b).
Powyższa,˛ powszechnie dziś używana˛ definicj˛e pary podał w 1921 roku polski matematyk Kazimierz Kuratowski (rys. 4.4). Wcześniejsze, bardziej skomplikowane definicje si˛e nie przyj˛eły.
Kluczową własnością pary, której nie ma dubleton, jest
Uwaga 4.4.1
(a, b) = (c, d) ⇔ a = c ∧ b = d.
4.4. ILOCZYN KARTEZJAŃSKI
83
W poniższym dowodzie trzykrotnie zastosowano schemat dowodowy zwany dowodem przez przypadki. W dowodzie przez przypadki zamiast jednego dowodu
przedstawiamy dwa lub wi˛ecej dowodów, każdy z pewnym dodatkowym nieudowodnionym założeniem. Dowód jest kompletny, jeśli dodatkowo potrafimy udowodnić,
że przynajmniej jedno z tych dodatkowych założeń musi być prawdziwe. Ten ostatni fakt cz˛esto sprawdzić jest bardzo łatwo, bo rozważane przypadki wzajemnie
si˛e dopełniaja:˛ na przykład jeden przypadek to x > 0, a drugi x ¬ 0. Zaleta˛ takiego podejścia jest możliwość odmiennego poprowadzenia dowodu w każdym z
przypadków.
Dowód: Choć własność wydaje się oczywista, to jednak jej w miarę formalny dowód jest pracochłonny. Aby udowodnić,
że
(a, b) = (c, d) ⇔ a = c ∧ b = d.
wystarczy podać oddzielnie dowód implikacji
(a, b) = (c, d) ⇒ a = c ∧ b = d
oraz implikacji
a = c ∧ b = d ⇒ (a, b) = (c, d).
Podamy dowód pierwszej z tych implikacji. Dowód drugiej jest znacznie łatwiejszy i zostawiamy go jako ćwiczenie.
Załóżmy zatem, że (a, b) = (c, d), co zgodnie z naszą definicją pary oznacza, że {{a, b}, {b}} = {{c, d}, {d}}. Ponieważ
{b} jest elementem zbioru {{a, b}, {b}}, więc jest on też elementem zbioru = {{c, d}, {d}}. Zatem albo {b} = {{c, d}} albo
{b} = {d}. Dalszą część dowodu możemy zatem poprowadzić przez przypadki.
Załóżmy najpierw, że {b} = {{c, d}}. Ponieważ tak c jak i d należą do dubletona {{c, d}}, a dubleton {{c, d}} jest w tym
przypadku równy singletonowi {b}, więc c i d należą do singletona {b}. Zgodnie z definicją singletona jest to możliwe tylko
wtedy gdy c = b i d = b. Zatem również c = d co oznacza w szczególności, że dubleton {c, d} pokrywa się z singletonem {d},
a w konsekwencji mamy
(c, d) = {{c, d}, {d}} = {{d}, {d}} = {{d}}.
Zatem {{a, b}, {b}} = {{d}}. Ponieważ {a, b} należy do lewej strony tej równości, więc należy też do prawej strony. Stąd
{a, b} = {d}. To oznacza, że d = a i d = b. Pokazaliśmy zatem, że a = b = c = d, więc w szczególności a = c i b = d. Kończy
to dowód w przypadku gdy {b} = {{c, d}}.
By rozważyć drugi przypadek przyjmijmy, że {b} = {d}. Wtedy b = d i pozostaje pokazać, że a = c. Z b = d wynika, że
(a, b) = (c, b). Ponieważ {a, b} ∈ (a, b), więc również {a, b} ∈ (c, b). Mamy zatem do rozpatrzenia dwa podprzypadki: albo
{a, b} = {c, b} albo {a, b} = {b}. W pierwszym podprzypadku dostajemy a = c lub a = b. Podpodprzypadek a = c nie
wymaga już dalszego rozumowania, bo chcieliśmy właśnie pokazać, że a = c. Natomiast jeśli a = b, to {a} = {c, b}, skąd
również wynika, że a = c.
Pozostaje jeszcze rozważyć podprzypadek {a, b} = {b}. Wtedy a = b, skąd (a, b) = {{a}}. Zatem {c, d} ∈ {{a}}, skąd
a = c = d. Tak więc w tym podprzypadku znów dostajemy, że wszsytkie cztery elementy są równe, skąd w szczególności
a = c i b = d.
4.4.2
Iloczyn kartezjański
Zauważmy, że jeśli X i Y są zbiorami, x ∈ X, y ∈ Y , to
(x, y) = {{x, y}, {y}} ∈ P(P(X ∪ Y )).
Iloczynem kartezjańskim zbiorów X i Y nazywamy zbiór
X × Y := { u ∈ P(P(X ∪ Y )) | ∃x ∈ X∃y ∈ Y u = (x, y) }.
Iloczyn kartezjański X × X oznaczamy krótko X 2 .
84
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Twierdzenie 4.4.2 Iloczyn kartezjański ma następujące własności.
(i) Jeśli A 6= ∅ 6= B, to
A × B ⊂ X × Y ⇔ A ⊂ X i B ⊂ Y,
(ii) Dla dowolnych zbiorów A1 , A2 , B mamy
(A1 × B) ∪ (A2 × B)
=
(A1 ∪ A2 ) × B,
(A1 × B) ∩ (A2 × B)
=
(A1 ∩ A2 ) × B,
(iii) Dla dowolnych zbiorów A, B, C, D mamy
(A × B) ∩ (C × D) = (A ∩ C) × (B ∩ D).
4.5
Relacje
4.5.1
Relacje
Relacją w zbiorach X i Y nazywamy dowolny podzbiór R ⊂ X × Y . Gdy X = Y , mówimy krótko o relacji w X. Tradycyjnie piszemy xRy zamiast (x, y) ∈ R. Zbiór pusty i X × X to odpowiednio relacja pusta i relacja pełna w X. Relacją
identycznościową w X jest
∆X := idX := { (x, x) | x ∈ X }.
4.5.2
Własności relacji
Niech R ⊂ X × X będzie relacją w X. Podane już w rozdziale ... własności relacji definiujemy przy użyciu następujących
wzorów formalnych.
R zwrotna : ⇔
x R x,
∀x, y ∈ X
x R y ⇒ y R x,
:⇔
∀x, y ∈ X
x R y ∧ y R x ⇒ x = y,
R antysymetryczna
R przechodnia : ⇔
R spójna
4.5.3
∀x ∈ X
R symetryczna : ⇔
:⇔
∀x, y, z ∈ X
∀x, y ∈ X
x R y ∧ y R z ⇒ x R z,
x R y ∨ y R x.
Złożenie relacji
Definicja 4.5.1 Dla relacji R w X × Y i relacji S w Y × Z definiujemy obłożenie relacji R przez relację S zwane
również podstawieniem relacji R w relacji S jako
S ◦ R := { (x, z) ∈ X × Z | ∃y ∈ Y xRy i ySz }.
Definiujemy również relację odwrotną do relacji R jako
R−1 := { (y, x) ∈ Y × X | xRy }.
4.6. RELACJE RÓWNOWAŻNOŚCI
85
Twierdzenie 4.5.2 Niech Q będzie relacją w W × X, R relacją w X × Y , a S relacją w Y × Z. Wtedy
(S ◦ R) ◦ Q = S ◦ (R ◦ Q),
(S ◦ R)−1 = R−1 ◦ S −1 ,
(R−1 )−1 = R,
∆−1
X = ∆X .
4.5.4
Charakterystyka własności relacji
Następujące twierdzenie opisuje własności relacji w języku zbiorów.
Twierdzenie 4.5.3 Niech R ⊂ X × X będzie relacją. Wtedy:
4.6
4.6.1
R zwrotna
⇔
∆X ⊂ R,
R symetryczna
⇔
R−1 = R,
R anysymetryczna
⇔
R ∩ R−1 ⊂ ∆X ,
R przechodnia
⇔
R ◦ R ⊂ R,
R spójna
⇔
R ∪ R−1 = X × X.
Relacje równoważności
Relacja równoważności
Definicja 4.6.1 Relację w klasie X, która jest zwrotna, symetryczna i przechodnia nazywamy relacją równoważności.
Dla x ∈ X zbiór
[x]R := { y ∈ X | xRy }
nazywamy klasą równoważności elementu x.
Twierdzenie 4.6.2 Niech R będzie relacją równoważności w X. Jeśli x, y ∈ X oraz xRy, to [x]R = [y]R . Innymi słowy,
klasy równoważności równoważnych elementów są identyczne. Ponadto dla dowolnych x, y ∈ X albo [x]R = [y]R , albo
[x]R ∩ [y]R = ∅, to znaczy klasy równoważności dwóch elementów są albo równe, albo rozłączne.
4.7
4.7.1
Funkcje
Relacje jednolistne
Definicja 4.7.1 Niech R ⊂ X × Y będzie relacją. Mówimy, że R jest jednolistna jeżeli
(x, y) ∈ R ∧ (x, y 0 ) ∈ R ⇒ y = y 0 .
86
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Rysunek 4.5: Graf relacji niejednolistnej i jednolistnej
Rysunek 4.6: Wykres relacji niejednolistnej i jednolistnej
4.7. FUNKCJE
87
Przykładowy graf relacji niejednolistnej (po lewej) i jednolistnej (po prawej) przedstawiono na rys. 4.5. Wykresy tych relacji (niejednolistnej po lewej, jednolistnej
po prawej) przedstawiono na rys. 4.6.
Relacja jednolistna nie może być jeszcze uznana za funkcj˛e, bo własność jednolistności nie gwarantuje, że każdy element x ∈ X pozostaje w relacji z jakimś
elementem y ∈ Y . Jednak nim zajmiemy si˛e definicja˛ funkcji zauważmy najpierw, że czasami mamy do czynienia z sytuacja,˛ w której pewnym argumentom nie
chcemy badź
˛ nie potrafimy w rozsadny
˛ sposób przypisać wartości. Mówimy wtedy o funkcjach cz˛eściowych.
4.7.2
Funkcje częściowe
Definicja 4.7.2 Mówimy, że trójka (X, f, Y ) jest funkcją częściową z X do Y
Tradycyjnie piszemy f : X−→
◦ Y na oznaczenie funkcji częściowej z X do Y .
częściowej f z X do Y , to element y jest wyznaczony jednoznacznie przez
nazywamy wartością funkcji częściowej f w x. Dziedzinę funkcji częściowej f
jeżeli f jest relacją jednolistną w X ×Y .
Jeśli para (x, y) jest elementem funkcji
element x. Oznaczamy go f (x) := y i
definiujemy jako
dom f := { x ∈ X | ∃y ∈ Y (x, y) ∈ f }.
Obraz funkcji częściowej f definiujemy jako
im f := { y ∈ Y | ∃x ∈ X (x, y) ∈ f }.
Uwaga 4.7.3 Dwie funkcje częściowe (X1 , f1 , Y1 ) i (X2 , f2 , Y2 ) są sobie równe wtedy i tylko wtedy gdy X1 = X2 i
f1 = f2 i Y1 = Y2 .
Pakiet Relations.m umożliwia sprawdzenie czy relacja jest funkcją częściową. Na przykład pisząc
rR = R e l a t i o n [ { a , b , c } , {b −> b , c −> c , b −> a } ]
I s P a r t i a l F u n c t i o n [ rR ]
otrzymamy odpowiedź False.
4.7.3
Funkcje
Aby funkcja cz˛eściowa f była funkcja˛ musimy jeszcze dodać warunek, że dla każdego x ∈ X istnieje y ∈ Y taki, że (x, y) ∈ f . Wykorzystujac
˛ poj˛ecie
dziedziny, możemy ten wymóg sformułować nast˛epujaco:
˛
Definicja 4.7.4 Jeżeli dla funkcji częściowej (X, f, Y ) spełniony jest warunek dom f = X, to piszemy
f :X→Y
i mówimy, że (X, f, Y ) jest funkcją z X do Y lub odwzorowaniem z X do Y lub przekształceniem X w Y . Często, od
strony formalnej niepoprawnie, mówimy, że to f jest funkcją, rozumiejąc, że jest jasne o jakie X i Y chodzi.
Na zbiór funkcji z X do Y stosujemy oznaczenie
Y X := { f | f : X → Y - funkcja z X do Y }
Przykład 4.7.5
1. Niech c ∈ Y . Wtedy { (x, c) | x ∈ X } jest funkcją z X do Y . Nazywamy ją funkcją stałą.
2. Relacja identycznościowa ∆X jest funkcją ∆X : X → X.
3. Relacja pełna w przestrzeni X nie jest funkcją z wyjątkiem przypadku gdy X jest pusty lub jest singletonem.
88
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Rysunek 4.7: Zawieranie funkcji
4.7.4
(*)Zawieranie się funkcji
Uwaga 4.7.6 Niech f, g : X−→
◦ Y . Wtedy warunek f ⊂ g jest równoważny koniunkcji warunków
dom f ⊂ dom g
i
∀x ∈ dom f
f (x) = g(x).
Przykład zawierania się funkcji przedstawiono na rys. 4.7
Definicja 4.7.7 Niech f, g będą fukcjami częściowymi z X do Y . Mówimy, że f jest zawężeniem g lub g jest rozszerzeniem f jeżeli f ⊂ g.
Niech f : X → Y , A ⊂ X. Zawężeniem funkcji f do A nazywamy funkcję
f|A := f ∩ A × Y.
4.7.5
Sklejenie funkcji
Uwaga 4.7.8 Niech f, g będą fukcjami częściowymi z X do Y . Suma f ∪ g jest funkcją częsciową z X do Y wtedy i
tylko wtedy gdy
∀x ∈ dom f ∩ dom g f (x) = g(x).
Definicja 4.7.9 Jeśli f, g : X−→
◦ Y są funkcjami częściowymi z X do Y i f ∪ g jest funkcją to nazywamy ją sklejeniem
funkcji f i g.
Przykładowe sklejenie funkcji przedstawiono na rys. 4.8
4.7. FUNKCJE
89
Rysunek 4.8: Sklejenie funkcji
4.7.6
(*)Zestawienie i iloczyn kartezjański funkcji
Definicja 4.7.10 Niech f : X → Y i g : X → Z. Zestawieniem funkcji f i g nazywamy funkcję
(f, g) : X 3 x 7→ (f (x), g(x)) ∈ X × Y.
Definicja 4.7.11 Niech f : X1 → Y1 , a g : X2 → Y2 . Iloczynem kartezjańskim funkcji f i g nazywamy funkcję
f × g : X1 × X2 3 (x1 , x2 ) → (f (x1 ), g(x2 )) ∈ Y1 × Y2 .
Oznaczenie na zestawienie i iloczyn kartezjański funkcji koliduje z parą funkcji i iloczynem kartezjańskim funkcji
potraktowanych jako zbiory. Jednak w tym drugim znaczeniu oznaczeń tych praktycznie się nie używa, więc ryzyko błędnej
interpretacji jest minimalne.
4.7.7
Obrazy i przeciwobrazy
Niech f : X → Y , A ⊂ X, B ⊂ Y . Obrazem zbioru A nazywamy
f (A) := { y ∈ Y | ∃x ∈ A y = f (x) }.
Przeciwobrazem zbioru B nazywamy
f −1 (B) := { x ∈ X | f (x) ∈ B }.
Uwaga 4.7.12 Niech f : X → Y , a A, A1 , A2 ⊂ X i B, B1 , B2 ⊂ Y będą zbiorami. Wtedy
A1 ⊂ A2 ⇒ f (A1 ) ⊂ f (A2 ),
B1 ⊂ B2 ⇒ f −1 (B1 ) ⊂ f −1 (B2 ),
f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 ),
f
−1
f
−1
(B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 ),
f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 ),
(B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ),
f (f −1 (B)) = B ∩ im f,
f −1 (f (A)) ⊃ A.
90
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
4.7.8
Złożenie funkcji
Twierdzenie 4.7.13 Niech f : X−→
◦ Y , g : Y −→
◦ Z będą funkcjami częściowymi. Wtedy g ◦ f jest funkcją częściową z
X do Z,
dom g ◦ f = f −1 (dom g),
oraz dla x ∈ dom g ◦ f
g ◦ f (x) = g(f (x)).
Co więcej, jeśli f i g są funkcjami, to g ◦ f jest funkcją.
4.7.9
Injekcje, surjekcje, i bijekcje.
Relacja odwrotna do relacji jednolistnej nie musi być jednolistna. Zatem relacja odwrotna do funkcji częściowej nie musi być
funkcją częściową.
Funkcję f : X → Y nazywamy injekcją, jeżeli dla dowolnych x1 , x2 ∈ X
f (x1 ) = f (x2 ) ⇒ x1 = x2 .
Funkcję f nazywamy surjekcją, jeżeli dla dowolnego y ∈ Y istnieje x ∈ X takie, że y = f (x). Funkcję f nazywamy bijekcją
jeśli jest injekcją i surjekcją.
Twierdzenie 4.7.14 Niech f : X → Y będzie funkcją. Relacja odwrotna f −1 jest jednolistna wtedy i tylko wtedy gdy
f jest injekcją. Relacja odwrotna f −1 jest funkcją wtedy i tylko wtedy gdy f jest bijekcją.
Relację odwrotną do bijekcji nazywamy funkcją odwrotną.
4.7.10
Iloczyn kartezjański n zbiorów
Iloczyn kartezjański nie jest łączny:
(X × Y ) × Z 6= X × (Y × Z),
bo ((a, b), c) 6= (a, (b, c)). Jest jednak naturalna bijekcja
(X × Y ) × Z 3 ((a, b), c) 7→ (a, (b, c)) ∈ X × (Y × Z),
która pozwala utożsamiać te zbiory. Pozwala to mówić o iloczynie kartezjańskim trzech (i analogicznie) więcej zbiorów bez
podawania nawiasów. Dla n-krotnego iloczynu kartezjańskiego zbioru X przez siebie stosujemy krótką notację X n .
4.7.11
Sumy i iloczyny indeksowane
Definicja 4.7.15 Często zdarza się, że rodzina podzbiorów zbioru X zadana jest jako kodziedzina odwzorowania, t.zw.
odwzorowania indeksującego A : J → P(X). Wtedy rodzinę tę zapisujemy często jako {Aj }j∈J oraz wprowadzamy
oznaczenia na sumę i przecięcie tej rodziny
\
[
[
\
Aj :=
{ Aj | j ∈ J },
Aj :=
{ Aj | j ∈ J }.
j∈J
j∈J
4.8. RÓWNOLICZNOŚĆ ZBIORÓW. TWIERDZENIE CANTORA I CANTORA-BERNSTEINA.
91
Twierdzenie 4.7.16 Niech A : J → P(X) będzie odwzorowaniem indeksującym rodzinę podzbiorów X. Jeśli J =
J1 ∪ J2 , to

 


 

[
[
[
\
\
\
Aj = 
Aj  ∪ 
Aj  ,
Aj = 
Aj  ∩ 
Aj  .
j∈J
Ponadto
j∈J1
j∈J2

j∈J

[
\
Aj  =
j∈J
j∈J1

\
\Aj ,
\
j∈J
j∈J2

\
Aj  =
j∈J
[
\Aj .
j∈J
Jeśli dodatkowo B : K → P(Y ) jest odwzorowaniem indeksującym rodzinę podzbiorów Y , to


!
[
[
[


Aj ×
Bk =
Aj × B k ,
j∈J

k∈K
[

Aj  ∩
j∈J

!
[
Bk

j∈J
=
k∈K
Aj  ∪
[
Aj ∩ B k ,
(j,k)∈J×K

\
4.8
(j,k)∈J×K

!
\
k∈K
Bk
=
\
Aj ∪ B k .
(j,k)∈J×K
Równoliczność zbiorów. Twierdzenie Cantora i Cantora-Bernsteina.
Definicja 4.8.1 Zbiory X, Y nazywamy równolicznymi jeśli istnieje bijekcja f : X → Y .
Twierdzenie 4.8.2 Relacja równoliczności zbiorów jest relacją równoważności w klasie pełnej.
Twierdzenie 4.8.3 (Cantora) Żaden zbiór nie jest równoliczny ze zbiorem swoich podzbiorów.
Dowód: Dla dowodu nie wprost przypuśćmy, że dla pewnego zbioru X istnieje bijekcja f : X 7→ 2X . Rozważmy zbiór
Z := { x ∈ X | x 6∈ f (x) }.
X
Z definicji zbioru Z wynika, że Z ∈ 2 . Zatem, ponieważ f jest bijekcją, wnosimy, że istnieje z ∈ X takie, że f (z) = Z.
Zachodzi jeden z dwóch przypadków: albo z ∈ Z, albo z 6∈ Z. W pierwszym przypadku wnosimy z definicji zbioru Z, że
z 6∈ f (z) = Z, otrzymujemy więc sprzeczność. Podobnie, w przypadku drugim, mamy z 6∈ Z. Ale wtedy z ∈ f (z) = Z, co
ponownie daje sprzeczność. Tak więc w każdym z możliwych dwóch przypadków otrzymujemy sprzeczność, co dowodzi, że
nasze przypuszczenie o istnieniu bijekcji było fałszywe.
Twierdzenie 4.8.4 (Cantora-Bernsteina) Jeśli zbiór A jest równoliczny z podzbiorem zbioru B, a zbiór B jest równoliczny z podzbiorem zbioru A, to zbiory A i B są równoliczne.
Dowód: ....
92
ROZDZIAŁ 4. ELEMENTY TEORII MNOGOŚCI
Rozdział 5
Liczby naturalne. Indukcja i rekurencja.
Naszym celem w tym i nast˛epnym rozdziale jest naszkicowanie konstrukcji zbiorów liczbowych na gruncie teorii mnogości. Czasami, jak to zrobimy w przypadku zbioru liczb całkowitych, wymiernych, czy zespolonych wygodnie jest przeprowadzić bezpośrednie konstrukcje. Robimy tak zazwyczaj wtedy, gdy jest jakaś
szczególnie naturalna, narzucajaca
˛ si˛e konstrukcja. Jeśli możliwych, istotnie różnych konstrukcji jest wiele, preferujemy podanie ogólnej definicji wraz ze stwierdzeniem pokazujacym,
˛
że stosowny zbiór da si˛e skonstruować i to w jedyny, z dokładnościa˛ do pewnego utożsamienia, sposób. Tak postapimy
˛
w przypadku liczb
naturalnych i liczb rzeczywistych.
Ponadto w rozdziale tym zdefiniujemy poj˛ecie działania, grupy oraz ciała. Poj˛ecia te pozwalaja˛ uogólnić koncepcj˛e dodawania i mnożenia liczb i dowodzić
twierdzenia modelowane na własnościach liczb, a prawdziwe w znacznie szerszym zakresie. W przypadku takich ogólnych definicji cz˛esto używamy poj˛ecia
aksjomatyka. Należy jednak podkreślić, że użycie słowa aksjomatyka w odniesieniu do definicji nie oznacza, że rozszerzamy zbiór aksjomatów. W matematyce
budowanej w oparciu o teri˛e mnogości jedyne potrzebne aksjomaty to aksjomaty teorii mnogości.
5.1
5.1.1
Liczby naturalne
Aksjomatyka liczb naturalnych
Naturalne jest przyjać,
˛ że pierwotny pasterz, który wiedział, że ma stado owiec liczace
˛ n sztuk, był świadom, że może też mieć stado o jedna˛ sztuk˛e wi˛eksze. "O
jeden wi˛ecej" to bardzo naturalne i bardzo elementarne poj˛ecie w matematyce określane mianem nast˛epnika. Jest ono podstawa˛ nast˛epujacej
˛ definicji określanej
mianem aksjomatyki liczb naturanych.
Użycie zwrotu aksjomatyka w odniesieniu do tej definicji służy jedynie podkreśleniu, że wszystkie twierdzenia, które wywieść można z danej definicji stanowia˛
ważna˛ teori˛e, która może być rozwijana niezależnie od teorii mnogości.
Definicja 5.1.1 Struktura liczb naturalnych to trójka (N, 0, s) spełniająca warunki
(i)
N jest zbiorem,
(ii)
s : N → N jest injekcją,
(iii)
0 ∈ N \ s(N )
(iv)
(zasada indukcji) dla dowolnego K ⊂ N jeśli
(iv.1)
0 ∈ K,
(iv.2)
n ∈ K ⇒ s(n) ∈ K
to K = N .
93
94
ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA.
Rysunek 5.1: John von Neumann, 1903-1957, Źródło: Wikipedia
5.1.2
Konstrukcja von Neumanna
Postawienie powyższej definicji oczywiście nie gwarantuje, że coś co spełnia wymogi tej definicji rzeczywiście istnieje i jest w jakimś rozsadnym
˛
sensie dokładnie
jedno (nie chcielibyśmy mieć wielu istotnie różnych zbiorów liczb naturalnych). Dlatego potrzebna jest jakaś konstrukcja zbioru liczb naturalnych na gruncie teorii
mnogości oraz uzasadnienie jednoznaczności. Formalna˛ konstrukcj˛e zbioru liczb naturalnych na gruncie teorii mnogości, a dokładniej w oparciu o aksjomat
nieskończoności, podał amerykański matematyk w˛egierskiego pochodzenia, John von Neumann (rys. 5.1).
Rol˛e nast˛epnika pełni w niej funkcja S wykorzystywana w aksjomacie nieskończoności. Nie możemy skorzystać z operacji dodania jedynki, bo na tym etapie
formalizacji nie mamy jeszcze formalnie zdefiniowanego dodawania liczb. Dodawanie zdefiniujemy dopiero w oparciu o poj˛ecie nast˛epnika.
Twierdzenie 5.1.2 Trójka spełniająca warunki definicji 5.1.1 istnieje.
Dowód: Przypomnijmy, że następnikiem zbioru a nazywamy zbiór S(a) := a ∪ {a}. Powiemy, że zbiór A jest induktywny,
jeśli spełnia dwa warunki
∅∈A
a ∈ A ⇒ S(a) ∈ A.
Łatwo sprawdzić, że przecięcie dowolnej rodziny zbiorów induktywnych, w szczególności dwóch zbiorów induktywnych, też
jest zbiorem induktywnym. Na mocy aksjomatu nieskończoności przynajmniej jeden zbiór induktywny istnieje. Ustalmy jeden
taki zbiór i oznaczmy go L. To mógłby być nasz zbiór liczb naturalnych, ale może być w nim coś więcej, dlatego musimy się
tych ewentualnych,
niepotrzebnych elementów pozbyć. Niech L oznacza rodzinę wszystkich induktywnych podzbiorów L i
T
niech N := L. Łatwo sprawdzamy, że zbiór N też jest induktywny.
Co więcej, jeśli K jest zbiorem induktywnym, to K ∩ L jest zbiorem induktywnym zawartym w L. Stąd N ⊂ K ∩ L ⊂ K,
zatem N zawiera się w dowolnym innym zbiorze induktywnym. Zatem N jest najmniejszym zbiorem induktywnym w sensie
relacji inkluzji.
Przyjmujemy oznaczenia:
0
s(n)
:= ∅,
:= S(n) dla n ∈ N .
5.1. LICZBY NATURALNE
95
Sprawdzimy, że trójka (N, 0, s) spełnia warunki definicji 5.1.1. Wiemy już, że N jest zbiorem, więc własność (i) zachodzi.
Oczywiście 0 = ∅ ∈ N , a ponieważ n ∈ s(n), więc dla dowolnego n ∈ N mamy s(n) 6= ∅ = 0. co pokazuje własność (iii).
Własność (iv) definicji 5.1.1 stwierdza, że każdy induktywny podzbiór N jest równy N . Zatem wynika ona natychmiast z
naszej wcześniejszej obserwacji, że N zawiera się w każdym zbiorze induktywnym. Aby udowodnić własność (ii) pokażemy
najpierw, że
∀n ∈ N ∀m ∈ N m ∈ n ⇒ m ⊂ n.
(5.1)
Niech
N 0 := { n ∈ N | ∀m ∈ N m ∈ n ⇒ m ⊂ n }.
Wystarczy pokazać, że N 0 jest induktywny. Zauważmy, że implikacja
m∈∅ ⇒ m⊂∅
jest pusto spełniona. Zatem 0 = ∅ ∈ N 0 , co oznacza, że zbiór N 0 spełnia warunek (iv.1). Aby pokazać (iv.2) załóżmy, że
n ∈ N 0 . Aby pokazać, że s(n) ∈ N 0 weźmy m ∈ s(n). Ponieważ założyliśmy, że n ∈ N 0 , więc z definicji zbioru n0 wnosimy,
że w szczególności dla naszego m zachodzi implikacja
m ∈ n ⇒ m ⊂ n.
(5.2)
Z definicji s(n) i przesłanki m ∈ s(n) wnosimy, że albo m ∈ n albo m = n. W pierwszym przypadku z implikacji (5.2)
wnosimy, że m ⊂ n. W drugim przypadku ta inkluzja jest oczywista. Zatem dla dowolnego n ∈ N pokazaliśmy implikację
m ∈ s(n) ⇒ m ⊂ s(n),
co dowodzi, że s(n) ∈ N 0 . Zatem z przesłanki n ∈ N 0 wynika, że s(n) ∈ N 0 . Dowodzi to, że N 0 spełnia również warunek (iv.2),
czyli jest induktywny. Zatem z pokazanej już własności (iv) wnosimy, że N 0 = N , a to dowodzi prawdziwości formuły (5.1).
Możemy teraz pokazać własność (ii). Załóżmy, że dla pewnych n, m ∈ N mamy s(n) = s(m). Wtedy w szczególności
n ∈ s(n) = s(m), zatem albo n ∈ m albo n = m. Zatem z (5.1) w pierwszym przypadku, a w sposób oczywisty w drugim
przypadku, dostajemy n ⊂ m. Zamieniając m i n rolami dostajemy dowód, że m ⊂ n. Zatem m = n, czyli s jest iniekcją. Warto się przyjrzeć jak wygląda kilka początkowych liczb naturalnych według von Neumanna. I tak, mamy
0
:= ∅,
1
:= s(0) = {∅},
2
:= s(1) = {∅} ∪ {{∅}} = {∅, {∅}},
3
:= s(2) = {∅, {∅}} ∪ {{∅, {∅}}} = {∅, {∅}, {∅, {∅}}},
··· .
Konstrukcja von Neumanna nie jest jedyna˛ możliwa.˛ Na przykład można przyjać
˛
0
:= ∅,
1
:= {∅},
2
:= {{∅}},
3
:= {{{∅}}},
··· .
W tym momencie widać pożytek z postawienia formalnej definicji (aksjomatyki) zbioru liczb naturalnych. Pozwala ona na codzień nie myśleć o skomplikowanej
konstrukcji liczb naturalnych i badać ich własności jedynie poprzez odnoszenie si˛e do własności podanych w definicji.
Szczególna˛ rol˛e pełni własność 5.1.1(iv). Jest ona podstawa˛ schematu dowodowego zwanego dowodem przez indukcj˛e. Schemat ten mówi, że aby udowodnić
iż pewna własność przysługuje wszystkim liczbom naturalnym, wystarczy pokazać, że przysługuje ona liczbie 0 oraz udowodnić implikacj˛e, że jeśli przysługuje
liczbie naturalnej n to przysługuje liczbie nast˛epnej S(n).
Tradycyjnie zbiór liczb naturalnych oznaczamy przez N i stosujemy notację n∗ := S(n) dopóki nie zdefiniujemy formalnie
dodawania liczb naturalnych oraz liczby jeden.
96
ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA.
5.2
Ciągi i rekurencja.
Jesteśmy wreszcie gotowi podać formalna˛ definicj˛e ciagu.
˛ Do tego potrzebowaliśmy definicji funkcji oraz definicji zbioru liczb naturalnych. Ciag
˛ to po prostu funkcja
ze zbioru liczb naturalnych do dowolnego innego zbioru.
5.3
5.3.1
Ciągi i podciągi
Definicja ciągu i podciągu
Definicja 5.3.1 Ciągiem w zbiorze X nazywamy dowolne odwzorowanie a : N → X.
Dla ciągu a obok notacji funkcyjnej a(n) dla wartości a w n stosujemy też tradycyjną notację ciągową an := a(n). O an
mówimy często, że jest n-tym wyrazem ciągu a lub krótko wyrazem ciągu a.
Definicja 5.3.2 Niech X będzie zbiorem, c : N → X ciągiem o wartościach w X, a k : N → N ciągiem silnie rosnącym.
Wtedy ciąg będący złożeniem c ◦ k nazywamy podciągiem ciągu c. Jego n-tym wyrazem jest (c ◦ k)(n). Tradycyjnie
oznaczamy go ckn .
Rozważmy ciagi
˛
1
∈ Q,
1+n
k : N ∈ n → 2n ∈ N.
a:N3n→
Poczatkowe
˛
wyrazów ciagu
˛ a to
1 1 1
1, , , , . . .
2 3 4
Poczatkowe
˛
wyrazy ciagu
˛ k to
0, 2, 4, 6, . . .
Ciag
˛ k jest rosnacym
˛
ciagiem
˛
o wartościach w N. Zatem możemy rozważać złożenie b := a ◦ k : N → Q. Złożenie to jest ciagiem
˛
b : N 3 n → a(k(n)) = akn =
1
∈ Q.
1 + 2n
Kilka poczatkowych
˛
wyrazów ciagu
˛ b to
1,
1
1
= ,
1+2×1
3
1
1
= ,
1+2×2
5
1
1
= ,....
1+2×3
7
Widać wi˛ec, że ciag
˛ b jest zbudowany z wybranych wyrazów ciagu
˛ a, przy czym wyboru dokonujemy przy pomocy ciagu
˛ k . Wyjaśnia to nazw˛e podciag.
˛
5.3.2
Ciąg przybliżeń pierwiastka jeszcze raz.
Ciąg instrukcji, który wykorzystywaliśmy do liczenia przybliżeń pierwiastka wygodnie zapakować w postaci programu, z
którego można korzystać wielokrotnie. Program ten przedstawiono na listingu 5.1. Wystarczy teraz napisać
SqrtTwo [ 3 ]
i otrzymamy
{
707 283
,
}.
500 200
5.3. CIĄGI I PODCIĄGI
97
( ∗ D e f i n i u j e m y f u n k c j ę o nazwie SqrtTwoBf o b l i c z a j ą c ą p i e r w i a s t e k z dwóch
z jednym argumentem o k r e ś l a j ą c y m żądaną d o k ł a d n o ś ć ∗ )
SqrtTwoBf [ n_ ] := ( ∗ Znak p o d k r e ś l e n i a po n i n f o r m u j e , ż e n j e s t argumentem ∗ )
Module [ { i } , ( ∗ Moduł może z a w i e r a ć zmienne l o k a l n e .
I c h l i s t ę umieszczamy na p o c z ąt k u ∗ )
i = 1 ; ( ∗ I n i c j a l i z u j e m y zmienną i w a r t o ś c i ą j e d e n ∗ )
While [
( ∗ Początek p ę t l i ∗ )
i ^2 < 2∗100^n , ( ∗ P ę t l ę wykonujemy j a k długo s p e ł n i o n y j e s t warunek ∗ )
i = i + 1 ( ∗ Jedyna i n s t r u k c j a wewnątrz n a s z e j p ę t l i ∗ )
] ; ( ∗ Koniec p ę t l i ∗ )
( ∗ O s t a t n i e o b l i c z o n e w y r a ż e n i e t o w a r t o ś ć zwracana p r z e z f u n k c j ę ∗ )
( ∗ J e s t nim para ułamków s z a c u j ą c y c h p i e r w i a s t e k od dołu i góry ∗ )
{ ( i − 1)/10^ n , i /10^n}
] ( ∗ Koniec modułu d e f i n i u j ą c e g o f u n k c j ę ∗ )
Listing 5.1: Obliczania pierwiastka metodą brutalnej siły zademonstrowane w języku Mathematica. Tekst zamknięty w
parach dwuznaków (* i *) oznacza komentarz.
( ∗ Funkcja o b l i c z a j ą c a p i e r w i a s t e k z l i c z b y a>0 z d o k ł a d n o ś c i ą do d c y f r ∗ )
S q r t B f P l u s [ a_ , d_ ] :=
Module [ { i , n } ,
( ∗ Zmienne l o k a l n e : l i c z n i k i mianownik ∗ )
i = 1; n = 1;
While [ True , ( ∗ Główną p ę t l ę przerwiemy i n s t r u k c j ą Break p o n i ż e j ∗ )
( ∗ Wewnętrzna p ę t l a d o b i e r a w a r t o ś ć l i c z n i k a do a k t u a l n e g o mianownika ∗ )
While [ ( i + 1 ) ∗ ( i + 1 ) < a ∗n∗n , i = i + 1 ] ;
( ∗ Po o s i ą g n i ę c i u ż ą d a n e j d o k ł a d n o ś c i wychodzimy z p ę t l i ∗ )
I f [ n >= 10^d , Break [ ] ] ;
( ∗ Rozszerzamy r e p r e z e n t a c j ę ułamka p r z e d kolejnym p r z e j ś c i e m p ę t l i ∗ )
i = i ∗10;
n = n∗10;
];
{ i /n , ( i + 1 ) / n}
]
Listing 5.2: Usprawnione podejście do obliczania pierwiastka przedstawione w programie Mathematica.
Ćwiczenie komputerowe 5.3.3 Adaptuj nasz program SqrtTwoBf do SqrtBf tak by liczył pierwiastek z dowolnej
liczby naturalnej.
Ćwiczenie komputerowe 5.3.4 Sprawdź doświadczalnie jak rośnie czas obliczeń naszego algorytmu SqrtTwo przy
zwiększaniu dokładności. Warto wiedzieć, że obliczenie wyrażenia, którego wykonanie w programie Mathematica trwa
zbyt długo zawsze można przerwać wybierając w menu Evaluation opcję Abort evaluation.
Jak widać nasz algorytm liczenia pierwiastka jest daleki od doskonałości. Znacznie ulepszoną wersję przedstawiono na
listingu 5.2 Jak zobaczymy niebawem są jeszcze lepsze algorytmy. Warto jednak uświadomić sobie, że, choć tego nie jesteśmy
w stanie zaobserwować przy obliczaniu pojedynczego pierwiastka, jedną z przyczyn, dla których obliczenia przy dużej
dokładnosci są dość wolne jest przekroczenie pojemności maszynowego typu int i konieczność programowego symulowania
większej pojemności. Między innymi z tego powodu w tradycyjnych obliczeniach numerycznych zamiast dokładnych – ale na
ogół bardzo wolnych – obliczeń na liczbach całkowitych lub ułamkach preferuje się znacznie szybsze, ale obarczone pewnym
błędem, obliczenia na maszynowych liczbach zmiennopozycyjnych takich jak double, o których opowiemy w rozdziale 8.2.
98
ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA.
Ćwiczenie komputerowe 5.3.5 Adaptuj program z listingu 5.1 lub listingu 5.2 tak by wyznaczał ciąg przybliżeń
dodatniego pierwiastka równania
x2 + x = 3.
Listing 5.2 prezentuje nieco udoskonaloną wersję liczenia pierwiastka metodą brutalnej siły. Zastosowano tu pętlę w
pętli, by przy obliczeniach dla zwiększonej dokładności niepotrzebnie nie powtarzać tego co już jest wiadome na podstawie
obliczeń wcześniejszych.
Ćwiczenie komputerowe 5.3.6 Zmodyfikuj program z listingu 5.2 tak, by liczył
go dla liczb, dla których znasz prawidłową odpowiedź.
5.3.3
√
3
a dla zadanej liczby a. Przetestuj
Monotoniczność ciągu.
Twierdzenie 5.3.7 Niech X będzie przestrzenią uporządkowaną. Ciąg a : N → X jest słabo rosnący wtedy i tylko
wtedy gdy
∀n ∈ N an ¬ an+1 .
Jest on silnie rosnący wtedy i tylko wtedy gdy
∀n ∈ N
an < an+1 .
Analogicznie można scharakteryzować ciągi słabo i silnie malejące.
5.4
Rekurencyjne definiowanie ciągu.
Zobaczymy w rozdziale 5.4.1, że dla a > 1 funkcja
f : R+ 3 x 7→
ma t˛e sympatyczna˛ własność, iż jeśli x jest przybliżeniem
√
wyprodukować ciag
˛ coraz lepszych przybliżeń a
√
a + x2
∈ R+
2x
a, to f (x) jest jeszcze lepszym przybliżeniem
√
a. Zaczynajac
˛ od liczby jeden możemy zatem
1, f (1), f (f (1)), f (f (f (1))), . . . .
Cecha˛ tego ciagu
˛ jest to, że aby wyliczyć wyraz n-ty musimy już mieć policzony wyraz (n − 1)-szy. Podanie ogólnego wzoru na n-ty wyraz jest jednak trudne
o ile w ogóle możliwe. Może si˛e zatem pojawić watpliwość.
˛
Jeśli nie potrafimy podać wzoru na 4N4-ty wyraz, to czy rzeczywiście możemy mówić o dobrze
zdefiniowanym ciagu?
˛
Poniższe twierdzenie o rekurencyjnym definiowaniu ciagu
˛ upewnia nas, że takie post˛epowanie prowadzi do dobrze zdefiniowanego ciagu.
˛
Twierdzenie 5.4.1 (o rekurencyjnym definiowaniu ciągu) Niech f : X → X będzie funkcją i niech c ∈ X. Wtedy
istnieje dokładnie jeden ciąg a : N → X taki, że
a0
=
c,
∀n ∈ N an∗
=
f (an ).
5.4. REKURENCYJNE DEFINIOWANIE CIĄGU.
99
( ∗ S z y b k i e o b l i c z a n i e p i e r w i a s t k a z l i c z b y a z d o k l a d n o s c i a do e p s i l o n ∗ )
SqrtQuick [ a_ , d_ ] := Module [ { x , e p s } ,
e p s = 10^(−d ) ; ( ∗ żądana d o k ł a d n o ś ć ∗ )
x = 1 ; ( ∗ w a r t o ś ć początkowa c i ą g u r e k u r e n c y j n e g o ∗ )
While [ Abs [ x∗x − a ] / 2 > eps , ( ∗ j e ś l i n i e o s i ą g n i ę t o ż ą d a n e j d o k ł a d n o ś c i ∗ )
x = ( x∗x + a ) / ( 2 ∗ x ) ; ( ∗ nowa w a r t o ś ć c i ą g u r e k u r e n c y j n e g o ∗ )
Print [N[ { x − ( x∗x − a ) / 2 , x } , d + 1 ] ] ( ∗ wydruk k o n t r o l n y ∗ )
];
{x − ( x∗x − a ) / 2 , x} ( ∗ końcowy wynik ∗ )
]
Listing 5.3: Szybkie wyznaczenie ciągu przybliżeń pierwiastka w języku Mathematica.
Powyższe twierdzenie dowodzi si˛e przy pomocy zasady indukcji. Twierdzenie to pozwala definiować ciagi
˛ bez wypisywania jawnego wzoru na n-ty wyraz.
Wystarczy podać wyraz poczatkowy
˛
oraz recept˛e jak z wyrazu n-tego dostać wyraz (n + 1). Mówimy wtedy o rekurencyjnym definiowaniu ciagu.
˛
Twierdzenie 5.4.2 Trójka spełniająca warunki definicji 5.1.1 istnieje dokładnie jedna w tym sensie, że jeśli
(N1 , 01 , S1 ) i (N2 , 02 , S2 ) są dwiema takimi strukturami, to istnieje bijekcja f : N1 → N2 taka, że f (01 ) = (02 )
oraz dla każdego n ∈ N1 zachodzi f (S1 (n)) = S2 (f (n)).
Dowód: ....
5.4.1
Pierwiastek poprzez ciąg rekurencyjny.
Jako ilustracj˛e pożytków z ciagu
˛ zdefiniowanego rekurencyjnie rozważymy nast˛epujac
˛ a,˛ bardzo szybka˛ metod˛e liczenia pierwiastka z liczby a. Używamy w tym
celu ciagu
˛ zadanego rekurencyjnie wzorami
x0
xn
:=
1
a + x2n
:=
2xn
√
Można pokazać, że ciag
˛ ten jest zbieżny do a, i to bardzo szybko.
Program liczacy
˛ pierwiastek ta˛ metoda˛ napisany w j˛ezyku Mathematica przedstawiono na listingu 5.3.
Problem 5.4.3 Jak ocenić pr˛edkość zbieżności? Jak skonstruować ciag,
˛ który b˛edzie możliwie szybko zbieżny do poszukiwanej liczby?
Odpowiedzi na pytania tego typu daje analiza numeryczna oraz teoria aproksymacji.
Rekurencyjne definiowanie ciagów
˛
dost˛epne jest również w j˛ezykach programowania. Mówi si˛e tam o rekurencyjnym wywoływaniu funkcji, ale chodzi o funkcje
z argumentem b˛edacym
˛
liczba˛ naturalna,˛ a wi˛ec w terminologii przyj˛etej w matematyce o ciag.
˛ W j˛ezyku Mathematica definicj˛e rekurencyjna˛ podaje si˛e jako par˛e
wzorów. Na ogół bardzo upraszcza to pisanie programu, choć cz˛esto odbija si˛e to na jego efektywności. Na przykład wersja rekurencyjna szybkiego liczenia
pierwiastka z listingu 5.3 to
Q u i c k S q r t [ a_ , 0 ] = 1 ;
Q u i c k S q r t [ a_ , n_ ] : = Module [ { x } , x = Q u i c k S q r t [ a , n − 1 ] ; ( x ^ 2 + a ) / ( 2 ∗ x ) ] ;
Piszac
˛
QuickSqrt [2. ,4]
√
otrzymujemy przybliżenie 2 z dokładnościa˛ do 5 miejsc po przecinku. W rozwiazaniu
˛
tym jest jednak pewnym problemem jak dobrać wyraz ciagu
˛ by uzyskać
żadan
˛ a˛ dokładność.
Definicj˛e rekurencyjna QuickSqrt można zapisać jeszcze krócej, bez użycia modułu:
100
ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA.
Q u i c k S q r t [ a_ , 0 ] = 1 ;
Q u i c k S q r t [ a_ , n_ ] : =
( QuickSqrt [ a , n − 1]^2 + a )/(2∗ QuickSqrt [ a , n − 1 ] ) ;
Ćwiczenie komputerowe 5.4.4
˛
działa. Zastanów si˛e ile razy wywoływana jest funkcja QuickSqrt by obliczyć
√ Sprawdź czy i jak to rozwiazanie
2. Wyciagnij
˛ wnioski.
czwarty wyraz ciagu
˛ przybliżajacego
˛
5.4.2
(*)Arytmetyka liczb natualnych
Jesteśmy teraz gotowi podać formalne definicje dodawania i mnożenia liczb naturalnych. Sa˛ to definicje rekurencyjne. Wykorzystujemy w nich aksjomatycznie
dana˛ funkcj˛e nast˛epnika. Przypomnijmy, że nast˛epnik liczby n oznaczamy n∗ .
Operacje dodawania liczb naturalnych definiujemy rekurencyjnie:
m+0
m+n
m
:=
∗
(5.3)
∗
(m + n)
:=
(5.4)
Liczbę jeden, oznaczaną 1, definiujemy jako następnik zera. Tak więc 1 := 0∗ . Podstawiając zero w miejsce n we wzorze 5.4
i wykorzystując 5.3 ortzymujemy
m + 0∗ = (m + 0)∗ = m∗ .
Zatem definiując liczbę jeden jako następnik zera, to jest przyjmując 1 := 0∗ otrzymujemy
m + 1 = m∗ ,
co pozwala nam zapisywać następnik n w tradycyjnej formie n + 1.
Również rekurencyjnie definiujemy iloczyn:
m·0
m·n
∗
:=
0
:= m · n + m
Zwyczajowo znak mnożenia w iloczynie pomijamy, jeśli nie prowadzi to do nieporozumień.
Możemy teraz podać formalną definicję nierówności.
Definicja 5.4.5 Mówimy, że m jest nie większe (mniejsze lub równe) od n i piszemy m ¬ n jeżeli
∃k ∈ N m + k = n.
Mówimy, że m jest mniejsze niż n jeżeli m ¬ n i m 6= n.
Podobnie definiujemy podzielność.
Definicja 5.4.6 Mówimy, że m dzieli n i piszemy m|n jeżeli
∃k ∈ N m · k = n.
Można indukcyjnie pokazać, że w obu powyższych przypadkach jeśli k istnieje to jest jedyne. Nazywamy je odpowiednio
n
różnicą (dla nierówności) oraz ilorazem (dla podzielności) i oznaczamy odpowiednio n − m i m
.
Dla p ∈ N ędziemy stosować oznaczenia
Np
:= { n ∈ N | n p },
Ip :
=
Zauważmy, że w szczególności N0 = N oraz I0 = ∅.
{ n ∈ N | 1 ¬ n ¬ p }.
5.5. ZBIORY SKOŃCZONE I PRZELICZALNE
5.5
101
Zbiory skończone i przeliczalne
Definicja 5.5.1 Mówimy, że zbiór X jest skończony, jeśli istnieje liczba naturalna n ∈ N taka, że zbiór X jest
równoliczny ze zbiorem In . Wtedy liczbę n nazywamy mocą zbioru X i piszemy card X = n. Mówimy, że zbiór X jest
przeliczalny, jeżeli X jest równoliczny ze zbiorem liczb naturalnych.
Definicja 5.5.2 Ciągiem skończonym w zbiorze X nazywamy dowolne odwzorowanie a : Ip → X.
5.6
Rozszerzona zasada indukcji
Czasami wzór czy twierdzenie, które chcemy dowieść przy pomocy zasady indukcji nie ma sensu dla liczby zero, czy kilku poczatkowych
˛
liczb naturalnych. Innymi
słowy odnosi si˛e do zbioru Np = {p, p + 1, p + 2, . . .}. Co wi˛ecej, przy dowodzeniu wzgl˛ednej prawdziwości twierdzenia dla n w drugim kroku indukcyjnym
wygodnie jest skorzystać z założenia indukcyjnego nie tylko dla n − 1, ale dla wszystkich k < n. Poprawność takiego post˛epowania uzasadnia nast˛epujaca
˛
rozszerzona zasada indukcji.
Twierdzenie 5.6.1 (Rozszerzona zasada indukcji) Niech p ∈ N oraz Z ⊂ N. Jeżeli zachodzą warunki
(i)
(ii)
p ∈ Z,
N p ∩ In ⊂ Z ⇒ n + 1 ∈ Z
to Z = Np .
Mamy też rozszerzone twierdzenie o rekurencyjnym definiowaniu ciągu.
Twierdzenie 5.6.2 (rozszerzone o rekurencyjnym definiowaniu ciągu) Niech f : X → X będzie funkcją, niech c ∈ X
i p ∈ N. Wtedy istnieje dokładnie jeden ciąg a : Np → X taki, że
ap
∀n ∈ Np an+1
5.7
= c,
= f (an ).
Silnia i symbol Newtona
Jednym z klasycznych pytań matematyki zbiorów skończonych jest pytanie na ile sposobów elementy zbioru n-elementowego X można ustawić w ciag.
˛ Każde
takie ustawienie to bijekcja z In do X . Pytamy wi˛ec ile jest możliwych takich bijekcji. Okazuje si˛e, że jest ich n!. Dokładniej, można pokazać nast˛epujace
˛
twierdzenie.
Dla n ∈ N definiujemy rekurencyjnie
(
1
n! :=
n(n − 1)!
n = 0,
n > 0.
Wyrażenie n! czytamy "n silnia".
Wyrażenie n! pojawia si˛e w kontekście klasycznego pytania na ile sposobów elementy zbioru n-elementowego X można ustawić w ciag.
˛ Każde takie
ustawienie to bijekcja z In do X . Pytamy wi˛ec ile jest możliwych takich bijekcji. Okazuje si˛e, że jest ich n!. Dokładniej, można pokazać nast˛epujace
˛ twierdzenie.
102
ROZDZIAŁ 5. LICZBY NATURALNE. INDUKCJA I REKURENCJA.
Twierdzenie 5.7.1 Niech X będzie zbiorem skończonym i niech n := card X. Wtedy
card { f : In → X | f jest bijekcją } = n!
Dla n, k ∈ N definiujemy tzw. symbol Newtona wzorem
n
n!
:=
.
k
k!(n − k)!
Symbol Newtona ma również teoriomnogościową interpretację. Mamy bowiem następujące twierdzenie
Twierdzenie 5.7.2 Niech X będzie zbiorem skończonym o mocy n. Wtedy
n
card { A ⊂ X | card A = k } =
.
k
Z twierdzenia tego wynika w szczególności, że symbol Newtona jest zawsze liczbą naturalną, tzn. że k!(n − k)! dzieli n!.
W programie Mathematica silnię obliczamy stosując tradycyjną notację. Pisząc
50!
otrzymujemy
30414093201713378043612608166064768844377641568960512000000000000
Natomiast symbol Newtona obliczymy używając funkcji Binomial. Pisząc
Binomial[5, 2]
otrzymujemy 52 , czyli 10.
Rozdział 6
Struktury porządkowe
6.1
6.1.1
Relacje porządku
Częściowy i liniowy porządek
Definicja 6.1.1 Relację R w X nazywamy częściowym porządkiem lub krótko porządkiem jeżeli R jest relacją zwrotną, antysymetryczną i przechodnią, a liniowym porządkiem jeżeli dodatkowo R jest spójna. Parę (X, R) nazywamy
przestrzenią częściowo uporządkowaną lub krótko przestrzenią uporządkowaną jeżeli R jest częściowym porządkiem w
X, a przestrzenią liniowo uporządkowaną jeżeli R jest porządkiem liniowym.
Klasę przestrzeni częściowo uporządkowanych oznaczać będziemy Ord, a liniowo uporząkowanych LOrd. Jeśli R jest
częściowym porządkiem zwyczajowo będziemy pisać ¬ w miejsce R, a w miejsce R−1 . Ponadto mówić będziemy, że x jest
mniejsze od y i pisać x < y jeżeli
x ¬ y i x 6= y.
Analogicznie mówić będziemy, że x jest większe od y i pisać x > y jeżeli
x y i x 6= y.
W rozdziale 7.1.3 podamy formalna˛ definicj˛e porzadku
˛ linowego w zbiorze liczb całkowitych Z (wzór (7.4)), a w rozdziale 7.2.3 porzadku
˛ liniowego w zbiorze
liczb wymiernych Q (wzór (7.5)). W obu przypadkach b˛eda˛ to porzadki
˛ zgodne z codzienna˛ intuicja˛ zwiazan
˛ a˛ z porównywaniem liczb.
Uwaga 6.1.2 Jeśli R jest porządkiem w X, a Y ⊂ X, to RY := R ∩(Y ×Y ) jest porządkiem w Y . Jeśli R jest liniowy,
to RY jest liniowy.
Porządek RY nazywamy porządkiem indukowanym, a (Y, RY ) nazywamy podprzestrzenią przestrzeni uporządkowanej
(X, R).
Porzadek
˛ w Z ⊂ Q jest przykładem porzadku
˛ indukowanego z Q.
Ćwiczenie 6.1.3 Udowodnić uwagę 6.1.2
Aby zwi˛ekszyć przejrzystość rysunku, rysujac
˛ graf cz˛eściowego badź
˛ liniowego porzadku
˛
pomijamy kraw˛edzie, które sa˛ konsekwencja˛ własności przechodniości i własności zwrotności. Tak otrzymany graf cz˛eściowego porzaku
˛ nazywamy grafem zredukowanym. Jest on bardziej przejrzysty, bo zawiera mniej kraw˛edzi,
które w wyobraźni łatwo uzupełnić wykorzystujac
˛ własność zwrotności i przechodniości,
Rys. 6.1 przedstawia graf zredukowany przestrzeni liniowo uporzadkowanej
˛
(po lewej) oraz graf zredukowany przestrzeni cz˛eściowo uporzadkowanej
˛
(po
prawej).
103
104
ROZDZIAŁ 6. STRUKTURY PORZĄDKOWE
Rysunek 6.1: Graf liniowego i częściowego porządku
Rysunek 6.2: Przetrzeń częściowo uporządkowana i jej podzbiór A
6.1.2
Majoranty i minoranty
Definicja 6.1.4 Niech (X, ¬) będzie przestrzenią częściowo uporządkowaną i niech A będzie podzbiorem X. Mówimy,
że x ∈ X jest majorantą zbioru A jeżeli a ¬ x dla każdego elementu a ∈ A. Jeżeli x ∈ A i x jest majorantą A, to
x nazywamyelementem największym w A. Z kolei mówimy, że x jest elementem maksymalnym w A jeżeli x ∈ A
oraz w A nie istnieje element y większy od x. Analogicznie, odwracając kierunek nierówności, definiujemy minorantę,
element najmniejszy i element minimalny. Jeśli w podzbiorze A przestrzeni częściowo uporządkowanej istnieje element
największy (najmniejszy) to oznaczamy go max A, (min A).
Rys. 6.2 przedstawia przestrzeń cz˛eściowo uporzadkowan
˛
a˛ X oraz jej podzbiór A. W zbiorze A sa˛ dwa elementy maksymalne e oraz f , ale nie ma w nim
elementu najwi˛ekszego. Nie ma też majorant. Natomiast elementem najmniejszym zbioru A jest d. Jest to też jedyny element minimalny tego zbioru. Minorantami
zbioru A sa˛ elementy a, b, c, d.
6.2. PRZESTRZENIE CIĄGŁE
105
Twierdzenie 6.1.5 Niech (X, ¬) będzie przestrzenią częściowo uporządkowaną i niech A będzie podzbiorem X.
(i) Tak element największy jak i najmniejszy w zbiorze A istnieje co najwyżej jeden.
(ii) Podzbiór skończony niepusty A przestrzeni częściowo uporząkowanej posiada co najmniej jeden element minimalny i co najmniej jeden element maksymalny w A.
(iii) Element maksymalny (minimalny) zbioru liniowo uporządkowanego jest jego elementem największym (najmniejszym).
(iv) Podzbiór skończony niepusty przestrzeni liniowo uporządkowanej posiada element największy i element najmniejszy.
Dowód: Aby pokazać własnośc (i) przyjmijmy najpierw, że z1 i z2 są elementami największymi w zbiorze A. Z definicji
elementu największego wiemy, że z1 jest majorantą A, zatem
∀x ∈ A x ¬ z1 .
(6.1)
∀x ∈ A x ¬ z2 .
(6.2)
Ponieważ z2 też jest największy, więc również
Z definicji elementu największego wiemym że z1 , z2 ∈ A. Podstawiając z2 za x w (6.1) dostajemy z2 ¬ z1 . Podobnie z (6.2)
dostajemy z1 ¬ z2 . Wobec własności antysymetrii relacji porządku dostajemy z1 = z2 . Zatem element największy jest co
najwyżej jeden. Podobnie pokazujemy, że element najmniejszy jest co najwyżej jeden.
Własność (ii) pokażemy nie wprost. Przypuśćmy, że w A nie ma elementu maksymalnego. Zatem dla każdego x ∈ A
znajdziemy x∗ ∈ A taki, że x∗ > x. Ponieważ A 6= ∅, możemy wybrać element a ∈ A. Rozważmy elementy
a < a∗ < a∗∗ < · · ·
Ponieważ zbiór A jest skończony, więc w tym ciągu nierówności muszą znaleźć się dwa wyrazy równe. Ale równe być nie mogą,
bo nierówności są silne. Sprzeczność ta dowodzi, że przypuszcznie iż w A nie ma elementu maksymalnego było fałszywe.
Podobnie dowodzimy, że w A musi być element minimalny.
Aby pokazać własność (iii) przypuśćmy, że a jest maksymalny w liniowo uporządkowanym zbiorze A i równocześnie
nie jest on największy. Zatem istnieje b ∈ A taki, że nie jest prawdą iż b ¬ a. Ponieważ A jest liniowo uporządkowany, z
własności spójności wynika, że b > a. Ale to przeczy maksymalności a. Zatem a jest największy Podobnie pokazujemy, że
element minimalny zbioru liniowo uporządkowanego jest jego elementem najmniejszym.
Aby zakończyć dowód wystarczy zauważyć, że własność (iv) wynika natychmiast z własności (ii) i ( iii).
6.2
Przestrzenie ciągłe
Wiemy, że zbiór liczb wymiernych Q jest dziurawy. Brakuje w nim wielu liczb potrzebnych do mierzenia długości: na przykład długości przekatnej
˛
kwadratu lub
obwodu okr˛egu. Potrzebujemy "zakleić" te dziury. W tym rozdziale podamy formalna˛ definicj˛e przestrzeni liniowo uporzadkowanej
˛
bez dziur, tzw. przestrzeni ciagłej.
˛
Zbiór Q nie jest przestrzenia˛ ciagła.
˛ W rozdziale 7.3.3 skonstruujemy z liczb wymiernych zbiór liczb rzeczywistych R i pokażemy, że w przeciwieństwie do Q jest
on przestrzenia˛ ciagł
˛ a.˛
6.2.1
Kresy
Niech X będzie przestrzenią częściowo uporządkowaną i niech A ⊂ X.
Definicja 6.2.1 Mówimy, że zbiór A jest ograniczony od góry (od dołu) jeżeli posiada majorantę (minorantę).
106
ROZDZIAŁ 6. STRUKTURY PORZĄDKOWE
Definicja 6.2.2 Mówimy, że x jest kresem górnym (supremum) zbioru A i piszemy
x = sup A,
jeżeli A jest ograniczony od góry, a x jest jego najmniejszą majorantą.
Definicja 6.2.3 Mówimy, że x jest kresem dolnym (infimum) zbioru A i piszemy
x = inf A,
jeżeli A jest ograniczony od dołu, a x jest jego największą minorantą.
Ćwiczenie 6.2.4
• Podaj przykład ilustrujący, że w zbiorze skończonym częściowo uporządkowanym X może być
podzbiór A, którego kres dolny (górny) nie istnieje, albo istnieje, ale do A nie należy
• Pokaż, że jeśli X jest skończony, liniowo uporządkowany, to dla dowolnego A ⊂ X kres dolny (górny) istnieje i
zawsze należy do A.
Zobaczymy, że w zbiorach nieskończonych liniowo uporzadkowanych
˛
moga˛ być podzbiory ograniczone, których kresy nie istnieja,˛ badź
˛ istnieja,˛ ale do
podzbioru nie należa.˛
6.2.2
Przedziały
Definicja 6.2.5 Niech X będzie przestrzenią częściowo uporządkowaną i niech a, b ∈ X. Przedział otwarty, lewostronnie otwarty, prawostronnie otwarty oraz przedział domknięty o końcach a, b definiujemy odpowiednio wzorami
(a, b)
:= { x ∈ X | a < x i x < b },
(a, b]
:= { x ∈ X | a < x i x ¬ b },
[a, b)
:= { x ∈ X | a ¬ x i x < b },
[a, b]
:= { x ∈ X | a ¬ x i x ¬ b }.
Podobnie definiujemy lewy półprzedział otwarty, prawy półprzedział otwarty, lewy półprzedział domknięty, prawy półprzedział domknięty o końcu a odpowiednio wzorami wzorami
(−∞, a)
:= { x ∈ X | x < a },
(a, ∞)
:= { x ∈ X | a < x },
(−∞, a]
:= { x ∈ X | x ¬ a },
[a, ∞)
:= { x ∈ X | a ¬ x }.
Należy zwrócić uwagę, że oznaczenie (a, b) na przedział otwarty jest nieodróżnialne od oznaczenia na parę (a, b). Jednak
z kontekstu zawsze można będzie ustalić, o którą interpretację chodzi.
6.2. PRZESTRZENIE CIĄGŁE
6.2.3
107
Własność L
Mówimy, że niepusty podzbiór A przestrzeni liniowo uporządkowanej X ma własność (L) jeżeli A jest ograniczony od góry
oraz
x ∈ A i y ¬ x ⇒ y ∈ A.
Analogicznie mówimy, że A ma własność (R) jeżeli A jest ograniczony od dołu oraz
x ∈ A i y x ⇒ y ∈ A.
Uwaga 6.2.6 Każdy lewy półprzedział ma własność (L), a każdy prawy półprzedział ma własność (R). Niepusty,
właściwy podzbiór A przestrzeni liniowo uporządkowanej X ma własność (L) wtedy i tylko wtedy gdy X \ A ma
własność (R).
Pojawia si˛e naturalne pytanie czy w jakiejś przestrzeni liniowo uprzadkowanej
˛
moga˛ istnieć zbiory, które maja˛ własność (L) lub (R), a nie sa˛ przedziałami.
Odpowiedź jest twierdzaca.
˛ Zbiór
A := { q ∈ Q | q ¬ 0 albo q 2 < 2 }
√
ma własność (L), ale nie jest przedziałem, bo ewentualnym końcem tego przedziału musiałby być 2, a wiemy już, że w zbiorze liczb wymiernych takiej liczby
nie ma. Zbiór ten jest równocześnie przykładem zbioru ograniczonego od góry, który nie ma (w Q) kresu górnego.
Ma on jednak kres górny, do tego zbioru nie
√
należacy,
˛ jeśli A potraktujemy jako podzbiór zbioru liczb rzeczywistych. Kresem tym jest w takim przypadku 2.
6.2.4
Przestrzenie ciągłe
Definicja 6.2.7 Mówimy, że przestrzeń liniowo uporządkowana X jest przestrzenią ciągłą jeżeli dla każdego niepustego, właściwego podzbioru A tej przestrzeni, który ma własność (L) istnieje a ∈ X takie, że
A = (−∞, a) lub A = (−∞, a]
co jest równoważne założeniu, że dla każdego niepustego, właściwego podzbioru A tej przestrzeni, który ma własność
(R) istnieje a ∈ X takie, że
A = (a, ∞) lub A = [a, ∞).
Od zbioru liczb rzeczywistych, jakkolwiek go zdefiniujemy, oczekujemy, żeby był przestrzenia˛ liniowo uporzadkowan
˛
a˛ ciagł
˛ a.˛
Twierdzenie 6.2.8 Następujące trzy warunki są parami równoważne.
(i) X jest przestrzenią ciągłą.
(ii) Każdy niepusty, ograniczony od góry podzbiór X posiada kres górny.
(iii) Każdy niepusty, ograniczony od dołu podzbiór X posiada kres dolny.
108
6.3
6.3.1
ROZDZIAŁ 6. STRUKTURY PORZĄDKOWE
Funkcje monotoniczne
Funkcje rosnące i malejące
Definicja 6.3.1 Niech X i Y będą przestrzeniami uporządkowanymi, a f : X → Y niech będzie funkcją. Mówimy, że
f jest słabo rosnąca, jeżeli
∀x1 , x2 ∈ X x1 < x2 ⇒ f (x1 ) ¬ f (x2 ),
a silnie rosnąca, jeżeli
∀x1 , x2 ∈ X
x1 < x2 ⇒ f (x1 ) < f (x2 ).
Podobnie, mówimy, że f jest słabo malejąca, jeżeli
∀x1 , x2 ∈ X
x1 < x2 ⇒ f (x1 ) f (x2 ),
∀x1 , x2 ∈ X
x1 < x2 ⇒ f (x1 ) > f (x2 ).
a silnie malejąca, jeżeli
Twierdzenie 6.3.2 Niech X będzie przestrzenią liniowo uporząkowaną i niech f : X → X będzie odwracalna. Wtedy
jeśli f jest rosnąca (malejąca) to f −1 jest rosnąca (malejąca).
6.4
6.4.1
Liczby kardynalne i porządkowe.
Liczby kardynalne.
........................
6.4.2
Aksjomat wyboru.
........................
6.4.3
Liczby porządkowe.
........................
Rozdział 7
Struktury algebraiczne.
7.1
7.1.1
Liczby całkowite.
Działania
W rozdziale 8 podamy formalna˛ definicj˛e zbioru liczb rzeczywistych. Najpierw jednak przyjrzymy si˛e oddzielnie tzw. strukturom algebraicznym formalizujacym
˛
operacje dodawania i mnożenia.
Dodawanie i mnożenie liczb to operacje arytmetyczne znane nam dobrze ze szkoły. Z formalnego punktu widzenia operacje te to funkcje, które parom liczb
rzeczywistych przyporzadkowuj
˛
a˛ odpowiednio ich sum˛e lub iloczyn.
Działaniem dwuargumentowym w zbiorze X lub krótko działaniem nazywamy dowolne odwzorowanie d : X × X → X.
W przypadku działania dwuargumentowego zazwyczaj stosujemy tzw. notację infixową, w której symbol działania stawiamy
pomiędzy argumentami
x d y := d(x, y).
Mówimy o działaniach zamiast po prostu o funkcjach dwuargumentowych, bo w przypadku działań zazwyczaj oczekujemy spełnienia pewnych specjalnych
własności, modelowanych na własnościach dodawania i mnożenia liczb.
Definicja 7.1.1 Działanie d : X × X → X nazywamy łącznym jeżeli
∀x, y, z ∈ X
(x d y) d z = x d (y d z),
a przemiennym jeżeli
∀x, y ∈ X
x d y = y d x.
Element e ∈ X nazywamy elementem neutralnym dla działania d, jeżeli
∀x ∈ X
e d x = x d e = x.
Jeśli d : X × X → X ma element neutralny e to dla x ∈ X mówimy, że x0 jest jego elementem odwrotnym, jeżeli
x d x0 = x0 d x = e.
Uwaga 7.1.2 Jeśli działanie d : X × X → X ma element neutralny, to jest on dokładnie jeden. Jeśli działanie d jest
łączne i ma element neutralny, to element odwrotny do danego elementu może być co najwyżej jeden.
109
110
ROZDZIAŁ 7. STRUKTURY ALGEBRAICZNE.
Dowód: Aby pokazać, że element neutralny jest dokładnie jeden należy pokazać, że jeśli dwa elementy spełniają wymogi
elementu neutralnego, to są one sobie równe. Załóżmy zatem, że e oraz f są elementami neutralnymi dla działania d. Mamy
zatem
∀x ∈ X e d x = x d e = x
(7.1)
oraz
∀x ∈ X
f d x = x d f = x.
(7.2)
Ponieważ równości w (7.1) zachodzą dla każdego x, więc w szczególności dla x = f mamy
e d f = f.
Podobnie, po podstawieniu x = e, z równości (7.2) dostajemy
e d f = e.
Zatem e = f . Dowód drugiej części uwagi jest podobny i zostawiamy go jako ćwiczenie.
Tak dodawanie jak i mnożenie liczb możemy traktować jako działania, jeśli odpowiednio dobierzemy zbiór liczb, na przykład sa˛ to działania w zbiorze liczb
naturalnych, całkowitych, wymiernych, rzeczywistych, rzeczywistych dodatnich oraz w zbiorze ułamków (liczb wymiernych dodatnich). Mnożenie jest też działaniem
w zbiorze ułamków właściwych, czyli liczb wymiernych dodatnich i mniejszych niż jeden. Jednak dodawania nie można już traktować jako działania w tym zbiorze,
bo suma dwóch ułamków właściwych może nie być ułamkiem właściwym, np. 23 + 23 = 43 .
Tak dodawanie jak i mnożenie liczb sa˛ łaczne
˛
oraz przemienne. Elementem neutralnym dla dodawania liczb jest zero, a dla mnożenia jest jeden. W przypadku
mnożenia elementem odwrotnym do x jest x1 , oczywiście o ile x1 ma sens i jest elementem zbioru, w którym mnożenie rozważamy jako działanie. Zero nigdy
nie posiada elementu odwrotnego wzgl˛edem mnożenia. Dla pozostałych liczb istnienie elementu odwrotnego wzgl˛edem mnożenia zależy od zbioru, w którym
mnożenie rozważamy jako działanie. Na przykład liczba 2 posiada element odwrotny wzgl˛edem mnożenia w zbiorze liczb wymiernych, ale go nie posiada w
zbiorze liczb całkowitych.
W przypadku dodawania zwyczajowo zamiast o elemencie odwrotnym mówimy o elemecie przeciwnym. Dla liczby x jest nim −x, oczywiście o ile −x
jest elementem zbioru, w którym dodawanie rozważamy jako działanie. Elementy przeciwne istnieja˛ dla dodawania rozważanego jako działanie w zbiorze liczb
rzeczywistych, wymiernych, całkowitych.
Przykład 7.1.3 W zbiorze skończonym działanie można zadać przy pomocy tabelki. Na przykład poniższa tabelka
a
b
c
a
b
a
b
b
a
b
c
c
c
c
a
(7.3)
zadaje działanie w zbiorze trzyelementowym { a, b, c }. Wartość x d y jest elementem znajdującym się w przecięciu
wiersza oznaczonego x i kolumny oznaczonej y.
Pakiet Operations umożliwia definiowanie działań w zbiorach skończonych i sprawdzanie, czy działanie ma rozważane
własności. Instrukcja Operations ma dwa argumenty. Pierwszy to lista elementów zbioru, w którym określono działanie.
Drugi argument to tabelka zadająca działanie, zapisana jako lista wierszy. Wprowadzając
op = O p e r a t i o n [ { a , b , c } , { { b , a , c } , { a , b , c } , { b , c , a } } ]
definiujemy działanie zadane w tabelce (7.3). Z kolei wprowadzając
I s A s s o c i a t i v e [ op ]
HasNeutral [ op ]
H a s I n v e r s e s [ op ]
dowiadujemy się, że działanie to ma element neutralny, ale nie jest łączne i, przynajmniej dla pewnych elementów, nie ma
ono elementów odwrotnych.
7.1. LICZBY CAŁKOWITE.
111
Rysunek 7.1: Évariste Galois, 1811-1832, Źródło: Wikipedia
Ćwiczenie 7.1.4
odwrotnych.
(i) Ustal, które elementy w działaniu rozważanym w przykładzie 7.1.3 nie posiadają elementów
(ii) W tabelce (7.3) wystarzczy zamienić miejscami dwa elementy, by otrzymać działanie, które jest łączne, ma
element neutralny i wszystkie elementy odwrotne. Ustal jaka to zamiana.
7.1.2
Grupy
Wśród wielu różnych działań szczególna˛ rol˛e pełnia˛ działania łaczne
˛
posiadajace
˛ element neutralny oraz elementy odwrotne. Na przykład dodawanie w zbiorze
liczb całkowitych oraz mnożenie w zbiorze liczb wymiernych dodatnich sa˛ takimi działaniami. Okazuje si˛e, że jest bardzo wiele działań o takich własnościach,
określonych w bardzo różnych zbiorach, w szczególności w zbiorach skończonych. Dlatego warto wyróżnić takie działania wprowadzajac
˛ poj˛ecie grupy. Jednym z
pierwszych, którzy pokazali wag˛e tego poj˛ecia był francuski matematyk Évariste Galois (rys. 7.1). Posłużył si˛e on poj˛eciem grupy w celu określenia kiedy daje si˛e
wyrazić miejsca zerowe wielomianu przy użyciu czterech operacji arytmetycznych i pierwiastkowania.
Definicja 7.1.5 Trójkę (G, d, e) nazywamy grupą jeżeli d : G × G → G jest działaniem spełniającym następujące
warunki
G1) d jest łączne,
G2) e jest elementem neutralnym dla d,
G3) każdy element w G posiada element odwrotny.
W przypadku gdy spełniona jest jedynie własność G1) trójkę (G, d, e) nazywamy półgrupą. Jeśli spełnione są tylko
własności G1) i G2), półgrupę nazywamy półgrupą z jedynką lub monoidem. Grupę (półgrupę) nazywamy przemienną
albo abelową, jeżeli działanie d jest przemienne.
Przykładem grupy przemiennej jest (Z, +, 0) oraz (R, ·, 1). Grupa˛ przemienna˛ jest też (R+ , ·, 1), natomiast nie jest grupa˛ (N, +, 0), bo dodawanie nie
posiada w tym zbiorze elementu przeciwnego(odwrotnego). Z kolei (N, +, 0) jest przykładem półgrupy.
112
ROZDZIAŁ 7. STRUKTURY ALGEBRAICZNE.
Ćwiczenie 7.1.6 (*)Niech X będzie ustalonym zbiorem. Pokazać, że zbiór bijekcji X w X ze składaniem odwzorowań
jako działaniem jest grupą.
Jeśli rozważamy ustaloną grupę lub półgrupę tradycyjnie działanie d oznaczamy ’·’, element neutralny oznaczamy 1, a
element odwrotny do x oznaczmy x−1 . W praktyce ’·’ często w ogóle pomijamy. Ponadto dla n ∈ N stosujemy oznaczenia
n-krotnie
xn
x−n
z
}|
{
:= x · x · · · · · x
n
:= x−1 .
Ten system notacji określamy mianem notacji multyplikatywnej.
W przypadku grupy lub półgrupy przemiennej tradycyjnie działanie d oznaczamy ’+’, a element neutralny oznaczamy 0.
W przypadku tym zamiast o elemencie odwrotnym do x mówimy o elemencie przeciwnym do x i oznaczamy go −x. Ponadto
dla n ∈ N stosujemy oznaczenia
n-krotnie
nx
(−n)x
}|
{
z
:= x + x + · · · + x
:= n(−x).
Ten system notacji określamy mianem notacji addytywnej.
Choć formalnie grupa jest trójką składającą się, ze zbioru, działania i elementu zbioru, w praktyce często o samym
zbiorze mówimy, że jest grupą, zdając się na domyślność czytelnika co jest brane jako działanie, a co jako element neutralny.
7.1.3
Zbiór liczb całkowitych
Wiemy, że aby odejmować bez ograniczeń liczby naturalne, potrzebujemy rozszerzyć zbiór liczb naturalnych o liczby ujemne. Na przykład, żeby wykonać odejmowanie 3 − 5 potrzebujemy liczby −2. Jak formalnie zdefiniować liczb˛e −2 na gruncie tego co już mamy, to jest liczb naturalnych? Można na przykład przyjać,
˛ że
liczba −2 to para (3, 5). Przy takiej definicji nie wychodzimy poza poj˛ecia, które już mamy zdefiniowane. Pojawia si˛e jednak problem. Liczba −2 to również wynik
odejmowania 7 − 9. Zatem pary (3, 5) i (7, 9) trzeba jakoś utożsamić. Nie możemy postawić warunku 3 − 5 = 7 − 9, bo jeszcze nie zdefiniowaliśmy odejmowania gdy wynik jest ujemny. Ale warunek 3 − 5 = 7 − 9, po przeniesieniu 5 i 7 na druga˛ stron˛e równości, daje warunek równoważny 3 + 9 = 7 + 5, który
operuje jedynie dodawaniem liczb naturalnych, a to już mamy zdefiniowane. Sugeruje to, by par˛e (m, n) utożsamić z para˛ (m0 , n0 ) gdy m + n0 = m0 + n i
prowadzi do nast˛epujacej
˛ formalnej konstrukcji.
Zbiór liczb całkowitych definiujemy jako zbiór klas równoważności
Z := { [(m, n)]R | (m, n) ∈ N2 }
względem relacji
R := { ((m, n), (m0 , n0 )) ∈ N2 × N2 | m + n0 = m0 + n }.
Dla n ∈ N wprowadzamy oznaczenie −n := [(0, n)]R oraz utożsamiamy klasę [n, 0]R z liczbą n, co pozwala traktować Z
jako rozszerzenie N.
Ćwiczenie 7.1.7 (*)Rozszerzyć operację dodawania z N na Z tak by w Z uzyskać strukturę grupy przemiennej.
Rozszerzyć operację mnożenia z N \ {0} na Z \ {0} tak by w Z \ {0} uzyskać strukturę półgrupy przemiennej.
Dla m, n ∈ Z definiujemy
m ¬ n :⇔ n − m ∈ N.
(7.4)
Łatwo sprawdzić, że definicja ta rozszerza definicję 5.4.5 nierówności w N. Przedziałem w Z o końcach m, n ∈ Z nazywamy
zbiór
[m, n]Z := { x ∈ Z | m ¬ x ¬ n }.
Łatwo zauważyć, że zbiór ten jest niepusty wtedy i tylko wtedy gdy m ¬ n.
7.2. LICZBY WYMIERNE
7.1.4
113
Sumy i iloczyny
Niech G będzie półgrupą (w notacji addytywnej lub multyplikatywnej), m, n elementami Z, a
x : [m, n]Z → G
ciągiem. W przypadku notacji addytywnej definiujemy rekurencyjnie sumę elementów ciągu x wzorem
(
n
X
0
m>n
xi := Pn−1 w przeciwnym razie .
i=m xi + xn
i=m
Analogicznie dla notacji multyplikatywnej definiujemy rekurencyjnie iloczyn elementów ciągu x wzorem
(
n
Y
1
m>n
xi := Qn−1 w przeciwnym razie .
i=m xi · xn
i=m
Często stosujemy też mniej formalną, ale bardziej intuicyjną notację kropkową:
xm + xm+1 + . . . + xn
xm · xm+1 · . . . · xn
:=
:=
n
X
xi
i=m
Πni=m
xi .
Dla n ∈ N w przypadku n-krotnie wykonanego działania na elemencie x stosujemy oznaczenie
(
1
n = 0,
n
x :=
x · xn−1 n > 0
w przypadku notacji multyplikatywnej oraz oznaczenie
(
nx :=
0
x + (n − 1)x
n = 0,
n>0
w przypadku notacji addytywnej.
7.2
Liczby wymierne
Mamy już formalnie zdefiniowane liczby naturalne i całkowite. Po drodze wprowadziliśmy poj˛ecie grupy. Widzieliśmy, że choć liczby całkowite z dodawaniem tworza˛
grup˛e, to sa˛ również grupy, które niewiele maja˛ wspólnego z liczbami całkowitymi. Naszym nast˛epnym celem sa˛ liczby wymierne. Liczby wymierne z dodawaniem
też tworza˛ grup˛e, a z mnożeniem tworza˛ grup˛e gdy pominiemy zero. Ponadto, operacje dodawania i mnożenia liczb wymiernych sa˛ ze soba˛ powiazane:
˛
n-krotne
dodadnie do siebie liczby a to to samo co pomnożenie liczby a przez n, czego konsekwencja˛ jest rozdzielczość mnożenia wzgl˛edem dodawania (a + b) · c =
a · c + b · c. Powstaje pytanie, czy sformalizowanie tej koncepcji prowadzi już jednoznacznie do aksjomatyki liczb wymiernych, tak jak to przedstawiliśmy dla liczb
naturalnych?
7.2.1
Ciała
Definicja 7.2.1 Piątkę (F, +, ·, 0, 1) gdzie 0 6= 1 nazywamy ciałem jeżeli (F, +, 0) oraz (F \ {0}, ·, 1) są grupami
przemiennymi, a ponadto zachodzi tzw. prawo rozdzielności mnożenia względem dodawania
∀x, y, z ∈ F
(x + y) · z = x · z + y · z.
114
ROZDZIAŁ 7. STRUKTURY ALGEBRAICZNE.
Okazuje si˛e, że sa˛ ciała istotnie różne od ciała liczb wymiernych. Jak zobaczymy mamy ciało liczb rzeczywistych, ciało liczb zespolonych, ale co ciekawe,
podobnie jak w przypadku grup, sa˛ też ciała skończone.
Ćwiczenie 7.2.2 Pokazać, że zbiór {0, 1} z działaniami + i ∗ danymi tabelami
+
0
1
0
0
1
1
1
0
*
0
1
0
0
0
1
0
1
jest ciałem. Ciało to zwyczajowo oznaczamy Z2 .
7.2.2
Funkcja potęgowa i wielomian
Niech (F, +, ·, 0, 1) będzie ciałem. Dla n ∈ N definiujemy funkcję potęgową
·n : F 3 x 7→ xn ∈ F,
a dla a0 , a1 , . . . an ∈ F definiujemy wielomian A o współczynnikach a0 , a1 , . . . an
Qa0 ,a1 ,...an : F 3 x 7→ a0 + a1 x + a2 x2 + · · · + an xn ∈ F.
Największe n takie, że an 6= 0 nazywamy stopniem wielomianu Q.
7.2.3
Zbiór liczb wymiernych
Konstrukcja zbioru liczb wymiernych ze zbioru liczb całkowitych bardzo przypomina konstrukcj˛e liczb całkowitych z liczb naturalnych. Aby zapewnić sobie możliwość
dzielenia m/n rozważamy pary (p, q) liczb całkowitych oraz relacj˛e utożsamiajac
˛ a˛ pary (p, q)] i (p0 , q 0 ) gdy pq 0 = qp0 .
Zbiór liczb wymiernych definiujemy jako zbiór klas równoważności
Q := { [(p, q)]S | (p, q) ∈ Z × N1 }
względem relacji
S := { ((p, q), (p0 , q 0 )) ∈ (Z × N1 ) × (Z × N1 ) | pq 0 = qp0 }.
Dla liczb wymiernych [(p, q)]S , [(p0 , q 0 )]S definiujemy relację nierówności
[(p, q)]S ¬ [(p0 , q 0 )]S :⇔ pq 0 ¬ qp0 .
(7.5)
Łatwo sprawdzić, że definicja ta nie zależy od wyboru reprezentantów i rozszerza definicję nierówności zadaną wzorem (7.4)
dla liczb całkowitych.
Ćwiczenie 7.2.3 (*)Rozszerzyć operacje dodawania i mnożenia z Z na Q tak by w Q uzyskać strukturę ciała.
7.2.4
Wzory skróconego mnożenia
Niniejsze wzory obowiązujące w każdym ciele będą nam wielokrotnie pomocne. Ich indukcyjny dowód pomijamy.
Twierdzenie 7.2.4 Niech (F, +, ·, 0, 1) będzie ciałem, a, b ∈ F oraz n ∈ N1 . Wtedy
n
b −a
n
=
(b − a)
n−1
X
an−i−1 bi ,
(7.6)
i=0
n
(a + b)
=
n X
n
i=0
i
ai bn−i .
(7.7)
7.3. CIAŁO LICZB RZECZYWISTYCH
7.3
115
Ciało liczb rzeczywistych
Bardzo użyteczna˛ własnościa˛ dodawania liczb jest zachowywanie nierówności przy operacjach arytmetycznych. Jeśli x ¬ y to x + z ¬ y + z . Z mnożeniem
jest podobnie. Nierówność x ¬ y implikuje xz ¬ yz , ale pod dodatkowym warunkiem, że z > 0. Jeśli z < 0, to nie wszystko jest stracone: nierówność si˛e
nie zachowuje, ale pojawia si˛e nierówność przeciwna: xz yz . Przypadek z = 0 jest specyficzny: przemnożenie przez zero powoduje, że po obu stronach
pojawia si˛e zero. Te użyteczne własności sa˛ konsekwencja˛ faktu, że definicja porzadku
˛ w zbiorach liczbowych posługuje si˛e operacja˛ dodawania, a mnożenie jest
powiazane
˛
z dodawaniem własnościa˛ rozdzielności. Jednak jeśli mamy jakieś ciało, a w nim jakiś porzadek,
˛
to nie mamy gwarancji, że nierówności si˛e zachowuja˛
przy wykonywaniu operacji dodawania lub mnożenia w ciele. Dlatego warto wyróżnić te ciała wyposażone w relacj˛e porzadkuj
˛ ac
˛ a,˛ dla których zachowywanie
nierówności ma miejsce.
7.3.1
Ciała uporządkowane
Definicja 7.3.1 Szóstkę (F, +, ·, 0, 1, ¬) nazywamy ciałem uporządkowanym, jeżeli (F, +, ·, 0, 1) jest ciałem, (F, ¬)
jest przestrzenią liniowo uporządkowaną oraz
(i) ∀x, y, z ∈ F
(ii) ∀x, y ∈ F
x ¬ y ⇒ x + z ¬ y + z,
x > 0, y > 0 ⇒ xy > 0.
Wprowadzamy oznaczenia
Q+ := { q ∈ Q | q > 0 },
Q− := { q ∈ Q | q < 0 }.
Ćwiczenie 7.3.2 Pokazać, że zbiór liczb wymiernych Q wraz z określonymi wcześniej działaniami dodawania i mnożenia oraz relacją porządku jest ciałem uporządkowanym.
Ćwiczenie 7.3.3 Pokazać, że ciało z ćw. 7.2.2 z porządkiem {0 ¬ 0, 0 ¬ 1, 1 ¬ 1} nie jest ciałem uporządkowanym.
7.3.2
Zbiór liczb rzeczywistych
Jakkolwiek zdefiniujemy zbiór liczb rzeczywistych, oczekujemy by miał on struktur˛e ciała uporzadkowanego.
˛
Wiemy, że ciało liczb wymiernych z naturalnym
porzadkiem
˛
jest ciałem uporzadkowanym.
˛
Pami˛etamy też, że od zbioru liczb rzeczywistych oczekujemy by, w przeciwieństwie do zbioru liczb wymiernych, był
przestrzenia˛ uporzadkowan
˛
a˛ ciagł
˛ a.˛ Powstaje pytanie, czy nie żadamy
˛
za dużo, to znaczy czy koncepcja ciała uporzadkowanego
˛
ciagłego
˛
nie jest sprzeczna sama
w sobie, a jeśli nie jest, to czy moga˛ być ciała uporzakowane
˛
istotnie różne od liczb rzeczywistych. Odpowiedź zgodna˛ z naszymi oczekiwaniami daje nast˛epujace
˛
twierdzenie.
Twierdzenie 7.3.4 Istnieje ciało uporządkowane ciągłe. Jeśli F1 i F2 są dwoma takimi ciałami, to istnieje silnie
rosnąca bijekcja f : F1 → F2 taka, że
∀x, y ∈ F1
f (x + y) = f (x) + f (y) oraz f (x · y) = f (x) · f (y).
Bijekcja f w powyższym twierdzeniu daje sposób utożsamienia dwóch formalnie różnych ciał uporzadkowanych.
˛
Można wi˛ec powiedzieć, że z dokładnościa˛
do utożsamienia poprzez bijekcj˛e f istnieje dokładnie jedno ciało uporzadkowane
˛
ciagłe.
˛
Jest nim intuicyjnie rozważany od rozdziału wst˛epnego zbiór liczb
rzeczywistych z naturalnymi działaniami dodawania i mnożenia oraz naturalnym porzadkiem.
˛
Definicja 7.3.5 Ciałem liczb rzeczywistych nazywamy ciało uporządkowane ciągłe. Ciało to oznaczamy R.
116
ROZDZIAŁ 7. STRUKTURY ALGEBRAICZNE.
7.3.3
(*)Konstrukcja Cauchy’ego
Dowód tw. 7.3.4 nie jest prosty. Ograniczymy się jedynie do podania szkicu konstrukcji liczb rzeczywistych pochodzącej od
Cauchy’ego.
Pierwsze konstrukcje ciała liczb rzeczywistych podali Cauchy, Dedekind i Weierstrass. Konstrukcja Cauchy’ego opiera
się na pojęciu ciągu Cauchy’ego.
Definicja 7.3.6 Ciąg x : N → Q nazywamy ciągiem Cauchy’ego jeżeli
∀ ∈ Q+ ∃N ∈ N ∀m, n ∈ N
m, n N ⇒ |xm − xn | < .
Dla ciągów x, y : N → Q definiujemy sumę x + y i iloczyn x · y wzorami
x+y
x·y
: N 3 n 7→ xn + yn ∈ Q,
: N 3 n 7→ xn · yn ∈ Q
oraz nierówność
x ¬ y :⇔ ∀ ∈ Q+ ∃N ∈ N ∀n ∈ N
n N ⇒ xn − ¬ yn .
W zbiorze ciągów Cauchy’ego wprowadzamy relację równoważności
x ∼ y :⇔ ∀ ∈ Q+ ∃N ∈ N ∀n ∈ N
n N ⇒ |xn − yn | < .
Zbór liczb rzeczywistych według Cauchy’ego definiujemy jako
R := { [x]∼ | x : N → Q ciąg Cauchy’ego. }
Liczbę wymierną q ∈ Q utożsamiamy z klasą równoważności ciągu stale równego q.
Część II
Granice
117
Rozdział 8
Liczby rzeczywiste i liczby zespolone
8.1
Ciało liczb rzeczywistych.
W części pierwszej, na gruncie teorii mnogości naszkicowaliśmy jak konstruuje się liczby rzeczywiste i dowodzi ich własności.
Rozpoczynając czytanie bezpośrednio od części drugiej możemy się oprzeć na następujących definicjach.
Definicja 8.1.1 Ciało liczbowe F to zbiór liczb z dwuargumentowymi działaniami + (dodawanie), · (mnożenie) i
wyróżnionymi liczbami 0 (zero) i 1 (jeden) taki, że
• dla dowolnego x ∈ F
x+0
=
x·1
x
= x
• dla dowolnego x ∈ F istnieje x0 ∈ F , zwyczajowo oznaczane −x, takie że
x + x0
=
0
• dla dowolnego x ∈ F \ {0} istnieje x00 ∈ F , zwyczajowo oznaczane
x · x00
=
1
x,
takie że
1
• dla dowolnych x, y ∈ F
x+y
= y+x
x·y
= y·x
• dla dowolnych x, y, z ∈ F
(x + y) + z
(x · y) · z
(x + y) · z
119
= x + (y + z)
= x · (y · z)
= x·z+y·z
120
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Definicja 8.1.2 Ciało liczbowe uporządkowane to ciało liczbowe F dodatkowo z dwuargumentową relacją > (większe)
takie, że
• dla dowolnych x, y ∈ F
x>0∧y >0
⇒
x·y >0
• dla dowolnych x, y, z ∈ F
x>y
⇒
x + z > y + z.
Piszemy x y jako skrót x > y ∨ x = y. Dla wygody wprowadzamy też oznaczenie x ¬ y dla y x oraz x < y dla
y > x. Mówimy, że b ∈ F jest majorantą zbioru X ⊂ F jeśli dla każdego x ∈ X mamy x ¬ b. Mówimy, że zbiór X ⊂ F jest
ograniczony od góry, jeśli ma majorantę. Mówimy, że a ∈ F jest kresem górnym zbioru X i piszemy a = sup X jeżeli a jest
majorantą zbioru X i zbiór ten nie posiada mniejszej majoranty.
Analogicznie definiujemy minorantę, zbiór ograniczony od dołu i kres dolny, który oznaczamy inf A.
Definicja 8.1.3 Ciało liczb rzeczywistych R to ciało liczbowe uporządkowane o tej własności, że każdy niepusty
ograniczony podzbiór x ⊂ R posiada kres górny.
8.1.1
Podzbiory R
Zbiór naturlanych N utożsamiamy ze zbiorem liczb postaci
n razy
z
}|
{
{ x ∈ R | x = 1 + 1 + . . . + 1 }.
Zbiór Z utożsamiamy ze zbiorem
{ x ∈ R | x ∈ N lub − x ∈ N }.
Zbiór Q utożsamiamy ze zbiorem
{ x ∈ R | ∃p ∈ Z ∃q ∈ N1 x = p · q −1 }.
Wprowadzamy oznaczenia
R+
:= { x ∈ R | x > 0 },
−
:= { x ∈ R | x < 0 },
∗
:= { x ∈ R | x 0 }.
R
R
8.2
Liczby reprezentowalne
W pamięci komputera możemy reprezentować jedynie pewien skończony podzbiór zbioru liczb. Używane są różne podzbiory.
W przypadku liczb, na których operuje procesor są to pewne podzbiory zbioru liczb całkowitych oraz pewne podzbiory
zbioru liczb wymiernych, najczęściej liczby całkowite typu int oraz wymierne typu double.
Do reprezentacji liczb typu int używa się zazwyczaj 32 cyfr dwójkowych, czyli inaczej bitów (rys.8.1). Sama liczba
zapisana jest przy pomocy 31 bitów, a 32-gi bit używany jest do zapisania znaku. Pozwala to na zapisywanie liczb całkowitych
z zakresu −2147483648 do +2147483647.
8.2. LICZBY REPREZENTOWALNE
121
Rysunek 8.1: 32-bitowe słowo (4 bajty) używane do reprezentacji liczb typu int.
Rysunek 8.2: 64-bitowe słowo (8 bajtów) używane do reprezentacji liczb typu double.
Liczby typu double przechowywane są zazwyczaj na 64 bitach, z czego jeden bit reprezentuje znak s, 11 bitów cechę N ,
a pozostałe 52 mantysę m będącą ułamkiem o mianowniku 252 z przedziału [1, 2) (rys.8.2). Umożliwa to zapisywanie liczb
w postaci
x = sm2N ,
a także, przy pomocy specjalnego kodu, liczby zero. Wykorzystanie cechy i mantysy pozwala na przybliżanie liczb o bardzo
dużym zakresie, od bardzo małych, rzędu 10−323 , do bardzo dużych, rzędu 10308 , przy zachowaniu w miarę stałej dokładności,
wynoszącej około 15 cyfr znaczących.
Większość języków programowania zadowala się takim systemem liczb reprezentowalnych jaki jest dostępny na poziomie
procesora. Tak jest na przykład w języku C++. Takie podejście jest wystarczające do większości zastosowań. Jeśli jednak
z jakiegoś powodu zachodzi potrzeba stosowania większej dokładności w obliczeniach, zawsze można skorzystać z biblioteki
udostępniającej liczby reprezentowalne reprezentowane na dowolnej ilości bitów, ograniczonej nie wielkością słowa maszynowego ale jedynie całkowitą ilością wolnej pamięci. Jedyne co przy takim rozwiązaniu tracimy to czas obliczeń, który jest
istotnie wolniejszy niż w przypadku obliczeń wykonywanych na pojedynczych słowach maszynowych.
Specjalizowane programy do matematyki obliczeniowej, takie jak Mathematica mają tego typu biblioteki wbudowane.
Na przykład, aby pomnożyć przez siebie dwie liczby 25-cyfrowe wystarczy napisać
1234567890123456789012345∗1234567890123456789012345.
Natychmiast otrzymujemy wynik
1524157875323883675049533479957338669120562399025
Pisząc
2^200
otrzymujemy
1606938044258990275541962092341162602522202993782792835301376
Możliwa jest też zamiana ułamka na liczbę dziesiętną o dowolnie wysokiej dokładności. Na przykład pisząc
N[ 1 / 2 3 , 5 0 ]
otrzymujemy przybliżenie ułamka
1
23
0.043478260869565217391304347826086956521739130434783
122
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
z dokładnością do 50 cyfr.
Tam gdzie liczy się prędkość obliczeń (na przykład, gdy musimy policzyć nie jeden pierwiastek, ale miliony pierwiastków
jako część innego zadania) zamiast języków interpretowanych, takich jak Mathematica, używamy języków kompilowanych.
Współcześnie wszędzie tam, gdzie kluczowa jest szybkość obliczeń prym wiedzie język C++, choć na przykład fizycy preferują
jeszcze szybszy, ale nieco już sędziwy język Fortran. Najszybszy kod można uzyskać stosując bezpośrednio język maszynowy,
ale pisanie w nim programów jest wyjątkowo żmudne.
Listingi 8.1 i 8.2 prezentują nasz algorytm liczenia pierwiastka metodą brutalnej siły napisany w języku C++. Działa
on z dokładnością do 10−4 . Większej dokładności w oparciu o użyty w nim standardowy typ całkowitoliczbowy int nie da
się uzyskać, bo dla n >= 100000 wyrażnie p ∗ n ∗ n nie może być policzone poprawnie gdy reprezentowane jest jako typ int.
Odpowiednik programu z listingu 5.3 napisany w języku C++ przedstawono na listingu 8.3.
8.3
Funkcja potęgowa w R
n razy
}|
{
z
Dla n ∈ N przyjmujemy oznaczenie xn := x · x · · · · · x. Funkcję
R 3 x 7→ xn ∈ R
nazywamy funkcją potęgową.
Uwaga 8.3.1 Mamy następujące własności funkcji potęgowej w R
(i) ∀x ∈ R
(ii) ∀x ∈ R
x2 0,
x2 = 0 ⇔ x = 0,
(iii) ∀x, y, z ∈ R
x > 0, y < z ⇒ xy < xz,
(iv) ∀x, y, z ∈ R
x < 0, y < z ⇒ xy > xz,
(v) ∀x ∈ R
x > 0 ⇒ x−1 > 0.
Dowód: ćwiczenie.
Twierdzenie 8.3.2 Funkcja potęgowa na zbiorze R∗ jest silnie rosnąca, tzn.
∀n ∈ N1 ∀x, y ∈ R∗ :
0 ¬ x < y ⇒ xn < y n
Dowód: Dowód poprowadzimy indukcyjnie względem n. Dla n = 1 teza pokrywa się z założeniem, więc implikacja jest
oczywiście prawdziwa. Załóżmy zatem, że dla pewnego k ∈ N mamy
∀x, y ∈ R∗ x < y ⇒ xk < y k .
(8.1)
Chcemy pokazać, że
∀x, y ∈ R∗ x < y ⇒ xk+1 < y k+1 .
(8.2)
k
k
Rozważmy więc x, y ∈ R takie, że x < y. Z założenia indukcyjnego (8.1) wnosimy, że x < y . Stosując dwukrotnie własność
(ii) ciała uporządkowanego dostajemy
xk+1 = xk x < y k x < y k y = y k+1 .
Zatem xk+1 < y k+1 co dowodzi, że implikacja (8.2) zachodzi. Zatem na mocy zasady indukcji twierdzenie zostało udowodnione.
8.3. FUNKCJA POTĘGOWA W R
123
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ SqrtTwoBf . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗
Obliczanie przybliżenia pierwiastka z 2
∗/
/∗
metodą b r u t a l n e j s i ł y
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗/
/∗ Tu włączamy standardową b i b l i o t e k ę w e j ś c i a w y j ś c i a ∗/
#include 
/∗ I podpinamy tak zwaną standardową p r z e s t r z e ń nazw .
Bez t e g o nazwy t a k i e j a k c o u t p o n i ż e j m u s i e l i b y ś m y
p i s a ć j a k o s t d : : c o u t ∗/
using namespace s t d ;
/∗ Właściwy p o c z ą t e k programu .
Program główny w C++ ma zawsze nazwę main .
Pomiędzy nawiasami ( i ) może być l i s t a ewentualnych
argumentów ( danych w e j ś c i o w y c h ) . W naszym przypadku
j e s t ona p u s t a . Słowo i n t p r z e d main o z n a c z a typ
z w r a c a n e j w a r t o ś c i , k t ó r y musi tu być , a l e nas
n i e i n t e r e s u j e . Sam program m i e ś c i s i ę pomiędzy
nawiasami { i }
∗/
i n t main ( ) {
/∗ Deklarujemy i i n i c j a l i z u j e m y t r z y zmienne typu i n t ∗/
i n t a =2,n=10000 , i=n ;
/∗ Jak długo s p e ł n i o n y j e s t warunek zwiększamy zmienną i .
Taka k o n s t r u k c j a nazywana j e s t p ę t l ą w h i l e .
W t e j p ę t l i wykonywana j e s t t y l k o j e d n a i n s t r u k c j a ,
z w i ę k s z e n i a z m i e n n e j i o j e d e n . Znak = n i e p e ł n i tu
r o l i porównania ( wtedy d o s t a l i b y ś m y s p r z e c z n o ś ć 0=1)
t y l k o p r z y p i s a n i a : z a w a r t o ś ć i z a s t ą p p r z e z i +1 ∗/
while ( i ∗ i<=a ∗n∗n ) i=i +1;
/∗ O s t a t n i a dobra w a r t o ś ć z m i e n n e j i
była m n i e j s z a o j e d e n . Poprawiamy
i=i −1;
∗/
/∗ Wyprowadzamy zmienną i , t e k s t " / " , zmienną n
o r a z znak nowej l i n i i na standardowe w y j ś c i e ∗/
c o u t << i << "/" << n << e n d l ;
/∗ Koniec programu ∗/
}
Listing 8.1: Obliczania pierwiastka metodą brutalnej siły w C++
124
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ S q r t B f P l u s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ U s p r a w n i e n i e programu SqrtTwoBf . cpp
∗/
/∗ Zamiast z a c z y n a ć d o b i e r a n i e w a r t o ś c i z m i e n n e j i ∗/
/∗ od 1 , zaczynamy od p o p r z e d n i e j z n a l e z i o n e j
∗/
/∗ w a r t o ś c i
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗/
#include 
/∗ Włączenie dodatkowej b i b l i o t e k i z a w i e r a j ą c e j
m. i n . s e t p r e c i s i o n w y j a ś n i o n e d a l e j ∗/
#include <iomanip>
using namespace s t d ;
/∗ Podprogram o b l i c z a j ą c y p i e r w i a s t e k z l i c z b y a .
Przyjmuje on w a r t o ś ć j a k o argument typu d o u b l e .
Wartość zwracana j e s t t e ż typu d o u b l e ∗/
double S q r t B f P l u s ( double a ) {
/∗ Ustawiamy p r e c y z j ę na 14 c y f r ∗/
double p = 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 . 0 ;
/∗ Deklarujemy dwie zmienne l o k a l n e typu z m i e n n o p o z y c y j n e g o ∗/
double n=1 , i =1;
/∗ P ę t l ę przerwiemy i n s t r u k c j ą break p o n i ż e j ∗/
while ( true ) {
/∗ Dopóki kwadrat z i /n n i e p r z e k r a c z a a zwiększamy i ∗/
while ( i ∗ i<=a ∗n∗n ) i=i +1;
/∗ O s t a t n i e dobre i b y l o m n i e j s z e o j e d e n ∗/
i=i −1;
/∗ i /n j e s t naszym kolejnym p r z y b l i ż e n i e m p i e r w i a s t k a ∗/
c o u t <=p ) break ;
/∗ Zwiększamy n o r a z i 10− k r o t n i e ∗/
n=n ∗ 1 0 ;
i=i ∗ 1 0 ;
/∗ Koniec bloku . Zawracamy i podejmujemy próbę
k o l e j n e g o p r z e j ś c i a i n s t r u k c j i w bloku .
Ponieważ n w każdym kolejnym p r z e j ś c i u
j e s t 10− k r o t n i e w i ę k s z e , n i e będziemy
t e g o na s z c z ę ś c i e r o b i ć w n i e s k o ń c z o n o ś ć . . . ∗/
}
/∗ Zwracamy wynik ∗/
return i /n ;
/∗ Koniec podprogramu ∗/
}
/∗ Program główny ∗/
i n t main ( ) {
/∗ Ustalamy d o k ł a d n o ś ć wyprowadzanych wyników na 15 c y f r ∗/
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
/∗ Deklarujemy j e d n ą zmienną typu d o u b l e ∗/
double a ;
/∗ Wyprowadzamy t e k s t na standardowe w y j ś c i e ∗/
c o u t << " Podaj liczbe naturalna : " ;
/∗ Wprowadzamy w a r t o ś ć z m i e n n e j a z k l a w i a t u r y ∗/
c i n >> a ;
/∗ Uruchamiamy podprogram ∗/
c o u t << " Pierwiastek z " << a << " wynosi " << S q r t B f P l u s ( a ) << "\n" ;
/∗ Koniec programu ∗/
}
Listing 8.2: Usprawnione podejście do obliczania pierwiastka w C++
8.3. FUNKCJA POTĘGOWA W R
125
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗ SqrtBfQuick . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗
Szybki sposób l i c z e n i a p i e r w i a s t k a
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗ ∗∗ ∗ ∗ ∗∗ ∗/
#include 
#include <iomanip>
using namespace s t d ;
/∗ Podprogram o b l i c z a j ą c y w a r t o ś ć bezwzględną ∗/
double abs ( double x ) {
i f ( x>=0) return x ;
e l s e return −x ;
}
/∗ Podprogram o b l i c z a j ą c y p i e r w i a s t e k z l i c z b y a ∗/
double SqrtBfQuick ( double a ) {
double x=a ;
/∗ Dopóki w a r t o ś ć bezwzględna r ó ż n i c y kwadratu p r z e k r a c z a 10
w p o t ę d z e −15 z a p i s a n e w p o s t a c i w y k ł a d n i c z e j j a k o 1 e −15
∗/
while ( abs ( x∗x−a)>1e −15){
x=(x∗x+a ) / ( 2 ∗ x ) ;
c o u t << x << e n d l ;
}
return x ;
}
/∗ Po czątek głównego programu ∗/
i n t main ( ) {
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
double a ;
c o u t << " Podaj liczbe dodatnia : " ;
c i n >> a ;
c o u t << " Pierwiastek z " << a << " wynosi " << SqrtBfQuick ( a ) << "\n" ;
}
Listing 8.3: Szybkie wyznaczenie ciągu przybliżeń pierwiastka w C++.
126
8.3.1
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Nierówność Bernoullego
Poniższa nierówność przyda si˛e nam w dowodzie twierdzenia 8.9.2, o zbieżności ciagu
˛ o wyrazach 1 +
Jacob Bernoulli(rys. 8.9).
1 n
.
n
Jej autorem jest słynny matematyk szwajcarski
Twierdzenie 8.3.3
∀n ∈ N1 ∀x ∈ R :
x > −1 ⇒ (1 + x)n 1 + nx
Dowód: (*) Dowód poprowadzimy indukcyjnie względem n. Dla n = 1 nierówność jest oczywista. Załóżmy, że zachodzi
ona dla pewnego k ∈ N i wszystkich x > −1. Ustalmy y > −1. Na mocy założenia
(1 + y)k 1 + ky.
(8.3)
Ponieważ y + 1 > 0, więc mnożąc nierówność (8.3) obustronnie przez y + 1 dostajemy
(1 + y)k+1 (1 + ky)(1 + y) = 1 + (k + 1)y + ky 2 1 + (k + 1)y,
co dowodzi, że teza zachodzi dla n = k + 1 i kończy dowód indukcyjny.
8.4
Wartość bezwzględna
Definicja 8.4.1 Dla x ∈ R definiujemy wartość bezwzględną x jako
(
x
gdy x 0,
|x| :=
−x gdy x < 0.
Twierdzenie 8.4.2 Niech x, y, a ∈ R. Wtedy
|x| = | − x|,
|x| 0,
−|x| ¬ x ¬ |x|,
|x| = 0 ⇔ x = 0,
|x| ¬ a ⇔ −a ¬ x ¬ a,
|x| a ⇔ x ¬ −a lub x a,
||x| − |y|| ¬ |x ± y| ¬ |x| + |y|,
√
x2 = |x|.
|xy| = |x||y|,
(8.4)
(8.5)
(8.6)
(8.7)
(8.8)
Dowód: Własności (8.4), (8.5), (8.6) i (8.8) są oczywiste gdy rozważy się oddzielnie przypadki x 0 i x < 0. Aby
pokazać (8.7) najpierw udowodnimy, że dla dowolnych x, y ∈ R mamy
|x + y| ¬ |x| + |y|.
(8.9)
Z własności (8.4) mamy
−|x| ¬ x ¬ |x| i
− |y| ¬ y ¬ |y|.
Z własności ciała uporządkowanego mamy zatem
−(|x| + |y|) ¬ x + y ¬ |x| + |y|.
Zatem z (8.6) dostajemy (8.9). Ponieważ (8.9) zachodzi dla dowolnych x, y ∈ R, więc w szczególności możemy podstawić w
(8.9) x − y za x. W efekcie dostajemy
|x| = |(x − y) + y| ¬ |x − y| + |y|.
8.5. TWIERDZENIE O ISTNIENIU PIERWIASTKA.
127
Podobnie otrzymujemy
|y| ¬ |y − x| + |x|,
skąd wnosimy, że
|x| − |y| ¬ |x − y| i |y| − |x| ¬ |y − x| = |x − y|.
Zatem z (8.6) dostajemy
||x| − |y|| ¬ |x − y|,
a także
||x| − |y|| = ||x| − | − y|| ¬ |x − (−y)| = |x + y|,
co kończy dowód własności (8.7).
8.5
Twierdzenie o istnieniu pierwiastka.
Naszym celem√w tym rozdziale jest udowodnienie, że w zbiorze liczb rzeczywistych dodatnich pierwiaski istnieja.˛ W szczególności ostatecznie zamkniemy spraw˛e
sensowności 2. Nim jednak twierdzenie to udowodnimy potrzebujemy dwa pomocniczne twierdzenia: własność Archimedesa oraz g˛estość Q w R.
8.5.1
Własność Archimedesa
Twierdzenie 8.5.1 Ciało liczb rzeczywistych ma własność Archimedesa, tzn.
∀a, b ∈ R+ ∃n ∈ N
na > b.
Dowód: (*) Dowód poprowadzimy nie wprost. Załóżmy zatem, że istnieją liczby rzeczywiste dodatnie a, b takie, że dla
każdej liczby naturalnej n zachodzi na ¬ b. Oznacza to, że b jest majorantą zbioru
A := { x ∈ R | ∃n ∈ N x = na }.
Niech c := sup A będzie jego kresem gónym. Ponieważ c − a < c, więc c − a nie jest majorantą zbioru A. Zatem znajdziemy
n0 ∈ N takie, że n0 a > c − a. Ale wtedy (n0 + 1)a > c, a w konsekwencji c nie jest majorantą A, a tym bardziej kresem
górnym zbioru A. Otrzymana sprzeczność dowodzi twierdzenia.
Wniosek 8.5.2 Ciało liczb wymiernych ma wartość Archimedesa.
Dowód: ćwiczenie.
8.5.2
Gęstość zbioru w zbiorze
Definicja 8.5.3 Niech X będzie przestrzenią liniowo uporządkowaną, a A niech będzie podzbiorem X. Mówimy, że
A jest gęsty w X jeżeli
∀x, y ∈ X x < y ⇒ ∃z ∈ A x < z < y.
Gdy A = X, mówimy, że A jest gęsty w sobie.
Twierdzenie 8.5.4 Zbiór liczb wymiernych jest gęsty w zbiorze liczb rzeczywistych.
128
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Dowód: Niech x, y ∈ R będą takie, że x < y. Możliwe są trzy przypadki
x < 0 < y lub 0 ¬ x < y lub x < y ¬ 0.
W pierwszym przypadku teza jest oczywista, bo zero jest liczbą wymierną. Rozważmy drugi przypadek. Niech a := y −x > 0.
Z własności Archimedesa znajdziemy liczbę naturalną n taką, że na > 1. Wtedy n1 < a. Również z własności Archimedesa
wniosimy, że zbiór
A := { k ∈ N | k n1 > x }
jest niepusty. Niech m := min A. Wtedy m − 1 6∈ A. W szczególności
m−1
n
¬ x oraz
m
m−1
1
1
=
+ ¬ x + < x + a = y.
n
n
n
n
m
Zatem x < m
n < y, a ponieważ oczywiście n ∈ Q, teza w tym przypadku zachodzi. Pozostaje rozważyć trzeci przypadek.
Wtedy 0 ¬ −y < −x, zatem z rozważonego już przypadku znajdziemy z ∈ Q takie, że −y < z < −x. Ale wtedy x < −z < y
i oczywiście −z ∈ Q co kończy dowód twierdzenia.
8.5.3
Pierwiastki
Teraz możemy już udowodnić twierdzenie o istnieniu n-tego pierwiastka
Twierdzenie 8.5.5 (o istnieniu n-tego pierwiastka)
∀n ∈ N1 ∀x ∈ R∗ ∃!y ∈ R∗ :
yn = x
Dowód: (*) Pokażemy najpierw, że pierwiastek istnieje co najwyżej jeden. Dla dowodu nie wprost, przyjmijmy, że
istnieją y1 , y2 ∈ R∗ takie, że y1 6= y2 oraz y1n = y2n . Dla ustalenia uwagi możemy przyjąć, że y1 < y2 (dowód gdy y1 > y2 jest
analogiczny). Na mocy twierdzenia 8.3.2 mamy y1n < y2n co przeczy y1n = y2n i dowodzi jednoznaczności.
Dla dowodu istnienia zauważmy najpierw, że 0n = 0, zatem teza jest oczywista gdy x = 0. Możemy więc założyć, że
x > 0. Rozważmy zbiór
E := { u ∈ R∗ | un < x }.
Oczekujemy, że kres górny tego zbioru jest poszukiwanym pierwiastkiem. Musimy jednak najpierw pokazać, że E jest zbiorem niepustym i ograniczonym od
góry.
x
Pokażemy, że E 6= ∅. Niech t := x+1
. Mamy 0 < t < 1 oraz t < x. Mnożąc nierówności 0 < t < 1 obustronnie przez t > 0
dostajemy z własności ciała uporządkowanego dostajemy 0 < t2 < t. Ale t < 1, zatem 0 < t2 < 1. Rozumując indukcyjnie
stwierdzamy, że również 0 < tn−1 < 1. Mnożąc tę nierówność obustronnie przez t >) dostajemy tn < t. Zatem tn < x co
oznacza, że t ∈ E. Tak więc E 6= ∅. Pokażemy z kolei, że 1 + x jest majorantą zbioru E. Gdyby tak nie było, znaleźlibyśmy
s ∈ E, takie, że s > 1 + x. Wtedy sn > s > x. Zatem s 6∈ E. Otrzymana sprzeczność pokazuje, że 1 + x rzeczywiście jest
majorantą zbioru E, zatem E jest ograniczony od góry. Zatem ma kres górny.
Połóżmy y := sup E. Pokażemy, że rzeczywiście y n = x. Dla dowodu nie wprost załóżmy, że y n 6= x. Mamy do rozważenia
dwa przypadki: y n < x lub y n > x. Rozważmy najpierw przypadek y n < x.
Liczymy teraz, że da si˛e skonstruować y1 > y takie, że y1n < y , co przeczyłoby y = sup E . Naturalne jest poszukiwać y1 w postaci y1 = y + h.
Pytanie jak dobrać h? Mamy mieć (y + h)n < x co jest równoważne
(y + h)n − y n < x − y n .
Wiemy ze wzoru (7.6), że
(y + h)n − y n = h (y + h)n−1 + (y + h)n−2 y + · · · y n−1 < hn(y + h)n .
Zatem, dla h < 1 mamy
(y + h)n − y n < hn(y + 1)n .
(8.10)
8.6. ROZSZERZONY ZBIÓR LICZB RZECZYWISTYCH
129
Stad,
˛ by zagwarantować (8.10), wystarczy zapewnić, że
hn(y + 1)n < x − y n ,
a w tym celu wystarczy wziać
˛ h<
x−y n
n(y+1)n . Jesteśmy teraz gotowi, by ze zrozumieniem wrócić do formalnego dowodu.
Dobierzmy h ∈ Q takie, że
0 < h < min{1,
x − yn
}.
n(y + 1)n
Istnienie takiego h zapewnia nam gęstość Q w R (twierdzenie 8.5.4). Łatwo sprawdzamy, że wtedy
(y + h)n − y n < hn(y + 1)n < x − y n .
Zatem (y + h) < x, czyli y + h ∈ E. Ale y + h > y = supE, skąd y + h 6∈ E. Otrzymana sprzeczność wyklucza nierówność
y n < x.
Pozostaje pokazać, że nierówność y n > x też prowadzi do sprzeczności.
Tym razem liczymy, że uda si˛e skonstruować y2 < y ,
również b˛edace
˛ majoranta˛ zbioru E , co doprowadzi do sprzeczności z faktem, że y jako kres górny jest najmniejsza˛ majoranta.˛ Poszukujemy y2 w postaci y − k .
Chcemy mieć (y − k)n > x co jest równoważne postulatowi
y n − (y − k)n < y n − x
Rozpisujac
˛ podobnie jak poprzednio mamy
y n − (y − k)n = k y n−1 + y n−2 (y − k) + · · · + (y − k)n−1 < kny n−1 .
Podpowiada to jak dobrać k .
Dobierzmy k ∈ Q takie, że
0<k<
yn − x
.
ny n−1
Łatwo sprawdzamy, że przy tak dobranym k mamy (y − k)n > x. Twierdzimy, że y − k jest majorantą zbioru E. Gdyby tak
nie było, znaleźlibyśmy v ∈ E takie, że v > y − k. Ale wtedy v n > (v − k)n > x, co przeczy v ∈ E. Zatem y − k rzeczywiście
jest majorantą zbioru E. Ale y − k < y, skąd y nie jest najmniejszą majorantą E< zatem y 6= sup E. Otrzymana sprzeczność
dowodzi, że y n = x.
√
Nieujemną liczbę, której n-ta potęga jest równa liczbie x 0 nazywamy n-tym pierwiastkiem z x i oznaczamy n x.
Twierdzenie 8.5.6
∀n ∈ N1 ∀x, y ∈ R∗ :
√
n
xy =
√
√
n
xny
Dowód: ćwiczenie.
W programie Mathematica pierwiastek kwadratowy z√x zapisujemy jako Sqrt[x]. Nie ma natomiast podobnej notacji
n
dla pierwiastków stopnia wyższego niż dwa. Aby policzyć
x piszemy x^(1/n).
Notacja ta bierze si˛e stad,
˛ że, jak wkrótce zobaczymy,
√
1
n
funkcj˛e pot˛egowa˛ można rozszerzyć na wykładniki rzeczywiste i wtedy x = x n .
8.6
8.6.1
Rozszerzony zbiór liczb rzeczywistych
R uzupełniony o −∞ i +∞
Aby brać kres górny lub dolny podzbioru R trzeba sprawdzać czy jest on ograniczony odpowiednio od góry lub dołu. Jest to niewygodnie, dlatego przydaje si˛e
zbiór liczb rzeczywistych rozszerzony o plus i minus nieskończoność. W takim rozszerzonym zbiorze każdy podzbiór ma kres górny lub dolny. Jest nim zwykła
liczba gdy zbiór jest ograniczony, a plus lub minus nieskończoność jeśli jest nieograniczony od góry lub nieograniczony od dołu.
130
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Definicja 8.6.1 Definiujemy rozszerzony zbiór liczb rzeczywistych jako
R̄ := R ∪ {−∞, ∞}.
Ponadto przyjmujemy, że dla każdego x ∈ R
− ∞ < x < ∞.
Uwaga 8.6.2 Każdy niepusty podzbiór R̄ posiada kresy.
Definicja 8.6.3 W R̄ definiujemy następujące działania:
(i) Dla x ∈ R
x + ∞ := ∞, x − ∞ := −∞,
x
∞
(ii) Dla x ∈ R+
x · ∞ := ∞, x · (−∞) := −∞.
(iii) Dla x ∈ R−
x · ∞ := −∞, x · (−∞) := ∞.
:=
x
−∞
:= 0.
(iv) Ponadto ∞ · ∞ := (−∞) · (−∞) := ∞, ∞ · (−∞) := (−∞) · ∞ := −∞.
(v) Oraz ∞ + ∞ := ∞, (−∞) + (−∞) := −∞.
Uwaga 8.6.4 Jeśli A ⊂ R̄ jest zbiorem niepustym, to A jest ograniczony od góry (od dołu) wtedy i tylko wtedy gdy
sup A < ∞ (inf A > −∞).
8.6.2
Kresy funkcji
Definicja 8.6.5 Niech X będzie zbiorem, A ⊂ X jego podzbiorem, a f : X → R̄ funkcją. Definiujemy kres górny
funkcji f na zbiorze A jako
sup f (x) := sup f (A) = sup { f (x) | x ∈ A }.
x∈A
Definiujemy kres dolny funkcji f na zbiorze A jako
inf f (x) := inf f (A) = inf { f (x) | x ∈ A }.
x∈A
Mówimy, że f jest ograniczona od góry (od dołu) na zbiorze A gdy f (A) jest ograniczony od góry (od dołu) co jest
równoważne warunkowi supx∈A f (x) < ∞ (inf x∈A f (x) > −∞).
8.6. ROZSZERZONY ZBIÓR LICZB RZECZYWISTYCH
131
Twierdzenie 8.6.6 Mamy następujące własności kresów funkcji:
(i) Niech f : X → R̄ będzie funkcją, a A ⊂ X. Wtedy
inf (−f (x))
= − sup f (x),
sup (−f (x))
= − inf f (x).
x∈A
x∈A
x∈A
x∈A
(ii) Niech fi : X → R̄ dla i ∈ {1, 2} będą funkcjami, a A ⊂ Xi . Wtedy
sup (f1 (x) + f2 (x))
¬
x∈A
sup f1 (x) + sup f2 (x),
x∈A
inf (f1 (x) + f2 (x))
x∈A

x∈A
inf f1 (x) + inf f2 (x).
x∈A
x∈A
Dowód: (*)Aby udowodnić własność (i) połóżmy a := supx∈A f (x) oraz b := inf x∈A (−f (x)). Wystarczy pokazać, że
−a ¬ b i −a b. Niech x ∈ A. Wtedy z definicji kresu górnego f (x) ¬ a. Zatem −a ¬ −f (x) dla wszystkich elementów
x ∈ A. Zatem −a jest minorantą zbioru { −f (x) | x ∈ A }, skąd −a ¬ inf x∈A (−f (x)) = b. Potrzebujemy jeszcze pokazać,
że −a b. Ustalmy ponownie x ∈ A. Z definicji kresu dolnego mamy b ¬ −f (x), skąd f (x) ¬ −b. Zatem −b jest majorantą
zbioru { f (x) | x ∈ A }, co oznacza, że −b a, czyli −a b. Dowodzi to pierwszej równości własności (i). Drugą dowodzi
się analogicznie.
Dla dowodu pierwszej nierówności własności (ii) połóżmy a1 := supx∈A f1 (x), a2 := supx∈A f2 (x) oraz ustalmy x ∈ A. Z
definicji kresu górnego mamy
f1 (x) ¬ a1 f2 (x) ¬ a2 .
Zatem
f1 (x) + f2 (x) ¬ a1 + a2 .
Ponieważ x ∈ A jest dowolnie ustalone, wnosimy, że a1 + a2 jest majorantą zbioru { f1 (x) + f2 (x) | x ∈ A }. Ponieważ
supx∈A (f1 (x) + f2 (x)) jest najmniejszą majorantą tego zbioru, dostajemy
sup (f1 (x) + f2 (x)) ¬ a1 + a2 ,
x∈A
co dowodzi pierwszej nierówności we własności (ii). Drugą nierówność dowodzi się analogicznie.
W podobny sposób dowodzi się następujących twierdzeń.
Twierdzenie 8.6.7 Niech f : X1 × X2 → R̄ będzie funkcją, a Ai ⊂ Xi dla i ∈ {1, 2}. Wtedy
f (x1 , x2 ) = sup
sup f (x1 , x2 ) ,
sup
x1 ∈A1
(x1 ,x2 )∈A1 ×A2
x2 ∈A2
inf
(x1 ,x2 )∈A1 ×A2
f (x1 , x2 )
=
inf
x1 ∈A1
inf f (x1 , x2 ) .
x2 ∈A2
Twierdzenie 8.6.8 Niech fi : Xi → R̄ oraz Ai ⊂ Xi dla i ∈ {1, 2}. Jeśli inf xi ∈Ai fi (xi ) > −∞ oraz supxi ∈Ai fi (xi ) <
∞ to
sup
(f1 (x1 ) + f2 (x2 ))
=
inf
(x1 ,x2 )∈A1 ×A2
sup f1 (x1 ) + sup f2 (x2 ),
x1 ∈A1
(x1 ,x2 )∈A1 ×A2
(f1 (x1 ) + f2 (x2 ))
=
x2 ∈A2
inf f1 (x1 ) + inf f2 (x2 ).
x1 ∈A1
x2 ∈A2
132
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Twierdzenie 8.6.9 Niech f : X → R̄ będzie funkcją, A ⊂ X, a c ∈ R. Wtedy
sup (f (x) + c)
=
x∈A
inf (f (x) + c)
x∈A
8.7
8.7.1
sup f (x) + c,
x∈A
=
inf f (x) + c.
x∈A
Ciało liczb zespolonych
Liczby zespolone
Chcemy rozszerzyć ciało liczb rzeczywistych tak, by pozostało ciałem, ale była w nim liczba i o własności i2 = −1. Widać, że jeśli ma to być ciało to musi w nim
też być liczba a + bi dla dowolnych rzeczywistych a, b. Jednak suma i iloczyn liczb tej postaci nie wymaga już dalszego rozszerzania, bo
(a + bi) + (c + di)
=
(a + c) + (b + d)i,
(a + bi)(c + di)
=
ac + adi + bci + bdi2 = (ac − bd) + (ad + bc)i.
Niestety nie ma szans, by ciało to było uporzadkowane,
˛
bo wtedy albo i > 0, albo −i > 0, co na mocy własności ciała uporzadkowanego
˛
prowadzi do i2 > 0
2
sprzecznego z i = −1.
Pozostaje jednak pytanie, czy sam pomysł liczby i jako elementu ciała rozszerzajacego
˛
ciało liczb rzeczywistych też nie prowadzi do jakiejś sprzeczności,
której jeszcze nie widzimy. Aby przekonać si˛e, że tak nie jest, trzeba zbudować formalny model liczb zespolonych.
8.7.2
Ciało C
W C := R2 wprowadzamy działania
(a, b) + (c, d)
:=
(a + c, b + d),
(a, b)(c, d)
:=
(ac − bd, ad + bc).
Twierdzenie 8.7.1 Zbiór C := R2 z tak określonymi działaniami oraz parami (0, 0) i (1, 0) jako elementami neutralnymi odpowiednio dla dodawania i mnożenia jest ciałem.
Definicja 8.7.2 Ciało to nazywamy ciałem liczb zespolonych.
Dla dowolnych a, b ∈ R mamy (a, 0) + (b, 0) = (a + b, 0) oraz (a, 0)(b, 0) = (ab, 0), zatem parę (a, 0) możemy utożsamiać
z liczbą rzeczywistą a.
Zwyczajowo kładziemy i := (0, 1). Jest to tak zwana jednostka urojona. Łatwo sprawdzamy, że i2 = (−1, 0) = −1 oraz
(a, b) = (a, 0) + (b, 0)i = a + bi.
√
Dla liczby zespolonej z := a + bi definiujemy jej moduł |z| := a2 + b2 oraz jej sprzężenie z̄ := a − bi.
Dla liczby zespolonej z = a+bi liczby a, b ∈ R nazywamy odpowiednio częścią rzeczywistą i częścią urojoną z i oznaczamy
re z i im z.
W programie Mathematica jednostkę urojoną i oznaczamy I, a liczbę zespoloną a + bi zapisujemy jako a + b I.
Interpretacja geometryczna liczby zespolonej przedstawiona jest na rys. 8.3, interpretacja sumy na rys. 8.4, a interpretacja
iloczynu liczby zespolonej przez liczbę i na rys. 8.5.
8.7. CIAŁO LICZB ZESPOLONYCH
Rysunek 8.3: Interpretacja geometryczna liczby zespolonej z := a + bi, jej modułu oraz sprzężenia.
Rysunek 8.4: Interpretacja geometryczna sumy liczb zespolonych.
Rysunek 8.5: Interpretacja geometryczna iloczynu liczby zespolonej przez liczbę i.
133
134
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
8.7.3
Zespolona funkcja kwadratowa
Wiemy ze szkoły, że miejsca zerowe funkcji kwadratowej
x 7→ ax2 + bx + c
zależa˛ od tzw. wyróżnika ∆ := b2 −4ac, w szczególności miejsc zerowych nie ma, gdy wyróżnik jest ujemny. Sytuacja ulega zmianie, gdy w funkcji tej dopuścimy
argument zespolony.
Twierdzenie 8.7.3 Rozważmy zespoloną funkcją kwadratową o współczynnikach rzeczywistych tj. funkcję
Q : C 3 z 7→ az 2 + bz + c ∈ C,
gdzie a, b, c ∈ R są zadanymi współczynnikami rzeczywistymi. Niech ∆ := b2 − 4ac. Jeśli ∆ > 0, to Q ma dwa
rzeczywiste miejsca zerowe
√
−b ± ∆
.
z1,2 :=
2a
Gdy ∆ = 0 funkcja Q ma jeden pierwiatek rzeczywisty
z :=
−b
.
2a
Natomiast dla ∆ < 0 mamy dwa zespolone, wzajemnie sprzężone miejsca zerowe
√
−b ± i −∆
z1,2 :=
.
2a
8.7.4
Liczby zespolone o module jeden.
Półprosta poprowadzona z poczatku
˛ układu współrz˛ednych pod katem
˛
ϕ do osi X przecina okrag
˛ jednostkowy
S1 := { z ∈ C | |z| = 1 }
(rys. 8.6) w punkcie o współrz˛ednych
zϕ (cos ϕ, sin ϕ) ∈ C.
Wykorzystujac
˛ tożsamości trygonometryczne dla sumy katów
˛ można pokazać, że
zϕ+ψ
=
cos(ϕ + ψ) + i sin(ϕ + ψ)
=
(cos ϕ cos ψ − sin ϕ sin ψ) + i(sin ϕ cos ψ + cos ϕ sin ψ)
=
(cos ϕ + i sin ϕ)(cos ψ + i sin ψ)
=
zϕ zψ .
To przypomina fundamentalna˛ własność funkcji wykładniczej. Matematyk szwajcarski Leonard Euler pokazał, że rzeczywista˛ funkcj˛e wykładnicza˛ można
rozszerzyć na argumenty zespolone
ez :=
∞
X
zn
n!
n=0
i przy takiej definicji dla x ∈ R zachodzi słynny wzór o nawijaniu prostej na okrag
˛
8.8. GRANICE CIĄGÓW W R
135
Rysunek 8.6: Liczby zespolone o module jeden.
eix = cos x + i sin x,
który jest wygodna˛ podstawa˛ tak formalnej definicji jak i własności funkcji trygonometrycznych. Aby pójść ta˛ droga˛ potrzebujemy rozszerzyć poj˛ecie granicy
ciagu
˛ i zbieżności szeregu na liczby zespolone.
8.7.5
Odległość w R i C.
Wyst˛epujaca
˛ w definicji Cauchy’ego granicy ciagu
˛ wartość bezwzgl˛edna |a − b| dla a, b ∈ R może być interpretowana jako odległość pomi˛edzy liczbami a i b.
Uogólniajac
˛ poj˛ecie odległości możemy si˛e pokusić o uogólnienie poj˛ecia granicy.
Moduł liczby zespolonej pod wieloma względami przypomina wartość bezwzględną:
Twierdzenie 8.7.4 Moduł liczby zespolonej ma następujące własności
(i)
∀z ∈ C
|z| = 0 ⇔ z = 0,
(ii)
∀z1 , z2 ∈ C
|z1 z2 | = |z1 ||z2 |,
(iii)
∀z1 , z2 ∈ C
|z1 + z2 | ¬ |z1 | + |z2 |.
Dlatego |z1 − z2 | można interpretować jako odległość pomi˛edzy liczbami zespolonymi z1 i z2 .
Zilustrowano to na rys. 8.7
8.8
Granice ciągów w R
W rozdziale 1.2
˛ jako narz˛edzie do przybliżania liczb, które nie sa˛ liczbami wymiernymi i analizowaliśmy prosty algorytm pozwalajacy
˛ przy√ przedstawiliśmy ciagi
bliżać liczb˛e 2. Przedstawiliśmy też ide˛e granicy ciagu
˛ jako liczby, która˛ ciag
˛ przybliża. Teraz przyjrzymy si˛e temu poj˛eciu dokładniej, ale zaczniemy od dwóch
dodatkowych eksperymentów numerycznych.
8.8.1
Eksperymenty numeryczne
Listing 8.4 prezentuje program w j˛ezyku Mathematica obliczajacy
˛ wyrazy ciagu
˛ (1.2) rozważanego w rozdziale 1.2.5 jako narz˛edzie do przybliżania liczby π . Jego
odpowiednik w j˛ezyku C++ przedstawiono na listingu 8.5.
136
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Rysunek 8.7: Odległość liczb zespolonych z1 i z2 .
( ∗ P r z y b l i ż a n i e l i c z b y p i obwodem wpisanych w i e l o k ą t ó w ∗ )
P i B y C i rcumference [ d_ ] :=
Module [ { a , m, n , A} ,
( ∗ Zaczynamy od wpisanego kwadratu .
Jego bok a wynosi p ó ł p i e r w i s t k a z dwóch .
Do p o l i c z e n i a
p i e r w i a s t k a wykorzystujemy f u n k c j ę wbudowaną S q r t ∗ )
a = Sqrt [ 2 . ] / 2 ;
m = 4 ; ( ∗ I l o ś c boków w i e l o k ą t a , na p o c z ą t e k c z t e r y ∗ )
n = 1;
( ∗ Numer k o l e j n e g o wyrazu c i ą g u , na p o c z ą t e k j e d e n ∗ )
Do[ ( ∗ Początek p ę t l i Do∗ )
A=m∗ a ;
( ∗ Obliczamy d ł u g o ś ć obwodu ∗ )
( ∗ Domyślnie d l a l i c z b maszynowych Mathematica w y p i s u j e t y l k o 6 c y f r .
NumberForm pozwala wydobyć w i ę c e j c y f r ∗ )
Print [ n , " " , NumberForm[ A, 1 6 ] ] ;
( ∗ Wydruk k o n t r o l n y . ∗ )
n = n + 1;
( ∗ K o l e j n y wyraz c i ą g u ∗ )
m = m∗ 2 ; ( ∗ K o l e j n y w i e l o b o k b ę d z i e miał dwa r a z y w i ę c e j boków ∗ )
a = Sqrt [ 2 − Sqrt [ 4 − 4∗ a ∗ a ] ] / 2 , ( ∗ o t a k i e j d ł u g o ś c i ∗ )
{d} ( ∗ I l o ś ć powtórzeń p ę t l i Do ∗ )
] ; ( ∗ Koniec p ę t l i Do∗ )
a ∗m
]
Listing 8.4: Wyznaczenie ciągu przybliżeń liczby π w języku Mathematica w oparciu o obwody wielokątów
8.8. GRANICE CIĄGÓW W R
137
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ PiByCircumference . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z obwody
∗/
/∗ w i e l o k ą t ó w foremnych wpisanych w okrąg o ś r e d n i c y j e d e n ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include 
#include <iomanip>
/∗ B i b l i o t e k a matematyczna , z a w i e r a standardowe i m p l e m e n t a c j e
w i e l u matematycznych , f u n k c j i . My sk orzys tamy p o n i ż e j
z f u n k c j i s q r t l i c z ą c e j p i e r w i a s t e k kwadratowy ∗/
#include <cmath>
using namespace s t d ;
i n t main ( ) {
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
c o u t << f i x e d << r i g h t ;
/∗ Zaczynamy od wpisanego kwadratu , k t ó r e g o
bok a wynosi p ó ł p i e r w i a s t k a z 2 . Do p o l i c z e n i a
p i e r w i a s t k a wykorzystujemy b i b l i o t e c z n y
podprogram s q r t ∗/
double a=s q r t ( 2 . 0 ) / 2 ;
/∗ I l o ś c boków w i e l o k ą t a , na p o c z ą t e k c z t e r y ∗/
i n t m=4;
/∗ Numer k o l e j n e g o wyrazu c i ą g u , i l o ś ć wyrazów do p o l i c z e n i a ∗/
i n t n=1 ,nmax=40;
/∗ Dla w s z y s t k i c h n od 1 do nmax ∗/
while ( n<nmax ) {
/∗ Obliczamy d ł u g o ś ć obwodu ∗/
double A=m∗ a ;
c o u t << "
A[" << setw ( 2 ) << n << "] =" ;
c o u t << setw ( 1 8 ) << A << e n d l ;
/∗ K o l e j n y w i e l o k ą t b ę d z i e miał dwa r a z y w i ę c e j boków ∗/
m=m∗ 2 ;
/∗ A t y l e w y n i e s i e d ł u g o ś ć j e g o boku ∗/
a=s q r t (2− s q r t (4−4∗ a ∗ a ) ) / 2 ;
/∗ K o l e j n y wyraz c i ą g u ∗/
n=n+1;
}
}
Listing 8.5: Wyznaczenie ciągu przybliżeń liczby π w C++ w oparciu o obwody wielokątów
138
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Uruchamiajac
˛ program w C++ z listingu 8.5 otrzymujemy nast˛epujacy
˛ ciag
˛ liczb (moga˛ wyst˛epować drobne różnice dla różnych platform), z których pierwszych
czternaście to:
A1
=
2.828427124746190
A2
=
3.061467458920719
A3
=
3.121445152258053
A4
=
3.136548490545940
A5
=
3.140331156954754
A6
=
3.141277250932759
A7
=
3.141513801144285
A8
=
3.141572940367515
A9
=
3.141587725275636
A10
=
3.141591421514008
A11
=
3.141592345563526
A12
=
3.141592576625775
A13
=
3.141592634298169
A14
=
3.141592650272843
Do tego miejsca ciag
˛ ten zachowuje si˛e bardzo przyzwoicie, a jego kolejne wyrazy rosna.˛ Jednak dalsze wyrazy pokazuja,˛ że nie do końca spełnia on nasze
oczekiwania.
A15
=
3.141592648934190
A16
=
3.141592684156058
A17
=
3.141592607672169
A18
=
3.141592910939673
A19
=
3.141591696683685
A20
=
3.141596553704820
A21
=
3.141596553704820
A22
=
3.141518840465548
A23
=
3.141207968282266
A24
=
3.142451272494134
A25
=
3.142451272494134
A26
=
3.162277660168380
A27
=
3.162277660168380
A28
=
2.828427124746190
A29
=
0.000000000000000
Poczynajac
˛ od wyrazu A15 ciag
˛ przestaje być rosnacy
˛ i zamiast przybliżać, zaczyna oddalać si˛e od π , a wyraz A29 wynosi wr˛ecz zero! I w tym przypadku
przyczyna˛ ograniczeń algorytmu jest skończona arytmetyka komputera. Efekt obliczeń z precyzja˛ maszynowa˛ w środowisku Mathematica jest analogiczny.
Wartość liczby π z dokładnościa˛ do 15-tu miejsc dziesi˛etnych wynosi
π = 3.141592653589793 . . . .
8.8. GRANICE CIĄGÓW W R
139
Zatem przy zastosowaniu 64-bitowego typu double przedstawiona metoda pozwala policzyć π z dokładnościa˛ do około 8 cyfr znaczacych.
˛
Warto podkreślić, że sama obserwacja numeryczna zachowania tego ciagu
˛ może prowadzić do bł˛ednego wniosku iż ciag
˛ ten jest zbieżny do zera. Aby mieć
praktyczny pożytek z ciagu
˛ jako narz˛edzia do przybliżania liczb, musimy umieć od strony teoretycznej przeanalizować jego zachowanie.
Mathematica radzi sobie łatwo z wyliczeniem π z duża˛ dokładnościa,˛ ale wymaga to obliczeń wysokiej precyzji, znacznie kosztowniejszych od obliczeń z
precyzja˛ maszynowa.˛ Na przykład piszac
˛
N [ Pi , 1 0 0 0 ]
otrzymujemy
3.14159265358979323846264338327950288419716939937510582097494459230781\
6406286208998628034825342117067982148086513282306647093844609550582231\
7253594081284811174502841027019385211055596446229489549303819644288109\
7566593344612847564823378678316527120190914564856692346034861045432664\
8213393607260249141273724587006606315588174881520920962829254091715364\
3678925903600113305305488204665213841469519415116094330572703657595919\
5309218611738193261179310511854807446237996274956735188575272489122793\
8183011949129833673362440656643086021394946395224737190702179860943702\
7705392171762931767523846748184676694051320005681271452635608277857713\
4275778960917363717872146844090122495343014654958537105079227968925892\
3542019956112129021960864034418159813629774771309960518707211349999998\
3729780499510597317328160963185950244594553469083026425223082533446850\
3526193118817101000313783875288658753320838142061717766914730359825349\
0428755468731159562863882353787593751957781857780532171226806613001927\
876611195909216420199
jako przybliżenie liczby π z dokładnościa˛ do 1000 cyfr.
Ćwiczenie komputerowe 8.8.1 Zmodyfikuj program z listingu 8.5 tak by przybliżał π wykorzystujac
˛ 2n -katy
˛ foremne opisane na okr˛egu (patrz
cw. 1.2.7). Wykorzystaj ten program do prześledzenia zachowania tego ciagu
˛ przybliżeń.
8.8.2
Granice pozorne
W poprzednim podrozdziale zaobserwowaliśmy, że wyciaganie
˛
wniosków na temat granicy ciagu
˛ z samego numerycznego eksperymentu może być niebezpieczne.
Okazuje si˛e, że ciag
˛ może robić wrażenie zbieżnego, a mimo wszystko zbieżnym nie być. Rozważmy ciag
˛ dany wzorem rekurencyjnym
x0
x1
=
=
136.462554878752
5.39650717129623
(8.11)
(8.12)
xn
=
0.3x0 + 1 − 1.4x21
(8.13)
Program w j˛ezyku Mathematica wyznaczajacy
˛ wyrazy tego ciagu
˛ przedstawiony jest na listingu 8.6. Wersja w C++ jest na listingu 8.7.
Przejrzenie pierwszych 15-tu wyrazów tego ciagu
˛ może robić wrażenie, że ciag
˛ ten jest zbieżny do granicy wynoszacej
˛ około 0.63135. Przejrzenie 50-ciu
wyrazów zaciera to pierwsze wrażenie. Jednakże, po doświadczeniach z ciagiem przybliżajacym
˛
π możemy być skłonni podejrzewać, że przyczyna˛ niestabilnego
zachowania dalszych wyrazów tego ciagu
˛ znów jest skończona arytmetyka komputera. Okazuje si˛e jednak, że obserwowana numerycznie zbieżność tego ciagu
˛
jest pozorna. Wykres pierwszych 100 wyrazów tego ciagu
˛ przedstawiono na rys. 8.8. Przykłady tego typu zaobserwowane zostały przez matematyków po raz
pierwszy dopiero w XX wieku. Rozważany przez nas przykład wywodzi si˛e z tzw. odwzorowania Hénona.
8.8.3
Definicja Cauchy’ego granicy ciągu
Niech x : N → R będzie ciągiem liczb rzeczywistych.
140
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
( ∗ Przykład z c i ą g i e m p o z o r n i e zbieżnym , zadanym r e k u r e n c y j n i e ∗ )
Henon [ n_ ] := Module [ { a , b , x0 , x1 , x2 , k } ,
a = 1 . 4 ; b = 0 . 3 ; ( ∗ Pomocnicze parametry a i b ∗ )
k = 0 ; ( ∗ L i c z n i k wyrazów c i ą g u ∗ )
( ∗ Dwa początkowe wyrazy c i ą g u ∗ )
x0 = 1 3 6 . 4 6 2 5 5 4 8 7 8 7 5 2 ;
x1 = 5 . 3 9 6 5 0 7 1 7 1 2 9 6 2 3 ;
Do[ k = k + 1 ;
( ∗ K o l e j n y wyraz c i ą g u wyliczamy w o p a r c i u o dwa p o p r z e d n i e ∗ )
x2 = b∗ x0 + 1 − a ∗ x1 ∗ x1 ;
( ∗ Nowe w a r t o ś c i dwóch p o r z e d n i c h wyrazów c i ą g u ∗ )
x0 = x1 ;
x1 = x2 ;
Print [ { k , NumberForm[ x2 , 1 6 ] } ] ,
{n}
];
]
Listing 8.6: Przykład ciągu pozornie zbieżnego w języku Mathematica.
Rysunek 8.8: Wykres pierwszych 100 wyrazów ciągu danego wzorami (8.11)-(8.13)
8.8. GRANICE CIĄGÓW W R
141
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ Henon . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ Przykład z zadanym r e k u r e n c y j n i e c i ą g i e m , p o z o r n i e zbieżnym . ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include 
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
/∗ Dla w i ę k s z e j c z y t e l n o ś c i wyników narzucamy s t a ł o p o z y c y j n y ,
wyrównywany w prawo z a p i s l i c z b ∗/
c o u t << f i x e d << r i g h t ;
/∗ Pomocnicze parametry a i b ∗/
double a =1.4 , b = 0 . 3 ;
/∗ Dwa początkowe wyrazy c i ą g u ∗/
double x0 = 1 3 6 . 4 6 2 5 5 4 8 7 8 7 5 2 ;
double x1 = 5 . 3 9 6 5 0 7 1 7 1 2 9 6 2 3 ;
/∗ I l o ś ć wyrazów c i ą g u do p o l i c z e n i a ∗/
i n t nmax=15;
/∗ Inna forma p ę t l i . I n s t r u k c j e w bloku { . . . } wykonujemy d l a w a r t o ś c i n
od j e d e n do nmax z w i ę k s z a j ą c n za każdym razem o j e d e n ∗/
f o r ( i n t n=1;n<=nmax ; n=n+1){
/∗ K o l e j n y wyraz c i ą g u wyliczamy w o p a r c i u o dwa p o p r z e d n i e ∗/
double x2=b∗ x0+1−a ∗ x1 ∗ x1 ;
/∗ Wyprowadzamy w y n i k i na standardowe w y j ś c i e . setw ( p ) u s t a l a i l o ś ć p ó l
d l a wyprowadzanej k o l e j n e j z m i e n n e j . Pozwala t o na l e p s z e
f o r m a t o w a n i e wypisywanych danych ∗/
c o u t << "x[" << setw ( 2 ) << n << " ]= " ;
c o u t << setw ( 2 0 ) << x0 << e n d l ;
/∗ Nowe w a r t o ś c i dwóch p o r z e d n i c h wyrazów c i ą g u ∗/
x0=x1 ;
x1=x2 ;
}
}
Listing 8.7: Przykład ciągu pozornie zbieżnego w C++.
142
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Definicja 8.8.2 Mówimy, że ciąg x jest zbieżny do granicy g ∈ R jeżeli
∀ > 0∃N ∈ N∀n > N
|xn − g| < .
Piszemy wtedy
lim xn = g.
n→∞
Mówimy, że ciąg x jest zbieżny, jeżeli istnieje g ∈ R takie, że x jest zbieżny do g.
Twierdzenie 8.8.3 Niech p ∈ N1 . Wtedy
lim
n→∞
1
= 0.
np
Dowód:
1
Niech ∈ R+ . Weźmy n ∈ N takie, że N > √
Niech n będzie większe od N . Wtedy n >
p
1
1
p
potęgowej n > i w konsekwencji np < . Zatem dla n > N mamy
|
1
√
p
i z monotoniczności funkcji
1
1
− 0| = p < .
p
n
n
Mówimy, że ciąg a : N → R jest ograniczony, jeśli istnieje M ∈ R takie, że |an | ¬ M dla wszystkich n ∈ N.
Twierdzenie 8.8.4 Ciąg zbieżny w R jest ograniczony.
Dowód:
Niech a∗ := limn→∞ an . Dla = 1 znajdziemy N ∈ N takie, że dla n > N mamy |an − a∗ | < 1. Zatem dla takich n jest
|an | = |an − a∗ + a∗ | ¬ |an − a∗ | + |a∗ | < 1 + |a∗ |.
W zbiorze skończonym { |an | | n ∈ N i n ¬ N } jest element największy. Oznaczmy go M0 i weźmy
M := max(1 + |a∗ |, M0 ).
Wtedy dla wszystkich n ∈ N mamy an ¬ M .
8.8.4
Granica ciągu, a struktura ciała w R
Niech a, b : N → R będą ciągami liczb rzeczywistych. Niech ∈ { +, −, · } będzie operatorem dodawania, odejmowania lub
mnożenia w R. Definiujemy nowy ciąg
a b : N 3 n 7→ an bn ∈ R.
Twierdzenie 8.8.5
(i)
Jeśli ciągi a, b są zbieżne to ciąg a b jest zbieżny oraz
lim (an bn ) = lim an lim bn .
n→∞
(ii)
n→∞
n→∞
Jeśli ciągi a, b są zbieżne i limn→∞ bn 6= 0 to ciąg a / b jest zbieżny oraz
lim
n→∞
an
limn→∞ an
=
.
bn
limn→∞ bn
8.8. GRANICE CIĄGÓW W R
143
Dowód:
Niech limn→∞ an = a∗ i limn→∞ bn = b∗ Przedstawimy dowód dla przypadku gdy jest iloczynem. Pozostałe dowody
są albo łatwiejsze (suma, różnica), albo wyglądają podobnie (iloraz).
Naszym celem jest oszacowanie różnicy
|an bn − a∗ b∗ |
dla dużych n, przy wykorzystaniu oszacowań na różnice |an − a∗ | i |bn − b∗ |, które możemy uzyskać ze zbieżności ciagów
˛
a i b. Sztuczka˛ powszechnie
stosowana˛ przy takich oszacowaniach jest dodanie i odj˛ecie wyrazu pomocniczego i skorzystanie z własności wartości bezwzgl˛ednej.
|an bn − a∗ b∗ | = |an bn − a∗ bn + a∗ bn − a∗ b∗ | = |(an − a∗ )bn + a∗ (bn − b∗ )| ¬ |an − a∗ ||bn | + |a∗ ||bn − b∗ |
˛ ac
˛ nierówność
Aby suma dwóch ostatnich składników była mniejsza od wystarczy, by każdy z nich był mniejszy od 2 . Rozwiazuj
|a∗ ||bn − b∗ | <
,
2
˛ b do stałej 2|a ∗ | . Wyjatkiem
˛
jest |a∗ | = 0,
widzimy, że wystarczy, by |bn − b∗ | < 2|a ∗ | , a to mamy zagwarantowane dla n > N1 dobranego dla ciagu
bo wtedy nie można dzielić przez |a∗ |, ale z tym nie ma problemu, bo przy |a∗ | = 0 lewa strona nierówności jest zero, wi˛ec nierówność jest spełniona dla
wszystkich n.
Troch˛e bardziej kłopotliwy jest przypadek nierówności
|an − a∗ ||bn | <
,
2
bo tu n wyst˛epuje w dwóch miejscach. Jednak wiemy, że ciag
˛ zbieżny jest ograniczony, wi˛ec możemy znaleźć stała˛ M > 0 taka,˛ że |bn | < M dla wszystkich
n. Zatem wystarczy, by
|an − a∗ | <
,
2M
a to mamy zagwarantowane dla n > N2 dobranego dla ciagu
˛ a do stałej 2M
.
Aby uniknać
˛ oddzielnego rozważania przypadku a∗ = 0 wystarczy zauważyć, że |a∗ | < |a∗ | + 1, a |a∗ | + 1 6= 0, wi˛ec można od razu dobrać N1 tak,
by |bn − b∗ | < 2(|a∗|+1) .
Weźmy ustalone > 0. Niech M będzie takie, że |bn | < M dla wszystkich n ∈ N. Niech N1 ∈ N oraz N2 ∈ N będą takie,
że
,
n > N1 ⇒ |bn − b∗ | <
2(|a∗ | + 1)
n > N2 ⇒ |an − a∗ | <
.
2M
Niech N := max{N1 , N2 }. Ustalmy n > N . Wtedy
|an bn − a∗ b∗ | ¬ |an − a∗ ||bn | + |a∗ ||bn − b∗ | ¬ |an − a∗ |M + (|a∗ | + 1)|bn − b∗ | <
M + (|a∗ | + 1)
= ,
2M
2(|a∗ | + 1)
co dowodzi, że
lim an bn = a∗ b∗ .
n→∞
8.8.5
Granica ciągu, a struktura porządkowa w R
Niech a, b, c : N → R będą ciągami liczb rzeczywistych.
Twierdzenie 8.8.6 Jeśli istnieje N ∈ N takie że dla wszystkich n > N ciągi an , bn , cn spełniają nierówność
an ¬ bn ¬ cn
i ciągi an oraz cn są zbieżne do granicy g, to ciąg bn też jest zbieżny do granicy g.
144
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Dowód:
Ustalmy > 0. Ze zbieżności ciągów a i c do g wynika, że możemy dobrać stałą N > 0 tak, by dla n > N zachodziły
nierówności
|an − g| < ,
|cn − g| < .
Oznacza to, że dla n ∈ N zachodzi
− < an − g < ,
− < cn − g < .
Zatem mamy dla n > N
− < an − g ¬ bn − g ¬ cn − g < ,
co oznacza, że dla takich n
|bn − g| < i dowodzi, że
lim bn = g.
n→∞
Twierdzenie 8.8.7 Niech a : N → R będzie ciągiem liczb rzeczywistych.
(i)
Jeśli a jest ciągiem rosnącym i ograniczonym od góry, to ciąg ten jest zbieżny oraz
lim an = sup { an | n ∈ N }.
n→∞
(ii)
Jeśli a jest ciągiem malejącym i ograniczonym od dołu, to ciąg ten jest zbieżny oraz
lim an = inf { an | n ∈ N }.
n→∞
Dowód:
Udowodnimy własność (i). Drugą własność dowodzi się analogicznie. Oznaczmy
a∗ := sup { an | n ∈ N }.
Ustalmy > 0. Z definicji kresu górnego wynika, że a∗ − nie jest majorantą zbioru { an | n ∈ N }, zatem istnieje takie
N ∈ N, że aN > a∗ − . Zatem dla n > N mamy
a∗ − < aN ¬ an ¬ a∗ < a∗ + ,
czyli
|an − a∗ | < ,
co dowodzi, że ciąg a jest zbieżny i jego granicą jest a∗ .
8.9. PRZYKŁADY I ZASTOSOWANIA GRANIC CIĄGÓW W R
8.9
8.9.1
145
Przykłady i zastosowania granic ciągów w R
Granice kilku ważnych ciągów
Twierdzenie 8.9.1
p ∈ R+
⇒
lim
√
n
p=1
(8.14)
lim
√
n
n=1
(8.15)
n→∞
n→∞
α
α ∈ Q, a > 1
⇒
p∈R
⇒
n
=0
an 
1

lim pn = 0
n→∞


nie istn. w R
(8.16)
lim
n→∞
p=1
p ∈ (−1, 1)
p ¬ −1 lub p > 1.
(8.17)
Dowód:
√
Dla pokazania własności (8.14) rozważmy najpierw przypadek p 1. Niech xn := n p − 1. Wtedy xn 0 oraz na mocy
nierówności Bernoulliego mamy
1 + nxn ¬ (1 + xn )n = p.
Zatem dla wszystkich n ∈ N mamy
p−1
.
n
Z twierdzenia o trzech ciągach wynika, że ciąg limn→∞ xn = 0. Tak więc własność (8.14) dla p 1 otrzymujemy z twierdzenia
o granicy sumy ciągów. Gdy p ∈ (0, 1) wystarczy zauważyć, że dla q := p1 mamy z twierdzenia o granicy ilorazu ciągów
0 ¬ xn ¬
lim
√
n
n→∞
Aby udowodnić (8.15) oznaczmy xn :=
dwumianu Newtona mamy
√
n
p=
1
1
√ = = 1.
limn→∞ n q
1
n − 1. Wystarczy pokazać, że ciąg o wyrazach xn zmierza do zera. Z rozwinięcia
n = (1 + xn )n 
1
n(n − 1)x2n ,
2
skąd wynika, że dla n 2 mamy
r
0 < xn ¬
2
2
¬√ ,
n−1
n
a zatem limn→∞ xn = 0.
Dla dowodu (8.16) oznaczmy b := a − 1 wybierzmy k ∈ N, takie że k > α + 1. Mamy dla n > 2k
( n )k
n k
n(n − 1) · · · (n − k + 1) k
an = (1 + b)n >
b =
b > 2 bk ,
k
1 · 2···k
k!
zatem
0<
nα
2k k! α−k
2k k! 1
<
n
<
(1 + b)n
bk
bk n
i tezę znów dostajemy z twierdzenia o trzech ciągach.
Własność (8.17) jest prostym wnioskiem z (8.16) dla p ∈ (0, 1). Dla p ∈ {0, 1} własność jest oczywista. Dla p ∈ (−1, 0)
wynika z nierówności
−|p|n ¬ pn ¬ |p|n .
146
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
W pozostałym przypadku ciąg ma wartości dowolnie wielkie dla wykładników parzystych, jest więc nieograniczony, a więc
nie może być zbieżny.
Aby policzyć granicę ciągu a : N → R w programie Mathematica należy użyć instrukcji
Limit[a[n], n -> Infinity, Assumptions -> Element[n, Integers]]
Na przykład pisząc
Limit[Sqrt[(1 + n)/(1 + 3 n)], n -> Infinity, Assumptions -> Element[n, Integers]]
otrzymujemy
√1 .
3
Często ten sam wynik otrzymamy używając krótszej instrukcji
Limit[a[n], n -> Infinity]
która służy do liczenia granicy funkcji. Granica funkcji jest szerszym pojęciem, ale w przypadku argumentu zmierzającego
do nieskończoności często daje ten sam wynik. Jednak nie jest to dokładnie to samo, bo na przykład w przypadku ciągu
lim cos 2πn = 1,
n→∞
gdyż jest to ciąg stale równy jeden, ale granica funkcji
lim cos 2πx
x→∞
nie istnieje. Mathematica dla instrukcji
Limit[Cos[2 Pi n], n -> Infinity, Assumptions -> Element[n, Integers]]
zwraca liczbę 1, natomiast instrukcja
Limit[Cos[2 Pi n], n -> Infinity]
zwraca
Interval[{-1, 1}]
co oznacza, że granica nie istnieje, a zbiór punktów granicznych, czyli granic wszystkich możliwych podciągów, to przedział
[−1, 1]. Pojęciem zbioru punktów granicznych zajmiemy się w rozdziale 10.
8.9.2
Procent składany
Matematyk szwajcarski, Jakob Bernoulli (rys. 8.9) rozważał problem procentu składanego, który przedstawić można skrótowo nast˛epujaco.
˛ Wpłacamy do banku
1zł oprocentowane na 100%. Po roku odbieramy 1 + 1 = 2 zł. Jeśli bank jest gotowy wypłacać proporcjonalne oprocentowanie za dowolnie krótki okres, to po
pół roku wypłacimy 1 + 12 = 1.5 zł. Wpłacajac
˛ t˛e kwot˛e na kolejne pół roku odbierzemy (1 + 12 )(1 + 12 ) = 2.25 zł. Zadajac
˛ sobie trud wpłat i wypłat n-krotnie
w ciagu
˛ roku na koniec roku wypłacimy kwot˛e
1
1+
n
n
zł.
Powstaje pytanie: czy możemy zyskać w ten sposób dowolnie wiele, jeśli n b˛edzie odpowiednio duże? Programy w j˛ezyku Mathematica oraz w C++ realizujace
˛
stosowny eksperyment numeryczny przedstawiono na listingach 8.8 i 8.9.
8.9. PRZYKŁADY I ZASTOSOWANIA GRANIC CIĄGÓW W R
147
( ∗ O b l i c z a n i e p r z y b l i ż e ń l i c z b y e według i d e i p r o c e n t u s k ł a d a n e g o
( ang . compound i n t e r e s t ) ∗ )
CompoundInterest [ d_ ] := Module [ { n } ,
n = 1;
Do[
Print [ "e[" , n , " ]= " , NumberForm [ ( 1 . + 1 . / n )^ n , 1 6 ] ] ;
n = n + 1,
{d}
];
]
Listing 8.8: Eksperyment numeryczny z procentem składanym w języku Mathematica
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ CompoundInterest . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e p r z y b l i ż e ń l i c z b y e według i d e i p r o c e n t u
∗/
/∗ s k ł a d a n e g o ( ang . compound i n t e r e s t )
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include 
#include <cmath>
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
// Policzymy 1000 wyrazów c i ą g u
i n t nmax=1000;
f o r ( i n t n=1;n<=nmax ; n=n+1){
// Czynnik , k t ó r y t r z e b a przemnożyć n r a z y p r z e z s i e b i e
// Piszemy 1 . 0 / n , a n i e 1/n , bo w a r y t m e t y c e
// c a ł k o w i t o l i c z b o w e j 1/n d a j e z e r o .
double x=1+1.0/n ;
// W C++ brak wbudowanego potęgowania ,
// w i ę c l i c z y m y p o t ę g ę przy pomocy p ę t l i
double prod =1;
f o r ( i n t i =1; i<=n ; i=i +1) prod=prod ∗x ;
c o u t << "
s[" << setw ( 3 ) << n << "] =" << setw ( 1 8 ) << prod ;
c o u t << e n d l ;
}
}
Listing 8.9: Eksperyment numeryczny z procentem składanym w C++
148
8.9.3
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Liczba e
Twierdzenie 8.9.2 Ciąg 1 +
1 n
n
jest rosnący i ograniczony, a więc ma skończoną granicę.
Dowód: Pokażemy najpierw, że ciąg ten jest rosnący. Podstawiając w nierówności Bernoullego (tw. 8.3.3) − n12 za x i
przekształcając uzyskaną nierówność otrzymujemy dla n > 1
n
1
1
1− 2
 1−
n
n
n n
1
1
1
1−
1+
 1− .
n
n
n
n−1
n
Z kolei dzieląc obustronnie przez 1 − n1 , mnożąc przez n−1
i przekształcając dostajemy
1
1−
n
n−1 n
1
1+
n
n
1
1+
n
n
1
1+
n

1


n
n−1
1+
n−1
1
n−1
n−1
do dowodzi, że rozważany ciąg jest rosnący.
Aby pokazać, że jest on ograniczony, najpierw zauważmy, że podstawiając 1 za b oraz
1
1
1
1
+ n−2 + · · · + 1 .
1− n =
2
2 2n−1
2
1
2
za a we wzorze (7.6) otrzymujemy
(8.18)
Zatem podstawiając we wzorze (7.7) 1 za a oraz n1 za b, przekształcając i na koniec wykorzystując (8.18) otrzymujemy
n
1
n 1
n 1
n 1
n 1
1+
= 1+
+
+
+ ··· +
2
3
1 n
2 n
n
3 n
n nn
n(n − 1) 1
n(n − 1)(n − 2) 1
n(n − 1) · · · 1 1
n1
= 1+
+
+
+ ··· +
2
3
1n
1·2 n
1·2·3
n
1 · 2 · · · n nn
1
1
1
2
1(1 − n ) 1(1 − n )(1 − n )
1(1 − n ) · · · (1 − n−1
n )
+
+ ··· +
= 1+1+
1·2
1·2·3
1 · 2···n
1
1
1
< 1+1+
+
+ ··· +
1·2 1·2·3
1 · 2···n
1
1
1
< 1 + 1 + + 2 + · · · + n−1
2
2
2
1
= 1 + 2 1 − n < 1 + 2 = 3.
2
n
Zatem na mocy twierdzenia 8.8.7 ciąg 1 + n1
jest zbieżny.
n
Choć Bernoulli pierwszy zauważył, że ciag
˛ o wyrazach 1 + n1
jest zbieżny, jego granic˛e nazywamy liczba˛ Eulera i oznaczamy litera˛ e, bo to Leonard
Euler (rys. 8.9), inny szwajcarski matematyk, pokazał jak ważna jest ona w matematyce. On pierwszy oznaczał ja˛ litera˛ e i tak pozostało do dziś.
Liczba e w przybliżeniu wynosi
e = 2.71828182845904523536 . . .
8.9. PRZYKŁADY I ZASTOSOWANIA GRANIC CIĄGÓW W R
149
Rysunek 8.9: Jacob Bernoulli (1654 - 1705) i Leonard Euler (1707 - 1783)
n
Co ciekawe, ciag
˛ 1 + n1
nadaje liczbie e ważna˛ interpretacj˛e, jednak zupełnie nie nadaje si˛e do obliczania jej przybliżeń, bo jest bardzo wolno zbieżny. W
rozdziale 12 poznamy nieporównanie szybsza˛ metod˛e wyznaczania liczby e.
W programie Mathematica liczba e jest oznaczana E.
8.9.4
Funkcja wykładnicza
Wpłacajac
˛ kwot˛e 1zł na rachunek z oprocentowaniem nie 100%, tylko x (potraktowane jako liczba, 100%=1) po roku wypłacamy kwot˛e
exp(x) := lim
n→∞
1+
x n
zł.
n
Jest to przykład funkcji ciagłej,
˛
której wzrost (lub spadek) jest proporcjonalny do jej wartości.
Można to zapisać w postaci równania różniczkowego
f 0 (x) = af (x).
Rozwiazaniem
˛
tego równania jest funkcja wykładnicza i jej wielokrotności. Bardzo wiele zjawisk w fizyce (np. rozpad pierwiastków promieniotwórczych, biologii
(np. wzrost populacji przy nieograniczonych zasobach), ekonomii (np. piramidy finansowe) i innych dziedzinach opisywanych jest przy pomocy funkcji wykładniczej.
Można pokazać, że funkcja wykładnicza spełnia wzór
f (x + y) = f (x)f (y),
a stad,
˛ że jest postaci
R 3 x 7→ ax ∈ R+ .
W wyrażeniu tym a ∈ R+ , a ax jest rozszerzeniem wyrażenia an dla n ∈ N na dowolny wykładnik rzeczywisty. W szczególności łatwo stad
˛ wywnioskować,
że dla pq ∈ Q+
p
aq =
√
q
ap ,
150
ROZDZIAŁ 8. LICZBY RZECZYWISTE I LICZBY ZESPOLONE
Rysunek 8.10: Wykres funkcji exp.
a0 = 1,
oraz dla r ∈ Q−
ar =
1
a−r
.
Przyjmujac
˛ powyższe wzory jako definicje, można zdefiniować funkcj˛e wykładnicza˛ dla dowolnego x ∈ R wzorem
ax := sup { ar | r ∈ Q, r < x }
i pokazać, że
exp(x) = ex .
W programie Mathematica funkcja exp jest oznaczana Exp. Natomiast wyrażenie ax wyst˛epujace
˛ w funkcji wykładniczej o podstawie a w programie
Mathematica zapisywane jest w postaci a^x.
Wykres funkcji wykładniczej przedstawiono na rys. 8.10
Od strony obliczeniowej wygodniejszy jest jednak wzór
exp(x) =
który nam posłuży jako podstawa do formalnej definicji funkcji wykładniczej.
∞
X
xn
,
n!
n=0
Rozdział 9
Topologia przestrzeni metrycznych
Jak widzieliśmy w poprzednim rozdziale jest potrzeba rozszerzenia poj˛ecia granicy tak, by przynajmniej obejmowało ono granice ciagów
˛
liczb zespolonych.
W rzeczywistości, jak już mówiliśmy, koncepcja granicy jest kluczowa dla całej analizy. Dlatego spróbujemy zastanowić si˛e co jest rzeczywiście niezb˛edne do
zdefiniowania granicy.
Intencja˛ zwrotu |xn − g| < w definicji Cauchy’ego granicy ciagu
˛ jest stwierdzenie, że xn leży nie dalej niż od g . Widzieliśmy, że również w przypadku
liczb zespolonych możemy mierzyć odległość mi˛edzy u, w ∈ C rozważajac
˛ funkcj˛e, która parze liczb zespolonych przyporzadkowuje
˛
moduł ich różnicy.
C 3 (u, w) 7→ |u − w| ∈ R∗ .
Ma ona własności analogiczne do funkcji, która parze liczb rzeczywistych przyporzadkowuje
˛
wartość bezwzgl˛edna˛ ich różnicy. W tym rozdziale przedstawimy ide˛e
odległości, która uogólnia obie te funkcje. Jak zobaczymy później jest to jednak tylko krok pośredni do uzyskania ogólnego poj˛ecia granicy.
9.1
9.1.1
Przestrzenie metryczne
Przestrzeń metryczna
Definicja 9.1.1 Odległością (metryką) w zbiorze X nazywamy odwzorowanie
ρ : X × X → R∗
spełniające własności
(i)
ρ(x, y) = 0 ⇔ x = y,
(ii)
ρ(x, y) = ρ(y, x),
(iii)
ρ(x, z) ¬ ρ(x, y) + ρ(y, z).
Parę (X, ρ) nazywamy przestrzenią metryczną.
151
152
ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH
Rysunek 9.1: Odległość punktów x, y ∈ R2 w metryce euklidesowej (zielony), Manhattan (niebieski) i maksimum (czerwony).
9.1.2
Przykłady metryk w Rn
Przestrzeń Rn to iloczyn kartezjański n kopii zbioru liczb rzeczywistych R. Element x ∈ Rn ma postać n-tki liczb: x =
(x1 , x2 , . . . , xn ), którą krótko zapisujemy x = (xi )i=1,n . Dla x = (xi )i=1,n , y = (yi )i=1,n ∈ Rn definiujemy
v
u n
uX
de (x, y) := t (xi − yi )2 ,
i=1
dmax (x, y)
:=
d1 (x, y)
:=
max { |xi − yi | | i = 1, 2, . . . n },
n
X
|xi − yi |.
i=1
Jak łatwo zauważyć, pierwsza z tych definicji uogólnia na przypadek Rn metrykę zadaną w R poprzez wartość bezwzględną
oraz metrykę w C zadaną poprzez moduł.
Twierdzenie 9.1.2
(i) (Rn , de ), (Rn , dmax ) i (Rn , d1 ) są przestrzeniami metrycznymi.
(ii) de w R2 = C pokrywa się z modułem, a w R z wartością bezwzględną różnicy argumentów.
Metryka de to metryka euklidesowa, metrykę dmax określa się mianem metryka maksimum, a metrykę d1 mianem metryka
Manhattan. Łatwo sprawdzić, że dla n = 1 wszystkie te trzy metryki są sobie równe, dane wzorem ρ(x, y) = |x − y| dla
x, y ∈ R.
Przykład liczenia odległości w R2 w różnych metrykach przedstawiono na rys. 9.1.
9.1.3
Metryka indukowana i podprzestrzenie przestrzeni metrycznej
Twierdzenie 9.1.3 Niech (X, ρ) będzie przestrzenią metryczną, a Y ⊂ X podzbiorem. Wtedy ρY := ρ|Y ×Y jest
metryką w Y .
Dowód: ćwiczenie.
9.1. PRZESTRZENIE METRYCZNE
153
Rysunek 9.2: Kule w R2 w metryce euklidesowej (zielony), Manhattan (niebieski) i maksimum (czerwony). Odpowiednie
sfery zaznaczono ciemniejszym kolorem.
Definicja 9.1.4 Metrykę ρY nazywamy metryką indukowaną z X w Y , a przestrzeń metryczną (Y, ρY ) nazywamy
podprzestrzenią przestrzeni (X, ρ).
Zatem każdy podzbiór przestrzeni metrycznej jest przestrzenią metryczną. Pokazuje to, że przestrzenie metryczne mogą
być bardzo różnorodne.
9.1.4
Kule
Definicja 9.1.5 Niech (X, ρ) będzie przestrzenią metryczną, x punktem w X, a r liczbą rzeczywistą dodatnią. Przez
kulę otwartą w X o środku w x i promieniu r rozumiemy zbiór
K(x, r) := { y ∈ X | ρ(y, x) < r }.
Podobnie definiujemy kulę domkniętą jako zbiór
K̄(x, r) := { y ∈ X | ρ(y, x) ¬ r },
a sferę jako zbiór
S(x, r) := { y ∈ X | ρ(y, x) = r }.
Dla ustalonej przestrzeni metrycznej (X, ρ) oraz x ∈ X będziemy używać oznaczenia
Ball(x) := Ball(x, X) := Ball(x, X, ρ) := { K(x, r) | r ∈ R+ }.
na rodzinę kul otwartych o środku w x.
Przykład kul domkniętych i sfer w R2 w różnych metrykach przedstawiono na rys. 9.2.
Różnica mi˛edzy kula˛ domkni˛eta,˛ a otwarta˛ jest analogiczna do różnicy mi˛edzy przedziałem domkni˛etym, a przedziałem otwartym. Na rysunku można ja˛
przedstawić tylko umownie, na przykład zaznaczajac
˛ sfer˛e ograniczajac
˛ a˛ kul˛e otwarta˛ linia˛ cienka,˛ a sfer˛e ograniczajac
˛ a˛ kul˛e domkni˛eta˛ linia˛ gruba˛ (rys.9.3).
Posługujac
˛ si˛e metryka,˛ można poj˛ecie granicy ciagu
˛ w przestrzeni metrycznej sformułować tak
154
ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH
Rysunek 9.3: Umowne przedstawienie różnicy między kulą domknięta, sferą i kulą otwartą.
lim xn = g
n→∞
:⇔
∀ > 0 ∃N ∈ N ∀n ∈ N n N ⇒ ρ(xn , g) < ,
a posługujac
˛ si˛e poj˛eciem kuli tak
lim xn = g
n→∞
:⇔
∀K ∈ Ball(g) ∃N ∈ N ∀n ∈ N n N ⇒ xn ∈ K.
Docelowo chcielibyśmy je przeformułować tak
lim xn = g
n→∞
:⇔
∀V ∈ Nb(g) ∃U ∈ Nb(∞) ∀n ∈ N n ∈ U ⇒ xn ∈ V,
gdzie Nb(g) to pewna rodzina zbiorów "zadajaca
˛ coraz wi˛eksze wymagania bliskości" do g , a Nb(∞) to pewna rodzina zbiorów "zadajaca
˛ coraz wi˛eksze
wymagania bliskości" do ∞. W naszym przypadku ta pierwsza rodzina to rodzina kul o środku w g , a ta druga to rodzina przedziałów [N, ∞). Tego typu rodziny
to tzw. bazy otoczeń. Sformalizujemy to poj˛ecie pod koniec tego rozdziału.
9.1.5
Zbiory ograniczone
W dalszym ciągu przyjmujemy, że X jest przestrzenią metryczną z metryką ρ.
Definicja 9.1.6 Podzbiór A ⊂ X nazywamy ograniczonym jeśli istnieje kula K(x, r) o środku w x i promieniu r taka,
że A ⊂ K(x, r).
Twierdzenie 9.1.7 Suma skończonej ilości zbiorów ograniczonych jest zbiorem ograniczonym.
9.2
9.2.1
Średnica zbiorów
Średnica zbioru
9.3. ZBIORY OTWARTE I DOMKNIĘTE, WNĘTRZE, DOMKNIĘCIE I BRZEG ZBIORU
155
Rysunek 9.4: Poszukiwanie punktów brzegowych (na górze po lewej) zbioru A, brzeg zbioru A (na górze po prawej), domknięcie zbioru A jako przykład zbioru domkniętego (na dole po lewej) i otwarcie zbioru A jako przykład zbioru otwartego
(na dole po prawej).
Definicja 9.2.1 Średnicę zbioru A ⊂ X definiujemy jako
ρ(A) := sup { ρ(x, y) | x, y ∈ A }
gdy A jest zbiorem niepustym, a jako zero w przeciwnym razie.
Zauważmy, że dla metryki euklidesowej de w R oraz x, y ∈ R takich, że x ¬ y średnica przedziału otwartego (x, y) oraz
domkniętego [x, y] wynosi y − x.
Uwaga 9.2.2 Średnica zbioru ma następujące własności.
(i) Zbiór A jest ograniczony wtedy i tylko wtedy, gdy jego średnica jest skończona.
(ii) Średnica zbioru A wynosi zero wtedy i tylko wtedy, gdy zbiór A ma nie więcej niż jeden element.
(iii) Jeśli A ⊂ B, to ρ(A) ¬ ρ(B).
(iv) Jeśli A : N → P(X) jest ciągiem zbiorów takich, że ρ(An ) <
9.3
1
n,
to ρ(
T∞
n=1
An ) = 0.
Zbiory otwarte i domknięte, wnętrze, domknięcie i brzeg zbioru
Poj˛ecia zbioru otwartego i domkni˛etego uogólniaja˛ poj˛ecia kuli otwartej i domkni˛etej. Intuicyjnie zbiór otwarty to taki, który jest rozłaczny
˛
ze swoim brzegiem, a
zbiór domkni˛ety to taki, który zawiera swój brzeg. Punkt x jest punktem brzegowym zbioru A jeżeli każda kula K ∈ Ball(x) zawiera tak punkty należace
˛ do A
jak i nie należace
˛ do A. Ide˛e t˛e przedstawiono na rys. 9.4.
Definicja 9.3.1 Niech A ⊂ X. Brzegiem zbioru A w X nazywamy zbiór
bd A := { x ∈ X | ∀K ∈ Ball(x) K ∩ A 6= ∅ i K \ A 6= ∅ }.
Mówimy, że A jest otwarty, jeżeli A ∩ bd A = ∅. Mówimy, że A jest domknięty, jeżeli bd A ⊂ A.
156
ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH
Twierdzenie 9.3.2 A jest otwarty wtedy i tylko wtedy gdy
∀x ∈ A ∃K ∈ Ball(x)
K ⊂ A.
A jest domknięty wtedy i tylko wtedy gdy
∀x 6∈ A ∃K ∈ Ball(x)
9.3.1
K ∩ A = ∅.
Wnętrze i domknięcie
Definicja 9.3.3 Niech A ⊂ X. Wnętrzem zbioru A nazywamy zbiór
int A := A \ bd A
Domknięciem zbioru A nazywamy zbiór
cl A := A ∪ bd A
Twierdzenie 9.3.4 Niech A ⊂ X. Wtedy
int A = { x ∈ X | ∃K ∈ Ball(x) K ⊂ A. }
oraz
cl A = { x ∈ X | ∀K ∈ Ball(x) K ∩ A 6= ∅. }
Niech X ∈ Metr, x ∈ X, r > 0.
Twierdzenie 9.3.5 Kula otwarta K(x, r) jest zbiorem otwartym, a kula domknięta K̄(x, r) jest zbiorem domkniętym.
Rodzinę zbiorów otwartych w przestrzeni metrycznej (X, ρ) oznaczać będziemy Open(X, ρ), a zbiorów domkniętych
Clos(X, ρ). W notacji tej będziemy pomijać metrykę i pisać Open(X), Clos(X) gdy metryka będzie znana z kontekstu.
9.3.2
Własności wnętrza i domknięcia
Uwaga 9.3.6 Niech A ⊂ X. Wtedy
(i) int A ⊂ A ⊂ cl A,
(ii) A jest otwarty wtedy i tylko wtedy gdy A = int A,
(iii) A jest domknięty wtedy i tylko wtedy gdy A = cl A,
(iv) \ int A = cl(\A),
\ cl A = int(\A),
(v) bd A = cl A ∩ cl(\A) jest zbiorem domkniętym.
9.4. OTOCZENIA, PUNKTY SKUPIENIA
157
Twierdzenie 9.3.7 Operacje wnętrza i domknięcia są monotoniczne względem relacji inkluzji, tzn. jeśli A ⊂ B ⊂ X,
to int A ⊂ int B oraz cl A ⊂ cl B.
Twierdzenie 9.3.8 Niech A ⊂ X. Wnętrze A jest zbiorem otwartym. Jest to największy zbiór otwarty zawarty w A.
Podobnie domknięcie A jest zbiorem domkniętym i jest to najmniejszy zbiór domknięty zawierający A.
Wniosek 9.3.9 Dla każdego A ⊂ X mamy
int(int A) = int A,
cl(cl A) = cl A.
Twierdzenie 9.3.10 Dla dowolnych A, B ⊂ X mamy
9.4
9.4.1
int(A ∩ B)
=
int A ∩ int B,
int(A ∪ B)
⊃ int A ∪ int B,
cl(A ∩ B)
⊂ cl A ∩ cl B,
cl(A ∪ B)
=
cl A ∪ cl B.
Otoczenia, punkty skupienia
Rodzina otoczeń punktu
Definicja 9.4.1 Mówimy, że zbiór A jest otoczeniem punktu x ∈ X jeżeli x ∈ int A. Mówimy, że A jest otoczeniem
otwartym punktu x jeżeli A jest otwarty i x ∈ A. Zbiór otoczeń punktu x oznaczamy Nb(x), a zbiór otoczeń otwartych
punktu x oznaczamy ONb(x).
9.4.2
Punkty skupienia zbioru
Definicja 9.4.2 Punkt x ∈ X nazywamy punktem skupienia zbioru A ⊂ X, jeżeli
∀V ∈ Nb(x) ∃y ∈ X
y 6= x i y ∈ V ∩ A.
Zbiór punktów skupienia zbioru A oznaczamy A0 .
Definicja 9.4.3 Mówimy, że x ∈ X jest punktem izolowanym zbioru A ⊂ X, jeżeli x ∈ A i x nie jest punktem
skupienia zbioru A.
Dla zbioru
n
A := { n1 | n ∈ N1 } ∪ { n+1
| n ∈ N1 }
jedynymi punktami skupienia są 0 i 1, z czego tylko 1 jest elementem A. Wszystkie pozostałe punkty zbioru A to jego punkty
izolowane.
158
9.5
9.5.1
ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH
Metryki równoważne, iloczyn kartezjański przestrzeni metrycznych
Równoważność metryk.
Definicja 9.5.1 Niech ρ1 i ρ2 będą metrykami w zbiorze X. Mówimy, że ρ1 i ρ2 są równoważne wtedy i tylko wtedy,
gdy zachodzą następujące dwa warunki
Open(X, ρ1 ) = Open(X, ρ2 ).
Twierdzenie 9.5.2 Metryki ρ1 , ρ2 na X są rówoważne wtedy i tylko wtedy gdy
∀x ∈ X ∀K1 ∈ Ball(x, X, ρ1 ) ∃K2 ∈ Ball(x, X, ρ2 )
K2
⊂
K1 ,
∀x ∈ X ∀K2 ∈ Ball(x, X, ρ2 ) ∃K1 ∈ Ball(x, X, ρ1 )
K1
⊂
K2 .
Twierdzenie 9.5.3 Metryki euklidesowa, maksimum i Manhattan w Rd są wzajemnie równoważne.
9.5.2
Iloczyn kartezjański przestrzeni metrycznych
Twierdzenie 9.5.4 Niech (Xi , ρi ) dla i = 1, 2, . . . d będą przestrzeniami metrycznymi. Dla x := (x1 , x2 , . . . , xd ) ∈
X1 × X2 × · · · × Xd i y := (y1 , y2 , . . . , yd ) ∈ X1 × X2 × · · · × Xd połóżmy
v
u n
uX
ρi (xi , yi )2 ,
ρe (x, y) := t
i=1
ρmax (x, y)
ρ1 (x, y)
max { ρi (xi , yi ) | i = 1, 2, . . . n },
n
X
:=
ρi (xi , yi ).
:=
i=1
Wtedy ρe , ρmax i ρ1 (x, y) są wzajemnie równoważnymi metrykami w X1 × X2 × · · · × Xd .
9.6
9.6.1
(*)Topologia przestrzeni metrycznej
Fundamentalne własności zbiorów otwartych i domkniętych
Twierdzenie 9.6.1 Niech (X, ρ) będzie przestrzenią metryczną. Wtedy
∅, X ∈ Open(X),
U1 , U2 ∈ Open(X) ⇒ U1 ∩ U2 ∈ Open(X),
[
{Uι }ι∈I ⊂ Open(X) ⇒
Uι ∈ Open(X).
ι∈I
9.7. (**)BAZY OTOCZEŃ
159
Twierdzenie 9.6.2 Niech (X, ρ) będzie przestrzenią metryczną. Wtedy
∅, X ∈ Clos(X),
U1 , U2 ∈ Clos(X) ⇒ U1 ∪ U2 ∈ Clos(X),
\
{Uι }ι∈I ⊂ Clos(X) ⇒
Uι ∈ Clos(X).
ι∈I
Definicja 9.6.3 Rodzinę zbiorów otwartych przestrzeni metrycznej nazywamy topologią tej przestrzeni.
Widzimy, że różne metryki moga˛ prowadzić do tej samej rodziny zbiorów otwartych, czyli topologii. I właśnie topologia jest tym co nas w tym wykładzie
interesuje bardziej niż metryka. Topologi˛e można studiować bez metryki. Wtedy przyjmuje si˛e jako aksjomaty własności rodziny zbiorów otwartych zawarte w tezie
twierdzenia 9.6.1. Przestrzeń z zadana˛ rodzina˛ takich zbiorów nazywa si˛e przestrzenia˛ topologiczna.˛ Okazuje si˛e, że istnieja˛ przestrzenie topologiczne, których
topologii nie da si˛e zadać przy pomocy metryki. Dziedzin˛e matematyki, która zajmuje si˛e badaniem przestrzeni topologicznych też określa si˛e mianem topologia.
9.7
(**)Bazy otoczeń
9.7.1
Baza otoczeń punktu
Niech (X, ρ) będzie ustaloną przestrzenią metryczną.
Definicja 9.7.1 Mówimy, że rodzina B ⊂ X jest bazą otoczeń punktu x ∈ X jeżeli zachodzą następujące dwa warunki
(i) ∀B ∈ B
x ∈ B,
(ii) ∀U ∈ Open(X) x ∈ U ⇒ ∃B ∈ B B ⊂ U .
Rodzinę rodzin zbiorów {B x }x∈X nazywamy bazą otoczeń w X jeżeli dla każdego x ∈ X rodzina B x jest bazą otoczeń
punktu x.
Dla x ∈ X zdefiniujmy
ONb(x)
Nb(x)
Ball0 (x)
:= { V ∈ Open(X) | x ∈ V },
:= { A ⊂ X | ∃V ∈ Open(X) x ∈ V ⊂ A },
:= { K(x, n1 ) | n ∈ N }.
Dla każdego x ∈ X mamy
Ball0 (x) ⊂ Ball(x) ⊂ ONb(x) ⊂ Nb(x).
Twierdzenie 9.7.2 Rodziny rodzin zbiorów {Ball0 (x)}x∈X , {Ball(x)}x∈X , {ONb(x)}x∈X , {Nb(x)}x∈X są bazami otoczeń w X.
Bazy otoczeń są przydatne, bo wiele warunków wystarczy sprawdzać jedynie na bazach. W szczególności mamy następujące
twierdzenie.
160
ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH
Rysunek 9.5: Rozdzielenie punktów kulami w przestrzeni metrycznej.
Twierdzenie 9.7.3 Niech {B x }x∈X będzie bazą otoczeń w X. Wtedy
(i) Zbiór A jest otwarty w X wtedy i tylko wtedy gdy dla każdego x ∈ A istnieje B ∈ B x takie, że B ⊂ A.
(ii) Zbiór A jest domknięty w X wtedy i tylko wtedy gdy dla każdego x 6∈ A istnieje B ∈ B x takie, że B ∩ A = ∅.
9.7.2
Własność Hausdorffa
Twierdzenie 9.7.4 Niech {B x }x∈X będzie bazą otoczeń w X. Jeśli x1 , x2 ∈ X i x1 6= x2 , to istnieją B1 ∈ B x1 oraz
B2 ∈ B x2 takie, że B1 ∩ B2 = ∅.
9.7.3
Metryka w R̄
Twierdzenie 9.7.5 Istnieje silnie rosnąca bijekcja f : R̄ → [−1, 1]. W szczególności jest taką funkcja zadana wzorem


x = −∞,
−1
x
x ∈ R,
f (x) := 1+|x|


1
x = ∞.
Jeśli f : R̄ → [−1, 1] jest silnie rosnącą bijekcją, to funkcja ρf : R̄ × R̄ → R∗ dana wzorem
ρf (x, y) := |f (x) − f (y)|
jest metryką w R̄. Co więcej, jeśli f1 , f2 : R̄ → [−1, 1] są dwoma silnie rosnącymi bijekcjami, to metryki ρf1 i ρf2 są
równoważne.
W dalszym ciągu zbiór R̄ traktować będziemy jako przestrzeń metryczną z metryką ρf .
Twierdzenie 9.7.6 Metryka indukowana z R̄ w R jest równoważna metryce euklidesowej w R.
Zbiór N̄ := N ∪ {∞} jest podzbiorem R̄, jest więc przestrzenią metryczną z metryką indukowaną z R̄. Łatwo sprawdzić,
że w przestrzeni tej wszystkie punkty są izolowane, z wyjątkiem punktu ∞, który jest punktem skupienia zbioru N ⊂ N̄.
Ponieważ kule w metryce ρf nie mają prostego opisu, wygodnie jest posługiwać się następującym twierdzeniem.
9.8. (**)PRZELICZALNE BAZY OTOCZEŃ PUNKTU
161
Twierdzenie 9.7.7 Dla x ∈ R̄ połóżmy


{ [−∞, −n) | n ∈ N }
B x := { (x − n1 , x + n1 ) | n ∈ N }


{ (n, ∞] | n ∈ N }
Wtedy {B x }
x∈R̄
9.8
x = −∞,
x ∈ R,
x = ∞.
stanowi bazę otoczeń w R̄.
(**)Przeliczalne bazy otoczeń punktu
Rodzina Ball0 (x) jest przeliczalna. Pozwala to w szczególności udowodnić następujące dwa twierdzenia.
Twierdzenie 9.8.1 Zbiór A ⊂ X jest domknięty wtedy i tylko wtedy gdy dla każdego ciągu x : N → A jeśli x jest
zbieżny do x0 ∈ X to x0 ∈ A.
Twierdzenie 9.8.2 Punkt x0 ∈ X jest punktem skupienia zbioru A ⊂ X wtedy i tylko wtedy gdy istnieje ciąg a : N →
A \ {x0 } zbieżny do x0 .
9.9
9.9.1
(*)Zupełność
Warunek Cauchy’ego
Definicja 9.9.1 Niech (X, ρ) będzie przestrzenią metryczną. Mówimy, że ciąg X : N → X spełnia warunek Cauchy’ego
jeżeli
∀ > 0∃N ∈ N∀n, m N ρ(xn , xm ) < .
Twierdzenie 9.9.2 Każdy ciąg zbieżny jest ciągiem Cauchy’ego.
Dowód:
Twierdzenie 9.9.3 (*)Jeśli ciąg Cauchy’ego posiada podciąg zbieżny to jest zbieżny.
Dowód:
162
ROZDZIAŁ 9. TOPOLOGIA PRZESTRZENI METRYCZNYCH
Twierdzenie 9.9.4 (*)Każdy ciąg Cauchy’ego jest ograniczony
Dowód:
Wniosek 9.9.5 Każdy ciąg Cauchy’ego w Rd jest zbieżny.
Dowód:
(*)
9.9.2
Przestrzenie zupełne
Definicja 9.9.6 Przestrzeń metryczną nazywamy zupełną, jeżeli każdy ciąg Cauchy’ego w tej przestrzeni jest zbieżny.
Wniosek 9.9.7 Rd jest przestrzenią zupełną.
Rozdział 10
Granica funkcji
10.1
Granica funkcji w przestrzeniach metrycznych
10.1.1
Eksperymenty numeryczne
Przy obliczeniach numerycznych granicy limx→x0 f (x) nie możemy rozważyć wszystkich wartości argumentu x, wi˛ec w praktyce wybieramy ciag
˛ xn zmierzajacy
˛ do x0 i obserwujemy zachowanie f (xn ). Program w j˛ezyku Mathematica obliczajacy
˛ przybliżenie granicy funkcji poprzez obliczanie wartości funkcji w ciagu
˛
punktów przedstawiono na listingu 10.1. Analogiczny przykład w C++ w odniesieniu do granicy limx→0 sinx x i ciagu
˛ xn := n1 przedstawiono w programie z
listingu 10.2.
Ćwiczenie komputerowe 10.1.1
wartosciach p.
• Sprawdź działanie programu z listingu 10.1 dla funkcji x 7→
sin x
x
i dla ciagu
˛ xn :=
1
np
przy różnych
˛
• Sprawdź działanie programu z listingu 10.1 dla funkcji x 7→ sin x1 i dla różnych ciagów.
• W programie z listingu 10.2 zmień ciag
˛ xn na xn :=
1
np
dla różnych wartości p i zaobserwuj zachowanie si˛e programu.
• Zmodyfikuj program z listingu 10.2 zast˛epujac
˛ funkcj˛e x 7→
sin x
x
funkcja˛ x 7→ sin
1
x
i zaobserwuj zachowanie si˛e programu dla różnych ciagów.
˛
Eksperymenty numeryczne pokazuja,˛ że definicj˛e granicy funkcji lepiej byłoby postawić uniezależniajac
˛ si˛e od ciagów,
˛
bo zachowanie funkcji może być różne,
przy podstawieniu w miejsce argumentów różnych ciagów.
˛
Taka˛ definicj˛e rozważaliśmy już w rozdziale wst˛epnym.
10.1.2
Definicja granicy funkcji w przestrzeniach metrycznych
Niech X, Y będą przestrzeniami metrycznymi odpowiednio z metrykami ρX i ρY . Niech A będzie podzbiorem X. Rozważmy
punkt skupienia x0 zbioru A, punkt y0 ∈ Y oraz funkcję f : A → Y .
Twierdzenie 10.1.2 Następujące warunki są równoważne:
∀ > 0 ∃δ > 0 ∀x ∈ A \ {x0 }
ρX (x, x0 ) < δ ⇒ ρY (f (x), y0 ) < ,
∀V ∈ Nb(y0 ) ∃U ∈ Nb(x0 ) ∀x ∈ U ∩ A \ {x0 }
f (x) ∈ V.
(10.1)
(10.2)
Dowód: Załóżmy, że warunek (10.1) zachodzi. Niech V będzie otoczeniem punktu y0 . Z definicji otoczenia znajdziemy
kulę K(y0 , r) w Y zawartą w V . Ponieważ r > 0, na mocy założenia (10.1) znajdziemy δ > 0 takie, że dla wszystkich
x ∈ A \ {x0 }
ρX (x, x0 ) < δ ⇒ ρY (f (x), y0 ) < r.
163
164
ROZDZIAŁ 10. GRANICA FUNKCJI
(∗ P r z y b l i ż a n i e granicy f u n k c j i f granicą ciągu n wartości f u n k c j i
w punktach c i ą g u x ∗ )
F u n c t i o n L i m i t [ f_ , x_ , n_ ] :=
Module [ { k } ,
k = 1;
Do[
Print [ f [ x [ k ] ] ] ;
k = k + 1,
{n}
];
]
( ∗ Funkcja , k t ó r e j g r a n i c ę w z e r z e l i c z y m y ∗ )
g [ x_ ] := Sin [ x ] / x ;
( ∗ Ciąg o wyrazach z m i e r z a j ą c y c h do z e r a ∗ )
x [ n_ ] := 1 . / n
( ∗ Test p r z y b l i ż a n i a w a r t o ś c i f u n k c j i ∗ )
FunctionLimit [ g , x , 100]
Listing 10.1: Przybliżanie granicy funkcji w języku Mathematica
Zatem dla x ∈ A \ {x0 } mamy
x ∈ K(x0 , δ) ⇒ y ∈ K(y0 , r) ⊂ V.
Ponieważ K(x0 , δ) jest otoczeniem x0 , więc dobraliśmy do V otoczenie U , którego istnienie jest postulowane w (10.2).
Dowodzi to, że warunek (10.1) implikuje warunek (10.2). Dowód implikacji przeciwnej jest podobny. Zostawiamy go jako
ćwiczenie.
Twierdzenie 10.1.2 pozwala postawić następującą ogólną definicję granicy w przestrzeniach metrycznych.
Definicja 10.1.3 Mówimy, że y0 ∈ Y jest granicą funkcji f w punkcie x0 i piszemy
lim f (x) = y0
x→x0
jeżeli zachodzi którykolwiek z równoważnych warunków (10.1) i (10.2).
10.1.3
Jednoznaczność granicy
Twierdzenie 10.1.4 (o jednoznaczności granicy) Niech X, Y będą przestrzeniami metrycznymi, A ⊂ X, f : X → Y
funkcją, a x0 punktem skupienia A w X. Jeśli dla pewnych y1 , y2 ∈ Y mamy
lim f (x) = y1 i lim f (x) = y2
x→x0
to y1 = y2 .
x→x0
10.1. GRANICA FUNKCJI W PRZESTRZENIACH METRYCZNYCH
165
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ F u n c t i o n L i m i t . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ P r z y b l i ż a n i e g r a n i c y f u n k c j i g r a n i c ą c i ą g u w a r t o ś c i
∗/
/∗ f u n k c j i
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include 
#include <cmath>
#include <iomanip>
using namespace s t d ;
/∗ Funkcja , k t ó r e j g r a n i c ę w z e r z e l i c z y m y ∗/
double f ( double x ) {
return s i n ( x ) / x ;
}
/∗ Ciąg o wyrazach z m i e r z a j ą c y c h do z e r a ∗/
double x ( i n t n ) {
return 1 . 0 / n ;
}
/∗ W p r o g r a m i e głównym wypisujemy c i ą g w a r t o ś c i f u n k c j i
w zadanym c i ą g u punktów ∗/
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
f o r ( i n t n=1;n<=20;n=n+1){
c o u t << "x[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << x ( n ) ;
c o u t << "
f(x[" << setw ( 2 ) << n << " ]) =" ;
c o u t << setw ( 1 8 ) << f ( x ( n ) ) << e n d l ;
}
}
Listing 10.2: Przybliżanie granicy funkcji w C++
166
ROZDZIAŁ 10. GRANICA FUNKCJI
Dowód: Dla dowodu nie wprost załóżmy, że y1 6= y2 . Wtedy r := ρ(y1 , y2 ) > 0. Z warunku (10.1) zastosowanego dla y1
i y2 do := 2r znajdziemy odpowiednio δ1 i δ2 takie, że dla x ∈ A \ {x0 }
ρ(x, x0 ) < δ1
⇒
ρ(f (x), y1 ) < (10.3)
ρ(x, x0 ) < δ2
⇒
ρ(f (x), y2 ) < .
(10.4)
Niech δ := min(δ1 , δ2 ). Ponieważ x0 jest punktem skupienia zbioru A w X, a K(x0 , δ) jest otoczeniem x0 w X, więc
znajdziemy punkt x∗ ∈ K(x0 , δ) ∩ A. Ponieważ w szczególności ρ(x∗ , x0 ) < δ1 i ρ(x∗ , x0 ) < δ2 , więc na mocy (10.3) i (10.4)
mamy ρ(f (x∗ ), y1 ) < i ρ(f (x∗ ), y2 ) < . Zatem z nierówności trójkąta
ρ(y1 , y2 ) ¬ ρ(y1 , f (x∗ )) + ρ(f (x∗ ), y2 ) < + = ρ(y1 , y2 ).
Otrzymana sprzeczność dowodzi tezy.
10.1.4
Granica złożenia funkcji
Twierdzenie 10.1.5 (O granicy złożenia funkcji) Niech X, Y, Z będą przestrzeniami metrycznymi, x0 ∈ X 0 , y0 ∈ Y 0 ,
z0 ∈ Z. Jeśli f : X → Y i g : Y → Z są takie, że y0 6∈ im f oraz limx→x0 f (x) = y0 i limy→y0 g(y) = z0 to
limx→x0 (g ◦ f )(x) = z0 .
Dowód:
W programie Mathematica granicę limx→u f (x) dla funkcji f : R̄−→
◦ R̄ i u ∈ R̄ liczymy przy pomocy instrukcji
Limit[f[x], x -> u]
Na przykład
Limit[1/(1 + x), x -> Infinity]
zwraca 0.
10.2
(**)Przypadki szczególne definicji granicy
Przypomnijmy, że ciag
˛ x : N → R ma granic˛e x∗ wtedy i tylko wtedy gdy
∀ > 0 ∃N ∈ N n > N ⇒ |xn − x∗ | < .
Natomiast funkcja f : R → R ma granic˛e f∗ przy x zmierzajacym
˛
do x∗ wtedy i tylko wtedy gdy
∀ > 0 ∃δ > 0 |x − x∗ | < δ, x 6= x∗ ⇒ |f (x) − f∗ | < .
Funkcja f może też mieć granic˛e nieskończona.˛ Mówimy, że funkcja f : R → R ma granic˛e ∞ przy x zmierzajacym
˛
do x∗ wtedy i tylko wtedy gdy
∀A > 0 ∃δ > 0 |x − x∗ | < δ, x 6= x∗ ⇒ f (x) > A.
10.2. (**)PRZYPADKI SZCZEGÓLNE DEFINICJI GRANICY
167
Powstaje naturalne pytanie, czy te trzy formalnie różne definicje nie daja˛ si˛e uogólnić do jednej definicji uniwersalnej. Podpowiedź jak to zrobić zawarta jest w
nast˛epujacym
˛
przeformułowaniu powyższych definicji.
lim xn = x∗
:⇔
∀ > 0 ∃N ∈ N ∀n ∈ (N, ∞] \ {∞} xn ∈ (x∗ − , x∗ + ),
lim f (x) = f∗
:⇔
∀ > 0 ∃δ > 0 ∀x ∈ (x − δ, x + δ) \ {x∗ } f (x) ∈ (f∗ − , f∗ + ),
lim f (x) = ∞
:⇔
∀A > 0 ∃δ > 0 ∀x ∈ (x − δ, x + δ) \ {x∗ } f (x) ∈ (A, ∞].
n→∞
x→x∗
x→x∗
Widać, że w każdym przypadku pojawiaja˛ si˛e otoczenia: albo postaci (x − r, x + r) dla x ∈ R, albo postaci (r, ∞] w przypadku punktu w nieskończoności.
Tak wi˛ec zast˛epujac
˛ te konkretne otoczenia w R̄ ogólnymi otoczeniami w przestrzeni metrycznej dostajemy dość ogólna˛ definicj˛e granicy.
10.2.1
Kryterium na granicę w bazach
Niech B 1 będzie bazą otoczeń x0 , a B 2 bazą otoczeń y0 .
Twierdzenie 10.2.1 Warunek
lim f (x) = y0
x→x0
jest równoważny warunkowi
∀V ∈ B 2 ∃U ∈ B 1 ∀x ∈ U ∩ A \ {x0 }
10.2.2
f (x) ∈ V.
Granica ciągu
Zobaczmy jak z naszego ogólnego kryterium na granicę w bazach można odzyskać naszą definicję granicy ciągu liczb. Jako
przestrzeń X bierzemy N̄. Jako przestrzeń Y bierzemy R. Jako metrykę w R bierzemy metrykę euklidesową. Jako zbiór A,
na którym jest określona funkcja f : A → Y bierzemy N. Funkcja określona na N to przecież ciąg, więc w miejsce f pisać
będziemy bardziej tradycyjnie a, a jako argumentu zamiast x używać będziemy n. Jako punkt x0 , w którym liczymy granicę
bierzemy ∞. Punkt ∞ jest rzeczywiście punktem skupienia zbioru A = N w przestrzeni X = N̄. Jako bazę otoczeń dla
x0 = ∞ bierzemy
B 1 := {B(N ) := (N, ∞] | N ∈ N}.
Jako bazę otoczeń dla y0 bierzemy B 2 := Ball(y0 ). Podstawiając to wszystko do naszej ogólnej definicji dostajemy
lim an = y0
n→∞
:⇔
∀K = K(y0 , ) ∈ Ball(y0 ) ∃B = B(N ) ∈ B 1 ∀n ∈ B ∩ A \ {∞}
⇔
∀ > 0 ∃N ∈ N ∀n > N
an ∈ K
|an − y0 | < ,
a więc dokładnie taki warunek jaki postawiliśmy jako definicję granicy ciągu.
10.2.3
Granica funkcji w przestrzeni metrycznej
Definicję Cauchy’ego granicy funkcji R w R odzyskujemy biorąc A = X = Y = R, jako metrykę biorąc metrykę euklidesową
w R, a jako bazy otoczeń B 1 i B 2 rodziny kul w x0 i y0 . Dostajemy
lim f (x) = y0
x→x0
:⇔
∀K = K(y0 , ) ∈ Ball(y0 ) ∃B = K(x0 , δ) ∈ Ball(x0 ) ∀x ∈ B ∩ A \ {x0 }
⇔
∀ > 0 ∃δ > 0 ∀x 6= x0
|x − x0 | < δ ⇒ |f (x) − y0 | < ,
f (x) ∈ K
168
ROZDZIAŁ 10. GRANICA FUNKCJI
10.2.4
Granica nieskończona w R̄
Przypadek nieskończonej wartości granicy funkcji uzyskujemy biorąc Y = R̄, y0 = ∞, B 1 = Ball(x0 ) i B 2 = {(E, ∞] | E ∈
R+ }. Dostajemy
lim f (x) = ∞
x→x0
:⇔
∀B = (E, ∞] ∈ B 1 ∃K = K(x0 , δ) ∈ Ball(x0 ) ∀x ∈ K ∩ A \ {x0 }
⇔
∀E > 0 ∃δ > 0 ∀x ∈ A \ {x0 }
f (x) ∈ B
ρ(x, x0 ) < δ ⇒ f (x) > E,
Podobnie wygląda przypadek granicy wynoszącej −∞. Za bazę otoczeń B 2 bierzemy jedynie {[−∞, −E) | E ∈ R+ }
10.2.5
Granica w nieskończoności
Przypadek granicy w nieskończoności dla funkcji f : X → R uzyskujemy biorąc X = R̄, A = R, x0 = ∞, B 1 =
{ (E, ∞] | E ∈ R+ }, B 2 = Ball(y0 ). Dostajemy
lim f (x) = y0
x→∞
:⇔
∀K = K(y0 , ) ∈ Ball(y0 ) ∃B = (E, ∞] ∈ B 1 ∀x ∈ B ∩ A \ {∞}
⇔
∀ > 0 ∃E > 0 ∀x ∈ R
f (x) ∈ K
x > E ⇒ |f (x) − y0 | < ,
Podobnie wygląda przypadek granicy w −∞. Za bazę otoczeń B 1 bierzemy jedynie {[−∞, −E) | E ∈ R+ }
10.3
Granice jednostronne
Niech Y będzie przestrzenią metryczną. Rozważmy f : R → Y i punkt x0 ∈ R.
Definicja 10.3.1 Mówimy, że f ma w x0 granicę lewostronną równą y ∈ Y i piszemy
lim f (x) = y,
x→x−
0
jeżeli f|(−∞,x0 ] : (−∞, x0 ] → Y ma w x0 granicę y. Analogicznie, mówimy, że f ma w x0 granicę prawostronną równą
y ∈ Y i piszemy
lim+ f (x) = y,
x→x0
jeżeli f|[x0 ,∞) : [x0 , ∞) → Y ma w x0 granicę y.
Twierdzenie 10.3.2 Funkcja f ma w x0 granicę y ∈ Y wtedy i tylko wtedy gdy obie granice jednostronne istnieją i
są sobie równe.
W programie Mathematica granicę jednostronną limx→u− f (x) liczymy przy pomocy instrukcji
Limit[f[x], x -> u, Direction -> 1]
a granicę jednostronną limx→u+ f (x) liczymy przy pomocy instrukcji
Limit[f[x], x -> u, Direction -> -1]
Na przykład
Limit[1/x, x -> 0, Direction -> 1]
zwraca −∞.
10.4. PUNKTY GRANICZNE
169
10.4
Punkty graniczne
10.4.1
Ciągowa charakterystyka granicy
Ustalmy dwie przestrzenie metryczne X, Y oraz funkcję f : X → Y i punkt x0 ∈ X 0 .
Twierdzenie 10.4.1 Następujące dwa warunki są sobie równoważne
(i)
istnieje granica
lim f (x) = y0 ,
x→x0
(ii)
dla każdego ciągu x : N1 → X \ {x0 } zachodzi
lim xn = x0 ⇒ lim f (xn ) = y0 .
n→∞
n→∞
Dowód:
10.4.2
Zbiór punktów granicznych
Definicja 10.4.2 Niech f : X → Y będzie funkcją odwzorowującą przestrzeń metryczną X w przestrzeń metryczną
Y . Niech x0 ∈ X będzie punktem skupienia X w X. Definiujemy zbiór punktów granicznych funkcji f w x0 jako
Lim f (x) := { y ∈ Y | ∃a : N → X limn→∞ an = x0 i limn→∞ f (an ) = y }.
x→x0
Twierdzenie 10.4.3 Zbiór Limx→x0 f (x) jest domknięty.
Dowód:
170
ROZDZIAŁ 10. GRANICA FUNKCJI
10.4.3
Ciągowa charakterystyka granicy ciągu
Twierdzenie 10.4.4 Niech a : N → Y będzie ciągiem w przestrzeni metrycznej Y , a y ∈ Y . Następujące warunki są
równoważne.
(i) limn→∞ an = y,
(ii) ∀k : N → N
limn→∞ kn = ∞ ⇒ limn→∞ (a ◦ k)(n) = y,
(iii) ∀k : N → N
k silnie rosnący ⇒ limn→∞ (a ◦ k)(n) = y,
(iv) Dla każdego a0 podciągu a jest limn→∞ a0n = y.
Twierdzenie 10.4.5 Niech a : N → Y będzie ciągiem w przestrzeni metrycznej Y . Wtedy
Lim an = { y ∈ Y | ∃kN → N silnie rosnący i taki, że lim akn = y }.
n→∞
10.5
Granica dolna i górna
10.5.1
Granica dolna i górna
Niech X będzie przestrzenią metryczną, Y ⊂ R̄ oraz f : X → Y . Załóżmy ponadto, że dla pewnego x0 ∈ X 0 zbiór
Limx→x0 f (x) jest niepusty.
Definicja 10.5.1 W przypadku gdy Limx→x0 f (x) jest ograniczony od góry, granicę górną definiujemy wzorem
lim sup f (x) := sup Lim f (x).
x→x0
x→x0
Analogicznie, gdy Limx→x0 f (x) jest ograniczony od dołu, granicę dolną definiujemy wzorem
lim inf f (x) := inf Lim f (x).
x→x0
x→x0
Zobaczymy później, że w przypadku Y = R̄ zbiór punktów granicznych jest zawsze niepusty, a ponieważ każdy zbiór w R̄ jest ograniczony tak od góry jak
i od dołu, wi˛ec granica górna i dolna sa˛ w tym przypadku zawsze określone.
Twierdzenie 10.5.2 Niech f : X → R̄ oraz x0 ∈ X 0 . Wtedy a = limx→x0 f (x) jest równoważne równości
lim inf f (x) = lim sup f (x).
x→x0
x→x0
10.5. GRANICA DOLNA I GÓRNA
171
W przypadku gdy Y = R̄ możemy podać przydatne kryterium na granicę górną i dolną, a także twierdzenie o zachowywaniu nierówności przez te granice. W dowodach wykorzystujemy nieudowodniony jeszcze fakt, że każdy ciąg w R̄ posiada
podciąg zbieżny. Fakt ten udowodnimy w rozdziale 11.
10.5.2
Własności granicy dolnej i górnej
Twierdzenie 10.5.3 Niech f : X → R̄ oraz x0 ∈ X 0 . Wtedy a = lim supx→x0 f (x) jest równoważne koniunkcji
następujących dwóch warunków.
a ∈ Lim f (x),
x→x0
∀b > a ∃V ∈ Nb(x0 )
x ∈ V ⇒ f (x) < b.
Dowód:
Twierdzenie 10.5.4 Niech f, g : X → R̄ oraz x0 ∈ X 0 . Jeśli istnieje V ∈ Nb(x0 ) takie, że dla każdego x ∈ V \ {x0 }
mamy f (x) ¬ g(x) to
lim inf f (x) ¬ lim inf g(x),
x→x0
x→x0
lim sup f (x) ¬ lim sup g(x).
x→x0
Dowód:
x→x0
172
ROZDZIAŁ 10. GRANICA FUNKCJI
10.6
Granica, a struktura algebraiczna
10.6.1
Sumy, różnica, iloczyn i iloraz funkcji
Niech X będzie przestrzenią metryczną, a x0 punktem skupienia X. Niech Y będzie ciałem R lub ciałem C.
Załóżmy, że dane są funkcje
f1 , f2 : X → Y.
Niech : Y × Y będzie działaniem w ciele Y . Definiujemy funkcję
f1 f2 : X 3 x 7→ f1 (x) f2 (x) ∈ Y.
Dla ∈ { +, −, ·, / } nazywamy ją odpowiednio sumą, różnicą, iloczynem i ilorazem funkcji f1 i f2 .
10.6.2
Granica sumy, różnicy i iloczynu
Twierdzenie 10.6.1 Załóżmy, że f1 , f2 mają w x0 odpowiednio granice a1 , a2 ∈ Y , tzn.
lim fi (x) = ai .
x→x0
Wtedy istnieją granice sumy, różnicy i iloczynu funkcji f1 , f2 w x0 i wynoszą odpowiednio
lim (f1 (x) + f2 (x))
= a1 + a2 ,
lim (f1 (x) − f2 (x))
= a1 − a2 ,
x→x0
x→x0
lim (f1 (x)f2 (x))
x→x0
Dowód:
10.6.3
Granica ilorazu
= a1 a2 .
10.7. GRANICA, A STRUKTURA PORZĄDKOWA
173
Twierdzenie 10.6.2 Przy założeniach poprzedniego twierdzenia, jeśli ponadto a2 6= 0, to istnieje też granica ilorazu
i wynosi
f1 (x)
a1
lim
= .
x→x0 f2 (x)
a2
Dowód:
Powyższe twierdzenia zachodzą też w przypadku Y = R̄, ale tylko wtedy, gdy odpowiednie działania mają sens.
10.7
Granica, a struktura porządkowa
10.7.1
Zachowywanie nierówności w granicy
Twierdzenie 10.7.1 Niech f, g : X → R̄, x ∈ X 0 . Jeśli istnieje otoczenie V punktu x0 takie, że dla każdego x ∈
X \ {x0 } mamy f (x) ¬ g(x), to
lim f (x) ¬ lim g(x).
x→x0
Dowód:
10.7.2
Twierdzenie o trzech funkcjach
x→x0
174
ROZDZIAŁ 10. GRANICA FUNKCJI
Twierdzenie 10.7.2 Niech f, g, h : X → R̄, x ∈ X 0 . Jeśli istnieje otoczenie V punktu x0 takie, że dla każdego
x ∈ X \ {x0 } mamy f (x) ¬ g(x) ¬ h(x) oraz istnieją granice
lim f (x),
x→x0
lim h(x)
x→x0
i obie są równe pewnemu a ∈ R̄, to istnieje granica limx→x0 g(x) i też wynosi a.
Dowód:
10.7.3
Granica funkcji monotonicznej
Twierdzenie 10.7.3 Niech A ⊂ R̄ i ω := sup A. Jeśli ω jest punktem skupienia zbioru A, a f : A → R̄ jest funkcją
rosnącą i ograniczoną od góry, to istnieje granica limx→ω f (x) i jest równa
sup { f (x) | x ∈ A, x < ω }.
Dowód:
10.8
Granice w produkcie kartezjańskim
Twierdzenie 10.8.1 Niech X oraz Y1 , Y2 , . . . Yn będą przestrzeniami metrycznymi, a f = (f1 , f2 , . . . fn ) : X →
Y1 × Y2 × · · · × Yn niech będzie zestawieniem funkcji fi : X → Yi dla i = 1, 2, . . . , n. Niech x0 będzie punktem skupienia
przestrzeni X oraz niech y := (y1 , y2 , . . . , yn ) ∈ Y1 × Y2 × · · · × Yn . Wtedy
lim f (x) = y ⇔ lim fi (x) = yi dla i = 1, 2, . . . n.
x→x0
x→x0
10.8.
GRANICE W PRODUKCIE KARTEZJAŃSKIM
Dowód: (**)Dowód przedstawimy dla przypadku n = 2.
175
176
ROZDZIAŁ 10. GRANICA FUNKCJI
Rozdział 11
Ciągłość funkcji
11.1
Koncepcja ciągłości
11.1.1
Definicja ciągłości
Niech f : X → Y będzie odwzorowaniem przestrzeni metrycznych.
Definicja 11.1.1 Mówimy, że f jest ciągła w punkcie x0 ∈ X jeżeli dla każdego otoczenia V ∈ Nb(f (x0 )) istnieje
otoczenie U ∈ Nb(x0 ) takie, że
x ∈ U ⇒ f (x) ∈ V.
Mówimy, że f jest ciągła jeśli jest ciągła w każdym punkcie x ∈ X.
Twierdzenie 11.1.2 Funkcja f jest ciągła w x0 wtedy i tylko wtedy gdy zachodzi jeden z następujących dwóch warunków
x0 6∈ X 0 lub x0 ∈ X 0 i lim f (x) = f (x0 ).
x→x0
Dowód:
Twierdzenie 11.1.3 Niech B 1 będzie bazą otoczeń x0 , a B 2 bazą otoczeń f (x0 ). Wtedy ciągłość f : X → Y w x0 jest
równoważna każdemu z trzech poniższych warunków
∀V ∈ B 2 ∃U ∈ B 1
∀V ∈ B 2 ∃U ∈ B 1
∀V ∈ B 2
f (U ) ⊂ V,
U ⊂ f −1 (V ),
f −1 (V ) ∈ Nb(x0 ).
177
178
ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI
Dowód:
11.1.2
Kryteria ciągłości
Twierdzenie 11.1.4 Funkcja f : X → Y jest ciągła wtedy i tylko wtedy gdy dla każdego zbioru otwartego V w Y
zbiór f −1 (V ) jest otwarty w X.
Dowód:
Twierdzenie 11.1.5 Funkcja f : X → Y jest ciągła wtedy i tylko wtedy gdy dla każdego zbioru domkniętego K w Y
zbiór f −1 (K) jest domknięty w X.
11.1.3
Ciągłość złożenia
Twierdzenie 11.1.6 Niech X, Y, Z będą przestrzeniami metrycznymi, a f : X → Y i g : Y → Z odwzorowaniami.
Jeśli f jest ciągłe w x0 ∈ X, a g jest ciągłe w f (x0 ), to g ◦ f jest ciągłe w x0 . Zatem jeśli f i g są ciągłe, to g ◦ f jest
ciągłe.
Dowód: łatwe ćwiczenie.
11.1.4
Ciągłość operacji arytmetycznych
Niech X będzie przestrzenią metryczną, a Y niech będzie ciałem liczb rzeczywistych lub ciałem liczb zespolonych.
Twierdzenie 11.1.7 Jeśli f, g : X → Y są ciągłe w x0 ∈ X to f + g, f − g, f · g są ciągłe w x0 . Jeśli dodatkowo
g(x0 ) 6= 0, to f /g jest ciągłe w x0 .
Dowód: łatwe ćwiczenie.
11.1.5
Twierdzenie o lokalnym zachowywaniu znaku
Twierdzenie 11.1.8 Niech f : X → R będzie funkcją ciągłą. Jeśli f (x0 ) > 0 dla pewnego x0 ∈ X, to istnieje U
otoczenie punktu x0 takie, że dla każdego x ∈ U mamy f (x) > 0.
11.1. KONCEPCJA CIĄGŁOŚCI
179
Dowód:
Twierdzenie 11.1.9 Niech X, Y będą przestrzeniami metrycznymi.
(i)
(ii)
Niech c ∈ Y . Funkcja stała cX : X 3 x 7→ c ∈ Y jest ciągła.
Niech X ⊂ Y . Inkluzja j : X 3 x 7→ x ∈ Y jest ciągła.
(iii)
Identyczność idX : X 3 x 7→ x ∈ X jest ciągła.
(iv)
Odwzorowania rzutowania
pX : X × Y 3 (x, y) 7→ x ∈ X
qX : X × Y 3 (x, y) 7→ y ∈ Y
są ciągłe.
(v)
Zawężenie f|A odwzorowania ciągłego f : X → Y do zbioru A ⊂ X jest ciągłe.
Dowód: łatwe ćwiczenie.
Twierdzenie 11.1.10 Niech P : C → C będzie wielomianem. Wtedy P jest ciągłe.
Dowód: łatwe ćwiczenie.
Niech P, Q : C → C będą wielomianami. Funkcją wymierną jest funkcja
P
P (x)
: C \ Q−1 (0) 3 x 7→
∈ C.
Q
Q(x)
Twierdzenie 11.1.11 Funkcja wymierna jest ciągła.
Dowód: łatwe ćwiczenie.
(*)Nieciągłości funkcji f : R → R
11.1.6
Niech f : (a, b) → R i niech x0 ∈ (a, b).
Definicja 11.1.12 Mówimy, że f ma w x0 nieciągłość pierwszego rodzaju, jeżeli f nie jest ciągła w x0 , ale istnieją
granice jednostronne limx→x− f (x) i limx→x+ f (x). W przeciwnym razie mówimy, że f ma w x0 nieciągłość drugiego
0
0
rodzaju.
Twierdzenie 11.1.13 Funkcja f ma w x0 nieciągłość pierwszego rodzaju wtedy i tylko wtedy gdy limx→x− f (x) 6=
0
limx→x+ f (x) lub limx→x− f (x) = limx→x+ f (x) 6= f (x0 ).
0
0
0
180
ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI
Twierdzenie 11.1.14 Jeśli f : (a, b) → R jest funkcją słabo rosnącą, to każdy jej punkt nieciągłości jest pierwszego
rodzaju. Ponadto
∀x0 ∈ (a, b)
∀x1 , x2 , x3 ∈ (a, b)
lim f (x) ¬ f (x0 ) ¬ lim+ f (x),
x→x−
0
x→x0
x1 < x2 < x3 ⇒ lim+ f (x) ¬ f (x2 ) ¬ lim− f (x).
x→x1
x→x3
Analogiczne własności ma funkcja słabo malejąca.
Dowód:
11.1.7
Ciągłość bijekcji monotonicznej
Twierdzenie 11.1.15 Niech (a, b) i (c, d) będą otwartymi przedziałami w R i niech f : (a, b) → (c, d) będzie bijekcją
rosnącą. Wtedy f jest ciągła.
Dowód:
11.2
Ciągłość, a zwartość
Funkcje ciągłe mają wiele pożytecznych własności. Jednakże wiele z tych własności wymaga, by zbiory na których funkcje
są określone miały pewne sprzyjające tym własnościom cechy. Do cech takich należą rozważane w tym rozdziale zwartość,
spójność oraz zupełność.
11.2.1
Zwartość podprzestrzeni Rd .
Przyczyny braku zbieżności mogą być różne. Ciąg
a : N1 3 n 7→
1
+ (−1)n → R
n
11.2. CIĄGŁOŚĆ, A ZWARTOŚĆ
181
Rysunek 11.1: Funkcja ciągła na zbiorze domkniętym i ograniczonym jest ograniczona
nie jest zbieżny, bo nie może się zdecydować czy zbiegać do 1 czy do −1. Inaczej: można z niego wybrać podciągi zbieżne
do dwóch różnych granic. Z kolei ciąg
a : N1 3 n 7→ 2n → R,
w ogóle nie posiada podciągu zbieżnego. Ale temu można zaradzić zmieniając przestrzeń R na R̄. Wtedy ten ciąg staje
się zbieżny do +∞. Można pokazać, że w R̄ każdy ciąg posiada podciąg zbieżny. Przestrzenie topologiczne, które mają
taką własność są z wielu powodów mile widziane. Do takich zaliczają się przestrzenie zwarte. Ponieważ ich ogólna definicja
jest nieco skomplikowana, podamy ją oddzielnie w rozdz. 11.2.3. Jednak w następującym ważnym przypadku szczególnym
definicja jest prosta.
Definicja 11.2.1 Niech X będzie podprzestrzenią przestrzeni metrycznej Rd z metryką euklidesową. Mówimy, że
przestrzeń X jest zwarta jeśli X jako podzbiór Rd jestdomknięty i ograniczony.
Domkni˛ete i ograniczone podzbiory w Rn maja˛ też inne przydatne własności. Rysunek 11.1 pokazuje, że należy oczekiwać iż funkcja ciagła
˛ f na domkni˛etym
i ograniczonym podzbiorze Rn jest ograniczona.
Rysunek 11.2 z kolei pokazuje, że założenie iż zbiór jest ograniczony jest istotne.
Co wi˛ecej, sama domkni˛etość przedziału nie wystarcza. Przedział [0, ∞), też jest domkni˛ety, ale funkcja
[0, ∞) 3 x 7→ x2 ∈ R
jest nieograniczona. Zatem istotne jest, by rozważać przedział domkni˛ety i ograniczony. Rozważania te sugeruja,˛ że prawdziwe powinno być nast˛epujace
˛
twierdzenie (formułujemy je dla najprostszego przypadku).
Twierdzenie 11.2.2 Niech f : [a, b] → R b˛edzie funkcja˛ ciagł
˛ a.˛ Wtedy f jest funkcja˛ ograniczona.˛
11.2.2
(*)Intuicja zwartości i ogólna definicja zwartości.
Potencjalny dowód tw. 11.2.2 mógłby przebiegać tak: Do y ∈ im f dobieram x ∈ [a, b] takie, że f (x) = y oraz Vx ∈ ONb(x) takie, że
u ∈ Vx ⇒ f (u) ∈ [y − 1, y + 1].
182
ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI
Rysunek 11.2: Funkcja ciągła na przedziale otwartym (a, b) nie musi być ograniczona
Mamy
[a, b] ⊂
[
{ Vx | x ∈ [a, b] }.
Mówimy, że rodzina zbiorów { Vx | x ∈ [a, b] } stanowi pokrycie otawrte przedziału [a, b]. Gdyby było możliwe zastapienie
˛
tego pokrycia podpokryciem skończonym, to znaczy wybranie skończonej ilości punktów x1 , x2 , . . . xk ∈ [a, b], tak, by
[a, b] ⊂
k
[
V xi ,
i=1
to otrzymalibyśmy
f ([a, b]) ⊂
k
[
[f (xi ) − 1, f (xi ) + 1]
i=1
a stad
˛ f ([a, b]) ⊂ [c, d], gdzie
c := min { f (xi ) − 1 | i = 1, 2, . . . k } d := max { f (xi ) + 1 | i = 1, 2, . . . k }
i dowód byłby zakończony. Okazuje si˛e, że jedynymi podzbiorami w Rn , które maja˛ własność istnienia podpokrycia skończonego dla dowolnego pokrycia otwartego
sa˛ zbiory domkni˛ete i ograniczone. Niestety nie jest to prawda˛ w dowolnej przestrzeni metrycznej. Ponieważ pomysł polegajacy
˛ na wybraniu z nieskończonego
pokrycia zbioru pewnego podpokrycia skończonego przydaje si˛e w wielu dowodach, dlatego warto wyróżnić klas˛e zbiorów majacych
˛
taka˛ własność. Zbiory takie
nazywane sa˛ zbiorami zwartymi.
Co wi˛ecej, okazuje si˛e, że zwartość zbioru nie zależy od topologii przestrzeni, w której zbiór jest zanurzony, a tylko od topologii indukowanej w zbiorze. Dlatego
mówimy też o przestrzeniach zwartych.
Niech X będzie przestrzenią metryczną i A ⊂ X.
Definicja 11.2.3 Mówimy, że zbiór A jestS
zwarty jeżeli dla każdej rodziny C ⊂ Open(X) takiej, że A ⊂
skończona podrodzina C 0 ⊂ C taka, że A ⊂ C 0 .
S
C istnieje
Definicja 11.2.4 Mówimy, że przestrzeń metryczna X jest zwarta, jeżeli X traktowane jako zbiór w przestrzeni X
jest zbiorem zwartym.
11.2. CIĄGŁOŚĆ, A ZWARTOŚĆ
183
Definicja 11.2.5 Klasę przestrzeni zwartych oznaczać będziemy Comp.
11.2.3
Przestrzenie zwarte
Niech X będzie ustaloną przestrzenią metryczną. Poniższe twierdzenie pokazuje, że zwartość jest własnością zbioru zależną
jedynie od metryki indukowanej w tym zbiorze, a nie od metryki w całej przestrzeni.
Twierdzenie 11.2.6 Niech Y ⊂ X będzie podprzestrzenią X, a A ⊂ Y . Zbiór A jest zwarty w Y wtedy i tylko wtedy
gdy jest zwarty w X.
Twierdzenie 11.2.7 Każdy zwarty zbiór A ⊂ X jest domknięty.
Twierdzenie 11.2.8 Podzbiór domknięty zbioru zwartego jest zbiorem zwartym.
Twierdzenie 11.2.9 Niech K ⊂ X będzie zbiorem zwartym, a E ⊂ K jego nieskończonym podzbiorem. Wtedy zbiór
punktów skupienia E 0 6= ∅.
Twierdzenie 11.2.10 Niech E ⊂ Rd . Następujące warunki są równoważne.
(i) E jest domknięty i ograniczony.
(ii) E jest zwarty.
(iii) Każdy nieskończony podzbiór zbioru E ma punkt skupienia należący do E.
Zatem ogólna definicja zwartości w przypadku podzbiorów Rd jest równoważna definicji, którą podaliśmy wcześniej.
Twierdzenie 11.2.11 Przestrzeń R̄ jest zwarta.
11.2.4
Obraz zbioru zwartego przez odwzorowanie ciągłe.
Ustalmy przestrzenie metryczne X, Y oraz funkcję f : X → Y .
Twierdzenie 11.2.12 Jeśli f jest ciągła, a A ⊂ X jest zwarty, to f (A) jest zwarty.
Dowód: (*)
184
ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI
Rysunek 11.3: Funkcja ciągła na przedziale zwartym osiąga swoje kresy
Wniosek 11.2.13 Zachodzą następujące własności.
(i) Jeśli f : X → Rd jest ciągła, a K ⊂ X jest zwarty, to f (K) jest domknięty i ograniczony.
(ii) Jeśli przestrzeń X jest zwarta, a f : X → Rd jest ciągła, to f jest ograniczona.
(iii) Jeśli f : [a, b] → Rd jest ciągła, to jest ograniczona.
11.2.5
Funkcja ciągła na przedziale zwartym osiąga swoje kresy
Twierdzenie 11.2.14 Jeśli X jest przestrzenią zwartą, a f : X → R jest ciągła oraz m := inf f (X), M := sup f (X),
to istnieją p, q ∈ X takie, że f (p) = m i f (q) = M .
Dowód:
11.2.6
Funkcja odwrotna do funkcji ciągłej
Twierdzenie 11.2.15 Jeśli f : X → Y jest ciągłą bijekcją, a X jest zwarty, to f −1 jest ciągłe.
Dowód:
11.3. JEDNOSTAJNA CIĄGŁOŚĆ
11.3
185
Jednostajna ciągłość
Definicja 11.3.1 Funkcja f : X → Y jest jednostajnie ciągła wtedy i tylko wtedy gdy
∀ > 0 ∃δ > 0 ∀x, y ∈ X
ρX (x, y) < δ ⇒ ρY (f (x), f (y)) < .
Twierdzenie 11.3.2 Jeśli f : X → Y jest jednostajnie ciągła, to f jest ciągła.
Twierdzenie 11.3.3 Jeśli f : X → Y jest ciągła, a X jest przestrzenią zwartą, to f jest jednostajnie ciągła.
Dowód:
11.3.1
Funkcje Lipschitza
Definicja 11.3.4 f : X → Y jest funkcją Lipschitza jeżeli istnieje stała L > 0 taka, że
∀x1 , x2 ∈ X
ρY (f (x1 ), f (x2 )) ¬ LρX (x1 , x2 ).
186
ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI
Rysunek 11.4: Funkcja jednostajnie ciągła, która nie jest funkcją Lipschitza
Twierdzenie 11.3.5 Jeśli f : X → Y jest funkcją Lipschitza, to jest funkcją jednostajnie ciągłą.
11.4
Ciągłość, a spójność
11.4.1
Spójne podzbiory R̄.
Intuicja przestrzeni spójnej jest bardzo prosta. Jest to taka przestrzeń, która nie rozpada si˛e na dwa lub wi˛ecej kawałków. Formalna definicja jest jednak nieco
skomplikowana. Dlatego najpierw podamy definicj˛e spójności dla przestrzeni metrycznych b˛edacych
˛
podzbiorami R̄
Definicja 11.4.1 Niech X ⊂ R̄ będzie podprzestrzenią. Mówimy, że X jest przestrzenią spójną jeżeli X jest przedziałem w R̄.
11.4.2
(*)Przestrzenie spójne
Niech X będzie przestrzenią metryczną.
Definicja 11.4.2 Mówimy, że zbiór E ⊂ X jest niespójny, jeżeli istnieją rozłączne zbiory A, B ∈ Open(X) takie, że
A ∩ E 6= ∅ 6= B ∩ E oraz E ⊂ A ∪ B. Jeśli takie zbiory nie istnieją, mówimy, że E jest spójny.
Twierdzenie 11.4.3 Niech E ⊂ R̄. E jest zbiorem spójnym, wtedy i tylko wtedy gdy
∀x, y, z ∈ E
z ∈ (x, y) ⇒ z ∈ E.
11.4. CIĄGŁOŚĆ, A SPÓJNOŚĆ
187
Wniosek 11.4.4 Zbiory spójne w R̄ to przedziały.
Zatem ogólna definicja spójności w przypadku podzbiorów R̄ jest równoważna definicji, którą już podaliśmy.
11.4.3
Obraz zbioru spójnego przez odwzorowanie ciągłe.
Twierdzenie 11.4.5 Niech f : X → Y będzie odwzorowaniem ciągłym. Jeśli E ⊂ X jest spójny, to f (E) jest zbiorem
spójnym.
Dowód:
Wniosek 11.4.6 Jeśli a, b ∈ R̄, a < b i f : [a, b] → R̄ jest odwzorowaniem ciągłym, to f ([a, b]) jest przedziałem
domkniętym.
11.4.4
Własność Darboux.
Wniosek 11.4.7 (własność Darboux) Jeśli a, b ∈ R̄, a < b, f : [a, b] → R̄ jest odwzorowaniem ciągłym oraz f (a) <
f (b) to dla każdego c ∈ [f (a), f (b)] istnieje ξ ∈ [a, b] takie, że f (ξ) = c.
Własność Darboux zobrazowano na rys. 11.5
188
ROZDZIAŁ 11. CIĄGŁOŚĆ FUNKCJI
Rysunek 11.5: Własność Darboux.
Rozdział 12
Szeregi
12.1
Eksperymenty numeryczne
12.1.1
Przybliżanie liczby π polami wielokątów wpisanych w koło.
W rozdziale 1.3.2 zaprezentowaliśmy metod˛e przybliżania liczby π poprzez pola wielokatów
˛
wpisanych w koło i zauważyliśmy, że stosowny ciag
˛ (1.4) jest
szeregiem. Przyjrzyjmy si˛e teraz zachowaniu tego szeregu od strony numerycznej Program wyznaczajacy
˛ wyrazy ciagu
˛ (1.4) w Mathematica jest przedstawiony
na listingu 12.1, a w j˛ezyku C++ na listingu 12.2
Uruchamiajac
˛ program łatwo sprawdzić, że metoda oparta o pola przy zastosowaniu tego samego typu double daje znacznie dokładniejsze wyniki niż
metoda poprzednia, bo już 26-ta suma cz˛esciowa daje wartość
s26 = 3.141592653589793,
która jest poprawnym przybliżeniem liczby π do ostatniej cyfry włacznie.
˛
12.1.2
Warunek konieczny zbieżności szeregu
Twierdzenie 12.1.1 Jeśli szereg
P∞
n=1 cn
jest zbieżny, to ciag
˛ cn zmierza do zera.
Nie jest to jednak warunek wystarczajacy,
˛ bo na przykład o szeregu
∞
X
1
n
n=1
zwanym szeregiem harmonicznym, można pokazać, że nie jest zbieżny w sensie definicji Cauchy’ego.
Pogrupujmy wyrazy szeregu harmonicznego w porcje kolejno po jeden, dwa, cztery itd.
∞
X
1
1 1
1 1 1 1
=1+
+
+
+ + +
+ ...
n
2 3
4 5 6 7
n=1
189
190
ROZDZIAŁ 12. SZEREGI
( ∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z p o l a w i e l o k ą t ó w foremnych
wpisanych w okrąg o ś r e d n i c y j e d e n
∗)
P i B y F i e l d [ d_ ] :=
Module [ { s , m, n , a } ,
n = 2;
m = 4 ; ( ∗ I l o ś ć boków w i e l o k ą t a , na p o c z ą t e k kwadrat ∗ )
a = Sqrt [ 2 . ] / 2 ;
( ∗ Bok k o l e j n y c h w i e l o k ą t ó w ∗ )
s = 2 ; (∗ c z t e r o k r o t n e pole ko lejnego wielokąta ∗)
Do[
Print [ "s[" , n , " ]= " , NumberForm[ s , 1 6 ] ] ;
s = s + m∗ a ∗ ( 1 − Sqrt [ 1 − a ∗ a ] ) ;
a = Sqrt [ 2 − Sqrt [ 4 − 4∗ a ∗ a ] ] / 2 ;
m = m∗ 2 ;
n = n + 1,
{d}
];
s
]
Listing 12.1: Wyznaczenie ciągu przybliżeń liczby π w języku Mathematica w oparciu o pola wielokątów
Tak wi˛ec sumy kolejnych porcji to
T0
T1
T2
T3
...
Tk
:=
1
1 1
+
:=
2 3
1 1 1 1
:=
+ + +
4 5 6 7
1 1
1
1
1
1
1
1
:=
+ +
+
+
+
+
+
8 9 10 11 12 13 14 15
...
2k+1
X−1 1
.
:=
n
k
n=2
Na listingach 12.3 i 12.4 przedstawiono program odpowiednio w Mathematica i w C++, który liczy sumy kolejnych porcji Tk dla szeregu harmonicznego.
Wynik działania programu sugeruje, że sumy te sa˛ wi˛eksze od pewnej stałej c > 0, co w dalszym toku udowodnimy formalnie. Na razie zaobserwujmy, że
konsekwencja˛ tego faktu jest
m
2
X
1
 mc.
n
n=1
Zatem sumy cz˛eściowe szeregu harmonicznego moga˛ być wi˛eksze od dowolnie zadanej liczby.
12.1.3
Rozbieżność do nieskończoności
Mówimy, że ciag
˛ xn jest rozbieżny do nieskończoności, jeżeli zachodzi warunek
∀M > 0∃N > 0∀n ∈ N n > N ⇒ xn > M.
Możemy wi˛ec powiedzieć, że sumy cz˛eściowe szeregu
P∞
1
n=1 n
sa˛ rozbieżne do nieskończoności.
12.1. EKSPERYMENTY NUMERYCZNE
191
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ P i B y F i e l d . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e p r z y b l i ż e n i a l i c z b y p i p o p r z e z p o l a w i e l o k ą t ó w foremnych ∗/
/∗ wpisanych w okrąg o p r o m i e n i u j e d e n
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include 
#include <cmath>
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
i n t m=4; /∗ I l o ś ć boków w i e l o k ą t a , na p o c z ą t e k kwadrat . ∗/
/∗ Bok k o l e j n y c h w i e l o k ą t ó w wpisanych w k o ł o o ś r e d n i c y j e d e n .
Na p o c z ą t e k bok kwadratu ∗/
double a=s q r t ( 2 . 0 ) / 2 ;
/∗ Zmienna s z a w i e r a c z t e r o k r o t n e p o l e k o l e j n e g o w i e l o k ą t a .
Zaczynamy od kwadratu , k t ó r y ma p o l e 1 / 2 . ∗/
double s =2;
i n t nmax=30;
f o r ( i n t n=2;n<nmax ; n=n+1){
c o u t << "
s[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << s ;
c o u t << e n d l ;
/∗ C z t e r o k r o t n e p o l e k o l e j n e g o w i e l o k ą t a
p r z y r a s t a o c z t e r o k r o t n e p o l e m t ró k ąt ów równobocznych ∗/
s=s+m∗ a∗(1− s q r t (1−a ∗ a ) ) ;
m=m∗ 2 ; /∗ Podwajamy i l o ś ć boków ∗/
a=s q r t (2− s q r t (4−4∗ a ∗ a ) ) / 2 ; /∗ I wyznaczamy k o l e j n y bok ∗/
}
}
Listing 12.2: Wyznaczenie ciągu przybliżeń liczby π w C++ w oparciu o pola wielokątów
192
ROZDZIAŁ 12. SZEREGI
( ∗ A n a l i z a zachowania s z e r e g u harmonicznego ∗ )
H a r m o n i c S e r i e s [ d_ ] := Module [ { s , n , k } ,
k = 0;
Do[
s = 0.;
n = 2^k ;
( ∗ Obliczamy sumę wyrazów s z e r e g u od 2^k do 2^{ k+1}−1 ∗ )
Do[
s = s + 1./n ;
n = n + 1,
{2^ k}
];
Print [ "T[" , k , " ]= " , NumberForm[ s , 1 6 ] ] ;
k = k + 1,
{d}
];
]
Listing 12.3: Obliczanie sumy
P2k+1 −1
n=2k
1
n
w Mathematica
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ H a r m o n i c S e r i e s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ A n a l i z a zachowania s z e r e g u harmonicznego
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include 
#include <cmath>
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
double m=1; /∗ Będziemy sumować w p o r c j a c h po m d l a m= 1 , 2 , 4 , . . . ∗/
f o r ( i n t k=0;k <25; k=k+1){
double s =0;
/∗ Obliczamy sumę wyrazów s z e r e g u od m=2^k do 2m−1=2^{k+1}−1 ∗/
f o r ( double n=m; n<m∗2;++n ) {
s=s +1/n ;
}
c o u t << "T[" << k << " ]= " << s << e n d l ;
m=m∗ 2 ; /∗ K o l e j n a p o r c j a b ę d z i e dwa r a z y w i ę k s z a ∗/
}
}
Listing 12.4: Obliczanie sumy
P2k+1 −1
n=2k
1
n
w C++
12.2. WŁASNOŚCI PODSTAWOWE
193
Co ciekawe, szereg
∞
X
(−1)n
n=1
1
n
jest zbieżny.
Ćwiczenie komputerowe 12.1.2 Adaptuj program z listingu 12.3 i/lub listingu 12.4 do prześledzenia zachowania szeregów
∞
X
1
√
n
n=1
i
∞
X
1
.
n2
n=1
Co sadzisz
˛
na temat ich zbieżności?
12.2
Własności podstawowe
12.2.1
Pojęcie szeregu
Niech X będzie albo ciałem R albo ciałem C.
Definicja 12.2.1 Dla k ∈ N parę ciągów x, s : Nk → X nazywamy szeregiem jeżeli
sn =
n
X
xi .
i=k
Element xn nazywamy n-tym wyrazem szeregu, a element sn nazywamy n-tą sumą częściową szeregu. Mówimy, że
szereg jest zbieżny, jeżeli ciąg jego sum częściowych jest zbieżny. Jeśli ciąg sum częściowych jest zbieżny, to jego granicę
nazywamy sumą szeregu i oznaczamy
∞
X
xi .
i=k
P∞
W praktyce symbolem i=k xi zazwyczaj oznaczamy nie tylko sumę szeregu, co jest sensowne tylko jeśli szereg jest
zbieżny, ale także sam szereg. To czy mamy na myśli szereg, czy jego sumę, rozstrzygamy na podstawie kontekstu.
Twierdzenie 12.2.2 Szereg
P∞
i=k
xi jest zbieżny wtedy i tylko wtedy gdy
∀ > 0∃N ∈ Nk ∀m n N
|
m
X
xi | < .
i=n
Dowód:
Własność ta oznacza, że ciąg sum częściowych szeregu spełnia warunek Cauchy’ego. Zatem teza wynika z zupełności
przestrzeni R lub C.
P∞
Wniosek 12.2.3 Jeśli szereg n=1 xn jest zbieżny, to limn→∞ xn = 0.
Definicja 12.2.4 Szereg
P∞
i=k
xi nazywamy bezwzględnie zbieżnym, jeżeli szereg
P∞
i=k
|xi | jest zbieżny.
194
ROZDZIAŁ 12. SZEREGI
Twierdzenie 12.2.5 Jeśli szereg
P∞
i=k
xi jest bezwzględnie zbieżny to jest zbieżny oraz
|
∞
X
xi | ¬
∞
X
i=k
|xi |.
i=k
Dowód:
Ponieważ ciąg sum częściowych dla szeregu wartości bezwzględnych spełnia warunek Cauchy’ego, więc, jak łatwo sprawdzić, również ciąg sum częściowych wyjściowego szeregu spełnia ten warunek i teza wynika z zupełności R lub C.
12.2.2
Szereg geometryczny
Definicja 12.2.6 Niech a, q ∈ C, a 6= 0. Szereg
P∞
n=0
aq n , nazywamy szeregiem geometrycznym.
Twierdzenie 12.2.7 Szereg geometryczny jest zbieżny gdy |q| < 1. W przeciwnym razie jest on rozbieżny.
Dowód: Wiemy, że
sn = a
1 − q n+1
.
1−q
Zatem, jeśli |q| < 1, to
lim sn =
n→∞
a
,
1−q
czyli szereg jest zbieżny. Natomiast jeśli |q| 1, to ciąg aq n na pewno nie jest zbieżny do zera, więc nie jest spełniony
warunek konieczny zbieżności.
Twierdzenie 12.2.8 (Kryterium porównawcze) Jeśli ciągi a, b : N → R mają wyrazy nieujemne i istnieje N ∈ N
takie, że an ¬ bn dla n N , to:
P∞
P∞
• jeśli n=1 bn jest zbieżny, to n=1 an jest zbieżny,
P∞
P∞
• jeśli n=1 an jest rozbieżny, to n=1 bn jest rozbieżny.
Dowód:
Jest to wniosek z zupełności przestrzeni R.
P∞
P∞
Wniosek 12.2.9 Niech n=k zn będzie szeregiem liczb zespolonych,
P∞a n=k xn zbieżnym szeregiem liczb rzeczywistych. Jeśli istnieje n ∈ N takie, że |zn | ¬ xn dla n N , to szereg n=k zn jest bezwzględnie zbieżny.
12.3. KRYTERIA ZBIEŻNOŚCI
195
12.3
Kryteria zbieżności
12.3.1
Szereg
P∞
1
n=1 np .
Twierdzenie 12.3.1 Niech a : N → R będzie ciągiem o wyrazach nieujemnych. Szereg
tylko wtedy gdy jego ciąg sum częściowych jest ograniczony.
Dowód:
Twierdzenie 12.3.2 Niech ciąg a : N1 → R+ będzie słabo malejący. Rozważmy ciąg
b : N0 3 n 7→ 2n a2n ∈ R+ .
P∞
P∞
Wtedy zbieżność szeregu n=1 an jest równoważna zbieżności szeregu n=0 bn .
Dowód:
Wniosek 12.3.3 Szereg
Dowód:
P∞
1
n=1 np
jest zbieżny dla p > 1, a rozbieżny dla p ¬ 1.
P∞
n=1
an jest zbieżny wtedy i
196
ROZDZIAŁ 12. SZEREGI
12.3.2
Kryterium Leibniza
Twierdzenie 12.3.4 (Leibniza P
o szeregu naprzemiennym) Niech a : N0 → R+ będzie ciągiem słabo malejącym i
∞
zbieżnym do zera. Wtedy szereg n=0 (−1)n an jest zbieżny oraz dla dowolnego m ∈ N1
2m−1
X
(−1)n an ¬
n=0
∞
X
(−1)n an ¬
n=0
2m
X
(−1)n an .
n=0
Dowód:
12.3.3
Kryterium Cauchy’ego i kryterium d’Alemberta
Badaniem zbieżności szeregów zajmowali się w szczególności matematycy francuscy: najpierw Jean le Rond d’Alembert
(rys. 12.1), a następnie Augustin Louis Cauchy (rys. 1.5). Podali oni następujące kryteria zbieżności szeregów.
Twierdzenie 12.3.5 (Kryterium Cauchy’ego i d’Alemberta) Niech a : N → C będzie ciągiem oraz
α := lim sup
n→∞
p
n
|an |,
β := lim sup
n→∞
|an+1 |
.
|an |
Wtedy:
• jeśli α < 1 to
P∞
an jest zbieżny,
• jeśli β < 1 to
P∞
an jest zbieżny,
• jeśli α > 1 to
P∞
n=0
n=0
an jest rozbieżny,
P∞
• jeśli istnieje N ∈ N takie, że aan+1
> 1 dla n N , to n=0 an jest rozbieżny.
n
Dowód:
n=0
12.3. KRYTERIA ZBIEŻNOŚCI
197
Rysunek 12.1: Jean le Rond d’Alembert, 1717-1783, Źródło: Wikipedia
12.3.4
Szeregi potęgowe
P∞
Definicja 12.3.6 Szeregiem potęgowym nazywamy szereg postaci n=0 cn z n , gdzie z ∈ C jest ustalonym parametrem,
a ciąg c : N0 → C jest tzw. ciągiem współczynników szeregu potęgowego.
198
ROZDZIAŁ 12. SZEREGI
Twierdzenie 12.3.7 Niech
Wtedy szereg
|z| = R.
P∞
n=0 cn z
n
P∞
n=0 cn z
n
będzie szeregiem potęgowym, α := lim supn→∞

1

 α gdy 0 < α < ∞,
R := 0
gdy α = ∞,


∞ gdy α = 0.
p
n
|cn |, a
jest zbieżny dla |z| < R, a rozbieżny dla |z| > R. Kryterium nie rozstrzyga zbieżności gdy
Dowód:
Jest to wniosek z kryterium Cauchy’ego dla szeregów.
12.4
Operacje na szeregach
12.4.1
Suma i iloczyn szeregów
Dowód:
Stosujemy do sum częściowych tw. granicy sumy i iloczynu ciągów.
12.4. OPERACJE NA SZEREGACH
Dowód:
12.4.2
(**)Permutacja szeregu i zbieżność bezwarunkowa
199
200
ROZDZIAŁ 12. SZEREGI
12.4.3
(**)Twierdzenie Riemanna
12.4.4
Szeregi w programie Mathematica
Program Mathematica dość dobrze
radzi sobie z liczeniem sum szeregów, a w przypadku braku zbieżności sygnalizuje ten
P∞
fakt. Do policzenia sumy szeregu i=p an używamy instrukcji
Sum[a[n],{n,p,Infinity}]
Na przykład
Sum[1/n!, {n, 2, Infinity}]
P∞ 1
zwraca n=2 n!
= −2 + e. Oznacza to, że Mathematica, w miarę swoich umiejętności, stara się zwrócić wynik dokładny,
używając symbolicznych oznaczeń na stałe matematyczne.
Rozdział 13
Funkcje wykładnicza, logarytmiczna i
trygonometryczne
13.1
Funkcja wykładnicza i logarytmiczna
13.1.1
Zespolona funkcja wykładnicza
Następujące twierdzenie pozwala przybliżać liczbę e za pomocą szeregów i to znacznie szybciej niż w przypadku ciągu,
którym posłużyliśmy się przy jej definiowaniu
Twierdzenie 13.1.1
∞
X
1
= e.
n!
n=0
Dowód:
Łatwo sprawdzić za pomocą kryterium d’Alemberta, że dla dowolnego z ∈ C szereg
∞
X
zn
n!
n=0
jest zbieżny. Rozważać zatem możemy funkcję
E : C 3 z 7→ E(z) :=
201
∞
X
zn
∈ C.
n!
n=0
202
ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
Twierdzenie 13.1.2 Funkcja E ma następujące własności:
(i) E(0) = 1 oraz E(1) = e,
(ii) dla dowolnych z1 , z2 ∈ C
E(z1 + z2 ) = E(z1 )E(z2 ),
(iii) dla dowolnego z ∈ C mamy E(z) 6= 0 oraz
E(−z) =
1
,
E(z)
(iv) E jest funkcją ciągłą,
(v) dla dowolnego z ∈ C
¯
E(z̄) = E(z).
Dowód:
Definicja 13.1.3 Funkcję E nazywamy zespoloną funkcją wykładniczą. Stosujemy dla niej również tradycyjną notację
ez := E(z) :=
13.1.2
Funkcja wykładnicza ex
∞
X
zn
∈ C.
n!
n=0
13.1. FUNKCJA WYKŁADNICZA I LOGARYTMICZNA
203
Twierdzenie 13.1.4 Istnieje dokładnie jedna funkcja ciągła f : R → R+ taka, że f (1) = e oraz dla dowolnych
x, y ∈ R zachodzi f (x + y) = f (x)f (y). Jest ona zwana funkcją wykładniczą o podstawie e. Powszechnie stosowaną
notacją dla f (x) jest ex , a sama funkcja f jest oznaczana
exp : R 3 x 7→ ex ∈ R+ .
Funkcja ta ma również następujące własności:
(i) dla dowolnych p ∈ Z oraz q ∈ N1
p
eq =
√
q
ep ,
(ii) jest silnie rosnąca,
(iii) limx→∞ ex = ∞, limx→−∞ ex = 0,
(iv) dla dowolnego n ∈ N mamy limx→∞ xn e−x = 0.
Dowód:
13.1.3
Logarytm naturalny
Funkcja exp, jako bijekcja silnie rosnąca z R do R+ , ma funkcję odwrotną, która jest bijekcją silnie rosnącą z R+ do R.
Definicja 13.1.5 Funkcję tę nazywamy logarytmem naturalnym i oznaczamy
ln : R+ 3 x 7→ ln x ∈ R.
Z definicji tej wynika w szczególności, że dla dowlnych x ∈ R+ i y ∈ R równość y = ln x jest równoważna równości
x = ey .
204
ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
Twierdzenie 13.1.6 Funcja ln ma następujące własności:
(i) jest silnie rosnąca,
(ii) ln 1 = 0, ln e = 1,
(iii) dla dowolnych x, y ∈ R+ , n ∈ N
ln(xy) = ln x + ln y,
ln
x
= ln x − ln y,
y
ln xn = n ln x,
ln
√
n
x=
ln x
,
n
(iv) limx→∞ ln x = ∞, limx→0 ln x = −∞,
(v) dla dowolnych p ∈ N, q ∈ Z+ , x ∈ R+
p
e q ln x =
√
q
p
xp = x q .
Dowód:
W programie Mathematica logarytm naturalny oznaczany jest Log.
13.1.4
Funkcja wykładnicza ax
Przy pomocy logarytmu naturalnego możemy zdefiniować funkcję wykładniczą o dowolnej podstawie a ∈ R+ .
Definicja 13.1.7 Funkcję wykładniczą o podstawie a ∈ R+ definiujemy wzorem
R 3 x 7→ ax := ex ln a ∈ R+ .
13.2
Funkcje trygonometryczne
13.2.1
Nawijanie prostej na okrąg
Zespolona funkcja wykładnicza pozwoli nam też podać formalną i czysto analityczną definicję funkcji trygonometrycznych.
Zacznijmy od następującej uwagi:
Uwaga 13.2.1 Funkcja
R 3 x 7→ eix ∈ S 1
jest dobrze określona i ciągła.
(13.1)
13.2. FUNKCJE TRYGONOMETRYCZNE
205
Rysunek 13.1: Wykres funkcji R 3 t 7→ eit ∈ S1 .
Dowód:
Funkcję daną wzorem (13.1) określa się często mianem nawijania prostej na okrąg. Terminologię tę wyjaśnia rys. 13.1
13.2.2
Funkcje sin i cos
Możemy teraz podać czysto analityczną definicję funkcji sin oraz cos. Analizując własności tych funkcji stopniowo przekonamy
się, że pokrywają się one z funkcjami sin i cos zdefiniowanymi geometrycznie.
Definicja 13.2.2 Funkcje cos i sin definiujemy wzorami
eix + e−ix
∈ [−1, 1]
2
eix − e−ix
=
∈ [−1, 1].
2i
cos
: R 3 x 7→ re eix =
sin
:
R 3 x 7→ im eix
206
ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
( ∗ O b l i c z a n i e f u n k c j i s i n u s za pomocą r o z w i n i ę c i a w s z e r e g ∗ )
S i n S e r i e s [ x_ , d_ ] :=
Module [ { s , znak , s i l n i a , y , n } ,
s = 0 ; znak = 1 ; s i l n i a = 1 ; y = x ; n = 0 ;
Do[
s = s + znak ∗y/ s i l n i a ;
znak = −znak ;
s i l n i a = s i l n i a ∗(2∗n + 2)∗(2∗ n + 3 ) ;
y = y∗x∗x ;
n = n + 1,
{d}
];
s
]
Listing 13.1: Wyznaczenie wartości funkcji sin w programie Mathematica w oparciu o rozwinięcie w szereg
Uwaga 13.2.3 Funkcje sin i cos są ciągłe. Ponadto dla każdego x ∈ R zachodzą wzory:
cos x =
∞
X
(−1)k
k=0
e
x2k
(2k)!
ix
sin x =
∞
X
k=0
(−1)k
x2k+1
(2k + 1)!
= cos x + i sin x
2
cos x + sin2 x = 1.
Dowód:
Program, który przybliża wartości funkcji sin w oparciu o szereg w uwadze 13.2.3 przedstawiono na listingach 13.1
(Mathematica) i 13.2 (C++).
13.2. FUNKCJE TRYGONOMETRYCZNE
207
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ S i n S e r i e s . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ O b l i c z a n i e f u n k c j i s i n u s za pomocą r o z w i n i ę c i a w s z e r e g ∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include 
#include <cmath>
#include <iomanip>
using namespace s t d ;
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
double p i = 3 . 1 4 1 5 9 2 6 5 3 5 8 9 7 9 3 ;
double x=p i / 6 ;
double y=x ;
i n t nmax=10 , znak =1 , s i l n i a =1;
double s =0;
f o r ( i n t n=0;n<nmax ; n=n+1){
s=s+znak ∗y/ s i l n i a ;
c o u t << "
s[" << setw ( 2 ) << n << "] =" << setw ( 1 8 ) << s ;
c o u t << e n d l ;
s i l n i a = s i l n i a ∗ ( 2 ∗ n +2)∗(2∗ n +3);
y=y∗x∗x ;
znak=−znak ;
}
}
Listing 13.2: Wyznaczenie wartości funkcji sin w C++ w oparciu o rozwinięcie w szereg
208
ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
Ćwiczenie komputerowe 13.2.4
• Sprawdź zachowanie się programu z listingu 13.2 dla zmiennej x inicjalizowanej wartościami π4 , π3 , π2 , π, 2π. Co obserwujesz w zachowaniu się ciągu przybliżeń? Jakie rodzą się pytania?
• Adaptuj program z listingów 13.1 i 13.2 do liczenia wartości funkcji cos wykorzystując fakt, że
cos x = 1 −
∞
X
x2
x4
x2n
+
− ... =
.
(−1)n
1·2 1·2·3·4
(2n)!
n=0
Oceń poprawność i przydatność implementacji wykorzystując argument, w którym wartość funkcji cos jest Ci
znana.
Lemat 13.2.5 Zachodzą następujące wzory
cos 0 = 1,
sin 0 = 0,
cos 2 < 0,
x ∈ (0, 2] ⇒ sin x > 0.
Dowód:
13.2.3
Liczba π
Dysponujemy teraz wystarczającą maszynerią, by podać analityczną, a nie geometryczną definicję liczby π.
Wniosek 13.2.6 Zbiór dodatnich miejsc zerowych funkcji cos jest domknięty i niepusty. W szczególności jego kres
dolny jest dodatni i też jest miejscem zerowym funkcji cos.
Definicja 13.2.7 Liczbę π definiujemy jako podwojone najmniejsze dodatnie miejsce zerowe funkcji cos. Innymi słowy
π := 2 inf { x ∈ R+ | cos x = 0 }.
13.2.4
Okresowość
Definicja 13.2.8 Niech F oznacza ciało liczb rzeczywistych lub ciało liczb zespolonych. Mówimy, że funkcja f : F −→
◦ F
jest okresowa wtedy i tylko wtedy gdy istnieje takie t ∈ F , że dla każdego x ∈ dom f mamy x + t ∈ dom f oraz
f (x + t) = f (x). Liczbę t nazywamy wtedy okresem funkcji f . Jeśli istnieje najmniejszy okres dodatni funkcji f
nazywamy go okresem podstawowym funkcji f
13.2. FUNKCJE TRYGONOMETRYCZNE
209
Twierdzenie 13.2.9 Mamy następujące własności:
(i) funkcja exp : C → C jest okresowa o okresie 2πi,
(ii) funkcje sin, cos : R → [−1, 1] są okresowe o okresie 2π,
(iii) t ∈ (0, 2π) ⇒ eit 6= 1,
(iv) dla każdego z ∈ S 1 istnieje dokładnie jedno t ∈ [0, 2π) takie, że eit = z.
Dowód:
Wniosek 13.2.10 Okresem podstawowym funkcji sin i cos jest 2π.
Dowód:
13.2.5
Wzory trygonometryczne
Twierdzenie 13.2.11 Dla dowolnych x, y ∈ R zachodzą wzory
sin(x + y)
=
sin x cos y + cos x sin y,
cos(x + y)
=
cos x cos y − sin x sin y.
210
ROZDZIAŁ 13. FUNKCJE WYKŁADNICZA, LOGARYTMICZNA I TRYGONOMETRYCZNE
Dowód:
Twierdzenie 13.2.12 (wzór de Moivre’a) Dla dowolnego x ∈ R oraz n ∈ N zachodzi wzór
n
(cos x + i sin x) = cos nx + i sin nx.
Dowód:
Część III
Rachunek różniczkowy i całkowy
211
Rozdział 14
Przestrzenie wektorowe
14.1
Definicja przestrzeni wektorowej
Zaproponowana przez Kartezjusza algebraizacja geometrii poprzez wprowadzenie układu współrz˛ednych na płaszczyźnie oraz geometryczna interpretacja liczb
zespolonych zaowocowały wprowadzeniem w XIXw. koncepcji wektorów jako zaczepionych w poczatku
˛ układu n-wymiarowej przestrzeni zorientowanych odcinków, które można dodawać podobnie jak dodaje si˛e liczby rzeczywiste i zespolone. Intuicyjne wyobrażenie geometryczne wektora możliwe jest jedynie w
przestrzeni dwu- i trójwymiarowej, bo jedynie z takimi przestrzeniami maja˛ do czynienia nasze zmysły. Od strony algebraicznej wektor to po prostu układ n liczb
zwanych współrz˛ednymi wektora. Dodawanie wektorów metoda˛ geometryczna˛ sprowadza si˛e do konstrukcji przekatnej
˛ rozpi˛etego na wektorach równoległoboku.
W przypadu płaszczyzny pokrywa si˛e to z geometryczna˛ interpretacja˛ sumy liczb zespolonych przedstawiona˛ na rysunku 8.4. Wektory wraz z operacja˛ dodawania
stanowia˛ grup˛e. Poza wymiarem dwa wektory nie da si˛e jednak zdefiniować mnożenia wektorów tak, by uzyskać struktur˛e ciała. Możliwe jest jednak mnożenie
wektora przez liczb˛e, które sprowadza si˛e do stosownej zmiany jego długości i, w przypadku mnożenia liczby ujemnej, symetrycznego odbicia wzgl˛edem poczatku
˛
układu.
Powyższe idee prowadza˛ do koncepcji przestrzeni wektorowej nad zadanym ciałem.
14.1.1
Przestrzeń wektorowa
Definicja 14.1.1 Niech F będzie ciałem i niech 1 oznacza element neutralny względem mnożenia w ciele F . Przestrzenią wektorową nad F nazywamy piątkę (X, F, +, ·, 0) taką, że (X, +, 0) jest grupą abelową, a
·:F ×X →X
jest działaniem (tzw. działaniem zewnętrznym) spełniającym dla dowolnych α, β ∈ F oraz x, y ∈ X warunki
(W1) (α + β)x = αx + βx,
(W2) α(x + y) = αx + αy,
(W3) α(βx) = (αβ)x,
(W4) 1.x = x.
Elementy ciała F określa się często mianem skalarów, a o działaniu zewnętrznym mówi się, że jest to mnożenie przez
skalary. Klasę przestrzeni wektorowych nad ciałem F oznaczać będziemy Vect(F ).
213
214
ROZDZIAŁ 14. PRZESTRZENIE WEKTOROWE
Przykład 14.1.2 Klasycznym przykładem przestrzeni wektorowej jest Rn nad ciałem R. Elementami tej przestrzeni
są n-tki (zwane również krotkami lub po prostu wektorami) postaci x = (x1 , x2 , . . . xn ), gdzie xi ∈ R są liczbami
rzeczywistymi. Sumę x = (x1 , x2 , . . . xn ) i y = (y1 , y2 , . . . yn ) definiuje się wzorem
x + y := (x1 + y1 , x2 + y2 , . . . xn + yn ),
a mnożenie wektora x przez skalar α ∈ R wzorem
αx := (αx1 , αx2 , . . . αxn ).
Łatwo sprawdzić, że jest to rzeczywiście przestrzeń wektorowa. W podobny sposób konstruujemy przestrzeń wektorową
F n dla dowolnego ciała F , na przykład dla ciała liczb zespolonych.
Przykład 14.1.3 Niech A będzie dowolnym ustalonym zbiorem. Niech F (A, R) oznacza zbiór wszystkich funkcji
f : A → R. Dla f, g ∈ F (A, R) definiujemy sumę f + g jako funkcję
f + g : A 3 x 7→ f (x) + g(x) ∈ R,
a mnożenie funkcji f przez skalar α ∈ R jako funkcję
αf : A 3 x 7→ αf (x) ∈ R.
Łatwo sprawdzić, że jest to rzeczywiście przestrzeń wektorowa. Jeśli X jest przestrzenią topologiczną, to w podobny
sposób konostruujemy przestrzeń funkcji ciągłych z X do R oznaczaną jako C(A, R)
Przykład z przestrzenią wektorową funkcji ograniczonych sygnalizuje, że pożytki ze stosowania tego pojęcia mogą wykraczać poza wektory na płaszczyźnie i ich uogólnienia na Rn . W istocie, można pokazać, że przestrzeń B(A) nie jest
izomorficzna z przestrzenią Rn dla żadnego n.
14.2
Przestrzenie wektorowe z iloczynem skalarnym
Poprzez interpretacj˛e wektorów na płaszczyźnie jako liczb zespolonych wiemy, że można je nie tylko dodawać, ale i mnożyć z zachowaniem własności ciała.
Uzyskanie struktury ciała dla wektorów w przestrzeni trówymiarowej i wyższych wymiarach nie jest możliwe. Natomiast bardzo pożyteczny jest iloczyn skalarny.
Jest to odwzorowanie, które parze wektorów (v, w) przyporzadkowuje
˛
liczb˛e v · w b˛edac
˛ a˛ iloczynem długości wektora w przez długość rzutu prostopadłego
wektora v na prosta,˛ w której zawiera si˛e wektor w, wzi˛eta ze znakiem plus, jeśli kat˛ mi˛edzy wektorami jest ostry i znakiem minus w przeciwnym razie. Łatwo
sprawdzić, że tak zdefiniowany iloczyn skalarny jest przemienny i wyraża si˛e wzorem
v · w = |v||w| cos α
gdzie |v| i |w| oznaczaja˛ długości wektorów v i w, a α jest katem
˛
pomi˛edzy nimi. Ze wzoru tego wynikaja˛ od razu najważniejsze własności iloczynu skalarnego:
wektory v i w sa˛ prostopadłe wtedy i tylko wtedy gdy v · w = 0 oraz v · v = |v|2 .
W praktyce wygodne jest przyj˛ecie aksjomatycznej definicji iloczynu skalarnego.
14.2.1
Iloczyn skalarny
14.3. PRZESTRZENIE WEKTOROWE UNORMOWANE
215
Definicja 14.2.1 Niech X będzie przestrzenią wektorową nad R. Odwzorowanie ϕ : X × X → R nazywamy iloczynem
skalarnym jeżeli dla wszystkich x, y, z ∈ X oraz α ∈ R spełnione są następujące warunki:
(IS1) ϕ(x + y, z) = ϕ(x, z) + ϕ(y, z),
(IS2) ϕ(αx, y) = αϕ(x, y),
(IS1) ϕ(x, y) = ϕ(y, x),
(IS1) ϕ(x, x) 0 i ϕ(x, x) = 0 ⇔ x = 0.
Iloczynem skalarnym w Rd jest odwzorowanie
(x1 , x2 , . . . , xd ), (y1 , y2 , . . . , yd ) 7→
d
X
xi yi .
i=1
Wzór na iloczyn skalarny w Rd jest podstawa˛ definiowania ilocznu skalarnego w innych przestrzeniach. W szczególności w pewnych przestrzeniach ciagów
˛
Rb
P∞
iloczynem skalarnym jest i=1 xi yi , a w pewnych przestrzeniach funkcyjnych iloczynem skalarnym jest a f (x)g(x)dx.
14.2.2
Nierówność Cauchy-Schwartza
Twierdzenie 14.2.2 (Nierówność Cauchy-Schwartza) Niech X będzie przestrzenią wektorową nad R z iloczynem
skalarnym ϕ. Dla dowolnych x, y ∈ X mamy
p
p
|ϕ(x, y)| ¬ ϕ(x, x) ϕ(y, y).
Dowód: Rozważmy funkcję
µ : R 3 t 7→ ϕ(x + ty, x + ty) ∈ [0, ∞).
Wykorzystując własności iloczynu skalarnego dostajemy dla dowolnego t ∈ [0, ∞)
0 ¬ µ(t) = t2 ϕ(x, x) + 2tϕ(x, y) + ϕ(y, y).
Zatem wyróżnik w tej nierówności kwadratowej musi być niedodatni, tj.
4ϕ(x, y)2 − 4ϕ(x, x)ϕ(y, y) ¬ 0
co dowodzi tezy.
Wniosek 14.2.3 Dla (x1 , x2 , . . . , xd ), (y1 , y2 , . . . , yd ) ∈ Rd mamy
v
v
u d
u d
d
uX uX
X
t
2
|
xi yi | ¬
xi t
yi2 .
i=1
14.3
i=1
i=1
Przestrzenie wektorowe unormowane
W przestrzeniach wektorowych przydałoby się pojęcie odległości, tak byśmy mogli nadać jej strukturę przestrzeni metrycznej
i rozważać zbiory otwarte i domknięte oraz granice. Jeśli mamy do dyspozycji koncepcję długości wektora, to odległość dwóch
wektorów można zdefiniować jako długość ich różnicy. Dlatego przydałaby się aksjomatyczna definicja długości wektora, która
gwarantowałaby, że wydobyć z niej można odległość.
216
ROZDZIAŁ 14. PRZESTRZENIE WEKTOROWE
14.3.1
Norma
Definicja 14.3.1 Niech X będzie przestrzenią wektorową nad R. Odwzorowanie || · || : X → R∗ nazywamy normą w
X jeżeli dla wszystkich x, y ∈ X oraz α ∈ R
(N1) ||x|| = 0 ⇔ x = 0,
(N2) ||αx|| = |α| ||x||,
(N3) ||x + y|| ¬ ||x|| + ||y||.
Twierdzenie 14.3.2 Jeśli ϕ jest iloczynem skalarnym w przestrzeni wektorowej X, to
p
||x||ϕ := ϕ(x, x)
zadaje w tej przestrzeni normę.
Dowód: Własności (N1) i (N2) są oczywiste. Aby sprawdzić własność (N3) zauważmy, że
p
p
||x + y||2ϕ = ϕ(x + y, x + y) = ϕ(x, x) + 2ϕ(x, y) + ϕ(y, y) ¬ ϕ(x, x) + 2 ϕ(x, y) ϕ(x, y) + ϕ(y, y) = (||x||ϕ + ||y||ϕ )2
14.3.2
Norma euklidesowa
Definicja
14.3.3 Normę w Rd pochodzącą od iloczynu skalarnego
qP
d
2
i=1 xi nazywamy normą euklidesową.
Pd
i=1
xi yi , tj. normę daną wzorem ||x|| :=
W Rd zadać można również normy nie pochodzące od iloczynu skalarnego, na przykład normą jest ||x||1 :
Pd
i=1
|xi |.
Definicja 14.3.4 Przestrzeń wektorową nad ciałem F z zadaną normą nazywamy przestrzenią wektorową unormowaną. Klasę takich przestrzeni oznaczać będziemy NVect(F ).
14.3.3
Przestrzenie Hilberta i Banacha
Twierdzenie 14.3.5 Niech ||.|| będzie normą w przestrzeni wektorowej X. Wtedy wzór
ρ(x, y) := ||x − y||
określa w X metrykę.
14.3. PRZESTRZENIE WEKTOROWE UNORMOWANE
217
Rysunek 14.1: Stefan Banach, 1892 - 1945
Definicja 14.3.6 Przestrzeń wektorową z iloczynem skalarnym, zupełną nazywamy przestrzenią Hilberta. Przestrzeń
wektorową unormowaną, zupełną nazywamy przestrzenią Banacha.
Poj˛ecie przestrzeni Hilberta i przestrzeni Banacha pozwala metody opracowane dla przestrzeni Rn stosować w przestrzeniach funkcyjnych. Sa˛ to różnego
rodzaju przestrzenie, w których rol˛e wektorów pełnia˛ funkcje.
218
ROZDZIAŁ 14. PRZESTRZENIE WEKTOROWE
Rozdział 15
Pochodne i różniczki.
15.1
Pochodna funkcji
15.1.1
Definicja pochodnej
W rozdziale wst˛epnym wprowadziliśmy intuicyjna˛ koncepcj˛e pochodnej funkcji f : R → R w punkcie x0 jako współczynnika kierunkowego nachylenia stycznej
do wykresu poprowadzonej w punkcie (x0 , f (x0 )). Współczynnik kierunkowy prostej w układzie współrz˛ednych x i y to tangens kata
˛ jaki tworzy ta prosta z osia˛
x. Łatwo jest policzyć ten współczynnik dla siecznej poprowadzonej przez punkty (x0 , f (x0 )) i (x1 , f (x1 )). Z rysunku 15.1 wnosimy, że tangens ten to iloraz
f (x1 ) − f (x0 )
,
x1 − x0
zwany ilorazem różnicowym. Ustalajac
˛ x0 i przybliżajac
˛ x1 do x0 przybliżamy sieczna˛ do stycznej w (x0 , f (x0 )). Można zatem oczekiwać, że współczynnik
kierunkowy siecznej zmierza do współczynnika kierunkowego stycznej. Niech h := x1 − x0 b˛edzie przyrostem zmiennej x wzgl˛edem punktu x0 . Iloraz
różnicowy można wtedy zapisać jako
f (x0 + h) − f (x0 )
,
h
a współczynnik kierunkowy stycznej w (x0 , f (x0 )) jako
lim
h→0
f (x0 + h) − f (x0 )
h
(15.1)
co prowadzi do definicji pochodnej funkcji f w punkcie x0 .
Choć powyższa interpretacja dotyczy funkcji o wartościach w zbiorze liczb rzeczywistych, granica (15.1) ma sens również wtedy, gdy funkcja f ma wartości
w przestrzeni wektorowej Rm , zatem nasza formalna definicja b˛edzie nieco ogólniejsza.
Niech f : (a, b) → Rm będzie funkcją określoną na przedziale otwartym (a, b) ⊂ R o wartościach w Rm . Ustalmy punkt
x0 ∈ (a, b)
Definicja 15.1.1 Mówimy, że funkcja f jest różniczkowalna w punkcie x0 jeżeli w Rm istnieje granica
lim
h→0
f (x0 + h) − f (x0 )
.
h
Granicę tę nazywamy pochodną funkcji f w punkcie x0 i oznaczamy f 0 (x0 ). Jeśli f ma pochodną w każdym punkcie
x ∈ (a, b) to mówimy, że f jest różniczkowalna na przedziale (a, b) i definiujemy również funkcję
f 0 : (a, b) 3 x 7→ f 0 (x) ∈ Rm ,
którą nazywamy funkcją pochodną funkcji f .
219
220
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Rysunek 15.1: Styczna i sieczna do krzywej.
Pochodzenie określenia "różniczkowalna" wyjaśnimy w rozdziale 15.2.4.
15.1.2
Pochodna funkcji stałej i identycznościowej.
Twierdzenie 15.1.2 (o pochodnej funkcji stałej) Funkcja stała
cR : (∞, ∞) 3 x 7→ c ∈ R.
ma pochodną w każdym punkcie oraz
(cR )0 = 0R
co czasami zapisujemy mniej formalnie, ale krócej jako
c0 = 0.
Dowód: Rzeczywiście, dla funkcji stałej iloraz różnicowy wynosi
cR (x + h) − cR (x)
c−c
=
= 0,
h
h
więc granica ilorazu różnicowego jako granica funkcji stale równej zero wynosi zero. Dowodzi to naszej tezy.
15.1. POCHODNA FUNKCJI
221
Twierdzenie 15.1.3 (o pochodnej identyczności) Funkcja identycznościowa
idR : R 3 x 7→ x ∈ R.
ma pochodną w każdym punkcie oraz
(idR )0 = 1R
co czasami zapisujemy mniej formalnie, ale krócej jako
x0 = 1.
Dowód: Dla funkcji identycznościowej iloraz różnicowy wynosi
idR (x + h) − idR (x)
(x + h) − x
h
=
= = 1,
h
h
h
więc granica ilorazu różnicowego jako granica funkcji stale równej jeden wynosi jeden. Dowodzi to naszej tezy.
Przykład 15.1.4 Rozważmy funkcję
f : R 3 x 7→ |x| ∈ R.
Jeśli x jest dodatnie, to dla dostatecznie małych h również x + h jest dodatnie, zatem wtedy |x| = x, |x + h| = x + h
czyli w tym przypadku iloraz różnicowy wynosi
|x + h| − |x|
(x + h) − x
h
f (x + h) − f (x)
=
=
= = 1.
h
h
h
h
Jeśli x jest ujemne, to dla dostatecznie małych h również x + h jest ujemne, zatem wtedy |x| = −x, |x + h| = −x − h
czyli w tym przypadku iloraz różnicowy wynosi
f (x + h) − f (x)
|x + h| − |x|
(−x − h) − (−x)
−h
=
=
=
= −1.
h
h
h
h
Dla x = 0 iloraz różnicowy może wynosić tak jeden jak i minus
Podsumowując,


−1
0
f (x) = nie istnieje


1
15.1.3
jeden, w zależności od znaku h, więc nie ma granicy.
gdy x < 0,
gdy x = 0,
gdy x > 0.
Pochodna lewo- i prawostronna.
Ostatni przykład podpowiada, że, podobnie jak w przypadku granicy, warto też rozważać pochodne lewo- i prawostronne.
Niech f : [a, b] → Rm będzie funkcją określoną na przedziale domkniętym [a, b].
222
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Definicja 15.1.5 Niech x0 ∈ (a, b]. Mówimy, że f ma pochodną lewostronną w x0 jeśli w Rm istnieje granica lewostronna
f (x0 + h) − f (x0 )
lim−
.
(15.2)
h
h→0
0
Granicę tę nazywamy pochodną lewostronną funkcji f w x0 i oznaczamy f−
(x0 ). Podobnie, jeśli x0 ∈ [a, b) to mówimy,
m
że f ma pochodną prawostronną w x0 jeśli w R istnieje granica prawostronna
f (x0 + h) − f (x0 )
.
h
lim
h→0+
(15.3)
0
Granicę tę nazywamy pochodną prawostronną funkcji f w x0 i oznaczamy f+
(x0 ).
Przykład 15.1.6 Funkcja f w przykładzie 15.1.4 ma w zerze pochodną lewostronną równą -1 oraz pochodną prawostronną równą 1.
Ćwiczenie 15.1.7 Pokaż, że funkcja f : (a, b) → Rm ma w punkcie x0 ∈ (a, b) pochodną wtedy i tylko wtedy gdy
ma w tym punkcie tak pochodną lewostronną jak i prawostronną i są one sobie równe.
W dalszym ciągu wygodnie będzie również rozważać różniczkowalność funkcji określonej na przedziale domkniętym.
Definicja 15.1.8 Mówimy, że funkcja f : [a, b] → Rm jest różniczkowalna jeśli ma pochodną w każdym punkcie
przedziału (a, b), pochodną prawostronną w a i pochodną lewostronną w b.
W przypadku funkcji różniczkowalnej f : [a, b] → Rm wygodnie jest mówić krótko o pochodnej f w a i w b rozumiejąc
przez to odpowiednio pochodną prawostronną w a i lewostronną w b.
15.1.4
Ciągłość funkcji różniczkowalnej
W dalszych rozdziałach podamy szereg twierdzeń gwarantujących istnienie pochodnej, co pozwoli nam konstruować znacznie
bardziej zaawansowane przykłady. Na koniec tego rozdziału podajmy następujące twierdzenie określające warunek konieczny
istnienia pochodnej.
Twierdzenie 15.1.9 Jeśli funkcja f : (a, b) → Rm ma w punkcie x0 ∈ (a, b) pochodną to jest w tym punkcie ciągła.
Dowód: Aby pokazać ciągłość f w x0 ustalmy > 0. Na mocy definicji pochodnej istnieje granica
lim
h→0
f (x0 + h) − f (x0 )
.
h
Z definicji granicy dla 0 = 1 znajdziemy δ 0 > 0 takie, że jeśli h ∈ (−δ 0 , δ 0 ) to
f (x0 + h) − f (x0 )
0
− f (x0 ) < 1.
h
W szczególności
f (x0 + h) − f (x0 ) f (x0 + h) − f (x0 )
0
¬
− f (x0 ) + |f 0 (x0 )| < 1 + |f 0 (x0 )|.
h
h
(15.4)
Weźmy δ := min(δ 0 , 1+|f 0 (x0 )| ). Z (15.4) dla h ∈ (−δ, δ) mamy
|f (x0 + h) − f (x0 )| < (1 + |f 0 (x0 )|)|h| ¬ co pokazuje, że limh→0 f (x) = f (x0 ) i dowodzi, że f jest ciągła w x0 .
15.2. RÓŻNICZKA FUNKCJI
223
Rysunek 15.2: Aproksymacja liniowa funkcji f w punkcie (x0 , f (x0 )) w lokalnym układzie współrzędnych (x̄, ȳ).
Ćwiczenie 15.1.10 Uogólnić twierdzenie 15.1.9 na przypadek funkcji f : [a, b] → Rm .
15.2
Różniczka funkcji
15.2.1
Aproksymacja liniowa
Interpretacja pochodnej jako współczynnika kierunkowego nachylenia stycznej w danym punkcie do wykresu nie jest jedyna˛ użyteczna˛ intuicja˛ w tym kontekście.
Poj˛ecie pochodnej wiaże
˛ si˛e również z idea˛ przybliżania funkcji funkcja˛ liniowa.˛
Definicja 15.2.1 Funkcja liniowa R → Rn jednej zmiennej to funkcja postaci
R 3 t 7→ tv ∈ Rn
dla ustalonego v ∈ Rn . Wektor v (liczbę w przypadku n = 1) nazywać będziemy współczynnikiem funkcji liniowej
jednej zmiennej.
Funkcję taką oznaczać będziemy Lv , lub krótko L, jeśli współczynnik v jest nieistotny. Łatwo sprawdzić, że funkcja
liniowa jest ciągła i w zerze ma wartość zero.
Uwaga 15.2.2 Jeśli L : R → Rm jest funkcją liniową, to L = Lv dla v = L(1). Innymi słowy wartość funkcji liniowej
dla argumentu jeden jest równa jej współczynnikowi.
Funkcja liniowa daje si˛e bardzo prosto wyliczać, wi˛ec jest dobrym kandydatem na przybliżanie (lokalne) innych funkcji. Idea jest nast˛epujaca.
˛ Wiemy, że
pewna funkcja f ma w punkcie x0 wartość y0 := f (x0 ). Interesuje nas wartość funkcji f w punkcie x1 bliskm x0 , czyli y1 := f (x1 ). Czy dysponujac
˛
przyrostem zmiennej x, czyli róznica˛ x1 − x0 , możemy przy pomocy pewnej funkcji liniowej wyliczyć przybliżenie przyrostu zmiennej y , czyli różnic˛e y1 − y0 =
f (x1 ) − f (x0 )? Podkreślmy, że chodzi nam o funkcj˛e liniowa˛ w układzie współrz˛ednych przesuni˛etym do punktu (x0 , y0 ), a wi˛ec w układzie (x̄, ȳ), gdzie
x̄ := x − x0 , ȳ := y − y0 , zwanym lokalnym układem współrz˛ednych wzgl˛edem punktu (x0 , y0 ). Zwróćmy uwag˛e, że punkt o współrz˛ednych (x0 , y0 ) w
lokalnym układzie współrz˛ednych ma współrz˛edne (0, 0). Nasze pytanie można wi˛ec sformułować nast˛epujaco
˛ (rys. 15.2):
224
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Czy istnieje funkcja liniowa L w lokalnym układzie współrz˛ednych (x̄, ȳ), taka że
y1 − y0 ≈ ȳ = L(x̄) = L(x1 − x0 )?
Zwróćmy uwag˛e, że to pytanie należy uściślić. Jeśli przybliżenie rozumieć b˛edziemy jako wymóg, by w granicy, przy x → x0 , popełniony bład,
˛ czyli wyrażenie
y1 − y0 − L(x1 − x0 ) = f (x1 ) − f (x0 ) − L(x1 − x0 )
zmierzało do zera, to wymóg ten spełni każda funkcja liniowa, bo jako ciagła
˛ ma w zerze granic˛e równa˛ wartości, czyli zero. Naturalne jest jednak oczekiwanie, że
im bliżej znajdziemy si˛e x0 , tym przybliżenie b˛edzie lepsze.
Miara˛ jakości przybliżenia jest bład
˛ wzgl˛edem przyrostu x̄ = x1 − x0 mierzony ilorazem
f (x0 + x̄) − f (x0 ) − L(x̄)
y1 − y0 − L(x1 − x0 )
=
.
x1 − x0
x̄
Chcemy, by ten bład
˛ zmierzał do zera przy x̄ → 0. Niech L = Lv . Przy użyciu bardziej tradycyjnego oznaczenia h w miejsce x̄, nasz wymóg można zapisać
jako
lim
h→0
f (x0 + h) − f (x0 ) − hv
= 0,
h
co jak łatwo sprawdzić, sprowadza si˛e do żadania,
˛
by
f (x0 + h) − f (x0 )
= v.
h
Tak wi˛ec, jeśli stosowne przybliżenie liniowe istnieje, to współczynnik v jest pochodna˛ funkcji w punkcie x0 .
lim
h→0
Czasami wygodnie jest patrzeć na problem sprowadzony do zera. Jak widzieliśmy wygodnie jest przesunać
˛ układ współrz˛ednych tak, by interesujacy
˛ nas
punkt był w poczatku
˛ układu. Wygodnie jest też sprowadzić definiowania pochodnej do definiowania pochodnej równej zero. Z naszych wcześniejszych rozważań
wynika, że pochodna równa zero oznacza, że przybliżajaca
˛ funkcja liniowa ma współczynnik v równy zero. Funkcja liniowa z R do R o współczynniku zero ma
wykres b˛edacy
˛ linia˛ pozioma˛ przechodzac
˛ a˛ przez poczatek
˛ układu współrz˛ednych. Z drugiej strony, jeśli pochodna wynosi zero, to mamy
f (x0 + h) − f (x0 )
= 0.
h→0
h
lim
Zwrócmy uwag˛e, że funkcja,˛ której granic˛e tu rozważamy jest ϕ : h 7→ f (x0 + h) − f (x0 ), gdzie x0 traktujemy jako parametr. Przy tych oznaczeniach mamy
ϕ(h)
= 0.
h→0 h
lim
Z definicji granicy wiemy, że wtedy dla dowolnego > 0 istnieje δ > 0 taka, że dla |h| < δ mamy
ϕ(h) h <
lub równoważnie
|ϕ(h)| < |h|.
Funkcj˛e o tej własności nazywamy płaska˛ w zerze. Poj˛ecie to wyjaśnia rysunek 15.3.
Używajac
˛ j˛ezyka funkcji płaskich w zerze możemy powiedzieć, że f 0 (x) = a wtedy i tylko wtedy gdy funkcja
h 7→ f (x + h) − f (x) − ah
jest płaska w zerze. Jest tak, bo dla h = 0 mamy
f (x + 0) − f (x) − a · 0 = 0,
a, jak niebawem b˛edziemy w stanie policzyć formlnie, pochodna tej funkcji w zerze wynosi f 0 (x) − a.
15.2. RÓŻNICZKA FUNKCJI
225
Rysunek 15.3: Funkcja płaska w zerze. Każdy ze stożków po zawężeniu do stosownego otocznia zera zawiera fragment
wykresu.
15.2.2
Relacja "o małe"
Aby sformalizować opisane w poprzednim podrozdziale intuicje zaczniemy od podania definicji relacji "o małe", która przyda
się nie tylko w podaniu formalnej definicji płaskości w zerze, ale również w następnych rozdziałach.
Rozważmy f : (a, b) → Rm i g : (a, b) → R. Załóżmy ponadto, że istnieje V otoczenie x0 takie, że g(x) 6= 0 dla
x ∈ V \ {x0 }. Stawiamy definicję ogólną, ale warto zaznaczyć, że na początku interesować nas będzie głównie przypadek
szczególny gdy g jest funkcją identycznościową, t.j. gdy g(x) = x.
Definicja 15.2.3 Mówimy, że funkcja f jest o małe od funkcji g w otoczeniu punktu x0 i piszemy
f (x) = o(g(x)) przy x → x0 ,
jeżeli
∀ > 0 ∃δ > 0
|x − x0 | < δ ⇒ ||f (x)|| < |g(x)|.
Następującą uwagę można wywnioskować wprost z definicji granicy.
Uwaga 15.2.4 Relacja f (x) = o(g(x)) przy x → x0 zachodzi wtedy i tylko wtedy gdy
f (x0 ) = 0 i lim
x→x0
||f (x)||
= 0.
|g(x)|
Z uwagi tej łatwo wyprowadzić następujący wniosek
Wniosek 15.2.5 Relacja f (x) = o(g(x)) przy x → x0 zachodzi wtedy i tylko wtedy gdy istnieje funkcja ciągła ϕ : V →
Rm taka, że ϕ(x0 ) = 0 oraz f (x) = ϕ(x)g(x) dla x ∈ V .
Dowód: Wystarczy przyjąć
(
ϕ(x) :=
f (x)
g(x)
dla x 6= 0,
0
dla x = 0.
Z kolei z twierdzenia o granicy sumy i różnicy natychmiast dostajemy następujący wniosek.
226
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Wniosek 15.2.6 Jeśli istnieje V otoczenie x0 takie, że g(x) 6= 0 dla x ∈ V \ {x0 } oraz funkcje fi : R−→
◦ R spełniają
fi (x) = o(g(x)) przy x → x0 to również (f1 + f2 )(x) = o(g(x)) i (f1 − f2 )(x) = o(g(x)) przy x → x0
15.2.3
Płaskość w zerze
Podamy teraz formalną definicję płaskości funkcji w zerze. Niech f : (a, b) → Rm będzie funkcją o wartościach w Rm ,
określoną na przedziale otwartym (a, b) ⊂ R takim, że 0 ∈ (a, b).
Definicja 15.2.7 Mówimy, że f jest płaska w zerze jeżeli f (x) = o(x) przy x → 0.
Następująca uwaga wynika wprost z uwagi 15.2.4.
Uwaga 15.2.8 Funkcja f jest płaska w zerze wtedy i tylko wtedy gdy f (0) = 0 oraz
lim
x→0
f (x)
= 0.
x
Jeśli f jest płaska w zerze, to funkcja ϕ : (a, b) → Rm zdefiniowana wzorem
(
f (x)
gdy x 6= 0,
x
ϕ(x) :=
0
dla x = 0.
jest ciągła w zerze oraz f (x) = xϕ(x). Łatwo sprawdzić, że również na odwrót, jeśli funkcja ϕ o takich własnościach istnieje,
to f jest płaska w zerze. Mamy zatem następującą uwagę.
Uwaga 15.2.9 Funkcja f jest płaska w zerze wtedy i tylko wtedy gdy istnieje funkcja ϕ : (a, b) → Rm ciągła w zerze
taka, że ϕ(0) = 0 oraz f (x) = xϕ(x) dla x ∈ (a, b).
15.2.4
Różniczkowalność
Wróćmy teraz do idei przybliżania przyrostu funkcji funkcja˛ liniowa.˛ Wprowadźmy tradycyjne oznaczenia na przyrost wartości argumentu i przyrost wartości funkcji
(różnice) w punkcie x0 :
∆x := x − x0 ,
∆y
:= f (x) − f (x0 ).
Niech L = Lf 0 (x0 ) b˛edzie funkcja˛ liniowa˛ przybliżajac
˛ a˛ w loklanym układzie współrz˛ednych przyrost funkcji f . Wtedy
∆y ≈ L(∆x) = f 0 (x0 )∆x,
(15.5)
przy czym popełniony bład
˛ wzgl˛edny jest tym mniejszy im mniejsze jest ∆x. Leibniz nie dysponował precyzyjnym aparatem i mówił, że jeśli ∆x jest nieskończenie
małe, to przybliżona równość (15.5) staje si˛e równościa.˛ Takie nieskończenie małe różnice ∆x i ∆y nazywał różniczkami (malusieńkimi różnicami) i oznaczał
dy i dx. Używajac
˛ jego j˛ezyka napisalibyśmy, że różniczki dx i dy spełniaja˛ równanie
dy = f 0 (x)dx.
(15.6)
Problem w tym, że różniczki jako wielkości nieskończenie małe trudno jest precyzyjnie zdefiniować. Poj˛ecie różniczki odczarował A. Cauchy, traktujac
˛ równanie
(15.6) jako równanie odwzorowania liniowego przybliżajacego
˛
przyrost funkcji, a sama˛ różniczk˛e definiujac
˛ jako to przybliżajace
˛ odwzorowanie liniowe. I tak do
dziś rozumiemy różniczk˛e. Natomiast termin różniczkowalność, ze wzgl˛edu na bezpośredni zwiazek
˛ pomi˛edzy różniczka˛ i pochodna,˛ jest odnoszony zarówno do
istnienia pochodnej jak i różniczki, bo, jak zobaczymy, sa˛ to fakty równoważne.
15.2. RÓŻNICZKA FUNKCJI
227
Jak poprzednio, niech f : (a, b) → Rm będzie funkcją określoną na przedziale otwartym (a, b) ⊂ R o wartościach w Rm .
Rozważmy przyrost funkcji f w punkcie x0 ∈ (a, b), t.j. funkcję ∆x0 f : (a − x0 , b − x0 ) → Rm określoną wzorem
∆x0 f (h) := f (x0 + h) − f (x0 ).
Definicja 15.2.10 Funkcję f nazywamy różniczkowalną w punkcie x0 jeżeli istnieje funkcja liniowa L : R → Rm taka,
że funkcja ∆x0 f − L, czyli różnica funkcji ∆x0 f i funkcji L jest płaska w zerze. Odwzorowanie L nazywamy wtedy
różniczką funkcji f w punkcie x0 i oznaczamy dx0 f .
Aby powyższa definicja miała sens, musimy wiedzieć, że różniczka jest wyznaczona jednoznacznie. W istocie różniczka
jest wyznaczona przez pochodną, jak pokazuje następujące rozumowanie. Jeśli L jest różniczką fukcji f w punkcie x0 to z
płaskości w zerze funkcji ∆x0 f − L wnosimy, że
lim
h→0
∆x0 f (h) − L(h)
= 0.
h
Ponieważ L(h) = L(1)h, jest to równoważne warunkowi
∆x0 f (h)
− L(1) = 0
h→0
h
lim
oraz warunkowi
∆x0 f (h)
= L(1).
h→0
h
lim
Ponieważ ∆x0 f (h) = f (x0 + h) − f (x0 ), powyższa granica pokrywa się z granicą (15.1). Pokazaliśmy zatem następującą
uwagę.
Uwaga 15.2.11 Funkcja liniowa L : R → Rm jest różniczką funkcji f w punkcie x0 wtedy i tylko wtedy gdy L(1) jest
pochodną tej funkcji w punkcie x0 . W szczególności f jest różniczkowalna w puncie x0 wtedy i tylko wtedy gdy f ma
pochodną w punkcie x0 .
Tak więc, jeśli odwzorowanie liniowe L spełniające wymogi definicji 15.2.10 istnieje, to współczynnik L(1), a zatem i samo
odwzorowanie L są wyznaczone jednoznacznie.
Z uwagi 15.2.11 wynika, że stwierdzenia "f jest różniczkowalna" i "f ma pochodna"˛ moga˛ być używane zamiennie. Jednak poj˛ecia różniczki i pochodnej nie
sa˛ tożsame, choć sa˛ ściśle powiazane:
˛
wartość różniczki dla argumentu jeden jest pochodna.˛ Różniczka jest odwzorowaniem liniowym, które przemnaża argument
przez pochodna.˛ Koncepcja różniczki bazuje na aproksymacji liniowej funkcji w punkcie. Koncepcja pochodnej bazuje na stycznej do wykresu funkcji w punkcie.
Zwiazek
˛ mi˛edzy różniczka,˛ a pochodna˛ można wi˛ec też wyrazić stwierdzajac,
˛ że wykres aproksymacji liniowej funkcji f w zadanym punkcie jest prosta,˛ która
pokrywa si˛e ze styczna˛ do wykresu funkcji f w tym punkcie.
Zauważmy, że jeśli funkcja jest płaska w zerze, to ma pochodną w zerze równą zero. Rzeczywiście, na mocy uwagi 15.2.8
jeśli f jest płaska w zerze, to f (0) = 0 oraz limx→0 f (x)
x = 0. Tę ostanią granicę można przepisać jako
0 = lim
x→0
f (x)
f (0 + h) − f (0)
= lim
h→0
x
h
co oznacza, że f ma w zerze pochodną zero. Łatwo zauważyć, że można przeprowadzić również odwrotne wnioskowanie.
Prowadzi to do następującej uwagi.
Uwaga 15.2.12 Niech f : R−→
◦ Rm będzie funkcją określoną w otoczeniu zera. Funkcja f jest płaska w zerze wtedy i
tylko wtedy gdy f (0) = 0 i f 0 (0) = 0.
228
15.3
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Różniczkowanie sumy, różnicy, iloczynu i ilorazu
Naturalne jest pytanie czy znając pochodną dwóch funkcji możemy wyznaczyć pochodną sumy, różnicy, iloczynu i ilorazu
tych funkcji. Jest tak w istocie, jak pokazują następujące twierdzenia.
Twierdzenie 15.3.1 (o pochodnej sumy i różnicy) Niech f, g : (a, b) → Rm będą różniczkowalne w punkcie
x0 ∈ (a, b). Wtedy funkcje f + g i f − g są różniczkowalne w x0 oraz
(f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 )
i
(f − g)0 (x0 ) = f 0 (x0 ) − g 0 (x0 ).
Dowód: Iloraz różnicowy dla sumy f + g to
f (x0 + h) − f (x0 ) g(x0 + h) − g(x0 )
(f + g)(x0 + h) − (f + g)(x0 )
=
+
.
h
h
h
Ponieważ
lim
h→0
f (x0 + h) − f (x0 )
= f 0 (x0 )
h
i
lim
h→0
(15.7)
g(x0 + h) − g(x0 )
= g 0 (x0 ),
h
więc z (15.7) wnosimy, że
(f + g)(x0 + h) − (f + g)(x0 )
= f 0 (x0 ) + g 0 (x0 ),
h
co dowodzi tezy dla sumy. Dla różnicy dowód jest analogiczny.
Twierdzenie o pochodnej iloczynu przedstawimy dla funkcji o wartościach w zbiorze liczb zespolonych C. Oczywiście
twierdzenie to obejmuje również przypadek funkcji o wartościach rzeczywistych, bo zbiór liczb rzeczywistych traktujemy jako
podzbiór zbioru liczb zespolonych. Jako ćwiczenie zostawimy przypadek, gdy jedna funkcja przyjmuje wartości skalarne, a
druga wektorowe, a iloczyn funkcji jest rozumiany jako mnożenie skalara przez wektor oraz przypadek, gdy obie funkcje są
wektorowe, a iloczyn jest rozumiany jako iloczyn skalarny wektorów.
lim
h→0
Twierdzenie 15.3.2 (o pochodnej iloczynu) Niech f, g : (a, b) → C będą różniczkowalne w punkcie x0 ∈ (a, b).
Wtedy funkcja f g jest różniczkowalna w x0 oraz
(f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ).
Dowód: Iloraz różnicowy dla iloczynu f g to
(f g)(x0 + h) − (f g)(x0 )
h
=
=
=
f (x0 + h)g(x0 + h) − f (x0 )g(x0 )
h
f (x0 + h)g(x0 + h) − f (x0 + h)g(x0 ) + f (x0 + h)g(x0 ) − f (x0 )g(x0 )
h
g(x0 + h) − g(x0 ) f (x0 + h) − f (x0 )
f (x0 + h)
+
g(x0 )
h
h
Funkcja f jako różniczkowalna w x0 jest również ciągła w x0 , więc
g(x0 + h) − g(x0 ) f (x0 + h) − f (x0 )
+
g(x0 ) = f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 ).
lim f (x0 + h)
h→0
h
h
Zatem z otrzymanego wyżej przedstawienia ilorazu różnicowego dla iloczynu również
(f g)0 (x0 ) = lim
h→0
(f g)(x0 + h) − (f g)(x0 )
= f (x0 )g 0 (x0 ) + f 0 (x0 )g(x0 )
h
15.3. RÓŻNICZKOWANIE SUMY, RÓŻNICY, ILOCZYNU I ILORAZU
229
co dowodzi naszej tezy.
Z twierdzenia o pochodnej iloczynu i z faktu, że pochodna funkcji stałej wynosi zero dostajemy natychmiast następujący
wniosek.
Wniosek 15.3.3 Niech f : (a, b) → C będzie różniczkowalne w punkcie x0 ∈ (a, b) i niech c ∈ C będzie stałą. Wtedy
funkcja cf jest różniczkowalna w x0 oraz
(cf )0 (x0 ) = cf 0 (x0 ).
Z twierdzenia o pochodnej iloczynu wyprowadzimy też następujące twierdzenie
Twierdzenie 15.3.4 (o pochodnej funkcji potęgowej) Niech n ∈ N0 będzie ustaloną liczbą naturalną. Funkcja
potęgowa
R 3 x 7→ xn ∈ R
jest różniczkowalna. Jej pochodną jest funkcja
R 3 x 7→ nxn−1 ∈ R
co zapisujemy mniej formalnie, ale krócej jako
(xn )0 = nxn−1 .
Dowód: Dowód poprowadzimy indukcyjnie względem n. Dla n ∈ {0, 1} twierdzenie wynika natychmiast z twierdzeń 15.1.2 i 15.1.3. Załóżmy, że n > 1 oraz że twierdzenie zachodzi dla k < n. Funkcja x 7→ xn jest wtedy iloczynem
funkcji identycznościowej oraz funkcji x 7→ xn−1 . Z założenia indukcyjnego mamy 0 xn−1 )0 = (n − 1)xn−2 , bo n − 1 < n.
Zatem z twierdzenia o pochodnej iloczynu mamy
(xn )0 = (xxn−1 )0 = x0 xn−1 + x(n − 1)xn−2 = nxn−1
co dowodzi tezy.
Ćwiczenie 15.3.5 Niech α : (a, b) → R i f : (a, b) → Rm będą różniczkowalne w x0 ∈ (a, b). Pokaż, że funkcja
αf : (a, b) 3 x 7→ α(x)f (x) ∈ Rm
jest różniczkowalna w x0 oraz
(αf )0 (x0 ) = α0 (x0 )f (x0 ) + α(x0 )f 0 (x0 ).
Wyprowadź stosowny wniosek gdy funkcja α lub funkcja f jest stała.
Ćwiczenie 15.3.6 Niech f, g : (a, b) → Rm będą różniczkowalne w x0 ∈ (a, b). Pokaż, że funkcja
f · g : (a, b) 3 x 7→ f (x) · g(x) ∈ R
jest różniczkowalna w x0 oraz
(f · g)0 (x0 ) = f 0 (x0 ) · g(x0 ) + f (x0 ) · g 0 (x0 ).
Wyprowadź stosowny wniosek gdy funkcja f lub funkcja g jest stała.
230
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Twierdzenie 15.3.7 (o pochodnej ilorazu) Niech f, g : (a, b) → C będą różniczkowalne w x0 ∈ (a, b) i niech
g(x0 ) 6= 0. Wtedy funkcja
f (x)
x 7→
g(x)
jest dobrze określona w pewnym otoczeniu x0 i różniczkowalna w x0 oraz
0
f
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
(x0 ) =
.
2
g
(g(x0 ))
Dowód: Zauważmy, że funkcja g jako różniczowalna w x0 jest ciągła w x0 , skąd wnosimy, że własność g(x0 ) 6= 0 przenosi
się na pewne otoczenie x0 . Zatem iloraz funkcji f i g jest dobrze określony w pewnym otoczeniu punktu x0 . Iloraz różnicowy
dla ilorazu funkcji f i g to
f
f
f (x0 )
f (x0 +h)
(x
+
h)
−
0
g
g (x0 )
g(x0 +h) − g(x0 )
=
h
h
f (x0 + h)g(x0 ) − f (x0 )g(x0 + h)
=
hg(x0 )g(x0 + h)
f (x0 + h)g(x0 ) − f (x0 )g(x0 ) + f (x0 )g(x0 ) − f (x0 )g(x0 + h)
=
hg(x0 )g(x0 + h)
(f (x0 + h) − f (x0 )) g(x0 ) − f (x0 ) (g(x0 + h) − g(x0 ))
=
hg(x0 )g(x0 + h)
=
f (x0 +h)−f (x0 )
g(x0 )
h
0)
− f (x0 ) g(x0 +h)−g(x
h
g(x0 )g(x0 + h)
Przechodząc w otrzymanej równości z h do granicy w zerze dostajemy tezę.
Twierdzenie 15.3.8 (o pochodnej zestawienia) Niech fi : (a, b) → C będą funkcjami różniczkowalnymi w x0 ∈
(a, b) dla i = 1, 2, . . . m. Wtedy zestawienie f := (f1 , f2 , . . . fm ) : (a, b) → Cm jest różniczkowalne w x0 oraz
0
f 0 (x0 ) = (f10 (x0 ), f20 (x0 ), . . . , fm
(x0 ))
Dowód: Teza wynika natychmiast z twierdzenia o granicy zestawienia funkcji (tw. 10.8.1), gdyż
m
fi (x0 + h) − fi (x0 )
f (x0 + h) − f (x0 )
=
h
h
i=1
15.4
Różniczkowanie funkcji złożonej
Bardzo przydatna w liczeniu pochodnych jest informacja jak pochodna złożenia funkcji wyraża się poprzez pochodne funkcji
składanych. Nim przedstawimy stosowne twierdzenie, zajmiemy się twierdzeniem pomocniczym, które przyda się nam później
w dowodzie twierdzenia o różniczkowaniu złożenia.
∆ f (h)
Zauważmy, że jeśli f : R−→
◦ Rm jest różniczkowalna w x0 ∈ R, to funkcja h 7→ x0h
− f 0 (x0 ) ma w zerze granic˛e zero, choć sama w zerze
∆
f (h)
nie jest zdefiniowana, bo ułamek x0h
dla h = 0 nie ma sensu. Możemy jednak rozszerzyć t˛e funkcj˛e do funkcji r : R−→
◦ Rm , która z definicji w zerze
przyjmuje wartość zero. B˛edzie to funkcja ciagła
˛ i b˛edzie spełniać wzór
∆x0 f (h) − hv = hr(h).
15.4. RÓŻNICZKOWANIE FUNKCJI ZŁOŻONEJ
231
Okazuje si˛e, że implikacja odwrotna również zachodzi, co prowadzi do nast˛epujacego
˛
twierdzenia.
Twierdzenie 15.4.1 Niech f : R−→
◦ Rm będzie funkcją określoną w otoczeniu x0 ∈ R. Wtedy różniczkowalność f w
x0 jest równoważna istnieniu funkcji r : R−→
◦ Rm określonej i ciągłej w otoczeniu zera oraz wektora v ∈ Rm takich, że
r(0)
=
0
∆x0 f (h) − hv
=
hr(h).
Dowód: Załóżmy najpierw, że f jest różniczkowalna w x0 . Połóżmy v := f 0 (x0 ) oraz zdefiniujmy funkcję r wzorem
(
∆x0 f (h)
− v gdy x 6= 0
h
r(h) :=
0
w przeciwnym razie.
Oczywiście r jest określona w otoczeniu zera i spełnia wzór (15.8) Ponieważ f 0 (x0 ) = v, więc
∆x0 f (h)
−v =0
h→0
h
lim
co oznacza, że r jest również ciągła. Na odwrót, jeśli funkcja o postulowanych własnościach istnieje, to z jej ciągłości w zerze
wynika, że istnieje granica
∆x0 f (h)
,
lim
h→0
h
a tym samym f jest różniczkowalna w x0 .
Twierdzenie 15.4.2 (o pochodnej złożenia funkcji) Niech f : (a, b) → (c, d) będzie funkcją różniczkowalną w
x0 ∈ (a, b), a g : (c, d) → Rm funkcją różniczkowalną w f (x0 ). Wtedy złożenie g ◦ f jest różniczkowalne w x0 oraz
(g ◦ f )0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ).
Dowód: Z założenia o różniczkowalności f w x0 i g w f (x0 ) oraz z twierdzenia 15.4.1 wnosimy, że istnieje V otoczenie
zera oraz ciągłe, zerujące się w zerze funkcje ϕ, ψ : V → R takie, że dla h, k ∈ V
∆x0 f (h)
∆f (x0 ) g(k)
= f (x0 + h) − f (x0 ) = (f 0 (x0 ) + ϕ(h)) h
(15.8)
= g(f (x0 ) + k) − g(f (x0 )) = (g 0 (f (x0 )) + ψ(k)) k.
(15.9)
Ponieważ funkcja h 7→ (f 0 (x0 ) + ϕ(h)) h jest ciągła i zeruje się w zerze, więc istnieje W otoczenie zera takie, że dla h ∈ W
mamy
(f 0 (x0 ) + ϕ(h)) h ∈ V.
Zatem wzór (15.9) zachodzi również dla k = (f 0 (x0 ) + ϕ(h)) h przy h ∈ V . Mamy zatem dla h ∈ V
g(f (x0 ) + (f 0 (x0 ) + ϕ(h)) h) − g(f (x0 )) = (g 0 (f (x0 )) + ψ(f 0 (x0 ) + ϕ(h)) h) (f 0 (x0 ) + ϕ(h)) h.
(15.10)
Wykorzystując (15.8) oraz (15.10) otrzymujemy
∆x0 (g ◦ f )(h)
= g(f (x0 + h)) − g(f (x0 )) = g(f (x0 ) + (f 0 (x0 ) + ϕ(h)) h) − g(f (x0 ))
= (g 0 (f (x0 )) + ψ(f 0 (x0 ) + ϕ(h)) h) (f 0 (x0 ) + ϕ(h)) h.
Stąd
∆x0 (g ◦ f )(h)
= (g 0 (f (x0 )) + ψ(f 0 (x0 ) + ϕ(h)) h) (f 0 (x0 ) + ϕ(h)) .
h
Ponieważ tak ψ jak i ϕ zmierzają do zera przy h zmierzającym do zera, prawa strona powyższej równości zmierza do
g 0 (f (x0 ))f 0 (x0 ). Zatem również lewa strona jest zbieżna do g 0 (f (x0 ))f 0 (x0 ). Dowodzi to tezy, bo lewa strona to iloraz
różnicowy dla funkcji g ◦ f w x0 .
232
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
15.5
Różniczkowanie funkcji wykładniczej i funkcji trygonometrycznych
W rozdziale tym podamy wzory na pochodna˛ funkcji wykładniczej oraz funkcji trygonometrycznych. Wzory te uzyskamy badajac
˛ pochodna˛ funkcji
R 3 t 7→ etz ∈ C
(15.11)
dla ustalonej liczby zespolonej z ∈ C. Stosowny wzór podamy dla dowolnego zespolonego z , ale interesować nas b˛eda˛ głównie przypadki gdy z jest liczba˛
rzeczywista˛ badź
˛ liczba˛ urojona˛ i.
Zauważmy, że iloraz róznicowy dla funkcji (15.11) ma postać
ehz − 1
e(t+h)z − etz
= etz
,
h
h
wi˛ec interesować nas b˛edzie granica limh→0
ehz −1
h .
Lemat 15.5.1 Funkcja
C \ {0} 3 u 7→
eu − 1
∈C
u
ma w zerze granicę równą jeden.
Dowód: Przypomnijmy, że zgodnie z definicją 13.1.3 mamy
eu =
∞
X
un
,
n!
n=0
skąd
eu − 1 =
bo
u0
0!
∞
X
un
,
n!
n=1
= 1. Zatem dla dowolnego u ∈ C \ {0} mamy
P
P
u
∞
∞ un − 1
∞ un
X
n−1
e − 1
u
n=0
n=1
n!
n!
= −
1
−
1
=
−
1
=
−
1
u
u
u
n!
n=1
∞
∞
∞
X un−1 X
X
|u|n−1
|u|n−2
= = |u|
¬
n! n=2 n!
n!
n=2
n=2
Ponieważ interesuje nas tylko otoczenie zera, możemy założyć, że |u| < 1. Dla takich u dostajemy
u
∞
X
e − 1
1
¬ |u|
−
1
¬ |u|e.
u
n!
n=2
Tak więc dla |u| < 1 mamy
u
e − 1
0¬
− 1 ¬ |u|e.
u
Ponieważ prawa strona tej nierówności zmierza do zera przy u zmiarzającym do zera, z twierdzenia o trzech funkcjach
wnosimy, że
u
e − 1
lim − 1 = 0,
u→0
u
co dowodzi tezy.
15.5. RÓŻNICZKOWANIE FUNKCJI WYKŁADNICZEJ I FUNKCJI TRYGONOMETRYCZNYCH
233
Twierdzenie 15.5.2 Funkcja
R 3 t 7→ etz ∈ C
jest różniczkowalna, a jej pochodną jest funkcja
R 3 t 7→ zetz ∈ C
Dowód: Dla z = 0 rozważana funkcja jest stale równa jeden, zatem jest różniczkowalna, a jej pochodną jest funkcja stale
równa zero, co jest zgodne z tezą twierdzenia. Załóżmy zatem, że z 6= 0. Pochodną rozważanej funkcji w punkcie z jest
e(t+h)z − ez
ehz − 1
ehz − 1
= etz lim
= zetz lim
= zetz ,
h→0
h→0
h→0
h
h
hz
lim
bo z lematu 15.5.1 wiemy, że
ehz − 1
eu − 1
= lim
= 1.
u→0
h→0
hz
u
lim
Wniosek 15.5.3 (o różniczkowaniu rzeczywistej funkcji wykładniczej) Rzeczywista funkcja wykładnicza
R 3 x 7→ ex ∈ R+
jest różniczkowalna, a jej pochodną jest ona sama, co nieprecyzyjnie, ale zwięźle zapisujemy jako
(ex )0 = ex .
Dowód: Tezę dostajemy natychmiast z twierdzenia 15.5.2 po podstawieniu za z stałej jeden.
Twierdzenie 15.5.4 (o różniczkowaniu funkcji trygonometrycznych) Funkcje trygonometryczne: sin, cos, tg,
ctg są różniczkowalne w swojej dziedzinie i zachodzą wzory
(sin t)0 = cos t,
(cos t)0 = − sin t,
(tg t)0 =
1
,
cos2 x
(ctg t)0 = −
1
.
sin2 x
Dowód: Z twierdzenia 15.5.2 dla z = i oraz dla z = −i mamy
it
0
eit + e−it
e − e−it
1
1
(sin t)0 =
=
(eit )0 − (e−it )0 =
ieit + ie−it =
= cos t.
2i
2i
2i
2
Podobnie
0
(cos t) =
eit + e−it
2
0
=
1
1
eit − e−it
(eit )0 + (e−it )0 =
ieit − ie−it = −
= − sin t.
2
2
2i
Z twierdzenia o granicy ilorazu mamy
0
sin t
(sin t)0 cos t − sin t(cos t)0
cos t cos t − sin t(− sin t)
1
(tg t)0 =
=
=
=
.
cos t
cos2 t
cos2 t
cos2 t
Podobnie
(ctg t)0 =
cos t
sin t
0
=
(cos t)0 sin t − cos t(sin t)0
− sin t sin t − cos t(cos t)
1
=
=− 2 .
sin2 t
sin2 t
sin t
234
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
15.6
Nieciągłości pochodnej i funkcje klasy C 1 .
W przykładzie 15.1.4 pokazaliśmy, że funkcja x 7→ |x| nie posiada w zerze pochodnej. Oczywiście poza zerem jest różniczkowalna. Jej nieróżniczkowalność w zerze bierze się stąd, że pochodne lewostronna i prawostronna, choć istnieją, nie są sobie
równe. Poniższy przykład pokazuje, że nawet pochodne jednostronne mogą w pewnym punkcie nie istnieć.
Przykład 15.6.1 Rozważmy funkcję
(
x sin x1
R 3 x 7→
0
gdy x 6= 0,
dla x = 0.
Funkcja ta jest ciągła, a dla x 6= 0 różniczkowalna na podstawie twierdzenia o różniczkowaniu iloczynu, funkcji złożonej
i ilorazu. Dla x = 0 iloraz różnicowy ma postać
h sin h1
1
= sin .
h
h
Wiemy, że granica limh→0 sin h1 nie istnieje. Nie istnieją nawet stosowne granice jednostronne. Zatem rozważana funkcja
nie jest różniczowalna w zerze i nie posiada w zerze pochodnych jednostronnych.
Interesujące jest pytanie, czy jeśli funkcja jest różniczkowalna w każdym punkcie, to jej pochodna musi być funkcją
ciągłą. Okazuje się, że niekoniecznie, jak pokazuje poniższy przykład.
Przykład 15.6.2 Rozważmy funkcję
(
R 3 x 7→
x2 sin x1
0
gdy x 6= 0,
dla x = 0.
Funkcja ta jest ciągła, a dla x 6= 0 różniczkowalna na podstawie twierdzenia o różniczkowaniu iloczynu, funkcji złożonej
i ilorazu. Dla x = 0 iloraz różnicowy ma postać
h2 sin h1
1
= h sin .
h
h
Granica limh→0 h sin h1 istnieje i wynosi zero. Zatem również w zerze nasza funkcja jest różniczkowalna. Jej pochodną
jest funkcja
(
2x sin x1 − cos x1
gdy x =
6 0,
R 3 x 7→
0
dla x = 0.
Pokażemy, że pochodna ta nie jest ciągła w zerze. Gdyby była ciągła w zerze, to dla każdego ciągu xn zbieżnego do
1
zera ciąg wartości byłby zbieżny do pochodnej w zerze, czyli do zera. Ale ciąg xn = 2πn
jest zbieżny do zera, a ciąg
wartości pochodnej w punktach tego ciągu wynosi stale −1, więc jest zbieżny do −1, a nie do zera.
Definicja 15.6.3 Funkcję f : (a, b) → Rm , która jest różniczkowalna i ma ciągłą pochodną nazywamy funkcją klasy
C 1 . Zbiór takich funkcji oznaczamy C 1 ((a, b), Rm ).
Nazwa "klasa C 1 " wyjaśni si˛e później, gdy zdefiniujemy również funkcje klasy C n .
W programie Mathematica pochodną funkcji f zmiennej x obliczamy używając instrukcji
D[f[x],x]
15.7. METODA NEWTONA
235
Na przykład pochodną funkcji
1
f (x) := log
4
x2 − 1
x2 + 1
obliczymy pisząc
D[(1/4) Log[(x^2 - 1)/(x^2 + 1)], x]
Jako wynik program Mathematica zwraca
2
x +1
2x
x2 +1
−
2x(x2 −1)
(x2 +1)2
4 (x2 − 1)
.
Nie jest to czytelna postać pochodnej. Instrukcja Simplify pozwala uzyskać najbardziej zwartą postać wyrażenia. Jako
argumentu można użyć znaku %, który odnosi się do ostatniego wyrażenia obliczonego przez program Mathematica.
Simplify[%]
daje w wyniku
15.7
x
.
x4 − 1
Metoda Newtona
Rozwiazywanie
˛
równań interesowało matematyków już od starożytności. Pierwotnie stosowano głównie metody geometryczne, które pozwalały rozwiazywać
˛
równania liniowe i wybrane równania wyższych stopni, głównie kwadratowe. Po raz pierwszy podejście algebraiczne w rozwiazywaniu
˛
równania kwadratowego
zastosowano w VII wieku w Indiach. W XVIw. metod˛e rozwiazywania
˛
równania trzeciego i czwartego stopnia znaleźli włoscy matematycy Niccolo Fontana Tartaglia
i Lodovico Ferrari. Liczne próby ogólnego rowiazania
˛
równań wyższych stopni spełzły na niczym, a na poczatku
˛ XIXw. norwerski matematyk Niels Henrik Abel
udowodnił, że nie da si˛e podać ogólnego algorytmu rozwiazania
˛
równania stopnia wi˛ekszego niż cztery za pomoca˛ skończonej ilości operacji arytmetycznych
+, −, ∗, / oraz pierwiastkowania.
Pozostały zatem metody przybliżone. Wsród nich prym wiedzie wywodzaca
˛ si˛e z prac Izaaka Newtona i nazywana jego imieniem metoda iteracyjna wykorzystujaca
˛ przybliżanie funkcji styczna˛ do wykresu.
Załóżmy, że chcemy rozwiazać
˛ równanie postaci
f (x) = 0,
gdzie f : [a, b] → R jest funkcja˛ różniczkowalna.˛ Rozwiazania
˛
takiego równania nazywane sa˛ również miejscami zerowymi funkcji f .
Załóżmy, że dany jest punkt x0 ∈ [a, b], a y = cx + d jest równaniem prostej stycznej do wykresu f w punkcie x0 .
Wiemy, że c, czyli współczynnik kierunkowy tej prostej jest równy f 0 (x0 ). Ponieważ punkt (x0 , f (x0 )) należy do stycznej, wi˛ec f (x0 ) = f 0 (x0 )x0 + d,
skad
˛ wyliczamy d co pozwala przepisać nam równanie stycznej w postaci
y = f (x0 ) + f 0 (x0 ) (x − x0 ) .
Przyjmujac
˛ y = 0 i rozwiazuj
˛ ac
˛ wzgl˛edem x znajdujemy
x = x0 −
f (x0 )
.
f 0 (x0 )
Jest to przybliżenie miejsca zerowego funkcji f tym lepsze im bliżej x0 było miejsca zerowego. Dlatego iterujac
˛ ten proces, to znaczy liczac
˛ wyrazy ciagu
˛
danego rekurencyjnie wzorem
xn+1 := xn −
f (xn )
f 0 (xn )
236
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
/∗ ∗∗∗∗∗∗∗∗∗∗ newton . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗
P i e r w i a s t e k wielomianu
∗/
/∗
metodą Newtona
∗/
/∗ ∗ ∗ ∗ ∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
#include 
using namespace s t d ;
/∗ S t o p i e ń wielomianu ∗/
const i n t d e g r e e =2;
/∗ T a b l i c a współczynników wielomianu ∗/
double c o e f [ d e g r e e + 1 ] ;
/∗ maksymalna l i c z b a i t e r a c j i ∗/
i n t l i m i t =30;
/∗ o c z e k i w a n a d o k ł a d n o ś ć ∗/
double e p s i l o n = 0 . 0 0 1 ;
/∗ W y l i c z e n i e w a r t o ś c i wielomianu w x ∗/
double f ( double x ) {
double s=c o e f [ d e g r e e ] ;
f o r ( i n t i=d e g r e e −1; i >=0; i −−) s=c o e f [ i ]+x∗ s ;
return s ;
}
/∗ W y l i c z e n i e p o c h o d n e j wielomianu w x ∗/
double d e r f ( double x ) {
double s=d e g r e e ∗ c o e f [ d e g r e e ] ;
f o r ( i n t i=d e g r e e −1; i >=1; i −−) s=i ∗ c o e f [ i ]+x∗ s ;
return s ;
}
/∗ Program główny ∗/
i n t main ( ) {
/∗ Wczytujemy w s p ó ł c z y n n i k i wielomianu ∗/
f o r ( i n t i =0; i <d e g r e e +1;++ i ) {
c o u t << "c[" <> c o e f [ i ] ;
}
/∗ o r a z w y j ś c i o w e p r z y b l i ż e n i e p i e r w i a s t k a ∗/
double x ;
c o u t << " x0 =" ; c i n >> x ;
/∗ P ę t l a główna ∗/
f o r ( i n t i =0; i <l i m i t ;++ i ) {
double v a l=f ( x ) ;
c o u t << "
x
=" << x
<< "\n" ;
c o u t << "
f(x )= " << v a l << "\n" ;
/∗ J e ś l i o s i ą g n i ę t o żądaną d o k ł a d n o ś ć można p r z e r w a ć p ę t l ę ∗/
i f ( v a l <e p s i l o n && v a l >−e p s i l o n ) break ;
/∗ Nowe p r z y b l i ż e n i e ∗/
x=x−v a l / d e r f ( x ) ;
}
}
Listing 15.1: Wyznaczanie miejsc zerowych wielomianu w C++.
15.7. METODA NEWTONA
237
Rysunek 15.4: Interpretacja geometryczna metody Newtona
możemy si˛e spodziewać, że b˛edzie on zbieżny do miejsca zerowego funkcji f w przedziale [a, b]. Nie zawsze tak jest, ale dzieje si˛e tak na tyle cz˛esto,
że metoda Newtona jest do dziś bardzo powszechnie stosowanym narz˛edziem. Interpretacja geometryczna zwiazku
˛
xn i xn+1 z pochodna˛ funkcji f jest
przedstawiona na rys. (15.4).
Program w C++ znajdujacy
˛ miejsca zerowe wielomianu przedstawiono na listingu 15.1.
W programie Mathematica rozwiazanie
˛
równania metoda˛ Newtona umożliwia insturkcja FindRoot. Ponieważ program Mathematica sam potrafi znaleźć
pochodna,˛ jedyne co musimy zrobić to zapisać równanie i podać wartość, od której należy rozpoczać
˛ poszukiwanie pierwiastka. Na przykład piszac
˛
FindRoot[Cos[x] == x^3, {x, 1}]
otrzymujemy jako rozwiazanie
˛
{x -> 0.865474}
Program Mathematica przekształca równanie cos x = x3 do postaci f (x) = 0, gdzie
f (x) := cos x − x3 ,
znajduje pochodna˛ f 0 (x) = − sin x − 3x2 i nast˛epnie liczy wyrazy ciagu
˛ danego wzorem rekurencyjnym
x0
xn+1
:=
1
:= xn −
cos xn − x3n
− sin xn − 3x2n
aż do osiagni˛
˛ ecia przybliżenia granicy o domyślnie ustawionej dokładności.
Ćwiczenie 15.7.1 Pokaż, że zaprezentowana w rozdziale 5.4.1 metoda liczenia pierwiastka kwadratowego
sowana˛ do równania
x2 − a = 0.
√
a jest w istocie metoda˛ Newtona zasto-
238
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
15.8
Ekstrema lokalne, a różniczkowalność.
15.8.1
Maksima i minima lokalne
Pochodna funkcji przydaje się przy poszukiwaniu lokalnych minimów i maksimów funkcji.
Definicja 15.8.1 Mówimy, że funkcja f : (a, b) → R ma w x0 ∈ (a, b) minimum lokalne jeżeli istnieje otoczenie
U ⊂ (a, b) punktu x0 takie, że dla wszystkich x ∈ U zachodzi f (x) f (x0 ). Podobnie mówimy, że f ma w x0 ∈ (a, b)
maksimum lokalne jeżeli istnieje otoczenie U ⊂ (a, b) punktu x0 takie, że dla wszystkich x ∈ U zachodzi f (x) ¬ f (x0 ).
Mówimy, że f ma w x0 ∈ (a, b) ekstremum lokalne jeśli f ma w x0 minimum lokalne lub maksimum lokalne.
Twierdzenie 15.8.2 (o ekstremum lokalnym funkcji różniczkowalnej) Jeśli f : (a, b) → R jest różniczkowalna
w x0 ∈ (a, b) i ma w x0 ekstremum lokalne, to f 0 (x0 ) = 0.
Dowód: Załóżmy, że f ma w x0 maksimum lokalne. Zatem istnieje δ > 0 taka, że (x0 −δ, x0 +δ) ⊂ (a, b) oraz f (x) ¬ f (x0 )
dla x ∈ (x0 − δ, x0 + δ). W szczególności dla h ∈ (−δ, δ) mamy f (x0 + h) − f (x0 ) ¬ 0. Zatem dla h ∈ (−δ, 0) jest
f (x0 + h) − f (x0 )
 0,
h
skąd wnosimy, że pochodna lewostronna f w x0 jest nieujemna. Z drugiej strony dla h ∈ (0, δ) jest
f (x0 + h) − f (x0 )
¬ 0,
h
skąd wnosimy, że pochodna prawostronna f w x0 jest niedodatnia. Ale pochodna f w x0 istnieje, więc jest równa tak
pochodnej lewostronnej jak i prawostronnej. Zatem f 0 (x0 ) = 0.
15.8.2
Twierdzenie Rolle’a.
Francuski matematyk Michel Rolle (1652-1719) uważany jest za autora pierwszego w miarę współczesnego dowodu następującego twierdzenia.
Twierdzenie 15.8.3 (Rolle’a) Załóżmy, że f : [a, b] → R jest ciągła oraz, że jest różniczkowalna dla x ∈ (a, b). Jeśli
f (a) = f (b) to istnieje ξ ∈ (a, b) takie, że f 0 (ξ) = 0.
Dowód: Funkcja f , jako funkcja ciągła na przedziale zwartym, osiąga wartość największą oraz najmniejszą. Jeśli tak
wartość największa jak i najmniejsza są osiągane na końcach przedziału [a, b], to założenie f (a) = f (b) implikuje, że f jest
stała, a więc ma pochodną zero w każdym punkcie przedziału (a, b). Załóżmy zatem, że wartość największa lub wartość
najmniejsza jest osiągnięta w pewnym punkcie ξ ∈ (a, b). Wtedy f ma w ξ ekstremum lokalne, zatem z twierdzenia o
ekstremum lokalnym funkcji różniczkowalnej wynika, że f 0 (ξ) = 0.
15.9
Twierdzenie o wartości średniej
15.9.1
Uogólnione twierdzenie o wartości średniej
W twierdzeniu Rolle’a sieczna do wykresu poprowadzona przez punkty (a, f (a)) i (b, f (b)) jest pozioma. Styczna do wykresu w punkcie osiagania
˛
ekstremum
też jest pozioma. Zatem można stwierdzić, że istnieje punkt wewnatrz
˛ przedziału (a, b) taki, że styczna do wykresu w tym punkcie jest równoległa do siecznej
15.9. TWIERDZENIE O WARTOŚCI ŚREDNIEJ
239
Rysunek 15.5: Sieczna i równoległa do niej styczna.
przez punkty (a, f (a)) i (b, f (b)). Okazuje si˛e, że to stwierdzenie jest prawdziwe również wtedy gdy f (a) 6= f (b). Fakt ten, znany jako twierdzenie o wartości
średniej, ilustruje rysunek 15.5. W polskiej literaturze z twierdzeniem tym kojarzony jest francuski matematyk Joseph Louis Lagrange (1736-1813), Udowodnimy
najpierw jeszcze ogólniejsze twierdzenie, pochodzace
˛ od Augustina Cauchy’ego, z którego twierdzenie o wartości średniej wyprowadzimy jako wniosek.
Twierdzenie 15.9.1 (uogólnione o wartości średniej) Niech f, g : [a, b] → R będą ciągłymi funkcjami, różniczkowalnymi w przedziale (a, b). Wtedy istnieje punkt ξ ∈ (a, b) taki, że
(f (b) − f (a)) g 0 (ξ) = (g(b) − g(a)) f 0 (ξ).
Dowód: Rozważmy funkcję ϕ : [a, b] → R daną wzorem ϕ(x) := (f (b) − f (a)) g(x) − (g(b) − g(a)) f (x). Funkcja ta jest
ciągła na przedziale [a, b] i różniczkowalna na przedziale (a, b). Co więcej, prostym rachunkiem sprawdzamy, że
ϕ(a) = f (b)g(a) − f (a)g(b) = ϕ(b),
zatem stosując do ϕ twierdzenie Rolle’a znajdziemy punkt ξ ∈ (a, b) taki, że ϕ0 (ξ) = 0. Ale ϕ0 (ξ) = (f (b) − f (a)) g 0 (ξ) −
(g(b) − g(a)) f 0 (ξ). Zatem (f (b) − f (a)) g 0 (ξ) − (g(b) − g(a)) f 0 (ξ) = 0, co dowodzi naszej tezy.
15.9.2
Twierdzenie Lagrange’a o wartości średniej
Przyjmując w twierdzeniu 15.9.1 za funkcję g identyczność otrzymujemy jako wniosek następujące klasyczne twierdzenie o
wartości średniej.
Twierdzenie 15.9.2 (Lagrange’a o wartości średniej) Niech f : [a, b] → R będzie funkcją ciągłą, różniczkowalną
w przedziale (a, b). Wtedy istnieje punkt ξ ∈ (a, b) taki, że
(f (b) − f (a)) = (b − a) f 0 (ξ).
240
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
15.9.3
Twierdzenie o przyrostach skończonych
Twierdzenia o wartości średniej nie dają się przenieść w dosłownej formie na przypadek funkcji o wartościach wektorowych,
na przykład zespolonych, jak pokazuje następujący przykład.
Przykład 15.9.3 Rozważmy funkcję
f : [0, 1] 3 t 7→ e2tπi ∈ C.
Mamy f [0] = f [1] = 1, zatem gdyby twierdzenie o wartości średniej zachodziło, to istniałby punkt ξ ∈ (0, 1) taki, że
f 0 (ξ) = 0. Taki punkt jednak nie istnieje, bo z twierdzenia 15.5.2 wiemy, że pochodną jest f 0 (t) = 2πie2tπi 6= 0.
Mamy jednak pokrewne twierdzenie.
Twierdzenie 15.9.4 (o przyrostach skończonych) Niech f : [a, b] → Rm będzie funkcją ciągłą, różniczkowalną na
(a, b). Wtedy istnieje ξ ∈ (a, b) takie, że
||f (b) − f (a)|| ¬ ||f 0 (ξ)||(b − a).
Dowód: Oznaczmy z := f (b) − f (a). Jeśli z = 0, teza jest oczywista. Zatem załóżmy, że z 6= 0 i rozważmy funkcję
ϕ : [a, b] 3 t 7→ z · f (t) ∈ R.
Funkcja ϕ jest funkcją o wartościach rzeczywistych, jest ciągła, a na podstawie ćwiczenia 15.3.6 wiemy też, że jest różniczkowalna i ϕ0 (t) = z · f 0 (t). Możemy więc do niej zastosować twierdzenie o wartości średniej. Zatem istnieje ξ ∈ (a, b) takie,
że
ϕ(b) − ϕ(a) = ϕ0 (ξ)(b − a) = (b − a)z · f 0 (ξ).
Z drugiej strony
ϕ(b) − ϕ(a) = z · (f (b) − f (a)) = z · z = ||z||2 .
Zatem z nierówności Schwartza dostajemy
||z||2 = (b − a)z · f 0 (ξ) = |(b − a)z · f 0 (ξ)| ¬ (b − a)||z||||f 0 (ξ)||.
Dzieląc powyższą nierówność obustronnie przez ||z|| otrzymujemy tezę.
15.10
Zastosowania twierdzenia o wartości średniej
15.10.1
Pochodna, a monotoniczność
Monotoniczność funkcji różniczkowalnej znajduje odwzierciedlenie w znaku jej pochodnej. Dokładniej, mamy następujące
twierdzenie.
Twierdzenie 15.10.1 Niech f : (a, b) → R będzie funkcją różniczkowalną. Mają miejsce następujące równoważności
(i) f 0 0 wtedy i tylko wtedy gdy f jest słabo rosnąca,
(ii) f 0 > 0 wtedy i tylko wtedy gdy f jest silnie rosnąca,
(iii) f 0 ¬ 0 wtedy i tylko wtedy gdy f jest słabo malejąca,
(iv) f 0 < 0 wtedy i tylko wtedy gdy f jest silnie malejąca.
Dowód: Załóżmy najpierw, że f 0 0. Niech x1 , x2 ∈ (a, b) oraz x1 < x2 . Z twierdzenia o wartości średniej wiemy, że
f (x2 )−f (x1 ) = f 0 (ξ)(x2 −x1 ) dla pewnego ξ ∈ (x1 , x2 ). Ale z założenia f 0 (ξ) 0, skąd f (x2 )−f (x1 ) 0, a to dowodzi, że f
jest słabo rosnąca. Z kolei jeśli f jest słabo rosnąca, to iloraz różnicowy w każdym punkcie przedziału (a, b) jest nieujemny.
Zatem i pochodna jest nieujemna, jako granica ilorazu różnicowego. To dowodzi równoważności (i). Dowód pozostałych
równoważności jest podobny, więc zostawiamy go jako ćwiczenie.
15.10. ZASTOSOWANIA TWIERDZENIA O WARTOŚCI ŚREDNIEJ
15.10.2
241
Twierdzenie o wartościach pośrednich dla pochodnej
Widzieliśmy w przykładzie 15.6.2, że istnienie pochodnej w każdym punkcie dziedziny funkcji f nie gwarantuje ciągłości
pochodnej. Tym niemniej, pochodna, nawet jeśli jest nieciągła, ma własność przyjmowania wartości pośrednich, podobnie
jak funkcja ciągła.
Twierdzenie 15.10.2 Niech f : (a, b) → R będzie funkcją różniczkowalną. Niech c, d ∈ (a, b) będą takie, że c < d oraz
f 0 (c) < f 0 (d). Wtedy dla każdego λ ∈ (f 0 (c), f 0 (d)) istnieje ξ ∈ (c, d) takie, że f 0 (ξ) = λ.
Dowód: Rozważmy funkcję g : (a, b) → R daną wzorem g(t) := f (t) − λt. Jest ona ciągła różniczkowalna oraz g 0 (c) =
f (c) − λ < 0 i g 0 (d) = f 0 (d) − λ > 0. Zatem g(c) > g(c + h1 ) dla pewnego h1 ∈ (0, d − c), bo w przeciwnym razie iloraz
różnicowy g(c+h)−g(c)
>= 0 dla h > 0 co prowadzi do sprzeczności z g 0 (c) < 0. Podobnie stwierdzamy, że g(d) > g(d − h2 )
h
dla pewnego h2 ∈ (0, d − c). Wynika stąd, że maksium, które g na przedziale [c, d] musi osiągać na mocy tw. 11.2.14 , nie
może być osiągnięte na końcach tego przedziału lecz w pewnym punkcie ξ ∈ (c, d). Zatem jest to maksimum lokalne. Z
tw. 15.8.2 g 0 (ξ) = f 0 (ξ) − λ = 0, skąd f 0 (ξ) = λ.
Z udowodnionego twierdzenia wynika następujący ważny wniosek.
0
Wniosek 15.10.3 Niech f : (a, b) → R będzie funkcją różniczkowalną. Jeśli f 0 (x) 6= 0 dla wszystkich x ∈ (a, b), to f 0
przyjmuje wyłącznie wartości dodatnie lub wyłącznie wartości ujemne.
Ćwiczenie 15.10.4 Wywnioskuj z tw. 15.10.2, że jeśli f : (a, b) → R jest funkcją różniczkowalną, to f 0 nie posiada
punktów nieciągłości pierwszego rodzaju.
15.10.3
Reguła de l’Hospitala
Jeśli f : R → R zeruje si˛e w zerze, to
f (x)
f (x) − f (0)
=
x
x−0
może być traktowane jako przybliżenie f 0 (0), oczywiście przy założeniu, że pochodna ta istnieje. Zatem jeśli mamy dwie takie funkcje, f, g : R → R i obie
zeruja˛ si˛e w zerze, to mamy
f (x)
=
g(x)
f (x)
x
g(x)
x
f 0 (0)
f (0)
g 0 (0) . Lewa strona nie jest przybliżeniem g(0) , bo jest to pozbawiony sensu ułamek o zerze
f (x)
ułamków g(x) przy x zmierzajacym
˛
do zera o ile ta granica istnieje. Zatem, przy odpowiednich
Prawa˛ stron˛e tego wyrażenia można traktować jako przybliżenie
w liczniku i mianowniku. Jest to jednak przybliżenie granicy
założeniach, możemy si˛e spodziewać wzoru
f 0 (0)
f (x)
= 0 .
x→0 g(x)
g (0)
lim
Udowodnimy teraz nawet nieco ogólniejsze twierdzenie. Z twierdzeniem tym kojarzony jest francuski matematyk Guillaume de l’Hospital (rys. 15.6), który pierwszy
je opublikował. Jednak sa˛ argumenty za tym, że autorem twierdzenia jest szwajcarski matematyk Johann Bernoulli (rys. 15.6), brat Jacoba Bernoullego (rys. 8.9).
Okazuje si˛e ono bardzo pomocne przy wyznaczaniu granic ilorazów, do których nie możemy zastosować twierdzenia o granicy ilorazu. Przypomnijmy bowiem, że
twierdzenie o granicy ilorazu wymaga, by mianownik miał granic˛e różna˛ od zera.
242
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Rysunek 15.6: Guillaume de l’Hospital (1661 - 1704) i Johann Bernoulli (1667 - 1748) Źródło: Wikipedia
Twierdzenie 15.10.5 (reguła de l’Hospitala). Niech f, g : (a, b) → R będą różniczkowalne oraz g 0 (x) =
6 0 dla
x ∈ (a, b). Załóżmy, że
lim f (x) = 0 = lim g(x)
(15.12)
x→a
x→a
lub
lim g(x) ∈ {−∞, ∞}.
(15.13)
f 0 (x)
x→a g 0 (x)
(15.14)
f (x)
g(x)
(15.15)
x→a
Jeśli istnieje granica
lim
to istnieje granica
lim
x→a
i obie te granice są sobie równe.
Twierdzenie 15.10.5 wyprowadzimy z następującego lematu
Lemat 15.10.6 Przy założeniach twierdzenia 15.10.5 mamy nierówności
lim sup
x→a
oraz
lim inf
x→a
f (x)
f 0 (x)
¬ lim sup 0
g(x)
x→a g (x)
(15.16)
f (x)
f 0 (x)
 lim inf 0
x→a g (x)
g(x)
(15.17)
Dowód: (twierdzenia 15.10.5) Ponieważ granica dolna jest niewiększa od granicy górnej, z (15.16) i (15.17) mamy ciąg
nierówności
f 0 (x)
f (x)
f (x)
f 0 (x)
lim inf 0
¬ lim inf
¬ lim sup
¬ lim sup 0
.
(15.18)
x→a g(x)
x→a g (x)
x→a g(x)
x→a g (x)
W twierdzeniu 15.10.5 zakładamy istnienie granicy (15.14). Zatem stosowna granica dolna i granica górna są sobie równe.
Zatem pierwsze i ostatnie wyrażenie w ciągu nierówności (15.18) są sobie równe. Jest to możliwe tylko wtedy, gdy wszystkie
15.10. ZASTOSOWANIA TWIERDZENIA O WARTOŚCI ŚREDNIEJ
243
wyrażenia są sobie równe. W szczególności drugie i trzecie wyrażenie są sobie równe. Wynika stąd istnienie granicy (15.15)
i równość obu granic.
Dowód: (lematu 15.10.6) Rozważmy dowód wzoru (15.16). Oznaczmy
A := lim sup
x→a
f 0 (x)
.
g 0 (x)
Jeśli A = ∞, to wzór (15.16) oczywiście zachodzi, załóżmy więc, że A < ∞. Wystarczy pokazać, że
∀q > A
lim sup
x→a
f (x)
¬ q.
g(x)
(15.19)
Ustalmy zatem liczbę q > A. Z definicji granicy znajdziemy c ∈ (a, b) takie, że
∀ x ∈ (a, c)
f 0 (x)
< q.
g 0 (x)
(15.20)
Niech x, y ∈ (a, c) oraz x < y. Zwężenia f|[x,y] i g|[x,y] spełniają założenia uogólonionego twierdzenia o wartości średniej
(tw. 15.9.1) zatem znajdziemy ξ ∈ (x, y) takie, że
(f (y) − f (x)) g 0 (ξ) = (g(y) − g(x)) f 0 (ξ).
Wykorzystując założenie o niezerowaniu się pochodnej funkcji g przepisujemy powyższą równość w postaci
f (y) − f (x)
f 0 (ξ)
f (x) − f (y)
=
= 0 .
g(x) − g(y)
g(y) − g(x)
g (ξ)
Zatem z (15.20) wnosimy, że dla x, y ∈ (a, c)
f (y) − f (x)
f (x) − f (y)
=
< q.
g(x) − g(y)
g(y) − g(x)
(15.21)
Rozważmy przypadek założenia (15.12). Przechodząc ze zmienną y w (15.21) do granicy w a dostajemy
f (x)
¬q
g(x)
dla x ∈ (a, c), skąd natychmiast wynika (15.19).
Przypadek (15.13) jest nieco bardziej zagmatwany. Dowód zaprezentujemy przy założeniu limx→a g(x) = ∞. Rozumowanie dla limx→a g(x) = −∞ jest analogiczne. Zauważmy najpierw, że z limx→a g(x) = ∞ znajdziemy c0 ∈ (a, c) takie,
że g(x) > 0 dla x < c0 . Założenie o niezerowaniu się pochodnej funkcji g implikuje, że g jest funkcją monotoniczną, a w
konsekwencji, ze względu na założenie limx→a g(x) = ∞, jest funkcją silnie malejącą. Zatem g(x) − g(y) > 0. Mnożąc (15.21)
przez g(x) − g(y) i przenosząc f (y) na prawą stronę dostajemy
f (x) < f (y) + q (g(x) − g(y)) = qg(x) + f (y) − qg(y).
Dla x ∈ (a, c0 ) mamy g(x) > 0, więc dzieląc ostatnią nierówność przez g(x) dostajemy
f (x)
f (y)
g(y)
<q+
−q
.
g(x)
g(x)
g(x)
Ze względu na założenie limx→a g(x) = ∞, dla zadanego > 0 i przy ustalonym y ∈ (a, c) znajdziemy c00 ∈ (a, c0 ) takie, że
dla x ∈ (a, c00 )
f (y)
g(y)
−q
< .
g(x)
g(x)
244
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Zatem z ostatnich dwóch nierówności dla x ∈ (a, c00 ) i dowolnego > 0 mamy
f (x)
< q + .
g(x)
Ze względu na dowolność > 0 dla x ∈ (a, c00 ) mamy
f (x)
¬ q,
g(x)
skąd wnosimy (15.19) również dla przypadku założenia (15.13).
Dowód własności (15.17) jest podobny. Pozostawiamy go jako ćwiczenie.
Regułę de l’Hospitala zaprezentowaliśmy dla granicy w lewym końcu przedziału. Oczywiście analogiczna reguła obowiązuje również dla prawego końca przedziału, a tym samym dla granicy lewostronnej, prawostronnej i zwykłej granicy.
Przykład 15.10.7 Granica limx→0 sinx x nie daje się policzyć z twierdzenia o granicy ilorazu, bo mianownik zmierza do
zera. Ponieważ jednak również licznik zmierza do zera oraz tak licznik jak i mianownik są różniczkowalne w otoczeniu
zera, a mianownik ma pochodną stale równą jeden, więc możemy zastosować regułę de l’Hospitala. Dostajemy
sin x
(sin x)0
cos x
cos 0
= lim
= lim
=
= 1.
x→0 x
x→0
x→0
x0
1
1
lim
15.11
Różniczkowanie funkcji odwrotnej
15.11.1
Wzór na pochodną funkcji odwrotnej
Twierdzenie 15.11.1 Załóżmy, że f : (a, b) → R jest funkcją różniczkowalną oraz f 0 (x) 6= 0 dla wszystkich x ∈ (a, b).
Wtedy f jest bijekcją przedziału (a, b) w pewien przedział (c, d). Co więcej, bijekcja odwrotna f −1 : (c, d) → (a, b) jest
różniczkowalna oraz
1
(f −1 )0 (f (x)) = 0
(15.22)
f (x)
dla wszystkich x ∈ (a, b).
Dowód: Z wniosku 15.10.3 wnosimy, że f 0 jest wszędzie dodatnia lub wszędzie ujemna, zatem z tw. 15.10.1 funkcja jest
silnie rosnąca lub silnie malejąca. W szczególności jest zatem injekcją. Niech Γ := im f będzie obrazem przedziału (a, b) w
funkcji f . Ponieważ zbiory spójne w R pokrywają się z przedziałami (wn. 11.4.4), z tw. 11.4.5 wnosimy, że Γ jest również
przedziałem. Pokażemy, że przedział ten jest otwarty. Rzeczywiście, jeśli d jest lewym lub prawym końcem przedziału Γ i
d ∈ Γ, to d jest elementem największym lub najmniejszym w Γ. Równocześnie d = f (t) dla pewnego t ∈ (a, b). Wybierzmy
t0 , t00 ∈ (a, b) takie, że t0 < t < t00 . Z monotoniczności f mamy f (t0 ) < d < f (t00 ) lub f (t0 ) > d > f (t00 ). Ponieważ
f (t0 ), f (t00 ) ∈ Γ, wykluczone jest by d było elementem największym lub najmniejszym w Γ. Zatem Γ jest przedziałem
otwartym. Przyjmijmy, że Γ = (c, d).
Ustalmy x ∈ (a, b) oraz połóżmy y := f (x). Wtedy x = f −1 (y). Niech k będzie takie, że y + k ∈ (c, d). Połóżmy
h := f −1 (y + k) − f −1 (y). Wtedy f −1 (y + k) = f −1 (y) + h = x + x, zatem y + k = f (x + h). Mamy
f −1 (y + k) − f −1 (y)
h
f −1 (y + k) − f −1 (y)
=
=
=
k
(y + k) − y
f (x + h) − f (x)
1
f (x+h)−f (x)
h
.
15.11. RÓŻNICZKOWANIE FUNKCJI ODWROTNEJ
245
Zauważmy, że jeśli k → 0 to również h → 0. Zatem przechodząc w powyższej równości z k do granicy w zerze dostajemy
1
(f −1 )0 (y) =
f 0 (x)
co dowodzi różniczkowalności f −1 oraz równości (15.22).
15.11.2
Pochodna funkcji logarytmicznej
Stosując twierdzenie 15.11.1 do funkcji wykładniczej dostajemy twierdzenie o różniczkowaniu funkcji logarytmicznej.
Twierdzenie 15.11.2 Funkcja ln : R+ → R jest funkcją różniczkowalną oraz
1
.
x
(ln x)0 =
(15.23)
Dowód: Z wniosku 15.5.3 wiemy pochodną funkcji x → ex jest ona sama. Ponieważ funkcja wykładnicza nie przyjmuje wartości zero, możemy do niej zastosować twierdzenie 15.11.1. Funkcją odwrotną do funkcji wykładniczej jest funkcja
logarytmiczna x → ln x, zatem funkcja ta jest różniczkowalna oraz
(ln x)0 (ex ) =
1
1
= x.
x
0
(e )
e
Przyjmując y := ex dostajemy zatem
1
y
co pokrywa się ze wzorem (15.23), gdyż w obu wzorach występujące w nich zmienne są związane.
(ln y)0 =
15.11.3
Funkcje kołowe (odwrotne do trygonometrycznych)
Funkcje sin, cos i tg nie są bijekcjami, więc nie mają funkcji odwrotnych. Jednak po zawężeniu do odpowiednio małego
przedziału stają się bijekcjami. Zwyczajowo rozważamy zawężenia sin|[−π/2,π/2] , cos|[0,π] , tg|[−π/2,π/2] . Pochodne tych funkcji
na wnętrzach tych przedziałów są niezerowe, zatem zawężęnia do wnętrz są odwracalne. Łatwo pokazać, że w konsekwencji
odwracalne są również zawężenia do przedziałów domkniętych.
Definicja 15.11.3 Funkcje odwrotne do funkcji sin|[−π/2,π/2] , cos|[0,π] , tg|[−π/2,π/2] oznaczamy odpowiednio arc sin,
arc cos i arc tg. Nazywamy je funkcjami kołowymi lub cyklometrycznymi.
Jako prosty wniosek z tw. 15.11.1 dostajemy następujące twierdzenie
Twierdzenie 15.11.4 Funkcja arc sin : [−1, 1] → [−π/2, π/2] jest różniczkowalna dla x ∈ (−1, 1) oraz
(arc sin x)0 = √
1
.
1 − x2
Funkcja arc cos : [−1, 1] → [0, π] jest różniczkowalna dla x ∈ (−1, 1) oraz
(arc cos x)0 = − √
1
.
1 − x2
Funkcja arc tg : R → (−π/2, π/2) jest różniczkowalna dla x ∈ R oraz
(arc tg x)0 =
1
.
1 + x2
246
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Funkcje kołowe w programie Mathematica oznaczane są ArcSin, ArcCos, ArcTan.
15.11.4
Pochodna funkcji potęgowej
Wiemy już, że dla n ∈ N1 mamy (xn )0 = nxn−1 . Wzór ten uogólnić można na przypadek funkcji x → xα dla dowolnego
α ∈ R.
Twierdzenie 15.11.5 Dla dowolnego α ∈ R funkcja potęgowa
R+ 3 x 7→ xα ∈ R+
jest różniczkowalna oraz
(xα )0 = αxα−1 .
Dowód: Ponieważ xα = eα ln x , więc funkcja x 7→ xα jest złożeniem funkcji x 7→ α ln x oraz funkcji u 7→ eu . Zatem z
twierdzenia o różniczkowaniu złożenia funkcji mamy
(xα )0 = eα ln x
α
α
= xα = αxα−1 .
x
x
15.12
Pochodne wyższych rzędów
15.12.1
n-ta pochodna
Jeśli pochodna f 0 funkcji f sama ma pochodną, to nazywamy ją drugą pochodną funkcji f i oznaczamy f 00 . Proces brania
kolejnych pochodnych możemy kontynuować. Precyzyjniej, definicję różniczkowalności i pochodnej rozszerzamy rekurencyjnie
w następujący sposób.
Definicja 15.12.1 Mówimy, że funkcja f : (a, b) → Rm jest 1-różniczkowalna jeśli jest różniczkowalna. Jej pochodną
f 0 nazywamy pierwszą pochodną i zapisujemy jako f (1) . Mówimy, że funkcja f jest n-różniczkowalna jeśli jej (n − 1)-sza
pochodna f (n−1) jest różniczkowalna. Pochodną f (n−1) nazywamy n-tą pochodną funkcji f i zapisujemy jako f (n) .
Dla małych n zamiast f (n) piszemy czasem f 00 , f 000 itd. Dodatkowo wygodnie jest samą funkcję nazywać zerową pochodną
i zapisywać jako f (0) := f .
Definicja 15.12.2 Mówimy, że funkcja f : (a, b) → Rm jest klasy C n jeżeli jest n-różniczkowalna we wszystkich
punktach przedziału (a, b) oraz f (n) jest ciągła. Zbiór takich funkcji oznaczamy C n ((a, b), Rm ).
W programie Mathematica n-tą pochodną funkcji f zmiennej x obliczamy używając instrukcji
D[f[x],{x,n}]
Na przykład drugą pochodną funkcji
f (x) :=
obliczymy pisząc
1
ln
4
x2 − 1
x2 + 1
15.12. POCHODNE WYŻSZYCH RZĘDÓW
247
Rysunek 15.7: Wykres funkcji f (niebieski), prostej stycznej do wykresu f w punkcie x0 (fioletowy) i paraboli stycznej do
wykresu w punkcie x0 (zielony).
D[(1/4) Log[(x^2 - 1)/(x^2 + 1)], {x,2}]
Jako wynik program Mathematica zwraca skomplikowane wyrażenie, ale po zastosowaniu do niego Simplify dostajemy
−3x4 − 1
2.
(x4 − 1)
Aproksymacja liniowa poprzez różniczk˛e jest prosta, ale cz˛esto nie jest wystarczajaco
˛ dokładna. Możemy wtedy rozważać aproksymacj˛e krzywa˛ drugiego
stopnia (parabola)˛ zadana˛ wzorem y = a0 + a1 h + a2 h2 gdzie h = x − x0 jest przyrostem zmiennej niezależnej (rys. 15.7). Możemy też przybliżać
wielomianem n-ego stopnia postaci
W (h) := a0 + a1 h + a2 h2 + . . . + an hn .
Różnica
f (x) − W [h) = f (x0 + h) − a0 + a1 h + a2 h2 + . . . + an hn
powinna być o(hn ), bo oczekujemy bł˛edu, który szybciej zmierza do zera niż wielomian aproksymacyjny. Pokażemy, że jeśli funkcja r jest n-różniczkowalna w
zerze, to własność r(h) = o(hn ) jest równoważna zerowaniu si˛e pochodnych r do n-tej włacznie,
˛
tzn. warunkowi
r(0) = r0 (0) = r00 (0) = . . . = r(n) (0) = 0.
W odniesieniu do naszego problemu aproksymacyjnego oznacza to, że funkcja
h 7→ f (x0 + h) − W (h)
powinna mieć zerowe pochodne w zerze do n-tej włacznie
˛
co jest równoważne postulatowi by funkcje h 7→ f (x0 + h) i h 7→ W (h) miały te same
pochodne do n-tej włacznie.
˛
Jak zobaczymy pochodne wielomianu jest stosunkowo łatwo policzyć: W (i) (0) = i!ai . Zatem tyle musza˛ wynosić pochodne
funkcji h 7→ f (x0 + h) w zerze. Sa˛ one równe pochodnym x 7→ f (x) w x0 , zatem poszukiwana aproksymacja ma postać
f (x0 + h) = f (x0 ) +
f 0 (x0 )
f 00 (x0 ) 2
f (n) (x0 ) n
h+
h + ... +
h + r(h)
1!
2!
n!
gdzie r(h) = o(hn ). Otrzymany w ten sposób wielomian aproksymacyjny nazywany jest wielomianem Taylora funkcji f w x0 , bo pochodzi od angielskiego
matematyka Brooka Taylora (rys. 15.8).
248
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Rysunek 15.8: Brook Taylor, 1685-1731. Źródło: Wikipedia
Twierdzenie 15.12.3 Wielomian
W : R 3 x 7→ a0 + a1 h + a2 h2 + . . . + an hn ∈ R.
(15.24)
jest funkcją i-różniczkowalną dla wszystkich i ∈ N oraz
W (i) (0) = i!ai
(15.25)
gdzie przyjmujemy ai = 0 dla i > n.
Dowód: Pokażemy indukcyjnie, że dla k ∈ N zachodzi ogólniejszy wzór
W (k) (x) =
n
X
i=k
i!
ai xi−k .
(i − k)!
(15.26)
Rzeczywiście, dla k = 0 wzór (15.26) pokrywa się z definicją (15.24) wielomianiu W . Natomiast jeśli (15.26) zachodzi dla
pewnego k, to biorąc pochodną obu stron dostajemy
W
(k+1)
(x)
=
W
(k)
0
(x) =
k!ak +
n
X
i=k+1
=
n
X
i=k+1
i!
ai xi−k
(i − k)!
i!
(i − k)ai xi−k−1 =
(i − k)!
Podstawiając we wzorze (15.26) za x zero dostajemy (15.25).
15.12.2
Wielomian Taylora
Niech f : (a, b) → R będzie n-różniczkowalna w x0 ∈ (a, b).
n
X
i=k+1
!0
0
= (k!ak ) +
n
X
i=k+1
i!
(ai xi−k )0
(i − k)!
i!
ai xi−(k+1) .
(i − (k + 1))!
15.12. POCHODNE WYŻSZYCH RZĘDÓW
249
Definicja 15.12.4 Wielomianem Taylora funkcji f w punkcie x0 stopnia n nazywamy wielomian
Txn0 f : R 3 h 7→ f (x0 ) +
f 0 (x0 )
f 00 (x0 ) 2
f (n) (x0 ) n
h+
h + ... +
h ∈ R.
1!
2!
n!
Z twierdzenia 15.12.3 łatwo wyprowadzamy następujący wniosek.
Wniosek 15.12.5 Funkcja f i jej wielomian Taylora Txn0 f mają takie same pochodne do n-tej włącznie odpowiednio
w zerze i w x0 , tzn. dla i = 0, 1, 2, . . . n zachodzi
Txn0 f
(i)
(0) = f (i) (x0 ).
15.12.3
n-płaskość w zerze.
Uogólnieniem pojęcia płaskości w zerze jest n-płaskość w zerze.
Definicja 15.12.6 Mówimy, że funkcja r : R−→
◦ R określona w otoczeniu zera jest n-płaska w zerze, jeżeli r(h) = o(hn )
przy h → 0.
Lemat 15.12.7 Jeśli W : R → R jest wielomianem stopnia co najwyżej n oraz
W (h)
=0
h→0 hn
lim
(15.27)
to W = 0.
Dowód: Dowód poprowadzimy indukcyjnie względem n. Rozważmy najpierw przypadek n = 0. Wtedy W (h) = a0 jest
wtedy funkcją stałą. Z (15.27) mamy
W (h)
0=
= lim a0 = a0 ,
h→0
h0
skąd W = 0.
Przyjmijmy z kolei, że lemat jest spełniony dla m < n i rozważmy wielomian
W : R 3 h 7→ a0 + a1 h + a2 h2 + . . . + an hn ∈ R
spełniający (15.27). Mamy
a0 = lim W (h) = lim
h→0
h→0
W (h) n
W (h)
h = lim
lim hn = 0.
h→0 hn h→0
hn
Zatem W (h) = a1 h + a2 h2 + . . . + an hn = hW1 (h), gdzie W1 (h) := a1 + a2 h + . . . + an hn−1 . Ale W1 jest wielomianem
stopnia co najwyżej (n − 1) oraz
W1 (h)
hW1 (h)
W (h)
lim
= lim
= lim
= 0,
h→0 hn−1
h→0
h→0 hn
hn
zatem z założenia inducyjnego W1 = 0, skąd W = 0.
250
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Rysunek 15.9: Joseph Louis Lagrange (1736 - 1813) i Giuseppe Peano (1858 - 1932). Źródło: Wikipedia
15.13
Wzory Taylora i szereg Taylora.
15.13.1
Wzór Taylora z resztą Peano.
Przedstawimy teraz dwa, powiązane ze sobą twierdzenia. Pierwsze uogólnia uwagę 15.2.12 na przypadek n-płaskości w
zerze. Drugie precyzuje jak wielomian Talora funkcji n-różniczkowalnej przybliża samą funkcję. Pochodzą one od włoskiego
matematyka Giuseppe Peano (rys. 15.9).
Twierdzenie 15.13.1 (Peano o funkcji n-płaskiej) Niech r : R−→
◦ R będzie funkcją n-różniczkowalną w zerze.
Funkcja ta jest n-płaska w zerze wtedy i tylko wtedy gdy
r(i) (0) = 0 dla i = 0, 1, 2, . . . n.
(15.28)
Twierdzenie 15.13.2 (wzór Taylora z resztą Peano) Niech f : (a, b) → R będzie funkcją (n − 1)-różniczkowalną
na przedziale (a, b) oraz n-różniczkowalną w x0 ∈ (a, b). Wtedy istnieje dokładnie jeden wielomian W : R → R stopnia
co najwyżej n taki, że dla h ∈ (a − x0 , b − x0 )
f (x0 + h) = W (h) + r(h)
dla pewnej n-płaskiej w zerze funkcji r : R−→
◦ R. Co więcej, wielomianem tym jest Txn0 f , czyli wielomian Taylora funkcji
f w x0 stopnia n. W szczególności h 7→ f (x0 + h) − Txn0 f (h) jest funkcją n-płaską w zerze.
Dowód: (twierdzenia 15.13.1 i twierdzenia 15.13.2) Najpierw pokażemy indukcyjnie, że warunek (15.28) implikuje
n-płaskość w zerze funkcji r. Dla n = 1 wynika to wprost z uwagi 15.2.12. Załóżmy, że implikacja zachodzi dla m < n oraz
warunek (15.28) jest spełniony. Ponieważ r(0) = 0, z uwagi 15.2.4 wnosimy, że wystarczy pokazać, iż
r(h)
= 0.
h→0 hn
lim
(15.29)
Wtedy (r0 )(i) (0) = 0 dla i = 0, 1, 2, . . . n − 1, a zatem z założenia indukcyjnego zastosowanego do funkcji r0 wnosimy, że
15.13. WZORY TAYLORA I SZEREG TAYLORA.
251
r0 (h) = o(hn−1 ) przy h → 0. Zatem również z uwagi 15.2.4 wynika, iż
r0 (h)
= 0,
h→0 hn−1
lim
a stąd, przy wykorzystaniu reguły de l’Hospitala
r0 (h)
1
r(h)
r0 (h)
= lim
= lim n−1 = 0,
n
n−1
h→0 nh
h→0 h
n h→0 h
lim
co dowodzi (15.29).
Rozważmy z kolei funkcję f spełniającą założenia twierdzenia 15.13.2. Niech r(h) := f (x0 + h) − Txn0 f (h). Wtedy
(i)
r (0) = 0 dla i = 0, 1, 2, . . . n. Zatem na mocy już udowodnionej części twierdzenia 15.13.1 funkcja r jest n-płaska w zerze.
Dowodzi to, że za postulowany w twierdzeniu 15.13.2 wielomian W można wziąć wielomian Taylora Txn0 f . W szczególności
zatem taki wielomian W istnieje, choć nie możemy jeszcze twierdzić, że jest wyznaczony jednoznacznie.
Aby pokazać jednoznaczność załóżmy, że istnieją wielomiany W1 i W2 stopnia co najwyżej n oraz n-płaskie w zerze
funkcje r1 i r2 takie, że
f (x0 + h) = Wi (h) + ri (h) przy h → 0.
W szczególności
W1 (h) + r1 (h) = W2 (h) + r2 (h).
Wielomian W (h) := W1 (h) − W2 (h) spełnia zatem W (h) = r2 (h) − r1 (h). Z wniosku 15.2.6 wynika, że W (h) = o(hn ) przy
h → 0. W szczególności z uwagi 15.2.4 wnosimy, że
W (h)
= 0,
h→0 hn
lim
a więc lemat 15.12.7 implikuje, że W = 0.
Pozostaje jeszcze uzupełnić dowód twierdzenia 15.13.1. Niech r : R−→
◦ R będzie funkcją n-różniczkowalną i n-płaską w
zerze. Z udowodnionej już części twierdzenia 15.13.2 wiemy, że h 7→ r(h) − T0n r(h) jest funkcją n-płaską w zerze. Zatem
z wniosku 15.2.6 wnosimy, że wielomia T0n r = r − (r − T0n r) jest n-płaska w zerze. Z uwagi 15.2.4 oraz lematu 15.12.7
wnosimy, że T0n r =, a stąd, że zachodzi (15.28).
15.13.2
Wzór Taylora z resztą Lagrange’a
Szczególnie interesujacy
˛ jest przypadek, gdy funkcja f : (a, b) → R jest n-różniczkowalna dla każdego n ∈ N. Wtedy możemy zbudować wielomian Taylora
Txn0 f dowolnie wysokiego stopnia. Kolejne wielomiany Taylora tworza˛ wi˛ec sumy cz˛eściowe szeregu
∞
X
f (i) (x0 )
i=0
i!
hi .
(15.30)
Naturalne jest zatem pytanie czy i kiedy ten szereg jest zbieżny do f (x0 + h). W tym celu trzeba zbadać kiedy
rn (h) := f (x0 + h) −
n
X
f (i) (x0 )
i=0
i!
hi = f (x0 + h) − Txn0 f (h),
zwane n-ta˛ reszta,˛ zmierza do zera przy n zmierzajacym
˛
do nieskończoności. W pierwszej chwili może si˛e wydawać, że wzór Taylor z reszta˛ Peano pozwoli
odpowiedzieć na to pytanie, bo ze wzoru tego wiemy, że
rn (h) = f (x0 + h) − Txn0 f (h) = o(hn ) przy h → 0,
252
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
zatem na podstawie wniosku 15.2.5
rn (h) = f (x0 + h) − Txn0 f (h) = ϕ(h)hn
(15.31)
n
dla pewnej ciagłej
˛ i zerujacej
˛ si˛e w zerze funkcji ϕ. Ponieważ dla |h| < 1 wyrażenie h zmierza do zera przy n zmierzajacym
˛
do nieskończoności, może si˛e
wydawać, że dowodzi to iż n-ta reszta rn (h) zmierza do zera. Problem w tym, że funkcja ϕ we wzorze (15.31) zależy od n, zatem wzór ten powinien być
zapisany jako
rn (h) = f (x0 + h) − Txn0 f (h) = ϕn (h)hn .
Widać teraz, że chociaż hn zmierza do zera przy n daż
˛ acym
˛
do nieskończoności, to o granicy limn→∞ ϕn (h) nic nie potrafimy powiedzieć i nasze rozumowanie
si˛e rozsypuje. Aby je uratować musimy coś wi˛ecej wiedzieć o reszcie rn (h).
Niech f : (c, d) → R będzie funcją (n + 1)-różniczkowalną. Ustalmy a, b ∈ (c, d) takie, że a < b.
Zaczniemy od lematu, który uogólnia twierdzenie Rolle’a (tw. 15.8.3).
Lemat 15.13.3 Jeśli f jest n-płaska w a oraz f (b) = 0 to dla każdego i = 1, 2, . . . , n + 1 istnieje ξi ∈ (a, b) takie, że
f (i) (ξi ) = 0.
Dowód: Z twierdzenia Peano o funkcji płaskiej wnosimy, że f (i) (a) = 0 dla i = 1, 2, . . . n. Dowód poprowadzimy
indukcyjnie względem n. Dla n = 0 lemat wynika wprost z twierdzenia Rolle’a (tw. 15.8.3). Załóżmy zatem, że twierdzenie
zachodzi dla m < n. Stosując je dla m = n otrzymujemy istnienie potrzebnych ξi dla i = 1, 2, . . . , n. W szczególności
f (n) (ξn ) = 0. Ponieważ również f (n) (a) = 0, więc stosując twierdzenie Rolle’a do f (n) na przedziale [a, ξn ] znajdziemy
0
ξn+1 ∈ (a, ξn ) takie, że f (n) (ξn+1 ) = 0. Zatem f (n+1) (ξn+1 ) = 0.
Uogólnimy teraz twierdzenie o wartości średniej.
Twierdzenie 15.13.4 Jeśli f jest n-płaska w a to istnieje ξ ∈ (a, b) takie, że
f (b) =
Dowód: Połóżmy M :=
f (b)
(b−a)n+1
f (n+1) (ξ)
(b − a)n+1 .
(n + 1)!
i rozważmy funkcję g : t 7→ f (t) − M (t − a)n+1 . Prostym rachunkiem sprawdzamy,
że g(a) = g(b) = 0 oraz g (i) (a) = 0 dla i = 1, 2, . . . n. Zatem z twierdzenia Peano o funkcji płaskiej g spełnia założenia
lematu 15.13.3. Istnieje więc ξ ∈ (a, b) takie, że g (n+1) (ξ) = 0. Ale g (n+1) (t) = f (n+1) (t) − (n + 1)!M , więc f (n+1) (ξ) =
(n + 1)!M , skąd wynika teza.
Jesteśmy teraz gotowi podać wzór Taylora ze zmodyfikowaną resztą, zwaną resztą Lagrange’a. Twierdzenie to pochodzi
od francuskiego matematyka włoskiego pochodzenia, J.L. Lagrange’a (rys. 15.9).
Twierdzenie 15.13.5 (wzór Taylora z resztą Lagrange’a) Niech f : (c, d) → R będzie funcją n + 1różniczkowalną. Niech a, b ∈ (c, d) spełniają a < b. Wtedy istnieje ξ ∈ (a, b) takie, że
f (b) = Tan f (b − a) +
f (n+1) (ξ)
(b − a)n+1 .
(n + 1)!
(15.32)
Przyjmując oznaczenie h := b − a oraz rozpisując wielomian Taylora możemy też powyższą tezę zapisać jako
f (a + h) = f (a) +
f 0 (a)
f 00 (a) 2
f (n) (a) n f (n+1) (ξ) n+1
h+
h + ... +
h +
h
.
1!
2!
n!
(n + 1)!
Dowód: Rozważmy funkcję r : x 7→ f (x) − Tan f (x − a). Funkcja ta jest n-płaska w a, bo jej pochodne w a do n-tej
włącznie się zerują. Zatem z twierdzenia 15.13.4 istnieje ξ ∈ (a, b) takie, że
r(b) =
r(n+1) (ξ)
(b − a)n+1 .
(n + 1)!
15.13. WZORY TAYLORA I SZEREG TAYLORA.
253
Ale r(n+1) (x) = f (n+1) (x), bo (n + 1)-sza pochodna wielomianu stopnia co najwyżej n zeruje się, Zatem
f (n+1) (ξ)
(b − a)n+1 = r(b) = f (b) − Tan f (b − a),
(n + 1)!
skąd wynika (15.32).
W programie Mathematica n-ty wielomian Taylora funkcji f w punkcie u wyliczony dla argumentu (x − u) uzyskamy
instrukcją
Series[f[x],{x,u,n}]
Na przykład pisząc
Series[Exp[x], {x, 0, 6}]
otrzymujemy
1+x+
x2
x3
x4
x5
x6
7
+
+
+
+
+ O [x]
2
6
24 120 720
7
Wyrażenie O [x] jest tutaj niezbyt fortunnym, choć dającym się wytłumaczyć, sposobem zapisania reszty Lagrange’a.
15.13.3
Punkty przegięcia
Definicja 15.13.6 Mówimy, że funkcja f : (a, b) → R ma punkt przegięcia w x0 ∈ (a, b) jeżeli f jest różniczkowalna
w x0 oraz istnieje δ > 0 taka, że dla 0 < |h| < δ funkcja
h 7→ sgn [∆x0 f (h) − f 0 (x0 )h] sgn h
jest stała, to znaczy stale równa jeden lub stale równa minus jeden.
Twierdzenie 15.13.7 Niech f : (a, b) → R będzie klasy C n oraz niech f (i) (x0 ) = 0 dla i = 1, 2, . . . n−1 i f (n) (x0 ) 6= 0.
Jeśli n jest parzyste, to f ma w x0 maksimum lokalne gdy f (n) (x0 ) < 0 bądź minimum lokalne gdy f (n) (x0 ) > 0.
Natomiast jeśli n jest nieparzyste, to f ma w x0 punkt przegięcia.
Dowód: Ponieważ f jest klasy C n , więc f (n) jest funkcją ciągłą, zatem w pewnym otoczeniu punktu x0 ma stały znak.
Wybierzmy δ > 0 tak, by sgn f (n) (x) było stałe dla 0 < |x − x0 | < δ. Załóżmy, że 0 < |h| < δ. Ze wzoru Taylora z resztą
Lagrange’a dla pewnego θ ∈ (0, 1)
f (n) (x0 + θh) n
f (x0 + h) − f (x0 ) =
h ,
n!
skąd otrzymujemy tezę, ponieważ znak wyrażenia f (n) (x0 + θh) jest stały.
15.13.4
Szereg Taylora
Dysponujemy teraz narzędziami do badania zbieżności szeregu (15.30). Zacznijmy od formalnej definicji.
Definicja 15.13.8 Mówimy, że funkcja f : (a, b) → R jest klasy C ∞ jeżeli jest klasy C n dla każdego n ∈ N.
254
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Definicja 15.13.9 Niech f : (a, b) → R będzie funkcją klasy C ∞ i niech x0 ∈ (a, b). Szereg formalny (bez pytania o
zbieżność)
∞
X
f (i) (x0 ) i
h
i!
i=0
nazywamy szeregiem Taylora funkcji f w punkcie x0 dla argumentu h i oznaczamy Tx0 f (h).
Przykład 15.13.10 Pochodną rzeczywistej funkcji wykładniczej exp : R 3 x → ex ∈ R jest ona sama. Zatem
wszystkie jej pochodne są jej równe. W szczególności funkcja wykładnicza jest klasy C ∞ oraz exp(n) (0) = exp(0) = 1.
Zatem łatwo sprawdzamy, że szeregiem Taylora rzeczywistej funkcji wykładniczej w zerze jest
∞
X
1 i
h,
i!
i=0
a więc ten sam szereg, który posłużył nam do zdefiniowania funkcji wykładniczej. O szeregu tym wiemy, że jest zbieżny
do exp(h).
Wzór Taylora z resztą Lagrange’a podpowiada nam jak zagwarantować zbieżność szeregu Taylora.
Twierdzenie 15.13.11 Niech f : (a, b) → R będzie klasy C ∞ i niech x0 ∈ (a, b). Jeżeli istnieją stałe > 0 oraz
M > 0 takie, że dla wszystkich n ∈ N
|f (n) (x)| ¬ M dla x ∈ (x0 − , x0 + ),
to dla |h| < szereg Taylora Tx0 f (h) jest zbieżny do f (x0 + h), co możemy też zapisać w postaci
f (x0 + h) =
∞
X
f (i) (x0 )
i=0
i!
hi .
Dowód: Niech |h| < i niech sn := Txn0 f (h) oraz rn := f (a + h) − sn . Ze wzoru Taylora z resztą Lagrange’a (tw. 15.13.5)
dla pewnego ξ ∈ (a, b) mamy
(n+1)
f
(ξ) n+1 M n+1
|rn | = h
.
¬ n! |h|
n!
Prawa strona powyższej nierówności zmierza do zera przy n dążącym do nieskończoności. Zatem limn→∞ rn = 0, skąd
limn→∞ sn = f (a + h).
Nie w każdej sytuacji powyższe twierdzenie działa. Czasami, tak jak w poniższym przykładzie, musimy sobie radzić na
piechotę.
15.13. WZORY TAYLORA I SZEREG TAYLORA.
255
Przykład 15.13.12 Skonstruujemy szereg Taylora funkcji ln w otoczeniu jedynki. Indukcyjnie sprawdzamy, że dla
n1
(n − 1)!
ln(n) (x) = (−1)n−1
.
xn
Zatem ln(n) (1) = (−1)n (n − 1)!. Stąd
(T1 ln)(h) = ln 1 +
∞
X
(−1)i−1 (i − 1)!
i=1
i!
hi =
∞
X
(−1)i−1
i=1
i
hi .
Ze wzoru Taylora z resztą Lagrange’a mamy dla |h| < 1 i pewnego ξ pomiędzy 1 i 1 + h
n
X
(−1)n
(−1)i−1 i 1
1
|h|n+1
1
n+1 ln(1
+
h)
−
=
h
¬
¬
.
h
n+1
n+1
n+1
i
(n
+
1)(1
+
ξ)
n
+
1
(1
−
|ξ|)
n
+
1
(1
−
|h|)
i=1
Ponieważ prawa strona otrzymanej nierówności zmierza do zera przy n zmierzającym do nieskończoności otrzymujemy
n
X
(−1)i−1 i lim ln(1 + h) −
h=0
n→∞ i
i=1
Zatem dla |h| < 1 szereg T1 ln(h) jest zbieżny oraz
ln(1 + h) =
h h2
h3
−
+
− ....
1
2
3
256
ROZDZIAŁ 15. POCHODNE I RÓŻNICZKI.
Rozdział 16
Całka oznaczona
16.1
Całka Riemanna funkcji jednej zmiennej
16.1.1
Pole obszaru.
Gdy potrzebujemy pokryć pewien obszar (na przykład plac lub podłog˛e łazienki) kwadratowymi płytkami o boku jednostkowej długości (na przykład 10cm), musimy
umieć policzyć ile płytek do tego celu potrzebujemy. Zakładajac,
˛ że obszar ma kształt prostokata
˛ o bokach długości m, n ∈ N łatwo stwierdzamy, że potrzebujemy
mn płytek. Jeśli boki prostokata
˛ nie sa˛ liczbami całkowitymi lub obszar ma kształt inny niż prostokatny,
˛ sprawa robi si˛e bardziej skommplikowana, bo bez ci˛ecia
płytek sobie nie poradzimy. Zawsze jednak możemy zapytać ile maksymalnie płytek daje si˛e ułożyć w granicach obszaru tak, by nie zachodziły one na siebie, a
także ile minimalnie potrzeba płytek, by pokryć cały obszar (rys. 16.1). Te dwie liczby stanowia˛ oszacowanie od dołu i od góry tego co intuicyjnie określamy jako
powierzchni˛e obszaru. Lepsze przybliżenia powierzchni dostaniemy posługujac
˛ si˛e płytkami o mniejszym boku. Kontynuujac
˛ proces szacowania powierzchni
przy użyciu płytek o coraz krótszych bokach otrzymujemy dwa ciagi
˛ szacujace
˛ powierzchni˛e obszaru: jeden rosnacy
˛ i szacujacy
˛ powierzchni˛e od dołu, drugi
malejacy
˛ i szacujacy
˛ powierzchni˛e od góry. Wiemy, że takie ciagi,
˛ jako monotoniczne i ograniczone, maja˛ granice. Intuicja podpowiada nam, że oba te ciagi
˛ maja˛
t˛e sama˛ granic˛e i jest nia˛ pole powierzchni rozważanego obszaru. Intuicja jest tu zawodna, bo można podać przykład zbiorów, dla których granice te sa˛ różne, co
oznacza, że intuicyjne poj˛ecie powierzchni obszaru nie zawsze ma sens.
Do zagadnień zwiazanych
˛
z definicja˛ pola powierzchni podzbioru R2 (ogólniej miary podzbioru Rd ) jeszcze wrócimy, a na razie ograniczymy si˛e do szczególnego przypadku obszaru postaci
{ (x, y) ∈ R2 | a ¬ x ¬ b, 0 ¬ y ¬ f (x) },
gdzie a < b sa˛ liczbami rzeczywistymi, a f : [a, b] → R∗ jest pewna˛ funkcja.˛ Pole powierzchni takiego obszaru można oszacować dzielac
˛ przedział [a, b]
na mniejsze przedziały i sumujac
˛ pola prostokatów
˛
zbudowanych nad tymi przedziałami tak, by mieściły si˛e pod wykresem funkcji lub by pokrywały obszar.
Otrzymujemy w ten sposób odpowiednio przybliżenie pola powierzchini od dołu lub od góry (rys. 16.2).
16.1.2
Przedziały w R i ich podziały.
W niniejszym rozdziale rozważać będziemy przedziały zwarte w R, a więc przedziały postaci [a, b], gdzie a, b ∈ R i a < b.
Zbiór takich przedziałów oznaczać będziemy Przedz(R). Liczby a oraz b nazywamy końcami przedziału [a, b]. Długością
przedziału I = [a, b] ∈ Przedz(R) nazywamy liczbę b − a. Jest to liczba dodatnia, którą oznaczać będziemy len I.
Mówimy, że dwa przedziały I, J ∈ Przedz(R) są rozgraniczone jeżeli mają rozłączne wnętrza. Skończony zbiór przedziałów
P ⊂S
Przedz(R) nazywamy podziałem przedziału I ∈ Przedz(R), jeżeli dowolne dwa różne elementy P są rozgraniczone oraz
I = P. Średnicą podziału P nazywamy liczbę
δ(P) := max { len P | P ∈ P }.
Zbiór wszystkich podziałów przedziału I oznaczać będziemy Podz(I).
257
258
ROZDZIAŁ 16. CAŁKA OZNACZONA
Rysunek 16.1: Przybliżanie pola figury poprzez zliczanie kwadratów wpisanych w figurę i pokrywających figurę w sieci
kwadratowej na płaszczyźnie.
Rysunek 16.2: Po lewej obszar pod wykresem funkcji. Po prawej aproksymacja pola powierzchni tego obszaru od dołu sumą
pól prostokątów zawartych w obszarze oraz aproksymacja od góry sumą pól prostokątów pokrywających obszar.
16.1. CAŁKA RIEMANNA FUNKCJI JEDNEJ ZMIENNEJ
259
Niech x : { 0, 1, 2, . . . n } → [a, b] będzie silnie rosnącym, skończonym ciągiem takim, że x0 = a i xn = b. Łatwo sprawdzić,
że wtedy rodzina
P x := { [xi−1 , xi ] | i = 1, 2, . . . n }
jest podziałem przedziału [a, b], zwanym podziałem zadanym ciągiem x.
Łatwo zauważyć, że każdy podział P ∈ Podz(I) przedziału I = [a, b] ∈ Przedz(R) jest zadany pewnym ciągiem x :
{ 0, 1, 2, . . . n } → [a, b]. W istocie ciąg x zadający podział P otrzymamy biorąc zbiór końców przedziałów w P ustawiony w
ciąg rosnący. Ciąg ten nazywać będziemy ciągiem zadającym podział P i oznaczać xP .
Zatem podziały przedziału I = [a, b] ∈ Przedz(R) możemy utożsamiać ze skończonymi, silnie rosnącymi ciągami liczb
rozpoczynającymi się od liczby a i kończącymi się na liczbie b.
Uwaga 16.1.1 Jeśli P jest podziałem przedziału I, to
len I =
X
len P.
P ∈P
Definicja 16.1.2 Niech P 1 , P 2 ∈ Podz(I) będą podziałami przedziału I ∈ Przedz(R). Mówimy, że podział P 2 jest
podpodziałem podziału P 1 i piszemy P 2 @ P 1 jeżeli dla każdego przedziału P2 ∈ P 2 istnieje przedział P1 ∈ P 1 taki,
że P2 ⊂ P1 .
Łatwo zaobserwować, że podział P 2 ∈ Podz(I) jest podpodziałem podziału P 1 ∈ Podz(I) wtedy i tylko wtedy gdy ciąg
zadający podział P 1 jest podciągiem ciągu zadającego podział P 2 .
Uwaga 16.1.3 Niech P 1 , P 2 będą dwoma dowolnymi podziałami przedziału I ∈ Przedz(R). Istnieje podział P 3 przedziału I taki, że P 3 @ P 1 i P 3 @ P 2 .
Dowód: Jako podział P 3 wystarczy wziąć podział zadany przez zbiór końców przedziałów w P 1 ∪ P 2 posortowany w
ciąg rosnący.
16.1.3
Całkowalność w sensie Riemanna
Niech I = [a, b] ∈ Przedz(R) będzie ustalonym przedziałem, a f : [a, b] → R niech będzie funkcją ograniczoną. Dla podzbioru
P ⊂ [a, b] przyjmujemy oznaczenia
m(f, P )
:=
inf { f (x) | x ∈ P },
M (f, P )
:=
sup { f (x) | x ∈ P }.
Zwróćmy uwagę, że ograniczoność funkcji f gwarantuje iż liczby m(f, P ) i M (f, P ) są dobrze określone.
Definicja 16.1.4 Niech P będzie podziałem przedziału [a, b]. Wyrażenia
X
L(f, P) :=
m(f, P ) len P,
P ∈P
U (f, P)
:=
X
M (f, P ) len P
P ∈P
nazywamy odpowiednio dolną i górną sumą Darboux dla funkcji f i podziału P.
260
ROZDZIAŁ 16. CAŁKA OZNACZONA
Łatwo zauważyć, że jeżeli x : { 0, 1, 2, . . . n } → [a, b] jest ciągiem zadającym podział P, to mamy
L(f, P)
n
X
=
U (f, P)
i=1
n
X
=
m(f, [xi−1 , xi ])(xi − xi−1 ),
M (f, [xi−1 , xi ])(xi − xi−1 ).
i=1
Jeśli funkcja f ma wartości nieujemne, to iloczyny m(f, [xi−1 , xi ])(xi − xi−1 ) i M (f, [xi−1 , xi ])(xi − xi−1 ) odpowiadaja˛ polu prostokatów
˛
o
podstawie [xi−1 , xi ] i wysokości równej odpowiednio kresowi dolnemu i kresowi górnemu funkcji f na przedziale [xi−1 , xi ]. Zatem suma dolna Darboux i
suma górna Darboux daja˛ odpowiednio przybliżenie od dołu i od góry pola pod wykresem funkcji f .
Definicja 16.1.5 Wyrażenia
L(f )
:=
sup { L(f, P) | P ∈ Podz([a, b]) },
U (f )
:=
inf { L(f, P) | P ∈ Podz([a, b]) }.
nazywamy odpowiednio całką dolną i całką górną funkcji f . Jeżeli L(f ) = U (f ), to funkcję f nazywamy całkowalną
Rb
w sensie Riemanna, a liczbę L(f ) = U (f ) nazywamy całką Riemanna funkcji f i oznaczamy a f . Zbiór funkcji
ograniczonych f : [a, b] → R, które są całkowalne w sensie Riemanna oznaczamy Riem([a, b]).
Przykład 16.1.6 Najprostszym przykładem funkcji całkowalnej w sensie Riemanna jest funkcja stała c[a,b] . Rzeczywiście, dla dowolnego przedziału P ⊂ [a, b] mamy m(c[a,b] , P ) = M (c[a,b] , P ) = c, zatem dla dowolnego podziału
P ∈ Podz([a, b]) jest
X
X
L(c[a,b] , P) = U (c[a,b] , P) =
c len P = c
len P = c(b − a).
P ∈P
P ∈P
Zatem L(c[a,b] ) = U (c[a,b] ) = c(b − a) i w konsekwencji
Z
b
c[a,b] = c(b − a).
a
Przykład 16.1.7 Rozważmy funkcję Dirichleta
(
fD : [0, 1] 3 x 7→
0 x ∈ Q,
1 x∈
6 Q.
Jeśli P ⊂ [0, 1] jest przedziałem o niepustym wnętrzu, to m(fD , P ) = 0 i M (fD , P ) = 1. Stąd dla dowolnego P ∈
Podz([0, 1]) mamy L(fD , P) = 0 i U (fD , P) = 1. W konsekwencji L(fD ) = 0 6= 1 = U (fD ). Zatem funkcja Dirichleta
nie jest całkowalna w sensie Riemanna.
16.1.4
Epsilonowe kryterium całkowalności
16.1. CAŁKA RIEMANNA FUNKCJI JEDNEJ ZMIENNEJ
261
Lemat 16.1.8 Jeśli P 1 , P 2 ∈ Podz([a, b]) oraz P 2 @ P 1 , to
L(f, P 1 ) ¬ L(f, P 2 ) i U (f, P 2 ) ¬ U (f, P 1 ).
Dowód: Niech P ∈ P 1 . Z uwagi 16.1.1 mamy
m(f, P ) len P = m(f, P )
X
P 0 ⊂P, P 0 ∈P
len P 0 =
X
P 0 ⊂P, P 0 ∈P
2
X
m(f, P ) len P 0 ¬
2
P 0 ⊂P, P 0 ∈P
m(f, P 0 ) len P 0 .
2
Sumując lewą i prawą stronę powyższych nierówności dla P ∈ P 1 dostajemy
L(f, P 1 ) ¬ L(f, P 2 ).
Dowód nierówności dla sum górnych jest analogiczny.
Z lematu 16.1.8 i uwagi 16.1.3 dostajemy następujący wniosek
Wniosek 16.1.9 Dla dowolnych podziałów P 1 , P 2 ∈ Podz([a, b]) mamy
L(f, P 1 ) ¬ U (f, P 2 ).
Z powyższgo wniosku dostajemy natychmiast następujący wniosek
Wniosek 16.1.10 Dla dowolnej funkcji ograniczonej f : [a, b] → R mamy
L(f ) ¬ U (f ).
Jesteśmy teraz przygotowani, by pokazać następującą charakteryzację funkcji całkowalnych w sensie Riemanna.
Twierdzenie 16.1.11 Funkcja ograniczona f : [a, b] → R jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy
dla każdego > 0 istnieje podział P ∈ Podz([a, b]) przedziału [a, b] taki, że
U (f, P) − L(f, P) < .
(16.1)
Dowód: Przyjmijmy najpierw, że f jest całkowalna w sensie Riemanna. Ustalmy > 0. Z definicji całki dolnej i górnej
do /2 znajdziemy podziały P 1 , P 2 ∈ Podz([a, b]) takie, że
L(f, P 1 ) > L(f ) −
oraz U (f, P 2 ) < U (f ) + .
2
2
Na mocy uwagi 16.1.3 możemy wybrać podział P 3 ∈ Podz([a, b]) taki, że P 3 @ P 1 oraz P 3 @ P 2 . Z lematu 16.1.8 oraz z
(16.1.4) dostajemy
U (f, P 3 ) − L(f, P 3 ) ¬ U (f, P 2 ) − L(f, P 1 ) < U (f ) + − (L(f ) − ) = ,
2
2
bo z założenia L(f ) = U (f ). Zatem podział P 3 spełnia wymóg (16.1).
Dla dowodu przeciwnej implikacji przyjmijmy nie wprost, że f nie jest całkowalna w sensie Riemanna. Wtedy L(f ) 6=
U (f ), zatem z wniosku 16.1.10 wynika, że L(f ) < U (f ). Z definicji sum dolnych i górnych wnosimy, że dla dowolnego
P ∈ Podz([a, b]) mamy
U (f, P) − L(f, P) U (f ) − L(f ).
)
W szczególności wynika stąd, że dla := U (f )−L(f
, które na mocy przyjętego założenia jest dodatnie, nie znajdziemy
2
podziału P spełniającego warunek (16.1). A to dowodzi, że implikacja przeciwna również zachodzi.
262
ROZDZIAŁ 16. CAŁKA OZNACZONA
16.2
Własności całki Riemanna
16.2.1
Monotoniczność całki
Twierdzenie 16.2.1 Niech f, g : [a, b] → R będą funkcjami ograniczonymi. Jeśli f ¬ g to
L(f ) ¬ L(g) oraz U (f ) ¬ U (g).
W szczególności, jeśli tak f jak i g są całkowalne w sensie Riemanna, to
Z
b
Z
b
f¬
a
16.2.2
g.
a
Przestrzeń wektorowa funkcji całkowalnych w sensie Riemanna.
Twierdzenie 16.2.2 Jeśli f, g : [a, b] → R są całkowalne w sensie Riemanna to f + g oraz f − g są całkowalne w
sensie Riemanna oraz
Z b
Z b
Z b
Z b
Z b
Z b
(f + g) =
f+
g
i
(f − g) =
f−
g.
a
a
a
a
a
a
Ponadto, dla dowolnego α ∈ R funkcja αf jest całkowalna w sensie Riemanna oraz
Z
b
b
Z
(αf ) = α
a
f.
a
Uwaga 16.2.3 Jeśli f : [a, b] → R jest całkowalna w sensie Riemanna, to
Z
b f ¬ (b − a) sup |f (x)|.
a x∈[a,b]
Twierdzenie 16.2.4 Przestrzeń Riem([a, b]) funkcji całkowalnych w sensie Riemanna na przedziale zwartym [a, b] z
działaniem dodawania funkcji oraz możenia funkcji przez liczbę jest przestrzenią wektorową. Ponadto, odwzorowanie
Riem([a, b]) 3 f 7→ ||f || := sup |f (x)| ∈ R∗
x∈[a,b]
jest normą, która zadaje w Riem([a, b]) strukturę przestrzeni wektorowej unormowanej, a tym samym strukturę przestrzeni metrycznej. Co więcej, odwzorowanie
Z
Riem([a, b]) 3 f 7→
b
f ∈R
a
jest odwzorowaniem liniowym oraz Lipschitzowskim ze stałą len[a, b], a więc w szczególności odwzorowaniem ciągłym.
16.2. WŁASNOŚCI CAŁKI RIEMANNA
16.2.3
263
Miarowe kryterium całkowalności.
Definicja 16.2.5 Miarą zewnętrzną podzbiorów R nazywamy funkcję
P
S
µ∗ : P(R) 3 E 7→ inf { A∈A len A | A ⊂ Przedz(R) oraz E ⊂ A }.
Mówimy, że zbiór E ⊂ R jest miary zero jeżeli µ∗ (E) = 0.
Twierdzenie 16.2.6 Miara zewnętrzna ma następujące własności:
(i) µ∗ (∅) = 0,
(ii) E ⊂ F ⇒ µ∗ (E) ¬ µ∗ (F ),
S∞
P∞
(iii) µ∗ ( i=1 Ei ) ¬ i=1 µ∗ (Ei ),
Przykład 16.2.7 Zbiorem miary zero jest każdy skończony zbiór punktów.
Wniosek 16.2.8 Suma co najwyżej przeliczalnej rodziny zbiorów miary zero jest zbiorem miary zero.
Twierdzenie 16.2.9 Funkcja ograniczona f : [a, b] → R jest całkowalna w sensie Riemanna wtedy i tylko wtedy gdy
zbiór punktów, w których nie jest ciągła ma miarę zero. W szczególności, jeśli f jest ciągła, to jest całkowalna w sensie
Riemanna.
16.2.4
Całkowalność złożenia i iloczynu
Twierdzenie 16.2.10 Całka Riemanna ma następujące własności:
(i) jeśli f ∈ Riem(I) jest całkowalna w sensie Riemanna, a ϕ : R → R jest ciągła, to ϕ ◦ f ∈ Riem(I),
(ii) jeśli f, g ∈ Riem(I), to ich ich iloczyn f · g ∈ Riem(I),
(i) jeśli f ∈ Riem(I), to |f | ∈ Riem(I).
16.2.5
Całka Riemanna na podprzedziale
Definicja 16.2.11 Niech f : R−→
◦ R będzie funkcją ograniczoną i niech [a, b] ⊂ dom f . Mówimy, że f jest całkowalna
w sensie Riemanna na przedziale [a, b], jeżeli zwężenie f|[a,b] jest funkcją całkowalną w sensie Riemanna. W takim
Rb
przypadku całkę a f|[a,b] nazywamy całką Riemanna funkcji f na przedziale [a, b] lub całką oznaczoną funkcji f od a
do b i oznaczamy
Z b
Z b
f :=
f|[a,b] .
a
a
264
ROZDZIAŁ 16. CAŁKA OZNACZONA
Twierdzenie 16.2.12 Niech f : R−→
◦ R będzie funkcją ograniczoną i niech [a, b] będzie przedziałem zwartym zawartym
w dziedzinie funkcji f . Jeśli P jest podziałem przedziału [a, b] zadanym ciągiem x : { 0, 1, 2, . . . k } → [a, b], to f jest
całkowalna w sensie Riemanna na przedziale [a, b] wtedy i tylko wtedy gdy dla każdego i = 1, 2, . . . k funkcja f jest
całkowalna w sensie Riemanna na przedziale [xi−1 , xi ]. Co więcej, gdy którykolwiek z tych warunków zachodzi, to
Z
b
f=
a
16.2.6
k Z
X
i=1
xi
f.
xi−1
Całka oznaczona
Definicja 16.2.13 Niech f : R−→
◦ R będzie funkcją ograniczoną całkowalną w sensie Riemanna na przedziale [a, b].
Całkę Riemanna z f na przedziale [a, b] określa się też mianem całki oznaczonej z f na przedziale [a, b] i oznacza się
bardziej tradycyjnym symbolem
Z b
Z b
Z
f (x)dx :=
f :=
f.
a
a
[a,b]
Wniosek 16.2.14 Jeśli f jest całkowalna w sensie Riemanna na przedziale [a, b] oraz c ∈ (a, b), to f jest całkowalna
w sensnie Riemanna na przdziałach [a, c] i [c, b] oraz
Z
b
Z
f (x)dx =
a
c
Z
f (x)dx +
a
b
f (x)dx.
c
W programie Mathematica całkę oznaczoną z funkcji f na przedziale [a, b] obliczamy używając instrukcji
Integrate[f[x], {x, a, b}]
W miarę swoich możliwości Mathematica stara się zwrócić dokładny wynik. Na przykład
Integrate[Sqrt[1 - x^2], {x, 0, 1}]
zwraca
16.2.7
π
4.
Twierdzenie Riemanna
Niech f : R−→
◦ R będzie funkcją ograniczoną i niech [a, b] będzie przedziałem zwartym zawartym w dziedzinie funkcji f .
Niech P będzie podziałem przedziału [a, b] zadanym ciągiem x : { 0, 1, 2, . . . k } → [a, b].
Definicja 16.2.15 Niech Ξ := { ξ1 , ξ2 , . . . ξk } ⊂ [a, b] będzie zbiorem punktów takich, że ξi ∈ [xi−1 , xi ] dla i =
1, 2, . . . k. Parę (P, Ξ) nazywamy parą aproksymacyjną dla f na przedziale [a, b], a wyrażenie
S(f, P, Ξ) :=
k
X
f (ξi )(xi − xi−1 )
i=1
nazywamy sumą aproksymacyjną dla f na przedziale [a, b]. Ciąg par aproksymacyjnych (P n , Ξn )∞
n=1 nazywamy ciągiem
normalnym, jeżeli ciąg średnic podziałów P n zmierza do zera.
16.2. WŁASNOŚCI CAŁKI RIEMANNA
265
Twierdzenie 16.2.16 (Riemanna). Niech f : [a, b] → R będzie funkcją ograniczoną. Funkcja ta jest całkowalna w
sensie Riemanna wtedy i tylko wtedy gdy istnieje liczba g ∈ R taka, że dla każdego > 0 istnieje δ > 0 taka, że dla
każdej pary aproksymacyjnej (P, Ξ) dla f na przedziale [a, b] mamy
δ(P) < δ ⇒ |S(f, P, Ξ) − g| < .
Liczba g jest wyznaczona jednoznacznie i jest równa całce
Program, który liczy przybliżenie całki
Rb
a
f.
x
Z
f (t)dt
0
w oparciu o sumy Riemanna
sn :=
n
X
1 i
f ( x)
n
n
i=1
przedstawia listing 16.1. Podobny program w języku C++ przedstawia listing 16.2.
Wyrazy ciągu sn powinny przybliżać pole ćwiartki koła, czyli
π
= 0.7853981633974483...,
4
natomiast 20-ty wyraz ciągu sn wyliczony przez program to
s20 = 0.785397208948704.
Widzimy więc, że z punktu widzenia liczenia liczby π ta technika jest gorsza niż zastosowana wcześniej technika szeregów.
Jednak pożytki z niej leżą gdzie indziej.
Ćwiczenie komputerowe 16.2.17 Adaptuj program z listingu 16.2 do policzenia przybliżenia pola soczewkowatej
figury na rys. 1.13.
266
ROZDZIAŁ 16. CAŁKA OZNACZONA
( ∗ P r z y b l i ż a n i e c a ł k i o z n a c z o n e j z f u n k c j i f od 0 do x p o p r z e z
p o l a m p r o s t o k ą t ó w pod wykresem ∗ )
R i e m I n t e g r a l [ f_ , x_ , m_] :=
Module [ { s , k , y } ,
s = 0 . ; k = 0;
( ∗ Sumujemy w z m i e n n e j s w a r t o ś c i f u n k c j i w punktach x∗k/m ∗ )
Do[
y = x∗k/m;
s = s + f [y];
k = k + 1,
{m}
];
( ∗ Zwracamy sumę pomnożoną p r z e z wspólną d ł u g o ś ć podstawy wynoszącą 1/m ∗ )
s /m
]
( ∗ Wykres p o n i ż s z e j f u n k c j i nad p r z e d z i a ł e m [ 0 , 1 ] t o ć w i a r t k a okręgu ∗ )
a r c [ x_ ] := Sqrt [ 1 − x ^ 2 ] ;
( ∗ Przybliżymy p o l e pod ć w i a r t k ą okręgu danego f u n k c j ą a r c nad [ 0 , 1 ]
Wykonamy 20 prób za każdym razem p o d w a j a j ą c i l o ś ć p r z e d z i a ł ó w ∗ )
m = 1; d = 1;
Do[
p = R i e m I n t e g r a l [ arc , 1 . , m ] ;
( ∗ Wydruk k o n t r o l n y : c a ł k a powinna być b l i s k a p i /4 ∗ )
Print [ "s[" , d , " ]= " , NumberForm[ p , 1 6 ] ] ;
m = m∗ 2 ; d = d + 1 ,
{20}
]
Listing 16.1: Przybliżanie całki oznaczonej w języku Mathematica
16.2. WŁASNOŚCI CAŁKI RIEMANNA
267
/∗ ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ R i e m I n t e g r a l . cpp ∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗∗ ∗/
/∗ P r z y b l i ż a n i e c a ł k i o z n a c z o n e j p o p r z e z p o l a p r o s t o k ą t ó w ∗/
/∗ pod wykresem
∗/
/∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗ ∗/
#include 
#include <cmath>
#include <iomanip>
using namespace s t d ;
/∗ Wykres p o n i ż s z e j f u n k c j i nad p r z e d z i a ł e m [ 0 , 1 ] t o ć w i a r t k a okręgu ∗/
double a r c ( double x ) {
return s q r t (1−x∗x ) ;
}
/∗ P r z y b l i ż a n i e c a ł k i Riemanna f u n k c j i f od 0 do x sumą m p r o s t o k ą t ó w
Z a p i s d o u b l e ( ∗ f ) ( d o u b l e ) oznacza , ż e argumentem f j e s t f u n k c j a ∗/
double R i e m I n t e g r a l ( double ( ∗ f ) ( double ) , double x , i n t m) {
double s =0;
/∗ Sumujemy w z m i e n n e j s w a r t o ś c i f u n k c j i w punktach x∗k/m ∗/
f o r ( i n t k=0;k<m; k=k+1){
double y=x∗k/m;
s=s+f ( y ) ;
}
/∗ Zwracamy sumę pomnożoną p r z e z wspólną d ł u g o ś ć podstawy wynoszącą 1/m ∗/
return s=s /m;
}
i n t main ( ) {
c o u t << f i x e d << r i g h t ;
c o u t << s e t p r e c i s i o n ( 1 5 ) ;
i n t m=1;
/∗ Przybliżymy p o l e pod ć w i a r t k ą okręgu danego f u n k c j ą a r c nad [ 0 , 1 ]
Wykonamy 20 prób za każdym razem p o d w a j a j ą c i l o ś ć p r z e d z i a ł ó w ∗/
f o r ( i n t d=1;d<=20;d=d+1){
double p=R i e m I n t e g r a l ( arc , 1 . ,m) ;
/∗ Wydruk k o n t r o l n y : c a ł k a powinna być b l i s k a p i /4 ∗/
c o u t << "s[" << setw ( 2 ) << d << "] =" << setw ( 1 8 ) << p ;
c o u t << e n d l ;
m=m∗ 2 ;
}
}
Listing 16.2: Przybliżanie całki oznaczonej w C++
268
ROZDZIAŁ 16. CAŁKA OZNACZONA
Rozdział 17
Funkcja pierwotna i całka nieoznaczona
Jak wspomnieliśmy w rozdziale wst˛epnym Newton i Leibniz odkryli, że poj˛ecie pochodnej i poj˛ecie całki sa˛ ze soba˛ powiazane.
˛
Wzi˛ecie całki z pochodnej oraz
pochodnej z całki prowadza˛ do wyjściowej funkcji. W niniejszym rozdziale doprecyzujemy co to oznacza oraz zajmiemy si˛e pożytkami jakie z tego faktu płyna.˛
17.1
Podstawowe twierdzenie rachunku różniczkowego i całkowego
17.1.1
Pochodna całki
Twierdzenie 17.1.1 Niech f : [a, b] → R będzie funkcją całkowalną w sensie Riemanna. Rozważmy funkcję
Z x
F : [a, b] 3 x 7→
f (t)dt.
a
Wtedy
(i) funkcja F jest funkcją Lipschitza,
(ii) jeśli f jest ciągła w punkcie x0 ∈ [a, b] to F jest różniczkowalna w x0 oraz F 0 (x0 ) = f (x0 ).
Dowód: Aby pokazać własność (i) rozważmy x, y ∈ (a, b) spełniające x < y. Niech M := supx∈[a,b] f (x)|. Mamy
Z
y
x
Z
f ¬
y
|f | ¬ M (y − x) = M |y − x|.
x
Zatem F rzeczywiście jest funkcją Lipschitza.
Dla dowodu własności (ii) ustalmy > 0. Z ciągłości f w x0 znajdziemy δ > 0 takie, ze
|x − x0 | < δ ⇒ |f (x) − f (x0 | < .
Zatem dla |h| < δ
Z
Z x0 +h
Z x0 +h
Z x0 +h
x0 +h
F (x0 + h) − F )x0 )
h 1
1
1
= ,
f
(t)dt
−
f
(x
)dt
|f
(t)
−
f
(x
)|
¬
dt
=
¬
−
f
(x
)
=
0 0
0
h
|h| x0
h
|h| x0
|h| x0
x0
co dowodzi, że F jest różniczkowalna w x0 oraz F 0 (x0 ) = f (x0 ).
269
270
17.1.2
ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Funkcja pierwotna i całka nieoznaczona.
Definicja 17.1.2 Niech f : [a, b] → R. Mówimy, że F : [a, b] → R jest funkcją pierwotną funkcji f jeżeli F jest
różniczkowalna oraz F 0 (x) = f (x) dla każdego x ∈ [a, b].
Z twierdzenia 17.1.1 łatwo wyprowadzamy następujacy wniosek.
Wniosek 17.1.3 Jeśli f : [a, b] → R jest ciągła to funkcja
Z
[a, b] 3 x 7→
x
f (t)dt ∈ R
a
jest funkcją pierwotna funkcji f .
Naturalne jest pytanie czy funkcja f moze mieć więcej niż jedną pierwotną. Dodając do pierwotnej funkcję stałą dostajemy
inną pierwotną tej samej funkcji, bo pochodna funkcji stałej jest zero. Okazuje się, że więcej pierwotnych już nie ma jak
wynika z następującego twierdzenia.
Twierdzenie 17.1.4 Jeśli F1 i F2 są pierwotnymi funkcji f , to różnica F1 − F2 jest funkcja stałą.
Dowód: Niech F := F1 − F2 . Funkcja F jest różniczkowalna oraz F 0 = F10 − F20 = 0. Niech x, y ∈ [a, b] i x < y. Z
twierdzenia o wartości średniej wiemy, że istnieje ξ ∈ (x, y) takie, że
F (x) − F (y) = F 0 (ξ)(x − y) = 0.
Zatem F (x) = F (y), a ponieważ x, y są dowolne, otrzymujemy tezę.
Wygodnie jest zebrać wszystkie pierwotne razem.
Definicja 17.1.5 Niech f : [a, b] → R będzie funkcją całkowalną
w sensie Riemanna. Zbiór wszystkich pierwotnych
R
funkcji f nazywamy całką nieoznaczoną f i oznaczamy f .
R
W szczególności zapis F ∈ f oznacza, że F jest fukcją pierwotną f . Stosowany jest również tradycyjny, choć mało
precyzyjny zapis
Z
F (x) = f (x)dx + C,
który należy interpretować tak, że wybierając jakąś pierwotną z całki nieoznaczonej i dodając do niej stałą dostaniemy inną
pierwotną.
17.1.3
Podstawowe twierdzenie rachunku różniczkowego i całkowego
Leibniz i Newton odkryli, że znajomość pierwotnej pozwala wygodnie obliczać pole pod wykresem funkcji. Jest to nieporównalnie łatwiejsze od liczenia sum aproksymacyjnych Riemanna. Natomiast maszynką dostarczające liczne (choć niestety
nie wszystkie potrzebne) wzory na funkcje pierwotne są wszelkie wzory na pochodne.
Twierdzenie 17.1.6 (podstawowe twierdzenie rachunku różniczkowego i całkowego) Niech f : [a, b] → R
będzie całkowalna w sensie Riemanna. Jeśli F jest pierwotną funkcji f to
Z x
F (x) =
f (t)dt + F (a).
(17.1)
a
W szczególności
Z
b
f (t)dt = F (b) − F (a).
a
(17.2)
17.2. PODSTAWOWE TECHNIKI CAŁKOWANIA.
271
Dla wygody w dalszym ciągu stosować będziemy zapis F |ba := F (b) − F (a).
Dowód: Pokażemy najpierw (17.2). Dla k ∈ N1 wybierzmy podział P k przedziału [a, b] o średnicy nie większej niż
zadanym ciągiem xk : {0, 1, . . . nk } → R. Z twierdzenia o wartości średniej zastosowanego do F mamy
F (b) − F (a) =
n
X
F 0 (ξik )(xki − xki−1 )
1
k,
(17.3)
i=1
dla pewnych punktów ξik ∈ (xki−1 , xki ). Ponieważ F 0 (xki ) = f (xki ), więc prawa strona równości (17.3) jest sumą aproksymacyjRb
ną dla f na [a, b]. Zatem z twierdzenia Riemanna (tw. 16.2.16) prawa strona (17.3) zmierza do a f przy k → ∞, bo podziały
P k dobraliśmy tak, by ich średnice zmierzały do zera. Ale na mocy równości (17.3) wszystkie te sumy aproksymacyjne są
równe F (b) − F (a), zatem i granica jest równa F (b) − F (a) co dowodzi (17.2).
Aby pokazać (17.1) wystarczy zastosować pokazany już wzór (17.2) do zawężenia f|[a,x] .
17.2
Podstawowe techniki całkowania.
17.2.1
Własności całki nieoznaczonej.
Podamy teraz kilka podstawowych wzorów dla całki nieoznaczonej. Pojawiające się w nich funkcje rozważać będziemy na
przedziale [a, b]. Symbolem Const oznaczać będziemy rodzinę funkcji stałych na przedziale [a, b].
Twierdzenie 17.2.1 (liniowość całki nieoznaczonej). Niech f, g : [a, b] → R będą całkowalne w sensie Riemanna.
Wtedy f + g jest całkowalna w sensie Riemanna oraz
Z
Z
Z
(f + g) = f + g.
(17.4)
Ponadto αf jest całkowalna w sensie Riemanna dla dowolnego α ∈ R oraz
Z
Z
(αf ) = α f.
(17.5)
Zauważmy, że wzory (17.4) i (17.5) należy rozumieć jako równość zbiorów, ponieważ całka nieoznaczona jest zbiorem, a
dokładniej zbiorem funkcji pierwotnych.
Dowód: Całkowalność funkcji αf + βg i funkcji αf dostajemy wprost z twierdzenia 16.2.2. Zauważmy, że jeżeli F jest
pierwotną f , a G jest pierwotną g, to F +G jest pierwotną f +g na podstawie twierdzenia o pochodnej sumy funkcji. Dowodzi
to zawieranie się strony prawej w lewej we wzorze (17.4). Aby pokazać inkluzję przeciwną załóżmy, że H jest elementem
lewej strony równości (17.4). Wtedy H jest pierwotną funkcji f + g. Niech F będzie dowolnie ustaloną pierwotną funkcji f .
Połóżmy G : H − F . Mamy G0 = H 0 − F 0 = (f + g) − f = g. Zatem G jest pierwotną funkcji g, a ponieważ H = F + G,
więc H jest sumą pierwotnej funkcji f i pierwotnej funkcji g. Zatem H należy do prawej strony (17.4).
Dowód (17.5) jest podobny i zostawiamy go jako ćwiczenie.
Następujące twierdzenia są natychmiastową konsekwencją stosownych wzorów dla pochodnych i definicji całki nieoznaczonej.
272
ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Twierdzenie 17.2.2 Zachodzą następujące wzory
Z
0[a,b] dx = Const,
Z
1
dx = ln x + Const,
x
Z
ex dx =
Z
1[a,b] dx = x + Const,
Z
xα dx =
xα+1
+ Const dla α 6= −1,
α+1
ex + Const .
Twierdzenie 17.2.3 Zachodzą następujące wzory
Z
sin xdx = − cos x + Const,
Z
1
dx = tg x + Const,
cos2 x
Z
1
dx
1 + x2
Z
cos xdx = sin x + Const,
Z
=
√
1
dx = arc sin x + Const,
1 − x2
arc tg x + Const .
17.2.2
Całkowanie przez części
Widzieliśmy, że całkowanie sumy dwóch funkcji jest proste. Jest tak, bo pochodna sumy jest suma˛ pochodnych i w efekcie również całka sumy jest suma˛ całek.
Niestety pochodna iloczynu nie jest iloczynem pochodnych, a w efekcie całka iloczynu nie jest iloczynem całek. Dlatego nie jest oczywiste jak liczyć całki iloczynu
dwóch funkcji. Jednak wzór na pochodna˛ iloczynu jest w tym przypadku pomocny, chociaż nie bezpośrednio i nie automatycznie. Całkujac
˛ wzór na pochodna˛
iloczynu dostajemy
Z
Z
Z
(f g)0 =
f 0g +
f g0 .
Ponieważ f g jest pierwotna˛ (f g)0 , dostajemy
Z
f g + Const =
f 0g +
Z
f g0 .
˛ a˛ liczenie całki
RJeśli0 jedna z dwóch całek
R po prawej stronie jest łatwiejsza do policzenia niż druga, to wzór ten mozemy potraktować jako metod˛e sprowadzajac
f g do liczenia całki f g 0 . Jak zobaczymy, metoda ta może być użyteczna. Określana jest mianem całkowania przez cz˛eści.
Twierdzenie 17.2.4 Załóżmy, że f, g : [a, b] → R są klasy C 1 . Wtedy
Z
Z
0
f g = f g − f g0
(17.6)
W szczególności mamy też wzór dla całek oznaczonych:
Z
a
b
f 0 (x)g(x)dx = f (x)g(x)|ba −
Z
a
b
f (x)g 0 (x)dx.
(17.7)
17.2. PODSTAWOWE TECHNIKI CAŁKOWANIA.
273
Dowód: Niech F będzie elementem lewej strony wzoru (17.6). Wtedy F 0 = f 0 g. Mamy
F = f g − (f g − F ).
Zatem aby pokazać, że F jest elementem prawej strony wzoru (17.6), wystarczy pokazać, że f g − F jest pierwotną funkcji
f g 0 . Jest tak w istocie, bo
(f g − F )0 = (f g)0 − F 0 = f 0 g + f g 0 − f 0 g = f g 0 .
Rozważmy teraz element prawej strony równości (17.6). Ma on postać f g − G, gdzie G jest pierwotną f g 0 . Musimy pokazać,
że f g − G jest pierwotną f 0 g. Rzeczywiście tak jest, bo
(f g − G)0 = f 0 g + f g 0 − f g 0 = f 0 g.
Aby pokazać (17.7) wybierzmy F pierwotną dla f 0 g. Ze wzoru (17.6) wiemy, że F = f g − G, gdzie G jest pewną pierwotną
f g 0 . W szczególności
F (b)
=
f (b)g(b) − G(b)
F (a)
=
f (a)g(a) − G(a).
Odejmując te równości stronami dostajemy
F (b) − F (a) = f (b)g(b) − f (a)g(a) − (G(b) − G(a)).
(17.8)
W oparciu o przyjętą konwencję zapisywania różnic mamy
f (b)g(b) − f (a)g(a) = f (x)g(x)|ba .
Z podstawowego twierdzenia rachunku różniczkowego i całkowego (tw. 17.1.6) oraz z definicji F i G jako funkcji pierwotnych
odpowiednio f 0 g oraz f g 0 otrzymujemy
Z
F (b) − F (a)
b
f 0 (x)g(x)dx
=
a
Z
G(b) − G(a)
=
b
f (x)g 0 (x)dx.
a
Wstawiając otrzymane trzy równości do (17.8) otrzymujemy (17.7).
274
ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Przykład 17.2.5 Metodę całkowania przez części zastosujemy do policzenia całki
Z
x sin xdx.
Musimy w tym celu przedstawić funkcję x 7→ x sin x jako iloczyn pewnej funkcji przez pochodną innej funkcji. Mamy
dwie możliwości:
x sin x = x(− cos x)0
lub
x sin x =
x2
2
0
sin x
i nie jest oczywiste, z której lepiej skorzystać. Pierwsza sprowadzi problem do policzenia całki
Z
(x)0 (− cos x)dx,
a druga do całki
Z x2
2
(sin x)0 dx.
Z tych dwóch całek zdecydowanie łatwiejsza jest pierwsza, bo
Z
Z
(x)0 (− cos x)dx = − cos xdx = − sin x + Const .
Zatem wstawiając do wzoru (17.6) za f funkcję x 7→ − cos x, a za g funkcję identycznościową x 7→ x dostajemy
Z
Z
Z
Z
x sin xdx = (− cos x)0 xdx = −x cos x − (− cos x)x0 dx = −x cos x + cos xdx = −x cos x + sin x + Const .
17.2.3
Całkowanie przez podstawienie
Podobnie jak w przypadku iloczynu nie jest oczywiste jak całkować złożenie funkcji. Pochodna złożenia nie jest złożeniem pochodnych zatem i całka złożenia nie
jest złożeniem całek. Jednak całkujac
˛ wzór na pochodna˛ złożenia dostajemy wzór dostarczajacy
˛ metod˛e liczenia całek przydatna˛ w przypadku złożeń i zwana˛
całkowaniem przez podstawienie.
Twierdzenie 17.2.6 Załóżmy, że f : [a, b] → R jest funkcją ciągłą, a g : [α, β] → [a, b] jest klasy C 1 . Jeśli F jest
pierwotną funkcji f to F ◦ g jest pierwotną funkcji (f ◦ g)g 0 . W konsekwencji
Z Z
(f ◦ g)g 0 =
f ◦ g.
(17.9)
W szczególności
Z
β
α
f (g(t))g 0 (t)dt =
Z
g(β)
f (x)dx.
(17.10)
g(α)
Dowód: Jeśli F jest pierwotną funkcji f to oczywiście F ◦ g jest pierwotną funkcji (f ◦ g)g 0 , zatem prawa strona
zawiera się w lewej w (17.9). Aby pokazać, że lewa strona zawiera się w prawej przyjmijmy, że G jest pierwotną funkcji
(f ◦ g)g 0 . Wybierzmy też pewną pierwotną F funkcji f . Wiemy już, że wtedy F ◦ g jest pierwotną (f ◦ g)g 0 , zatem na mocy
17.2. PODSTAWOWE TECHNIKI CAŁKOWANIA.
275
twierdzenia 17.1.4 istnieje stała C taka, że G = F ◦ g + C. Mamy
G = F ◦ g + C = F ◦ g + C ◦ g = (F + C) ◦ g = F̄ ◦ g,
gdzie F̄ = F + C jest inną pierwotną f . Zatem G jako podstawienie g w pierwotnej F̄ funkcji f należy do prawej strony
równości (17.9).
Pozostaje pokazać (17.10). Wiemy, że jeśli F jest pierwotną f to F ◦ g jest pierwotną (f ◦ g)g 0 . Zatem z podstawowego
twierdzenia rachunku różniczkowego i całkowego (tw. 17.1.6) mamy
Z g(β)
Z β
0
f (x)dx.
f (g(t))g (t)dt = (F ◦ g)(α) − (F ◦ g)(β) = F (g(α)) − F (g(β)) =
g(α)
α
R
x
R
x
R
x ln a
Przykład 17.2.7
Policzymy całkę
dx. Chcielibyśmy sprowadzić poR
R nieoznaczoną a dx. Mamy a dx = e
liczenie całki ex ln a dx do całki eu du. Funkcja x 7→ ex ln a jest podstawieniem funkcji g : x 7→ x ln a w funkcji
f : u 7→ eu . Ponieważ pochodną g jest funkcja stała ln a, więc z twierdzenia 17.2.6 mamy
Z
Z
Z
Z
1
1
ax dx =
ex ln a dx =
ex ln a ln adx =
eu du ◦ (x 7→ x ln a) =
ln a
ln a
1
ax
1
(eu + Const) ◦ (x 7→ x ln a) =
ex ln a + Const =
+ Const .
ln a
ln a
ln a
17.2.4
Twierdzenia o wartości średniej dla całek
Twierdzenie 17.2.8 (o wartości średniej dla całek) Niech f : [a, b] → R będzie funkcją klasy C 1 , a g : [a, b] → R
funkcją całkowalną w sensie Riemanna. Jeśli g ma stały znak na [a, b] to istnieje ξ ∈ [a, b] takie, że
Z
b
Z
f g = f (ξ)
a
b
g.
(17.11)
a
Dowód: Rozważmy przypadek g 0. Połóżmy m := inf { f (x) | x ∈ [a, b] }, M := sup { f (x) | x ∈ [a, b] } i ustalmy
x ∈ [a, b]. Wtedy m ¬ f (x) ¬ M , a zatem również mg(x) ¬ f (x)g(x) ¬ M g(x). Całkując dostajemy
Z b
Z b
Z b
m
g(t)dt ¬
f (t)g(t)dt ¬
M g(t)dt.
a
Rb
a
a
Rb
g = 0, to również a f g = 0 i w konsekwencji (17.11) zachodzi dla dowolnie
Rb
dobranego ξ. Pozostaje zatem rozważyć przypadek a g 6= 0. Wtedy
Rb
fg
m ¬ Ra b ¬ M.
g
a
Z otrzymanej nierówności wynika, że jeśli
a
Zatem z twierdzenia 11.2.14 i wniosku 11.4.7 znajdziemy ξ ∈ [a, b] takie, że
Rb
fg
f (ξ) = Ra b
g
a
co dowodzi (17.11) dla g 0. Rozumowanie dla g ¬ 0 jest analogiczne.
Przyjmując w twierdzeniu 17.2.8 za g funkcję stale równą jeden dostajemy następujący wniosek.
276
ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Wniosek 17.2.9 Jeśli f : [a, b] → R jest klasy C 1 , to istnieje ξ ∈ [a, b] takie, że
b
Z
f = f (ξ)(b − a).
a
W programie Mathematica całkę nieoznaczoną (a dokładniej jedną z funkcji pierwotnych) funkcji f obliczamy używając
instrukcji
Integrate[f[x], x]
Na przykład
Integrate[Sin[3 x]^7, x]
zwraca
−
17.3
35
7
7
cos(21x)
cos(3x) +
cos(9x) −
cos(15x) +
192
192
960
1344
Całkowanie funkcji wektorowych
Rozważmy funkcję f : [a, b] → Rm . Funkcję taką określać będziemy mianem krzywej. Wtedy f = (f1 , f2 , . . . , fm ) gdzie
fi : [a, b] → R dla i = 1, 2, . . . , m.
Definicja 17.3.1 Mówimy, że f jest całkowalna w sensie Riemanna jeżeli funkcje fi są całkowalne w sensie Riemanna
dla wszystkich i = 1, 2, . . . , m. W takim przypadku jako całkę Riemanna f przyjmujemy
Z
b
b
Z
f := (
a
Z
f1 ,
a
b
Z
f2 , . . . ,
a
b
fm ).
a
Twierdzenie 17.3.2 Niech f : [a, b] → Rm będzie całkowalna w sensie Riemanna. Wtedy funkcja
||f || : [a, b] 3 x 7→ ||f (x)|| ∈ R
jest całkowalna w sensie Riemanna oraz
Z
||
b
Z
f || ¬
a
b
||f ||.
a
Dowód: Niech f = (f1 , f2 , . . . fm ). Z założenia funkcje fi są całkowalne w sensie Riemanna. Ponieważ funkcja
Rm 3 x 7→ ||x|| ∈ R
jest ciągła, zbiór punktów nieciągłości funkcji ||f || zawiera się w sumie mnogościowej zbiorów punktów nieciągłości funkcji
fi . Na mocy twierdzenia 16.2.9 całkowalność funkcji fi implikuje, że zbiór punktów nieciągłości funkcji fi jest miary zero.
Zatem również zbiór punktów nieciągłości funkcji ||f || jest miary zero, a więc z twierdzenia 16.2.9 wnosimy, że funkcja ta
jest całkowalna w sensie Riemanna.
Rb
Połóżmy vi := a fi i v = (v1 , v2 , . . . vn ). Jeśli v = 0 to teza jest oczywista. Załóżmy zatem, że v 6= 0. Dla x ∈ [a, b] mamy
z nierówności Schwartza
|v · f (x)| ¬ ||v|| ||f (x)||.
17.4. ZASTOSOWANIA GEOMETRYCZNE CAŁEK
277
Funkcja
[a, b] 3 x 7→ v · f (x) =
m
X
vi fi (x) ∈ R
i=1
jest całkowalna w sensie Riemanna. Zatem
2
||v|| =
m
X
vi vi =
i=1
m
X
i=1
Z
vi
b
Z
Z
b
v·f ¬
fi =
a
b
Z
||v|| ||f (x)||dx = ||v||
a
a
b
||f (x)||dx.
a
Dzieląc otrzymaną nierówność obustronnie przez ||v|| otrzymujemy
b
Z
||v|| ¬
||f (x)||dx.
a
Ponieważ v =
Rb
a
f , dowodzi to tezy.
17.4
Zastosowania geometryczne całek
17.4.1
Długość krzywej
Niech γ : [a, b] → Rm będzie krzywą i niech P będzie podziałem przedziału [a, b] zadanym ciągiem punktów (x0 , x1 , . . . xn ).
Liczba
m
X
Λ(γ, P) :=
||γ(xi ) − γ(xi−1 )||
i=1
określa długość łamanej rozpiętej na punktach γ(xi ).
Definicja 17.4.1 Mówimy, że krzywa γ jest prostowalna jeżeli istnieje kres górny
Λ(γ) := sup { Λ(γ, P) | P podział przedziału [a,b] }.
Mówimy wtedy, że liczba Λ(γ) jest długością krzywej γ.
Twierdzenie 17.4.2 Niech γ : [a, b] → Rm będzie krzywą klasy C 1 . Wtedy γ jest prostowalna oraz
b
Z
||γ 0 (t)||dt.
Λ(γ) =
(17.12)
a
Dowód: Pokażemy najpierw, że w (17.12) lewa strona jest niewiększa od prawej. Niech P będzie podziałem przedziału
[a, b] wyznaczonym przez punkty x0 , x1 , . . . xn . Wtedy
Z xi
Z xi
0
||γ(xi ) − γ(xi−1 )|| = ||
γ (t)dt|| ¬
||γ 0 (t)dt||
xi−1
xi−1
dla i = 1, 2, . . . n. Sumując po i dostajemy
Z
Λ(γ, P) ¬
a
b
||γ 0 (t)dt||,
278
ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
a ponieważ P jest dowolnym podziałem [a, b] otrzymujemy
Z
b
Λ(γ) ¬
||γ 0 (t)||dt.
a
Dla dowodu nierówności przeciwnej ustalmy > 0. Założyliśmy, że γ jest klasy C 1 , więc γ 0 jest funkcją ciągłą. Jako
funkcja ciągła na zbiorze zwartym jest ona jednostajnie ciągła. Zatem znajdziemy δ > 0 takie, że dla s, t ∈ [a, b]
|s − t| < δ ⇒ ||γ 0 (s) − γ 0 (t)|| < 0 :=
.
2(b − a)
(17.13)
Niech P będzie podziałem przedziału [a, b] wyznaczonym przez punkty x0 , x1 , . . . xn o średnicy nie przekraczającej δ. Z
(17.13) wnosimy, że dla t ∈ [xi−1 , xi ]
||γ 0 (t)|| ¬ ||γ 0 (t) − γ 0 (xi )|| + ||γ 0 (xi )|| ¬ ||γ 0 (xi )|| + 0 .
Niech ∆xi := xi − xi−1 . Z (17.14) mamy
Z xi
Z xi
Z
0
0
0
0
0
||γ (t)dt|| ¬
(||γ (xi )|| + ) dt = ||γ (xi )||∆xi + ∆xi = ||
xi−1
xi−1
Z xi
||
xi−1
Z xi
||
xi
(17.14)
γ 0 (xi )dt|| + 0 ∆xi =
xi−1
(γ 0 (t) + γ 0 (xi ) − γ 0 (t)) dt|| + 0 ∆xi ¬
γ 0 (t)dt|| + ||
Z
xi−1
xi
(γ 0 (xi ) − γ 0 (t)) dt|| + 0 ∆xi ¬
xi−1
0
||γ(xi ) − γ(xi−1 )|| + 2 ∆xi .
Sumując po i dostajemy
Z
b
||γ 0 (t)||dt ¬ Λ(γ, P) + 20 (b − a) = Λ(γ, P) + ¬ Λ(γ) + .
a
Ponieważ otrzymana nierówność zachodzi dla każdego > 0, otrzymujemy
Z
b
||γ 0 (t)||dt ¬ Λ(γ).
a
Przykład 17.4.3 Rozważmy krzywą
γ : [0, 2π] 3 t 7→ eit ∈ R2 .
Krzywa ta jest klasy C 1 oraz γ 0 (t) = ieit . Zatem ||γ 0 (t)|| = 1. Stąd
Z
Λ(γ) =
2π
||γ 0 (t)||dt =
0
17.4.2
Z
2π
dt = 2π − 0 = 2π.
0
Bryła obrotowa
Niech f : [a, b] → R+ będzie funkcją ciągłą. Rozważmy bryłę
V := { (x, y, z) ∈ R3 | a ¬ x ¬ b, y 2 + z 2 ¬ f (x)2 }
17.4. ZASTOSOWANIA GEOMETRYCZNE CAŁEK
279
Nazywamy ją bryłą obrotową zadaną przez funkcję f .
Bryła ta powstaje poprzez obrót trapezu krzywoliniowego pod wykresem funkcji f wokół osi x.
17.4.3
Obętość bryły obrotowej
Twierdzenie 17.4.4 Objętość bryły obrotowej dana jest wzorem
Z
π
b
f (x)2 dx.
a
17.4.4
Pole powierzchni bocznej bryły obrotowej
Powierzchnią boczną bryły obrotowej jest zbiór
S := { (x, y, z) ∈ R3 | a ¬ x ¬ b, y 2 + z 2 = f (x)2 }
280
ROZDZIAŁ 17. FUNKCJA PIERWOTNA I CAŁKA NIEOZNACZONA
Twierdzenie 17.4.5 Jeśli funkcja f jest klasy C 1 , to pole powierzchni bocznej bryły obrotowej dane jest wzorem
Z
2π
a
b
p
f (x) 1 + f 0 (x)2 dx.
Rozdział 18
Ciągi i szeregi funkcyjne
18.1
Zbieżność punktowa i jednostajna
18.1.1
Zbieżność punktowa
Niech X będzie ustalonym zbiorem, a Y ustaloną przestrzenią metryczną. Rozważmy ciąg funkcji sn : X → Y .
Definicja 18.1.1 Mówimy, że ciąg sn jest zbieżny punktowo do funkcji s : X → Y , jeżeli dla każdego punktu x ∈ X
ciąg sn (x) jest zbieżny do s(x).
Rozpisując warunek na zbieżność ciągu możemy zatem zbieżność punktową zapisać
∀x ∈ X ∀ > 0 ∃N ∈ N ∀n N
ρ(sn (x), s(x)) < .
Przykład 18.1.2 Rozważmy ciąg funkcji
fn : [0, 1] 3 x 7→ xn ∈ [0, 1].
Łatwo policzyć, że ciąg ten jest zbieżny punktowo do funkcji f : [0, 1] → [0, 1] danej wzorem
(
0 gdy x ∈ [0, 1),
f (x) :=
1 gdy x = 1.
Choć funkcje fn są ciągłe, funkcja graniczna f nie jest ciągła. Widzimy zatem, że zbieżność punktowa funkcji ciągłych
nie gwarantuje, że funkcja graniczna będzie ciągła.
281
282
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Przykład 18.1.3 Rozważmy ciąg funkcji
fn : [0, 1] 3 x 7→ lim (cos(n!πx))2m ∈ [0, 1].
m→∞
Łatwo policzyć, że dla każdego n funkcja fn przyjmuje wartość zero wszędzie poza skończoną ilością punktów, gdzie
przyjmuje wartość jeden. Zatem każda z funkcji fn jest całkowalna w sensie Riemanna. Ciąg fn jest zbieżny punktowo
do funkcji f : [0, 1] → [0, 1] danej wzorem
(
0 gdy x 6∈ [0, 1] ∩ Q,
f (x) :=
1 gdy x ∈ [0, 1] ∩ Q.
Nie jest to funkcja całkowalna w sensie Riemanna, zatem zbieżność punktowa nie gwarantuje również zachowania
całowalności w sensie Riemanna.
Przykład 18.1.4 Rozważmy ciąg funkcji
sin nx
fn : R 3 x 7→ √
∈ R.
n
Łatwo sprawdzić, że ciąg ten jest punktowo zbieżny do funkcji stale równej zero. Wszystkie funkcje fn są różniczkowalne,
a ich pochodne tworzą ciąg
√
fn0 : R 3 x 7→ n cos nx ∈ R.
Ciąg pochodnych nie jest ciągiem punktowo zbieżnym. Na przykład dla x = π dostajemy ciąg
√
n 7→ (−1)n n,
który nie jest zbieżny. Zatem zbieżność punktowa funkcji nie gwarantuje zachowania ich różniczkowalności w granicy.
Przedstawione przykłady pokazują, że punktowa zbieżność ciągu funkcji nie gwarantuje naturalnych własności, które w
wielu sytuacjach byłyby przydatne. Pojawia się pytanie, czy nie ma jakiegoś bardziej użytecznego pojęcia zbieżności ciągu
funkcji. Jak zobaczymy odpowiedź na to pytanie jest pozytywna. W tym celu potraktujemy funkcje jako punkty stosownie
zdefiniowanej przestrzeni metrycznej.
18.1.2
Zbieżność jednostajna
Niech ρ, ρ0 będą dwoma metrykami w zbiorze Y .
Definicja 18.1.5 Mówimy, że metryki ρ i ρ0 są jednostajnie równoważne, jeżeli zachodzą następujące dwa symetryczne
warunki
∀ > 0
∃δ > 0
ρ(x, y) < δ ⇒ ρ0 (x, y) < ,
∀ > 0
∃δ > 0
ρ0 (x, y) < δ ⇒ ρ(x, y) < .
Definicja 18.1.6 Niech (Y, ρ) będzie przestrzenią metryczną. Mówimy, że ρ jest metryką ograniczoną, jeżeli istnieje
stała M > 0 taka, że dla dowolnych x, y ∈ Y mamy ρ(x, y) < M .
Mamy następującą użyteczną własność:
18.1. ZBIEŻNOŚĆ PUNKTOWA I JEDNOSTAJNA
283
Lemat 18.1.7 « Dla dowolnej przestrzeni metrycznej (Y, ρ) istnieje metryka ograniczona ρ0 jednostajnie równoważna metry-
ce ρ. »
284
18.1.3
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Kryterium Cauchy’ego zbieżności jednostajnej
18.2. ZBIEŻNOŚĆ JEDNOSTAJNA, A CIĄGŁOŚĆ, RÓŻNICZKA I CAŁKA
18.2
Zbieżność jednostajna, a ciągłość, różniczka i całka
18.2.1
Granica, a zbieżność jednostajna
285
286
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
18.2.2
Całkowanie i różniczkowanie, a zbieżność jednostajna
18.3
Aproksymacja funkcji ciągłych
18.4
Szeregi potęgowe
18.4. SZEREGI POTĘGOWE
18.4.1
Twierdzenie o szeregu Taylora
18.4.2
Funkcje analityczne
287
288
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
18.5. SZEREGI FOURIERA
289
Rysunek 18.1: Joseph Fourier (1768-1830)
18.5
Szeregi Fouriera
18.5.1
Wielomiany trygonometryczne
290
18.5.2
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Zespolony iloczyn skalarny
18.5. SZEREGI FOURIERA
18.5.3
Przestrzeń wektorowa z zespolonym iloczynem skalarnym
291
292
18.5.4
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Układ ortonormalny
18.5. SZEREGI FOURIERA
18.5.5
Szereg Fouriera
293
294
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
18.5. SZEREGI FOURIERA
295
296
18.5.6
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Rzut ortonormalny
18.5. SZEREGI FOURIERA
18.5.7
Jądro Dirichleta
297
298
18.5.8
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Zbieżność punktowa szeregu Fouriera
18.5. SZEREGI FOURIERA
299
300
ROZDZIAŁ 18. CIĄGI I SZEREGI FUNKCYJNE
Bibliografia
[1] F. Leja, Rachunek różniczkowy i całkowy, Państwowe Wydawnictwo Naukowe, Warszawa 1969.
[2] W. Rudin, Podstawy analizy matematycznej, Państwowe Wydawnictwo Naukowe, Warszawa 1982.
[3] W. Rudnicki, Wykłady z analizy matematycznej, Państwowe Wydawnictwo Naukowe, Warszawa 2001.
[4] G.M. Fichtenholz, Rachunek różniczkowy i całkowy, tom I, II i III. Państwowe Wydawnictwo Naukowe, Warszawa 1978.
[5] W. Krysicki, L. Włodarski, Analiza matematyczna w zadaniach, część I i II, Państwowe Wydawnictwo Naukowe, Warszawa 1986.
[6] J. Banaś, S. Wędrychowicz, Zbiór zadań z analizy matematycznej, Wydawnictwo Naukowo-Techniczne, Warszawa 2001.
301