Bazy danych

advertisement
Bazy danych - jak je ugryźć?
informatyka +
2
Plan prezentacji
1. Kilka definicji na dobry początek.
2. Dane i bazy danych.
3. Podstawy relacyjnego modelu danych.
4. Rozważania o tabeli.
5. Modelowanie z wykorzystaniem tabel relacyjnych.
6. Problemy i anomalie związane z gromadzeniem danych w
tabelach.
7. Systemy Zarządzania Bazami Danych.
8. Spójność i integralność danych.
9. Od rozkładu jazdy do bankowości internetowej.
10.Podsumowanie wykładu – pytania.
informatyka +
3
Dane
• Liczby, znaki, symbole (i cokolwiek
innego) zapisane w celu ich
przetwarzania
• 15,’ Ala’,’12-09-1987’, /…/---/…/,
‘Warszawa’,
To są jakieś dane
Tylko do końca nie wiemy
co one znaczą
Wniosek :
Dane bez uporządkowania i
bez umiejętności ich
interpretacji to najczęściej
„ŚMIETNIK”
informatyka +
4
Krótkie podsumowanie
Dane:
- znaki
- liczby
- teksty
- dźwięki
- obrazy
Bez uporządkowania korzystanie z danych jest
praktycznie niemożliwe
Proces wykorzystywania danych
związany jest z ich przetwarzaniem
informatyka +
5
Informacja
Trudno przytoczyć jedną definicję pojęcia informacja
Informacja to taki czynnik, któremu
człowiek może przypisać określony
sens (znaczenie), aby móc ją
wykorzystywać do różnych celów
Informacje możemy „zdobywać” dzięki
przetwarzaniu i interpretacji danych .
informatyka +
6
Wiedza
Podobnie jak w przypadku informacji – trudno jest
jednoznacznie zdefiniować pojęcie wiedza
Tak definiował to pojecie Platon :
„ogół wiarygodnych informacji o
rzeczywistości wraz z umiejętnością
ich wykorzystywania”
Proszę zwrócić uwagę na fakt, że wiedza to,
miedzy innymi, umiejętność wykorzystania
informacji .
informatyka +
7
Społeczeństwo informacyjne 1
I znów będziemy mieli problem z jednoznacznym
zdefiniowaniem pojęcia społeczeństwo informacyjne
Społeczeństwo charakteryzujące się
przygotowaniem i zdolnością do
użytkowania systemów
informatycznych, skomputeryzowane i
wykorzystujące usługi telekomunikacji
do przesyłania i zdalnego przetwarzania
informacji”
(I Kongres Informatyki Polskiej, 1994)
Wszystko wskazuje na to, że przyszłość należeć będzie
do społeczeństw informacyjnych
informatyka +
8
Społeczeństwo informacyjne 2
Umiejętność korzystania ze zgromadzonych danych
jest jedną z podstawowych cech społeczeństwa
informacyjnego.
informatyka +
9
Podsumowanie części 1
Dane -
powstają na różnych etapach działalności
gromadzimy dane w celu ich późniejszego wykorzystania
przechowując dane należy zapewnić określony porządek
Informacje -
Wiedza
-
często powstaje w wyniku przetwarzania
i interpretacji danych
to miedzy innymi umiejętność
wykorzystania informacji
Społeczeństwo informacyjne
- to także my
informatyka +
Wiedza
10
Plan prezentacji
1. Kilka definicji na dobry początek.
2. Dane i bazy danych.
3. Podstawy relacyjnego modelu danych.
4. Rozważania o tabeli.
5. Modelowanie z wykorzystaniem tabel relacyjnych.
6. Problemy i anomalie związane z gromadzeniem danych w
tabelach.
7. Systemy Zarządzania Bazami Danych.
8. Spójność i integralność danych.
9. Od rozkładu jazdy do bankowości internetowej.
10.Podsumowanie wykładu – pytania.
informatyka +
11
Porozmawiajmy o danych 1
Uczeń
Przedmiot
Nauczyciel
Data
Ocena
Zosia Nowak
3
15-03-2009
Jak widać - dane bez określonego porządku to chaos … i nie ma z
takich danych korzyści
Powoli zbiór danych staje się bardziej przejrzysty
+
Jeszcze trochę pracy i powinnoinformatyka
być dobrze
informatyka +
12
12
Porozmawiajmy o danych 2
Gromadzenie danych musi
zapewnić porządek bo w
przeciwnym razie nie damy
sobie rady w sytuacji gdy
danych będzie bardzo dużo.
Jak sprawnie gromadzić dane zachowując możliwość ich
wykorzystania ?
informatyka +
13
Bazy danych 1
Nauczyciel : Maria Bryła
Nauczyciel: : Józef
Jan Powaga
Nauczyciel
Ostry
Przedmiot :Fizyka
Przedmiot
:Matematyka
Przedmiot :Informatyka
Rodzaj
: Sprawdzian
Rodzaj
Sprawdzian
Rodzaj
: :Sprawdzian
Data wyst. : 17-05-2009
Data
wyst.
:
17-05-2009
Data wyst. : 17-05-2009
Ocena
:3
Ocena
:
5
Ocena
:2
Nazwisko
Lisek
Nazwisko :: Kotek
Sarenka
Imię
:
Jasio
Piotr
Imię
: Zosia
Data
11-02-1991
Data ur.
ur. :: 07-11-1991
11-11-1991
Pesel
:: 07111134498
91021134498
Pesel
91111134498
Kod
96-987
Kod poczt:
poczt: 26-987
26-987
Miasto
:
Sopot
Miasto : Opole
Poznań
Ulica
:: Klonowa
12/8
Długa
62/8
Ulica
Osinowa
22/8
Dane gromadzimy w bazach danych
Baza danych
informatyka +
14
Bazy danych 2
Baza danych to zbiór danych
zapisanych w ściśle określony sposób w
strukturach odpowiadających
założonemu modelowi danych.
Aktualnie najczęściej wykorzystuje się bazy danych
oparte na relacyjnym modelu danych
informatyka +
15
Bazy danych 3
Codziennie korzystamy z
różnych baz danych:
Rozkład jazdy pociągów
Korzystanie z bankomatu
Korzystanie z pomocy
i podpowiedzi w
różnych programach
Wyszukiwarki internetowe
informatyka +
16
Podsumowanie części 2
Dane opisują pewne fakty i zdarzenia
Gromadzimy dane w celu ich późniejszego wykorzystania
Gromadzenie danych bez określonego porządku jest bezsensowne
Dane gromadzimy w bazach danych
Bardzo wiele codziennych czynności związanych jest z korzystaniem
z baz danych
informatyka +
17
Plan prezentacji
1. Kilka definicji na dobry początek.
2. Dane i bazy danych.
3. Podstawy relacyjnego modelu danych.
4. Rozważania o tabeli.
5. Modelowanie z wykorzystaniem tabel relacyjnych.
6. Problemy i anomalie związane z gromadzeniem danych w
tabelach.
7. Systemy Zarządzania Bazami Danych.
8. Spójność i integralność danych.
9. Od rozkładu jazdy do bankowości internetowej.
10.Podsumowanie wykładu – pytania.
informatyka +
18
Relacyjny model danych 1
Sposób modelowania danych w którym
podstawowym pojęciem jest tabela.
Relacja jest pojęciem matematycznym (z
dziedziny teorii zbiorów) i cały model
relacyjny jest doskonale opisany przez
matematyków.
Dobra interpretacja matematyczna
pozwoliła zrealizować dobre
oprogramowanie obsługujące
relacyjne bazy danych.
informatyka +
19
Wybrane cechy modelu relacyjnego 1
Wszystkie wartości zapisywane w tabelach
oparte są na prostych typach danych(brak
struktur złożonych )
Nazwisko
Imię
Adres
Ulica
Nowa
33/21
Kot
Jasio
Kod
12-098
Miasto
Opole
Lis
Hania
65-987
Cicha 17/2 Sopot
Żuk
Piotrek
33-093
Miła 4/3
Gdynia
Języki obce
Rodzeństwo
Angielski,
francuski,
hiszpański
Angielski,
niemiecki
Nie zna
brat Staś, siostra
Mariola
brak
brat Jaś,
brat Staś, siostra
Hania
Powyższa tabela nie spełnia tej cechy - w dalszej części
pokażemy jak można ten problem rozwiązać
informatyka +
20
Wybrane cechy modelu relacyjnego 2
Wszystkie dane w bazie relacyjnej przedstawione są
w formie dwuwymiarowych tabel zwanych relacjami
Płyty
Numer
Nazwa albumu
Rok
wydania
Nazwa
zespołu
1
Kwiaty polskie
1969
Akwarele
2
Help
1967
The Beatles
3
Mrowisko
1971
Klan
4
Rubikone
2009
Piotr Rubik
5
Hellwood
2009
Hunter
informatyka +
21
Wybrane cechy modelu relacyjnego 3
Wszystkie operacje wykonywane są w oparciu o logikę
bez względu na położenie wiersza w tabeli
Ponieważ
w
modelu
relacyjnym kolejność kolumn
i wierszy nie ma żadnego
znaczenia - to widoczne
trzy
postaci
tabel
są
identyczne i można z nich
pobrać dokładnie te same
informacje
informatyka +
22
Wybrane cechy modelu relacyjnego 4
W tabeli musi istnieć kolumna lub zbiór kolumn o
wartościach niepowtarzalnych, pozwalający odnaleźć
konkretny wiersz.
Zaznaczone wiersze są
nierozróżnialne,
Tak naprawdę nie wiadomo czy
jest to pomyłka czy też opis
dwóch różnych osób
Nazwisko
Imię
DataUr.
Nowak
Jan
15-07-1992
Nowak
Piotr
16-10-1992
Kowalski
Jan
22-11-1992
Kowalski
Jan
22-11-1992
Piskorska
Beata
03-05-1992
Pesel
Nazwisko
Imię
DataUr.
92071598712
Nowak
Jan
15-07-1992
92101675643
Nowak
Piotr
16-10-1992
92112287965
Kowalski
Jan
22-11-1992
92112233562
Kowalski
Jan
22-11-1992
92050322411
Piskorska
Beata
03-05-1992
Dodatkowa kolumna „Pesel”
– umożliwiła rozróżnienie
dwóch osób. Pesel może
być uznany za klucz
podstawowy.
Taką kolumnę (lub zbiór) nazywamy kluczem podstawowym
(ang. primary key)
informatyka +
23
Relacyjny model danych 2
Projekt bazy danych, opartej na
modelu relacyjnym, polega na
opisaniu pewnej dziedziny życia za
pomocą wielu tabel
Każda tabela opisuje jeden rodzaj
obiektów (np. uczeń, klient, książka)
lub zdarzeń (np. wystawiona ocena,
wykonany przelew, wizyta lekarska)
Projektując bazę danych zapewnia się możliwość łączenia ze
sobą danych zawartych w różnych tabelach.
Więcej o projektowaniu relacyjnej bazy danych w dalszej części
wykładu
informatyka +
24
Podsumowanie części 3
Model relacyjny opiera się na pojęciu tabeli
Każda tabela musi posiadać klucz podstawowy
W modelu relacyjnym nieistotna jest kolejność kolumn i
wierszy
Baza danych oparta na modelu relacyjnym składa się z
wielu tabel opisujących pewną dziedzinę życia.
Bazy relacyjne są aktualnie najbardziej
rozpowszechnione.
informatyka +
25
Plan prezentacji
1. Kilka definicji na dobry początek.
2. Dane i bazy danych.
3. Podstawy relacyjnego modelu danych.
4. Rozważania o tabeli.
5. Modelowanie z wykorzystaniem tabel relacyjnych.
6. Problemy i anomalie związane z gromadzeniem danych w
tabelach.
7. Systemy Zarządzania Bazami Danych.
8. Spójność i integralność danych.
9. Od rozkładu jazdy do bankowości internetowej.
10.Podsumowanie wykładu – pytania.
informatyka +
26
Tabela relacyjna
Sztuczny klucz
podstawowy
Iducznia
Cechy tabeli relacyjnej
Uczniowie
Nazwisko
Imie
Data_ur
Pesel
1
Nowak
Jan
11.09.1991
91091145654
2
Rybak
Zofia
12.11.1991
91111256744
3
Kowal
Stefan
21.02.1992
92022172138
4
Kozak
Jan
17.08.1992
92081711737
5
Pływak
Anna
04.02.1993
93020495571
I już mamy tabelę wraz z zawartością 
informatyka +
1.Przeznaczenie
2.Kolumny –
określają cechy
opisywanego
obiektu
3.Klucz
podstawowy
4.Wiersze –
suma cech
danego obiektu
27
Normalizacja – podstawa projektowania
Faktury
Idfaktury
Numer
Data_w
Netto
Vat
Firma
Nip
Ulica
Miasto
1
234/08
11.08.08
345.67
71.22
Wedel
1234652789
Nowa 3
Warszawa
2
43/08
12.08.08
763.00
167.00
Wedel
1234652789
Nowa 3
Warszawa
3
01/2008
15.08.08
322.00
68.65
Złotex
6573298722
Miła 7
Sopot
4
11.08/1
22.09.08
100.00
22.00
Koral
5582998721
Dobra 1
Opole
5
34w/08
28.09.08
882.00
187.00
Wedel
1234652789
Nowa 3
Warszawa
6
987/08
02.10.08
250.55
58.12
Złotex
6573298722
Miła 7
Sopot
7
002.08
11.10.08
891.00
201.15
Złotex
6573298722
Miła 7
Sopot
Redundancja!!!!!!!!!!!!!!
I co tutaj nie gra 
informatyka +
28
Normalizacja – podstawa projektowania
Faktury
Idfaktury
Numer
Data_w
Netto
Vat
1
234/08
11.08.08
345.67
71.22
2
43/08
12.08.08
763.00
3
01/2008
15.08.08
4
11.08/1
5
Klucz obcy
Idfirmy
1
1
Wedel
1234652789
Nowa 3
Warszawa
167.00
1
1
Wedel
1234652789
Nowa 3
Warszawa
322.00
68.65
2
Złotex
6573298722
Miła 7
Sopot
22.09.08
100.00
22.00
2
3
3
Koral
5582998721
Dobra
Warszawa
34w/08
28.09.08
882.00
187.00
1
1
Wedel
1234652789
Nowa 3
Warszawa
6
987/08
02.10.08
250.55
58.12
2
2
Złotex
6573298722
Miła 7
Sopot
7
002.08
11.10.08
891.00
201.15
2
2
Złotex
6573298722
Miła 7
Sopot
Firmy
IdFirmy
Firma
Nip
Ulica
Miasto
1
Wedel
1234652789
Nowa 3
Warszawa
2
Złotex
6573298722
Miła 7
Sopot
3
Koral
5582998721
Dobra 1
Opole
informatyka +
29
Podsumowanie części 4
Model relacyjny opiera się na pojęciu tabeli
Każda tabela musi posiadać klucz podstawowy
W modelu relacyjnym nieistotna jest kolejność
kolumn i wierszy
Baza danych oparta na modelu relacyjnym
składa się z wielu tabel opisujących pewną
dziedzinę życia.
Bazy relacyjne są aktualnie najbardziej
rozpowszechnione.
informatyka +
30
Plan prezentacji
1. Kilka definicji na dobry początek.
2. Dane i bazy danych.
3. Podstawy relacyjnego modelu danych.
4. Rozważania o tabeli.
5. Modelowanie z wykorzystaniem tabel relacyjnych.
6. Problemy i anomalie związane z gromadzeniem danych w
tabelach.
7. Systemy Zarządzania Bazami Danych.
8. Spójność i integralność danych.
9. Od rozkładu jazdy do bankowości internetowej.
10.Podsumowanie wykładu – pytania.
informatyka +
31
Przykładowy projekt bazy danych
Schemat bazy danych do rejestrowania ocen uczniów
informatyka +
32
Przykładowe fragmenty baz danych
Rejestr wypożyczeń książek
Tabela opisująca
wypożyczenia
książek
Powiązanie
pomiędzy
tabelami
Tabela
słownikowa
Powiązanie
pomiędzy
tabelami
Powiązanie
pomiędzy
tabelami
Tabela opisująca
książki
Tabela opisująca
osoby
informatyka +
33
Analiza pewnego problemu 1
Wyobraźmy sobie, że w pewnej bazie
danych istnieje tabela o nazwie „Klienci” o
strukturze pokazanej na rysunku obok
Przykładowa zawartość takiej tabeli mogłaby wyglądać tak
jak na rysunku poniżej
Proszę zwrócić uwagę na fakt, że jak brak pewnych danych to
w tabeli przechowywana jest specyficzna wartość null
informatyka +
34
Analiza pewnego problemu 2
W trakcie eksploatacji naszej przykładowej bazy danych wyniknął problem,
ponieważ użytkownicy bazy danych chcieliby dodatkowo przechowywać
dane o numerze telefonu komórkowego.
Rozwiązaniem problemu mogłoby być dodanie do tabeli Klienci
dodatkowej kolumny TelefonKomorkowy – tak jak poniżej
Tak mogłaby wyglądać zmodyfikowana
tabela
… a tak zawartość tej tabeli
informatyka +
35
Analiza pewnego problemu 3
… ale czy mamy pewność, że w trakcie dalszej eksploatacji
tej bazy danych nie będzie potrzeby dodawania kolejnych
kolumn np. żeby zapisać więcej niż jeden numer telefonu
albo adres strony www, numer faksu (… a może dwa
numery), numer GG … itd.
… a może chwila zastanowienia i
rozwiązać ten problem raz a dobrze
???
informatyka +
36
Analiza pewnego problemu 4
Problem rozwiążemy w trzech krokach :
1.Utworzymy tabelę słownikową o
nazwie „RodzajeKontaktow”
2. Z tabeli „Klienci”
usuniemy kolumny
opisujące numery telefonów
itp.
3.Utworzymy nową tabelę (tzw.
tabelę asocjacyjną) o nazwie
„KontaktyKlienta”
informatyka +
37
Analiza pewnego problemu 5
Model bazy danych
informatyka +
38
Analiza pewnego problemu 6
Przykładowa zawartość tabel (RodzajeKontaktow)
Tabele podobnego typu nazywamy
tabelami słownikowymi.
Jeżeli będziemy dodatkowo
potrzebowali przechowywać w
bazie danych informacje o
numerach Gadu Gadu i adresy
stron WWW – to wystarczy
dopisać kolejne wiersze do tabeli
informatyka +
39
Analiza pewnego problemu 7
Przykładowa zawartość tabel (Klienci)
W tabeli „Klienci” nie zapisujemy teraz danych o numerach
telefonów, adresach e-mail itp.
Dodatkowo uzyskujemy jeszcze jedna korzyść – w sytuacji
gdy dany klient nie ma telefonu lub innego środka łączności,
nie musimy przechowywać w tabeli wartości null.
informatyka +
40
Analiza pewnego problemu 8
Przykładowa zawartość tabel (KontaktyKlienta)
Tabele tego typu nazywamy tabelą powiązań (asocjacyjną)
Dane zawarte w tabeli KontaktyKlienta wymagają
interpretacji, żeby stały się czytelne
informatyka +
41
Analiza pewnego problemu 9
Poniżej postać danych z poprzedniego slajdu, przekształcona
do bardziej czytelnej postaci
Dzięki kluczom obcym w tabeli KontaktyKlienta mogliśmy
powiązać dane zapisane w różnych tabelach
informatyka +
42
Podsumowanie części 5
Za pomocą dwuwymiarowych tabel opisujemy wybrany
fragment rzeczywistości (bank, szkoła , kolekcja płyt)
Tabele relacyjne mogą opisywać :
•Obiekty rzeczywiste (uczniowie, nauczyciele, klasy)
•Słowniki pojęć (przedmioty, rodzaje ocen)
•Zdarzenia i powiązania (wystawione oceny)
Powiązanie danych zapisanych w
różnych tabelach osiągamy dzięki
parze kluczy :
klucz obcy --- klucz podstawowy
informatyka +
43
Plan prezentacji
1. Kilka definicji na dobry początek.
2. Dane i bazy danych.
3. Podstawy relacyjnego modelu danych.
4. Rozważania o tabeli.
5. Modelowanie z wykorzystaniem tabel relacyjnych.
6. Problemy i anomalie związane z gromadzeniem danych w
tabelach.
7. Systemy Zarządzania Bazami Danych.
8. Spójność i integralność danych.
9. Od rozkładu jazdy do bankowości internetowej.
10.Podsumowanie wykładu – pytania.
informatyka +
44
Problemy gromadzenia danych w tabelach 1
Problem 1 : Gromadzenie danych w tabeli nie może się
odbywać bez reguł i ograniczeń – nie wystarczy samo
nazwanie kolumn
Pesel
Nazwisko
Imię
DataUrodzenia
Płeć
Wiek
92092256787 Kotek
Janina 1992-09-22
Kobieta
17
921105au34
Lisek
Piotr
1992-07-21
Kotek
33
Wiktor
23
Lis
8 maj 91
Chłopak
OK
Jak widać na powyższym przykładzie – w tabeli bardzo łatwo
może zapanować totalny bałagan, choćby z tego powodu, że
to ludzie wprowadzają dane, a człowiek jest omylny.
Bazy danych powinny posiadać mechanizmy ułatwiające
wymuszanie poprawności zapisywanych danych
informatyka +
45
Problemy gromadzenia danych w tabelach 3
Kilka słów o przedstawionych problemach
Pesel
Nazwisko
Imię
DataUrodzenia
Płeć
Wiek
92092256787 Kotek
Janina 1992-09-22
Kobieta
17
921105au34
Lisek
Piotr
1992-39-42
Kotek
33
Wiktor
23
Lis
8 maj 91
Chłopak
OK
1. Nazwa kolumny nie gwarantuje zapisywania w niej
właściwych danych
2. Gdy mamy zapisane błędne dane – baza danych traci
sens.
3. W powyższym przykładzie – numer Pesel powinien być
zależny od daty urodzenia
informatyka +
46
Problemy gromadzenia danych w tabelach 4
Problem 2: Problemy i anomalie związane z zapisywaniem
danych
W powyższej, przykładowej, tabeli mamy cały szereg
problemów, które mogą wyniknąć w nieprawidłowo
zabezpieczonej bazie danych
informatyka +
47
Problemy gromadzenia danych w tabelach 5
Problem 2: Problemy i anomalie związane z zapisywaniem
danych
1. Czy Jan Kotek i Kotek Jan – to ta sama osoba????
2. Czy Daria Miła mieszka na ulicy Naftowej czy Benzynowej ???
3. Czy Sprawdzian i Sprawdz. to ten sam rodzaj oceny????
4. Czy Historia i Chistoria (ale wtyd – ale zdarzyć się może) to ten
sam przedmiot ?????
informatyka +
48
Podsumowanie części 6
•Przedstawione wcześniej problemy oraz wiele innych,
których nie zdążymy teraz omówić są poważnym
wyzwaniem dla twórców baz danych.
•Bez rozwiązania tych problemów bazy danych byłyby
niewiarygodne.
•W dalszej części wykładu omówimy niektóre sposoby
zapewnienia poprawności przechowywanych danych
informatyka +
49
Plan prezentacji
1. Kilka definicji na dobry początek.
2. Dane i bazy danych.
3. Podstawy relacyjnego modelu danych.
4. Rozważania o tabeli.
5. Modelowanie z wykorzystaniem tabel relacyjnych.
6. Problemy i anomalie związane z gromadzeniem danych w
tabelach.
7. Systemy Zarządzania Bazami Danych.
8. Spójność i integralność danych.
9. Od rozkładu jazdy do bankowości internetowej.
10.Podsumowanie wykładu – pytania.
informatyka +
50
System Zarządzania Bazą Danych 1
Systemem Zarządzania Bazami Danych nazywamy
specjalistyczne oprogramowanie umożliwiające tworzenie baz
danych oraz ich eksploatację
SZBD powinien(miedzy innymi) umożliwiać :
•Definiowanie obiektów bazy danych
•Manipulowanie danymi
•Generowanie zapytań
•Zapewnienie spójności i integralności danych
informatyka +
51
System Zarządzania Bazą Danych 2
Przykłady SZBD :
MS SQL Server 2008
Oracle
MySQL
Access
DB2
… i wiele, wiele innych
informatyka +
52
System Zarządzania Bazą Danych 2
Jednym z najważniejszych zadań stojących przed SZBD jest
zapewnienie spójności i integralności danych
SZBD dostarczają szereg mechanizmów służących
zapewnieniu poprawności przechowywanych danych
informatyka +
53
System Zarządzania Bazą Danych 2
Rodzaje reguł i ograniczeń
•Deklaracja typu
•Definicje kluczy
•Reguły poprawności dla kolumny
•Reguły poprawności dla wiersza
•Reguły integralności referencyjnej
Poszczególne typy reguł zostaną omówione w dalszej
części wykładu
informatyka +
54
Plan prezentacji
1. Kilka definicji na dobry początek.
2. Dane i bazy danych.
3. Podstawy relacyjnego modelu danych.
4. Rozważania o tabeli.
5. Modelowanie z wykorzystaniem tabel relacyjnych.
6. Problemy i anomalie związane z gromadzeniem danych w
tabelach.
7. Systemy Zarządzania Bazami Danych.
8. Spójność i integralność danych.
9. Od rozkładu jazdy do bankowości internetowej.
10.Podsumowanie wykładu – pytania.
informatyka +
55
Spójność i integralność danych
Jednym z najistotniejszych elementów Systemów Zarządzania
Bazami Danych są mechanizmy zapewnienia spójności i
integralności danych przechowywanych w bazie
Podstawowe sposoby zapewnienia integralności danych
•Deklaracja typu
•Deklaracje kluczy
•Reguły poprawności dla kolumny
•Reguły poprawności dla wiersza
•Reguły integralności referencyjnej
informatyka +
56
Deklaracja typu 1
W tabelach relacyjnych przechowujemy dane różnego typu
(liczby, teksty, znaki, daty …)
Każda kolumna w tabeli musi mieć określony typ
przechowywanych danych
Deklaracja typu jest pierwszym
sposobem zapewnienia
poprawności danych – w ujęciu
matematycznym jest to określenie
dziedziny wartości dla kolumny
informatyka +
57
Deklaracja typu 2
Przykładowe typy danych w SQL Server 2008
Dla danych znakowych
•char(n) - ciąg n znaków o stałej długości (np. jeżeli
kolumna ma określony typ char(25) a wpiszemy
słowo „kot” – to i tak zostanie ono zapisane za
pomocą 25 znaków – uzupełnione spacjami)
•varchar(n) – ciąg n znaków o zmiennej długości (np. jeżeli
kolumna ma określony typ varchar(25) a
wpiszemy słowo „kot” –zostanie ono zapisane
za pomocą 3 znaków)
•varchar(max) – ciąg znaków o zmiennej długości do 2 GB
informatyka +
58
Deklaracja typu 3
Przykładowe typy danych w SQL Server 2008
Pytanie :
Skoro typ char w porównaniu z varchar
wykorzystuje więcej pamięci do
zapisywania danych (uzupełnianie spacjami) –
to jakie korzyści możemy osiągnąć w
przypadku wykorzystania typu char
informatyka +
59
Deklaracja typu 4
Przykładowe typy danych w SQL Server 2008
Istnieją także odmiany podanych wcześniej
znakowych typów danych poprzedzone literka
„n”
• nchar (n)
• nvarchar(n)
• nvarchar(max)
Są to typy danych znakowych (zapisywanych
łącznie z informacją o stronie kodowej)
umożliwiające przechowywanie tekstów
używających znaków specyficznych dla
różnych języków
informatyka +
60
Deklaracja typu 5
Przykładowe typy danych w SQL Server 2008
Dla danych liczbowych – liczby całkowite
•tinyint- liczba całkowita z zakresu 0 ÷ 255 - przechowywana
za pomocą 1 bajtu
•smallint- liczba całkowita z zakresu -32768 ÷ 32767
przechowywana za pomocą 2 bajtów
•int- liczba całkowita z zakresu -2147483648 ÷ 2147483647
przechowywana za pomocą 4 bajtów
•bigint- liczba całkowita z zakresu
-9223372036854775808 ÷ 9223372036854775807
przechowywana za pomocą 8 bajtów
informatyka +
61
Deklaracja typu 5
Przykładowe typy danych w SQL Server 2008
Dla danych liczbowych – liczby z ułamkiem
•real , float - do zapisywania liczb
zmiennoprzecinkowych
•decimal, numeric - do zapisywania liczb
zmiennoprzecinkowych
o określonej precyzji
•money - do zapisywania liczb wyrażających
kwoty pieniężne
informatyka +
62
Deklaracja typu 6
Przykładowe typy danych w SQL Server 2008
Dla danych liczbowych – data i czas
•date- do zapisywania dat np. 2009-08-22
•time- do zapisywania czasu np. 19:22:07.2345644
•datetime - do zapisywania łącznie daty i czasu
np. 2009-08-22 19:22:07.2345644
informatyka +
63
Deklaracja typu 7
Przykładowe typy danych w SQL Server 2008
Dla danych liczbowych – typy różne
•bit- do zapisywania wartości logicznych (true, false lub 0,1)
•varbinary(n)- do zapisywania danych binarnych o długości
n bajtów
•varbinary(max) - do zapisywania danych binarnych o
długości do 2 GB (np. obrazy, dźwięki itp. )
•xml- do zapisywania dokumentów XML o długości do 2 GB
•Timestamp - specjalny znacznik który automatycznie
zmienia swoja wartość przy modyfikacji wiersza
informatyka +
64
Deklaracja typu 8
Krótkie podsumowanie
•Każda kolumna w tabeli musi mieć określony typ danych jaki
będzie w tej kolumnie zapisywany
•Decyzja o wyborze odpowiedniego typu danych jest
pierwszym etapem zapewnienia spójności danych
•Wybór typu jest równoznaczny z określeniem dziedziny
wartości dla danych zapisywanych w danej kolumnie
informatyka +
65
Deklaracja kluczy
W każdej tabeli relacyjnej powinien być zdefiniowany klucz
podstawowy – taka definicja zapewnia, ze każda wartość w
kolumnie klucza podstawowego musi przyjąć inną wartość
W SZBD istnieją mechanizmy nadające kolumnom klucza
podstawowego automatycznie unikalne wartości
(autonumeracja)
Można także wymusić unikalność kolumn, które nie są
kluczem podstawowym – klucze potencjalne
informatyka +
66
Reguły poprawności dla kolumny
Deklaracja typu określa dziedzinę wartości dla kolumny ale
często jest to dziedzina zbyt szeroka
Reguła poprawności dla kolumny jest wyrażeniem
logicznym ograniczającym dziedzinę do tych wartości, które
spełniają ten warunek
Przykład :
Numer Pesel (w tabeli Uczniowie) ma zadeklarowany typ danych
char(11) - czyli ciąg znaków o maksymalnej długości 11.
Powinniśmy wymusić, żeby to było dokładnie 11 znaków i mogą to
być tylko cyfry.
Taka definicja zapewni, że zapisywane w tabeli numery Pesel będą
poprawne (w tej części wymagań)
informatyka +
67
Reguły poprawności dla wiersza
Czasami występują logiczne zależności pomiędzy danymi
zapisanymi w różnych kolumnach (dla jednego wiersza)
Reguła poprawności dla wiersza jest wyrażeniem logicznym
ograniczającym dziedzinę do tych wartości, które spełniają
ten warunek .
Przykład :
Numer Pesel (w tabeli Uczniowie) jest logicznie powiązany z datą
urodzenia ucznia zapisaną w tej samej kolumnie.
Powinniśmy wymusić, żeby pierwsze sześć cyfr numeru Pesel
odpowiadało dacie urodzenia zapisanej w innej kolumnie
Taka definicja zapewni, że zapisywane w tabeli numery Pesel i daty
urodzenia będą logicznie poprawne
informatyka +
68
Reguły integralności referencyjnej
Integralność referencyjna określa poprawność logiczna
danych zapisanych w różnych tabelach
Klasycznym przykładem takich zależności jest para klucz
obcy – klucz podstawowy.
Przykład :
Kolumna iducznia w tabeli Uczniowie (jako klucz podstawowy) i kolumna
iducznia w tabeli Oceny (jako klucz obcy)
Powinniśmy wymusić, żeby wartości klucza obcego przyjmowały
tylko takie wartości, które występują w tabeli gdzie ta kolumna jest
kluczem podstawowym – zapewnia to odpowiednie powiązanie
danych zapisanych w różnych tabelach.
informatyka +
69
Podsumowanie części 8
•Zapewnienie spójności i integralności danych jest
jednym z najważniejszych wyzwań stojących przed
twórcami baz danych
•Systemy Zarządzania Bazami Danych dostarczają
mechanizmy ułatwiajace realizacje tych zadań
•W trakcie zajęć warsztatowych przyjrzymy się jak te
mechanizmy działają w praktyce
informatyka +
70
Plan prezentacji
1. Kilka definicji na dobry początek.
2. Dane i bazy danych.
3. Podstawy relacyjnego modelu danych.
4. Rozważania o tabeli.
5. Modelowanie z wykorzystaniem tabel relacyjnych.
6. Problemy i anomalie związane z gromadzeniem danych w
tabelach.
7. Systemy Zarządzania Bazami Danych.
8. Spójność i integralność danych.
9. Od rozkładu jazdy do bankowości internetowej.
10.Podsumowanie wykładu – pytania.
informatyka +
71
Od rozkładu jazdy do bankowości internetowej
•Czy chcemy tego czy nie chcemy, czy wiemy o tym czy nie
wiemy … bazy danych są wszechobecne w naszym życiu
•Korzystanie z internetu,
•Załatwianie sprawy w urzędzie,
•Wypłacanie pieniędzy w bankomacie
•Zakupy w sklepie internetowym
•Wykupienie recepty w aptece
• … a jeszcze do tego elektroniczny dziennik lekcyjny 
Trudno wyobrazić sobie działanie, żeby w tle nie było bazy
danych
informatyka +
72
Od rozkładu jazdy do bankowości internetowej
Codziennie setki milionów ludzi korzystają z wielkiej
„bazy danych” – czyli internetu.
Kto nie zna internetowej wyszukiwarki np. google
Wyszukiwarki internetowe pozwalają wyszukiwać dane i
informacje z zasobów internetu na podstawie słów kluczowych
Aktualnie stajemy się świadkami narodzin nowego!!!!
informatyka +
73
Od rozkładu jazdy do bankowości internetowej
Projekt WolframAlpha –
wprowadza nową jakość do
świata wyszukiwarek
internetowych
Różnicę w sposobie działania omówimy na przykładzie :
Chcemy dowiedzieć się o ilości mieszkańców Polski
informatyka +
74
Od rozkładu jazdy do bankowości internetowej
Wykorzystamy najpierw wyszukiwarkę google ( … i język
angielski – bo projekt WolframAlpha aktualnie najlepiej radzi
sobie z tym językiem)
Wpisujemy w
wyszukiwarce słowa
- Poland citizniens
(Polska obywalete)
I otrzymujemy wynik
– ok. 5 milionów
stron zawierających
podane słowa
informatyka +
75
Od rozkładu jazdy do bankowości internetowej
… a teraz to samo w wyszukiwarce WolframAlfa – wpisujemy
to samo hasło ….
Początek podobny …. Ale efekt końcowy całkowicie odmienny
informatyka +
76
Tym razem
otrzymujemy
odpowiedź na zadane
pytanie
informatyka +
77
Dziękuję za uwagę
… a może pytania ????
informatyka +
78
Dziękuję za uwagę
… a może pytania ????
informatyka +
79
Download