Bazy danych - jak je ugryźć? informatyka + 2 Plan prezentacji 1. Kilka definicji na dobry początek. 2. Dane i bazy danych. 3. Podstawy relacyjnego modelu danych. 4. Rozważania o tabeli. 5. Modelowanie z wykorzystaniem tabel relacyjnych. 6. Problemy i anomalie związane z gromadzeniem danych w tabelach. 7. Systemy Zarządzania Bazami Danych. 8. Spójność i integralność danych. 9. Od rozkładu jazdy do bankowości internetowej. 10.Podsumowanie wykładu – pytania. informatyka + 3 Dane • Liczby, znaki, symbole (i cokolwiek innego) zapisane w celu ich przetwarzania • 15,’ Ala’,’12-09-1987’, /…/---/…/, ‘Warszawa’, To są jakieś dane Tylko do końca nie wiemy co one znaczą Wniosek : Dane bez uporządkowania i bez umiejętności ich interpretacji to najczęściej „ŚMIETNIK” informatyka + 4 Krótkie podsumowanie Dane: - znaki - liczby - teksty - dźwięki - obrazy Bez uporządkowania korzystanie z danych jest praktycznie niemożliwe Proces wykorzystywania danych związany jest z ich przetwarzaniem informatyka + 5 Informacja Trudno przytoczyć jedną definicję pojęcia informacja Informacja to taki czynnik, któremu człowiek może przypisać określony sens (znaczenie), aby móc ją wykorzystywać do różnych celów Informacje możemy „zdobywać” dzięki przetwarzaniu i interpretacji danych . informatyka + 6 Wiedza Podobnie jak w przypadku informacji – trudno jest jednoznacznie zdefiniować pojęcie wiedza Tak definiował to pojecie Platon : „ogół wiarygodnych informacji o rzeczywistości wraz z umiejętnością ich wykorzystywania” Proszę zwrócić uwagę na fakt, że wiedza to, miedzy innymi, umiejętność wykorzystania informacji . informatyka + 7 Społeczeństwo informacyjne 1 I znów będziemy mieli problem z jednoznacznym zdefiniowaniem pojęcia społeczeństwo informacyjne Społeczeństwo charakteryzujące się przygotowaniem i zdolnością do użytkowania systemów informatycznych, skomputeryzowane i wykorzystujące usługi telekomunikacji do przesyłania i zdalnego przetwarzania informacji” (I Kongres Informatyki Polskiej, 1994) Wszystko wskazuje na to, że przyszłość należeć będzie do społeczeństw informacyjnych informatyka + 8 Społeczeństwo informacyjne 2 Umiejętność korzystania ze zgromadzonych danych jest jedną z podstawowych cech społeczeństwa informacyjnego. informatyka + 9 Podsumowanie części 1 Dane - powstają na różnych etapach działalności gromadzimy dane w celu ich późniejszego wykorzystania przechowując dane należy zapewnić określony porządek Informacje - Wiedza - często powstaje w wyniku przetwarzania i interpretacji danych to miedzy innymi umiejętność wykorzystania informacji Społeczeństwo informacyjne - to także my informatyka + Wiedza 10 Plan prezentacji 1. Kilka definicji na dobry początek. 2. Dane i bazy danych. 3. Podstawy relacyjnego modelu danych. 4. Rozważania o tabeli. 5. Modelowanie z wykorzystaniem tabel relacyjnych. 6. Problemy i anomalie związane z gromadzeniem danych w tabelach. 7. Systemy Zarządzania Bazami Danych. 8. Spójność i integralność danych. 9. Od rozkładu jazdy do bankowości internetowej. 10.Podsumowanie wykładu – pytania. informatyka + 11 Porozmawiajmy o danych 1 Uczeń Przedmiot Nauczyciel Data Ocena Zosia Nowak 3 15-03-2009 Jak widać - dane bez określonego porządku to chaos … i nie ma z takich danych korzyści Powoli zbiór danych staje się bardziej przejrzysty + Jeszcze trochę pracy i powinnoinformatyka być dobrze informatyka + 12 12 Porozmawiajmy o danych 2 Gromadzenie danych musi zapewnić porządek bo w przeciwnym razie nie damy sobie rady w sytuacji gdy danych będzie bardzo dużo. Jak sprawnie gromadzić dane zachowując możliwość ich wykorzystania ? informatyka + 13 Bazy danych 1 Nauczyciel : Maria Bryła Nauczyciel: : Józef Jan Powaga Nauczyciel Ostry Przedmiot :Fizyka Przedmiot :Matematyka Przedmiot :Informatyka Rodzaj : Sprawdzian Rodzaj Sprawdzian Rodzaj : :Sprawdzian Data wyst. : 17-05-2009 Data wyst. : 17-05-2009 Data wyst. : 17-05-2009 Ocena :3 Ocena : 5 Ocena :2 Nazwisko Lisek Nazwisko :: Kotek Sarenka Imię : Jasio Piotr Imię : Zosia Data 11-02-1991 Data ur. ur. :: 07-11-1991 11-11-1991 Pesel :: 07111134498 91021134498 Pesel 91111134498 Kod 96-987 Kod poczt: poczt: 26-987 26-987 Miasto : Sopot Miasto : Opole Poznań Ulica :: Klonowa 12/8 Długa 62/8 Ulica Osinowa 22/8 Dane gromadzimy w bazach danych Baza danych informatyka + 14 Bazy danych 2 Baza danych to zbiór danych zapisanych w ściśle określony sposób w strukturach odpowiadających założonemu modelowi danych. Aktualnie najczęściej wykorzystuje się bazy danych oparte na relacyjnym modelu danych informatyka + 15 Bazy danych 3 Codziennie korzystamy z różnych baz danych: Rozkład jazdy pociągów Korzystanie z bankomatu Korzystanie z pomocy i podpowiedzi w różnych programach Wyszukiwarki internetowe informatyka + 16 Podsumowanie części 2 Dane opisują pewne fakty i zdarzenia Gromadzimy dane w celu ich późniejszego wykorzystania Gromadzenie danych bez określonego porządku jest bezsensowne Dane gromadzimy w bazach danych Bardzo wiele codziennych czynności związanych jest z korzystaniem z baz danych informatyka + 17 Plan prezentacji 1. Kilka definicji na dobry początek. 2. Dane i bazy danych. 3. Podstawy relacyjnego modelu danych. 4. Rozważania o tabeli. 5. Modelowanie z wykorzystaniem tabel relacyjnych. 6. Problemy i anomalie związane z gromadzeniem danych w tabelach. 7. Systemy Zarządzania Bazami Danych. 8. Spójność i integralność danych. 9. Od rozkładu jazdy do bankowości internetowej. 10.Podsumowanie wykładu – pytania. informatyka + 18 Relacyjny model danych 1 Sposób modelowania danych w którym podstawowym pojęciem jest tabela. Relacja jest pojęciem matematycznym (z dziedziny teorii zbiorów) i cały model relacyjny jest doskonale opisany przez matematyków. Dobra interpretacja matematyczna pozwoliła zrealizować dobre oprogramowanie obsługujące relacyjne bazy danych. informatyka + 19 Wybrane cechy modelu relacyjnego 1 Wszystkie wartości zapisywane w tabelach oparte są na prostych typach danych(brak struktur złożonych ) Nazwisko Imię Adres Ulica Nowa 33/21 Kot Jasio Kod 12-098 Miasto Opole Lis Hania 65-987 Cicha 17/2 Sopot Żuk Piotrek 33-093 Miła 4/3 Gdynia Języki obce Rodzeństwo Angielski, francuski, hiszpański Angielski, niemiecki Nie zna brat Staś, siostra Mariola brak brat Jaś, brat Staś, siostra Hania Powyższa tabela nie spełnia tej cechy - w dalszej części pokażemy jak można ten problem rozwiązać informatyka + 20 Wybrane cechy modelu relacyjnego 2 Wszystkie dane w bazie relacyjnej przedstawione są w formie dwuwymiarowych tabel zwanych relacjami Płyty Numer Nazwa albumu Rok wydania Nazwa zespołu 1 Kwiaty polskie 1969 Akwarele 2 Help 1967 The Beatles 3 Mrowisko 1971 Klan 4 Rubikone 2009 Piotr Rubik 5 Hellwood 2009 Hunter informatyka + 21 Wybrane cechy modelu relacyjnego 3 Wszystkie operacje wykonywane są w oparciu o logikę bez względu na położenie wiersza w tabeli Ponieważ w modelu relacyjnym kolejność kolumn i wierszy nie ma żadnego znaczenia - to widoczne trzy postaci tabel są identyczne i można z nich pobrać dokładnie te same informacje informatyka + 22 Wybrane cechy modelu relacyjnego 4 W tabeli musi istnieć kolumna lub zbiór kolumn o wartościach niepowtarzalnych, pozwalający odnaleźć konkretny wiersz. Zaznaczone wiersze są nierozróżnialne, Tak naprawdę nie wiadomo czy jest to pomyłka czy też opis dwóch różnych osób Nazwisko Imię DataUr. Nowak Jan 15-07-1992 Nowak Piotr 16-10-1992 Kowalski Jan 22-11-1992 Kowalski Jan 22-11-1992 Piskorska Beata 03-05-1992 Pesel Nazwisko Imię DataUr. 92071598712 Nowak Jan 15-07-1992 92101675643 Nowak Piotr 16-10-1992 92112287965 Kowalski Jan 22-11-1992 92112233562 Kowalski Jan 22-11-1992 92050322411 Piskorska Beata 03-05-1992 Dodatkowa kolumna „Pesel” – umożliwiła rozróżnienie dwóch osób. Pesel może być uznany za klucz podstawowy. Taką kolumnę (lub zbiór) nazywamy kluczem podstawowym (ang. primary key) informatyka + 23 Relacyjny model danych 2 Projekt bazy danych, opartej na modelu relacyjnym, polega na opisaniu pewnej dziedziny życia za pomocą wielu tabel Każda tabela opisuje jeden rodzaj obiektów (np. uczeń, klient, książka) lub zdarzeń (np. wystawiona ocena, wykonany przelew, wizyta lekarska) Projektując bazę danych zapewnia się możliwość łączenia ze sobą danych zawartych w różnych tabelach. Więcej o projektowaniu relacyjnej bazy danych w dalszej części wykładu informatyka + 24 Podsumowanie części 3 Model relacyjny opiera się na pojęciu tabeli Każda tabela musi posiadać klucz podstawowy W modelu relacyjnym nieistotna jest kolejność kolumn i wierszy Baza danych oparta na modelu relacyjnym składa się z wielu tabel opisujących pewną dziedzinę życia. Bazy relacyjne są aktualnie najbardziej rozpowszechnione. informatyka + 25 Plan prezentacji 1. Kilka definicji na dobry początek. 2. Dane i bazy danych. 3. Podstawy relacyjnego modelu danych. 4. Rozważania o tabeli. 5. Modelowanie z wykorzystaniem tabel relacyjnych. 6. Problemy i anomalie związane z gromadzeniem danych w tabelach. 7. Systemy Zarządzania Bazami Danych. 8. Spójność i integralność danych. 9. Od rozkładu jazdy do bankowości internetowej. 10.Podsumowanie wykładu – pytania. informatyka + 26 Tabela relacyjna Sztuczny klucz podstawowy Iducznia Cechy tabeli relacyjnej Uczniowie Nazwisko Imie Data_ur Pesel 1 Nowak Jan 11.09.1991 91091145654 2 Rybak Zofia 12.11.1991 91111256744 3 Kowal Stefan 21.02.1992 92022172138 4 Kozak Jan 17.08.1992 92081711737 5 Pływak Anna 04.02.1993 93020495571 I już mamy tabelę wraz z zawartością informatyka + 1.Przeznaczenie 2.Kolumny – określają cechy opisywanego obiektu 3.Klucz podstawowy 4.Wiersze – suma cech danego obiektu 27 Normalizacja – podstawa projektowania Faktury Idfaktury Numer Data_w Netto Vat Firma Nip Ulica Miasto 1 234/08 11.08.08 345.67 71.22 Wedel 1234652789 Nowa 3 Warszawa 2 43/08 12.08.08 763.00 167.00 Wedel 1234652789 Nowa 3 Warszawa 3 01/2008 15.08.08 322.00 68.65 Złotex 6573298722 Miła 7 Sopot 4 11.08/1 22.09.08 100.00 22.00 Koral 5582998721 Dobra 1 Opole 5 34w/08 28.09.08 882.00 187.00 Wedel 1234652789 Nowa 3 Warszawa 6 987/08 02.10.08 250.55 58.12 Złotex 6573298722 Miła 7 Sopot 7 002.08 11.10.08 891.00 201.15 Złotex 6573298722 Miła 7 Sopot Redundancja!!!!!!!!!!!!!! I co tutaj nie gra informatyka + 28 Normalizacja – podstawa projektowania Faktury Idfaktury Numer Data_w Netto Vat 1 234/08 11.08.08 345.67 71.22 2 43/08 12.08.08 763.00 3 01/2008 15.08.08 4 11.08/1 5 Klucz obcy Idfirmy 1 1 Wedel 1234652789 Nowa 3 Warszawa 167.00 1 1 Wedel 1234652789 Nowa 3 Warszawa 322.00 68.65 2 Złotex 6573298722 Miła 7 Sopot 22.09.08 100.00 22.00 2 3 3 Koral 5582998721 Dobra Warszawa 34w/08 28.09.08 882.00 187.00 1 1 Wedel 1234652789 Nowa 3 Warszawa 6 987/08 02.10.08 250.55 58.12 2 2 Złotex 6573298722 Miła 7 Sopot 7 002.08 11.10.08 891.00 201.15 2 2 Złotex 6573298722 Miła 7 Sopot Firmy IdFirmy Firma Nip Ulica Miasto 1 Wedel 1234652789 Nowa 3 Warszawa 2 Złotex 6573298722 Miła 7 Sopot 3 Koral 5582998721 Dobra 1 Opole informatyka + 29 Podsumowanie części 4 Model relacyjny opiera się na pojęciu tabeli Każda tabela musi posiadać klucz podstawowy W modelu relacyjnym nieistotna jest kolejność kolumn i wierszy Baza danych oparta na modelu relacyjnym składa się z wielu tabel opisujących pewną dziedzinę życia. Bazy relacyjne są aktualnie najbardziej rozpowszechnione. informatyka + 30 Plan prezentacji 1. Kilka definicji na dobry początek. 2. Dane i bazy danych. 3. Podstawy relacyjnego modelu danych. 4. Rozważania o tabeli. 5. Modelowanie z wykorzystaniem tabel relacyjnych. 6. Problemy i anomalie związane z gromadzeniem danych w tabelach. 7. Systemy Zarządzania Bazami Danych. 8. Spójność i integralność danych. 9. Od rozkładu jazdy do bankowości internetowej. 10.Podsumowanie wykładu – pytania. informatyka + 31 Przykładowy projekt bazy danych Schemat bazy danych do rejestrowania ocen uczniów informatyka + 32 Przykładowe fragmenty baz danych Rejestr wypożyczeń książek Tabela opisująca wypożyczenia książek Powiązanie pomiędzy tabelami Tabela słownikowa Powiązanie pomiędzy tabelami Powiązanie pomiędzy tabelami Tabela opisująca książki Tabela opisująca osoby informatyka + 33 Analiza pewnego problemu 1 Wyobraźmy sobie, że w pewnej bazie danych istnieje tabela o nazwie „Klienci” o strukturze pokazanej na rysunku obok Przykładowa zawartość takiej tabeli mogłaby wyglądać tak jak na rysunku poniżej Proszę zwrócić uwagę na fakt, że jak brak pewnych danych to w tabeli przechowywana jest specyficzna wartość null informatyka + 34 Analiza pewnego problemu 2 W trakcie eksploatacji naszej przykładowej bazy danych wyniknął problem, ponieważ użytkownicy bazy danych chcieliby dodatkowo przechowywać dane o numerze telefonu komórkowego. Rozwiązaniem problemu mogłoby być dodanie do tabeli Klienci dodatkowej kolumny TelefonKomorkowy – tak jak poniżej Tak mogłaby wyglądać zmodyfikowana tabela … a tak zawartość tej tabeli informatyka + 35 Analiza pewnego problemu 3 … ale czy mamy pewność, że w trakcie dalszej eksploatacji tej bazy danych nie będzie potrzeby dodawania kolejnych kolumn np. żeby zapisać więcej niż jeden numer telefonu albo adres strony www, numer faksu (… a może dwa numery), numer GG … itd. … a może chwila zastanowienia i rozwiązać ten problem raz a dobrze ??? informatyka + 36 Analiza pewnego problemu 4 Problem rozwiążemy w trzech krokach : 1.Utworzymy tabelę słownikową o nazwie „RodzajeKontaktow” 2. Z tabeli „Klienci” usuniemy kolumny opisujące numery telefonów itp. 3.Utworzymy nową tabelę (tzw. tabelę asocjacyjną) o nazwie „KontaktyKlienta” informatyka + 37 Analiza pewnego problemu 5 Model bazy danych informatyka + 38 Analiza pewnego problemu 6 Przykładowa zawartość tabel (RodzajeKontaktow) Tabele podobnego typu nazywamy tabelami słownikowymi. Jeżeli będziemy dodatkowo potrzebowali przechowywać w bazie danych informacje o numerach Gadu Gadu i adresy stron WWW – to wystarczy dopisać kolejne wiersze do tabeli informatyka + 39 Analiza pewnego problemu 7 Przykładowa zawartość tabel (Klienci) W tabeli „Klienci” nie zapisujemy teraz danych o numerach telefonów, adresach e-mail itp. Dodatkowo uzyskujemy jeszcze jedna korzyść – w sytuacji gdy dany klient nie ma telefonu lub innego środka łączności, nie musimy przechowywać w tabeli wartości null. informatyka + 40 Analiza pewnego problemu 8 Przykładowa zawartość tabel (KontaktyKlienta) Tabele tego typu nazywamy tabelą powiązań (asocjacyjną) Dane zawarte w tabeli KontaktyKlienta wymagają interpretacji, żeby stały się czytelne informatyka + 41 Analiza pewnego problemu 9 Poniżej postać danych z poprzedniego slajdu, przekształcona do bardziej czytelnej postaci Dzięki kluczom obcym w tabeli KontaktyKlienta mogliśmy powiązać dane zapisane w różnych tabelach informatyka + 42 Podsumowanie części 5 Za pomocą dwuwymiarowych tabel opisujemy wybrany fragment rzeczywistości (bank, szkoła , kolekcja płyt) Tabele relacyjne mogą opisywać : •Obiekty rzeczywiste (uczniowie, nauczyciele, klasy) •Słowniki pojęć (przedmioty, rodzaje ocen) •Zdarzenia i powiązania (wystawione oceny) Powiązanie danych zapisanych w różnych tabelach osiągamy dzięki parze kluczy : klucz obcy --- klucz podstawowy informatyka + 43 Plan prezentacji 1. Kilka definicji na dobry początek. 2. Dane i bazy danych. 3. Podstawy relacyjnego modelu danych. 4. Rozważania o tabeli. 5. Modelowanie z wykorzystaniem tabel relacyjnych. 6. Problemy i anomalie związane z gromadzeniem danych w tabelach. 7. Systemy Zarządzania Bazami Danych. 8. Spójność i integralność danych. 9. Od rozkładu jazdy do bankowości internetowej. 10.Podsumowanie wykładu – pytania. informatyka + 44 Problemy gromadzenia danych w tabelach 1 Problem 1 : Gromadzenie danych w tabeli nie może się odbywać bez reguł i ograniczeń – nie wystarczy samo nazwanie kolumn Pesel Nazwisko Imię DataUrodzenia Płeć Wiek 92092256787 Kotek Janina 1992-09-22 Kobieta 17 921105au34 Lisek Piotr 1992-07-21 Kotek 33 Wiktor 23 Lis 8 maj 91 Chłopak OK Jak widać na powyższym przykładzie – w tabeli bardzo łatwo może zapanować totalny bałagan, choćby z tego powodu, że to ludzie wprowadzają dane, a człowiek jest omylny. Bazy danych powinny posiadać mechanizmy ułatwiające wymuszanie poprawności zapisywanych danych informatyka + 45 Problemy gromadzenia danych w tabelach 3 Kilka słów o przedstawionych problemach Pesel Nazwisko Imię DataUrodzenia Płeć Wiek 92092256787 Kotek Janina 1992-09-22 Kobieta 17 921105au34 Lisek Piotr 1992-39-42 Kotek 33 Wiktor 23 Lis 8 maj 91 Chłopak OK 1. Nazwa kolumny nie gwarantuje zapisywania w niej właściwych danych 2. Gdy mamy zapisane błędne dane – baza danych traci sens. 3. W powyższym przykładzie – numer Pesel powinien być zależny od daty urodzenia informatyka + 46 Problemy gromadzenia danych w tabelach 4 Problem 2: Problemy i anomalie związane z zapisywaniem danych W powyższej, przykładowej, tabeli mamy cały szereg problemów, które mogą wyniknąć w nieprawidłowo zabezpieczonej bazie danych informatyka + 47 Problemy gromadzenia danych w tabelach 5 Problem 2: Problemy i anomalie związane z zapisywaniem danych 1. Czy Jan Kotek i Kotek Jan – to ta sama osoba???? 2. Czy Daria Miła mieszka na ulicy Naftowej czy Benzynowej ??? 3. Czy Sprawdzian i Sprawdz. to ten sam rodzaj oceny???? 4. Czy Historia i Chistoria (ale wtyd – ale zdarzyć się może) to ten sam przedmiot ????? informatyka + 48 Podsumowanie części 6 •Przedstawione wcześniej problemy oraz wiele innych, których nie zdążymy teraz omówić są poważnym wyzwaniem dla twórców baz danych. •Bez rozwiązania tych problemów bazy danych byłyby niewiarygodne. •W dalszej części wykładu omówimy niektóre sposoby zapewnienia poprawności przechowywanych danych informatyka + 49 Plan prezentacji 1. Kilka definicji na dobry początek. 2. Dane i bazy danych. 3. Podstawy relacyjnego modelu danych. 4. Rozważania o tabeli. 5. Modelowanie z wykorzystaniem tabel relacyjnych. 6. Problemy i anomalie związane z gromadzeniem danych w tabelach. 7. Systemy Zarządzania Bazami Danych. 8. Spójność i integralność danych. 9. Od rozkładu jazdy do bankowości internetowej. 10.Podsumowanie wykładu – pytania. informatyka + 50 System Zarządzania Bazą Danych 1 Systemem Zarządzania Bazami Danych nazywamy specjalistyczne oprogramowanie umożliwiające tworzenie baz danych oraz ich eksploatację SZBD powinien(miedzy innymi) umożliwiać : •Definiowanie obiektów bazy danych •Manipulowanie danymi •Generowanie zapytań •Zapewnienie spójności i integralności danych informatyka + 51 System Zarządzania Bazą Danych 2 Przykłady SZBD : MS SQL Server 2008 Oracle MySQL Access DB2 … i wiele, wiele innych informatyka + 52 System Zarządzania Bazą Danych 2 Jednym z najważniejszych zadań stojących przed SZBD jest zapewnienie spójności i integralności danych SZBD dostarczają szereg mechanizmów służących zapewnieniu poprawności przechowywanych danych informatyka + 53 System Zarządzania Bazą Danych 2 Rodzaje reguł i ograniczeń •Deklaracja typu •Definicje kluczy •Reguły poprawności dla kolumny •Reguły poprawności dla wiersza •Reguły integralności referencyjnej Poszczególne typy reguł zostaną omówione w dalszej części wykładu informatyka + 54 Plan prezentacji 1. Kilka definicji na dobry początek. 2. Dane i bazy danych. 3. Podstawy relacyjnego modelu danych. 4. Rozważania o tabeli. 5. Modelowanie z wykorzystaniem tabel relacyjnych. 6. Problemy i anomalie związane z gromadzeniem danych w tabelach. 7. Systemy Zarządzania Bazami Danych. 8. Spójność i integralność danych. 9. Od rozkładu jazdy do bankowości internetowej. 10.Podsumowanie wykładu – pytania. informatyka + 55 Spójność i integralność danych Jednym z najistotniejszych elementów Systemów Zarządzania Bazami Danych są mechanizmy zapewnienia spójności i integralności danych przechowywanych w bazie Podstawowe sposoby zapewnienia integralności danych •Deklaracja typu •Deklaracje kluczy •Reguły poprawności dla kolumny •Reguły poprawności dla wiersza •Reguły integralności referencyjnej informatyka + 56 Deklaracja typu 1 W tabelach relacyjnych przechowujemy dane różnego typu (liczby, teksty, znaki, daty …) Każda kolumna w tabeli musi mieć określony typ przechowywanych danych Deklaracja typu jest pierwszym sposobem zapewnienia poprawności danych – w ujęciu matematycznym jest to określenie dziedziny wartości dla kolumny informatyka + 57 Deklaracja typu 2 Przykładowe typy danych w SQL Server 2008 Dla danych znakowych •char(n) - ciąg n znaków o stałej długości (np. jeżeli kolumna ma określony typ char(25) a wpiszemy słowo „kot” – to i tak zostanie ono zapisane za pomocą 25 znaków – uzupełnione spacjami) •varchar(n) – ciąg n znaków o zmiennej długości (np. jeżeli kolumna ma określony typ varchar(25) a wpiszemy słowo „kot” –zostanie ono zapisane za pomocą 3 znaków) •varchar(max) – ciąg znaków o zmiennej długości do 2 GB informatyka + 58 Deklaracja typu 3 Przykładowe typy danych w SQL Server 2008 Pytanie : Skoro typ char w porównaniu z varchar wykorzystuje więcej pamięci do zapisywania danych (uzupełnianie spacjami) – to jakie korzyści możemy osiągnąć w przypadku wykorzystania typu char informatyka + 59 Deklaracja typu 4 Przykładowe typy danych w SQL Server 2008 Istnieją także odmiany podanych wcześniej znakowych typów danych poprzedzone literka „n” • nchar (n) • nvarchar(n) • nvarchar(max) Są to typy danych znakowych (zapisywanych łącznie z informacją o stronie kodowej) umożliwiające przechowywanie tekstów używających znaków specyficznych dla różnych języków informatyka + 60 Deklaracja typu 5 Przykładowe typy danych w SQL Server 2008 Dla danych liczbowych – liczby całkowite •tinyint- liczba całkowita z zakresu 0 ÷ 255 - przechowywana za pomocą 1 bajtu •smallint- liczba całkowita z zakresu -32768 ÷ 32767 przechowywana za pomocą 2 bajtów •int- liczba całkowita z zakresu -2147483648 ÷ 2147483647 przechowywana za pomocą 4 bajtów •bigint- liczba całkowita z zakresu -9223372036854775808 ÷ 9223372036854775807 przechowywana za pomocą 8 bajtów informatyka + 61 Deklaracja typu 5 Przykładowe typy danych w SQL Server 2008 Dla danych liczbowych – liczby z ułamkiem •real , float - do zapisywania liczb zmiennoprzecinkowych •decimal, numeric - do zapisywania liczb zmiennoprzecinkowych o określonej precyzji •money - do zapisywania liczb wyrażających kwoty pieniężne informatyka + 62 Deklaracja typu 6 Przykładowe typy danych w SQL Server 2008 Dla danych liczbowych – data i czas •date- do zapisywania dat np. 2009-08-22 •time- do zapisywania czasu np. 19:22:07.2345644 •datetime - do zapisywania łącznie daty i czasu np. 2009-08-22 19:22:07.2345644 informatyka + 63 Deklaracja typu 7 Przykładowe typy danych w SQL Server 2008 Dla danych liczbowych – typy różne •bit- do zapisywania wartości logicznych (true, false lub 0,1) •varbinary(n)- do zapisywania danych binarnych o długości n bajtów •varbinary(max) - do zapisywania danych binarnych o długości do 2 GB (np. obrazy, dźwięki itp. ) •xml- do zapisywania dokumentów XML o długości do 2 GB •Timestamp - specjalny znacznik który automatycznie zmienia swoja wartość przy modyfikacji wiersza informatyka + 64 Deklaracja typu 8 Krótkie podsumowanie •Każda kolumna w tabeli musi mieć określony typ danych jaki będzie w tej kolumnie zapisywany •Decyzja o wyborze odpowiedniego typu danych jest pierwszym etapem zapewnienia spójności danych •Wybór typu jest równoznaczny z określeniem dziedziny wartości dla danych zapisywanych w danej kolumnie informatyka + 65 Deklaracja kluczy W każdej tabeli relacyjnej powinien być zdefiniowany klucz podstawowy – taka definicja zapewnia, ze każda wartość w kolumnie klucza podstawowego musi przyjąć inną wartość W SZBD istnieją mechanizmy nadające kolumnom klucza podstawowego automatycznie unikalne wartości (autonumeracja) Można także wymusić unikalność kolumn, które nie są kluczem podstawowym – klucze potencjalne informatyka + 66 Reguły poprawności dla kolumny Deklaracja typu określa dziedzinę wartości dla kolumny ale często jest to dziedzina zbyt szeroka Reguła poprawności dla kolumny jest wyrażeniem logicznym ograniczającym dziedzinę do tych wartości, które spełniają ten warunek Przykład : Numer Pesel (w tabeli Uczniowie) ma zadeklarowany typ danych char(11) - czyli ciąg znaków o maksymalnej długości 11. Powinniśmy wymusić, żeby to było dokładnie 11 znaków i mogą to być tylko cyfry. Taka definicja zapewni, że zapisywane w tabeli numery Pesel będą poprawne (w tej części wymagań) informatyka + 67 Reguły poprawności dla wiersza Czasami występują logiczne zależności pomiędzy danymi zapisanymi w różnych kolumnach (dla jednego wiersza) Reguła poprawności dla wiersza jest wyrażeniem logicznym ograniczającym dziedzinę do tych wartości, które spełniają ten warunek . Przykład : Numer Pesel (w tabeli Uczniowie) jest logicznie powiązany z datą urodzenia ucznia zapisaną w tej samej kolumnie. Powinniśmy wymusić, żeby pierwsze sześć cyfr numeru Pesel odpowiadało dacie urodzenia zapisanej w innej kolumnie Taka definicja zapewni, że zapisywane w tabeli numery Pesel i daty urodzenia będą logicznie poprawne informatyka + 68 Reguły integralności referencyjnej Integralność referencyjna określa poprawność logiczna danych zapisanych w różnych tabelach Klasycznym przykładem takich zależności jest para klucz obcy – klucz podstawowy. Przykład : Kolumna iducznia w tabeli Uczniowie (jako klucz podstawowy) i kolumna iducznia w tabeli Oceny (jako klucz obcy) Powinniśmy wymusić, żeby wartości klucza obcego przyjmowały tylko takie wartości, które występują w tabeli gdzie ta kolumna jest kluczem podstawowym – zapewnia to odpowiednie powiązanie danych zapisanych w różnych tabelach. informatyka + 69 Podsumowanie części 8 •Zapewnienie spójności i integralności danych jest jednym z najważniejszych wyzwań stojących przed twórcami baz danych •Systemy Zarządzania Bazami Danych dostarczają mechanizmy ułatwiajace realizacje tych zadań •W trakcie zajęć warsztatowych przyjrzymy się jak te mechanizmy działają w praktyce informatyka + 70 Plan prezentacji 1. Kilka definicji na dobry początek. 2. Dane i bazy danych. 3. Podstawy relacyjnego modelu danych. 4. Rozważania o tabeli. 5. Modelowanie z wykorzystaniem tabel relacyjnych. 6. Problemy i anomalie związane z gromadzeniem danych w tabelach. 7. Systemy Zarządzania Bazami Danych. 8. Spójność i integralność danych. 9. Od rozkładu jazdy do bankowości internetowej. 10.Podsumowanie wykładu – pytania. informatyka + 71 Od rozkładu jazdy do bankowości internetowej •Czy chcemy tego czy nie chcemy, czy wiemy o tym czy nie wiemy … bazy danych są wszechobecne w naszym życiu •Korzystanie z internetu, •Załatwianie sprawy w urzędzie, •Wypłacanie pieniędzy w bankomacie •Zakupy w sklepie internetowym •Wykupienie recepty w aptece • … a jeszcze do tego elektroniczny dziennik lekcyjny Trudno wyobrazić sobie działanie, żeby w tle nie było bazy danych informatyka + 72 Od rozkładu jazdy do bankowości internetowej Codziennie setki milionów ludzi korzystają z wielkiej „bazy danych” – czyli internetu. Kto nie zna internetowej wyszukiwarki np. google Wyszukiwarki internetowe pozwalają wyszukiwać dane i informacje z zasobów internetu na podstawie słów kluczowych Aktualnie stajemy się świadkami narodzin nowego!!!! informatyka + 73 Od rozkładu jazdy do bankowości internetowej Projekt WolframAlpha – wprowadza nową jakość do świata wyszukiwarek internetowych Różnicę w sposobie działania omówimy na przykładzie : Chcemy dowiedzieć się o ilości mieszkańców Polski informatyka + 74 Od rozkładu jazdy do bankowości internetowej Wykorzystamy najpierw wyszukiwarkę google ( … i język angielski – bo projekt WolframAlpha aktualnie najlepiej radzi sobie z tym językiem) Wpisujemy w wyszukiwarce słowa - Poland citizniens (Polska obywalete) I otrzymujemy wynik – ok. 5 milionów stron zawierających podane słowa informatyka + 75 Od rozkładu jazdy do bankowości internetowej … a teraz to samo w wyszukiwarce WolframAlfa – wpisujemy to samo hasło …. Początek podobny …. Ale efekt końcowy całkowicie odmienny informatyka + 76 Tym razem otrzymujemy odpowiedź na zadane pytanie informatyka + 77 Dziękuję za uwagę … a może pytania ???? informatyka + 78 Dziękuję za uwagę … a może pytania ???? informatyka + 79