Dr inż. Anna M. Wiśniewska E‐mail: [email protected] 1. Podstawowe wiadomości o bazach danych‐ wprowadzenie do programu MS. Access. 2. Wybrane informacje z zakresu baz danych. 3. Program MS Access jako narzędzie do zbierania danych w akwakulturze. Komputerowa baza danych sobota, 19 kwietnia 2008 2 Modele danych Model danych jest to abstrakcyjny model (pojęcie/schemat) opisujący jak dane są reprezentowane i jak mają być używane. Model bazy danych zbiór zasad, którymi należy się posługiwać podczas tworzenia bazy danych. W modelu danych określa się reguły, zgodnie z którymi dane umieszcza się w strukturach. Określane są również dozwolone operacje. Definiuje się strukturę danych poprzez specyfikację reprezentacji dozwolonych w modelu obiektów (encji) oraz ich związków. W informatyce głównymi modelami baz danych są: • hierarchiczny model danych, • relacyjny model danych, • grafowy (sieciowy) model danych, • obiektowy model danych, • sieci semantyczne, sobota, 19 kwietnia 2008 3 Wprowadzenie Baza danych w aplikacji Microsoft Access jest kolekcją związanych ze sobą danych. System zarządzania bazami danych (ang. database management system, w skrócie SZBD) wykonuje dwa podstawowe zadania: dodaje, usuwa i uaktualnia dane w bazie danych, umożliwia przeglądanie danych znajdujących się w bazie danych na różne sposoby (na ekranie i w druku). Jeżeli dane są nieskomplikowane i nie ma ich zbyt wiele, baza danych może składać się z pojedynczej tabeli. Na dobrą sprawę, prostą bazę danych można zbudować nawet za pomocą edytora tekstu. sobota, 19 kwietnia 2008 4 Baza danych jest logicznie spójnym zbiorem danych. Baza danych posiada: źródło danych, użytkowników, związki z reprezentowaną rzeczywistością System zarządzania bazą danych ( SZBD) ‐ (database managment system, DBMS) ‐ oprogramowanie umożliwiające jednej lub więcej osobom korzystanie z danych. Głównym zadaniem takiego systemu jest zapewnienie użytkownikowi możliwości operowania danymi za pomocą pojęć abstrakcyjnych w niewielkim stopniu odwołujących się do sposobu przechowywania danych przez komputer. sobota, 19 kwietnia 2008 5 Funkcje spełniane przez SZBD: modyfikacja danych, synchronizacja, integralność, ochrona, zarządzanie bazą danych. Cechy baz danych: niezależność aplikacji i danych, abstrakcyjna reprezentacja danych, różnorodność sposobów widzenia danych, fizyczna i logiczna niezależność danych. sobota, 19 kwietnia 2008 6 Systemy zarządzania bazą danych umożliwiają, oprócz przechowywania zebranych informacji, również: • przyjazny dostęp do bazy danych • porządkowanie danych wg różnych kryteriów • szybką zmianę formy prezentacji danych • uzyskiwanie unikatowych zestawów danych oraz ich grupowanie i dokonywanie obliczeń • znaczne skrócenie czasu potrzebnego na dołączanie, modyfikowanie i usuwanie zestawów danych system zarządzania bazą danych ‐ Access, FoxPro, Oracie. sobota, 19 kwietnia 2008 7 Modele danych Model danych to zbiór koncepcji stosowanych do opisu struktury informacyjnej rzeczywistości a potem struktury bazy danych. Struktura ta obejmuje: typy danych, związki pomiędzy danymi i więzy nałożone na dane, zbiór operacji do manipulowania danymi, Typy modeli danych: konceptualne modele danych, implementacyjne modele danych, fizyczne modele danych. sobota, 19 kwietnia 2008 8 Poziomy abstrakcji w SZBD sobota, 19 kwietnia 2008 9 Relacyjna baza danych Zarządzanie prostą, jednorodną bazą danych zawierającą jedną tabelę nie wymaga zgłębiania teorii baz danych. Jednak większość przydatnych baz danych jest znacznie bardziej złożona niż baza przedstawiona wyżej. Prawdziwe bazy danych często posiadają setki tysięcy lub nawet miliony rekordów zawierających ściśle ze sobą powiązane dane. Właśnie w takich sytuacjach korzystanie z systemu zarządzania bazami danych ma sens. Przykładem może być — Biblioteka Kongresu USA — kolekcja ponad 16 milionów książek. Z powodów, które wkrótce staną się jasne, jedna tabela to po prostu za mało dla tak dużej bazy danych. sobota, 19 kwietnia 2008 10 12 praw CODD’a dla relacyjnych baz danych Model relacyjnej bazy danych został opracowany na początku lat siedemdziesiątych przez Amerykanina E.F. Codd'a, który przy jego tworzeniu oparł się na matematycznej teorii relacji i zbiorów. Dr E. F. Codd, twórca modelu relacyjnego opublikował dwuczęściowy artykuł w ComputerWorld (Codd, 1985), w którym podał 12 praw określania, kiedy baza danych jest relacyjna. sobota, 19 kwietnia 2008 11 12 praw CODD’a dla relacyjnych baz danych Dwanaście Reguł Codd'a brzmi następująco : 1. Reguła Informacyjna. Cała informacja w relacyjnej bazie danych jest reprezentowana wprost i tylko w jeden sposób, jako wartości w tabelach. 2. Reguła Gwarantowanego Dostępu. Każda i wszystkie dane w relacyjnej bazie danych są logicznie dostępne poprzez nazwę tabeli, wartość klucza pierwotnego i nazwę kolumny. 3. Reguła Systematycznego Traktowania Wartości Pustych. Wartości puste (różne od pustego łańcucha znaków, łańcucha spacji i różne od zera lub innej liczby) są całkowicie wpierane przez relacyjny system zarządzania bazą danych dla reprezentacji braku informacji w sposób systematyczny (konsekwentny) niezależnie od typu danej. sobota, 19 kwietnia 2008 12 12 praw CODD’a dla relacyjnych baz danych 4. Reguła Organizacji Dostępu w Modelu Relacyjnym. Opis bazy danych jest przedstawiany na poziomie logicznym w ten sam sposób jak dane, tak że upoważniony użytkownik może zastosować ten sam język zapytań tak w celu poznania opisu bazy jak i danych. 5. Reguła Pełności Danych Podjęzyka. System relacyjny może wspierać wiele języków, jednakże musi istnieć przynajmniej jeden, którego instrukcje tworzą wyrażenia dla dobrze zdefiniowanej składni w postaci łańcuchów znaków i są zdolne do pełnego wspierania następujących elementów: definicji danych, definicji perspektyw, manipulacji danymi (interaktywnie lub przez program), więzów integralności danych i zakresów transakcji (begin, commit i rollback). 6. Reguła Przeglądania Modyfikacji. Wszystkie modyfikacje działające na perspektywach muszą wykonywalne przez System Zarządzania Bazą Danych. sobota, 19 kwietnia 2008 13 12 praw CODD’a dla relacyjnych baz danych 7. Reguła Wysokiego Poziomu Wstawiania, Aktualizacji i Usuwania. System musi wspierać zespół jednoczesnych działań takich jak wstawianie, aktualizacja i usuwanie danych. 8. Reguła Fizycznej Niezależności Danych. Programy aplikacyjne lub akcje wykonywane na terminalu pozostają logicznie nienaruszone w przypadku zmian dokonywanych w reprezentacji pamięci fizycznej lub metod dostępu. 9. Reguła Logicznej Niezależności Danych. Modyfikacje w logicznej strukturze bazy danych mogą być wykonywane bez wyrejestrowywania się istniejących użytkowników czy zamykania istniejących programów. sobota, 19 kwietnia 2008 14 12 praw CODD’a dla relacyjnych baz danych 10. Reguła Niezależności Integralności. Ograniczenia integralności specyficzne dla konkretnej relacyjnej bazy danych muszą być definiowalne w podjęzyku relacyjnym i przechowywane w schemacie bazy a nie w programie aplikacyjnym. Minimum dwa ograniczenia integralności muszą być wpierane: • integralność encji: żaden z elementów składowych klucza pierwotnego nie może zawierać wartości pustej, • integralność referencyjna: dla każdej różnej, nie pustej wartości klucza obcego musi odpowiadać odpowiednia wartość klucza pierwotnego z tej samej domeny sobota, 19 kwietnia 2008 15 12 praw CODD’a dla relacyjnych baz danych 11. Reguła Niezależności Dystrybucji. Niezależność dystrybucji wymusza, że użytkownicy nie powinni martwić się kiedy baza danych jest dystrybuowana 12. Reguła Braku Podwersji. Dostęp na niskim poziomie albo na poziomie rekordu nie może być zdolny do naruszenia systemu, ominięcia reguł integralności lub ograniczeń zdefiniowanych na wyższych poziomach Do 12 reguł istnieje uzupełnienie znane jako Reguła zero: Dla każdego systemu, który uważany jest za relacyjny musi istnieć możliwość zarządzania danymi wyłącznie poprzez jego relacyjne możliwości sobota, 19 kwietnia 2008 16 Dlaczego baza danych stanowi dobry fundament S.I.? Współczesne profesjonalne systemy informacyjne z reguły wykorzystują bazy danych. Wydajność – wydajne przetwarzanie transakcji – szybkie wyszukiwanie Wielodostęp Otwartość – elastyczność dostępu do danych – współdziałanie z różnymi źródłami danych sobota, 19 kwietnia 2008 W ogromnej większości przypadkow stosowane są systemy relacyjne (RDBMS). Bezpieczeństwo – zabezpieczenia dostępu – niezawodność – ograniczenia integralności – możliwość scentralizowanego administrowania danymi – przetwarzanie transakcyjne Możliwości rozwoju – skalowalność – przenośność – możliwości pracy rozproszonej 17 Wprowadzenie do projektowania struktur relacyjnych Określenie celu, któremu ma służyć baza danych Określenie tabel, które znajdą się w bazie danych Określenie pól, które znajdą się w tabelach Przypisanie polom jednoznacznych wartości Określenie relacji (sprzężeń) między tabelami sobota, 19 kwietnia 2008 18 Określanie relacji o Relacja jeden‐do‐wielu rekord w tabeli A może mieć wiele dopasowanych do niego rekordów z tabeli B, ale rekord w tabeli B ma tylko jeden dopasowany rekord w tabeli A. o Relacja jeden‐do‐jednego każdy rekord w tabeli A może mieć tylko jeden dopasowany rekord z tabeli B, i tak samo każdy rekord w tabeli B może mieć tylko jeden dopasowany rekord z tabeli A.. o Relacja wiele‐do‐wielu rekord w tabeli A może mieć wiele dopasowanych do niego rekordów z tabeli B i tak samo rekord w tabeli B może mieć wiele dopasowanych do niego rekordów z tabeli A. o Więzy integralności o Typy połączeń relacji ‐ właściwości sprzężeń sobota, 19 kwietnia 2008 19 Nadmiarowość danych Baza danych składająca się tylko z jednej tabeli zawiera zwykle powtarzające się, tj. nadmiarowe dane. Niektóre dane muszą się powtarzać, ale chodzi o to, by usunąć jak najwięcej powtarzających się danych. sobota, 19 kwietnia 2008 20 Składniki bazy danych Microsoft Access: • Tabele są zbiorami danych dotyczących konkretnego tematu. Do prezentacji i zarządzania danymi przechowywanymi w tabelach służą kwerendy (zapytania), formularze i raporty, • Kwerendy są to pytania skierowane do bazy danych pozwalającym na wybieranie z tabel rekordów według określonych kryteriów, łączenie pól z różnych powiązanych ze sobą tabel, wykonywanie obliczeń itp. Kwerendy służą także do uzupełniania, dołączania i usuwania rekordów, są również bardzo często, a praktycznie zawsze podstawą formularzy i raportów. sobota, 19 kwietnia 2008 21 Składniki bazy danych Microsoft Access: • Formularze tworzone są głównie w celu wprowadzania danych i dają inne możliwości wyboru formy ich prezentacji. Można zmieniać szatę graficzną i położenie wyświetlanych informacji, jak również zmieniać interpretację danych (np. przedstawić je w postaci wykresu). Formularze można również drukować, z tym, że taki wydruk najczęściej ma charakter roboczy, ponieważ mogą pojawiać się na nim niekiedy niewskazane na wydruku obiekty, np. przyciski poleceń. • Raporty służą do wydruku informacji w najbardziej odpowiadającym użytkownikowi układzie. Umożliwiają one automatyczne grupowanie i podsumowanie danych. Pozwalają też na lepszą kontrolę nad wyświetlaniem informacji i ich wydrukiem. sobota, 19 kwietnia 2008 22 Składniki bazy danych Microsoft Access: •Makra są to zdefiniowane przez użytkownika listy akcji, które Access może wielokrotnie w ten sam sposób wykonać. Dzięki nim, między innymi, możliwe jest zautomatyzowanie często wykonywanych zadań przez uruchamianie odpowiednich poleceń. • Moduły są zbiorami grup procedur napisanych w Visual Basic języku programowania wykorzystywanym w aplikacjach Microsoft Office. sobota, 19 kwietnia 2008 23 Tabela jest zbiorem danych dotyczących określonego zagadnienia (jak np. produkty i dostawcy). Używanie oddzielnych tabel dla każdego tematu eliminuje duplikowanie danych (redundancję), co czyni ich przechowywanie bardziej efektywnym i eliminuje błędy wprowadzania. Tabele organizują dane w kolumnach (zwanych polami) i w wierszach (zwanych rekordami). sobota, 19 kwietnia 2008 24 Typy danych: Tekst- znaki alfanumeryczne, rozmiar do 255 bajtów Memo- znaki alfanumeryczne, do 64000 bajtów Liczba- wartości liczbowe, 1,2,4 lub 8 bajtów Data/Godzina- daty i godziny, 8 bajtów Waluta- wartości pieniężne, 8 bajtów Licznik- wartości liczbowe zwiększane automatycznie dla każdego nowego rekordu; 4 bajty Tak/Nie- wartości logiczne, 1 bit Obiekt OLE- Obiekty OLE, grafika lub inne dane binarne, do 1 gigabajta W przypadku typu tekst i Liczba można precyzyjniej określić typ danych i rozmiar pola. sobota, 19 kwietnia 2008 25 Hurtownie danych Tworzenie hurtowni danych Ekstrakcja danych Rynki danych Systemy informacyjne dla zarządu sobota, 19 kwietnia 2008 26 Jaka ma być hurtownia? Zintegrowana Zorientowana tematycznie Nieulotna Wielowersyjno‐czasowa sobota, 19 kwietnia 2008 27 Etap1 Dokumentacja środowiska produkcyjnego Identyfikacja wszystkich systemów w danym przedsiębiorstwie Określenie jaka informacja jest przekazywana w danym systemie sobota, 19 kwietnia 2008 28 Etap2 Wybór technologii System operacyjny dla hurtowni Baza danych dla hurtowni Narzędzia modelowania hurtowni Narzędzia programistyczne Narzędzia monitorujące Narzędzia do ekstrakcji i płukania danych Narzędzia do raportowania Narzędzia do przeszukiwania danych sobota, 19 kwietnia 2008 29 Etap 3 Projektowanie modelu Schemat gwiazdy sobota, 19 kwietnia 2008 30 Etap 3 Projektowanie modelu Schemat płatka śniegu sobota, 19 kwietnia 2008 31 Etap 4 Opracowanie procedur 1. Sposoby określania które dane uległy zmianie Zastosowanie dzienników śledzenia Tabele Pełne odświeżanie z wyborem danych w hurtowni sumaryczne Zmiana kodu w istniejących już aplikacjach Tabele bazowe sobota, 19 kwietnia 2008 32 Etap 4 Opracowanie procedur 1. Funkcje weryfikacji danych w procesie ekstrakcji Sprawdzenie poprawności samego procesu ekstrakcji Sprawdzenie poprawności procesów produkcyjnych Tabele sumaryczne Wychwytywanie większych problemów natury biznesowej Tabele bazowe sobota, 19 kwietnia 2008 33 Etap 5 Tworzenie repozytorium metadanych Metadane – „dane o danych” dostarczające informacji o strukturach danych i związkach między strukturami w bazie lub pomiędzy bazami danych • Rodzaje metadanych 1. Metadane systemowe 2. Metadane administracyjne 3. Metadane biznesowe sobota, 19 kwietnia 2008 34 sobota, 19 kwietnia 2008 35 Dziękuję za uwagę sobota, 19 kwietnia 2008 36