Wybrane informacje z zakresu baz danych. Program Ms Access jako

advertisement
Dr inż. Anna M. Wiśniewska
E‐mail: [email protected]
1. Podstawowe wiadomości o bazach danych‐
wprowadzenie do programu MS. Access. 2. Wybrane informacje z zakresu baz danych.
3. Program MS Access jako narzędzie do zbierania danych w akwakulturze.
Komputerowa baza danych
sobota, 19 kwietnia 2008
2
Modele danych
Model danych jest to abstrakcyjny model (pojęcie/schemat) opisujący jak dane są reprezentowane i jak mają być używane.
Model bazy danych
zbiór zasad, którymi należy się posługiwać podczas tworzenia bazy danych. W
modelu danych określa się reguły, zgodnie z którymi dane umieszcza się w
strukturach. Określane są również dozwolone operacje. Definiuje się strukturę
danych poprzez specyfikację reprezentacji dozwolonych w modelu obiektów (encji)
oraz ich związków. W informatyce głównymi modelami baz danych są:
• hierarchiczny model danych,
• relacyjny model danych,
• grafowy (sieciowy) model danych,
• obiektowy model danych,
• sieci semantyczne,
sobota, 19 kwietnia 2008
3
Wprowadzenie
Baza danych w aplikacji Microsoft Access jest kolekcją związanych ze
sobą danych. System zarządzania bazami danych (ang. database
management system, w skrócie SZBD) wykonuje dwa podstawowe
zadania:
dodaje, usuwa i uaktualnia dane w bazie danych,
umożliwia przeglądanie danych znajdujących się w bazie danych na
różne sposoby (na ekranie
i w druku).
Jeżeli dane są nieskomplikowane i nie ma ich zbyt wiele, baza danych
może składać się z pojedynczej tabeli. Na dobrą sprawę, prostą
bazę danych można zbudować nawet za pomocą edytora tekstu.
sobota, 19 kwietnia 2008
4
Baza danych jest logicznie spójnym zbiorem danych. Baza danych posiada:
źródło danych,
użytkowników,
związki z reprezentowaną rzeczywistością
System zarządzania bazą danych ( SZBD) ‐ (database managment system, DBMS) ‐ oprogramowanie
umożliwiające jednej lub więcej osobom korzystanie z danych. Głównym zadaniem takiego systemu jest zapewnienie użytkownikowi możliwości operowania danymi za pomocą pojęć abstrakcyjnych w niewielkim stopniu odwołujących się do sposobu przechowywania danych przez komputer.
sobota, 19 kwietnia 2008
5
Funkcje spełniane przez SZBD:
modyfikacja danych,
synchronizacja,
integralność,
ochrona,
zarządzanie bazą danych.
Cechy baz danych:
niezależność aplikacji i danych,
abstrakcyjna reprezentacja danych,
różnorodność sposobów widzenia danych,
fizyczna i logiczna niezależność danych.
sobota, 19 kwietnia 2008
6
Systemy zarządzania bazą danych umożliwiają, oprócz przechowywania zebranych informacji, również:
• przyjazny dostęp do bazy danych
• porządkowanie danych wg różnych kryteriów
• szybką zmianę formy prezentacji danych
• uzyskiwanie unikatowych zestawów danych oraz ich grupowanie i dokonywanie obliczeń
• znaczne skrócenie czasu potrzebnego na dołączanie, modyfikowanie i usuwanie zestawów danych
system zarządzania bazą danych ‐ Access, FoxPro, Oracie.
sobota, 19 kwietnia 2008
7
Modele danych
Model danych to zbiór koncepcji stosowanych do opisu struktury informacyjnej rzeczywistości a potem struktury bazy danych.
Struktura ta obejmuje:
typy danych, związki pomiędzy danymi i więzy nałożone na dane,
zbiór operacji do manipulowania danymi,
Typy modeli danych:
konceptualne modele danych,
implementacyjne modele danych,
fizyczne modele danych.
sobota, 19 kwietnia 2008
8
Poziomy abstrakcji w SZBD
sobota, 19 kwietnia 2008
9
Relacyjna baza danych
Zarządzanie prostą, jednorodną bazą danych zawierającą jedną tabelę nie wymaga zgłębiania teorii baz danych. Jednak większość przydatnych baz danych jest znacznie bardziej złożona niż baza przedstawiona wyżej. Prawdziwe bazy danych często posiadają setki tysięcy lub nawet miliony rekordów zawierających ściśle ze sobą powiązane dane. Właśnie w takich sytuacjach korzystanie z systemu zarządzania bazami danych ma sens. Przykładem może być — Biblioteka Kongresu USA — kolekcja ponad 16 milionów książek. Z powodów, które wkrótce staną się jasne, jedna tabela to po prostu za mało dla tak dużej bazy danych.
sobota, 19 kwietnia 2008
10
12 praw CODD’a dla relacyjnych baz danych
Model relacyjnej bazy danych został opracowany na początku lat siedemdziesiątych przez Amerykanina E.F. Codd'a, który przy jego tworzeniu oparł się na matematycznej teorii relacji i zbiorów. Dr E. F. Codd, twórca modelu relacyjnego opublikował dwuczęściowy artykuł w ComputerWorld (Codd, 1985), w którym podał 12 praw określania, kiedy baza danych jest relacyjna.
sobota, 19 kwietnia 2008
11
12 praw CODD’a dla relacyjnych baz danych
Dwanaście Reguł Codd'a brzmi następująco :
1. Reguła Informacyjna. Cała informacja w relacyjnej bazie danych jest reprezentowana wprost i tylko w jeden sposób, jako wartości w tabelach.
2. Reguła Gwarantowanego Dostępu. Każda i wszystkie dane w relacyjnej bazie danych są logicznie dostępne poprzez nazwę tabeli, wartość klucza pierwotnego i nazwę kolumny.
3. Reguła Systematycznego Traktowania Wartości Pustych. Wartości puste (różne od pustego łańcucha znaków, łańcucha spacji i różne od zera lub innej liczby) są całkowicie wpierane przez relacyjny system zarządzania bazą danych dla reprezentacji braku informacji w sposób systematyczny (konsekwentny) niezależnie od typu danej.
sobota, 19 kwietnia 2008
12
12 praw CODD’a dla relacyjnych baz danych
4. Reguła Organizacji Dostępu w Modelu Relacyjnym. Opis bazy danych jest przedstawiany na poziomie logicznym w ten sam sposób jak dane, tak że upoważniony użytkownik może zastosować ten sam język zapytań tak w celu poznania opisu bazy jak i danych.
5. Reguła Pełności Danych Podjęzyka. System relacyjny może wspierać wiele języków, jednakże musi istnieć przynajmniej jeden, którego instrukcje tworzą wyrażenia dla dobrze zdefiniowanej składni w postaci łańcuchów znaków i są zdolne do pełnego wspierania następujących elementów: definicji danych, definicji perspektyw, manipulacji danymi (interaktywnie lub przez program), więzów integralności danych i zakresów transakcji (begin, commit i rollback).
6. Reguła Przeglądania Modyfikacji. Wszystkie modyfikacje działające na perspektywach muszą wykonywalne przez System Zarządzania Bazą Danych.
sobota, 19 kwietnia 2008
13
12 praw CODD’a dla relacyjnych baz danych
7. Reguła Wysokiego Poziomu Wstawiania, Aktualizacji i Usuwania. System musi wspierać zespół jednoczesnych działań takich jak wstawianie, aktualizacja i usuwanie danych.
8. Reguła Fizycznej Niezależności Danych. Programy aplikacyjne lub akcje wykonywane na terminalu pozostają logicznie nienaruszone w przypadku zmian dokonywanych w reprezentacji pamięci fizycznej lub metod dostępu.
9. Reguła Logicznej Niezależności Danych. Modyfikacje w logicznej strukturze bazy danych mogą być wykonywane bez wyrejestrowywania się istniejących użytkowników czy zamykania istniejących programów.
sobota, 19 kwietnia 2008
14
12 praw CODD’a dla relacyjnych baz danych
10. Reguła Niezależności Integralności. Ograniczenia integralności specyficzne dla konkretnej relacyjnej bazy danych muszą być definiowalne w podjęzyku relacyjnym i przechowywane w schemacie bazy a nie w programie aplikacyjnym. Minimum dwa ograniczenia integralności muszą być wpierane:
• integralność encji: żaden z elementów składowych klucza pierwotnego nie może zawierać wartości pustej,
• integralność referencyjna: dla każdej różnej, nie pustej wartości klucza obcego musi odpowiadać odpowiednia wartość klucza pierwotnego z tej samej domeny
sobota, 19 kwietnia 2008
15
12 praw CODD’a dla relacyjnych baz danych
11. Reguła Niezależności Dystrybucji. Niezależność dystrybucji wymusza, że użytkownicy nie powinni martwić się kiedy baza danych jest dystrybuowana
12. Reguła Braku Podwersji. Dostęp na niskim poziomie albo na poziomie rekordu nie może być zdolny do naruszenia systemu, ominięcia reguł integralności lub ograniczeń zdefiniowanych na wyższych poziomach
Do 12 reguł istnieje uzupełnienie znane jako Reguła zero: Dla każdego systemu, który uważany jest za relacyjny musi istnieć możliwość zarządzania danymi wyłącznie poprzez jego relacyjne możliwości
sobota, 19 kwietnia 2008
16
Dlaczego baza danych stanowi dobry fundament S.I.?
Współczesne profesjonalne systemy informacyjne z reguły wykorzystują bazy danych.
Wydajność
– wydajne przetwarzanie transakcji
– szybkie wyszukiwanie
Wielodostęp
Otwartość
– elastyczność dostępu do danych
– współdziałanie z różnymi źródłami danych
sobota, 19 kwietnia 2008
W ogromnej większości przypadkow stosowane są systemy relacyjne (RDBMS).
Bezpieczeństwo
– zabezpieczenia dostępu
– niezawodność
– ograniczenia integralności
– możliwość scentralizowanego administrowania danymi
– przetwarzanie transakcyjne
Możliwości rozwoju
– skalowalność
– przenośność
– możliwości pracy rozproszonej
17
Wprowadzenie do projektowania struktur relacyjnych Określenie celu, któremu ma służyć baza danych
Określenie tabel, które znajdą się w bazie danych
Określenie pól, które znajdą się w tabelach
Przypisanie polom jednoznacznych wartości
Określenie relacji (sprzężeń) między tabelami
sobota, 19 kwietnia 2008
18
Określanie relacji
o Relacja jeden‐do‐wielu
rekord w tabeli A może mieć wiele dopasowanych do niego rekordów z tabeli B, ale rekord w tabeli B ma tylko jeden dopasowany rekord w tabeli A.
o Relacja jeden‐do‐jednego
każdy rekord w tabeli A może mieć tylko jeden dopasowany rekord z tabeli B, i tak samo każdy rekord w tabeli B może mieć tylko jeden dopasowany rekord z tabeli A..
o Relacja wiele‐do‐wielu
rekord w tabeli A może mieć wiele dopasowanych do niego rekordów z tabeli B i tak samo rekord w tabeli B może mieć wiele dopasowanych do niego rekordów z tabeli A. o Więzy integralności
o Typy połączeń relacji ‐ właściwości sprzężeń
sobota, 19 kwietnia 2008
19
Nadmiarowość danych
Baza danych składająca się tylko z jednej tabeli zawiera zwykle powtarzające się, tj. nadmiarowe dane. Niektóre dane muszą się powtarzać, ale chodzi o to, by usunąć jak najwięcej powtarzających się danych.
sobota, 19 kwietnia 2008
20
Składniki bazy danych Microsoft Access:
• Tabele są zbiorami danych dotyczących konkretnego tematu.
Do prezentacji i zarządzania danymi przechowywanymi w
tabelach służą kwerendy (zapytania), formularze i raporty,
• Kwerendy są to pytania skierowane do bazy danych
pozwalającym na wybieranie z tabel rekordów według
określonych kryteriów, łączenie pól z różnych powiązanych ze
sobą tabel, wykonywanie obliczeń itp. Kwerendy służą także
do uzupełniania, dołączania i usuwania rekordów, są również
bardzo często, a praktycznie zawsze podstawą formularzy i
raportów.
sobota, 19 kwietnia 2008
21
Składniki bazy danych Microsoft Access:
• Formularze tworzone są głównie w celu wprowadzania danych i
dają inne możliwości wyboru formy ich prezentacji. Można zmieniać
szatę graficzną i położenie wyświetlanych informacji, jak również
zmieniać interpretację danych (np. przedstawić je w postaci
wykresu). Formularze można również drukować, z tym, że taki
wydruk najczęściej ma charakter roboczy, ponieważ mogą pojawiać
się na nim niekiedy niewskazane na wydruku obiekty, np. przyciski
poleceń.
• Raporty służą do wydruku informacji w najbardziej
odpowiadającym użytkownikowi układzie. Umożliwiają one
automatyczne grupowanie i podsumowanie danych. Pozwalają też
na lepszą kontrolę nad wyświetlaniem informacji i ich wydrukiem.
sobota, 19 kwietnia 2008
22
Składniki bazy danych Microsoft Access:
•Makra są to zdefiniowane przez użytkownika listy akcji, które
Access może wielokrotnie w ten sam sposób wykonać. Dzięki
nim, między innymi, możliwe jest zautomatyzowanie często
wykonywanych zadań przez uruchamianie odpowiednich
poleceń.
• Moduły są zbiorami grup procedur napisanych w Visual Basic języku programowania wykorzystywanym w aplikacjach
Microsoft Office.
sobota, 19 kwietnia 2008
23
Tabela jest zbiorem danych dotyczących określonego zagadnienia (jak np. produkty i dostawcy). Używanie oddzielnych tabel dla każdego tematu eliminuje duplikowanie danych (redundancję), co czyni ich przechowywanie bardziej efektywnym i eliminuje błędy wprowadzania. Tabele organizują dane w kolumnach (zwanych polami) i w wierszach (zwanych rekordami).
sobota, 19 kwietnia 2008
24
Typy danych:
Tekst- znaki alfanumeryczne, rozmiar do 255 bajtów
Memo- znaki alfanumeryczne, do 64000 bajtów
Liczba- wartości liczbowe, 1,2,4 lub 8 bajtów
Data/Godzina- daty i godziny, 8 bajtów
Waluta- wartości pieniężne, 8 bajtów
Licznik- wartości liczbowe zwiększane automatycznie dla każdego nowego
rekordu; 4 bajty
Tak/Nie- wartości logiczne, 1 bit
Obiekt OLE- Obiekty OLE, grafika lub inne dane binarne, do 1 gigabajta
W przypadku typu tekst i Liczba można precyzyjniej określić typ danych i
rozmiar pola.
sobota, 19 kwietnia 2008
25
Hurtownie danych
Tworzenie hurtowni danych
Ekstrakcja danych
Rynki danych
Systemy informacyjne dla zarządu
sobota, 19 kwietnia 2008
26
Jaka ma być hurtownia?
Zintegrowana
Zorientowana tematycznie
Nieulotna
Wielowersyjno‐czasowa
sobota, 19 kwietnia 2008
27
Etap1 Dokumentacja środowiska produkcyjnego
Identyfikacja wszystkich systemów w danym przedsiębiorstwie
Określenie jaka informacja jest przekazywana w danym systemie
sobota, 19 kwietnia 2008
28
Etap2 Wybór technologii
System operacyjny dla hurtowni
Baza danych dla hurtowni
Narzędzia modelowania hurtowni
Narzędzia programistyczne
Narzędzia monitorujące Narzędzia do ekstrakcji i płukania danych
Narzędzia do raportowania
Narzędzia do przeszukiwania danych
sobota, 19 kwietnia 2008
29
Etap 3 Projektowanie modelu Schemat gwiazdy
sobota, 19 kwietnia 2008
30
Etap 3 Projektowanie modelu Schemat płatka śniegu
sobota, 19 kwietnia 2008
31
Etap 4 Opracowanie procedur 1.
Sposoby określania które dane uległy zmianie
Zastosowanie dzienników śledzenia
Tabele
Pełne odświeżanie z wyborem danych w hurtowni
sumaryczne
Zmiana kodu w istniejących już aplikacjach
Tabele bazowe
sobota, 19 kwietnia 2008
32
Etap 4 Opracowanie procedur 1.
Funkcje weryfikacji danych w procesie ekstrakcji
Sprawdzenie poprawności samego procesu ekstrakcji
Sprawdzenie poprawności procesów produkcyjnych
Tabele
sumaryczne
Wychwytywanie większych problemów natury biznesowej
Tabele bazowe
sobota, 19 kwietnia 2008
33
Etap 5 Tworzenie repozytorium metadanych
Metadane – „dane o danych” dostarczające informacji o strukturach danych i związkach między strukturami w bazie lub pomiędzy bazami danych
•
Rodzaje metadanych
1. Metadane systemowe
2. Metadane administracyjne
3. Metadane biznesowe
sobota, 19 kwietnia 2008
34
sobota, 19 kwietnia 2008
35
Dziękuję za uwagę
sobota, 19 kwietnia 2008
36
Download