Hurtownie Danych

advertisement
Hurtownie Danych
Mariusz Dołęga
Bazy operacyjne
 Celem jest wspomaganie bieżącej obsługi
działalności przetsiębiordtwa, dla dobrze
zdefiniowanych procesów (np.: obsługa
sprzedaży)
 OLTP - OnLine Transaction Processing przetwarzanie transakcji w trybie on-line
Bazy analityczne
 Celem jest przeprowadzanie analizy danych i
wspomaganie decyzji. Posiadanie danych
opisujących działanie przedsiębiorstwa w
dłuższym przedziale czasu pozwala na
analizę trendów, anomalii, poszukiwanie
wzorców z myślą o wspomaganiu procesu
podejmowania decyzji w firmie.
 OLAP - OnLine Analytical Processing przetwarzanie analityczne w trybie on-line.
 Bazy analityczne inaczej „hurtownie danych"
Po co hurtownie danych?
 Hurtownia danych pozwala na wydobycie
informacji o zachowaniu się klientów,
zapotrzebowaniu na produkt, pozwala efektywnie
kierować kampaniami reklamowymi, zarządzać
zapasami. Analizę rentowności, pokazuje firmom,
którzy klienci są dochodowi, a którzy nie.
 Jakie usługi są najbardziej pożądane przez klientów?
 W których regionach kraju firma osiąga największe
zyski, z jakiej działalności one pochodzą?
Hurtownia danych?
 Hurtownie danych są bardzo dużymi bazami
danych, w których gromadzi się dane
pochodzące z wielu źródeł: baz relacyjnych,
relacyjno-obiektowych, obiektowych oraz ze
źródeł innych niż bazy danych.
 Hurtownia danych jest baza danych
charakteryzującą się czterema cechami :
Cechy hurtowni danych.
 Zorientowanie na temat.
 Nieulotność.
 Zintegrowanie.
 Zmienność w czasie.
Cechy hurtowni danych
Zorientowanie na temat.
 Zorientowanie na temat oznacza, że zbierane dane
dotyczą pewnego tematu (np. sprzedaży, klienta ).
Dane dotyczące jednego tematu mogą się
znajdować w kilku aplikacjach operacyjnych
(bazach operacyjnych) np. dane klienta mogą się
znajdować w aplikacji obsługi zamówień i w
aplikacji księgowej. Operacyjne aplikacje (bazy)
skupiają się na celach biznesowych, są
zorientowane na działanie.
Cechy hurtowni danych
Nieulotność.
 Nieulotność oznacza, że dane raz umieszczone w
hurtowni pozostają tam niezmienione. Zostają tam
umieszczone na zawsze i potem będą już tylko
odczytywane. (W operacyjnych bazach danych
dane podlegają ciągłym zmianom.)
Cechy hurtowni danych
Zintegrowanie.
 Zintegrowanie oznacza ze dane są jednolite. Np.
daty przechowywane są zawsze w tym samym
formacie. Zanim dane zostaną umieszczone w
hurtowni danych , musza zostać ujednolicone.
Integracja jest zatem procesem, który dane musza
przejść po opuszczeniu bazy danych, a przed
wejściem do hurtowni danych.
Cechy hurtowni danych
Zmienność w czasie.
 Zmienność w czasie oznacza , że gromadzone są
dane zmieniające się w czasie. Prawie wszystkie
zapytania kierowane do hurtowni danych wymagają
prześledzenia jakiegoś odcinka czasu.
Analiza wymiarowa.
 Jednym ze sposobów stosowanych podczas
projektowania hurtowni danych jest tworzenie i
implementacja „modelu wymiarowego”.
 Metoda ta wymaga ustalenia jakim obszarem
tematycznym jesteśmy zainteresowani. Obszary
tematyczne odzwierciedlają cechę hurtowni danych
„zorientowanie na temat”.
Analiza wymiarowa przykład.
 Obszarem tematycznym jest sprzedaż, wymiarami
analizy są klienci, produkty i czas. Wymagana jest
analiza sprzedaży w określonym czasie dla każdego
klienta i produktu.
Analiza wymiarowa przykład
Schemat gwiazdy.
Klienci
Produkt
Sprzedaż
Obszar
Czas
Architektura logiczna hurtowni danych.
Hurtownia danych
Integracja
Ekstrakcja
Zródło 1
Zródło 2
Zródło 3
Architektura logiczna hurtowni danych.
 Ekstrakcja danych – odbywa się przez bramki
(gateways) lub standardowe interfejsy (ODBC,
JDBC, Oracle Open Connect, Informix Enterprise
Gateway, itd.)
 Integracja – ujednolicenie danych z różnych zródeł.
 Baza danych hurtowni- schemat relacyjny
odzwierciedlający schemat gwiazdy.
Bibliografia
 Chris Todman „Projektowanie hurtowni
danych”.
 Lech Banachowski, Krzysztof Stencel
„Bazy Danych”.
Download