Hurtownie Danych Mariusz Dołęga Bazy operacyjne Celem jest wspomaganie bieżącej obsługi działalności przetsiębiordtwa, dla dobrze zdefiniowanych procesów (np.: obsługa sprzedaży) OLTP - OnLine Transaction Processing przetwarzanie transakcji w trybie on-line Bazy analityczne Celem jest przeprowadzanie analizy danych i wspomaganie decyzji. Posiadanie danych opisujących działanie przedsiębiorstwa w dłuższym przedziale czasu pozwala na analizę trendów, anomalii, poszukiwanie wzorców z myślą o wspomaganiu procesu podejmowania decyzji w firmie. OLAP - OnLine Analytical Processing przetwarzanie analityczne w trybie on-line. Bazy analityczne inaczej „hurtownie danych" Po co hurtownie danych? Hurtownia danych pozwala na wydobycie informacji o zachowaniu się klientów, zapotrzebowaniu na produkt, pozwala efektywnie kierować kampaniami reklamowymi, zarządzać zapasami. Analizę rentowności, pokazuje firmom, którzy klienci są dochodowi, a którzy nie. Jakie usługi są najbardziej pożądane przez klientów? W których regionach kraju firma osiąga największe zyski, z jakiej działalności one pochodzą? Hurtownia danych? Hurtownie danych są bardzo dużymi bazami danych, w których gromadzi się dane pochodzące z wielu źródeł: baz relacyjnych, relacyjno-obiektowych, obiektowych oraz ze źródeł innych niż bazy danych. Hurtownia danych jest baza danych charakteryzującą się czterema cechami : Cechy hurtowni danych. Zorientowanie na temat. Nieulotność. Zintegrowanie. Zmienność w czasie. Cechy hurtowni danych Zorientowanie na temat. Zorientowanie na temat oznacza, że zbierane dane dotyczą pewnego tematu (np. sprzedaży, klienta ). Dane dotyczące jednego tematu mogą się znajdować w kilku aplikacjach operacyjnych (bazach operacyjnych) np. dane klienta mogą się znajdować w aplikacji obsługi zamówień i w aplikacji księgowej. Operacyjne aplikacje (bazy) skupiają się na celach biznesowych, są zorientowane na działanie. Cechy hurtowni danych Nieulotność. Nieulotność oznacza, że dane raz umieszczone w hurtowni pozostają tam niezmienione. Zostają tam umieszczone na zawsze i potem będą już tylko odczytywane. (W operacyjnych bazach danych dane podlegają ciągłym zmianom.) Cechy hurtowni danych Zintegrowanie. Zintegrowanie oznacza ze dane są jednolite. Np. daty przechowywane są zawsze w tym samym formacie. Zanim dane zostaną umieszczone w hurtowni danych , musza zostać ujednolicone. Integracja jest zatem procesem, który dane musza przejść po opuszczeniu bazy danych, a przed wejściem do hurtowni danych. Cechy hurtowni danych Zmienność w czasie. Zmienność w czasie oznacza , że gromadzone są dane zmieniające się w czasie. Prawie wszystkie zapytania kierowane do hurtowni danych wymagają prześledzenia jakiegoś odcinka czasu. Analiza wymiarowa. Jednym ze sposobów stosowanych podczas projektowania hurtowni danych jest tworzenie i implementacja „modelu wymiarowego”. Metoda ta wymaga ustalenia jakim obszarem tematycznym jesteśmy zainteresowani. Obszary tematyczne odzwierciedlają cechę hurtowni danych „zorientowanie na temat”. Analiza wymiarowa przykład. Obszarem tematycznym jest sprzedaż, wymiarami analizy są klienci, produkty i czas. Wymagana jest analiza sprzedaży w określonym czasie dla każdego klienta i produktu. Analiza wymiarowa przykład Schemat gwiazdy. Klienci Produkt Sprzedaż Obszar Czas Architektura logiczna hurtowni danych. Hurtownia danych Integracja Ekstrakcja Zródło 1 Zródło 2 Zródło 3 Architektura logiczna hurtowni danych. Ekstrakcja danych – odbywa się przez bramki (gateways) lub standardowe interfejsy (ODBC, JDBC, Oracle Open Connect, Informix Enterprise Gateway, itd.) Integracja – ujednolicenie danych z różnych zródeł. Baza danych hurtowni- schemat relacyjny odzwierciedlający schemat gwiazdy. Bibliografia Chris Todman „Projektowanie hurtowni danych”. Lech Banachowski, Krzysztof Stencel „Bazy Danych”.