Wyższa Szkoła Biznesu w Dąbrowie Górniczej Kierunek studiów: INFORMATYKA – studia stacjonarne Przedmiot: HURTOWNIE I EKSPLORACJA DANYCH Specjalność: wszystkie Liczba godzin w tygodniu / semestrze * 1 I 2 II III 30 7 3 IV V 4 VI VII 5 VIII IX X ECTS WYKŁADOWCA Mgr Marcin Heczko FORMA ZAJĘĆ Laboratorium CELE PRZEDMIOTU Celem przedmiotu jest zapoznanie słuchaczy z problemami, metodami i rozwiązaniami informatycznych systemów hurtowni i eksploracji danych. Na przykładzie systemu IFS Applications 2003 oraz bazy Oracle 10g w treści przedmiotu omówiono m.in.: hurtownię danych jako podstawę systemów wspomagania decyzji, technologię MOLAP i ROLAP, narzędzia dostępu do danych, podstawy projektowania hurtowni danych, wybrane metody i techniki eksploracji danych, architekturę systemów eksploracji danych. Po ukończeniu cyklu zajęć laboratoryjnych studenci powinni uzyskać wiedzę i umiejętności praktyczne umożliwiające pełnienie funkcji projektanta i administratora hurtowni danych opartych o systemy Oracle 9i / 10g oraz system MS SQL Server 2005 Znajomość podstaw baz danych, języka SQL oraz PL-SQL. WARUNKI WSTĘPNE TREŚĆ PRZEDMIOTU Wprowadzenie do problematyki hurtowni danych. Architektura hurtowni danych opartej o rozwiązania Oracle 9i/10g. Architektura hurtowni danych opartej o rozwiązania Microsoft SQL Server 2005. Pojęcia magazynu danych, źródła danych, integratora, konwertera i monitora. Modelowanie hurtowni danych. Model relacyjny ROLAP: Schemat gwiazdy (ang. star schema), schemat płatka śniegu (ang. snowflake schema), schemat konstelacji faktów (ang. fact constellation schema), schemat gwiazda-płatek śniegu (ang. starflake schema), obiekty typu Dimension). Model wielowymiarowy (MOLAP, MDOLAP) - implementacja w Oracle: Dane wielowymiarowe, obsługa modelu, obsługa danych. Heterogeniczność źródeł danych. Standardy dostępu do systemów hurtowni danych: Oracle Gateway, ODBC/JDBC, dostęp do plików tekstowych. Tabele zewnętrzne: Tworzenie tabel zewnętrznych, funkcje tablicowe, funkcje zwracające kolekcje rekordów Odświeżanie magazynu danych: Perspektywy zmaterializowane, odświeżanie przyrostowe, odświeżanie ręczne. Wsparcie SQL dla analiz biznesowych na przykładzie IFS Applications 2003. Rozszerzenia polecenia „select” w środowisku Oracle. Funkcje analityczne w środowisku ROLAP i MOLAP: Funkcje numeryczne, time series, finansowe, przewidywania. Indeksowanie danych: B-drzewa, indeksy bitmapowe, ideksy połączeniowe, bitmapowe indeksy połączeniowe Optymalizacja zapytań gwiaździstych. Partycjonowanie danych i indeksów: Techniki partycjonowania, algorytmy partycjonowania, partycjonowanie zakresowe, LITERATURA METODY NAUCZANIA SPOSÓB I WARUNKI ZALICZENIA PRZEDMIOTU partycjonowanie listowe, partycjonowanie hybrydowe, zarządzanie tabelami partycjonowanymi. Kompresja danych: Kompresja danych w blokach, kompresja liści w indeksie B-drzewo, kompresja indeksów bitmapowych. Przetwarzanie równoległe: Wykonywanie zapytań, tworzenie kopii tabel, budowanie indeksów, wczytywanie danych do magazynu, archiwizowanie danych, odtwarzanie bazy danych po awarii. Connolly T., Begg C.: Systemy baz danych, tom 2. Wyd. RM, W-wa 2004. Todman C.: Projektowanie hurtowni danych. Zarządzanie kontaktami z klientami. WNT, W-wa 2003. Kimball R., Ross M.: The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, 2nd Edition, Wiley, 2002. Beynon-Davies P.: Systemy baz danych. WNT, W-wa 2003. Oracle Warehouse Buider – Technical Overview 2003 (wersja internetowa http://otn.oracle.com/products/warehouse/content.html), Lentner M.: ORACLE. System zarządzania bazą danych.. Podręcznik użytkownika Akademicka Oficyna Wydawnicza EXIT, Warszawa 2001, Greene J.: Oracle 8 serwer – księga eksperta. Wyd.Helion, Gliwice 2000, Poe V., Klauer P., Brobst S., Tworzenie hurtowni danych. Wyd.WNT, Warszawa 2000. Hobbs L., Hillson S., Lawande S.: Oracle9iR2 Data Warehousing. Digital Press, 2003, ISBN 1-55558-287-7 Corey M., Abbey M., Abramson I., Taub B.: Oracle8i Data Warehousing. Osborne McGraw-Hill, 2001, ISBN 0-07-212675-2 Jarke M., Lenzerini M., Vassiliou Y., Vassiliadis P.: Fundamentals of Data Warehouses. Springer-Verlag, 2000, ISBN 3-540-65365-1 Ćwiczenia przy stanowiskach komputerowych Zaliczenie ćwiczeń laboratoryjnych podzielono na dwie części: 1. Zaliczenie testu obejmującego program kursu. Test składa się z 20 pytań teoretycznych. Do zaliczenia części testowej konieczne jest uzyskanie 50% ogólnej liczby punktów. 2. Zaliczenie sprawdzianu praktycznego przy komputerze. Sprawdzian obejmuje 5 zadań. Do uzyskania pozytywnej oceny wymagane jest wykonanie minimum trzech zadań. Czas trwania zaliczenia: test – 20min część praktyczna – 45 min Ocena z zaliczenia obejmuje: wynik testu i egzaminu praktycznego, obecność na zajęciach, aktywność na zajęciach.