Hurtownie i eksploracja danych

advertisement
Wyższa Szkoła Biznesu w Dąbrowie Górniczej
Kierunek studiów: INFORMATYKA – studia stacjonarne
Przedmiot: HURTOWNIE I EKSPLORACJA DANYCH
Specjalność: wszystkie
Liczba godzin w
tygodniu /
semestrze *
1
I
2
II
III
30
7
3
IV
V
4
VI
VII
5
VIII
IX
X
ECTS
WYKŁADOWCA
Mgr Marcin Heczko
FORMA ZAJĘĆ
Laboratorium
CELE
PRZEDMIOTU
Celem przedmiotu jest zapoznanie słuchaczy z problemami, metodami i rozwiązaniami
informatycznych systemów hurtowni i eksploracji danych. Na przykładzie systemu IFS
Applications 2003 oraz bazy Oracle 10g w treści przedmiotu omówiono m.in.: hurtownię
danych jako podstawę systemów wspomagania decyzji, technologię MOLAP i ROLAP,
narzędzia dostępu do danych, podstawy projektowania hurtowni danych, wybrane metody i
techniki eksploracji danych, architekturę systemów eksploracji danych. Po ukończeniu cyklu
zajęć laboratoryjnych studenci powinni uzyskać wiedzę i umiejętności praktyczne
umożliwiające pełnienie funkcji projektanta i administratora hurtowni danych opartych o
systemy Oracle 9i / 10g oraz system MS SQL Server 2005
Znajomość podstaw baz danych, języka SQL oraz PL-SQL.
WARUNKI
WSTĘPNE
TREŚĆ
PRZEDMIOTU
Wprowadzenie do problematyki hurtowni danych.
Architektura hurtowni danych opartej o rozwiązania Oracle 9i/10g.
Architektura hurtowni danych opartej o rozwiązania Microsoft SQL Server 2005.
Pojęcia magazynu danych, źródła danych, integratora, konwertera i monitora.
Modelowanie hurtowni danych.
Model relacyjny ROLAP:
 Schemat gwiazdy (ang. star schema), schemat płatka śniegu (ang. snowflake schema),
schemat konstelacji faktów (ang. fact constellation schema), schemat gwiazda-płatek
śniegu (ang. starflake schema), obiekty typu Dimension).
Model wielowymiarowy (MOLAP, MDOLAP) - implementacja w Oracle:
 Dane wielowymiarowe, obsługa modelu, obsługa danych.
Heterogeniczność źródeł danych.
Standardy dostępu do systemów hurtowni danych:
 Oracle Gateway, ODBC/JDBC, dostęp do plików tekstowych.
Tabele zewnętrzne:
 Tworzenie tabel zewnętrznych, funkcje tablicowe, funkcje zwracające kolekcje rekordów
Odświeżanie magazynu danych:
 Perspektywy zmaterializowane, odświeżanie przyrostowe, odświeżanie ręczne.
Wsparcie SQL dla analiz biznesowych na przykładzie IFS Applications 2003.
Rozszerzenia polecenia „select” w środowisku Oracle.
Funkcje analityczne w środowisku ROLAP i MOLAP:
 Funkcje numeryczne, time series, finansowe, przewidywania.
Indeksowanie danych:
 B-drzewa, indeksy bitmapowe, ideksy połączeniowe, bitmapowe indeksy połączeniowe
Optymalizacja zapytań gwiaździstych.
Partycjonowanie danych i indeksów:
 Techniki partycjonowania, algorytmy partycjonowania, partycjonowanie zakresowe,
LITERATURA
METODY
NAUCZANIA
SPOSÓB I
WARUNKI
ZALICZENIA
PRZEDMIOTU
partycjonowanie listowe, partycjonowanie hybrydowe, zarządzanie tabelami
partycjonowanymi.
Kompresja danych:
 Kompresja danych w blokach, kompresja liści w indeksie B-drzewo, kompresja indeksów
bitmapowych.
Przetwarzanie równoległe:
 Wykonywanie zapytań, tworzenie kopii tabel, budowanie indeksów, wczytywanie danych
do magazynu, archiwizowanie danych, odtwarzanie bazy danych po awarii.
 Connolly T., Begg C.: Systemy baz danych, tom 2. Wyd. RM, W-wa 2004.
 Todman C.: Projektowanie hurtowni danych. Zarządzanie kontaktami z klientami. WNT,
W-wa 2003.
 Kimball R., Ross M.: The Data Warehouse Toolkit: The Complete Guide to Dimensional
Modeling, 2nd Edition, Wiley, 2002.
 Beynon-Davies P.: Systemy baz danych. WNT, W-wa 2003.
 Oracle Warehouse Buider – Technical Overview 2003 (wersja internetowa http://otn.oracle.com/products/warehouse/content.html),
 Lentner M.: ORACLE. System zarządzania bazą danych.. Podręcznik użytkownika
Akademicka Oficyna Wydawnicza EXIT, Warszawa 2001,
 Greene J.: Oracle 8 serwer – księga eksperta. Wyd.Helion, Gliwice 2000,
 Poe V., Klauer P., Brobst S., Tworzenie hurtowni danych. Wyd.WNT, Warszawa 2000.
 Hobbs L., Hillson S., Lawande S.: Oracle9iR2 Data Warehousing. Digital Press, 2003,
ISBN 1-55558-287-7
 Corey M., Abbey M., Abramson I., Taub B.: Oracle8i Data Warehousing. Osborne
McGraw-Hill, 2001, ISBN 0-07-212675-2
 Jarke M., Lenzerini M., Vassiliou Y., Vassiliadis P.: Fundamentals of Data Warehouses.
Springer-Verlag, 2000, ISBN 3-540-65365-1
Ćwiczenia przy stanowiskach komputerowych
Zaliczenie ćwiczeń laboratoryjnych podzielono na dwie części:
1. Zaliczenie testu obejmującego program kursu. Test składa się z 20 pytań teoretycznych.
Do zaliczenia części testowej konieczne jest uzyskanie 50% ogólnej liczby punktów.
2. Zaliczenie sprawdzianu praktycznego przy komputerze. Sprawdzian obejmuje 5 zadań.
Do uzyskania pozytywnej oceny wymagane jest wykonanie minimum trzech zadań.
Czas trwania zaliczenia:
 test – 20min
 część praktyczna – 45 min
Ocena z zaliczenia obejmuje:
 wynik testu i egzaminu praktycznego,
 obecność na zajęciach,
 aktywność na zajęciach.
Download