WyŜsza Szkoła Biznesu w Dąbrowie Górniczej Kierunek studiów: Informatyka – niestacjonarne, studia II stopnia Przedmiot: Bazy i hurtownie danych Specjalność: wszystkie Liczba godzin w semestrze I ECTS WYKŁADOWCA Małgorzata Bach FORMA ZAJĘĆ Wykład i ćwiczenia laboratoryjne CELE PRZEDMIOTU Celem przedmiotu jest przekazanie wiedzy niezbędnej dla opanowanie przez studentów podstaw z zakresu baz danych oraz hurtowni danych, a takŜe przygotowanie do projektowania baz i hurtowni danych. Prezentacja metod eksploracji danych. Wiedza: : Student zdobywa wiedzę niezbędną do projektowania i zarządzania bazami i hurtowniami danych. EFEKTY KSZTAŁCENIA 1 2 II 16w 16lab 6 III 3 IV V VI Kompetencje: Po zakończeniu nauki w ramach przedmiotu „Bazy i hurtownie danych” student powinien wykazać się: • wiedzą na temat róŜnic między systemami OLTP i OLAP • umiejętnością projektowania baz i hurtowni danych, • znajomością języka SQL • znajomością zagadnień związanych z zasilaniem hurtowni, • umiejętnością projektowania wielowymiarowych struktur danych, • zdolnością posługiwania się językiem MDX (MultiDimensional eXpressions), • umiejętnością doboru metody eksploracji danych do konkretnych potrzeb. Postawy: Celem przedmiotu jest kształtowanie twórczej postawy. W trakcie ćwiczeń laboratoryjnych punktowana jest aktywność i zaangaŜowanie w realizację postawionych zadań. Niektóre zadania realizowane są w dwu-, trzyosobowych grupach, co sprzyja doskonaleniu postawy (umiejętności) współpracy. WARUNKI WSTĘPNE TREŚĆ PRZEDMIOTU Wprowadzenie do zagadnień związanych z bazami danych Ogólna charakterystyka baz danych. Język SQL. Definiowanie tabel. Wprowadzanie i aktualizacja danych w tabelach. Formułowanie zadań wyszukiwania danych. Pytania zagnieŜdŜone. Funkcje agregujące. Grupowanie danych. Pytania skorelowane. Perspektywy. Ochrona integralności danych – więzy referencyjne. Wprowadzenie do zagadnień związanych z hurtowniami danych Wyjaśnienie róŜnicy między systemami transakcyjnymi (OLTP) i analitycznymi (OLAP) Wyjaśnienie pojęć: źródła danych, hurtownia centralna, składnice danych, magazyny danych operacyjnych, ... Omówienie procesu ekstrakcji, czyszczenia, transformacji i ładowania danych. Przedstawienie zagadnień związanych z eksploracją danych (data mining) rozumianą jako pozyskiwanie nietrywialnych, ukrytych, poprzednio nieznanych a potencjalnie uŜytecznych informacji lub reguł na podstawie duŜych kolekcji danych. Prezentacja obszarów stosowania eksploracji danych – technika, medycyna, astronomia, ekonomia (np. analiza koszyka produktów, grupowanie pokrewieństw...) Omówienie wybranych metod eksploracji danych: - Odkrywanie asocjacji - Klasyfikacja LITERATURA OBOWIAZKOWA LITERATURA UZUPEŁNIAJĄCA METODY NAUCZANIA - Wykrywanie wzorców sekwencji - Grupowanie (klastrowanie) Przedstawienie specyfiki zagadnień związanych z eksploracją tekstu i zasobów WWW. . • J.D.Ullman, J. Widom: Podstawowy wykład z systemów baz danych. WNT, Warszawa 2000. • R. Coburn: SQL dla kaŜdego, Helion 2005 • W. H. Inmon, R. D. Hackathorn:„Using a Data Warehouse” • D. Hand, H. Mannila, P. Smyth: „Eksploracja danych”, Wydaw. Naukowo-Techniczne, Warszawa, 2005 • Jakubowski A.: Podstawy SQL. Ćwiczenia praktyczne, Helion 2001. • V. Poe, P. Klauer, S. Brobst: „Tworzenie hurtowni danych”, WNT, 2000T. Morzy „Eksploracja danych” http://wazniak.mimuw.edu.plT. Pankowski „Eksploracja danych” www.staff.amu.edu.pl/~tpankow/data-mining.pdfD.T. Larose: „Odkrywanie wiedzy z danych, Wprowadzenie do eksploracji danych”, PWN, Warszawa, 2006. Prezentacje multimedialne. Ćwiczenia laboratoryjne z uŜyciem wybranych systemów zarządzania bazami danych i systemów wspomagających hurtownie danych. W ramach ćwiczeń: tworzenie bazy danych, wprowadzanie i modyfikacja danych oraz wyszukiwanie danych (z wykorzystaniem języka SQL), budowa własnej hurtowni, zasilanie hurtowni, tworzenie kostki danych, wyszukiwanie danych z uŜyciem języka MDX, badanie, (porównywanie wyników) wybranych metod eksploracji danych – tworzenie drzewa decyzyjnego, definiowanie klastrów, odkrywanie asocjacji. Prezentacje multimedialne POMOCE NAUKOWE PRZYKŁADOWE TEMATY PROJEKTÓW SPOSÓB I Zaliczenie ćwiczeń laboratoryjnych oraz egzamin pisemny w postaci testu wielokrotnego wyboru. WARUNKI ZALICZENIA PRZEDMIOTU PRZYKŁADOWE O systemach OLAP (ang. On-Line Analytical Processing) moŜemy powiedzieć, Ŝe: ZAGADNIENIA (ew. a. dopuszczalne są operacje dodawania, usuwania, modyfikacji danych pytania) b. słuŜą do przetwarzania danych w celu wspomagania decyzji strategicznych i decyzji EGZAMINU/ związanych z zarządzaniem ZALICZENIA c. przechowywane dane są znormalizowane * Proszę zacieniować odpowiedni rok i semestr