ZAŁĄCZNIK DO ZARZĄDZENIA NR 24/2000 REKTORA PRZ z dnia 13 listopada 2000 r. POLITECHNIKA RZESZOWSKA Im. IGNACEGO ŁUKASIEWICZA W RZESZOWIE BUDOWY MASZYN I LOTNICTWA WYDZIAŁ ZARZĄDZANIE I INŻYNIERIA PRODUKCJI KIERUNEK INFORMATYKA W ZARZĄDZANIU PRZEDSIĘBIORSTWEM SPECJALNOŚĆ RODZAJ STUDIÓW magisterskie, dzienne KARTA PRZEDMIOTU N AZWA P RZEDMIOTU WIELOWYMIAROWA ANALIZA I EKSPLORACJA DANYCH IMIĘ I NAZWISKO, STOPIEŃ, TYTUŁ NAUKOWY, NAUCZYCIELA AKADEMICKIEGO ODPOWIEDZIALNEGO ZA PRZEDMIOT (NR. TELEFONU, ADRES E-MAIL) Galina Setlak dr hab. inż., prof. nadz, 85-61-433, [email protected] ZAKŁAD/KATEDRA Zakład Informatyki RODZAJ ZAJĘĆ REALIZOWANYCH W RAMACH PRZEDMIOTU LICZBAGODZIN PROWADZONYCH ZAJĘĆ W DANYM S E M E S T R Z E W* Ć* L* P* K* s e m e s t r: . .9.... s e m e s t r: ....... s e m e s t r: 9........ s e m e s t r: ........ s e m e s t r: ........ 30 godz 15 godz. TEMATYKA ZAJĘĆ** WG PROWADZONYCH RODZAJÓW ZAJĘĆ LICZBA GODZIN WYKŁAD: 1. Wielowymiarowa analiza danych w systemach wspomagania decyzji. Współczesne narzędzia do wielowymiarowej analizy danych i raportowania. Hurtownia danych środowiskiem do wielowymiarowej analizy i eksploracji danych. Pojęcia podstawowe: tabele faktów, wymiarów, miary, kostki wielowymiarowe, agregacje, metadane. Miejsce hurtowni danych w systemach informatycznych porównanie z systemami tradycyjnymi. 2. Hurtownie Danych (HD) w systemach wspomagania decyzji. Architektura hurtowni. Źródła danych i ich rodzaje. Moduły HD. Modele danych w hurtowni. Narzędzia programowe umożliwiające integrację BD. Zarządzanie i optymalizacja pamięci w HD.. Wielowymiarowe, relacyjne i hybrydowe modele danych stosowane w hurtowni. Struktury danych typu gwiazda, płatek śniegu. Administrowanie hurtownią danych. Planowanie i projektowanie systemu analitycznego przedsiębiorstwa. Architektura systemu informatycznego z hurtownią danych. Źródła danych i ich rodzaje. Moduły hurtowni danych. 3. Eksploracja danych w kontekście procesu pozyskiwania wiedzy. Pojęcia podstawowe, przyczyny rozwoju eksploracji danych. Przegląd celów i zadań eksploracji danych. Główne dziedziny zastosowań. Przegląd zadań eksploracji danych. Omówienie i przykłady zadań klasyfikacji, estymacji, predykcji, grupowania, uogólnienia. 4. Przegląd technik eksploracji danych (metody statystyczne: analiza dyskryminacyjna, regresja logistyczna, sieci neuronowe: wielowarstwowy perceptron, Kohonena, Hamminga, drzewa decyzyjne, analiza skupień, metody uczenia maszynowego, metody ewolucyjne, logika rozmyta, zbiory przybliżone). Omówienie i przykłady technik sieci neutronowych, algorytmów genetycznych. Przykłady zastosowań i rozwiązań. Studium przypadku dla rozwiązań w zarządzaniu relacjami z klientami. 5. Analiza skupień. Podstawowe pojęcia odległości taksonomicznej, miary i odległości (odległość euklidesowa, odległość Czebyszewa, Minkowskiego. Techniki grupowania: aglomaracyjne i podziałowe. Algorytmy aglomeracyjnego skupiania. Metody skupiania: metoda K-średnich, medianowa, metoda minimalnej wariancji. 2h 4h 4h 4h 2h 6. Podstawy teorii zbiorów rozmytych i logiki rozmytej. Wnioskowanie rozmyte. Rozmyta metoda analizyskupień. 7. Eksploracja danych internetowych. Charakterystyka danych internetowych. Próbkowanie danych internetowych. Przechowywanie danych internetowych w bazie danych. Zastosowanie metod eksploracji danych dla modelowania zachowania odwiedzających witrynę internetową. Przykłady narzędzi eksploracji w bazach danych i w Internecie. 8. Techniki OLAP w Excel. Tabele przestawne i raporty przestawne. 9. Integracja HD z arkuszem kalkulacyjnym. Wybór źródła danych, tworzenie interfejsu użytkownika. Prezentacja graficzna wyników. 10. Implementacja przykładowych algorytmów eksploracji danych w aplikacji bazodanowej. Określenie procesu pozyskiwania wiedzy z baz danych. Sformułowanie zadania drążenia danych. Analiza elementów algorytmu eksploracji. Oprogramowanie modułu transformacji danych. Realizacja algorytmu drążenia. Interpretacja uzyskanych wyników. 11. Usługi analityczne. Aspekty teoretyczne i praktyczne przetwarzania danych: OLTP i OLAP. Analityczne rzetwarzanie na bieżąco OLAP. Projektowanie systemu OLAP. 12. Zgłębianie i analiza danych w Microsoft SGL Server 2000. Przykłady i zastosowania. ŁĄCZNIE LICZBA GODZIN LABORATORIUM: 1. Eksploracja danych. Metody i techniki eksploracji. Obszary zastosowań. Klasyfikacja danych za pomocą sieci neuronowych MLP, RBF. Symulacja sieci neuronowych za pomocą Statistica Neural Networks. 2. Grupowanie - segmentacja. Sieci neuronowe Kohonena. Predykcja. Progonozowanie szeregów czasowych za pomocą probabilistycznych sieci neuronowych PNN i GRNN. 3. Wielowymiarowa analiza danych w arkuszach kalkulacyjnych MS Excel.Tabele i raporty przestawne. 4. Model relacyjny a model wielowymiarowy. Model płatka gwiazdy, płatka śniegu i konstelacji faktów. Problemy wydzielania, transformacji i ładowania. Główne problemy hurtowni danych. Procesy KDD. Selekcja. Oczyszczanie. Wzbogacanie. Kodowanie (transformacja). Raportowanie. 5. Kostka wielowymiarowa. MOLAP, ROLAP, HOLAP. Operacje OLAP. 6. Drzewa decyzyjne. 7. Kolokwium zaliczeniowy RAZEM L. p. 1. 2. 3. 4. 5. 6. WYKAZ ZALECANEJ LITERATURY M. Lasek: Data mining. Zastosowania w analizach i ocenach klientów bankowych, 2002, Wyd. Bankowość, W-wa Zieliński J.S. (red.), Inteligentne systemy w zarządzaniu. Teoria i praktyka, PWN, Warszawa 2000. Witkowska D., Sztuczne sieci neuronowe i metody statystyczne. Wybrane zagadnienie finansowe, Wydawnictwo C.H. Beck, Warszawa 2002. Seidman C. : Zgłębianie i analiza danych, Przewodnik techniczny MS Press, W-wa, 2002. M. Dec System SAS, 1997. David Hand, Heikki Mannila, P. Smyth: Eksploracja danych, WNT, W-wa, 2005 FORMA I WARUNKI ZALICZENIA PRZEDMIOTU (RODZAJU ZAJĘĆ) Laboratorium: zaliczenie pisemne, kolokwium. Przedmiot kończy się egzaminem. Warunkiem dopuszczenia do egzaminu jest uzyskanie zaliczenia z laboratorium. PODPISY: ................................................................................................................................... ............................................. nauczyciela akademickiego odpowiedzialnego za przedmiot data ......................................................................................................................................... ....................................... kierownika zakładu/katedry akceptującego kartę data 2h 2h 2h 2h 2h 2h 2h 30 godzin 2h 2h 2h 3h 2h 2h 2h 15 h