Streszcze do pracy dyplomowej

advertisement
Ola Olacka
Analiza dużych magazynów informacji
ANALIZA DUŻYCH MAGAZYNÓW INFORMACJI
STRESZCZENIE
Intensywnie rozwijająca się dziedzina odkrywania wiedzy w bazach danych (ang. Knowledge
Discovery in Databases) oraz eksploracji danych (ang. Data Mining) jest odpowiedzią na gwałtowny wzrost
ilości informacji gromadzonych w bazach i magazynach danych. Techniki eksploracji danych pozwalają na
znajdowanie wcześniej nieznanych zależności i schematów, które mogą być wykorzystane do wspomagania
podejmowania decyzji lub opisu dużych baz danych. Praca prezentuje podstawowa problematykę związaną z
odkrywaniem wiedzy w bazach danych z uwzględnieniem procesu eksploracji danych. Zostały omówione
techniki eksploracji danych i algorytmy służące temu celowi wraz identyfikacją implementacji tychże
algorytmów i technik zawartych w SQL Server 2000. Przedstawiono również produkt komercyjny, jakim jest
SQL Server 2000 w kontekście realizacji zadań procesu odkrywania wiedzy i eksploracji danych.
Dodatkowo przeanalizowane zostały metody tworzenia i analiza modelu eksploracji danych opartego na
danych z rzeczywistych baz danych za pomocą dwóch algorytmów zgłębiani danych: algorytmu drzewa decyzji
(ang. Microsoft Decision Tree) oraz algorytmu klasteryzacji (ang. Microsoft Clustering).
ANALYSIS OF LARGE WAREHOUSES OF INFORMATION
ABSTRACT
Intensively developing domain of Knowledge Discovery in Databases (KDD) and Data Mining is an
respond on fast growth of information’s stored in data bases and data warehouses. Technique of data mining is a
powerful process that finds hidden, not know before, patterns and schemas, that can be useful for Decision
Support Systems (DSS) or description of large data bases.
This M.Cs. presents basic problems connected with Knowledge Discovery in Databases involving data
mining process. This paper consider data mining techniques and algorithms for this purpose, with identification
of implemented algorithms and techniques for SQL Server 2000. Also is discussed commercial product, like
SQL Server 2000, in context of realizing of Knowledge Discovery and Data Mining tasks. Additionally, M.Cs.
presents methods of creating and analyzing data mining model from real world data bases using data mining
algorithms: Microsoft Decision Tree and Microsoft Clustering.
Download