Reklama - BazaTematow.pl

advertisement
.
6
Rozmiar największej operacyjnej bazy danych w roku 2005 osiągnął 23 TB. Największa
hurtownia danych to 100 TB (YAHOO). Prognozowany dalszy wzrost baz danych np. CERN
stworzył bazę dla składowania niemal 1Exabajta danych (1EB=1024PB=1018TB)
KDD- Knowledge Discovery In Databases.
DBMS- Database Management System
Dana- ciąg znaków np. 100®C
- informacja powiązana relacjami
Bardzo duże rozmiary gromadzonych danych z góry, wykluczają możliwość ręcznej analizy
pozyskiwanych informacji. Techniki analizy statystycznej również zawodzą w obliczu ilości
danych i nie są w stanie zapewnić zadowalającej szybkości przetwarzania i analizy. Pozostają
metody automatycznego lub półautomatycznego pozyskiwania wiedzy z ogromnych
wolumenów danych.
Eksploracja danych-proces odkrywania nowych, wcześniej nieznanych, potencjalnie
użytecznych, zrozumiałych i poprawnych wzorców w bardzo dużych wolumenach danych.
Celem eksploracji danych jest analiza danych i procesów w celu lepszego ich zrozumienia.
Eksploracja danych nie jest:
-jest ona jednym z etapów tego procesu
procesem
Przykłady zapytań do depozytoriów danych:
roku w sklepie…
sklepów.
Przykłady zapytań eksploracyjnych:
wodę mineralną ?
kupi sok ?
Etapy odkrywania wiedzy z danych:
1. Definiowanie celu
2. Czyszczenie danych
3. Integracja danych
4. Selekcja
5. Transformacja
6. Data mining- eksploracja danych
7. Oszacowanie modeli
8. Prezentacja wiedzy
CRISP-DM (Cross-Industry Standard Piecess for Data Mining)
Twórcami modelu CRISP-DM są NCR System Engineering Copenhagen (Dania).
CRISP-DM:
1. Zrozumienie uwarunkowań biznesowych
2. Zrozumienie danych (wstępna analiza EDA)
3. Przygotowanie danych
4. Modelowanie
5. Ewaluacja
6. Wożenie
SEMMA (Sample, Explore, Modify, Model, Asses)
Został zaprojektowany przez SAS Institute. Wyróżnia 5 etapów eksploracji danych:
1. Próbkowanie
2. Eksploracja
3. Modyfikowanie
4. Modelowanie
5. Ocena
DMAIC:
1. Definiowanie
2. Pomiar
3. Analiza
4. Usprawnienia
5. Kontrola
Model VCofDM (Vittous Cycle of Data Mining) zmodyfikowany został przez wybranych
specjalistów z dziedziny eksploracji danych M.J.A. Beriego iG. Linoffa.
Etapy:
1. Zidentyfikowanie problemów biznesowych
2. Przekształcenie danych w informacje
3. Podjęcie działań
4. Mierzenie i ocena wyników
Porównanie modeli eksploracji danych:
-DM- wskazanie podmiotów realizujących projekt klienta i analityka danych,;
minus pełna autonomia podmiotu realizującego
Data Mining - omówienie
ążenie danych w BI - wykład
Text mining i WEB mining - wykład
modelowanie i optymalizacja - modelowanie i optymalizacja
Technologia informacyjna IV
Technologie informacyjne- wykład IV
Reklama



























Administracja publiczna
Działalność gospodarcza
Kodeks postępowania administracyjnego




.
Download