. 6 Rozmiar największej operacyjnej bazy danych w roku 2005 osiągnął 23 TB. Największa hurtownia danych to 100 TB (YAHOO). Prognozowany dalszy wzrost baz danych np. CERN stworzył bazę dla składowania niemal 1Exabajta danych (1EB=1024PB=1018TB) KDD- Knowledge Discovery In Databases. DBMS- Database Management System Dana- ciąg znaków np. 100®C - informacja powiązana relacjami Bardzo duże rozmiary gromadzonych danych z góry, wykluczają możliwość ręcznej analizy pozyskiwanych informacji. Techniki analizy statystycznej również zawodzą w obliczu ilości danych i nie są w stanie zapewnić zadowalającej szybkości przetwarzania i analizy. Pozostają metody automatycznego lub półautomatycznego pozyskiwania wiedzy z ogromnych wolumenów danych. Eksploracja danych-proces odkrywania nowych, wcześniej nieznanych, potencjalnie użytecznych, zrozumiałych i poprawnych wzorców w bardzo dużych wolumenach danych. Celem eksploracji danych jest analiza danych i procesów w celu lepszego ich zrozumienia. Eksploracja danych nie jest: -jest ona jednym z etapów tego procesu procesem Przykłady zapytań do depozytoriów danych: roku w sklepie… sklepów. Przykłady zapytań eksploracyjnych: wodę mineralną ? kupi sok ? Etapy odkrywania wiedzy z danych: 1. Definiowanie celu 2. Czyszczenie danych 3. Integracja danych 4. Selekcja 5. Transformacja 6. Data mining- eksploracja danych 7. Oszacowanie modeli 8. Prezentacja wiedzy CRISP-DM (Cross-Industry Standard Piecess for Data Mining) Twórcami modelu CRISP-DM są NCR System Engineering Copenhagen (Dania). CRISP-DM: 1. Zrozumienie uwarunkowań biznesowych 2. Zrozumienie danych (wstępna analiza EDA) 3. Przygotowanie danych 4. Modelowanie 5. Ewaluacja 6. Wożenie SEMMA (Sample, Explore, Modify, Model, Asses) Został zaprojektowany przez SAS Institute. Wyróżnia 5 etapów eksploracji danych: 1. Próbkowanie 2. Eksploracja 3. Modyfikowanie 4. Modelowanie 5. Ocena DMAIC: 1. Definiowanie 2. Pomiar 3. Analiza 4. Usprawnienia 5. Kontrola Model VCofDM (Vittous Cycle of Data Mining) zmodyfikowany został przez wybranych specjalistów z dziedziny eksploracji danych M.J.A. Beriego iG. Linoffa. Etapy: 1. Zidentyfikowanie problemów biznesowych 2. Przekształcenie danych w informacje 3. Podjęcie działań 4. Mierzenie i ocena wyników Porównanie modeli eksploracji danych: -DM- wskazanie podmiotów realizujących projekt klienta i analityka danych,; minus pełna autonomia podmiotu realizującego Data Mining - omówienie ążenie danych w BI - wykład Text mining i WEB mining - wykład modelowanie i optymalizacja - modelowanie i optymalizacja Technologia informacyjna IV Technologie informacyjne- wykład IV Reklama Administracja publiczna Działalność gospodarcza Kodeks postępowania administracyjnego .