11 Business Intelligence prof. UE dr hab. Maria Mach-Król Wykład 3 Hurtownie danych CASE STUDY - DirecTV Za pomocą oprogramowania Teradata i GoldenGate, DirecTV rozwinęła produkt, który integruje jej zasoby danych niemal w czasie rzeczywistym, w całym przedsiębiorstwie. GoldenGate umożliwia integrację platform i systemów zarządzania danymi W DirecTV istniały platformy Oracle, HP NonStop, system IBM DB2 i hurtownia Teradata Rezultaty: możliwość mierzenia odejść klientów w czasie rzeczywistym, wpływ na raportowanie, kampanie sprzedaży precyzyjnie ukierunkowane, co wpłynęło na zmniejszenie liczby odejść klientów. Główne zagadnienia związane z HD Definicja hurtowni danych Charakterystyka hurtowni danych Data Marts - składnice danych Operational Data Store, Enterprise Data Warehouse, Metadane Ramy HD Architektura HD i proces ETL Rozwój HD Czym jest hurtownia danych? Fizyczne repozytorium, w którym dane relacyjne są specjalnie zorganizowane, aby zapewnić dane obejmujące całe przedsiębiorstwo, wyczyszczone, w zestandaryzowanym formacie “Hurtownia danych to zbiór zintegrowanych, zorientowanych tematycznie baz danych, zaprojektowanych aby wspierać funkcje DSS, gdzie każda jednostka danych jest nieulotna i niezmienna i odnosi się do pewnego momentu czasowego.” Charakterystyka (cechy) HD Zorientowana tematycznie - dane są zorganizowane według tematów Zintegrowana - zawiera dane z różnych źródeł w spójnym formacie Zależna od czasu (szereg czasowy) - przechowuje dane historyczne Nieulotna - po wprowadzeniu danych do HD, użytkownik nie może zmienić ani aktualizować danych Zsumaryzowana Nieznormalizowana Metadane - HD zawiera dane o tym, jak dane są zorganizowane i jak ich efektywnie używać Oparta na web - HD są zazwyczaj zaprojektowane tak, aby zapewnić efektywne środowisko obliczeniowe dla aplikacji webowych relacyjna/wielowymiarowa Klient/serwer Czas rzeczywisty i/lub czas właściwy (aktywna) Składnice danych (data marts) HD departamentu, która przechowuje tylko relewantne dane Rodzaje: Zależna składnica danych Podzbiór stworzony bezpośrednio z HD Niezależna składnica danych Mała HD zaprojektowana dla strategicznej jednostki biznesowej lub departamentu Definicje związane z HD Operational data stores (ODS) - operacyjny magazyn danych Rodzaj bazy danych często używany jako obszar tymczasowy hurtowni danych (…) … trójwarstwowej są połączone w jedną Czasami jest tylko jedna warstwa Architektury HD Kwestie, jakie należy rozważyć, wybierając architekturę HD: Jakiego użyć systemu zarządzania bazą danych? Np. Oracle, SQL Server, IBM DB2 Jakiego przetwarzania równoległego i/lub partycjonowania użyć? (Np. Teradata ma nowoczesne rozwiązania w tym zakresie) Jakie narzędzia migracji danych będą używane do ładowania HD… … użytkowników końcowych Ograniczenia zasobów Strategiczne spojrzenie na HD przed implementacją Kompatybilność z istniejącymi systemami Postrzegane umiejętności personelu IT Kwestie techniczne Czynniki społeczne/polityczne Integracja danych i proces ETL (Extraction, Transformation, Loading) Integracja danych Integracja obejmuje 3 główne procesy: dostęp do danych, federacja danych (integracja widoków biznesowych… Hurtownie danych-praca zaliczeniowa oraz prezentacja na wykład. Business Intelligence - Procesy ETL Business Intelligence - omówienie Pytania z egzaminu Technologia Informacyjna w Ekonomii - test z odpowiedziami Wykład - Programowanie Reklama Prawa autorskie Reklama Kontakt