Systemy Business Intelligence Oferta Microsoft Jarosław Szymaniuk Microsoft Warszawa, 19 lipca 2017 Business Intelligence (BI) BI – klucz do uwolnienia wiedzy Dostęp Łatwy dostęp do różnych źródeł danych Analiza Narzędzia Dystrybucja Aktywny do eksploracji danych i bierny dostęp do informacji W ramach organizacji i poza nią Pracownicy, dostawcy, klienci, partnerzy, ... Miejsce BI wśród systemów informatycznych wspierających zarządzanie Terminologia ETL (extraction, transformation, loading) Hurtownia danych Wydzielona baza danych Zawiera dane historyczne i bieżące Data Mart - Składnica danych Ekstrakcja danych Transformacja danych Ładowanie danych Ściśle związana z mniejszą grupą użytkowników Tematycznie dostosowana, zoptymalizowana dla ich potrzeb OLAP (On-Line Analytical Processing) Przetwarzanie danych wielowymiarowych Krótki czas odpowiedzi na dowolne zapytanie OLAP – Analizy wspierające proces podejmowania decyzji biznesowych Oddział Poznań Kraków Gdańsk ROR Kredyt 69,059,440 PLN 8,755 szt. 7,888 PLN Depozyt Rach. Inwest. Inne Q1 Produkt Q2 Q3 Czas Q4 Business Intelligence - architektura Informacja Wiedza Wnioski Działanie Wyniki Systemy źródłowe DM ETL Hurtownia danych Kostka OLAP DM Kostka OLAP Użytkownicy: - Raporty - Zapytania do bazy - Analizy OLAP - EIS - Budżetowanie - Data Mining Trochę historii: BI w Microsoft 1996/1997 Stworzenie zespołu ekspertów BI: Jim Gray Peter Spiro Bill Baker Zakup Panorama Zdefiniowanie OLE DB for OLAP Data Warehousing Alliance SQL Server 7.0 1998 SQL Server 2000 2000 Wejście na rynek BI Data Mining OLAP Services Skalowalność OLAP (T3) Data Transformation Services Excel 2000 & XP Microsoft Repository Microsoft Data Analyzer English Query SharePoint Portal Server XML for Analysis Appsco Software Limited Arcplan Inc Ardent Software Inc Artech Baan Company Best Software Broadbase Software Inc Business Objects ChangePoint Citicorp ITI Limited Cizer Software Corporation Cognos Comshare Data Mirror Data Watch Decisionism Decision Support Panel EMS Plc Epicor FRx Software Corp Harmony Infinium Software Informatica Information Builders Knosys/ProClarity Lawson Manugistics Maximal Innovative Intelligence MetaEdge MIS Technologies Gmbh NetAcumen OLAP @ Work Inc Polyvista Software Portola Dimensional Revelwood Inc Sagent Technology Seagate Software Silvon Software SRC Software Inc Targit A/S Top Tier Visual Insights Data Warehousing Alliance Members Microsoft - kompleksowa oferta SYSTEMY ŹRÓDŁOWE EXTRACTION TRANSFORM LOAD MANAGE DATA WAREHOUSE DATA MARTS Data Warehouse / Data Mart DOSTĘP UŻYTKOWNIKÓW I ANALIZY PREZENTACJA / OLAP OLAP : - HOLAP - ROLAP - MOLAP OLE DB Ad-hoc Query Tools XML/A Raporty i Operational Data Store Aplikacje na zamówienie OLE DB Aplikacje analityczne XML/A Web Services i Aplikacje mobilne Data Mining Modele Microsoft - kompleksowa oferta SYSTEMY ŹRÓDŁOWE SQL Server EXTRACTION TRANSFORM LOAD MANAGE PREZENTACJA / OLAP DATA WAREHOUSE DATA MARTS OLAP including SQL Server OLAP including HOLAP, ROLAP, HOLAP, Services ROLAP, Analysis MOLAP query services; MOLAP query (OLAP) may store atomic data; services; may store may be frequently atomic data; refreshed may be frequently refreshed Server or DataSQL Warehouse Data Mart Oracle DTS OLE DB DTS DTS (dimensional, subject oriented) and DOSTĘP UŻYTKOWNIKÓW I ANALIZY XML/A DTS IBM DTS / HIS Third Party Reporting (DWA Q&R) Visual Studio Custom Apps Operational Data Store OLEDB Excel / Ad-hoc Query MSDA / Tools Sharepoint / IE DataSQL Mining Models Server Data Mining Models forecasting; clustering; forecasting; Analysis Services scoring clustering; scoring (Data Mining) OLE DB Data Analytical Warehousing Apps Alliance XML/A Web Services Visual Studio and Mobile Apps Budowa systemu BI Etapy procesu Data Marts Systemy źródłowe SQL Analysis Services SQL SQL Server DB2 SQL Klienci Data Warehouse Analysis Services Oracle 1 Stworzenie struktury bazy i zasilanie hurtowni danych Narzędzia Query Raportowanie Analizy Data Mining 2 3 Stworzenie kostek OLAP Dostęp do danych Narzędzia ETL – Microsoft Data Transformation Services (DTS) Zestaw narzędzi umożliwiający łatwe oprogramowanie przesyłania i transformacji danych - TSQL - VBScript - JScript - VBA - .EXE - .BAT Transform Źródła danych Baza docelowa ‘pompa danych’ Udziały w rynku baz danych Microsoft #1 i #2 Windows Sybase 2% Unix+Windows Other 3% Sybase Other Informix 4% 6% 4% Informix 1% IBM 19% Microsoft 38% Oracle 37% $2.4B Total 40% Growth Dane za rok 2000 Źródło: GartnerDataquest IBM 16% Oracle 53% Microsoft 17% $5.4B Total 24% Growth wydajność 400000 14.96 $ 300000 200000 100000 0 SymfoWARE / Sun Solaris Oracle 9i / Compaq Tru64 700000 SQL Srv 2k / Win2k Adv 800000 tpmC price/tpmC $40,00 600000 $35,00 500000 $30,00 $25,00 $20,00 cena / wydajność 709220 Oracle 9i / HP UX SQL Srv 2k / Win2k Adv IBM DB2 / Win2k Adv SymfoWARE / SUN Solaris SQL Server / Win2k Adv SQL Server / Win2k DC SQL Server / Win2k Adv Benchmark TPC-C $50,00 $45,00 $15,00 $10,00 $5,00 $0,00 2002-02-19, źródło: www.tpc.org Budowa systemu BI Etapy procesu Data Marts Systemy źródłowe SQL SQL SQL Server DB2 Analysis Services SQL Klienci Data Warehouse Analysis Services Oracle Narzędzia Query Raportowanie Analizy Data Mining 1 2 3 Stworzenie struktury bazy i zasilanie hurtowni danych Stworzenie kostek OLAP Dostęp do danych MS Analysis Services Integracja z dowolnym źródłem danych (OLEDB) Skalowalność - wsparcie wszystkich sposobów przechowywania danych (MOLAP, ROLAP, HOLAP) Analysis Services - Wymiary Wspólne/prywatne Regularne/nieregularne Hierarchia drzewiasta (relacja rodzic – potomek) O dużej liczbie elementów (grupowanie) Dane w węzłach Wymiary o liczbie potomków większej niż 64k Atrybuty Wiele hierarchii Własne formuły podsumowujące SQL Server 2000 Analysis Services Zabezpieczenia, zarządzanie Uprawnienia Dla bazy OLAP / poszczególnych kostek Dla poszczególnych wymiarów ( hierarchii ) Zakres poziomów, zakres elementów, wyrażenia Opcjonalne uprawnienia w zbiorze danych Do poziomu poszczególnych komórek dla zapisu i/lub odczytu Zarządzanie Narzędzie graficzne Programowo - Decision Support Objects Analysis Services - Kostki Kostki wirtualne Partycje Jednostka przetwarzania Storage (MOLAP, ROLAP, HOLAP) Optymalizacje Lokalne/zdalne Rozproszone Miary wyliczane Drillthrough Distributed Partitions Cubes Odczyt danych źródłowych Writeback Lazy aggregations Analysis Services Aggregation Wizard AW znajduje regułę “80-20” dla danych 20% wszystkich możliwych agregacji, które zapewniają 80% zysku wydajności Wyszukuje agregacje najczęściej wykorzystywane przez inne agregacje Niezależny od modelu danych OLAP Optymalizacja dla partycji