Zarządzanie Jakością Danych Prezentacja SGH Warszawa, 06 grudnia 2016 r Co to są dane? Dane (ang. data, łac. datum) – zbiory liczb i tekstów o różnych formach; Tematyczne zbiory informacji nazwane są bazami danych. Zestaw danych zawierający konkretną informację nazwiemy komunikatem. Podziały danych Różne dziedziny: • dane przestrzenne • dane przeterminowane • dane statystyczne • dane tajne • dane wejściowe • dane wrażliwe Informatyka: • dane alfanumeryczne • dane binarne • dane masowe • dane statyczne • dane tekstowe Źródła danych - systemy centralne np. transakcyjne/księgowe - ekstrakty z aplikacji (np. kartowe, skarbowe itp.) - pliki płaskie (raporty, inwentury itp.) - dane z instytucji zewnętrznych (słowniki, informacje klientowskie itp.) Uwarunkowania prawne Ochrona danych osobowych - regulacje prawne dotyczące tworzenia i posługiwania się zbiorami danych osobowych, a także pojedynczymi danymi, mające na celu administracyjno-prawną ochronę prawa do prywatności: Rezolucja 34/169 Zgromadzenia Ogólnego ONZ: Kodeks Postępowania Funkcjonariuszy Porządku Prawnego. Rezolucja 45 (95) Zgromadzenia Ogólnego ONZ: Wytyczne w sprawie uregulowania kartotek skomputeryzowanych danych osobowych Dyrektywa 95/46/WE Parlamentu Europejskiego i Rady z dnia 24 października 1995 r. w sprawie ochrony osób fizycznych w zakresie przetwarzania danych osobowych oraz swobodnego przepływu tych danych (Dz. Urz. WE L 281 z 23.11.1995, tłumaczenie na język polski). Dyrektywa 97/66/WE Parlamentu Europejskiego i Rady z dnia 15 grudnia 1997 r. w sprawie przetwarzania danych osobowych i ochrony prywatności w dziedzinie telekomunikacji (Dz. Urz. WE L 24 z 30.1.1998, tłumaczenie na język polski Ustawa z dnia 29 sierpnia 1997 r. o ochronie danych osobowych (Dz. U. z 2014 r. poz. 1182, z późń. Zm.) - GIODO Uwarunkowania prawne Znaczenie jakości danych w informacji zarządczej przedsiębiorstwa - regulacje KNF Rekomendacja D „dotycząca zarządzania obszarem technologii informacyjnej i bezpieczeństwa środowiska teleinformatycznego w bankach” w tym rekomendacja 8: „Bank powinien posiadać sformalizowane zasady zarządzania danymi wykorzystywanymi w ramach prowadzonej działalności, obejmujące w szczególności zarządzanie architekturą oraz jakością danych i zapewniające właściwe wsparcie działalności banku „ Co to jest jakość danych Definicja jakości danych „…dane są wysokiej jakości jeżeli nadają się do użycia zgodnie z przeznaczeniem w zakresie działania, podejmowania decyzji i planowania. Dane nadają się do użycia zgodnie z przeznaczeniem, jeżeli nie zawierają defektów i posiadają pożądane cechy...” Wg. Redmana „…jakość to zgodność z wymaganiami…” wg Crosby’ego „…jakość informacji to stałe spełnianie oczekiwań użytkowników posługujących się informacją...” wg Englisha Definicja jakości danych „…dane o wystarczającej jakości pewnych cech dla jednego zadania, mogą się okazać niedostatecznie dobre do innego celu....” Tayi, G.K. and D.P. Ballou, “Examining data quality”. Communications of the ACM, 1998. 41(2): s. 54-57. Jest to sygnał do tego, by podejść do zagadnienia jakości danych jako do problemu wielowymiarowego i wielowątkowego. Skoro te same dane mogą być jednocześnie dobrej i złej jakości z różnych punktów widzenia, to należałoby ustalić pewne kryteria oceny jakości danych pod kątem ich różnych cech (np. stosunek nakładu (kosztu) jaki jest niezbędny do podniesienia jakości danych do korzyści wynikających z poprawy danych.) Zarządzanie jakością danych R. Manteuffel „Zadaniem zarządzania jest zrobienie wszystkiego co jest możliwe, aby dopilnować do maksimum spełnienia celu jaki stoi przed przedsiębiorstwem. Jest to możliwe tylko wtedy, gdy istnieje harmonia w posługiwaniu się środkami produkcji, technologią i czynnikiem pracy.” Zarządzanie jakością – to kontekst całości funkcji zarządzania, który ustala politykę jakości, cele i odpowiedzi oraz środki urzeczywistnienia tej działalności w ramach systemów jakości, takich jak: sterowanie jakością, zapewnienie jakości, planowanie jakości, doskonalenie jakości. Zarządzanie przez jakość – jest filozofią kształtującą pozytywne relacje pomiędzy: produktywnością, konkurencją i jakością wyrobu, ochroną środowiska, bezpieczeństwem i higieną pracy, a także między kierownictwem organizacji a jej pracownikami oraz między organizacją i społeczeństwem. Zapewnienie jakości – wszystkie zaplanowane i systematyczne, a także, jeśli to konieczne, udowodnione działania realizowane w ramach systemu jakości, służące do wzbudzania należytego zaufania co do tego, że obiekt spełni określone wymagania jakościowe. Definicja zarządzania jakością podana została także w dokumentach norm ISO 9000. Na czym polega zarządzanie jakością Jakość danych, produktów i usług nie bierze się z niczego – jest rezultatem pracy. W zarządzaniu jakością niezwykle ważne jest uprzedzanie problemów, zamiast reagowania na nie po fakcie. Kontrola i zapobieganie a nie poprawia jakości. Źródła powstawania defektów danych przyczyny problemów spowodowane czynnikiem ludzkim błędy użytkowników braki walidacji wady aplikacji niezgodności długości pól powstałe wskutek czynników zewnętrznych wielokrotne migracje niezgodności formatu pola wielokrotna integracje danych brak funkcjonalności awarie sprzętowe samoistne starzenie się danych Zarządzanie jakością danych ASPEKTY OCENY JAKOŚCI DANYCH – MERYTORYCZNE Poprawność • Przyjmowanie przez dane prawidłowych wartości (zgodnych z faktami), przedstawionych w zestandaryzowany sposób czyli zgodnie z definicją, w określonym formacie i jednostce. • Z brakiem poprawności mamy do czynienia we wszystkich przypadkach, gdy wartość nie odpowiada rzeczywistości, np.: błędny PESEL, wartość netto zamiast brutto itp. Kompletność • Kompletność można rozważać dwojako: jako kompletność opisywanych obiektów lub jako kompletność wypełnienia cech dla tych obiektów. • Brak kompletności to brak niektórych elementów zbiorowości, np. nie wszyscy klienci danej firmy lub braki w opisie tych klientów (np. brak numeru telefonu). Spójność • Odpowiednie zaprojektowanie danych dające możliwość łączenia ze sobą różnych faktów, przy jednoczesnym braku wewnętrznych sprzeczności w ramach rekordu, bazy, domeny. • Brak spójności to np. sprzedaż w systemie produktowym jest różna od tej samej zmiennej w systemie księgowym lub inna data urodzenia niż to wynika z numeru PESEL. Zgodność czasowa • Ulotność, czyli trwałość przechowywania i udostępniania informacji. • Aktualność, czyli opóźnienie w uzyskaniu informacji i jej zdolność do reprezentacji rzeczywistości. Zarządzanie jakością danych ASPEKTY OCENY JAKOŚCI DANYCH – PROCESOWE Dostępność • Występowanie danych w postaci łatwej do użycia przez użytkownika oraz zgodnie z ustalonymi reżimami czasowymi. • Sposób prezentacji danych musi być dostosowany do możliwości i umiejętności odbiorcy. • Bezpieczeństwo danych zgodne z regulacjami i zasadami działania organizacji. Zrozumiałość • Możliwość łatwej interpretacji danych. • Czytelna charakterystyka danych w celu ich prawidłowego użycia. Zrozumiałość zależy od wielu czynników, takich jak prawidłowe standardy obserwacji danych, odpowiednie oprogramowanie oraz właściwe udostępnienie danych. Użyteczność • Dokładność, weryfikowalność, interpretowalność, wiarygodność. • Zgodność z oczekiwaniami; dopasowanie do potrzeb użytkownika i/lub realizowanego procesu biznesowego. Cechy Danych Dobrej Jakości dokładność spójna reprezentacja obiektywność zwięzłość interpretowalność ilość danych wiarygodność CECHY DANYCH DOBREJ JAKOŚCI kompletność reputacja dostępność relewantność wartość dodana aktualność Obszary wykorzystania informacji Rachunkowość, operacje Wykrywanie nadużyć oraz prania brudnych pieniędzy Analiza danych klienckich, wsparcie sprzedaży Wsparcie planowania strategicznego Wsparcie procesu kredytowego Dane referencyjne Wsparcie procesu reklamacyjnego Wsparcie sprzedaży Wsparcie planowania krótkoterminowego Wsparcie procesu windykacyjnego Dane marketingowe Zabezpieczenia Obsługa klienta Raportowanie efektywności Sprawozdawczość obligatoryjna Zarządzanie i raportowanie ryzyka Sprawozdawczość wewnętrzna Raportowanie do zewnętrznych organów nadzoru Dobre praktyki Czy dane są zgodne z meta danymi? Czy dane Czy dane spełniają kryterium są dostosowane do standardów jakości? reguł biznesowych? Wartości puste Dokładność % Wartości zerowe Wyniki Call Center Czy informacje wspierają procesy? Czy informacje są odpowiednie do wykorzystania w korporacji? Sprzedaż i marketing w USA CEO Dyr. Ds. finansów Struktura Prawidłowość Strona kodowa Agregacja Duplikaty Zarząd % Braki Aktualność Wydajność łańcucha zaopatrzenia % Produkcja w Europie Formatowanie Kompletność % Inne Długość Niezgodne (np. ze słownikiem) Weryfikacja techniczna Związane z danymi fakturowanie i kwestie kredytowania Istotność % Użytkownik biznesowy Kierownictwo Co możemy uzyskać dzięki sprawnemu zarządzaniu danymi Możliwość szerszego stosowanie analityki predykcyjnej Organizację zarządzaną przez dane Podejmowanie decyzji w oparciu o wiarygodne dane Dostępność danych w odpowiednim czasie Jednoznaczna interpretacja danych Korzyści dla organizacji Jednoznaczna interpretacji danych Większe wsparcie w danych przy podejmowaniu decyzji Wspólna baza wiedzy biznesowej Zwiększenie możliwości wykorzystania danych w pracach analitycznych Modele Systemu Zarządzania Danymi Modele Systemu Zarządzania Danymi Brak modelu Nie zawiera procesów zarządzania jakością danych, przypisania właścicielstwa, ról ani nie definiuje zasad w tym obszarze. Model rozproszony Model komitetowy (federacyjny) Model scentralizowany (dedykowana j. org.) Zakłada przypisanie ról z odpowiedzialnościami za jakość danych w organizacji do pracowników istniejących jednostek. Zakłada powołanie Komitetu Jakości Danych złożonego z pracowników istniejących jednostek, którym przypisane zostałyby nowe role i związane z nimi odpowiedzialności. Zakłada powołanie wydzielonej, niezależnej jednostki odpowiedzialnej za jakość danych w organizacji. Skuteczność modelu organizacji SZD Model Systemu Zarządzania Danymi Model organizacji (1): Model rozproszony Zalety • Bardzo dobra znajomość własnego obszaru danych • Stosunkowo płaska struktura organizacyjna • Model łatwy do powołania w Organizacji IT Właściciel Właściciel systemu A Właściciel systemu B systemu B Departament 1 (Biznes) Architekt IT Model organizacyjny: • Rozproszony – zestaw typowych ról związanych z jakością danych występuje w wielu istniejących jednostkach w Organizacji, np. Jednostka w ramach Pionu Finansowego odpowiada za dane finansowe i jest ich Opiekunem Grupy Danych (Data Stewardem), Opiekun grupy danych - Data Steward (aplikacji/syste mu/departame ntu) Analityk Jakości Departament 2 (Biznes) Wady • Brak wspólnych celów – trudność z podjęciem decyzji ponad interesami własnego Departamentu • Brak jednego miejsca z wizją strategiczną dla całej Organizacji • Role dla zagadnienia Jakości Danych przewidziane jako dodatkowe obowiązki dla dotychczasowych – potencjalnie niewystarczające zaangażowanie • Brak „przebicia” w Organizacji wynikającego z umocowania w dedykowanych strukturach Opiekun grupy danych - Data Steward (aplikacji/systemu /departamentu) Analityk Jakości Model Systemu Zarządzania Danymi Model organizacji (2): Model komitetowy Model organizacyjny: • Komitetowy – Pracownicy (IT i Biznes), mają przypisane nowe role w zakresie Jakości Danych i wspólnie opracowują strategię Jakości Danych Reprezentacja poszczególnych obszarów działalności organizacji Komitet Systemu Zarządzania Danymi (SZD) Zalety • Stosunkowo płaska struktura organizacyjna • Model łatwy do powołania w Organizacji Dla każdego obszaru: Opiekun grupy Datadanych Stewart grupy (Data danych Produkt… DataStewart) Stewart Systemy źródłowe Właściciel systemu (Biznes) Właściciel systemu (IT) Architekt IT Wady • Rozproszona decyzyjność – trudność z podjęciem decyzji • Role dla zagadnienia Jakości Danych przewidziane jako dodatkowe obowiązki dla dotychczasowych – potencjalnie niewystarczające zaangażowanie • Rozbieżne cele – odsuwanie problemów w obrębie własnego obszaru codziennej działalności • Brak „przebicia” w Organizacji wynikającego z umocowania w dedykowanych strukturach Analitycy Jakości Data Stewart grupy Data Stewart danych … Model Systemu Zarządzania Danymi Model organizacji (3): Dedykowana jednostka Model organizacyjny: • Wydzielona, niezależna jednostka odpowiedzialna za zarządzanie jakością danych – Zespół Jakości Danych Wady • Utworzenie nowej jednostki organizacyjnej (ZJD) • Formalne oddzielenie Właściciela systemu od Właściciela danych Sponsor/Dyrektor ds. Jakości Danych Opiekun grupy danych (Data Stewart) - Klient Opiekun grupy danych Data Stewart grupy (Data Stewart) -grupy … Data Stewart danych Produkt danych Architekt Informacji Systemy źródłowe Właściciel systemu (Biznes) Właściciel systemu (IT) Analitycy Jakości Analitycy Jakości Analitycy Jakości Architekt IT Zalety • Niezależność wyodrębnionej jednostki („siła przebicia w Organizacji”) • Odpowiedzialność za jakość danych jest scentralizowana, a nie rozproszona • Zakres odpowiedzialności i podział zadań jest precyzyjnie określony • Rozdział ról nadzorczych i wykonawczych przekłada się na podział na jednostki organizacyjne Zespół Jakości Danych Model Systemu Zarządzania Danymi Kryterium Model rozproszony Model komitetowy Dedykowana jednostka Rozliczalność Rozproszona Ciało wirtualne Jednostka organizacyjna Sposób finansowania Finansowanie przez wiele departamentów Finansowanie przez wiele departamentów Jednostka odpowiedzialna za finansowanie projektów SZD Siła oddziaływania Brak dedykowanych struktur Ciało wirtualne Dedykowane struktury Rozdział odpowiedzialności Rozdział na poziomie ról Dodatkowa kontrolna rola Komitetu Rozdział na poziomie ról oraz jednostek organizacyjnych Ścieżki eskalacji W ramach dotychczasowych struktur Na poziom Komitetu SZD Na poziom Dyrektora ZJD Elastyczność Wymaga uzgodnień z poszczególnymi jednostkami Wymaga uzgodnień na poziomie Komitetu Poprzez dostosowywanie odpowiedzialności ZJD Skala niezbędnych zmian Przypisanie nowych ról w ramach istniejących struktur Powołanie Komitetu Powołanie dedykowanej jednostki Pracochłonność procesów Silnie rozproszenie może skutkować wyższą pracochł. Komitet w części równoważy skutki rozproszenia procesu Mniejsze rozproszenie procesu zapewnia wyższą efektywność Podsumowanie Legenda Efektywność wariantu w danym obszarze: Wysoka Niska Model Systemu Zarządzania Danymi Definicja biznesowa SZD System Zarządzania Danymi jest sformalizowanym zbiorem zasad, ról, procesów wraz z przypisanym właścicielstwem, dotyczących kontroli, dostarczania i poprawy danych i informacji. Wszystkie elementy wspólnie mają na celu zarządzanie jakością danych. Model Systemu Zarządzania Danymi System Zarządzania Danymi obejmującego działania związane z planowaniem, wykonaniem, monitorowaniem i optymalizacją zarządzania danymi. W celu zaadresowania przedstawionych problemów rekomendowane jest wdrożenie Systemu Zarządzania Danymi obejmującego zasady, role, procesy i przypisanie właścicielstwa. SZD powinien objąć działania związane z planowaniem, wykonywaniem, monitorowaniem i optymalizacją zarządzania danymi: • Monitorowania okresowego i oceny jakości danych • Bieżącego monitorowania jakości danych • Zarządzania incydentami • Analizy i identyfikacji przyczyn błędów w danych • Czyszczenia danych Optymalizacja • Opracowywania i wdrażania rozwiązań technicznych zapewniających jakość danych w systemach • Zarządzania definicjami i architekturą danych • Definiowania kryteriów jakości danych • Oceny efektywności realizacji procesów jakości danych • Reakcji na zmiany architektury Banku Model Systemu Zarządzania Danymi Elementy SZD: Zasady W zasadach zapisane są biznesowe definicje danych oraz sposoby weryfikacji ich jakości. Zasady określają: • • Grupy danych ze względu na zakres biznesowy Kryteria poprawności danych: Grupy danych • kryteria biznesowe: • Definicja co stanowi poprawną daną oraz dopuszczalne poziomy poprawności danych KPI • kryteria techniczne: • Sposób implementacji pomiarów kryteriów biznesowych, reguły automatycznego czyszczenia danych Kryteria biznesowe Przykład: pole PESEL • Kryterium techniczne – weryfikacji cyfry kontrolnej • Kryterium biznesowe – zgodność informacji zakodowanej w PESEL z datą urodzenia i płcią Kryteria techniczne Model Systemu Zarządzania Danymi Elementy SZD: Role Role są dobrane według trzech głównych kategorii obowiązków: Kontroli, Definicji zasad oraz Wykonywanych działań w ramach SZD. Podział na role uwzględnia wymaganie niezależności, tzn. ta sama rola nie może być odpowiedzialna za np. wykonywanie czynności oraz ich kontrolowanie. Sponsor / Dyrektor Programu SZD • Odpowiednio umocowana osoba w organizacji • Zapewnia sponsoring inicjatyw w ramach Jakości Danych, • Nadzorowanie całościowego programu Jakości Danych, ZASADY Opiekun Grupy Danych (Data Steward) • Ekspert biznesowy z zaawansowanymi umiejętnościami analitycznymi i miękkimi • Pełni rolę łącznika między biznesem i IT • Jest odpowiedzialny za definicje kryteriów jakości danych, ich użycia i sposobu monitorowania • Analizuje zgłoszenia o nieprawidłowościach i identyfikuje odpowiedzialność między właścicielami • Całkowicie dedykowany do celów związanych z zarządzaniem Jakością Danych Architekt Informacji • Jest odpowiedzialny za techniczną definicję, spójność i utrzymanie reguł jakości danych określoną w Zasadach, w całej organizacji Analitycy Jakości Danych • Osoby zaangażowanie bezpośrednio w biznesowe wykorzystanie danych, o dużej wiedzy biznesowej IT, które monitorują na bieżąco poziom jakości danych według zasad technicznych i biznesowych • Są pierwszą instancją zgłaszającą problemy z jakością danych (poza użytkownikami końcowymi), • Wspierają raportowanie cykliczne Pozostałe: Deweloperzy, Właściciele grup danych i systemów, Użytkownicy końcowi Model Systemu Zarządzania Danymi Elementy SZD: Procesy Procesy spajają Zasady i Role poprzez przydzielenie Roli i odpowiedzialności za konkretne zasady. Procesy obejmują: • Monitorowanie okresowe i ocena jakości danych • Bieżące monitorowanie jakości danych • Zarządzanie incydentami • Analiza i identyfikacja przyczyn błędów w danych • Czyszczenie danych • Opracowywanie i wdrażanie rozwiązań technicznych zapewniających jakość danych w systemach • Zarządzanie definicjami i architekturą danych • Definiowanie kryteriów jakości danych • Ocena efektywności realizacji procesów jakości danych • Reakcja na zmiany architektury danych w organizacji Planowanie Optymalizacja Jakość danych Monitorowanie Powyższa lista procesów obejmuje procesy wymienione jako wymagane przez Rekomendację D.8. Wykonanie Model Systemu Zarządzania Danymi Elementy SZD: Właścicielstwo Model właścicielstwa obejmuje definicję: Biznes Struktura organizacyjna właścicielstwo Właściciela biznesowego grupy danych (jeden) • Jednostka/osoby biznesowe odpowiedzialne za grupę danych we wszystkich systemach w którym dane powstają. Rozumieją cel i sposób przetwarzania w całym cyklu życia grupy danych właścicielstwo Struktura organizacyjna Banku System A IT \ Biznes Właściciela IT i Biznesowego systemu (dla każdego systemu) • Osoby odpowiedzialne z grupę danych w systemie w którym grupa danych jest przetwarzana. Grupa danych 1 System B System C System D Grupa danych 2 ... Gata Governance – zaawansowany model zarządzania danymi Definicja Data Governance Data Governance (DG) – sposób w jaki przedsiębiorstwo zarządza zasobami danych. Zarządzanie to uwzględnia reguły, polityki, procedury, role oraz odpowiedzialności, które kierują ogólnym administrowaniem danymi przedsiębiorstwa. Większość programów zarządzania danymi zostało zbudowanych w celu utworzenia i utrzymywania zgodnych definicji danych oraz reguł biznesowych pozwalających osiągnąć w organizacji „jedną wersji prawdy”, co pozwala na oszczędności czasu przy budowie nowych rozwiązań oraz skuteczność podejmowania decyzji w oparciu o dane. DG dostarcza wytyczne, które mają zapewnić, że dane są dokładne, spójne, kompletne, dostępne i bezpieczne. Oddziaływania Data Governance w organizacji Cele Strategiczne Misja i Wizja Zarządzanie Zgodnością Nadzór Data Governance Wsparcie Zarządcze Właścicielstwo Danych Bezpieczeństwo Danych Współpraca z Biznesem Strategia Jakości Danych Profilowanie Danych Czyszczenie Danych Wprowadzanie Danych Walidacja Danych Pomiar Jakości Danych Wspólny Model danych Standaryzacja Danych Podstawowe Zarządzanie Danymi Zarządzanie Metadanymi Rozwój systemu zarządzania danymi Wprowadzenie rekomendacji „D” Data Governance Jakość danych Zarządzanie metadanymi Standardy danych Data Stewardship Przykład modelu Systemu Zarządzania Danymi w instytucji finansowej Model Systemu Zarządzania Danymi Z perspektywy skuteczności zapewnienia wysokiej jakości danych wdrożono scentralizowanego modelu Systemu Zarządzania Danymi z dedykowaną jednostką, przy kontroli i wsparciu Komitetu Systemu Zarządzania Danych (SZD). Odpowiedzialności departamentów biznesowych: Zespół Jakości Danych • Prawidłowa rejestracja danych i/lub poprawianie błędów w danych • Identyfikacja problemów dotyczących jakości danych, we współpracy z Opiekunem grupy danych (Data Stewards) Opiekun grupy Data Stewart danych (Data grupy Data danych Stewart Stewart) - ... Produkt grupy danych Opiekun grupy danych (Data Stewart) -Klient • Identyfikacja systemów informatycznych przetwarzających grupy danych, we współpracy z Opiekunem grupy danych (Data Stewards) • oraz technicznymi opiekunami systemów • Przekazywanie informacji zwrotnej dotyczącej jakości danych. Systemy źródłowe Właściciel systemu (Biznes) Właściciel systemu (IT) Architekt IT • Uwzględnienie wymagań związanych z zapewnieniem jakości danych w ramach realizowanych projektów Architekt Informacji Komitet SZD • Wsparcie Opiekuna grupy danych (Data Stewards) w wypracowaniu definicji danych Dyrektor ds. Jakości Danych Odpowiedzialny za zarządzanie jakością danych oraz architekturą danych Banku Analitycy Analitycy Jakości Analitycy Jakości Jakości Odpowiedzialny za kontrolę i ocenę SZD 37 Model Systemu Zarządzania Danymi Odpowiedzialności departamentów biznesowych Niezależnie od przyjętego modelu konieczne jest przypisanie dodatkowych odpowiedzialności istniejącym jednostkom organizacyjnym. W związku z wdrożeniem SZD, departamentom biznesowym zostaną przypisane nowe odpowiedzialności niezbędne z perspektywy zapewnienia jakości danych w Banku: • Dbałość o jakość danych poprzez prawidłową rejestrację danych i/lub poprawianie ewentualnych błędów w danych, • Identyfikacja problemów dotyczących jakości danych w obszarze kompetencji jednostki, we współpracy z Opiekunem grupy danych (Data Stewards), • Wsparcie Opiekuna grupy danych (Data Stewards) w wypracowaniu definicji danych w obszarze kompetencji jednostki, • Definiowanie reguł weryfikacji i walidacji danych wspierających biznesowe kryteria poprawności danych, • Identyfikacja systemów informatycznych przetwarzających grupy danych w obszarze kompetencji jednostki, we współpracy z Opiekunem grupy danych (Data Stewards) oraz technicznymi opiekunami systemów, • Uwzględnienie wymagań związanych z zapewnieniem jakości danych w ramach realizowanych projektów (np. reguł jakości danych), • Przekazywanie informacji zwrotnej dotyczącej jakości danych (np. w ramach Komitetu SZD). Dodatkowo, w przypadku modelu komitetowego i rozproszonego, odpowiedzialności Opiekuna grupy danych (Data Stewards) również zostają przypisane do istniejących departamentów biznesowych. Model Systemu Zarządzania Danymi Przykład Grupy Danych Jednym z wymiarów podziału kompetencji w ramach SZD będzie podział wg grup danych. Poniższa przykładowa lista grup danych została opracowana w oparciu o model FSDF, doświadczenie rynkowe oraz dyskusję z przedstawicielami Banku. Grupy danych źródłowych: • Dane klientów • Dane sprzedaży • Dane relacji z klientami (w tym kampanie) • Dane ubezpieczeń (bancassurance) • Dane rachunków • Dane ryzyka • Dane transakcji • Dane budżetowe • Dane produktów • Dane sprawozdawcze • Dane wniosków • Dane księgi głównej • Dane harmonogramów płatności • Dane gospodarki własnej • Dane zabezpieczeń • Dane przebiegu procesów • Dane windykacji • Dane referencyjne (w tym słowniki, dane zewnętrzne) Model Systemu Zarządzania Danymi Niezbędne kompetencje Zespołu Jakości Danych Powołanie Zespołu Jakości Danych wymaga pozyskania nowych kompetencji w Banku. Poniżej wylistowano główne kompetencje niezbędne dla ról w ramach ZJD. Dyrektor ZJD • Znajomość biznesowych i technicznych zagadnień dotyczących danych w Banku • Znajomość architektury danych Banku • Znajomość organizacji, procesów i procedur funkcjonujących w Banku • Umiejętności menedżerskie, w tym zarządzania jednostką organizacyjną • Umiejętność współpracy i budowania relacji z licznymi interesariuszami Opiekun grupy Danych (Data Steward) • Znajomość grup danych, sposobów ich powstawania i wykorzystywania w wybranym obszarze działalności Banku (wiedza biznesowa) • Znajomość sposobów przetwarzania danych w systemach informatycznych i zapewnienia jakości danych (wiedza informatyczna) • Znajomość sposobów pomiaru jakości danych i typowych problemów związanych z jakością danych • Umiejętność rozwiązywania problemów związanych z jakością danych Architekt informacji • Znajomość zagadnień dotyczących zarządzania architekturą danych • Znajomość grup danych, sposobów ich powstawania i wykorzystywania (wiedza biznesowa) • Znajomość rozwiązań technicznych umożliwiających zapewnienie jakości danych (wiedza informatyczna) • Znajomość architektury danych Banku • Umiejętność wypracowywania konsensusu wokół proponowanych rozwiązań architektonicznych • Umiejętność projektowania rozwiązań informatycznych Strategia i rola Biura Zarządzania Jakością Danych Centrum kompetencji i wiedzy „…organizacja, rozwój i zarządzanie systemem zarządzania danymi (SZD) w sposób zapewniający poprawę i utrzymanie jakości danych w Banku…” Planowanie i nadzór procesu kontroli jakości danych Definiowanie architektury danych Biuro Zarządzania Jakością Danych Analiza zgłoszeń Opiekunowie grupy Data Stewart grupy danych ( …..) Datadanych Stewart grupy Architekt danych (…) danych (…) Definicja wymagań biznesowych, reguł kontrolnych miar jakości oraz analiza problemów Opracowanie koncepcji poprawy jakości danych Konsultowanie rozwiązań systemowych poprawy danych oraz wdrażanie ich w SIB Aplikacje, systemy źródłowe Właściciel techniczny aplikacji systemy Architekt IT Właściciel biznesowy aplikacji systemy Realizacja inicjatyw poprawy jakości danych Zgłaszanie błędów, wsparcie BJD w wypracowaniu koncepcji poprawy jakości danych Właściciele Grup Analitycy Jakości Danych Analitycy Jakości Analitycy Jakości Analitycy Jakości Analitycy Jakości JO wspierające Model Systemu Zarządzania Danymi Czynności i odpowiedzialność w ramach SZD (przykład) Czynność Odpowiedzialny Nadzorujący Wsparcie Definicja procesów SZD Dyrektor ds. Jakości Danych - Data Steward, Użytkownicy Biznesowi Monitorowanie bieżące Analityk Jakości Architekt Informacji Data Steward Czyszczenie danych Analityk Jakości Architekt Informacji Deweloper Analiza i identyfikacja przyczyn błędów – monitorowanie bieżące Analityk Jakości, Data Steward, Data Steward Właściciele systemów (IT i Biznes) Analiza i identyfikacja przyczyn błędów – systemy źródłowe Właściciele systemu Biznes/IT Data Steward Użytkownicy Biznesowi, Właściciele systemów (IT i Biznes) Opracowanie definicji danych Właściciel biznesowy, Data Steward Dyrektor ds. Jakości Danych Użytkownicy biznesowi Opracowanie Kryteriów Jakości Data Steward Dyrektor ds. Jakości Danych Właściciel biznesowy, Architekt Informacji Wdrażanie rozwiązań technicznych Deweloper Architekt Informacji Data Steward Definiowanie procesów i procedur Jakości Danych Data Steward Dyrektor ds. Jakości Danych Architekt Informacji Opracowanie raportów cyklicznych Data Steward Dyrektor ds. Jakości Danych Architekt Informacji Zgłaszanie potrzeby zmian w systemach źródłowych Data Steward Dyrektor ds. Jakości Danych Architekt Informacji Data Steward Analitycy, Architekci, Właściciele, Użytkownicy Biznesowi Komitet SZD Definicja zasad bezpieczeństwa i dostępu Ocena jakości procesów SZD Użytkownicy Biznesowi, Deweloperzy, Właściciele systemu, Właściciel Biznesowy Użytkownicy Biznesowi, Właściciel systemu Dyrektor ds. Jakości Danych, Data Stewardzi Model Systemu Zarządzania Danymi Przykładowe role i ich obowiązki Właściciel grupy danych: 1. nadzór nad grupą danych (w tym dostarczanych do podmiotów zewnętrznych), której jest właścicielem, w tym w szczególności kryteriami jakości tej grupy danych i ich spełnieniem, 2. konsultowanie opracowywanych przez BJD definicji grup danych w zakresie tych danych, których są właścicielem, 3. określanie istotności danych, których są właścicielem, 4. definiowanie kryteriów jakości danych, których są właścicielem, 5. definiowanie oraz uzgadnianie reguł postępowania w przypadku przekroczenia dopuszczalnych poziomów jakości grup danych, których są właścicielem, 6. konsultowanie reguł jakości danych opracowywanych przez BJD, 7. inicjowanie przedsięwzięć i występowanie zgodnie z odrębnymi przepisami Banku o przyznanie budżetu na inicjatywy związane z jakością danych, których są właścicielem, 8. w zakresie danych pochodzących ze źródeł zewnętrznych takich jak międzybankowe systemy wymiany informacji BIK, AMRON, ZORO: wymaganie od dostawców danych przedstawiania potwierdzenia odpowiedniej jakości danych (popartego wynikami niezależnego audytu zewnętrznego). Model Systemu Zarządzania Danymi Przykładowe role i ich obowiązki Analityk jakości danych: 1. przekazywanie informacji o jakości danych wykorzystywanych lub przetwarzanych przez jednostkę organizacyjną Banku i komórkę organizacyjną Centrali do Opiekuna Danych odpowiedzialnego za daną grupę danych, z zastosowaniem ustalonych dla danej grupy danych i/lub aplikacji reguł jakości danych w zakresie, formacie i terminie uzgodnionym z Biurem Zarządzania Jakością Danych, 2. identyfikowanie i przekazywanie informacji o kategoriach zidentyfikowanych błędów dotyczących jakości danych do Opiekuna Danych odpowiedzialnego za daną grupę danych, 3. wsparcie w analizie i identyfikacji przyczyn błędów w danych w ramach działań koordynowanych przez Opiekuna Danych odpowiedzialnego za daną grupę danych, 4. konsultowanie reguł jakości danych definiowanych przez Opiekuna Danych odpowiedzialnego za daną grupę danych. Model Systemu Zarządzania Danymi Przykładowe role i ich obowiązki Opiekun grupy danych: 1. 2. 3. 4. 5. 6. 7. 8. koordynowanie określenia przez Właścicieli Grup Danych kryteriów jakości danych (biznesowych, technicznych), w zakresie przypisanych Opiekunowi Danych grup danych, opracowywanie reguł jakości danych (walidacji, czyszczenia, rekoncyliacji) wspierających kryteria jakości danych, w zakresie przypisanych Opiekunowi Danych grup danych, koordynowanie określenia przez Właścicieli Grup Danych reguł postępowania w przypadku przekroczenia dopuszczalnych poziomów jakości danych, w zakresie przypisanych Opiekunowi Danych grup danych, koordynowanie pozyskiwania informacji od Analityków Jakości Danych dotyczących jakości danych będących w kompetencji danej jednostki organizacyjnej Banku i komórki organizacyjnej Centrali, w zakresie przypisanych Opiekunowi Danych grup danych, analiza i identyfikowanie przyczyn błędów w danych, w zakresie przypisanych Opiekunowi Danych grup danych, definiowanie i przekazywanie zadań związanych z analizą i identyfikowaniem przyczyn błędów w danych, jak również z zapewnieniem jakości danych do: Analityków Jakości Danych, Opiekunów Merytorycznych dla zasobów SIB oraz Opiekunów Technicznych dla zasobów SIB, tworzenie planów działań i raportów okresowych dotyczących rozwiązania problemów z jakością danych w zakresie przypisanych Opiekunowi Danych grup danych. Plany działań mogą obejmować w szczególności: czyszczenie danych, opracowywanie i wdrażanie rozwiązań technicznych służących zapewnieniu jakości danych, opracowywanie i wdrażanie rozwiązań organizacyjnych służących zapewnieniu jakość danych, koordynowanie realizacji zaakceptowanych planów działań dotyczących rozwiązania problemów z jakością danych w zakresie przypisanych Opiekunowi Danych grup danych. Model Systemu Zarządzania Danymi Przykładowe role i ich obowiązki Architekt informacji: 1. opracowywanie definicji grup danych, 2. rekomendowanie Komitetowi Jakości Danych przypisania właścicielstwa grup danych do jednostek i komórek organizacyjnych Banku, 3. koordynowanie określenia istotności danych przez Właścicieli Grup Danych, 4. inwentaryzacja i opisywanie architektury danych (z uwzględnieniem źródła / miejsca powstawania danych, sposobu ich wprowadzania do SIB, przepływów danych, wykorzystania danych i sposobów ich użycia), 5. opracowywanie rozwiązań w zakresie jakości i kompletności danych, 6. analiza wpływu zmian architektury Banku na architekturę danych, w tym w szczególności zmian zgłaszanych przez Kierowników Biznesowych Projektów, 7. definiowanie standardów rozwiązań zapewniających jakość danych oraz konsultowanie ich z komórką organizacyjną odpowiedzialną za rozwój architektury IT Banku w Pionie Rozwoju i Utrzymania Aplikacji, 8. współpraca z Kierownikami Biznesowymi Projektów i Kierownikami Technicznymi Projektów w celu zapewnienia zgodności wdrażanych rozwiązań ze zdefiniowanymi standardami rozwiązań jakości danych. Strategia działania w procesie Zarządzania Jakością Danych Cele i korzyści poprawy jakości danych Optymalizuje koszty Optymalizuje działania operacyjne Poprawia jakości obsługi klienta Redukuje ryzyko funkcjonowania organizacji Kluczowe aspekty dla poprawnego wdrożenia procesu podnoszenia jakości danych Zarządzanie jakością danych to proces ciągły, a nie jednorazowe zadanie Zarządzanie jakością danych to nie jest tylko ich czyszczenie Współpraca IT-biznes jest kluczem do sukcesu Właściwe określenie właścicielstwa danych – wraz ze wsparciem inicjatywy ponad właścicielami domenowymi Działania podwyższające jakość danych muszą mieć uzasadnienie ekonomiczne Priorytety działania zadania wynikające z obowiązku prawnego (legislacja wewnętrzna oraz zewnętrzna – przepisy, rekomendacje regulatora) oczekiwane efekty (korzyści finansowe) w założonym horyzoncie czasowym powinny przewyższać szacowane nakłady* * szacowanie wartości uzgadniane z właścicielem grupy danych i weryfikowane przez właścicieli grup danych (zgłaszających błędy) lub dysponentów kosztów Priorytety działania - Co w pierwszej kolejności? Wielkość „bąbla” określa istotność problemu wskazana przez zgłaszających problemy z jakością danych korzyści nakłady Zadania zakończone Zadania w trakcie realizacji Przygotowanie do realizacji Zadania oczekujące na realizację Pytania? Dziękuję za uwagę Dariusz Gałęzowski [email protected] tel. 22 521 66 60 Mariusz Sienkiewicz [email protected] tel. 22 580 20 34