Darek Śliwa, HPE Big Data Solutions 12:00 - 12:45 Czy wiemy, gdzie są dane osobowe naszych klientów? - identyfikacja, klasyfikacja i retencja danych Wyzwania związane z GDPR • Określenie/zrozumienie zakresu “Personally Identifiable Information/PII” • Stosowanie czasów retencji dla danych osobowych i kontaktowych • Wykonanie oceny Data Protection Impact Assessments • Posiadanie formalnej/jednoznacznej zgody użytkownika • Realizacja prawa “right to erasure” dla danych osobowych • Aktywne zarządzanie wielkimi i rozproszonymi źródłami danych (“Data Lake”) identyfikacja, klasyfikacja i retencja danych a.) podstawy technologii HPE Czy tylko platforma sprzętowa? 4 HPE HAVEn 2.0 – Platforma Big Data Hadoop/ Autonomy HDFS IDOL Kataloguje olbrzymie masywy rozproszonych danych Procesuje i indeksuje całą informację Social media Video Audio Enterprise Vertica nApps Security Email Analizuje w czasie rzeczywistym na olbrzymią skalę Texts Mobile Transactional data Korporacyjne bezpieczeństwo. Zbiera i unifikuje dane maszynowe Documents IT/OT n aplikacji: połączy rozwiązania HP + Twoje aplikacje Search engine Images Information sources CRM, SCM, ERP IT ops Email Transactional data Video Mobile Audio Texts Social media Search Images Human Information Machine Data Business Data HPE IDOL HPE Vertica Enterprise Security Hadoop HPE IDOL: technologia pozwalająca rozumieć – – – – bazujący na algorytmach i matematyce ponad 15 lat i $280M inwestycji w R&D >170 patentów niezależny od języka komunikacji z człowiekiem – wszystkie typy plików, wszystkie typy mediów (głos/wideo) – skalowalny i bezpieczny – niezależny od platformy/OS HPE IDOL: technologia pozwalająca rozumieć 500 funkcji & 400 konektorów – rozumienie Różnicy Pojęciowej (Conceptual Distance) – ekstrakcja Znaczenia (Meaning) – zaawansowane mechanizmy bezpieczeństwa – niezależność od języka komunikacji z człowiekiem – wsparcie dla 1,000 typów plików i 400 repozytoriów danych – automatyzacja procesów w czasie rzeczywistym – media społecznościowe, audio, wideo, tekst – petabajtowa skalowalność Over 400 Connectors Ponad 500 funkcji IDOL'a poszerzających inteligencję Inquire Investigate Interact Improve Search your data Analyze your data Personalize your data Enhance your data Automatic hyperlinking Automatic query guidance Implicit profiling Eduction Conceptual search Highlighting Explicit profiling Automatic clustering Keyword search Parametric refinement Clustering 2D/3D Fieldtext search Summarization Community and expertise network Phrase search Real-time predictive query Agents Auto language detection Phonetic search Metadata extraction Intent-based ranking Sentiment analysis Field modulation Automatic tagging Alerting Fuzzy matching Faceted navigation Automatic taxonomy generation Social feedback Autoclassification HPE IDOL: analiza obrazu, wykrywanie osób Found “President Obama” face Face detection Face analysis Primary clothing color = white Not nude Primary clothing color = white Not nude Primary clothing color = black Not nude HPE IDOL: media i społeczność identyfikacja, klasyfikacja i retencja danych b.) platforma HPE dla Information Governance i GDPR 12 Platforma HPE dla Information Governance oraz GDPR Dane niestrukturalne Klasyfikacja Email Pliki SharePoint Badanie zgodności / audyt Wymuszanie polityk GDPR IM Manage in place Review Konektory Dane niestrukturalne HPE ControlPoint (IDOL) Aplikacje Repozytorium HPE Content Manager Zniszczenie Raportowanie PII Structured Dane strukturalne HPE SDM - Structured Data Manager identyfikacja, klasyfikacja i retencja danych c.) HPE Content Manager - repozytorium treści 14 HPE Content Manager - repozytorium treści i informacji Znacząco ułatwia zarządzanie informacją oraz obniża TCR (Total Cost of Regulation) Bezpośrednio adresuje potrzeby bezpieczeństwa i prywatności dzięki bezpiecznemu składowaniu informacji/treści w całym przedsiębiorstwie Wspiera i poprawia zwrot z inwestycji w MS SharePoint/Office 365 Znacząco zwiększa wydajność pracy użytkowników dzięki rozbudowanej wyszukiwarce oraz informacjom lokalizacyjnym 15 HPE Content Manager bazuje na politykach Wymagania statutowe Polityki biznesowe Przedsiębiorstwo Poziom operacyjny Poziom aplikacyjny Polityki dot. rekordów Polityki IT Monitorowanie i raportowanie Silnik polityk Bezpieczeństwo i kontrola Retencja Usunięcie/ zniszczenie Polityki klasyfikacji Hold and Discovery Identyfikacja i analiza 16 HPE Content Manager - przykład współpracy z MS SharePoint/Office 365 • Rozbudowane polityki 'Lifetime management' • Definiowanie kontroli dostępu • Ulepszone powiadomienia • Rozszerzone bezpieczeństwo • Wsparcie dla SharePoint 2016 17 HPE Content Manager - obsługa lokalizacji • Wyszukiwane i zapamiętywane są koordynaty GPS z metadanych • Pozwala na wyszukiwanie wg. lokalizacji • Pozwala na akcje (np. udostępnianie informacji) bazujące na lokalizacji 18 HPE Content Manager - również aspekty prawne Iron Mountain Policy Center Definicje polityk retencyjnych w zależności od obowiązującego prawa HPE Content Manager Stosowanie polityk retencyjnych Key Value: Automated End to End Lifecycle Management According to Law identyfikacja, klasyfikacja i retencja danych d.) HPE Structured Data Manager - zarządzanie i archiwizacja danych strukturalnych - wygaszanie leciwych aplikacji 20 HPE Structured Data Manager Enterprise Management dla danych strukturalnych Optymalizacja wydajności • • • Znacząca obniżka pojemności danych i kosztów Storage Wydajność aplikacji Usprawnienie backupu Wygaszanie leciwych aplikacji (Application Retirement) • Likwidacja przestarzałych aplikacji z pozostawieniem dostępu do danych Ekstrakt danych do testów • Wyodrębnianie podzbiorów danych na potrzeby rozwoju i testowania aplikacji • Maskowanie danych wrażliwych Search & eDiscovery • Indeksowanie danych aplikacji do dalszego wyszukiwania • Identyfikacja zbiorów danych na potrzeby działań prawnych 21 HPE Structured Data Manager - jak działa? Bazy produkcyjne Active Data Search Inactive Data Ingest Ingest/Search Ingest/Search HPE SDM Bazy 'na emeryturze' Inactive Data Search Ingest HPE Cloud Storage repozytoria HPE Content Manager Ingest/Search analityka Big Data HPE Vertica “Structured Data Manager takes a unique approach to storing, managing and extracting value from structured data that is based on a robust selection of pre-built integrations to cloud storage, comprehensive information management systems and high performance analytics platform. We believe that the HPE solution provides excellent flexibility and quick return-on-investments for enterprises of all sizes.” — Sara Radicati, The Radicati Group identyfikacja, klasyfikacja i retencja danych e.) HPE ControlPoint - identyfikacja i klasyfikacja informacji 23 HPE ControlPoint do obsługi informacji niestrukturalnej Wykorzystanie możliwości HPE IDOL do automatycznego deklarowania i klasyfikowania informacji rozproszonej po repozytoriach organizacji. HPE ControlPoint Współdzieleni e Policy Categories SharePoint Wybiera rekordy bazując na politykach 'deklaracji' powiązanych z kategoriami IDOL'a Auto-Declaration Email Auto-Classification ECM Systems Archives Filing Categories HPE Content Manager Przydziela miejsce składowania na podstawie klasyfikacji powiązanej z kategoriami IDOL'a oraz regułami automatycznego tworzenia folderów Etapy analizy ControlPoint Etap 'Identify and Index' – Rejestracja repozytorium – Systemy plików, MS Exchange, HP RM czy SharePoint mogą zostać dodane i skonfigurowane do indeksowania wprost w interfejsie ControlPoint'a – Lista dodatkowych repozytoriów jest dłuuuga (Lotus Notes, Documentum, …) – Indeksowanie – Dostępne są różne poziomy (głębokości) indeksowania – Prekonfigurowane zadanie szuka danych osobowych – Wyjście z OCR (tekst) łączone jest z metadanymi i przekazywane do procesu indeksującego OCR-owanie dokumentacji technicznej (w tym rysunków) Etapy analizy ControlPoint Analiza zebranych danych • Przykłady analizy datasetów po czasie (powyżej) i po typie (po prawej) • Ponad 50% dokumentów po prawej jest typu 'obraz' • Inne kryteria analizy: zakresy dat, users/groups, właściciele, … Etapy analizy ControlPoint Automatyczne grupowanie podobnych danych Kategoryzacja bazująca na zawartości • Możliwość przygotowania złożonych kategorii za pomocą kombinacji metadanych, wyszukiwania słów kluczowych, ekstrakcji, operacji logicznych, itp. • Możliwość zarządzania kategoriami w ramach zorganizowanej systematyki/taksonomii • Poniższy przykład: znajdź dokumenty zawierające słowa 'PIG' i 'Launcher' oraz numer rysunku Etapy analizy ControlPoint Etapy analizy ControlPoint identyfikacja, klasyfikacja i retencja danych f.) GDPR a platforma HPE dla Information Governance 35 Platforma HPE dla Information Governance oraz GDPR Dane niestrukturalne Klasyfikacja Email Pliki SharePoint Badanie zgodności / audyt Wymuszanie polityk GDPR IM Manage in place Review Konektory Dane niestrukturalne HPE ControlPoint Aplikacje Dane strukturalne Structured HPE SDM - Structured Data Manager Repozytorium HPE Content Manager Zniszczenie Raportowanie PII Wymagania rozporządzenia GDPR - jak je adresować? Wymóg Wyzwanie Rozwiązanie HPE Personal Data Assessment Jaka informacja podlega pod wymogi GDPR i gdzie się ona znajduje? HPE ControlPoint HPE Structured Data Manager Defensible Disposition Jak zidentyfikować informację do usunięcia/skasowania zgodnie z wymogiem 'prawa do bycia zapomnianym' HPE ControlPoint HPE Structured Data Manager Secure Content Management Jak najlepiej stosować i wymuszać polityki do zarządzania informacją w całym cyklu jej życia HPE ControlPoint HPE Structured Data Manager HPE Content Manager HPE Policy Center Litigation Readiness and Response Jak szybko i efektywnie kosztowo odpowiadać na aspekty prawne dotyczące informacji, którą zarządzam. HPE Verity suite (archiving, ECA and eDiscovery modules) HPE eDiscovery HPE Legal Hold Adaptive Backup and Recovery Jak najlepiej zapewnić bezpieczeństwo składowanej informacji? HPE Data Protector HPE Storage Optimizer HPE Backup Navigator HPE Connected Backup/CMX 37 Defensible Disposition How do I identify information for disposition, in accordance with “the right to be forgotten” (Complying with GDPR Articles: 4, 15, 16, 17, 18, 19, 20, 21, 22, 24; GDPR Recital 59, 63, 64, 65, 66, 67, 68, 69, 70, 71, 74) HPE Capabilities HPE Products Capabilities • • • • HPE ControlPoint HPE Structured Data Manager Data mapping – structured and unstructured data Identify information that has no enterprise value and isn’t subject to GDPR requirements for disposition Benefits • • • • Lower total storage costs by defensibly disposing of information (with audit trail) that costs € 23/GB to manage through its lifecycle (per ESG report) Ensure alignment with “right to be forgotten” and dispose of information that is no longer needed Lower risk of information accidentally being viewed out of context Protect against security breaches by proactively analyzing previously dark data that is more prone to breach 38 Secure Content Management How do I best apply and enforce policies to manage information through its lifecycle? (Complying with GDPR Articles: 5, 24; GDPR Recital 39, 74) HPE Capabilities HPE Products Capabilities • • • • • • • • Data mapping Automated PII analysis and tagging Enterprise Content Management Benefits • • • • • HPE ControlPoint HPE Structured Data Manager HPE Content Manager HPE Policy Center HPE Verity suite (archiving module) Understand your GDPR readiness and risk exposure Identify information that may be relevant to GDPR requirements in an streamlined/automated fashion vs. a manual, error-prone process Systematically apply policies to applicable information for security, data protection, and lifecycle management purposes Protect against security breaches by proactively analyzing previously dark data that is more prone to breach Manage information throughout its lifecycle in a consolidated repository that is protected and backed up in conjunction with GDPR requirements to protect against fines & sanctions 39 Litigation Readiness & Response How can I quickly & cost-effectively respond to legal matters requiring information under my management? (Complying with GDPR Articles: 79, 58; GDPR Recital 122, 123, 143) HPE Capabilities HPE Products • Capabilities • • • Information archiving – proactively consolidate information in a central repository in advance of litigation Legal Hold – lock down information that may be relevant to a legal matter so it is not tampered with or disposed Processing and Review – cull down information that proceeds to litigation • • HPE Verity suite (archiving, ECA and eDiscovery modules) HPE eDiscovery HPE Legal Hold Benefits • • • Lower risk and cost, and minimize time of eDiscovery without moving information to various eDiscovery systems with manual processes Lower risk of accidental data spoliation that can lead to fines, sanctions, and adverse inference decisions in court Lower cost related to reviewing too much information 40 Adaptive Backup & Recovery How do I best ensure sensitive data is protected, stored and backed up securely? (Articles 6, 32, 33, 34, 83 ) HPE Capabilities HPE Products Capabilities • • • • • • • Pre-Optimization --Understand what information you have to backup specific to GDPR at a granular level Backup & Recovery – Protect information in accordance with GDPR requirements Guided Optimization – Leverage advanced analytics to determine how to optimize ongoing process HPE Data Protector HPE Storage Optimizer Backup Navigator HPE Connected Backup/CMX Benefits • • • • Lower total cost of data protection with ongoing optimizations and tiered backup strategies Ensure the right data is protected in accordance with requirements Advanced recovery options allow you to meet strict recovery and service level expectations Zero Downtime Backup snapshot protection to easily meet shrinking backup window demands 41 Przykład Udokumentowanego Usunięcia danych Polityki Retencji rekordy “proxy” RM Autoryzacja Usunięcia Lista danych do usunięcia SDM zasilenie metadanymi Wykasuj JDBC SDM SDM SDM SDM Nadpisz Wykasuj Wymień Wykasuj Script API …. App1 App2 App3 App4 App n 42 Dziękuję za uwagę Darek Śliwa [email protected] 44