Centralna baza danych ubezpieczeń komunikacyjnych w identyfikacji zjawisk związanych z przestępczością ubezpieczeniową Wojciech Bijak Instytut Ekonometrii SGH i Ośrodek Informacji UFG Krzysztof Hrycko Ośrodek Informacji UFG Wyzwania dla rynku ubezpieczeń komunikacyjnych, Ubezpieczeniowy Fundusz Gwarancyjny Warszawa, 4.12.2013 r. 1 Plan prezentacji Centralna Baza Danych Ośrodka Informacji UFG (OI UFG) UFG jako Ośrodek Informacji Wykrywanie nieubezpieczonych posiadaczy pojazdów Identyfikacja i weryfikacja zjawisk przestępczości ubezpieczeniowej Ubezpieczeniowy Fundusz Gwarancyjny 2 Centralna Baza Danych OI UFG - Zakres danych Do zadań Funduszu jako ośrodka informacji należy (art. 102 - 104 ustawy) Prowadzenie rejestru umów ubezpieczeń komunikacyjnych OC posiadaczy pojazdów mechanicznych (od 2004 r.) oraz casco pojazdów lądowych (od 2006 r.) Gromadzenie w bazie Ośrodka Informacji UFG danych dotyczących zdarzeń oraz wypłaconych odszkodowań i świadczeń Gromadzenie informacji dotyczących reprezentantów ds. roszczeń każdego zakładu ubezpieczeń działającego na terenie Polski organów odszkodowawczych ustanowionych w każdym państwie członkowskim UE Udostępnianie zgromadzonych danych uprawnionym podmiotom Ubezpieczeniowy Fundusz Gwarancyjny 3 Centralna Baza Danych OI UFG – stan bazy Liczba aktywnych rekordów w Centralnej Bazie Danych OI UFG na dzień 26.11.2013 Umowy ubezpieczenia 232 mln rekordów, co roku przybywa ok. 30 mln rekordów Zdarzenia 11,9 mln rekordów, co roku przybywa ok. 2-2,5 mln rekordów Wypłaty 11,1 mln rekordów, co roku przybywa ok. 2 mln rekordów Okres przechowywania danych przez UFG w bazie OI UFG – 21 lat Ubezpieczeniowy Fundusz Gwarancyjny 4 Centralna Baza Danych OI UFG – kompletność bazy Kompletność 0% 80,05% 86,95% 20% 10% 68,30% 30% 84,60% 40% 35,83% 10% 50% 18,61% 20% 40,87% 30% 21,65% 40% 89,41% 60% 50% 95,56% 70% 60% 93,38% 80% 70% 93,36% 90% 80% 90,03% 100% 90% 87,07% 100% 78,51% ZDARZENIA - 84,36 % 75,94% POJAZDY - 99,23 % 83,83% 0% 85,03% 10% 0% 83,44% 20% 10% 92,04% 30% 20% 89,66% 40% 30% 90,66% 50% 85,24% 60% 57,58% 100,16% 99,02% 40% 98,92% 50% 98,74% 70% 60% 98,98% 80% 70% 100,90% 90% 80% 100,10% 100% 90% 96,83% 100% Terminowość zasilania bazy (umowy, zdarzenia wypłaty) 0% ODSZKODOWANIA - ILOŚĆ - 79,25 % ODSZKODOWANIA - WARTOŚĆ - 69,51 % Ubezpieczeniowy Fundusz Gwarancyjny 5 UFG jako Ośrodek Informacji Polisy, Dostęp do baz referencyjnych zdarzenia, odszkodowania, … Centralna Baza Danych OI UFG Poszkodowany, posiadacz pojazdu Policja, Zakłady ubezpieczeń sąd, prokuratura, PIU, KNF,… W zakresie OC p.p.m. W toczącym się postępowaniu, do realizacji zadań ustawowych 1. Ocena ryzyka, 2. Ustalanie umów wielokrotnych 3. Wykonanie umowy 4. Inne cele po anomizacji danych 1. Kontrola spełnienia obowiązku zawarcia OC p.p.m. 2. Identyfikacja i weryfikacja zjawisk przestępczości ubezpieczeniowej 3. Inne cele po anonimizacji danych Przetwarzanie danych przez UFG Gromadzenie danych Udostępnianie danych Ubezpieczeniowy Fundusz Gwarancyjny 6 Wykrywanie nieubezpieczonych posiadaczy pojazdów Szacunki UFG 250 tys. nieubezpieczonych posiadaczy pojazdów Podmioty obowiązane do przeprowadzania kontroli spełnienia obowiązku zawarcia umowy ubezpieczenia OC p.p.m.: Policja organy celne Straż Graniczna organy właściwe w sprawach rejestracji pojazdów Inspekcja Transportu Drogowego Podmioty uprawnione: Ubezpieczeniowy Fundusz Gwarancyjny inne organy uprawnione do kontroli ruchu drogowego Inspekcja Ochrony Środowiska Ubezpieczeniowy Fundusz Gwarancyjny 7 Wykrywanie nieubezpieczonych w oparciu o dane OI UFG – architektura systemu Dane źródłowe Dane z ZU Modelowanie Analiza danych Dane z CBK* Budowa modelu Dane z CBP** Testowanie modelu System merytoryczny UFG Generowanie opłat za brak ubezpieczenia OC Dane z CEP Nadzór nad modelem Dane z systemu merytorycznego Wykorzystanie modelu analitycznego do typowania pojazdów bez ubezpieczenia Zgłoszenia z podmiotów uprawnionych i zobowiązanych Weryfikacja wykrytych przypadków braku ubezpieczenia w zakładach ubezpieczeń *CBK – Centralna Baza Kontrahentów, **CBP – Centralna Baza Pojazdów Ubezpieczeniowy Fundusz Gwarancyjny 8 Wykrywanie nieubezpieczonych w oparciu o dane OI UFG – skuteczność działania systemu Rok rejestracji spraw y 2011 2012 2013 Zasadność Zgłoszenie od podm iotów zew nętrznych Data m ining Źródło zgłoszenia Liczba spraw Średnie przychody na spraw ę Przychody a b c Liczba spraw Średnie przychody na spraw ę Przychody Efektyw ność bieżąca data m ining d e f b/e 548 1 504,35 zł 824 381,99 zł 301 625,95 zł 188 411,10 zł 2,40 Spraw y razem 1 083 761,58 zł 824 790,79 zł 2 271 82,96 zł 188 411,10 zł 9,18 Zasadne 1 829 1 311,84 zł 2 399 358,12 zł 8 704 848,67 zł 7 386 798,64 zł 1,55 Spraw y razem 6 062 398,68 zł 2 416 790,55 zł 71 831 103,98 zł 7 468 669,32 zł 3,83 1 864 1 130,24 zł 2 106 768,63 zł 1,09 Zasadne Zasadne 286 Spraw y razem 6 366 Razem 13 511 Rok rejestracji spraw y 1 236,81 zł 353 728,80 zł 55,57 zł 353 728,80 zł 41 362 52,55 zł 2 173 567,96 zł 1,06 266,10 zł 3 595 310,14 zł 115 464 85,14 zł 9 830 648,38 zł 3,13 Udział spraw niezasadnych w ogólnej liczbie spraw Zgłoszenie od Data m ining podm iotów zew nętrznych a b Skuteczność data m ining b/a 2011 12,74% 53,10% 4,17 2012 25,02% 51,70% 2,07 2013 7,90% 38,41% 4,86 W. Bijak, K Hrycko, Ł. Pietrowski, Sposób na nieubezpieczonych, Miesięcznik Ubezpieczeniowy, Tom 9, Nr 4, kwiecień 2012 r. W. Bijak, K. Hrycko, St. Garstka, Automatyzacja prowadzonych przez UFG kontroli spełnienia obowiązku zawarcia umowy OC posiadaczy pojazdów mechanicznych, Prawo asekuracyjne, Nr 3 (76) 2013. Ubezpieczeniowy Fundusz Gwarancyjny 9 Identyfikacja i weryfikacja zjawisk przestępczości ubezpieczeniowej Skala zjawiska – wartość wyłudzeń w mln zł (dane PIU) Rodzaj ubezpieczenia 2009 2010 2011 OC p.p.m. 19,9 35,7 37,5 AC 23,7 16,7 32,6 W wielu krajach szacuje się skalę zjawiska na poziomie od 1% do 10% wypłaconych odszkodowań (w Polsce wartość wyłudzeń to od 54 do 546 mln zł z OC p.p.m. i od 37 do 370 mln zł z AC w 2011 r.) I. Badanie w OI UFG możliwości bazy danych i narzędzi analitycznych w detekcji zjawiska przestępczości ubezpieczeniowej Wyniki badań przedstawiane na konferencjach: aktuarialnej w Będlewie w 2013 r. i poświęconych przestępczości ubezpieczeniowej w Szczecinie i Szczytnie w 2013 r. II. Ścisła współpraca z rynkiem ubezpieczeniowym i innymi podmiotami w zakresie określania reguł wykrywania zjawiska, stosowanych modeli i metod analitycznych i analizy sieci powiązań przestępczych Ubezpieczeniowy Fundusz Gwarancyjny 10 Identyfikacja i weryfikacja zjawisk przestępczości ubezpieczeniowej – Model współpracy podmiotów MSW CEPiK KNF ZBP Związek Banków Polskich Zakład Ubezpieczeń komunikacyjnych CBA PIU ABW Zakład Ubezpieczeń POLICJA PROKURATURA Ubezpieczeniowy Fundusz Gwarancyjny 11 Identyfikacja i weryfikacja zjawisk przestępczości ubezpieczeniowej – Wykorzystanie zasobów UFG I. Działania dopuszczone przez przepisy prawa II. Zbiór danych komunikacyjnych ze wszystkich Zakładów Ubezpieczeń III. Gotowe repozytorium danych historycznych IV. Działające procesy zasilające repozytorium, wraz z procesami monitorującymi kompletność i jakość przesyłanych danych V. Wykonana identyfikacja obiektów (osoba / pojazd) na danych z wszystkich zakładów VI. Tabele analityczne wykorzystywane do wykrywania nieubezpieczonych VII. Dostępna platforma analityczna/technologiczna VIII. Kanały komunikacji z Zakładami Ubezpieczeń i innymi podmiotami IX. Współpraca z rejestrami referencyjnymi Ubezpieczeniowy Fundusz Gwarancyjny 12 Identyfikacja i weryfikacja zjawisk przestępczości ubezpieczeniowej – techniki i narzędzia UFG • Wykrywanie zorganizowanych grup przestępczych • Wykrywanie złożonych przypadków • Wsparcie dla wszystkich ZU • Ocena skali zjawiska Analiza sieci społecznych UFG Zaawansowana analityka Reguły eksperckie ZU Wykrywanie anomalii Przeszukiwanie informacji w bazach danych Text mining Okazjonalne Działania przestępcze Profesjonalne • Przestępstwa wewnętrzne (agenci, likwidatorzy) • Okazjonalne działania przestępcze • „Lokalne” grupy przestępcze • Wszystkie linie biznesowe ZU Ubezpieczeniowy Fundusz Gwarancyjny 13 Przykładowa literatura Christopher Westphal, Data mining for inteligence, fraud & criminal detection. Advanced analysis & tools, CRC Press , Boca Raton 2009. Adrian Gepp, J. Holton Wilson, Kuldeep Kumar and Sukanto Bhattacharya, A comparative Analysis of Decision Trees Vis-a-vis Other Computational Data Mining Techniques in Automotive Insurance Fraud Detection,Journal of Data Science 10(2012), 537-561. Rekha Bhowmik, Detecting Auto Insurance Fraud by Data Mining Techniques , Journal of Emerging Trends in Computing and Information Sciences, Volume 2 No.4, APRIL 2011. Vidya Mohanty, FP.AnnanNaidu, Fraud Detection Using Outlier Analysis: A Survey, INTERNATIONAL JOURNAL OF ENGINEERING SCIENCES & RESEARCH TECHNOLOGY, 2(6): June, 2013. INSURANCE FRAUD HANDBOOK, The Association of Certified Fraud Examiners, Inc. 2009. Richard J. Bolton and David J. Hand, Statistical Fraud Detection: A Review, Statistical Science, 2002, Vol. 17, No. 3, 235–255. Viaene, S., Derrig, R. A., Baesens, B. and Dedene, G. (2002). A comparison of state-of-the-art classication techniques for expert automotive insurance claim fraud detection. Journal of Risk and Insurance 69, 373-421. APPLICATION PAPER ON DETERRING, PREVENTING, DETECTING, REPORTING AND REMEDYING FRAUD IN INSURANCE, IAIS, SEPTEMBER 2011 Ubezpieczeniowy Fundusz Gwarancyjny 14 Wybrane reguły wykrywania zjawiska przestępczości ubezpieczeniowej Klient Pojazd Reguła 1 Klienci którzy mieli 3 i więcej szkód w okresie roku z ubezpieczeń AC i OC łącznie Reguła 2 Klienci którzy mieli 2 i więcej szkód kradzieżowych Reguła 3 Klienci bez wcześniejszej historii ubezpieczenia, dla których zaistniała szkoda z pierwszej i jedynej polisy Reguła 4 Pojazdy dla których zgłoszono 3 i więcej szkód w ciągu roku Reguła 5 Pojazdy dla których zgłoszono 2 i więcej szkód całkowitych Reguła 6 Pojazdy dla których zgłoszono 2 i więcej szkód kradzieżowych Reguła 7 Pojazdy dla których ujawniono podwójne dobrowolne ubezpieczenie dotyczące tego samego okresu ochrony Ubezpieczeniowy Fundusz Gwarancyjny 15 Przewaga centralnej bazy nad bazami rozproszonymi - reguły Reguła: liczba zdarzeń, w których uczestniczyła dana osoba (zdarzenia zaistniałe w okresie styczeń 2012 – wrzesień 2013 ) Udział liczby osób uczestniczących w zdarzeniach wg liczby zdarzeń w ogólnej liczbie osób uczestniczących w zdarzeniach (w %) 80% 70% 60% 50% zakłady 40% OI UFG 30% 20% 10% 0% 1 2 3 4 Ubezpieczeniowy Fundusz Gwarancyjny 5 6 16 Sieci powiązań w opisie zjawisk przestępczości ubezpieczeniowej Liczba węzłów w sieci: 137, Liczba szkód kradzieżowych: 4 Liczba zakładów, w których zgłaszano szkody: 14 Łączna wartość odszkodowania: 932 069 zł Ubezpieczeniowy Fundusz Gwarancyjny 17 Przewaga centralnej bazy nad bazami rozproszonymi – sieci powiązań społecznych Udział liczby sieci powiązanych zdarzeń według liczby zdarzeń w sieci w ogólnej liczbie sieci utworzonych dla 2,2 mln zdarzeń zaszłych w okresie styczeń 2012 – wrzesień 2013 Uwaga: Wykres obrazuje sieci powiązań, dopiero dokładna analiza danych pozwala na określienie powiązań celowych oraz przestępczych. Ubezpieczeniowy Fundusz Gwarancyjny 18 Problemy do rozwiązania I. Jakość danych II. Standaryzacja danych III. Kompletność danych IV. Jakość i skuteczność stosowanych modeli, metod i technik V. Efektywność działań identyfikacji zjawisk przestępczych (jak mierzyć) • W obszarze zawierania umów • W obszarze likwidacji szkód • W obszarze prewencji VI. Bezpieczeństwo obiegu informacji Ubezpieczeniowy Fundusz Gwarancyjny 19 Dziękujemy za uwagę Ubezpieczeniowy Fundusz Gwarancyjny 20