Protokół z publicznej prezentacji założeń projektu „Zintegrowane wykorzystanie i udostępnianie statystycznych zasobów tworzonych na podstawie danych administracyjnych w tworzeniu Polski Cyfrowej” przygotowanego w odpowiedzi na konkurs w ramach Programu Operacyjnego Polska Cyfrowa na lata 2014-2020, II oś priorytetowa E-administracja i otwarty rząd, Działanie 2.3. Cyfrowa dostępność i użyteczność informacji sektora publicznego, Poddziałanie 2.3.1 – Cyfrowe udostępnienie informacji sektora publicznego ze źródeł administracyjnych i zasobów nauki (typ II: Cyfrowe udostępnienie zasobów nauki), która odbyła się 22.02.2016 r., o godzinie 10:00 w budynku dawnego Centrum Informatycznego Uniwersytetu Warszawskiego, przy ulicy Krakowskie Przedmieście 26/28, w sali 102 Informacja o prezentacji publicznej projektu Zintegrowane wykorzystanie i udostępnianie statystycznych zasobów tworzonych na podstawie danych administracyjnych w tworzeniu Polski Cyfrowej, zawierająca miejsce, termin, oraz informację o możliwości zgłoszenia udziału w prezentacji, udostępniona została w dniu 08.01.2016 r. na stronie internetowej Biuletynu Informacji Publicznej Uniwersytetu Warszawskiego oraz 10.02.2016 r. na stronie internetowej Centrum Projektów Polska Cyfrowa, a także przekazana do wiadomości Ministerstwa Nauki i Szkolnictwa Wyższego, Ministerstwa Edukacji Narodowej, Ministerstwa Rodziny, Pracy i Polityki Społecznej, Ministerstwa Zdrowia, Głównego Urzędu Statystycznego, Szkoły Głównej Handlowej oraz Instytutu Badań Edukacyjnych. Obecni: Pan Stanisław Alwasiak – konsultant Pan Marek Bożykowski – Pracownia Ewaluacji Jakości Kształcenia UW Pani Agnieszka Chłoń-Domińczak – Instytut Statystyki i Demografii SGH, Instytut Badań Edukacyjnych Pan Albert Izdebski – Zastępca kierownika Pracowni Ewaluacji Jakości Kształcenia UW Pan Mikołaj Jasiński – Kierownik Pracowni Ewaluacji Jakości Kształcenia UW Pan Michał Snarski – student Instytutu Europeistyki UW Pan Piotr Wieczorek – Helica Sp. z o.o. Pani Anna Wołodko – Biblioteka Uniwersytetu Warszawskiego Porządek spotkania: 1. Powitanie obecnych oraz informacja o przebiegu i celu spotkania 2. Prezentacja założeń projektu a. Istota projektu; b. Okres i koszt realizacji projektu, c. Zdiagnozowane potrzeby grup docelowych, dla których udostępnia się cyfrowo zasoby objęte projektem, d. Zasoby informacji sektora publicznego objęte projektem, e. Cele projektu wyrażone mierzalnymi wskaźnikami, f. Znaczenie zasobów objętych projektem z uwzględnieniem ich rodzaju i danego obszaru ich udostępniania (administracja, nauka), g. Harmonogram zamówień publicznych wraz z kwotą przewidzianą do przeznaczenia na poszczególne zamówienia lub informacja o wyłonionych już wykonawcach i kwotach, na które opiewają udzielone zamówienia. 3. Pytania i uwagi uczestników Ad 1. Powitanie obecnych oraz informacja o przebiegu i celu spotkania Pan dr Mikołaj Jasiński powitał uczestników. Następnie wskazał metodologię badań jako to, co świat nauki może dać sobie, administracji publicznej oraz opinii publicznej. Wyjaśnił, że bardzo ważna jest tutaj współpraca pomiędzy jednostkami administracji publicznej i świata nauki. Pan Mikołaj Jasiński dodał, że Autorzy projektu zabiegają o udział Głównego Urzędu Statystycznego w pracach przy tym przedsięwzięciu. Podczas rozmów z GUS-em został zgłoszony problem nazwy projektu. Pojęcie „statystyki” zgodnie z prawem jest utożsamiane ze statystyką publiczną i odnosi się do danych opracowywanych przez GUS. Natomiast dzięki projektowi udostępniane będą zasoby nauki, które znajdują się w zasobach administracyjnych, i które będą mogły być w wykorzystywane do rozmaitych analiz statystycznych. W związku z tym rozważana jest zmiana tytułu projektu na: Zintegrowane wykorzystanie i udostępnianie zasobów nauki na podstawie danych administracyjnych w tworzeniu Polski cyfrowej. Pan Mikołaj Jasiński przedstawił program prezentacji. Ad. 2. Prezentacja założeń projektu a. Istota projektu Pan dr Mikołaj Jasiński wskazał, że zasoby administracyjne, istniejące w Polsce, są bogatym źródłem informacji, ale są niedostępne. Powodem tego są ograniczenia ściśle prawne, związane z ochroną danych osobowych, oraz słabe ich dostosowanie do bezpośrednich analiz naukowych. Dlatego głównym celem projektu jest udostępnianie zasobów nauki w sposób bezpieczny i użyteczny dla twórców polityki publicznej, dla świata nauki oraz dla opinii publicznej. b. Okres i koszt realizacji projektu Pan Mikołaj Jasiński przedstawił informację o przewidywanym okresie realizacji projektu przypadającym na lata 2017-2020 oraz o koszcie realizacji wynoszącym 23 002 025 zł. Następnie omówił 3 komponenty z których będzie składał się projekt. Pierwszy komponent jest najważniejszy, ponieważ polega na pozyskaniu danych, w sposób bezpieczny i zgodny z prawem, od jednostek uprawnionych do ich przetwarzania. Drugi, największy komponent, ma na celu stworzenie, pilotaż i wdrożenie narzędzia pozwalającego na udostępnienie informacji sektora publicznego. Narzędzie to musi pozwalać na udostępnienie danych w postaci użytecznej, łatwej do przetwarzania i bezpiecznej. Trzeci komponent to szkolenia i upowszechnianie tych informacji. Pan Mikołaj Jasiński zwrócił uwagę na znaczenie szkoleń. Mają one na celu dotarcie do rozmaitych grup docelowych. Następnie Pan Mikołaj Jasiński krótko scharakteryzował Partnerów projektu. c. Zdiagnozowane potrzeby grup docelowych, dla których udostępnia się cyfrowo zasoby objęte projektem Głos zabrała Pani dr Agnieszka Chłoń-Domińczak, aby opisać grupy docelowe objęte projektem. Zwróciła uwagę na sektor publiczny, który nie wykorzystuje w pełni wartości informacyjnej zasobów, które posiada do poprawiania polityki publicznej. Zaletą danych, które są gromadzone przez sektor publiczny jest ich szczegółowość do poziomu gminy, powiatu. Są to informacje, które mogą wspierać działania podejmowane przez samorządy terytorialne. Mogą być wykorzystane w obszarach aktywizacji zawodowej, rynku pracy, pomocy społecznej. Istotną grupą docelową są ośrodki badawcze zajmujące się badaniami dotyczącymi edukacji, szkolnictwa na różnych poziomach, badaniami edukacyjnymi, polityki społecznej, polityki zdrowotnej, badaniami demograficznymi, ekonomicznymi, socjologicznymi. Natomiast uczelnie wyższe, dzięki wiedzy na temat losów absolwentów na rynku pracy, mogą łatwiej podejmować decyzje co do sposobów, kierunków i programów kształcenia. Pani Agnieszka Chłoń-Domińczak zaznaczyła, że w przypadku danych udostępnianych przez administrację publiczną nie ma możliwości porównywania ze sobą informacji z poszczególnych lat, ponieważ gestorzy udostępniają informacje w sposób, który nie jest jednolity. Stąd zasoby publiczne nie są wykorzystywane przez Ośrodki Badawcze, tylko pozyskiwane z innych źródeł, często bardziej kosztownych i mniej precyzyjnych. Pani Agnieszka Chłoń-Domińczak wskazała społeczeństwo jako bardzo ważną grupą docelową. Kandydaci na studentów podejmujący wybory edukacyjne, dotyczące swojego dalszego kształcenia, wyboru typu szkoły, kierunku studiów. Pracownicy i pracodawcy obserwujący jak zmienia się dynamika wybranych zjawisk na rynku pracy. Pacjenci i pracownicy służby zdrowia chcący pozyskać informacje na temat terapii, jej skuteczności, czasu powrotu do pracy. Kolejnym zagadnieniem omawianym przez Panią Agnieszkę Chłoń-Domińczak był sposób udostępniania danych grupom docelowym. Dla dysponentów objętych projektem są to odpowiednio przygotowane zbiory danych indywidualnych. Są to informacje dotyczące: poprawienia wnioskowania, polityki publicznej, tworzenia ocen różnego rodzaju wpływu oraz skutków, regulacji ex-post i ex-ante. Będą one przygotowywane z uwzględnieniem zasobów, które są obecnie dostępne u gestorów, a są niewykorzystane przez nieznajomość wskaźników jakie mogą być oszacowane na podstawie tych zbiorów. W przypadku pozostałych odbiorców, udostępniane będą statystyki oszacowane na podstawie zasobów informacyjnych zawartych w rejestrach. Będą to rozkłady wybranych zmiennych, zwykłe bądź warunkowe, z wybranymi różnymi parametrami związanymi z tymi rozkładami. Rozkłady dwuzmiennowe, pozwalające na ocenę występujących współzależności, macierze korelacji, równania regresji, wykresy. Również mapy pozwalające na zauważenie tendencji, które występują z punktu widzenia różnych analiz: regionalnych, gminnych, powiatowych. Na mapach będzie można również prześledzić zmiany dynamiki zjawisk w czasie oraz w zależności od grupy społecznoekonomicznej. d. Zasoby informacji sektora publicznego objęte projektem Następnie Pani Agnieszka Chłoń-Domińczak przedstawiła jakie zasoby informacji sektora publicznego będą objęte projektem. Są one związane z rejestrami, które są w administracji gestorów związanych z Partnerami projektu (Centralny Rejestr Płatników Składek, Centralny Rejestr Ubezpieczonych, System Informacji Oświatowej, Zintegrowany System Informacji o Nauce i Szkolnictwie Wyższym „POL-on”, baza danych na temat zawodowych losów absolwentów szkół wyższych, rejestry Centralnej Komisji Egzaminacyjnej i Okręgowych Komisji Egzaminacyjnych, rejestr udzielanych świadczeń opieki zdrowotnej finansowanych ze środków publicznych, system CeSAR, rejestry USC i PESEL). Zasoby te zostały krótko omówione. Podczas przedstawiania sposobów udostępniania zasobów informacji sektora publicznego objętych projektem, Pani Agnieszka Chłoń-Domińczak zwróciła szczególną uwagę na przygotowanie tych informacji w sposób rzetelny. Będą one zweryfikowane pod kątem jakości zasobów będących w tych rejestrach. Sposób ich prezentacji będzie standaryzowany. e. Cele projektu wyrażone mierzalnymi wskaźnikami Pani Agnieszka Chłoń-Domińczak podsumowała swoje wystąpienie zwięzłym przedstawieniem celów projektu oraz wskaźników jego realizacji, do których należą: Liczba podmiotów, które udostępniły on-line informacje sektora publicznego: 9. Liczba zdigitalizowanych dokumentów zawierających informacje sektora publicznego: 207 768 113. Liczba udostępnionych on-line dokumentów zawierających informacje sektora publicznego: 207 768 113. Liczba utworzonych API: 1. Liczba baz danych udostępnionych on-line poprzez API: 9. Liczba pobrań/odtworzeń dokumentów zawierających informacje sektora publicznego: ok. 1 200 000. f. Znaczenie zasobów objętych projektem z uwzględnieniem ich rodzaju i danego obszaru ich udostępniania (administracja, nauka) Głos ponownie zabrał Pan Mikołaj Jasiński. Omówił aplikację, która zostanie udostępniona na Platformie Informacji Publicznej. Zwrócił uwagę, że szacowana liczba dokumentów, które zostaną udostępnione jest prawdopodobnie zaniżona, ze względu na olbrzymią liczbę danych będących w zasobach gestorów. Zaznaczył również, że jest duże zapotrzebowanie na tego typu dane, więc liczba pobrań/odtworzeń dokumentów także została podana dosyć ostrożnie. Pan Mikołaj Jasiński nawiązując do wypowiedzi Pani Agnieszki Chłoń-Domińczak odnośnie obszarów objętych projektem, zwrócił uwagę na możliwości analityczne jakie uda się stworzyć. Przypomniał o tym, że projektem zainteresowane jest szerokie grono naukowców, którzy są gotowi zaangażować się w takie przygotowanie tej aplikacji, aby można było ją wykorzystać do badań w rozmaitych obszarach. Następnie krótko scharakteryzował wszystkie obszary objęte projektem, czyli edukację i rynek pracy, warunki życia, zdrowie, a także rodzaje zasobów – administrację i naukę. Szczególną uwagę zwrócił na mobilność edukacyjną, w tym zjawiska przerywania bądź zmiany kierunku studiów, które nie zostały do tej pory objęte żadnymi badaniami. W kolejnym elemencie prezentacji omówione zostały pozytywne skutki przewidywane po wprowadzeniu projektu. Jako bardzo istotne wymienione zostały: możliwość uzyskania szybkiej informacji, bez ponoszenia dodatkowych kosztów, zwiększenie wiarygodności danych oraz lepsze wykorzystanie posiadanych już zasobów. Natomiast dla świata nauki bardzo istotny będzie dialog z administracją publiczną. Pan Mikołaj Jasiński zwrócił uwagę na to, że do tej pory w Polsce dane administracyjne nie były wykorzystywane do badań naukowych z zastosowanie nowych technologii. Jest to okazja dla rozwoju metodologii takich badań. Wyraził również nadzieję na zainicjowanie w Polsce debaty naukowej nt. bezpieczeństwa cyfrowego. Czym jest faktyczna ochrona danych osobowych, ochrona prywatności obywateli i jaka jest relacja między tymi dwoma kwestiami. Zauważył, że te zagadnienia będą istotne przy realizacji tego projektu. Kolejną kwestią poruszoną przez Pana Mikołaja Jasińskiego były koszty które są obecnie wydawane na pozyskiwanie danych. Jest to około ¾ budżetu każdego projektu. Realizacja tego projektu pozwoli na zdecydowane ich obniżenie. Pan Mikołaj Jasiński oddał głos Panu Stanisławowi Alwasiakowi. g. Harmonogram zamówień publicznych wraz z kwotą przewidzianą do przeznaczenia na poszczególne zamówienia lub informacja o wyłonionych już wykonawcach i kwotach, na które opiewają udzielone zamówienia. Pan Stanisław Alwasiak przedstawił szacunkowy harmonogram zamówień publicznych wraz z kwotą przewidzianą do przeznaczenia na poszczególne zamówienia: zakup sprzętu i oprogramowania informatycznego – 1 099 185 zł szkolenia specjalistycznych dla partnerów – 109 500 zł szkolenia ogólne dla grup docelowych – 249 216 zł szkolenia e-learningowe – 1 082 400 zł Ad. 3. Pytania i uwagi uczestników Pan Piotr Wieczorek (Helica Sp. z o.o.) poinformował, że ze względu na przedmiot działalności przedsiębiorstwa, które reprezentuje, był żywo zainteresowany tematem prezentacji. Pani Agnieszka Chłoń-Domińczak zapowiedziała, że wnioski z dyskusji zostaną uwzględnione w dalszych pracach m.in. poprzez zmianę tytułu projektu. Wobec braku dalszych uwag i pytań Pan Mikołaj Jasiński zakończył prezentację.