Załącznik nr 6 do ZO Szczegółowy Opis Przedmiotu Zamówienia Inteligentny Analizator Przetargów Przedmiotem projektu jest przeprowadzenie prac badawczo-rozwojowych wymaganych do rozbudowania istniejącego narzędzia analizy rynku zamówień publicznych o funkcjonalności wykorzystujące machine learning w celu osiągnięcia bezprecedensowej dokładności dostarczanych informacji. Aktualnie system realizuje następujące funkcjonalności: - Wyszukiwarka przetargów o baza uzupełniana kilka razy dziennie o ogłoszenia o przetargach publicznych w Polsce o wyszukiwanie po słowach kluczowych z uwzględnieniem odmiany form gramatycznych o wyszukiwanie po frazach o rozróżnianie słów kluczowych na MUST i SHOULD o wyszukiwanie po parametrach: lokalizacji geograficznej, terminach (ogłoszenia przetargu, składania ofert itp.), branżach, typach ogłoszeń, wadium, wartości, zamawiających i innych. - Wyświetlanie wyników wyszukiwania o personalizacja widoku wyników – możliwość ustalenia, które pola są priorytetowe i powinny być wyświetlane w skróconej postaci ogłoszeń o algorytm sortujący wyniki wyszukiwania wg trafności spełniania kryteriów o możliwość eksportu listy wyników do xlsx. - Filtry i raporty o możliwość zapisania dowolnej liczby zestawów kryteriów wyszukiwania o możliwość otrzymywania regularnych raportów mailowych nt. aktualnych przetargów spełniających kryteria. - Obserwowane o schowek na ogłoszenia wybrane do późniejszej analizy. - Analizator o analiza statystyczna wykonawców (kiedy wygrywali przetargi, za jakie kwoty, dla jakich zamawiających itp.) o analiza statystyczna zamawiających (kiedy ogłaszają przetargi, jakie budżety stosują, jacy wykonawcy wygrywają). - Spółki Skarbu Państwa o interaktywna baza linków do platform zakupowych spółek skarbu Państwa o możliwość segregowania i sortowania linków o możliwość dodawania notatek. - Realizacje 1 o o o o - task manager umożliwiający zarządzanie realizacją przetargów od momentu decyzji o analizie przetargu, do momentu rozpoczęcia realizacji samego zamówienia zarządzanie pracownikami poprzez przydzielanie zadań powiadomienia mailowe o przydzielonych zadaniach kalendarz zadań i wydarzeń związanych z przetargiem. Wyszukiwarka orzeczeń Krajowej Izby Odwoławczej o pełna baza orzeczeń KIO, z możliwością przeszukiwania po datach, numerach aktów prawnych i słowach kluczowych (mechanizm analogiczny do zastosowanego w wyszukiwarce przetargów) Niniejszy projekt ma się skupiać na przeprowadzeniu prac badawczo-rozwojowych wymaganych w celu stworzenia dwóch nowych funkcjonalności, opartych na uczeniu maszynowym. 1. Pierwszą jest inteligentny parser, zdolny do rozpoznawania elementów ogłoszeń nawet w przypadku ich zmieniającej się formy lub wystąpienia błędów w formularzach wypełnianych przez zamawiających. Problemem aktualnej wersji platformy jest konieczność przeprogramowywania parsera za każdym razem, gdy format ogłoszeń w Biuletynie Zamówień Publicznych lub Suplemencie do Dziennika Urzędowego Unii Europejskiej się zmieni. Ponadto parser nie jest w stanie poprawnie wydobyć danych z ogłoszeń błędnie wypełnionych. Trudności występują również w przypadku różnorodnych formatów wpisywania dat, kwot, adresów i innych danych oraz popełniania błędów ortograficznych przez osoby publikujące ogłoszenia. Problemy te utrudniają lub blokują działanie automatycznych parserów, podczas gdy jednocześnie nie mają żadnego wpływu na rozumienie tekstu ogłoszenia przez człowieka. W związku z powyższym, celem niniejszego projektu jest napisanie algorytmu uczącego się, który na podstawie analizy bazy dotychczasowych ogłoszeń będzie w stanie rozpoznawać znaczenie danych w ogłoszeniach pomimo ww. błędów i w ten sposób zminimalizować liczbę niesparsowanych ogłoszeń. Inteligentny parser ma być w stanie wydobywać z ogłoszeń o przetargach, dostępnych w Biuletynie Zamówień Publicznych (aktualnie pod adresem: http://bzp.uzp.gov.pl), oraz w Suplemencie do Dziennika Urzędowego Unii Europejskiej (aktualnie pod adresem: http://ted.europa.eu), następujące dane: - tytuł ogłoszenia - rodzaj ogłoszenia - data ogłoszenia - termin składania ofert - nr ogłoszenia - strona, na której znajduje się Specyfikacja Istotnych Warunków Zamówienia - opis zamówienia - szacunkowa wartość zamówienia (jeśli podano) - wadium - kody CPV i odpowiadające im branże - nazwa zamawiającego - adres siedziby zamawiającego - warunki udziału w postępowaniu, w tym ich poszczególne podsekcje. 2 Z kolei z ogłoszeń o wynikach postępowań system ma wydobywać następujące informacje: - tytuł ogłoszenia - nr ogłoszenia - nr ogłoszenia o rozpoczęciu postępowania, którego dotyczy dane ogłoszenie o wyniku - rodzaj ogłoszenia - data ogłoszenia - opis ogłoszenia - nazwa zamawiającego - adres siedziby zamawiającego - liczba ofert - wartość wybranej oferty - wartość najniższej oferty - wartość najwyższej oferty - kody CPV i odpowiadające im branże. Wydobyte informacje mają być zapisywane w nierelacyjnej bazie danych kompatybilnej z bazą dotychczas stosowaną przez system, opartą na technologii Elasticsearch. Drugą funkcjonalność zrealizowaną w ramach projektu, będzie stanowił moduł inteligentnego tagowania, umożliwiający dokładne wyszukiwanie po rzeczywistych branżach, których dotyczą ogłoszenia. Aktualnie jedynymi sposobami wyszukiwania po branżach są słowa kluczowe oraz kody CPV. Są to jednak metody niedoskonałe, ponieważ: a) wyszukiwanie po słowach kluczowych zawsze niesie ze sobą ryzyko wyszukania pewnej liczby ogłoszeń niezwiązanych z intencją wyszukującego b) kody CPV są w bardzo dużym odsetku przypadków wpisywane przez zamawiających błędnie; ponadto skuteczne wyszukiwanie po nich wymagałoby ich szczegółowej znajomości. Celem nowej funkcjonalności ma być umożliwienie wyszukiwania po branżach wybieranych ze specjalnie utworzonego katalogu branż, odpowiadających rzeczywistym branżom, do których odnoszą się poszczególne ogłoszenia. Ma to zostać osiągnięte poprzez stworzenie systemu machine learning, który na podstawie informacji zwrotnej nt. spełniania kryteriów wyszukiwania przez podawane przez niego wyniki będzie uczył się przypisywać branże ogłoszeniom w taki sposób, w jaki zrobiłby to człowiek. Po rozpoznaniu branży ogłoszenia, ma ono zostać otagowane, tj. oznaczone znacznikiem odpowiadającym tej branży i pozwalającym na wyszukiwanie po branżach z katalogu. Oprócz wyszukiwania po branżach, w analogiczny sposób ma zostać umożliwione wyszukiwanie po typach projektów realizowanych w ramach poszczególnych projektów, tj. ma następować tagowanie ogłoszeń następującymi typami: budowa, instalacja, projekt techniczny lub dokumentacja, dostawa, ew. inne, jeśli w trakcie realizacji projektu powstaną uzasadnione sugestie na ten temat. Model biznesowy stojący za wyżej opisanym projektem to serwis internetowy udostępniający funkcjonalnoś ci systemu w zamian za opłatę abonamentową. Grupę docelową stanowią firmy uczestniczące w rynku zamó wień́ publicznych. 3