Załącznik nr 6 do ZO Szczegółowy Opis Przedmiotu Zamówienia

advertisement
Załącznik nr 6 do ZO
Szczegółowy Opis Przedmiotu Zamówienia
Inteligentny Analizator Przetargów
Przedmiotem projektu jest przeprowadzenie prac badawczo-rozwojowych wymaganych
do rozbudowania istniejącego narzędzia analizy rynku zamówień publicznych o funkcjonalności
wykorzystujące machine learning w celu osiągnięcia bezprecedensowej dokładności dostarczanych
informacji.
Aktualnie system realizuje następujące funkcjonalności:
-
Wyszukiwarka przetargów
o baza uzupełniana kilka razy dziennie o ogłoszenia o przetargach publicznych
w Polsce
o wyszukiwanie po słowach kluczowych z uwzględnieniem odmiany form
gramatycznych
o wyszukiwanie po frazach
o rozróżnianie słów kluczowych na MUST i SHOULD
o wyszukiwanie po parametrach: lokalizacji geograficznej, terminach (ogłoszenia
przetargu, składania ofert itp.), branżach, typach ogłoszeń, wadium, wartości,
zamawiających i innych.
-
Wyświetlanie wyników wyszukiwania
o personalizacja widoku wyników – możliwość ustalenia, które pola są priorytetowe
i powinny być wyświetlane w skróconej postaci ogłoszeń
o algorytm sortujący wyniki wyszukiwania wg trafności spełniania kryteriów
o możliwość eksportu listy wyników do xlsx.
-
Filtry i raporty
o możliwość zapisania dowolnej liczby zestawów kryteriów wyszukiwania
o możliwość otrzymywania regularnych raportów mailowych nt. aktualnych
przetargów spełniających kryteria.
-
Obserwowane
o schowek na ogłoszenia wybrane do późniejszej analizy.
-
Analizator
o analiza statystyczna wykonawców (kiedy wygrywali przetargi, za jakie kwoty, dla
jakich zamawiających itp.)
o analiza statystyczna zamawiających (kiedy ogłaszają przetargi, jakie budżety stosują,
jacy wykonawcy wygrywają).
-
Spółki Skarbu Państwa
o interaktywna baza linków do platform zakupowych spółek skarbu Państwa
o możliwość segregowania i sortowania linków
o możliwość dodawania notatek.
-
Realizacje
1
o
o
o
o
-
task manager umożliwiający zarządzanie realizacją przetargów od momentu decyzji
o analizie przetargu, do momentu rozpoczęcia realizacji samego zamówienia
zarządzanie pracownikami poprzez przydzielanie zadań
powiadomienia mailowe o przydzielonych zadaniach
kalendarz zadań i wydarzeń związanych z przetargiem.
Wyszukiwarka orzeczeń Krajowej Izby Odwoławczej
o pełna baza orzeczeń KIO, z możliwością przeszukiwania po datach, numerach aktów
prawnych i słowach kluczowych (mechanizm analogiczny do zastosowanego
w wyszukiwarce przetargów)
Niniejszy projekt ma się skupiać na przeprowadzeniu prac badawczo-rozwojowych wymaganych
w celu stworzenia dwóch nowych funkcjonalności, opartych na uczeniu maszynowym.
1. Pierwszą jest inteligentny parser, zdolny do rozpoznawania elementów ogłoszeń nawet
w przypadku ich zmieniającej się formy lub wystąpienia błędów w formularzach wypełnianych
przez zamawiających.
Problemem aktualnej wersji platformy jest konieczność przeprogramowywania parsera za każdym
razem, gdy format ogłoszeń w Biuletynie Zamówień Publicznych lub Suplemencie do Dziennika
Urzędowego Unii Europejskiej się zmieni. Ponadto parser nie jest w stanie poprawnie wydobyć
danych z ogłoszeń błędnie wypełnionych. Trudności występują również w przypadku różnorodnych
formatów wpisywania dat, kwot, adresów i innych danych oraz popełniania błędów ortograficznych
przez osoby publikujące ogłoszenia.
Problemy te utrudniają lub blokują działanie automatycznych parserów, podczas gdy jednocześnie
nie mają żadnego wpływu na rozumienie tekstu ogłoszenia przez człowieka.
W związku z powyższym, celem niniejszego projektu jest napisanie algorytmu uczącego się, który
na podstawie analizy bazy dotychczasowych ogłoszeń będzie w stanie rozpoznawać znaczenie
danych w ogłoszeniach pomimo ww. błędów i w ten sposób zminimalizować liczbę
niesparsowanych ogłoszeń.
Inteligentny parser ma być w stanie wydobywać z ogłoszeń o przetargach, dostępnych w Biuletynie
Zamówień Publicznych (aktualnie pod adresem: http://bzp.uzp.gov.pl), oraz w Suplemencie
do Dziennika Urzędowego Unii Europejskiej (aktualnie pod adresem: http://ted.europa.eu),
następujące dane:
- tytuł ogłoszenia
- rodzaj ogłoszenia
- data ogłoszenia
- termin składania ofert
- nr ogłoszenia
- strona, na której znajduje się Specyfikacja Istotnych Warunków Zamówienia
- opis zamówienia
- szacunkowa wartość zamówienia (jeśli podano)
- wadium
- kody CPV i odpowiadające im branże
- nazwa zamawiającego
- adres siedziby zamawiającego
- warunki udziału w postępowaniu, w tym ich poszczególne podsekcje.
2
Z kolei z ogłoszeń o wynikach postępowań system ma wydobywać następujące informacje:
- tytuł ogłoszenia
- nr ogłoszenia
- nr ogłoszenia o rozpoczęciu postępowania, którego dotyczy dane ogłoszenie o wyniku
- rodzaj ogłoszenia
- data ogłoszenia
- opis ogłoszenia
- nazwa zamawiającego
- adres siedziby zamawiającego
- liczba ofert
- wartość wybranej oferty
- wartość najniższej oferty
- wartość najwyższej oferty
- kody CPV i odpowiadające im branże.
Wydobyte informacje mają być zapisywane w nierelacyjnej bazie danych kompatybilnej z bazą
dotychczas stosowaną przez system, opartą na technologii Elasticsearch.
Drugą funkcjonalność zrealizowaną w ramach projektu, będzie stanowił moduł inteligentnego
tagowania, umożliwiający dokładne wyszukiwanie po rzeczywistych branżach, których dotyczą
ogłoszenia.
Aktualnie jedynymi sposobami wyszukiwania po branżach są słowa kluczowe oraz kody CPV. Są to
jednak metody niedoskonałe, ponieważ:
a) wyszukiwanie po słowach kluczowych zawsze niesie ze sobą ryzyko wyszukania pewnej
liczby ogłoszeń niezwiązanych z intencją wyszukującego
b) kody CPV są w bardzo dużym odsetku przypadków wpisywane przez zamawiających
błędnie; ponadto skuteczne wyszukiwanie po nich wymagałoby ich szczegółowej
znajomości.
Celem nowej funkcjonalności ma być umożliwienie wyszukiwania po branżach wybieranych
ze specjalnie utworzonego katalogu branż, odpowiadających rzeczywistym branżom, do których
odnoszą się poszczególne ogłoszenia. Ma to zostać osiągnięte poprzez stworzenie systemu machine
learning, który na podstawie informacji zwrotnej nt. spełniania kryteriów wyszukiwania przez
podawane przez niego wyniki będzie uczył się przypisywać branże ogłoszeniom w taki sposób,
w jaki zrobiłby to człowiek. Po rozpoznaniu branży ogłoszenia, ma ono zostać otagowane,
tj. oznaczone znacznikiem odpowiadającym tej branży i pozwalającym na wyszukiwanie
po branżach z katalogu.
Oprócz wyszukiwania po branżach, w analogiczny sposób ma zostać umożliwione wyszukiwanie
po typach projektów realizowanych w ramach poszczególnych projektów, tj. ma następować
tagowanie ogłoszeń następującymi typami: budowa, instalacja, projekt techniczny lub
dokumentacja, dostawa, ew. inne, jeśli w trakcie realizacji projektu powstaną uzasadnione sugestie
na ten temat.
Model biznesowy stojący za wyżej opisanym projektem to serwis internetowy udostępniający
funkcjonalnoś ci systemu w zamian za opłatę abonamentową. Grupę docelową stanowią firmy
uczestniczące w rynku zamó wień́ publicznych.
3
Download