Prezentacja z obrony pracy

advertisement
Artur Ulatowski
Implementacja algorytmu k – najbliższych sąsiadów
jako serwis internetowy
Promotor:
Dr hab. prof. WWSI Michał Grabowski
Wstęp
• Cel Pracy
• Istniejące implementacje
Zagadnienia z dziedziny pracy
•
•
•
•
•
Klasyfikacja
Algorytm uczenia
Walidacja krzyżowa
Nadmierne dopasowanie
Algorytm k-NN
• Odległość
• Parametr k
• Metryka
• Przypadki skrajne
k=3
Przypadki skrajne
k=3
k=3
Architektura aplikacji
 Interfejs użytkownika
• Przeglądarka internetowa
 Serwer WWW
• Serwer PHP
 Baza danych
• Baza MySQL
Interfejs użytkownika
 Zbieranie danych
• Import danych
• Oznaczenie atrybutów
 Funkcje aplikacji
• Kroswalidacja
• Klasyfikacja
Interfejs użytkownika
Oznaczenie atrybutów
Interfejs użytkownika
Klasyfikacja
Interfejs użytkownika
Walidacja krzyżowa
Serwer WWW
 Pliki podstron
 Strony wprowadzania danych
 Strony odbierania danych
 Pliki funkcji
 Funkcje bazy danych
 Funkcje klasyfikacji
 Funkcje kompozycji
 Funkcje sesji
Baza danych
Tabela Sesje
Tabela Atrybuty
Nazwa pola
Typ pola
Nazwa pola
Typ pola
ID
int
IdSesji
int
Klucz
varchar
Numer
int
Data
timestamp
Typ
int
ZnakSeparacji
varchar
Nazwa
varchar
Etap
int
Testy aplikacji
 Istota testów
 Pliki z danymi
• Creddit Approval
• Statlog(Heart)
Wykorzystane metryki
• M1
n
n
s
d   o(ai , bi )  wi
wi 
d  E ( a, b)
a  KL(a ), b  KL(b)
i 1
k 1
k
si
• M2
• M3
d  E ( a, b)  H ( a, b)
• M4
d  E ( a , b)  4 H ( a, b)
Wyniki testów
Dokładność klasyfikacji ( Credit Approval )
Wyniki testów
Dokładność klasyfikacji ( Statlog(Heart) )
Wyniki testów
Wariancja ( Credit Approval )
Wyniki testów
Wariancja ( Statlog(Heart) )
Podsumowanie
Download