Data Mining w e-commerce

advertisement
Data Mining w e-commerce
Cz. 2
•
•
•
•
szablony
wyszukiwania reguł asocjacyjnych
generowanie drzewa decyzyjnego
reguły decyzyjne
1. Szablony
•
•
•
•
Szablony: najprotsza forma wzorców
Problem wyszukiwania szablonów
Algorytmy odkrywania szablonów
Zastosowania szablonów
Zbiór danych:szablony
• Obiekty
• Atrybuty
– rzeczywiste
– symboliczne
• System informacyjny
• System decyzyjny
Problemy
•
•
•
•
•
Znaleźć regularne zjawiska w danej tablicy
który szablon jest bardziej interesujący?
Dekompozycja dużych tablic
Odkrywanie charakterystyk
Jak wykrywać szablony dla tablic zachowanych
w bazach danych (SQL, OQL)
Reguły asocjacyjne
• Problem wyszukiwania reguł asocjacyjnych
• Algorytm odkrywania reguł asocjacyjnych
• Zastosowania (katalogi, rozmieszczenie
towarów w sklepie, segmentacja klientów,
diagnoza awarii, itp..)
Drzewa decyzyjne
• Problem generowania optymalnego drzewa
decyzyjnego
• Konstrukcja drzew decyzyjnych
• Zagadnienia praktyczne
• Zastosowanie w problemie klasyfikacji
Dlaczego ?
• Proces klasyfikacji jest efektywny
obliczeniowo
• O ile drzewa nie są zbyt skomplikowane,
reprezentacja ta jest czytelna dla człowieka
• Istnieje łatwa możliwość przejścia od drzew
decyzyjnych do reguł decyzyjnych.ż
Przycinanie drzewa
• zasada krótkiego opisu: skracamy opis
kosztem dokładności klasyfikacji w zbiorze
treningowym
• zastąpienie podrzewa nowym liściem
(przycinanie) lub mniejszym podrzewem.
reguły decyzyjne
• Reguły decyzyjne: prosty opis klas
decyzyjnych
• Problem wyszukiwania reguł decyzyjnych
• Algorytmy generowania reguł decyzyjnych
(Sekwencyjne pokrywanie,Algorytm AQ)
Download