Data Mining w e-commerce Cz. 2 • • • • szablony wyszukiwania reguł asocjacyjnych generowanie drzewa decyzyjnego reguły decyzyjne 1. Szablony • • • • Szablony: najprotsza forma wzorców Problem wyszukiwania szablonów Algorytmy odkrywania szablonów Zastosowania szablonów Zbiór danych:szablony • Obiekty • Atrybuty – rzeczywiste – symboliczne • System informacyjny • System decyzyjny Problemy • • • • • Znaleźć regularne zjawiska w danej tablicy który szablon jest bardziej interesujący? Dekompozycja dużych tablic Odkrywanie charakterystyk Jak wykrywać szablony dla tablic zachowanych w bazach danych (SQL, OQL) Reguły asocjacyjne • Problem wyszukiwania reguł asocjacyjnych • Algorytm odkrywania reguł asocjacyjnych • Zastosowania (katalogi, rozmieszczenie towarów w sklepie, segmentacja klientów, diagnoza awarii, itp..) Drzewa decyzyjne • Problem generowania optymalnego drzewa decyzyjnego • Konstrukcja drzew decyzyjnych • Zagadnienia praktyczne • Zastosowanie w problemie klasyfikacji Dlaczego ? • Proces klasyfikacji jest efektywny obliczeniowo • O ile drzewa nie są zbyt skomplikowane, reprezentacja ta jest czytelna dla człowieka • Istnieje łatwa możliwość przejścia od drzew decyzyjnych do reguł decyzyjnych.ż Przycinanie drzewa • zasada krótkiego opisu: skracamy opis kosztem dokładności klasyfikacji w zbiorze treningowym • zastąpienie podrzewa nowym liściem (przycinanie) lub mniejszym podrzewem. reguły decyzyjne • Reguły decyzyjne: prosty opis klas decyzyjnych • Problem wyszukiwania reguł decyzyjnych • Algorytmy generowania reguł decyzyjnych (Sekwencyjne pokrywanie,Algorytm AQ)