DATA MINING

advertisement
w ekonomii, finansach i towaroznawstwie



spotykane określenia: zgłębianie danych,
eksploracyjna analiza danych,
„przekopywanie” danych, „męczenie” danych
proces wykrywania zależności w zbiorach
danych poprzez połączenie metod statystyki i
sztucznej inteligencji (AI) z zarządzaniem
bazami danych
przejście od (obszernych) danych surowych
do wiedzy (Knowledge Discovery in Databases
- KDD)
2






statystyczna analiza wielowymiarowa
uczenie maszynowe (Machine Learning) /
sztuczna inteligencja (AI) / metody obliczeń
miękkich (Soft Computing)
analiza szeregów czasowych
logika matematyczna
metody numeryczne
systemy baz danych (relacyjne bazy danych)
3


eksploracyjny data mining (eksploracyjna
analiza danych, „drążenie danych”)
predykcyjny data mining (konstrukcja modeli
opisujących prawidłowości odkryte w
poprzednim etapie postępowania)
4











sztuczne sieci neuronowe (ANN)
metody sztucznej inteligencji (m. in. algorytmy
genetyczne)
drzewa decyzyjne (metoda RP)
metody logiki rozmytej
metody statystycznej analizy wielowymiarowej
(metoda składowych głównych, analiza kanoniczna,
analiza dyskryminacyjna)
analiza skupień (klasteryzacja)
skalowanie wielowymiarowe / wizualizacja danych
analiza asocjacji i sekwencji
relacyjny data mining
text mining oraz web mining
modele zespołowe / modele hybrydowe
5







podejście modelowe w rozwiązywaniu zagadnienia
podejście konfirmacyjne (statystyka) / podejście
indukcyjne (DM)
zastosowanie metod parametrycznych (statystyka) /
zastoosowanie metod nieparametrycznych (DM)
zastosowanie miar statystycznych dla pomiaru jakości
dopasowania i jakości prognostycznej modelu
weryfikacja dobroci dopasowania modelu w oparciu o
dane, które posłużyły do estymacji modelu (statystyka) /
weryfikacja modelu w oparciu o niezależną próbę testową
(DM)
podejście ilościowe do analizy danych
pośrednia (statystyka) / bezpośrednia (DM) możliwość
optymalizacji modelu w oparciu o kryterium merytoryczne
np. finansowe
6




systemy scoringu kredytowego, fraudowego
(modele zmiennej jakościowej, ANN, SVM, logika
rozmyta)
modele wczesnego ostrzegania np. przed
bankructwem (modele zmiennej jakościowej,
ANN)
Systemy transakcyjne (systemy spekulacyjne
oparte o modele AI, pair trading/ arbitraż
statystyczny, wykrywanie formacji analizy
technicznej, text mining)
grupowanie spółek akcyjnych podobnych na
gruncie analizy fundamentalnej (analiza skupień)
7





wielowymiarowa analiza rozwoju gospodarczego
krajów, regionów i innych jednostek
terytorialnych (analiza skupień, mierniki
syntetyczne, skalowanie wielowymiarowe)
aCRM (segmentacja rynku, marketing
bezpośredni)
wycena nieruchomości, ocena stanu
technicznego nieruchomości
mikroekonometria (modelowanie decyzji
jednostkowych)
modele wczesnego ostrzegania przed kryzysem
walutowym
8




SPC / QC Data Mining (badanie stabilności
statystycznej procesu, wczesne ostrzeganie
przed rozregulowaniem procesu
wieloetapowego)
chemometria (czerpie z metod statystyki
wielowymiarowej)
statystyczne zapewnianie jakości analiz
laboratoryjnych (walidacja parametrów,
kalibracja, analityczne karty kontrolne)
przetwarzanie sygnałów w analizie
instrumentalnej (analiza widmowa)
9




biostatystyka
meteorologia i monitoring stanu powietrza
(np. modele opadu-przepływu,
prognozowanie szczytowego
zanieczyszczenia)
dynamiczne badanie poparcia politycznego
(testowanie występowania procesu o długiej
pamięci ARFIMA)
oraz wiele, wiele innych
10













R – język i środowisko programowania
STATISTICA
gretl
EViews
STATA
SAS
SPSS
MATLAB
Weka
JMulTi
GAUSS
Mplus
inne
11




PMML (Predictive Model Markup Language)
SQL
MQL5 (MetaQuotes Language)/MetaTrader –
dla Algotradingu
LATEX (LeD) – sporządzanie publikacji
12
 DZIĘKUJĘ
ZA UWAGĘ!
13
Download