Modele nienadzorowanego grupowania obiektów technicznych z

advertisement
MODELE NIENADZOROWANEGO GRUPOWANIA OBIEKTÓW TECHNICZNYCH
Z WYKORZYSTANIEM METOD INTELIGENCJI OBLICZENIOWEJ
RAFAŁ BONIECKI, MIROSŁAW MICIAK, ROMAN WIATR
Streszczenie
W artykule przedstawiono proces monitorowania i okrelania stanu maszyn,
który jest wanym obszarem zastosowa komercyjnych, a take bada naukowych,
majcym m.in. zastosowanie w systemach komputerowego sterowania
i nadzorowania. Głównym celem pracy jest selekcja informacji istotnych
z wykorzystaniem szeregu symptomów obiektu technicznego, które mog mie róny
charakter (składowe wolno i szybkozmienne, w tym losowe). W opracowaniu
zaproponowano przyjcie modelu ilociowego z wykorzystaniem parametrów
otrzymanych na etapie sporzdzania wizualizacji stanu technicznego maszyny
(obiektu).
Słowa kluczowe: okrelenie stanu maszyn, redukcja informacji diagnostycznej, inteligencja
obliczeniowa
1. Wprowadzenie
Dane eksploatacyjno-pomiarowe czsto charakteryzuj si du wymiarowoci (ang. highdimensional data sets), która staje si istotnym problemem podczas analizy. Definiujc pojcie
wysokiej wymiarowoci mamy na myli to, e poszczególne zbiory danych (np. dane pomiarowe
odpowiadajce poszczególnym stanom eksploatacyjnym) posiadaj du ilo
atrybutów
(zmiennych). W praktyce czsto okazuje si jednak, e wiele z tych atrybutów jest ze sob dosy
mocno skorelowanych i do otrzymania pełnego obrazu stanu opisywanego urzdzenia, czy
zauwaenia pewnych prawidłowoci (lub nieprawidłowoci) w obiektu, wystarczy uwzgldni
jedynie niewielki ich podzbiór. Pomimo, e istnieje szereg metod analizy stanów obiektów
technicznych, okrelenie zdatnoci obiektu przy analizowaniu wszystkich symptomów jest zwykle
albo niemoliwe, albo bardzo trudne do uzyskania. Sporód wielu zada, które definiuje si
wdziedzinie eksploatacji maszyn, due znaczenie maj wic te, które pozwalaj zredukowa
wymiarowo
zbioru symptomów. W wielu wypadkach najwiksze zastosowanie znajduj metody
nalece do grupy metod nienadzorowanych. Oznacza to, e wiedza (ang. knowledge), któr
uzyskujemy analizujc dane, powstaje niejako samorzutnie. Jest tak, gdy nie dysponujemy
adnymi danymi wzorcowymi (treningowymi), które mogłyby posłuy
do wycignicia
wniosków dotyczcych analizowanych danych. Takim klasycznym przykładem metody
nienadzorowanej jest grupowanie danych. Poprzez analiz metodami statystycznymi zalenoci
pomidzy danymi, wyciga
mona wnioski co do podobiestwa pewnych grup danych. Z kolei
klasycznym przykładem metody nadzorowanej jest klasyfikacja. Dysponujc wzorcowymi
36
Rafał Boniecki, Mirosław Miciak, Roman Wiatr
Modele nienadzorowanego grupowania obiektów technicznych
z wykorzystaniem metod inteligencji obliczeniowej
danymi, o których wiemy do jakiej grupy nale (czyli jak s zaklasyfikowane), mona
stosunkowo prosto i wiarygodnie wycign
wnioski co do klasyfikacji pozostałych danych.
Proces klasyfikacji stanu obiektu technicznego okrela klas przynalenoci na podstawie
dostpnej informacji jakociowej. W niniejszym opracowaniu zaproponowano model klasyfikatora
w oparciu o statystyczn informacj maszyny (uzyskiwan na etapie sporzdzania wizualizacji
parametrów obiektu w postaci regresji) z wykorzystaniem metod uczenia rónorodnoci
topologicznych.
W zwizku z tym na proces klasyfikacji realizowany w zaproponowanym modelu, składa
si
bd nastpujce etapy:
• pozyskiwanie i selekcja cech,
• redukcja wymiarowoci,
• klasyfikacja.
2. Pozyskiwanie i selekcja informacji o obiekcie technicznym
Naley te zauway
, e pozyskiwanie i selekcja informacji na temat obiektu technicznego
moe by
ukierunkowana bd na wykorzystanie w analizach eksperckich, bd do dalszego
przetwarzania ilociowego. Dla potrzeb analiz eksperckich wany jest dobór reprezentacji szeregu
symptomów, z uwzgldnieniem przebiegów poszczególnych regresji i ewentualnym
wyodrbnieniem charakterystycznych wzorców. W odniesieniu do szeregów informacyjnych
zawierajcych parametry stanu maszyn metody takie s szeroko rekomendowane jako tzw. analiza
techniczna. Wykorzystuje si tu proste metody analiz ilociowo-jakociowych sygnałów, takie jak
m.in. wizualizacja rednich ruchomych (metoda trzech rednich, gdzie badana jest relacja rednich
obliczonych w oknach o rónych szerokociach), analiza okresowoci, wyodrbnianie segmentów
szeregu o charakterystycznych, powtarzalnych kształtach (tzw. formacji).
Natomiast w analizach ilociowych składowe szeregów informacyjnych s poddawane
dalszemu przetwarzaniu, jako oddzielne sygnały diagnostyczne (tzw. analiza wielorozdzielcza).
Mog by
one ukierunkowane na badanie współzalenoci o charakterze deterministycznym
ilosowym badanych zjawisk reprezentowanych szeregami informacyjnymi.
Proces przetwarzania danych pochodzcych z obiektu technicznego sprowadza si do
wyselekcjonowania istotnych symptomów z punktu zadania klasyfikacji, czsto utosamiany jest
w teorii informacji z procesem odkrywania cech. Zatem odkrywanie cech (ang. Feature Extraction,
FE) jest technik okrelania nowego zbioru cech (ang. features) analizowanej rzeczywistoci na
potrzeby budowy modelu teje rzeczywistoci. Znalezione cechy s w pewnym sensie nowymi
abstrakcyjnymi ródłami danych. S one jednoczenie pewnymi kombinacjami (czsto liniowymi)
oryginalnych atrybutów zbioru danych. Jest to wic z pewnoci metoda redukujca wymiarowo
pierwotnego zadania. Metoda FE okrela równie (w postaci wartoci liczbowej) w jakim stopniu
oryginalne atrybuty wpływaj na wyliczon cech, czyli jaka jest ich warto
informacyjna. Nowe
cechy z reguły nie maja jasnej interpretacji fizycznej. S jednak uyteczne przy wizualizacji zbioru
danych na przykład w dwóch lub trzech wymiarach. Czsto metoda FE uywana jest równie jako
wstpna obróbka danych na potrzeby innych zada klasyfikacyjnych. Z pewnoci jednak
najwiksz zalet metody FE jest moliwo
interpretacji zadaniowej okrelonych cech.
Moliwoci interpretacyjne s ju cech systemu klasyfikacyjnego stan urzdzenia a nie metody
FE jako takiej. Przykładowo, łatwo przypisa
wyliczone cechy poszczególnym przypadkom
37
Studies & Proceedings of Polish Association for Knowledge Management
Nr 49, 2011
punktom czasowym odpowiadajcym poszczególnym stanom analizowanego obiektu.
Uzyskujemy wic pewien podział pierwotnych danych na grupy (tzw. klastry), lub te dokona
filtracji pewnych symptomów. Moemy wtedy analizowa
znalezione cechy jedynie poprzez
wartoci pozostałych po filtracji.
Natomiast selekcja cech (ang. Feature Selection, FS) jest technik okrelania istotnoci
atrybutów pierwotnego zbioru danych (tak zwane atrybuty predykcyjne (ang. predictive attributes)
na potrzeby przewidywania wartoci wybranego atrybutu celu (ang. target attribute). Chodzi wic
o wybór z duej liczby atrybutów tych z nich, które posiadaj istotn dla danego zadania (tu:
predykcji) warto
. Przykładowo, interesuje nas, które z dostpnych w pierwotnym zbiorze danych
atrybutów opisujcych klienta firmy najbardziej wpływaj na nisk aktywno
klienta
wkorzystaniu z nowych usług firmy. W metodach FS istotny jest fakt, e uzyskane wyniki silnie
zale od wyboru atrybutów predykcyjnych. W praktyce nie zawsze bdziemy wybierali wszystkie
dostpne atrybuty, pomijajc z oczywistych wzgldów atrybuty niemogce wpływa
na atrybut
celu lub wiadomie rezygnujc z uwzgldniania który z nich. Ponadto, dodanie do zbioru danych
nowego atrybutu predykcyjnego (np. wczeniej nieuwzgldnionego w analizie) moe w jego
obecnoci zupełnie zmieni
wczeniej wyliczone wanoci atrybutów.
Rozwizanie powyszych zada odbywa si czsto z wykorzystaniem technik korelacyjnych,
transformaty Karhunena-Loevego i analizy składowych głównych PCA (ang. Principal
Components Analysis), a take techniki eksploracji danych (do tej grupy zaliczane s m.in.
metody oparte na zastosowaniu miar odległoci, okrelanych te miarami odmiennoci szeregów).
Zatem zastosowanie nowoczesnych technik informatycznych pozwala na implementacj
złoonych metod przetwarzania szeregów informacyjnych. Implementowane s mechanizmy
klasyczne oraz adaptacyjne, udoskonalone czsto metodami tzw. inteligencji obliczeniowej,
eksplorujce rónorodne paradygmaty. Wiele algorytmów wymaga arbitralnego dostrajania
parametrów. Algorytmy takie, wykorzystujce analityczne oraz neuronowe techniki identyfikacji,
grupowania i klasyfikacji, systemy ekspertowe, w tym metody zaliczane do tzw. nowej inynierii,
maj zastosowanie bezporednie (np. detekcja anomalii umoliwiajca wykrycie awarii
urzdzenia) bd porednie, ukierunkowane na przetwarzanie danych wejciowych w celu
wygenerowania sygnału diagnostycznego, stanowicego sygnał wejciowy innych metod
przetwarzania, jak np. kompresji danych, czy redukcji wymiarowoci. Zatem istotnym elementem
procesu selekcji informacji jest eliminacja mniej istotnych cech szeregu informacyjnego,
pozwalajca na skuteczniejsz ocen najbardziej istotnych cech badanych obiektów.
W opracowaniu zaproponowano przyjcie modelu ilociowego z wykorzystaniem parametrów
otrzymanych na etapie sporzdzania wizualizacji stanu technicznego maszyny (obiektu). Zatem
dane reprezentowane s w postaci m wymiarowych wektorów dla n symptomów tworzc n×m
wymiarow przestrze topologiczn T. Zatem obiekt techniczny bdzie reprezentowany za
pomoc rónorodnoci topologicznej R osadzonej w T.
38
Rafał Boniecki, Mirosław Miciak, Roman Wiatr
Modele nienadzorowanego grupowania obiektów technicznych
z wykorzystaniem metod inteligencji obliczeniowej
3. Analiza i redukcja wymiarowoĞci danych pomiarowych
Metody inteligencji obliczeniowej w ostatnich latach wykorzystywane s coraz czciej do
zwikszenia skutecznoci mechanizmów ju istniejcych (klasycznych). Generalnie daje si
zauway
dwa stosowane podejcia. Pierwsze opiera si na narzdziowym wykorzystaniu danej
metody ze wzgldu na własnoci, charakterystyk, szybko
działania czy rodzaj uzyskiwanych
wyników. Drugie podejcie zwizane jest z wykorzystaniem analogii zadania detekcji zdarze do
innych zjawisk, w szczególnoci spotykanych w naturze. Podejcie to ma zastosowanie dla
zwikszania skutecznoci działania mechanizmów klasycznych, a take wpływa na efektywniejsze
wykorzystanie mocy obliczeniowych powszechnie dzi dostpnych komputerów (m.in. poprzez
rozpraszanie
oblicze,
zastosowanie
architektury
klastrowej/gridowej).
Jednym
zwykorzystywanych paradygmatów jest podejcie immunologiczne, którego załoenia
imechanizmy znajduj take odwzorowanie w przetwarzaniu sygnałów oraz detekcji zdarze
wszeregach czasowych.
Z punktu widzenia niniejszego opracowania szczególn rol odgrywa analiza symptomów
obiektu technicznego. Mona oczekiwa
, e w tych parametrach znajduj odzwierciedlenie nagłe
zdarzenia jakociowe zewntrzne, zarówno incydentalne (ujawniajce si w postaci
krótkotrwałych anomalii), jak i te powodujce długoterminowe skutki. Dla takich sygnałów
prowadzone s analizy diagnostyczne zmierzajce do detekcji zdarze. Analizy te mog by
prowadzone zarówno w dziedzinie czasu oraz czstotliwoci.
Okazuje si, e analiza danych otrzymanych w procesie wizualizacji moe okaza
si
problematyczna ze wzgldu na bardzo du ilo
informacji. Poniewa czsto okazuje si, e wiele
atrybutów opisujcych rzeczywiste dane (obiekty) jest ze sob powizanych (skorelowanych).
Dlatego do otrzymania obrazu rozpatrywanego obiektu, czy zauwaenia pewnych prawidłowoci
w danych, naley jedynie uwzgldni
niewielki ich podzbiór lub te na bazie oryginalnych
atrybutów wygenerowa
nowy zestaw (dokona
agregacji). W zwizku z tym stosuje si proces
redukcji wymiarowoci, który zwykle wie si z utrat pewnej iloci informacji. Dy si wic do
ustalenia takiego stopnia redukcji wymiarów, aby wspomniana strata nie wpływała na rezultat
działania danego systemu (np. klasyfikacji). Mona zatem przyj
, e istnieje pewna, tzw.
wewntrzna wymiarowo
(ang. intrinsic dimensionality), mniejsza ni oryginalna, która
gwarantuje, e dane po zredukowaniu bd niosły ze sob te same informacje, które zawierały
dane pierwotne.
Do rozwizania tego problemu zaproponowano techniki nazywane globalnymi metodami
redukcji wymiarowoci; s to algorytmy, które staraj si zachowa
globalne właciwoci danych
(podobnie jak w metodach PCA i LDA), ale s zdolne do identyfikacji nieliniowych transformacji
midzy wysoko-wymiarowymi danymi wejciowymi i ich odpowiednikami reprezentacji niskowymiarowych
Zadanie redukcji wymiarowoci mona zdefiniowa
w nastpujcy sposób. Załómy, e dana
jest macierz X składajc si z N wektorów x, D-wymiarowych, i e ten zestaw danych posiada
wewntrzn wymiarowo
d (gdzie d<D, bardzo czsto nawet d<<D). W pojciu geometrycznym,
wewntrzna wymiarowo
oznacza, e punkty zbioru X le na lub w pobliu rozmaitoci
topologicznej o wymiarowoci d, która jest osadzona w przestrzeni D wymiarowej.
Zagadnienie rozmaitoci topologicznej (ang. manifold), utosamiane czciej jako rozwinicie
pojcia powierzchni w wikszej liczbie wymiarów, mona równie zdefiniowa
formalnie jako
39
Studies & Proceedings of Polish Association for Knowledge Management
Nr 49, 2011
przestrze topologiczn M, w której dla kadego punktu istnieje otoczenie otwarte,
homeomorficzne z przestrzeni kartezjask Rd dla pewnego d⊂D. Natomiast liczb d, tak sam
dla wszystkich punktów x⊂D, nazywa si wymiarem rozmaitoci definiowanej jako wewntrzny
wymiar. Przykładem rozmaitoci topologicznej o wymiarze d=2 jest kula.
Metody redukcji wymiarowoci przekształcaj zbiór X w nowy zbiór danych Y
zwymiarowoci d. Naley jednak zaznaczy
e w procesie tym ani geometria M, ani ID zbioru
danych X, nie s dokładnie znane. W zwizku z tym redukcja wymiarowoci jest problemem,
który moe by
rozwizany jedynie przy załoeniu pewnych właciwoci danych (takich, jak np.
oszacowanie wewntrznej wymiarowoci danych). Metody redukcji wymiarowoci mona
podzieli
na nastpujce grupy:
• tradycyjne metody liniowe,
• globalne metody nieliniowe,
• lokalne metody nieliniowe,
• metody kombinowane.
Metody okrelane jako tradycyjne liniowe s ju znane w statystyce od pocztku 20 wieku.
Do tej grupy nale min. Analiza składowych głównych (ang. Principal Components Analysis),
PCA (znana te jako transformacja Karhunena-Loevego) oraz liniowa analiza dyskryminacyjna
LDA (znana równie jako odwzorowanie Fishera).
Analiza głównych składowych (ang. Principal Component Analysis) polega na ortogonalnym
przekształceniu n-wymiarowego układu zmiennych, opisujcych właciwoci danego obiektu lub
zjawiska, na nowy układ zmiennych nieskorelowanych, tzw. głównych składowych, o wymiarze
mniejszym od n. Zmniejszenie wymiaru przestrzeni cech oraz ich uporzdkowanie na podzbiory
(główne składowe) umoliwia graficzn interpretacj relacji badanych zmiennych oraz pozwala
okreli
ich istotno
. Składowe generowane s kolejno tak, aby wyjani
jak najwicej zmiennoci w zbiorze danych oraz tak, aby były jak najmniej skorelowane z innymi czynnikami. Ze
wzgldu na redukcj zmiennych opisujcych obserwacje, ułatwia to np. okrelenie podobiestw
midzy przypadkami.
Reprezentacja stanu obiektu za pomoc zbioru jego charakterystycznych cech (właciwoci)
jest czsto stosowan technik w systemach diagnozowania. Cechy tworz n-wymiarow przestrze, w której kada współrzdna reprezentuje pewny symptom. Tak wic obiekt techniczny
mona przedstawi
za pomoc wektora:
X = [X 1
T
X 2 ... X n ]
(1)
który jest przedstawiany jako punkt w przestrzeni cech, jeeli X ma rozkład gaussowski, to
mona zapisa
za pomoc równania:
(2)
W zwizku z powyszym mona znale
jednowymiarow reprezentacj x' połoon w bliskiej odległoci od x tak, e:
(3)
40
Rafał Boniecki, Mirosław Miciak, Roman Wiatr
Modele nienadzorowanego grupowania obiektów technicznych
z wykorzystaniem metod inteligencji obliczeniowej
przy czym miara odległoci okrelana jest przez błd rednio kwadratowy
(4)
Optymaln aproksymacj losowego wektora X za pomoc linowej kombinacji niezalenych
wektorów mona uzyska
przez projekcj losowego wektora X na wektory własne odpowiadajce
najwikszym wartociom własnym macierzy kowariancji. Na diagonalnej macierzy kowariancji
wystpuj wariancje składowych wektora losowego, natomiast na pozostałych pozycjach
kowariancje midzy nimi.
Liniowa analiza dyskryminacyjna dy do znalezienia liniowego podziału danych nalecych
do rónych klas. LDA jest uywania w uczeniu maszynowym (system uczcy si wykorzystuje
zewntrzne dane empiryczne w celu tworzenia i aktualizacji podstaw dla udoskonalonego
działania na podobnych danych w przyszłoci oraz wyraania tych podstaw w zrozumiałej
isymbolicznej postaci) do znalezienia liniowej kombinacji cech, które najlepiej rozróniaj dwie
lub wicej klas obiektów lub zdarze. Wynikowe kombinacje s uywane jako klasyfikator
liniowy, lub czciej, słu redukcji liczby wymiarów do póniejszej klasyfikacji statystycznej.
Wodrónieniu od wikszoci innych technik redukcji wymiarowoci, LDA jest metod
nadzorowan. Metoda ta poszukuje liniowego odwzorowania M, które umoliwia uzyskanie
maksymalnej separowalnoci klasy w niskowymiarowej reprezentacji danych. Kryteria, które s
wykorzystywane do formułowania liniowej separowalnoci poszczególnych klas, to miary
dyskryminacji, czyli rozproszenia wewntrz-klasowego oraz rozproszenia midzy-klasowego.
Zatem znajdujemy optymalny stosunek miary rozproszenia w niskowymiarowej reprezentacji
danych (tzw. kryterium Fishera), dc do maksymalizacji rozproszenia midzyklasowego
iminimalizacji rozproszenia wewntrzklasowego:
(5)
gdzie T – transformacja liniowa przekształcajca nasz przestrze w przestrze
ozredukowanym wymiarze, TTSwT oraz TTSbT – odpowiednie macierze rozproszenia w przestrzeni
o zredukowanym wymiarze.
Mona udowodni
, e kolumny T s pierwszymi C wektorami własnymi odpowiadajcymi
najwikszym wartociom własnym dla nastpujcego uogólnionego zagadnienia własnego:
(6)
Jeli macierz Sw jest nieosobliwa, to mona to zagadnienie sprowadzi
do zwykłego symetrycznego zagadnienia własnego. Poniewa Sw jest wtedy rzeczywista symetryczna i dodatnio
okrelona, to stosujc algorytm dekompozycji SVD otrzymujemy:
(7)
gdzie U – macierz unitarna, a D – diagonalna z dodatnimi wartociami na diagonali.
Zatem zadanie sprowadza si do:
41
Studies & Proceedings of Polish Association for Knowledge Management
Nr 49, 2011
(8)
co sprowadza si do:
(9)
W zwizku z powyszym otrzymujemy zagadnienie własne z macierz symetryczn
nieujemnie okrelon, które moemy rozwiza
za pomoc rozkładu SVD.
Inn grup metod redukcji wymiarowoci stanowi techniki nazywane globalnymi; s to
algorytmy, które staraj si zachowa
globalne właciwoci danych (podobnie jak w metodach
PCA i LDA), ale s zdolne do identyfikacji nieliniowych transformacji midzy wysokowymiarowymi danymi X i ich odpowiednikami reprezentacji nisko-wymiarowych Y.
Metoda skalowania wielowymiarowego (MDS) jest zbiorem technik nieliniowego
odwzorowania wysoko-wymiarowej reprezentacji danych X do reprezentacji nisko-wymiarowej Y
przy jak najwikszym zachowaniu odległoci midzy parami punktów danych. Jako
odwzorowania jest wyraana za pomoc funkcji stresu (ang. stress function), czyli miar błdu
odległoci midzy parami w nisko-wymiarowych i wysoko-wymiarowej reprezentacji danych.
Wimplementacjach algorytmów MDS na ogół spotyka si dwie postacie funkcji, posta
ogólna
(ang. raw stress function) i w postaci funkcji kosztu Sammona. Pierwsza z nich jest definiowana
przez:
(10)
gdzie ||xi-xj|| jest odległoci euklidesowa midzy punktami danych xi i xj w przestrzeni danych
wejciowych, ||yi-yj|| jest odległoci euklidesowa midzy punktami danych yi i yj w reprezentacji
danych wyjciowych. Natomiast funkcja kosztu Sammona jest wyraona przez:
(11)
Funkcja kosztów Sammona róni si od funkcji w postaci ogólnej tym, e kładzie wikszy
nacisk na zachowanie odległoci. Minimalizacja funkcji stresu moe by
przeprowadzona przy
uyciu metod takich, jak dekompozycja własna (ang. eigencomposition) macierzy, metoda
gradientu sprzonego lub metoda pseudo-Newtona.
Kolejn technik nieliniowej redukcji wymiarowoci jest metoda okrelana w literaturze jako
stochastyczna blisko
osadzenia (eng. Stochastic Proximity Embedding) (SPE); jest to iteracyjny
algorytm minimalizacji ogólnej funkcji stresu. Rozwizanie to róni si od wczeniej
przedstawionego skalowania wielowymiarowego podejciem do szacowania lokalnych przestrzeni
42
Rafał Boniecki, Mirosław Miciak, Roman Wiatr
Modele nienadzorowanego grupowania obiektów technicznych
z wykorzystaniem metod inteligencji obliczeniowej
(euklidesowych) w nisko-wymiarowej reprezentacji danych. Dla metody SPE ogólna funkcja
stresu moe by
przedstawiona w postaci:
(12)
gdzie r jest miar bliskoci midzy punktami xi oraz yi w wysoko-wymiarowej przestrzeni danych
i jest dana wzorem:
(13)
natomiast d jest odległoci euklidesow midzy ich odpowiednikami yi oraz yj w przestrzeni
nisko-wymiarowej. Algorytm ten w głównej mierze kładzie nacisk na zachowanie odległoci
wssiedztwie grafu N okrelonego na danych, ustawiajc d i r na 0. Jest to podejcie
przypominajce techniki z zastosowaniem ssiedztwa grafów.
Natomiast w metodzie Isomap odległoci midzy punktami danych oblicza si, tworzc graf
ssiedztw, w którym kady punkt danych zwizany jest z najbliszymi ssiadami zbioru.
Najkrótsza droga midzy dwoma wierzchołkami grafu tworzy oszacowanie geodezyjnej odległoci
midzy tymi punktami. Zadanie to mona wykona
stosujc algorytm Dijkstry lub Floyda. W ten
sposób wyznacza si macierz odległoci dla wszystkich punktów danych. Nastpnie reprezentacja
nisko-wymiarowa punktów obliczana jest z zastosowaniem skalowania wielowymiarowego
zuwzgldnieniem wczeniej utworzonej macierzy odległoci:
(14)
gdzie:
(15)
oraz:
(16)
Metoda maksymalnej wariancji rozkładu (ang. Maximum Variance Unfolding) (MVU), podobnie jak poprzednia, okrela graf ssiedztwa danych, lecz tym co odrónia j od Isomap jest
denie do swoistego rozwijania płaszczyzn topologicznych. Realizuje to poprzez maksymalizacj
euklidesowej odległoci pomidzy punktami danych, w ramach ograniczenia, e odległoci w grafie ssiedztwa pozostaj niezmienione (tj. lokalna geometria płaszczyzny topologicznej danych nie
moe by
zniekształcona). Powstały problem optymalizacji mona skutecznie rozwiza
przy zastosowaniu programowania pół-okrelonego (ang. Semidefinite Programming lub te ang. Semidefinite Embedding) (SDP)(SDE). Algorytm rozpoczyna działanie od budowy grafu ssiedztw,
43
Studies & Proceedings of Polish Association for Knowledge Management
Nr 49, 2011
w którym kady punkt danych jest połczony do najbliszych ssiadów. Nastpnie dokonywana
jest próba maksymalizacji sumy kwadratów odległoci euklidesowej midzy wszystkimi punktami
danych, pod warunkiem zachowania odległoci w obrbie grafu. Inaczej mówic, metoda MVU
wykonuje nastpujce zadanie optymalizacji:
(17)
przy czym:
(18)
Zatem metoda MVU formułuje problem optymalizacji jako problem (SDP), przez zdefiniowanie macierzy K, która jest przestrzeni unitarn reprezentacji danych. W zwizku z tym, pod
warunkiem:
(19)
i ostatecznie reprezentacja nisko-wymiarowa moe by
wyznaczona na podstawie:
(20)
Dla danych pomiarowych przedstawionych w tabeli 1 przeprowadzono redukcj wymiarowoci metod MDS; wyniki przedstawiono w tabeli 2.
Tabela 1. Dane obiektu S 266_1
Kod_Obiektu Czas pracy Stan
S266_1
87372
S266_1
88300
S266_1
89160
S266_1
92570 S59
S266_1
93670
S266_1
94530
S266_1
96180
S266_1
100101 S60
S266_1
102740
S266_1
109800
S266_1
110755 S61
S266_1
111790
S266_1
112312
S266_1
113131
S266_1
114419
CO
CO2
347,33 1,45
386,60 1,76
339,57 1,42
371,13 1,53
181,50 1,49
400,07 1,48
353,53 1,33
508,47 1,95
471,77 1,31
523,30 1,52
461,50 1,74
423,13 1,44
409,00 1,51
478,30 1,58
401,90 1,53
NO
157,23
188,37
168,43
143,83
175,53
152,20
128,40
100,67
119,97
142,10
176,57
126,17
124,20
157,00
163,63
NO2
73,27
72,20
73,90
82,70
79,73
85,07
69,57
60,63
53,77
21,00
75,80
68,00
60,00
74,63
61,00
NOx CxHx Dym
210,53 0,01 1,34
260,57 0,03 1,42
242,33 0,07 1,24
226,53 0,11 1,28
215,27 0,11 1,36
227,27 0,24 1,42
197,97 0,76 1,41
151,32 0,76 1,47
163,73 0,53 1,66
163,10 1,92 1,57
252,37 1,31 1,89
194,17 1,70 2,54
184,20 1,52 2,24
231,63 5,53 1,42
224,63 2,26 3,69
44
Rafał Boniecki, Mirosław Miciak, Roman Wiatr
Modele nienadzorowanego grupowania obiektów technicznych
z wykorzystaniem metod inteligencji obliczeniowej
Tabela 2. Reprezentacja danych obiektu S 266_1 w przestrzeni dwuwymiarowej metod MDS
Lp.
Kod_Obiektu Czas pracy Stan
1 S266_1
87372
2 S266_1
88300
3 S266_1
89160
4 S266_1
92570 S59
5 S266_1
93670
6 S266_1
94530
7 S266_1
96180
8 S266_1
100101 S60
9 S266_1
102740
10 S266_1
109800
11 S266_1
110755 S61
12 S266_1
111790
13 S266_1
112312
14 S266_1
113131
15 S266_1
114419
X
-0,32
0,23
-0,03
-0,25
-0,08
-0,14
0,01
-0,13
0,45
0,01
0,02
0,38
0,41
-0,32
-0,35
Y
0,33
0,13
0,04
-0,34
-0,13
-0,4
-0,06
0,22
-0,47
0,06
0,36
0,2
-0,16
-0,14
-0,31
0.5
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0.4
0.3
0.2
0.1
0
-0.1
-0.2
-0.3
-0.4
-0.5
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
Rysunek 1. Reprezentacja nisko-wymiarowa danych obiektów S 266_1 (Tabela 2)
45
Studies & Proceedings of Polish Association for Knowledge Management
Nr 49, 2011
Tabela 3. Reprezentacja parametrów (symtomów) obiektu S 266_1
uzyskana za pomoc metody MDS
Kod_Obiektu Czas pracy Stan
S266_1
x
x
CO
CO2
NO
NO2
NOx
CxHx Dym
1
2
3
4
5
6
7
-1126,96 460,48 -98,97 200,46 -340,65 462,17 459,68
-181,13 43,02 -92,83 62,76 73,12 38,18 44,73
100
1
2
3
4
50
5
6
7
0
-50
-100
-150
-200
-1200
-1000
-800
-600
-400
-200
0
200
400
600
Rysunek 2. Reprezentacja nisko-wymiarowa symptomów obiektu S 266_1 (tabela 3)
3. Klasyfikacja
W opracowaniu zaproponowano złoony liniowy model klasyfikatora stanu maszyny,
opierajcy swoje działanie na technikach eksploracji danych oraz metodach grupowania danych.
Ze wzgldu na to, e uzyskiwane parametry informacyjne (symptomy) obiektu technicznego s
utosamiane z szeregami czasowymi, analiza wieloczynnikowa wydaje si by
odpowiedni
technik zastosowan w etapie podejmowania decyzji o klasie stanu maszyny.
Naley zauway
, e przeprowadzenie procesu redukcji wymiarowoci pozwoli na okrelenie
połoenia poszczególnych klas stanu obiektu (tzw. klasteryzacja) w nowej reprezentacji danych.
Realizacja bada laboratoryjnych pozwoli na okrelenie kryteriów podziału przestrzeni niskowymiarowej na podstawie budowy tzw. systemu eksperckiego. Wtedy bdzie moliwe równie
okrelenie odległoci wewntrz-klasowej oraz odległoci midzy-klasowej. Na podstawie tych
danych bdzie mona ostatecznie dokona
procesu klasyfikacji. W zaproponowanym rozwizaniu
klasyfikacja reprezentacji nisko-wymiarowej jest dokonywana na podstawie algorytmu NN
46
Rafał Boniecki, Mirosław Miciak, Roman Wiatr
Modele nienadzorowanego grupowania obiektów technicznych
z wykorzystaniem metod inteligencji obliczeniowej
najbliszych ssiadów (ang. Nearest Neighbor). W procesie rozpoznawania pojawia si nowa
obserwacja (reprezentacja nisko-wymiarowa), której przypisanie do okrelonej klasy jest nieznane.
Okrelenie zbioru uczcego moliwe bdzie po przeprowadzeniu bada stanowiskowych
ieksploatacyjnych, które pozwol na akwizycj danych w postaci macierzy obserwacji: symptom
diagnostyczny – stan oraz symptom diagnostyczny – czas eksploatacji maszyny. Tworzy si w ten
sposób macierz X1 danych nalecych do klasy 1 (układy maszyny zdatne). Nastpnie
wprowadzajc kolejne rozregulowania i uszkodzenia, dokonuje si rejestracji zmian wartoci
parametrów diagnostycznych dla układów maszyn (zespołów) niezdatnych i zdatnych zadaniowo,
tworzc macierze X2, X3 itd., którym odpowiadały konkretne uszkodzenia, odpowiedzialne za
macierz obserwacji.
Alternatywny proces klasyfikacyjny jest realizowany za pomoc wielowarstwowej sztucznej
sieci neuronowej LTF-C (ang. Local Transfer Function Classifier), która jest przeznaczona
wszczególnoci do zada klasyfikacyjnych. Jej architektura zbliona jest do sieci radialnych
(RBF). Składa si ona z dwóch warstw neuronów. Pierwsza warstwa (tzw. ukryta) zawiera
neurony ogaussowskiej funkcji transferu, które wykrywaj w danych treningowych skupiska
wzorców z tej samej klasy. Kady neuron tej warstwy ma przypisan klas, której skupisko stara
si wykry
. Drug warstw tworz neurony liniowe, które segreguj odpowiedzi neuronów
ukrytych według przypisanych klas i sumuj je, formułujc ostateczn odpowied sieci.
Zaproponowana sie
na podstawie przeprowadzonych bada okazuje si by
skuteczniejsza
od metod najbliszego ssiada czy te nawet od techniki k-najbliszych ssiadów.
Redukcja wymiarowoci jest bardzo wanym elementem statystycznej analizy danych
pomiarowych oraz analiz wykonywanych w ramach szeroko pojtej eksploracji danych. Dziki
redukcji wymiarowoci osigamy nie tylko to, e mamy do przeanalizowania po prostu mniej
danych. Najwaniejsze jest mimo wszystko to, e dane po zredukowaniu pokazuj nam
niejednokrotnie wicej informacji, ni przed redukcj. Wiele zalenoci staje si bardziej
czytelnych i zmniejsza si prawdopodobiestwo ich przeoczenia. Bardzo czsto bowiem jest tak,
e ilo
posiadanych danych przerasta nas i bardzo łatwo wówczas pogubi
si w ich analizie.
Oczywicie, nie wszystkie dane naley automatycznie i bez zastanowienia redukowa
. Warto
jednak zawsze rozway
tak moliwo
.
47
Studies & Proceedings of Polish Association for Knowledge Management
Nr 49, 2011
Bibliografia
[1] M.S. Venkatarajan, W. Braun. New quantitative descriptors of amino acids based on
multidimensional scaling of a large number of physicalchemical properties. Journal of
Molecular Modeling, 7(12):445–453, 2004 r.
[2] C. Faloutsos, K.-I. Lin. FastMap: A fast algorithm for indexing, data-mining and
visualization of traditional and multimedia datasets. In Proceedings of the 1995 ACM
SIGMOD International Conference on Management of Data, s. 163–174, New York, USA,
1995 r.
[3] J.B. Tenenbaum. Mapping a manifold of perceptual observations. In Advances in Neural
Information Processing Systems, vol. 10, s. 682–688, Cambridge, USA, 1998 r.
[4] J.B. Tenenbaum, V. de Silva, J.C. Langford. A global geometric framework for nonlinear
dimensionality reduction. Science, vol. 290, s. 2319–2323, 2000 r.
[5] T. Pełech-Pilichowski, Adaptacyjne algorytmy zdarze w szeregach czasowych, AGH, 2009
r.
[6] K. Torkkola. Linear discriminant analysis in document classification. In IEEE ICDM-2001
Workshop on Text Mining, s. 800–806, 2001 r.
[7] T. Cox, M. Cox. Multidimensional scaling. Chapman and Hall, London, UK, 1994 r.
[8] J.B. Kruskal. Multidimensional scaling by optimizing goodness of fit to a nonmetric
hypothesis. Psychometrika, vol. 29, s. 1–27, 1964 r.
48
Rafał Boniecki, Mirosław Miciak, Roman Wiatr
Modele nienadzorowanego grupowania obiektów technicznych
z wykorzystaniem metod inteligencji obliczeniowej
UNATTENTED AGGREGATED MODELS OF TECHNICAL OBJECTS USING COMPUTATIONAL INTELLIGENCE
Summary
The article presents the process of monitoring and defining the state machine
which is an important area for commercial uses, as well as research applicable to
computer systems, control and surveillance. The main aim is the selection of
relevant information, using a variety of symptoms of a technical object that may
have vary character. The paper proposes the adoption of a quantitative model using
parameters obtained in the drafting of visual state of the machine.
Keywords: state machine, computational intelligence, reduction diagnostic information
Rafał Boniecki
Mirosław Miciak
Roman Wiatr
Zakład Inynierii Poczty
Wydział Telekomunikacji i Elektrotechniki
Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy
ul. Kordeckiego 20, 85-225 Bydgoszcz
e-mail: mirosł[email protected]
[email protected]
[email protected]
Download