MODELE NIENADZOROWANEGO GRUPOWANIA OBIEKTÓW TECHNICZNYCH Z WYKORZYSTANIEM METOD INTELIGENCJI OBLICZENIOWEJ RAFAŁ BONIECKI, MIROSŁAW MICIAK, ROMAN WIATR Streszczenie W artykule przedstawiono proces monitorowania i okrelania stanu maszyn, który jest wanym obszarem zastosowa komercyjnych, a take bada naukowych, majcym m.in. zastosowanie w systemach komputerowego sterowania i nadzorowania. Głównym celem pracy jest selekcja informacji istotnych z wykorzystaniem szeregu symptomów obiektu technicznego, które mog mie róny charakter (składowe wolno i szybkozmienne, w tym losowe). W opracowaniu zaproponowano przyjcie modelu ilociowego z wykorzystaniem parametrów otrzymanych na etapie sporzdzania wizualizacji stanu technicznego maszyny (obiektu). Słowa kluczowe: okrelenie stanu maszyn, redukcja informacji diagnostycznej, inteligencja obliczeniowa 1. Wprowadzenie Dane eksploatacyjno-pomiarowe czsto charakteryzuj si du wymiarowoci (ang. highdimensional data sets), która staje si istotnym problemem podczas analizy. Definiujc pojcie wysokiej wymiarowoci mamy na myli to, e poszczególne zbiory danych (np. dane pomiarowe odpowiadajce poszczególnym stanom eksploatacyjnym) posiadaj du ilo atrybutów (zmiennych). W praktyce czsto okazuje si jednak, e wiele z tych atrybutów jest ze sob dosy mocno skorelowanych i do otrzymania pełnego obrazu stanu opisywanego urzdzenia, czy zauwaenia pewnych prawidłowoci (lub nieprawidłowoci) w obiektu, wystarczy uwzgldni jedynie niewielki ich podzbiór. Pomimo, e istnieje szereg metod analizy stanów obiektów technicznych, okrelenie zdatnoci obiektu przy analizowaniu wszystkich symptomów jest zwykle albo niemoliwe, albo bardzo trudne do uzyskania. Sporód wielu zada, które definiuje si wdziedzinie eksploatacji maszyn, due znaczenie maj wic te, które pozwalaj zredukowa wymiarowo zbioru symptomów. W wielu wypadkach najwiksze zastosowanie znajduj metody nalece do grupy metod nienadzorowanych. Oznacza to, e wiedza (ang. knowledge), któr uzyskujemy analizujc dane, powstaje niejako samorzutnie. Jest tak, gdy nie dysponujemy adnymi danymi wzorcowymi (treningowymi), które mogłyby posłuy do wycignicia wniosków dotyczcych analizowanych danych. Takim klasycznym przykładem metody nienadzorowanej jest grupowanie danych. Poprzez analiz metodami statystycznymi zalenoci pomidzy danymi, wyciga mona wnioski co do podobiestwa pewnych grup danych. Z kolei klasycznym przykładem metody nadzorowanej jest klasyfikacja. Dysponujc wzorcowymi 36 Rafał Boniecki, Mirosław Miciak, Roman Wiatr Modele nienadzorowanego grupowania obiektów technicznych z wykorzystaniem metod inteligencji obliczeniowej danymi, o których wiemy do jakiej grupy nale (czyli jak s zaklasyfikowane), mona stosunkowo prosto i wiarygodnie wycign wnioski co do klasyfikacji pozostałych danych. Proces klasyfikacji stanu obiektu technicznego okrela klas przynalenoci na podstawie dostpnej informacji jakociowej. W niniejszym opracowaniu zaproponowano model klasyfikatora w oparciu o statystyczn informacj maszyny (uzyskiwan na etapie sporzdzania wizualizacji parametrów obiektu w postaci regresji) z wykorzystaniem metod uczenia rónorodnoci topologicznych. W zwizku z tym na proces klasyfikacji realizowany w zaproponowanym modelu, składa si bd nastpujce etapy: • pozyskiwanie i selekcja cech, • redukcja wymiarowoci, • klasyfikacja. 2. Pozyskiwanie i selekcja informacji o obiekcie technicznym Naley te zauway , e pozyskiwanie i selekcja informacji na temat obiektu technicznego moe by ukierunkowana bd na wykorzystanie w analizach eksperckich, bd do dalszego przetwarzania ilociowego. Dla potrzeb analiz eksperckich wany jest dobór reprezentacji szeregu symptomów, z uwzgldnieniem przebiegów poszczególnych regresji i ewentualnym wyodrbnieniem charakterystycznych wzorców. W odniesieniu do szeregów informacyjnych zawierajcych parametry stanu maszyn metody takie s szeroko rekomendowane jako tzw. analiza techniczna. Wykorzystuje si tu proste metody analiz ilociowo-jakociowych sygnałów, takie jak m.in. wizualizacja rednich ruchomych (metoda trzech rednich, gdzie badana jest relacja rednich obliczonych w oknach o rónych szerokociach), analiza okresowoci, wyodrbnianie segmentów szeregu o charakterystycznych, powtarzalnych kształtach (tzw. formacji). Natomiast w analizach ilociowych składowe szeregów informacyjnych s poddawane dalszemu przetwarzaniu, jako oddzielne sygnały diagnostyczne (tzw. analiza wielorozdzielcza). Mog by one ukierunkowane na badanie współzalenoci o charakterze deterministycznym ilosowym badanych zjawisk reprezentowanych szeregami informacyjnymi. Proces przetwarzania danych pochodzcych z obiektu technicznego sprowadza si do wyselekcjonowania istotnych symptomów z punktu zadania klasyfikacji, czsto utosamiany jest w teorii informacji z procesem odkrywania cech. Zatem odkrywanie cech (ang. Feature Extraction, FE) jest technik okrelania nowego zbioru cech (ang. features) analizowanej rzeczywistoci na potrzeby budowy modelu teje rzeczywistoci. Znalezione cechy s w pewnym sensie nowymi abstrakcyjnymi ródłami danych. S one jednoczenie pewnymi kombinacjami (czsto liniowymi) oryginalnych atrybutów zbioru danych. Jest to wic z pewnoci metoda redukujca wymiarowo pierwotnego zadania. Metoda FE okrela równie (w postaci wartoci liczbowej) w jakim stopniu oryginalne atrybuty wpływaj na wyliczon cech, czyli jaka jest ich warto informacyjna. Nowe cechy z reguły nie maja jasnej interpretacji fizycznej. S jednak uyteczne przy wizualizacji zbioru danych na przykład w dwóch lub trzech wymiarach. Czsto metoda FE uywana jest równie jako wstpna obróbka danych na potrzeby innych zada klasyfikacyjnych. Z pewnoci jednak najwiksz zalet metody FE jest moliwo interpretacji zadaniowej okrelonych cech. Moliwoci interpretacyjne s ju cech systemu klasyfikacyjnego stan urzdzenia a nie metody FE jako takiej. Przykładowo, łatwo przypisa wyliczone cechy poszczególnym przypadkom 37 Studies & Proceedings of Polish Association for Knowledge Management Nr 49, 2011 punktom czasowym odpowiadajcym poszczególnym stanom analizowanego obiektu. Uzyskujemy wic pewien podział pierwotnych danych na grupy (tzw. klastry), lub te dokona filtracji pewnych symptomów. Moemy wtedy analizowa znalezione cechy jedynie poprzez wartoci pozostałych po filtracji. Natomiast selekcja cech (ang. Feature Selection, FS) jest technik okrelania istotnoci atrybutów pierwotnego zbioru danych (tak zwane atrybuty predykcyjne (ang. predictive attributes) na potrzeby przewidywania wartoci wybranego atrybutu celu (ang. target attribute). Chodzi wic o wybór z duej liczby atrybutów tych z nich, które posiadaj istotn dla danego zadania (tu: predykcji) warto . Przykładowo, interesuje nas, które z dostpnych w pierwotnym zbiorze danych atrybutów opisujcych klienta firmy najbardziej wpływaj na nisk aktywno klienta wkorzystaniu z nowych usług firmy. W metodach FS istotny jest fakt, e uzyskane wyniki silnie zale od wyboru atrybutów predykcyjnych. W praktyce nie zawsze bdziemy wybierali wszystkie dostpne atrybuty, pomijajc z oczywistych wzgldów atrybuty niemogce wpływa na atrybut celu lub wiadomie rezygnujc z uwzgldniania który z nich. Ponadto, dodanie do zbioru danych nowego atrybutu predykcyjnego (np. wczeniej nieuwzgldnionego w analizie) moe w jego obecnoci zupełnie zmieni wczeniej wyliczone wanoci atrybutów. Rozwizanie powyszych zada odbywa si czsto z wykorzystaniem technik korelacyjnych, transformaty Karhunena-Loevego i analizy składowych głównych PCA (ang. Principal Components Analysis), a take techniki eksploracji danych (do tej grupy zaliczane s m.in. metody oparte na zastosowaniu miar odległoci, okrelanych te miarami odmiennoci szeregów). Zatem zastosowanie nowoczesnych technik informatycznych pozwala na implementacj złoonych metod przetwarzania szeregów informacyjnych. Implementowane s mechanizmy klasyczne oraz adaptacyjne, udoskonalone czsto metodami tzw. inteligencji obliczeniowej, eksplorujce rónorodne paradygmaty. Wiele algorytmów wymaga arbitralnego dostrajania parametrów. Algorytmy takie, wykorzystujce analityczne oraz neuronowe techniki identyfikacji, grupowania i klasyfikacji, systemy ekspertowe, w tym metody zaliczane do tzw. nowej inynierii, maj zastosowanie bezporednie (np. detekcja anomalii umoliwiajca wykrycie awarii urzdzenia) bd porednie, ukierunkowane na przetwarzanie danych wejciowych w celu wygenerowania sygnału diagnostycznego, stanowicego sygnał wejciowy innych metod przetwarzania, jak np. kompresji danych, czy redukcji wymiarowoci. Zatem istotnym elementem procesu selekcji informacji jest eliminacja mniej istotnych cech szeregu informacyjnego, pozwalajca na skuteczniejsz ocen najbardziej istotnych cech badanych obiektów. W opracowaniu zaproponowano przyjcie modelu ilociowego z wykorzystaniem parametrów otrzymanych na etapie sporzdzania wizualizacji stanu technicznego maszyny (obiektu). Zatem dane reprezentowane s w postaci m wymiarowych wektorów dla n symptomów tworzc n×m wymiarow przestrze topologiczn T. Zatem obiekt techniczny bdzie reprezentowany za pomoc rónorodnoci topologicznej R osadzonej w T. 38 Rafał Boniecki, Mirosław Miciak, Roman Wiatr Modele nienadzorowanego grupowania obiektów technicznych z wykorzystaniem metod inteligencji obliczeniowej 3. Analiza i redukcja wymiarowoĞci danych pomiarowych Metody inteligencji obliczeniowej w ostatnich latach wykorzystywane s coraz czciej do zwikszenia skutecznoci mechanizmów ju istniejcych (klasycznych). Generalnie daje si zauway dwa stosowane podejcia. Pierwsze opiera si na narzdziowym wykorzystaniu danej metody ze wzgldu na własnoci, charakterystyk, szybko działania czy rodzaj uzyskiwanych wyników. Drugie podejcie zwizane jest z wykorzystaniem analogii zadania detekcji zdarze do innych zjawisk, w szczególnoci spotykanych w naturze. Podejcie to ma zastosowanie dla zwikszania skutecznoci działania mechanizmów klasycznych, a take wpływa na efektywniejsze wykorzystanie mocy obliczeniowych powszechnie dzi dostpnych komputerów (m.in. poprzez rozpraszanie oblicze, zastosowanie architektury klastrowej/gridowej). Jednym zwykorzystywanych paradygmatów jest podejcie immunologiczne, którego załoenia imechanizmy znajduj take odwzorowanie w przetwarzaniu sygnałów oraz detekcji zdarze wszeregach czasowych. Z punktu widzenia niniejszego opracowania szczególn rol odgrywa analiza symptomów obiektu technicznego. Mona oczekiwa , e w tych parametrach znajduj odzwierciedlenie nagłe zdarzenia jakociowe zewntrzne, zarówno incydentalne (ujawniajce si w postaci krótkotrwałych anomalii), jak i te powodujce długoterminowe skutki. Dla takich sygnałów prowadzone s analizy diagnostyczne zmierzajce do detekcji zdarze. Analizy te mog by prowadzone zarówno w dziedzinie czasu oraz czstotliwoci. Okazuje si, e analiza danych otrzymanych w procesie wizualizacji moe okaza si problematyczna ze wzgldu na bardzo du ilo informacji. Poniewa czsto okazuje si, e wiele atrybutów opisujcych rzeczywiste dane (obiekty) jest ze sob powizanych (skorelowanych). Dlatego do otrzymania obrazu rozpatrywanego obiektu, czy zauwaenia pewnych prawidłowoci w danych, naley jedynie uwzgldni niewielki ich podzbiór lub te na bazie oryginalnych atrybutów wygenerowa nowy zestaw (dokona agregacji). W zwizku z tym stosuje si proces redukcji wymiarowoci, który zwykle wie si z utrat pewnej iloci informacji. Dy si wic do ustalenia takiego stopnia redukcji wymiarów, aby wspomniana strata nie wpływała na rezultat działania danego systemu (np. klasyfikacji). Mona zatem przyj , e istnieje pewna, tzw. wewntrzna wymiarowo (ang. intrinsic dimensionality), mniejsza ni oryginalna, która gwarantuje, e dane po zredukowaniu bd niosły ze sob te same informacje, które zawierały dane pierwotne. Do rozwizania tego problemu zaproponowano techniki nazywane globalnymi metodami redukcji wymiarowoci; s to algorytmy, które staraj si zachowa globalne właciwoci danych (podobnie jak w metodach PCA i LDA), ale s zdolne do identyfikacji nieliniowych transformacji midzy wysoko-wymiarowymi danymi wejciowymi i ich odpowiednikami reprezentacji niskowymiarowych Zadanie redukcji wymiarowoci mona zdefiniowa w nastpujcy sposób. Załómy, e dana jest macierz X składajc si z N wektorów x, D-wymiarowych, i e ten zestaw danych posiada wewntrzn wymiarowo d (gdzie d<D, bardzo czsto nawet d<<D). W pojciu geometrycznym, wewntrzna wymiarowo oznacza, e punkty zbioru X le na lub w pobliu rozmaitoci topologicznej o wymiarowoci d, która jest osadzona w przestrzeni D wymiarowej. Zagadnienie rozmaitoci topologicznej (ang. manifold), utosamiane czciej jako rozwinicie pojcia powierzchni w wikszej liczbie wymiarów, mona równie zdefiniowa formalnie jako 39 Studies & Proceedings of Polish Association for Knowledge Management Nr 49, 2011 przestrze topologiczn M, w której dla kadego punktu istnieje otoczenie otwarte, homeomorficzne z przestrzeni kartezjask Rd dla pewnego d⊂D. Natomiast liczb d, tak sam dla wszystkich punktów x⊂D, nazywa si wymiarem rozmaitoci definiowanej jako wewntrzny wymiar. Przykładem rozmaitoci topologicznej o wymiarze d=2 jest kula. Metody redukcji wymiarowoci przekształcaj zbiór X w nowy zbiór danych Y zwymiarowoci d. Naley jednak zaznaczy e w procesie tym ani geometria M, ani ID zbioru danych X, nie s dokładnie znane. W zwizku z tym redukcja wymiarowoci jest problemem, który moe by rozwizany jedynie przy załoeniu pewnych właciwoci danych (takich, jak np. oszacowanie wewntrznej wymiarowoci danych). Metody redukcji wymiarowoci mona podzieli na nastpujce grupy: • tradycyjne metody liniowe, • globalne metody nieliniowe, • lokalne metody nieliniowe, • metody kombinowane. Metody okrelane jako tradycyjne liniowe s ju znane w statystyce od pocztku 20 wieku. Do tej grupy nale min. Analiza składowych głównych (ang. Principal Components Analysis), PCA (znana te jako transformacja Karhunena-Loevego) oraz liniowa analiza dyskryminacyjna LDA (znana równie jako odwzorowanie Fishera). Analiza głównych składowych (ang. Principal Component Analysis) polega na ortogonalnym przekształceniu n-wymiarowego układu zmiennych, opisujcych właciwoci danego obiektu lub zjawiska, na nowy układ zmiennych nieskorelowanych, tzw. głównych składowych, o wymiarze mniejszym od n. Zmniejszenie wymiaru przestrzeni cech oraz ich uporzdkowanie na podzbiory (główne składowe) umoliwia graficzn interpretacj relacji badanych zmiennych oraz pozwala okreli ich istotno . Składowe generowane s kolejno tak, aby wyjani jak najwicej zmiennoci w zbiorze danych oraz tak, aby były jak najmniej skorelowane z innymi czynnikami. Ze wzgldu na redukcj zmiennych opisujcych obserwacje, ułatwia to np. okrelenie podobiestw midzy przypadkami. Reprezentacja stanu obiektu za pomoc zbioru jego charakterystycznych cech (właciwoci) jest czsto stosowan technik w systemach diagnozowania. Cechy tworz n-wymiarow przestrze, w której kada współrzdna reprezentuje pewny symptom. Tak wic obiekt techniczny mona przedstawi za pomoc wektora: X = [X 1 T X 2 ... X n ] (1) który jest przedstawiany jako punkt w przestrzeni cech, jeeli X ma rozkład gaussowski, to mona zapisa za pomoc równania: (2) W zwizku z powyszym mona znale jednowymiarow reprezentacj x' połoon w bliskiej odległoci od x tak, e: (3) 40 Rafał Boniecki, Mirosław Miciak, Roman Wiatr Modele nienadzorowanego grupowania obiektów technicznych z wykorzystaniem metod inteligencji obliczeniowej przy czym miara odległoci okrelana jest przez błd rednio kwadratowy (4) Optymaln aproksymacj losowego wektora X za pomoc linowej kombinacji niezalenych wektorów mona uzyska przez projekcj losowego wektora X na wektory własne odpowiadajce najwikszym wartociom własnym macierzy kowariancji. Na diagonalnej macierzy kowariancji wystpuj wariancje składowych wektora losowego, natomiast na pozostałych pozycjach kowariancje midzy nimi. Liniowa analiza dyskryminacyjna dy do znalezienia liniowego podziału danych nalecych do rónych klas. LDA jest uywania w uczeniu maszynowym (system uczcy si wykorzystuje zewntrzne dane empiryczne w celu tworzenia i aktualizacji podstaw dla udoskonalonego działania na podobnych danych w przyszłoci oraz wyraania tych podstaw w zrozumiałej isymbolicznej postaci) do znalezienia liniowej kombinacji cech, które najlepiej rozróniaj dwie lub wicej klas obiektów lub zdarze. Wynikowe kombinacje s uywane jako klasyfikator liniowy, lub czciej, słu redukcji liczby wymiarów do póniejszej klasyfikacji statystycznej. Wodrónieniu od wikszoci innych technik redukcji wymiarowoci, LDA jest metod nadzorowan. Metoda ta poszukuje liniowego odwzorowania M, które umoliwia uzyskanie maksymalnej separowalnoci klasy w niskowymiarowej reprezentacji danych. Kryteria, które s wykorzystywane do formułowania liniowej separowalnoci poszczególnych klas, to miary dyskryminacji, czyli rozproszenia wewntrz-klasowego oraz rozproszenia midzy-klasowego. Zatem znajdujemy optymalny stosunek miary rozproszenia w niskowymiarowej reprezentacji danych (tzw. kryterium Fishera), dc do maksymalizacji rozproszenia midzyklasowego iminimalizacji rozproszenia wewntrzklasowego: (5) gdzie T – transformacja liniowa przekształcajca nasz przestrze w przestrze ozredukowanym wymiarze, TTSwT oraz TTSbT – odpowiednie macierze rozproszenia w przestrzeni o zredukowanym wymiarze. Mona udowodni , e kolumny T s pierwszymi C wektorami własnymi odpowiadajcymi najwikszym wartociom własnym dla nastpujcego uogólnionego zagadnienia własnego: (6) Jeli macierz Sw jest nieosobliwa, to mona to zagadnienie sprowadzi do zwykłego symetrycznego zagadnienia własnego. Poniewa Sw jest wtedy rzeczywista symetryczna i dodatnio okrelona, to stosujc algorytm dekompozycji SVD otrzymujemy: (7) gdzie U – macierz unitarna, a D – diagonalna z dodatnimi wartociami na diagonali. Zatem zadanie sprowadza si do: 41 Studies & Proceedings of Polish Association for Knowledge Management Nr 49, 2011 (8) co sprowadza si do: (9) W zwizku z powyszym otrzymujemy zagadnienie własne z macierz symetryczn nieujemnie okrelon, które moemy rozwiza za pomoc rozkładu SVD. Inn grup metod redukcji wymiarowoci stanowi techniki nazywane globalnymi; s to algorytmy, które staraj si zachowa globalne właciwoci danych (podobnie jak w metodach PCA i LDA), ale s zdolne do identyfikacji nieliniowych transformacji midzy wysokowymiarowymi danymi X i ich odpowiednikami reprezentacji nisko-wymiarowych Y. Metoda skalowania wielowymiarowego (MDS) jest zbiorem technik nieliniowego odwzorowania wysoko-wymiarowej reprezentacji danych X do reprezentacji nisko-wymiarowej Y przy jak najwikszym zachowaniu odległoci midzy parami punktów danych. Jako odwzorowania jest wyraana za pomoc funkcji stresu (ang. stress function), czyli miar błdu odległoci midzy parami w nisko-wymiarowych i wysoko-wymiarowej reprezentacji danych. Wimplementacjach algorytmów MDS na ogół spotyka si dwie postacie funkcji, posta ogólna (ang. raw stress function) i w postaci funkcji kosztu Sammona. Pierwsza z nich jest definiowana przez: (10) gdzie ||xi-xj|| jest odległoci euklidesowa midzy punktami danych xi i xj w przestrzeni danych wejciowych, ||yi-yj|| jest odległoci euklidesowa midzy punktami danych yi i yj w reprezentacji danych wyjciowych. Natomiast funkcja kosztu Sammona jest wyraona przez: (11) Funkcja kosztów Sammona róni si od funkcji w postaci ogólnej tym, e kładzie wikszy nacisk na zachowanie odległoci. Minimalizacja funkcji stresu moe by przeprowadzona przy uyciu metod takich, jak dekompozycja własna (ang. eigencomposition) macierzy, metoda gradientu sprzonego lub metoda pseudo-Newtona. Kolejn technik nieliniowej redukcji wymiarowoci jest metoda okrelana w literaturze jako stochastyczna blisko osadzenia (eng. Stochastic Proximity Embedding) (SPE); jest to iteracyjny algorytm minimalizacji ogólnej funkcji stresu. Rozwizanie to róni si od wczeniej przedstawionego skalowania wielowymiarowego podejciem do szacowania lokalnych przestrzeni 42 Rafał Boniecki, Mirosław Miciak, Roman Wiatr Modele nienadzorowanego grupowania obiektów technicznych z wykorzystaniem metod inteligencji obliczeniowej (euklidesowych) w nisko-wymiarowej reprezentacji danych. Dla metody SPE ogólna funkcja stresu moe by przedstawiona w postaci: (12) gdzie r jest miar bliskoci midzy punktami xi oraz yi w wysoko-wymiarowej przestrzeni danych i jest dana wzorem: (13) natomiast d jest odległoci euklidesow midzy ich odpowiednikami yi oraz yj w przestrzeni nisko-wymiarowej. Algorytm ten w głównej mierze kładzie nacisk na zachowanie odległoci wssiedztwie grafu N okrelonego na danych, ustawiajc d i r na 0. Jest to podejcie przypominajce techniki z zastosowaniem ssiedztwa grafów. Natomiast w metodzie Isomap odległoci midzy punktami danych oblicza si, tworzc graf ssiedztw, w którym kady punkt danych zwizany jest z najbliszymi ssiadami zbioru. Najkrótsza droga midzy dwoma wierzchołkami grafu tworzy oszacowanie geodezyjnej odległoci midzy tymi punktami. Zadanie to mona wykona stosujc algorytm Dijkstry lub Floyda. W ten sposób wyznacza si macierz odległoci dla wszystkich punktów danych. Nastpnie reprezentacja nisko-wymiarowa punktów obliczana jest z zastosowaniem skalowania wielowymiarowego zuwzgldnieniem wczeniej utworzonej macierzy odległoci: (14) gdzie: (15) oraz: (16) Metoda maksymalnej wariancji rozkładu (ang. Maximum Variance Unfolding) (MVU), podobnie jak poprzednia, okrela graf ssiedztwa danych, lecz tym co odrónia j od Isomap jest denie do swoistego rozwijania płaszczyzn topologicznych. Realizuje to poprzez maksymalizacj euklidesowej odległoci pomidzy punktami danych, w ramach ograniczenia, e odległoci w grafie ssiedztwa pozostaj niezmienione (tj. lokalna geometria płaszczyzny topologicznej danych nie moe by zniekształcona). Powstały problem optymalizacji mona skutecznie rozwiza przy zastosowaniu programowania pół-okrelonego (ang. Semidefinite Programming lub te ang. Semidefinite Embedding) (SDP)(SDE). Algorytm rozpoczyna działanie od budowy grafu ssiedztw, 43 Studies & Proceedings of Polish Association for Knowledge Management Nr 49, 2011 w którym kady punkt danych jest połczony do najbliszych ssiadów. Nastpnie dokonywana jest próba maksymalizacji sumy kwadratów odległoci euklidesowej midzy wszystkimi punktami danych, pod warunkiem zachowania odległoci w obrbie grafu. Inaczej mówic, metoda MVU wykonuje nastpujce zadanie optymalizacji: (17) przy czym: (18) Zatem metoda MVU formułuje problem optymalizacji jako problem (SDP), przez zdefiniowanie macierzy K, która jest przestrzeni unitarn reprezentacji danych. W zwizku z tym, pod warunkiem: (19) i ostatecznie reprezentacja nisko-wymiarowa moe by wyznaczona na podstawie: (20) Dla danych pomiarowych przedstawionych w tabeli 1 przeprowadzono redukcj wymiarowoci metod MDS; wyniki przedstawiono w tabeli 2. Tabela 1. Dane obiektu S 266_1 Kod_Obiektu Czas pracy Stan S266_1 87372 S266_1 88300 S266_1 89160 S266_1 92570 S59 S266_1 93670 S266_1 94530 S266_1 96180 S266_1 100101 S60 S266_1 102740 S266_1 109800 S266_1 110755 S61 S266_1 111790 S266_1 112312 S266_1 113131 S266_1 114419 CO CO2 347,33 1,45 386,60 1,76 339,57 1,42 371,13 1,53 181,50 1,49 400,07 1,48 353,53 1,33 508,47 1,95 471,77 1,31 523,30 1,52 461,50 1,74 423,13 1,44 409,00 1,51 478,30 1,58 401,90 1,53 NO 157,23 188,37 168,43 143,83 175,53 152,20 128,40 100,67 119,97 142,10 176,57 126,17 124,20 157,00 163,63 NO2 73,27 72,20 73,90 82,70 79,73 85,07 69,57 60,63 53,77 21,00 75,80 68,00 60,00 74,63 61,00 NOx CxHx Dym 210,53 0,01 1,34 260,57 0,03 1,42 242,33 0,07 1,24 226,53 0,11 1,28 215,27 0,11 1,36 227,27 0,24 1,42 197,97 0,76 1,41 151,32 0,76 1,47 163,73 0,53 1,66 163,10 1,92 1,57 252,37 1,31 1,89 194,17 1,70 2,54 184,20 1,52 2,24 231,63 5,53 1,42 224,63 2,26 3,69 44 Rafał Boniecki, Mirosław Miciak, Roman Wiatr Modele nienadzorowanego grupowania obiektów technicznych z wykorzystaniem metod inteligencji obliczeniowej Tabela 2. Reprezentacja danych obiektu S 266_1 w przestrzeni dwuwymiarowej metod MDS Lp. Kod_Obiektu Czas pracy Stan 1 S266_1 87372 2 S266_1 88300 3 S266_1 89160 4 S266_1 92570 S59 5 S266_1 93670 6 S266_1 94530 7 S266_1 96180 8 S266_1 100101 S60 9 S266_1 102740 10 S266_1 109800 11 S266_1 110755 S61 12 S266_1 111790 13 S266_1 112312 14 S266_1 113131 15 S266_1 114419 X -0,32 0,23 -0,03 -0,25 -0,08 -0,14 0,01 -0,13 0,45 0,01 0,02 0,38 0,41 -0,32 -0,35 Y 0,33 0,13 0,04 -0,34 -0,13 -0,4 -0,06 0,22 -0,47 0,06 0,36 0,2 -0,16 -0,14 -0,31 0.5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 0.4 0.3 0.2 0.1 0 -0.1 -0.2 -0.3 -0.4 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 Rysunek 1. Reprezentacja nisko-wymiarowa danych obiektów S 266_1 (Tabela 2) 45 Studies & Proceedings of Polish Association for Knowledge Management Nr 49, 2011 Tabela 3. Reprezentacja parametrów (symtomów) obiektu S 266_1 uzyskana za pomoc metody MDS Kod_Obiektu Czas pracy Stan S266_1 x x CO CO2 NO NO2 NOx CxHx Dym 1 2 3 4 5 6 7 -1126,96 460,48 -98,97 200,46 -340,65 462,17 459,68 -181,13 43,02 -92,83 62,76 73,12 38,18 44,73 100 1 2 3 4 50 5 6 7 0 -50 -100 -150 -200 -1200 -1000 -800 -600 -400 -200 0 200 400 600 Rysunek 2. Reprezentacja nisko-wymiarowa symptomów obiektu S 266_1 (tabela 3) 3. Klasyfikacja W opracowaniu zaproponowano złoony liniowy model klasyfikatora stanu maszyny, opierajcy swoje działanie na technikach eksploracji danych oraz metodach grupowania danych. Ze wzgldu na to, e uzyskiwane parametry informacyjne (symptomy) obiektu technicznego s utosamiane z szeregami czasowymi, analiza wieloczynnikowa wydaje si by odpowiedni technik zastosowan w etapie podejmowania decyzji o klasie stanu maszyny. Naley zauway , e przeprowadzenie procesu redukcji wymiarowoci pozwoli na okrelenie połoenia poszczególnych klas stanu obiektu (tzw. klasteryzacja) w nowej reprezentacji danych. Realizacja bada laboratoryjnych pozwoli na okrelenie kryteriów podziału przestrzeni niskowymiarowej na podstawie budowy tzw. systemu eksperckiego. Wtedy bdzie moliwe równie okrelenie odległoci wewntrz-klasowej oraz odległoci midzy-klasowej. Na podstawie tych danych bdzie mona ostatecznie dokona procesu klasyfikacji. W zaproponowanym rozwizaniu klasyfikacja reprezentacji nisko-wymiarowej jest dokonywana na podstawie algorytmu NN 46 Rafał Boniecki, Mirosław Miciak, Roman Wiatr Modele nienadzorowanego grupowania obiektów technicznych z wykorzystaniem metod inteligencji obliczeniowej najbliszych ssiadów (ang. Nearest Neighbor). W procesie rozpoznawania pojawia si nowa obserwacja (reprezentacja nisko-wymiarowa), której przypisanie do okrelonej klasy jest nieznane. Okrelenie zbioru uczcego moliwe bdzie po przeprowadzeniu bada stanowiskowych ieksploatacyjnych, które pozwol na akwizycj danych w postaci macierzy obserwacji: symptom diagnostyczny – stan oraz symptom diagnostyczny – czas eksploatacji maszyny. Tworzy si w ten sposób macierz X1 danych nalecych do klasy 1 (układy maszyny zdatne). Nastpnie wprowadzajc kolejne rozregulowania i uszkodzenia, dokonuje si rejestracji zmian wartoci parametrów diagnostycznych dla układów maszyn (zespołów) niezdatnych i zdatnych zadaniowo, tworzc macierze X2, X3 itd., którym odpowiadały konkretne uszkodzenia, odpowiedzialne za macierz obserwacji. Alternatywny proces klasyfikacyjny jest realizowany za pomoc wielowarstwowej sztucznej sieci neuronowej LTF-C (ang. Local Transfer Function Classifier), która jest przeznaczona wszczególnoci do zada klasyfikacyjnych. Jej architektura zbliona jest do sieci radialnych (RBF). Składa si ona z dwóch warstw neuronów. Pierwsza warstwa (tzw. ukryta) zawiera neurony ogaussowskiej funkcji transferu, które wykrywaj w danych treningowych skupiska wzorców z tej samej klasy. Kady neuron tej warstwy ma przypisan klas, której skupisko stara si wykry . Drug warstw tworz neurony liniowe, które segreguj odpowiedzi neuronów ukrytych według przypisanych klas i sumuj je, formułujc ostateczn odpowied sieci. Zaproponowana sie na podstawie przeprowadzonych bada okazuje si by skuteczniejsza od metod najbliszego ssiada czy te nawet od techniki k-najbliszych ssiadów. Redukcja wymiarowoci jest bardzo wanym elementem statystycznej analizy danych pomiarowych oraz analiz wykonywanych w ramach szeroko pojtej eksploracji danych. Dziki redukcji wymiarowoci osigamy nie tylko to, e mamy do przeanalizowania po prostu mniej danych. Najwaniejsze jest mimo wszystko to, e dane po zredukowaniu pokazuj nam niejednokrotnie wicej informacji, ni przed redukcj. Wiele zalenoci staje si bardziej czytelnych i zmniejsza si prawdopodobiestwo ich przeoczenia. Bardzo czsto bowiem jest tak, e ilo posiadanych danych przerasta nas i bardzo łatwo wówczas pogubi si w ich analizie. Oczywicie, nie wszystkie dane naley automatycznie i bez zastanowienia redukowa . Warto jednak zawsze rozway tak moliwo . 47 Studies & Proceedings of Polish Association for Knowledge Management Nr 49, 2011 Bibliografia [1] M.S. Venkatarajan, W. Braun. New quantitative descriptors of amino acids based on multidimensional scaling of a large number of physicalchemical properties. Journal of Molecular Modeling, 7(12):445–453, 2004 r. [2] C. Faloutsos, K.-I. Lin. FastMap: A fast algorithm for indexing, data-mining and visualization of traditional and multimedia datasets. In Proceedings of the 1995 ACM SIGMOD International Conference on Management of Data, s. 163–174, New York, USA, 1995 r. [3] J.B. Tenenbaum. Mapping a manifold of perceptual observations. In Advances in Neural Information Processing Systems, vol. 10, s. 682–688, Cambridge, USA, 1998 r. [4] J.B. Tenenbaum, V. de Silva, J.C. Langford. A global geometric framework for nonlinear dimensionality reduction. Science, vol. 290, s. 2319–2323, 2000 r. [5] T. Pełech-Pilichowski, Adaptacyjne algorytmy zdarze w szeregach czasowych, AGH, 2009 r. [6] K. Torkkola. Linear discriminant analysis in document classification. In IEEE ICDM-2001 Workshop on Text Mining, s. 800–806, 2001 r. [7] T. Cox, M. Cox. Multidimensional scaling. Chapman and Hall, London, UK, 1994 r. [8] J.B. Kruskal. Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis. Psychometrika, vol. 29, s. 1–27, 1964 r. 48 Rafał Boniecki, Mirosław Miciak, Roman Wiatr Modele nienadzorowanego grupowania obiektów technicznych z wykorzystaniem metod inteligencji obliczeniowej UNATTENTED AGGREGATED MODELS OF TECHNICAL OBJECTS USING COMPUTATIONAL INTELLIGENCE Summary The article presents the process of monitoring and defining the state machine which is an important area for commercial uses, as well as research applicable to computer systems, control and surveillance. The main aim is the selection of relevant information, using a variety of symptoms of a technical object that may have vary character. The paper proposes the adoption of a quantitative model using parameters obtained in the drafting of visual state of the machine. Keywords: state machine, computational intelligence, reduction diagnostic information Rafał Boniecki Mirosław Miciak Roman Wiatr Zakład Inynierii Poczty Wydział Telekomunikacji i Elektrotechniki Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy ul. Kordeckiego 20, 85-225 Bydgoszcz e-mail: mirosł[email protected] [email protected] [email protected]