Tematy prac magisterskich na rok akademicki 2006/07 (dzienne studia magisterskie) Przemysław Kazienko 1. Analiza dynamiki komunikacji i relacji międzyludzkich w sieciach społecznych na przykładzie systemu pocztowego (Dynamic of communication and human relationships in social networks for email services) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Zasadnicza część pracy polega na analizie danych o komunikacji międzyludzkiej prowadzonej w sieci Internet. Ze względu na dostępność danych badania można przeprowadzić dla komunikacji email. Relacje międzyludzkie oparte na wymianie listów email można podzielić na pewne klasy. Jednocześnie szczególną uwagę można poświęcić dynamice i intensywności wymiany listów. Do analiz wykorzystane zostaną zarówno ogólnie dostępne narzędzia do hurtowni danych (np. SAS MDDB) i eksploracji danych (np. SAS Enterprise Miner) wspomagane rozbudowanymi mechanizmami przygotowania danych. Wymagania: ukończony kurs hurtownie i eksploracja danych, bierna znajomość języka angielskiego. Charakterystyka tematu: badawczy. 2. Analiza danych systemu publikacji Flickr (Data analysis for Flickr system) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: System Flickr to otwarta stosunkowo nowa platforma publikacyjna dla zdjęć zarządzana przez firmę Yahoo, w której każdy może sie zarejestrować i tworzyć własne kolekcje multimedialne. Dodatkowo, zamieszczane zdjęcia moga byc indeksowane za pomocą tzw. tagów, które są odpowiednikiem słów kluczowych. W ramach pracy koniecznym będzie zebranie danych na temat osób publikujących swoje prace w systemie Flickr a następnie wykonanie szeregu analiz tych danych ze szczególnym uwzględnieniem relacji między osobami. Możliwe jest także porównanie uzyskanych wyników dla podobnych systemów polskojęzycznych. Wymagania: umiejętność programowania systemów internetowych, bierna znajomość języka angielskiego. Charakterystyka tematu: badawczy. 3. Wydzielanie osób kluczowych na podstawie danych telekomunikacyjnych (Key person extraction based on telecommunication data) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Na podstawie danych o komunikacji między osobami (rozmowy telefoniczne) można stworzyć sieć społeczną (graf), w której węzłami są osoby reprezentowane przez linie telefoniczne, zaś krawędziami relacje międzyludzkie. W sieci społęcznej istnieją osoby o kluczowym znaczeniu dla całej sieci lub pewnych jej części. Praca polega na opracowaniu i zaimplementowaniu systemu wydzielania osób kluczowych na podstawie globalnej i lokalnej miary pozycji społecznej (social position) opracowanej na Politechnice Wrocławskiej a także innych miar znanych z literatury, np. prestiżu i centralności. Wymagania: umiejętność programowania w języku Java, bierna znajomość języka angielskiego. Charakterystyka tematu: badawczo-projektowy. 4. Ocena użyteczności odsyłaczy internetowych na podstawie analizy powiązań (Web hyperlink usability assesment based on data link analysis) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Badania porównawcze różnych metod oceny użyteczności odsyłaczy umieszczanych na stronach internetowych polegających na analizie danych o ich wykorzystaniu zawartych w logach serwera HTTP. W szczególności można porównać kilka typów wzorców znanych z analizy powiązań (techniki eksploracji danych): pozytywne i negatywne reguły asocjacyjne, pozytywne i negatywne wzorce sekwencji jak również szeregi czasowe. Praca jest kontynuacją poprzednich prac magisterskich z tego zakresu. Wymagania: umiejętność programowania systemów internetowych, bierna znajomość języka angielskiego. Charakterystyka tematu: badawczy. 5. System rekomendacyjny dla sieci społecznej (Recommender system for social network) Liczba studentów: 1 Omówienie: Celem pracy jest stworzenie spersonalizowanego systemu rekomendacji osób należących do sieci społecznej tzn. systemu sugerującego nawiązanie nowych lub podtrzymanie zaniedbanych relacji. Jednym z zadań w ramach pracy będzie opracowanie rozmytej miary siły relacji międzyludzkiej. Jest to kontynuacją innej pracy obronionej w 2006r. Wymagania: bierna znajomość języka angielskiego. Charakterystyka tematu: badawczo-projektowy. 6. Rekomendacje elementów nauczania w systemach e-learningu (Recommender system for e-learning) Liczba studentów: 1 Omówienie: Systemy uczenia na odległość (e-learning) są interesującym obszarem dla zastosowania systemów rekomendacyjnych. W ramach pracy zostanie zaproponowany konkretny system rekomendacji elementów nauczania dla systemu e-learningu. Wymagania: bierna znajomość języka angielskiego. Charakterystyka tematu: badawczy, projekt i implementacja systemu rekomendacyjnego. 7. Internetowy system zarządzania zaufaniem do firm i organizacji (Web-based system for management of trust between companies and organisations) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Opracowanie i implementacja internetowego systemu, w którym możliwe byłoby gromadzenie informacji o rzetelnych i nierzetelnych firmach, w tym także o zaufanych kontrahentach. System musi posiadać odpowiednie mechanizmy bezpieczeństwa oraz werfyfikacji, zaś wypadkowa miara zaufania/rzetelności musi uwzględniać pozycje i zaufanie do osób/organizacji oceniających a także obiektywne dane zewnętrzne o ocenianych podmiotach np. forma własności, obrót. Powstały system byłby bardzo użyteczny dla wywiadowni gospodarczych. Wymagania: umiejętność programowania systemów internetowych, bierna znajomość języka angielskiego. Charakterystyka tematu: badawczo-projektowy. 8. Analiza relacji międzyludzkich dla systemu blogów WordPress (Analysis of interpersonal relationships based on WordPress blog data) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Blogi (weblogi) internetowe są ważnym środkiem komunikacji międzyludzkiej w środowisku sieci Internet i mogą być traktowane jako pewien rodzaj sieci społecznej, w której istnieją powiązania interpersonalne. Głównym celem pracy jest analiza danych pochodzących z postów i komentarzy dostarczanych przez zarejestrowanych użytkowników światowego systemu blogów WordPress. Analizowane relacje międzyludzkie wynikają zarówno z wzajemengo cytowania, komentowania blogów swoich „znajomych” jak również „spotykania się” na liście komentarzy cudzych blogów. Możliwa jest także analiza dynamiki relacji. Wymagania: umiejętność programowania systemów internetowych, bierna znajomość języka angielskiego. Charakterystyka tematu: badawczy. 9. Analiza danych systemu YouTube (Data analysis for YouTube publication system) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Głównym celem pracy jest wykonanie analiz danych sprowadzonych z systemu YouTube z wykorzystaniem metod analizy wielowymiarowej oraz eksploracji danych. Wymagać to będzie napisania odpowiedniego narzedzia do poierania danych oraz ich właściwego przygotowania (ETL). W szczególności interesującym wydaje się analiza relacji międzyludzkich pomiędzy osobami publikujacymi swojem filmy w YouTube jak również analiza ich dynamiki. Wymagania: umiejętność programowania systemów internetowych, bierna znajomość języka angielskiego. Charakterystyka tematu: badawczy. 10. Sieć społeczna osób zarządzających polskimi i europejskimi firmami (Social network of managers from Polish and european companies) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Zbudowanie internetowego systemu sieci społecznej, w której udostępniane będą dane o powiązaniach między firmami wynikającymi z zasiadania tych samych osób w radach nadzorczych i zarządach polskich i europejskich spółek. Sieć będzie zbudowana z wykorzystaniem ogólnie dostępnych danych. Ocena powiązań może uwzględniac dodatkowe dane o osobach, np. okres sprawowania funkcji jak również dane o firmach takie jak zatrudnienie, obrót, obszar działalności. Wymagania: umiejętność programowania systemów internetowych, bierna znajomość języka angielskiego. Charakterystyka tematu: analityczno-projektowy. 11. Sieć społeczna właścicieli firm i organizacji w Polsce (Social network of company and organisation owners in Poland) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Zbudowanie internetowego systemu sieci społecznej, zależności właścicielskiej pomiędzy firmami i organizacjami w Polsce. Zależności mogą także uwzględniać dodatkowe informacje o podmiotach takie jak wartość czy obrót. Sieć będzie zbudowana zarówno z wykorzystaniem ogólnie dostępnych danych jak i danych wprowadznych przez użytkownika. Wymagania: umiejętność programowania systemów internetowych, bierna znajomość języka angielskiego. Charakterystyka tematu: analityczno-projektowy. 12. Otwarty, internetowy system gromadzenia i przetwarzania opinii konsumenckich o produktach (Public, web-based system for management of consumer opinions related to purchased products) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Opracowanie i implementacja internetowego systemu, w którym gromadzone i analizowane byłoby opinie o produktach dostępnych w sklepach internetowych. Dane o samych produktach pobierane byłyby bezpośrednio ze stron sklepów. Wypadkowa ocena produktu może być zarówno ogólna (dla wszystkich taka sama) jak i spersonalizowana tzn. uwzględniająca profil aktualnego użytkownika (jego zainteresowania i dotychczasowe oceny). Zastosowanie zwykłej średniej ocen lub średniej ważonej będzie tylko jednym z możliwych kryteriów oceny produktu wyliczanych przez system. Wymagania: umiejętność programowania systemów internetowych, bierna znajomość języka angielskiego. Charakterystyka tematu: analityczno-projektowy. 13. System rekomendacji dla sklepu internetowego (Recommender system for e-commerce) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Projekt i implementacja systemy rekomendacyjnego (recommendation / recommender system) dla wybranego sklepu internetowego. W ramach pracy dokonana zostanie także ocena stanu polskich sklepów i serwisów internetowych pod kątem zastosowania metod rekomendacji a także ich porównanie do innych serwisów europejskich i amerykańskich. Wymagania: umiejętność programowania systemów internetowych, bierna znajomość języka angielskiego. Charakterystyka tematu: analityczno-projektowy. 14. Ochrona prywatności w systemach spersonalizowanych (Privacy protection in personalized systems) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Problem ochrony prywatności jest bardzo złożony i dotyczy w sposób szczególny systemów spersonalizowanych, w których z natury rzeczy muszą być gromadzone pewne dane o użytkownikach. W pracy należy zanalizować problem zarówno ze względu na możliwości i ograniczenia istniejacych technologii internetowych jak i obowiązujacego prawa. W efekcie należy zaproponować jeden lub wiecej rozwiązań tego problemu dla różnych systemów spersonalizowanych. Wymagania: umiejętność programowania systemów internetowych, bierna znajomość języka angielskiego. Charakterystyka tematu: analityczno-badawczy. 15. Agregacje w prognozowaniu szeregów czasowych (Aggregations in time series prediction) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Przeprowadzenie badania, która droga postępowania daje lepsze wyniki: prognozowanie agregatu, czy też prognozowanie części składowych agregacji i prognoza „składana”. Wyznaczenie Best Practice i zaleceń odnośnie prognozowania. Temat realizowany we współpracy z SAS Institute Polska. Narzędzia: SAS/ETS, SAS Forecast Server.. Wymagania: umiejętność programowania systemów internetowych, bierna znajomość języka angielskiego. Charakterystyka tematu: analityczno-projektowy. 16. Modelowanie zdarzeń rzadkich (Modeling of rare events) Prowadzący: Przemysław Kazienko Liczba studentów: 1 Omówienie: Modelowanie za pomocą sieci neuronowych i reguł asocjacyjnych (nie regresji i nie drzew decyzyjnych). Modelowanie - predykcja zdarzeń rzadko występujących w danym zbiorze, np. bankructw przedsiębiorstw, niespłacania kredytów hipotecznych, awarii BTS (ang. base trasiving station) w telefonii komórkowej, itp. Temat realizowany we współpracy z SAS Institute Polska. Narzędzia: SAS Enterprise Miner.. Wymagania: umiejętność programowania systemów internetowych, bierna znajomość języka angielskiego. Charakterystyka tematu: analityczno-projektowy.