Recenzja rozprawy doktorskiej "Modele grafowe i algorytmy dla

advertisement
INSTYTUT CHEMII BIOORGANICZNEJ
POLSKA AKADEMIA NAUK
Noskowskiego 12, 61-704 Poznań
tel.: +48 61 8528503, +48 61 8528919
fax: +48 61 8520532, e-mail: [email protected]
Poznań, 24 czerwca 2013
Recenzja rozprawy doktorskiej mgr. inŜ. Kamila KWARCIAKA
pt. „Modele grafowe i algorytmy dla klasycznego problemu sekwencjonowania
DNA przez hybrydyzację oraz dla jego odmiany z informacją o powtórzeniach”
Poznanie w ostatnich latach genomu człowieka, a takŜe genomów bardzo wielu innych
organizmów Ŝywych stwarza szansę na poznanie mechanizmów Ŝycia, a takŜe na praktyczne
wykorzystanie tej wiedzy dla poprawy zdrowia ludzi i harmonicznego rozwoju ekosfery.
Poznanie genomowych sekwencji DNA, jest obecnie bardzo często etapem wstępnym do
określenia struktury i funkcji białek „in silico”, poprzedzającym ich izolację i badania
bezpośrednie. Badania bezpośrednie zawsze, albo przynajmniej jeszcze bardzo długo,
pozostaną najlepszym sposobem ich poznania. Nie zmienia to faktu, Ŝe poznanie sekwencji
kwasów nukleinowych, tzn. ich sekwencjonowanie (DNA), mimo Ŝe poznano juŜ genomy
wielu organizmów, nie tylko nie traci aktualności, ale nabiera wielkiego znaczenia
poznawczego i praktycznego. W tym miejscu odwołać się moŜna chociaŜby do załoŜeń
medycyny spersonalizowanej.
Wiedza na temat sekwencji genomów nagromadzona została w ciągu trzech dziesięcioleci
dzięki wykorzystaniu róŜnych metod sekwencjonowanie DNA, chociaŜ główną z nich była
metoda z wykorzystaniem dideoksynukleotydów i jej warianty. Obecnie z powodzeniem
wykorzystuje się inne metody sekwencjonowania, najczęściej określane jako
„sekwencjonowanie przez syntezę”. Wśród metod sekwencjonowania opracowywanych
wcześniej znajduje się tzw. sekwencjonowanie przez hybrydyzację (SBH) i mimo, Ŝe nie
doczekało się ono dotychczas implementacji większość jego aspektów teoretycznych, które
naleŜało i naleŜy rozwiązać, ma znaczenie ogólniejsze, nie ograniczone tylko do samego
problemu sekwencjonowania DNA. Ponadto, rozwaŜania teoretyczne wokół SBH okazują się
aktualne nie tylko dla sekwencjonowania, czy zagadnień pokrewnych w biologii
molekularnej, ale są istotą takŜe zupełnie odrębnych dziedzin. Tu przykładem są zastosowania
w automatyce, robotyce poprzez tzw. problem Orienteering. To naturalnie jeden z wielu
przykładów, których jakieś matematyczne ujęcie problemu poprawnie opisuje róŜne z pozoru
dziedziny.
Poszukiwania nowych metod sekwencjonowania DNA, koncentracja na poszukiwaniach
metod sekwencjonowania pojedynczych cząsteczek DNA (RNA), zainteresowanie
przyspieszeniem sekwencjonowania i stałym obniŜeniem jego kosztów stwarzają sytuację, w
której nie moŜna wykluczyć praktycznej realizacji „klasycznego’ SBH lub jakiegoś z jego
wariantów.
W nurt tych prac metodycznych wpisuje się bardzo dobrze praca doktorska mgr. inŜ. Kamila
KWARCIAKA, przygotowana pod kierunkiem dr. hab. inŜ. Piotra FORMANOWICZA, prof.
nadzw. IChB PAN i Politechniki Poznańskiej. Zespół prof. Piotra FORMANOWICZA w
Instytucie Informatyki Wydziału Informatyki Politechniki Poznańskiej i Zakładzie
Bioinformatyki Instytutu Chemii Bioorganicznej PAN w Poznaniu od szeregu lat podejmuje
próby rozwiązywania najistotniejszych problemów biologii obliczeniowej. Tak jest i tym
razem. Ten waŜny problem biologii obliczeniowej doczekał się oryginalnego rozwiązania
poprzez zaprojektowanie i implementację algorytmów przybliŜonych (zachłanny,
przeszukiwanie tabu, kolonia mrówek) dla problemu sekwencjonowania DNA przez
hybrydyzację z uwzględnieniem informacji o powtórzeniach.
Rozprawa doktorska mgr. inŜ. Kamila KWARCIAKA została spisana na 110 stronach, ma 11
rozdziałów, w tym podsumowanie i spis literatury liczący 69 pozycji. W rozdziale pierwszym
stanowiącym wprowadzenie do rozprawy doktorskiej Doktorant określił sekwencjonowanie
DNA, a w szczególności jego wariant opierający się na hybrydyzacji kwasów nukleinowych,
jako jeden z najbardziej istotnych problemów biologii molekularnej i obliczeniowej. Na tym
tle zarysował cel i zakres rozprawy doktorskiej.
W Rozdziale 2 Doktorant przedstawił podstawowe zagadnienia biologii molekularnej: opisał
budowę kwasów nukleinowych tzw. centralny dogmat biologii molekularnej. Zrobił to jasno i
zwięźle. W Rozdziale 3 opisane zostały współczesne, podstawowe metody sekwencjonowania
DNA:
Sangera
(dideoksynukleotydowa),
Maxama-Gilberta
(chemiczna),
pirosekwencjonowanie (wariant 454), sekwencjonowanie przez syntezę w wariancie firm
Solexa/Illumina, a w końcu takŜe bardziej szczegółowo samo SBH. To dobre wprowadzenie
dla czytelnika bez znajomości istoty problemu sekwencjonowania.
W następnym rozdziale omówione zostały podstawy matematyczne i informatyczne
problemu, w tym kwestie złoŜoności obliczeniowej wraz z podstawowymi definicjami,
podstawy teorii algorytmów, podstawy teorii grafów oraz algorytm aproksymacyjny dla
problemu komiwojaŜera w grafie skierowanym. Kolejny rozdział (5) opisuje problemy
obliczeniowe i istniejące modele grafowe związane z sekwencjonowaniem przez
hybrydyzację.
W Rozdziale 6 Doktorant dyskutuje modele grafowe dla problemów SBH z dodatkową
informacją o powtórzeniach i jest to juŜ dyskusja i rozwiązywanie podstawowego problemu
badawczego pracy doktorskiej. Zakładając moŜliwość pozyskania dokładnej informacji o
powtórzeniach doktorant dochodzi do stwierdzenia podobieństwa tej sytuacji w SBH do
problemu Orienteering, a właściwie pewnego jego szczególnego wariantu. Logiczne
rozwinięcie dyskursu prowadzi do zaproponowania rozwiązania problemu obliczeniowego z
wykorzystaniem algorytmu aproksymacyjnego oraz podejść heurystycznych w kolejnych
rozdziałach (7 i 8).
Wyniki eksperymentów obliczeniowych posłuŜyły do oceny algorytmów, ich skuteczności i
poprawności dostarczania prawidłowych rozwiązań. Obliczenia przeprowadzono na sztucznie
skonstruowanych zestawach danych wyjściowych, ale ostatecznie skonfrontowano je z
obliczeniami dla sekwencji DNA zawierających naturalne powtórzenia. We wszystkich
przypadkach analizowano wykorzystanie klasycznych zestawów danych tzn. l-merów o
jednakowej długości, jak i pochodzących z tzw. bibliotek izotermicznych. Otrzymane wyniki
potwierdziły pozytywny wpływ na rekonstrukcję sekwencji nawet częściowej informacji o
powtórzeniach. Dla wszystkich algorytmów zastosowanie jej prowadziło do otrzymania
znacząco lepszych wyników. Algorytmem najlepiej rozwiązującym problem obliczeniowy
okazał się algorytm przeszukiwania tabu. Pozwolił on na osiągnięcie najwyŜszej jakości
rozwiązań.
Moja ocena rozprawy doktorskiej jest bardzo pozytywna. Problem rozwaŜany w pracy i jego
dyskusja, rozwiązania mają znaczenie nie tylko dla biologii obliczeniowej, ale takŜe innych
dyscyplin obliczeniowych o duŜym znaczeniu praktycznym. Przedstawione przez doktoranta
wyniki dowodzą takŜe bardzo dobrego opanowania metod informatycznych zarówno od
strony teoretycznej, jak i praktycznej.
Reasumując stwierdzam, Ŝe przedstawiona mi do oceny praca całkowicie spełnia warunki
stawiane rozprawom doktorskim przez ustawę o stopniach i tytule naukowym i przedstawiam
Radzie Wydziału Informatyki Politechniki Poznańskiej wniosek o przeprowadzenie
publicznej obrony rozprawy doktorskiej mgr. inŜ. Kamila KWARCIAKA.
Prof. dr hab. Wojciech T. Markiewicz
Instytut Chemii Bioorganicznej PAN
Noskowskiego 12/14, 61-704 Poznań
tel.: 61 8528503
e-mail: [email protected]
Download