INSTYTUT CHEMII BIOORGANICZNEJ POLSKA AKADEMIA NAUK Noskowskiego 12, 61-704 Poznań tel.: +48 61 8528503, +48 61 8528919 fax: +48 61 8520532, e-mail: [email protected] Poznań, 24 czerwca 2013 Recenzja rozprawy doktorskiej mgr. inŜ. Kamila KWARCIAKA pt. „Modele grafowe i algorytmy dla klasycznego problemu sekwencjonowania DNA przez hybrydyzację oraz dla jego odmiany z informacją o powtórzeniach” Poznanie w ostatnich latach genomu człowieka, a takŜe genomów bardzo wielu innych organizmów Ŝywych stwarza szansę na poznanie mechanizmów Ŝycia, a takŜe na praktyczne wykorzystanie tej wiedzy dla poprawy zdrowia ludzi i harmonicznego rozwoju ekosfery. Poznanie genomowych sekwencji DNA, jest obecnie bardzo często etapem wstępnym do określenia struktury i funkcji białek „in silico”, poprzedzającym ich izolację i badania bezpośrednie. Badania bezpośrednie zawsze, albo przynajmniej jeszcze bardzo długo, pozostaną najlepszym sposobem ich poznania. Nie zmienia to faktu, Ŝe poznanie sekwencji kwasów nukleinowych, tzn. ich sekwencjonowanie (DNA), mimo Ŝe poznano juŜ genomy wielu organizmów, nie tylko nie traci aktualności, ale nabiera wielkiego znaczenia poznawczego i praktycznego. W tym miejscu odwołać się moŜna chociaŜby do załoŜeń medycyny spersonalizowanej. Wiedza na temat sekwencji genomów nagromadzona została w ciągu trzech dziesięcioleci dzięki wykorzystaniu róŜnych metod sekwencjonowanie DNA, chociaŜ główną z nich była metoda z wykorzystaniem dideoksynukleotydów i jej warianty. Obecnie z powodzeniem wykorzystuje się inne metody sekwencjonowania, najczęściej określane jako „sekwencjonowanie przez syntezę”. Wśród metod sekwencjonowania opracowywanych wcześniej znajduje się tzw. sekwencjonowanie przez hybrydyzację (SBH) i mimo, Ŝe nie doczekało się ono dotychczas implementacji większość jego aspektów teoretycznych, które naleŜało i naleŜy rozwiązać, ma znaczenie ogólniejsze, nie ograniczone tylko do samego problemu sekwencjonowania DNA. Ponadto, rozwaŜania teoretyczne wokół SBH okazują się aktualne nie tylko dla sekwencjonowania, czy zagadnień pokrewnych w biologii molekularnej, ale są istotą takŜe zupełnie odrębnych dziedzin. Tu przykładem są zastosowania w automatyce, robotyce poprzez tzw. problem Orienteering. To naturalnie jeden z wielu przykładów, których jakieś matematyczne ujęcie problemu poprawnie opisuje róŜne z pozoru dziedziny. Poszukiwania nowych metod sekwencjonowania DNA, koncentracja na poszukiwaniach metod sekwencjonowania pojedynczych cząsteczek DNA (RNA), zainteresowanie przyspieszeniem sekwencjonowania i stałym obniŜeniem jego kosztów stwarzają sytuację, w której nie moŜna wykluczyć praktycznej realizacji „klasycznego’ SBH lub jakiegoś z jego wariantów. W nurt tych prac metodycznych wpisuje się bardzo dobrze praca doktorska mgr. inŜ. Kamila KWARCIAKA, przygotowana pod kierunkiem dr. hab. inŜ. Piotra FORMANOWICZA, prof. nadzw. IChB PAN i Politechniki Poznańskiej. Zespół prof. Piotra FORMANOWICZA w Instytucie Informatyki Wydziału Informatyki Politechniki Poznańskiej i Zakładzie Bioinformatyki Instytutu Chemii Bioorganicznej PAN w Poznaniu od szeregu lat podejmuje próby rozwiązywania najistotniejszych problemów biologii obliczeniowej. Tak jest i tym razem. Ten waŜny problem biologii obliczeniowej doczekał się oryginalnego rozwiązania poprzez zaprojektowanie i implementację algorytmów przybliŜonych (zachłanny, przeszukiwanie tabu, kolonia mrówek) dla problemu sekwencjonowania DNA przez hybrydyzację z uwzględnieniem informacji o powtórzeniach. Rozprawa doktorska mgr. inŜ. Kamila KWARCIAKA została spisana na 110 stronach, ma 11 rozdziałów, w tym podsumowanie i spis literatury liczący 69 pozycji. W rozdziale pierwszym stanowiącym wprowadzenie do rozprawy doktorskiej Doktorant określił sekwencjonowanie DNA, a w szczególności jego wariant opierający się na hybrydyzacji kwasów nukleinowych, jako jeden z najbardziej istotnych problemów biologii molekularnej i obliczeniowej. Na tym tle zarysował cel i zakres rozprawy doktorskiej. W Rozdziale 2 Doktorant przedstawił podstawowe zagadnienia biologii molekularnej: opisał budowę kwasów nukleinowych tzw. centralny dogmat biologii molekularnej. Zrobił to jasno i zwięźle. W Rozdziale 3 opisane zostały współczesne, podstawowe metody sekwencjonowania DNA: Sangera (dideoksynukleotydowa), Maxama-Gilberta (chemiczna), pirosekwencjonowanie (wariant 454), sekwencjonowanie przez syntezę w wariancie firm Solexa/Illumina, a w końcu takŜe bardziej szczegółowo samo SBH. To dobre wprowadzenie dla czytelnika bez znajomości istoty problemu sekwencjonowania. W następnym rozdziale omówione zostały podstawy matematyczne i informatyczne problemu, w tym kwestie złoŜoności obliczeniowej wraz z podstawowymi definicjami, podstawy teorii algorytmów, podstawy teorii grafów oraz algorytm aproksymacyjny dla problemu komiwojaŜera w grafie skierowanym. Kolejny rozdział (5) opisuje problemy obliczeniowe i istniejące modele grafowe związane z sekwencjonowaniem przez hybrydyzację. W Rozdziale 6 Doktorant dyskutuje modele grafowe dla problemów SBH z dodatkową informacją o powtórzeniach i jest to juŜ dyskusja i rozwiązywanie podstawowego problemu badawczego pracy doktorskiej. Zakładając moŜliwość pozyskania dokładnej informacji o powtórzeniach doktorant dochodzi do stwierdzenia podobieństwa tej sytuacji w SBH do problemu Orienteering, a właściwie pewnego jego szczególnego wariantu. Logiczne rozwinięcie dyskursu prowadzi do zaproponowania rozwiązania problemu obliczeniowego z wykorzystaniem algorytmu aproksymacyjnego oraz podejść heurystycznych w kolejnych rozdziałach (7 i 8). Wyniki eksperymentów obliczeniowych posłuŜyły do oceny algorytmów, ich skuteczności i poprawności dostarczania prawidłowych rozwiązań. Obliczenia przeprowadzono na sztucznie skonstruowanych zestawach danych wyjściowych, ale ostatecznie skonfrontowano je z obliczeniami dla sekwencji DNA zawierających naturalne powtórzenia. We wszystkich przypadkach analizowano wykorzystanie klasycznych zestawów danych tzn. l-merów o jednakowej długości, jak i pochodzących z tzw. bibliotek izotermicznych. Otrzymane wyniki potwierdziły pozytywny wpływ na rekonstrukcję sekwencji nawet częściowej informacji o powtórzeniach. Dla wszystkich algorytmów zastosowanie jej prowadziło do otrzymania znacząco lepszych wyników. Algorytmem najlepiej rozwiązującym problem obliczeniowy okazał się algorytm przeszukiwania tabu. Pozwolił on na osiągnięcie najwyŜszej jakości rozwiązań. Moja ocena rozprawy doktorskiej jest bardzo pozytywna. Problem rozwaŜany w pracy i jego dyskusja, rozwiązania mają znaczenie nie tylko dla biologii obliczeniowej, ale takŜe innych dyscyplin obliczeniowych o duŜym znaczeniu praktycznym. Przedstawione przez doktoranta wyniki dowodzą takŜe bardzo dobrego opanowania metod informatycznych zarówno od strony teoretycznej, jak i praktycznej. Reasumując stwierdzam, Ŝe przedstawiona mi do oceny praca całkowicie spełnia warunki stawiane rozprawom doktorskim przez ustawę o stopniach i tytule naukowym i przedstawiam Radzie Wydziału Informatyki Politechniki Poznańskiej wniosek o przeprowadzenie publicznej obrony rozprawy doktorskiej mgr. inŜ. Kamila KWARCIAKA. Prof. dr hab. Wojciech T. Markiewicz Instytut Chemii Bioorganicznej PAN Noskowskiego 12/14, 61-704 Poznań tel.: 61 8528503 e-mail: [email protected]