Zastosowanie metod opartych na teorii grafów do

advertisement
„Zastosowanie metod opartych na teorii grafów
do rozwiązywania wybranych problemów analizy sekwencji
nukleotydowych i aminokwasowych”
Tomasz Głowacki
Stypendysta projektu pt. „Wsparcie stypendialne dla doktorantów na kierunkach uznanych za
strategiczne z punktu widzenia rozwoju Wielkopolski”, Poddziałanie 8.2.2 Programu
Operacyjnego Kapitał Ludzki
W drugiej połowie XX wieku rozpoczął się ogromny postęp we wszystkich
dziedzinach biologii molekularnej. Powstały i rozwinęły się zupełnie nowe gałęzie nauki na
pograniczu nauk podstawowych: matematyki i biologii. Przykładem nowej, szybko
rozwijającej się nauki jest bioinformatyka. W bioinformatyce z powodzeniem stosuje się
skomplikowane modele matematyczne, by przedstawić zachodzące w przyrodzie procesy lub
wspomóc
przetworzenie
ogromnej
ilości
informacji.
Teoria
grafów
jest
często
wykorzystywana w modelowaniu problemów bioinformatycznych. Warto by tu wspomnieć
modele grafowe
wykorzystywane
w sekwencjonowaniu
DNA,
modelowaniu
drzew
filogenetycznych, czy przewidywaniu funkcji białek.
Autor rozprawy skupia się na analizy sekwencji białek i DNA oraz proponuje własne
modele grafowe do rozwiązania zagadnień związanych z sekwencjami: rekonstrukcja
sekwencji białkowych na podstawie eksperymentów chemicznych oraz projektowanie
bibliotek sekwencji DNA o minimalnej wzajemnej chęci do hybrydyzacji. Jednym z
ważniejszych problemów biologii obliczeniowej jest ustalanie budowy peptydów. Peptydy są
to wielocząsteczkowe związki składające się z aminokwasów połączonych w długie
sekwencje. Długie peptydy, o masie powyżej 10000 daltonów, nazywane są białkami.
Znajomość budowy białek pozwala na przewidywanie ich funkcji w organizmie, a co za tym
idzie, może mocno wesprzeć przemysł farmaceutyczny w projektowaniu leków. Pierwszym
krokiem w celu określenia budowy białek jest rozpoznanie sekwencji aminokwasów w
cząsteczce. Brak bezpośrednich metod chemicznych do rozpoznania długich sekwencji
aminokwasowych
rodzi
naturalną
potrzebę
zastosowania
metod
informatycznych
umożliwiających odtworzenie tego rodzaju sekwencji. Rozpoznawanie krótkich łańcuchów
peptydowych nazywamy sekwencjonowaniem. Współczesne metody chemii analitycznej
pozwalają na określenie sekwencji peptydów nieprzekraczających 50 aminokwasów (metoda
Praca doktorska współfinansowana ze środków Unii Europejskiej w ramach
Europejskiego Funduszu Społecznego
Edmana). Szybko rozwijającą sią metodą ustalania sekwencji związków chemicznych, w tym
białek, jest spektrometria masowa. Wynikiem działania spektrometru jest widmo masowe
przedstawiające statystyczny rozkład jonów o różnej masie w oryginalnej cząsteczce. W
pracy analizuje się jeden z problemów sekwencjonowania i proponuje wielomianowy
algorytm do jego rozwiązania.
Wdrożenie wyników pracy pozwoli na wzrost poznańskiego ośrodka naukowego na
arenie międzynarodowej i umożliwi rozszerzenie prowadzonej przez ośrodek współpracy.
Dzięki dofinansowaniu z programu Innowacyjna Gospodarka, w Poznaniu został zakupiony
nowoczesny spektrometr masowy. Zaproponowany w pracy wydajny algorytm pozwalający
odtworzyć sekwencję białkową oraz przedstawione w pracy wydajne i skuteczne metody
analizy danych spektrometrycznych, gdy w posiadaniu ośrodka jest to specjalistyczne
urządzenie, pozwolą poznańskiemu ośrodkowi naukowemu stać się konkurencyjnym na
świecie laboratorium w badaniu tych związków chemicznych.
Praca doktorska współfinansowana ze środków Unii Europejskiej w ramach
Europejskiego Funduszu Społecznego
Download