Bioinformatyka Laboratorium, 30h Michał Bereta [email protected] www.michalbereta.pl Zasady zaliczenia przedmiotu • Kolokwia (3 – 4 ) • Ocena aktywności i przygotowania • Obecnośd Literatura, materiały • Bioinformatyka i ewolucja molekularna Paul G. Higgs, Teresa K. Attwood • Bioinformatyka. Podręcznik do analizy genów i białek A.D. Baxevanis (red.), B.F.F. Ouellette (red.) • http://www.bioinformatyk.eu/ Narzędzia programistyczne Python • www.python.org • http://www.trypython.org/ • http://biopython.org/wiki/Biopython R • http://www.r-project.org/ • http://www.bioconductor.org/ Bioinformatyka Definicja Bioinformatyka – interdyscyplinarna dziedzina nauki obejmująca wykorzystanie metod obliczeniowych do badania danych biologicznych. • Rozwój metod obliczeniowych służących do badania struktury, funkcji i ewolucji genów, białek i całych genomów • Rozwój metod wykorzystywanych do zarządzania i analizy informacji biologicznej gromadzonej w toku badao genomicznych oraz badao prowadzonych z zastosowaniem wysokoprepustowych technik eksperymentalnych. Bioinformatyka Nie mylid z pojęciem: Algorytmy genetyczne (jest to grupa metod inteligencji obliczeniowej, które w swoim działaniu wzorują się na mechanizmach ewolucji). Bioinformatyka Cele bioinformatyki • Obsługa rosnących baz danych biologicznych • Wyszukiwanie informacji w bazach danych biologicznych (również bazach publikacji) • Analiza, dopasowanie sekwencji nukleotydów • Lokalizacja genów • Przewidywanie struktury i funkcji białek na podstawie sekwencji • Analiza ekspresji genów (analiza mikromacierzy) • Projektowanie leków • Ewolucja molekularna • Biologia systemowa (ang. System biology) - badanie złożonych oddziaływao występujących w systemach biologicznych • … Zakres przedmiotu • • • • • • Rys historyczny Biologiczne bazy danych Analiza sekwencji Metody grupowania danych Konstrukcja drzew filogenetycznych Wykorzystanie języków programowania Python/ R Bioinformatyka Bioinformatics vs. Computational Biology Bioinformatyk – biolog wykorzystujący metody obliczeniowe do rozwiązania problemów biologicznych Computational biologists – opracowuję teorie, metody, algorytmy na potrzeby bioinformatyki Bioinformatyka Ewolucja – różnicowanie się materiału genetycznego Ewolucja molekularna – porównawcze analizy na poziomie molekularnym między gatunkami Genetyka populacyjna – badanie zróżnicowania genetycznego u osobników tego samego gatunku Bioinformatyka Rys historyczny 1982 – Utworzenie bazy GeneBank 1986 - Projekt poznania genomu ludzkiego 2000 – Ukooczenie prac nad ogólną sekwencją … - Eksplozja danych -> Bioinformatyka Bioinformatyka Rys historyczny Bioinformatyka Bioinformatyka Bioinformatyka Zależnośd wykładnicza Zależnośd liniową widoczną na wykresach otrzymujemy przez wzięcie logarytmu obu stron równania Bioinformatyka Bioinformatyka Bazy danych Bioinformatyka Bazy danych Bioinformatyka Cztery główne rodzaje danych w bioinformatyce Bioinformatyka Bioinformatyka Bioinformatyka Bioinformatyka Bioinformatyka Bioinformatyka Genomika – dziedzina biologii molekularnej i biologii teoretycznej (pokrewna genetyce i ściśle związana z bioinformatyką) zajmująca się analizą genomu organizmów. Głównym celem genomiki jest poznanie sekwencji materiału genetycznego oraz mapowanie genomu ale również określenie wszelkich zależności i interakcji wewnątrz genomu. Bioinformatyka Bioinformatyka Przewidywanie struktury i właściwości białek - struktura drugo-, trzeciorzędowa Proteomika – gałąź nauki zajmująca się badaniem białek - ich struktury, sprawowanych przez nie funkcji i zależności między nimi. Bioinformatyka • DNA – kwas deoksyrybonukleinowy • RNA – kwas rybonukleinowy • Zasady azotowe – – – – – Adenina (A) Tymina (T) Guanina (G) Cytozyna (C) Uracyl (U) (zastępuje tyminę w RNA) • Parowanie – C-G – A-T Bioinformatyka • fosfocukrowy szkielet cząsteczki RNA Bioinformatyka Podstawową jednstką budulcową kwasów nukleinowych są nukleotydy. Nukleotyd = cząsteczka zasady azotowej+cukier (ryboza)+reszta fosforanowa Nukleotydy występują nie tylko w formie łaocuchów. Bioinformatyka Bioinformatyka Bioinformatyka Bioinformatyka Szkielet cząsteczki białka W ramkach zaznaczone wiązania peptydowe. Bioinformatyka • Aminokwasy – – – – – – – – – – – – – – – – – – – – Kwas asparginowy Kwas glutaminowy Tryptofan Fenyloalanina Glicyna Alanina Walina Izoleucyna Leucyna Metionina Prolina Lizyna Arginina Histydyna Tyrozyna Seryna Treonina Asparagina Glutamina Cysteina Bioinformatyka Analiza podobieostwa aminokwasów za pomocą metod grupowania hierarchicznego Bioinformatyka Centralny Dogmat Biologii Molekularnej DNA RNA transkrypcja Białka translacja Bioinformatyka Kod genetyczny – jak sekwencje nukleotydów przekładają się na sekwencje aminokwasów Tłumaczeniu podlegają trójki nukleotydów, tzw. kodony Kodonów (64) jest więcej niż aminokwasów (20). Większości aminokwasów odpowiada więcej niż jeden kodon. Bioinformatyka Dopasowanie sekwencji Bioinformatyka Bioinformatyka Drzewo filogenetyczne (drzewo rodowe) – graf acykliczny przedstawiający ewolucyjne zależności pomiędzy sekwencjami lub gatunkami wszystkich organizmów żywych(analogicznie do pokrewieostwa w rodzie ludzkim zobrazowanym przez drzewo genealogiczne). Jest to rodzaj dendrogramu, w którym podstawa (pieo) drzewa filogenetycznego symbolizuje wspólnego przodka taksonów znajdujących się wyżej (czyli bardziej współczesnych i wyżej stojących ewolucyjnie), konary odpowiadają taksonom potomnym; długośd gałęzi, a czasem również kąt pomiędzy nimi, określają tempo zachodzących przemian ewolucyjnych. Bioinformatyka Bioinformatyka Bioinformatyka