Podstawy i zastosowania bioinformatyki II Marek Kudła BLAST Jak działa BLAST? AGI podobne np. AGI niepodobny BAZA DANYCH np. FGT AGL AGV BLAST Sekwencja białkowa Sekwencja DNA blastn blastx tblastn blastp tblastx Pfam – Protein families • Białka można grupować w rodziny na podstawie podobieństwa JEDNAK • Często można wyróżnić określony motyw – domenę, czy sekwencję peptydową, która występuje u różnych, niespokrewnionych ze sobą pod innym względem białek. • Taka domena często ma określoną specyficzną funkcję, np. aktywność helikazy, czy rybonukleazy Baza danych Pfam zawiera informacje o takich domenach – opis funkcjonalny domeny, linki do struktur krystalograficznych oraz prawdopodobną sekwencję domeny w postaci multiple alignment lub Position Specific Score Matrix Znanych jest 7600 takich domen. 74% białek posiada przynajmniej jedną domenę w bazie Pfam. Multiple alignment dla domen Position Specific Score Matrix Pozycja 1: V 0,3 ; G 0,02 ; L 0,68 Pozycja 2: L 0,6 ; M 0,2 ; C 0,2 Pozycja 3: D 0,1 ; F 0,01 ; G 0,01 ; H 0,88 ……… ……… ……… Pozycja N: A 0,99 ; G 0,01 PSI-BLAST