Podstawy i zastosowania bioinformatyki II

advertisement
Podstawy i zastosowania
bioinformatyki II
Marek Kudła
BLAST
Jak działa BLAST?
AGI
podobne
np.
AGI
niepodobny
BAZA
DANYCH
np. FGT
AGL
AGV
BLAST
Sekwencja
białkowa
Sekwencja
DNA
blastn
blastx
tblastn
blastp
tblastx
Pfam – Protein families
• Białka można grupować w rodziny na podstawie
podobieństwa JEDNAK
• Często można wyróżnić określony motyw –
domenę, czy sekwencję peptydową, która
występuje u różnych, niespokrewnionych ze
sobą pod innym względem białek.
• Taka domena często ma określoną specyficzną
funkcję, np. aktywność helikazy, czy
rybonukleazy
Baza danych Pfam zawiera informacje o takich domenach
– opis funkcjonalny domeny, linki do struktur
krystalograficznych oraz prawdopodobną sekwencję
domeny w postaci multiple alignment lub Position Specific
Score Matrix
Znanych jest 7600 takich domen.
74% białek posiada przynajmniej jedną domenę w bazie
Pfam.
Multiple alignment dla domen
Position Specific Score Matrix
Pozycja 1: V 0,3 ; G 0,02 ; L 0,68
Pozycja 2: L 0,6 ; M 0,2 ; C 0,2
Pozycja 3: D 0,1 ; F 0,01 ; G 0,01 ; H 0,88
………
………
………
Pozycja N: A 0,99 ; G 0,01
PSI-BLAST
Download