b) zapoznaj się z opisem algorytmu/narzędzia BLAST 1

advertisement
09.12.15
Bioinformatyka
Laboratorium 7
Rozwiązania należy przesłać najpóźniej do dn. 15.12.15
Zadanie 1. Źródło informacji oraz narzędzia: NCBI (National Center for Biotechnology Information)
https://www.ncbi.nlm.nih.gov
a) NCBI obejmuje dostęp do szeregu różnych baz danych, określ:
 liczbę baz nukleotydowych tj. DNA oraz RNA dostępnych poprzez NCBI?
DNA/ liczba baz ............
RNA/ liczba baz ............
 opisz krótko tematykę bazy GenBank (min.3-4 zdania)
.....................................
.....................................
.....................................
.....................................
 opisz krótko tematykę bazy PubMed
.....................................
.....................................
.....................................
.....................................
 opisz krótko tematykę bazy Structure (Molecular Modeling Database)
.....................................
.....................................
.....................................
.....................................
b) zapoznaj się z opisem algorytmu/narzędzia BLAST 1
c) korzystając z właściwego narzędzia tj. blastp, blastn, tblastn, tblastp lub blastx dostępne na
http://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&PAGE_TYPE=BlastSearch&LINK_LOC=blas
thome:


zidentyfikuj do jakiego organizmu należy następująca sekwencja białkowa:
MLLLGAVLLLLALPSLGQETTEKPGALLPMPKGACAGWMAGIPGHPGHNGTPGRDGRDG
VPGEKGEKGDTGLTGPKGDTGESGVTGVEGPRGFPGIPGRKGEPGESAYVYRSAFSVGLET
RVTVPNMPIRFTKIFYNQQNHYDVTTGKFHCNIPGLYYFSFHITVYLKDVKVSLYKKDKAV
LFTYDQYQDKNVDQASGSVLLYLEKGDQVWLQAYGDEENNGVYADNVNDSIFTGFLLYH
NIE
nazwa organizmu
............................
wyszukaj 10 najbardziej podobnych sekwencji (obserwuj parametr Ident)
wykonaj nakładanie wybranych sekwencji i określ domeny2 (odrębne strukturalnie fragmenty
białek) i ustal ich nazwę.
Informacje dodatkowe o algorytmie BLAST (autorzy: studenci Wydziału Biologii UWM w
Olsztynie): http://www.uwm.edu.pl/bioinfo/dydaktyka/ncbi/BLAST_handbook.pdf
1
Informacje dodatkowe o strukturze białek (autor dr E. Banachowicz)
http://www.staff.amu.edu.pl/~ewas/pracownia/biomono/Bioinformatyka_skrypt2_2.pdf
2
identyfikatory 10 sekwencji: ...........................................................................
domena nr 1...........................................nazwa..................................................
domena nr 2...........................................nazwa.................................................. itd

wykonaj drzewo filogenetyczne
Ilustracja drzewa filog.
Zadanie 2. Dla znacznika sekwencji, który podlega ekspresji (tzw. sekwencja EST)
TTCACTCTCATTGCATGTAGTGAGGACCAAGGTGAAGGACCCTTCTCAAACCATGGTGA
TTAGGATCAATAAGGTAATCAACCAATCTATCAATCAGTCATCCAGTCAGTCAATCATTA
GTGTACTGATTTATGCAGTCTTTAGCTTGTTGATGAATTAAACAAACAAAAAAACAGCAT
CTATAGCCTACATTAATCGTATATTAATCACATTTATCTCTTCCTCCAGCTGGATATATC
TCCTAACCTAATCGAGGGCATGGACCCATTTCTCCCTGCGGCTGCAGTAGATCAGCATAT
AGAAAGTCTGCCTTCCATAATGGAGACCATGGGGTTCTACCAGGACCTAATGCTCTTCCT
AGACTGGGCAGACCTCAAACAGGTGGTGGAAGACACCTCCACTATGAGGGGTCTGCTGGA
GAACTGGATGATA
określ:
 jakie białko ta sekwencja może kodować?
nazwa białka ...............................
 białka homologiczne do białka, które może ta sekwencja kodować (zastosuj blastx)
nazwy białek homologicznych .............................................
Zadanie 3. Źródło informacji oraz narzędzia: PDB http://www.rcsb.org/pdb/home/home.do - baza
danych, w której gromadzi się informacje o strukturze przestrzennej makrocząstek (białka, peptydy,
wirusy, kwasy nukleinowe, kompleksy białko/kwasy nukleinowe, węglowodany)
 wskaż aktualną liczbę struktur zdeponowanych w bazie PDB wraz z datą ostatniej aktualizacji bazy
liczba struktur wynosi .................
data aktualizacji...................
 podaj nazwę makrocząsteczki obecnego miesiąca i opisz (2 zdania) dlaczego jest ona interesująca.
nazwa cząsteczki .......................
opis .............................................
 Wymień rodzaje statystyk, które są udostępnione poprzez PDB?
rodzaje statystyk...............................................................................................................
 Korzystając z Search → PDB Statistics wskaż 2-3 najpopularniejsze grupy przestrzenne
obserwowane dla struktur makromolekuł
 krótko opisz co zawierają zakładki:
Deposit - ........................................................................
Search ............................................................................
Visualize ........................................................................
Analyze ...........................................................................
Learn ...............................................................................
Zadanie 4. Korzystając z wyszukiwarki znajdź struktury Hydrolases. W jakich organizmach występuje?
Ilustracje struktur
nazwy organizmów: ................................................................................................................................
Zadanie 5.
Korzystając z bazy PDB sprawdź jak wygląda struktura białka do której należy sekwencja z zadania 1.
Ilustracja struktury
Zadanie 6. Źródło informacji oraz narzędzia: UNIPROT (http://www.uniprot.org/)

Odszukaj w w/w bazie sekwencję arylosulfatazy B należącej do człowieka, wskaż:
a) ID tej sekwencji
..................................
b) choroby związane są z nieprawidłowym działaniem tego enzymu
....................................
c) Wskaż źródła schorzeń i objawy im towarzyszące
.............................................................................................
Download