09.12.15 Bioinformatyka Laboratorium 7 Rozwiązania należy przesłać najpóźniej do dn. 15.12.15 Zadanie 1. Źródło informacji oraz narzędzia: NCBI (National Center for Biotechnology Information) https://www.ncbi.nlm.nih.gov a) NCBI obejmuje dostęp do szeregu różnych baz danych, określ: liczbę baz nukleotydowych tj. DNA oraz RNA dostępnych poprzez NCBI? DNA/ liczba baz ............ RNA/ liczba baz ............ opisz krótko tematykę bazy GenBank (min.3-4 zdania) ..................................... ..................................... ..................................... ..................................... opisz krótko tematykę bazy PubMed ..................................... ..................................... ..................................... ..................................... opisz krótko tematykę bazy Structure (Molecular Modeling Database) ..................................... ..................................... ..................................... ..................................... b) zapoznaj się z opisem algorytmu/narzędzia BLAST 1 c) korzystając z właściwego narzędzia tj. blastp, blastn, tblastn, tblastp lub blastx dostępne na http://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastp&PAGE_TYPE=BlastSearch&LINK_LOC=blas thome: zidentyfikuj do jakiego organizmu należy następująca sekwencja białkowa: MLLLGAVLLLLALPSLGQETTEKPGALLPMPKGACAGWMAGIPGHPGHNGTPGRDGRDG VPGEKGEKGDTGLTGPKGDTGESGVTGVEGPRGFPGIPGRKGEPGESAYVYRSAFSVGLET RVTVPNMPIRFTKIFYNQQNHYDVTTGKFHCNIPGLYYFSFHITVYLKDVKVSLYKKDKAV LFTYDQYQDKNVDQASGSVLLYLEKGDQVWLQAYGDEENNGVYADNVNDSIFTGFLLYH NIE nazwa organizmu ............................ wyszukaj 10 najbardziej podobnych sekwencji (obserwuj parametr Ident) wykonaj nakładanie wybranych sekwencji i określ domeny2 (odrębne strukturalnie fragmenty białek) i ustal ich nazwę. Informacje dodatkowe o algorytmie BLAST (autorzy: studenci Wydziału Biologii UWM w Olsztynie): http://www.uwm.edu.pl/bioinfo/dydaktyka/ncbi/BLAST_handbook.pdf 1 Informacje dodatkowe o strukturze białek (autor dr E. Banachowicz) http://www.staff.amu.edu.pl/~ewas/pracownia/biomono/Bioinformatyka_skrypt2_2.pdf 2 identyfikatory 10 sekwencji: ........................................................................... domena nr 1...........................................nazwa.................................................. domena nr 2...........................................nazwa.................................................. itd wykonaj drzewo filogenetyczne Ilustracja drzewa filog. Zadanie 2. Dla znacznika sekwencji, który podlega ekspresji (tzw. sekwencja EST) TTCACTCTCATTGCATGTAGTGAGGACCAAGGTGAAGGACCCTTCTCAAACCATGGTGA TTAGGATCAATAAGGTAATCAACCAATCTATCAATCAGTCATCCAGTCAGTCAATCATTA GTGTACTGATTTATGCAGTCTTTAGCTTGTTGATGAATTAAACAAACAAAAAAACAGCAT CTATAGCCTACATTAATCGTATATTAATCACATTTATCTCTTCCTCCAGCTGGATATATC TCCTAACCTAATCGAGGGCATGGACCCATTTCTCCCTGCGGCTGCAGTAGATCAGCATAT AGAAAGTCTGCCTTCCATAATGGAGACCATGGGGTTCTACCAGGACCTAATGCTCTTCCT AGACTGGGCAGACCTCAAACAGGTGGTGGAAGACACCTCCACTATGAGGGGTCTGCTGGA GAACTGGATGATA określ: jakie białko ta sekwencja może kodować? nazwa białka ............................... białka homologiczne do białka, które może ta sekwencja kodować (zastosuj blastx) nazwy białek homologicznych ............................................. Zadanie 3. Źródło informacji oraz narzędzia: PDB http://www.rcsb.org/pdb/home/home.do - baza danych, w której gromadzi się informacje o strukturze przestrzennej makrocząstek (białka, peptydy, wirusy, kwasy nukleinowe, kompleksy białko/kwasy nukleinowe, węglowodany) wskaż aktualną liczbę struktur zdeponowanych w bazie PDB wraz z datą ostatniej aktualizacji bazy liczba struktur wynosi ................. data aktualizacji................... podaj nazwę makrocząsteczki obecnego miesiąca i opisz (2 zdania) dlaczego jest ona interesująca. nazwa cząsteczki ....................... opis ............................................. Wymień rodzaje statystyk, które są udostępnione poprzez PDB? rodzaje statystyk............................................................................................................... Korzystając z Search → PDB Statistics wskaż 2-3 najpopularniejsze grupy przestrzenne obserwowane dla struktur makromolekuł krótko opisz co zawierają zakładki: Deposit - ........................................................................ Search ............................................................................ Visualize ........................................................................ Analyze ........................................................................... Learn ............................................................................... Zadanie 4. Korzystając z wyszukiwarki znajdź struktury Hydrolases. W jakich organizmach występuje? Ilustracje struktur nazwy organizmów: ................................................................................................................................ Zadanie 5. Korzystając z bazy PDB sprawdź jak wygląda struktura białka do której należy sekwencja z zadania 1. Ilustracja struktury Zadanie 6. Źródło informacji oraz narzędzia: UNIPROT (http://www.uniprot.org/) Odszukaj w w/w bazie sekwencję arylosulfatazy B należącej do człowieka, wskaż: a) ID tej sekwencji .................................. b) choroby związane są z nieprawidłowym działaniem tego enzymu .................................... c) Wskaż źródła schorzeń i objawy im towarzyszące .............................................................................................