Bioinformatyka - Laboratorium nr.2 Zadanie 1 - ¡czenie i konwersja zmiennych. a) Sprawd¹ wynik komend: print('The answer is %s0 %42) lub u»yj print('The answer is', str(42)) b) wykonaj konwersj¦ dowolnych 3-ró»nych zmiennych, korzystaj¡c z 3-ch dowolnych funkcji: int(x) - konwersja zmiennej x do int, long(x) - konwersja zmiennej x do long-a, oat(x) - konwersja x do oat'a, complex(real [,imag]) - zapis liczby zespolonej, str(x) - konwersja do string zmiennej x, tuple(s) - konwersja do krotki, list(s) - konwersja do listy, chr(x) - konwersja integer do znaku, unichr(x)- konwersja integer do Unicode, hex(x)-konwertuje integer do postaci hexadecymalnej, oct(x)-konwertuje integer do postaci ósemkowej Zadanie 2 Sªowniki. a) W skªad biaªek wchodzi 20 ró»nych rodzajów aminokwasów biaªkowych, ka»dy z nich ma skrót 1 lub 3 literowy np. A-Ala-alanina (patrz Rys.1). Poni»ej przedstawiono kilka z nich w zbiorze o nazwie amino. Sprawd¹ wynik komend: amino = {'A':'Ala','C':'Cys','E':'Glu'} lub u»yj amino = dict(A='Ala', C='Cys', D='Glu') print(” C jest oznaczeniem dla: "+amino['C']) amino['A'] amino.items() amino.keys() amino.values() oraz Przykªad aa in amino.values(): print(aa) for Rysunek 1: Aminokwasy b) okre±l wynik dziaªa« nast¦puj¡cych operatorów tj.&, |, −, ∧ na poni»sze zbiory: zbior1 =set(['CP0.1','EF3.1','EF3.1']) zbior2 = set(['CP0.2','EF3.1','EF3.2']) wynik = zbior1 & zbior2 itd. Pytanie: jakim operacjom matematycznym na zbiorach odpowiadaj¡ rezultaty dziaªa« w/w funkcji. Zadanie 3 Moduªy Utwórz funkcj¦ o nazwie silnia, która obliczy warto±¢ silni dla zmiennej zdeklarowanej przez u»ytkownika, zapisz w/w funkcj¦ do pliku sil.py, nast¦pnie napisz skrypt który obliczy dwumian Newtona n!/(k!(n-k)!) wykorzystuj¡c moduª sil. Uwaga: pami¦taj o import nazwa moduªu. Zadanie 4 Sekwencje DNA Sekwencja DNA jest to kolejno±¢ nukleotydów w cz¡steczce DNA. Oznaczana jest za pomoc¡ skrótów od zasad wchodz¡cych w skªad nukleotydów. Analogicznie, sekwencja RNA jest to kolejno±¢ nukleotydów w cz¡steczce RNA (w RNA nie wyst¦puje tak jak w DNA tymina "T", zamiast niej wyst¦puje uracyl "U"). Przykªad: gdyby ni¢ koduj¡ca DNA byªa okre±lona jako CCGATTACGT (A-adeina, G-guanina, C-cytozyna, T-tymina) to powy»sza sekwencja mRNA wygl¡daªaby nast¦puj¡co: CCGAUUACGU. Rysunek 2: Proces transkrypcji, czyli przepisywanie informacji zawartej w DNA na RNA a) zapoznaj si¦ z ilustracj¡ Rys.2 przedstawiaj¡c¡ proces transkrypcji (górn¡ ni¢ DNA nazywamy matrycow¡), zwró¢ uwag¦ na poª¡czenia nici DNA. 1 Twoim zadaniem jest utworzenie programu, który umo»liwi wykonanie u»ytkownikowi transkrypcji kodu DNA na RNA dla podanej przez u»ytkownikownika sekwencji DNA (ni¢ matrycowa). b) zmodykuj wcze±niej napisany program tj. poinformuj u»ytkownika o niepoprawno±ci danych je±li poda liczb¦ nukleotydów mniejsz¡ ni» 10 lub wi¦ksz¡ ni» 25. Zadanie 5 Aminokwasy Aminokwasy s¡ budulcem biaªek. Ka»dy z aminokwasów ma indywidualn¡ wag¦. Podczas tworzenia biaªka, ka»de wi¡zanie aminokwasu uwalnia cz¡steczki wody (o masie cz¡steczkowej M=18). Aby obliczy¢ mas¦ biaªka nale»y odj¡¢ mas¦ wszystkich uwalnianych cz¡steczek wody od caªkowitej masy aminokwasów wchodz¡cych w skªad biaªka. a) wczytaj plik tekstowy zawieraj¡cy mas¦ poszczególnych aminokwasów aminowaga.txt zawieraj¡cy dane: {”A":89,”V":117,”L":131,”I":131,”P":115,”F":165, ”W":204,”M":149,”G":75,”S":105,”C":121,”T":119, ”Y":181,”N":132,”Q":146,”D":133,”E":147, ”K":146,”R":174,”H":155} Twoim zadaniem jest utworzenie programu, który umo»liwi obliczenie masy biaªka dla podanej przez u»ytkownika sekwencji aminokwasów. Przykªadowa sekwencja aminokwasów np. MKTFVLHIFIFALVAF b) dla zbioru=UUCUCGGACCUGGAGAUUCACAGU, oblicz ile razy w w/w zbiorze wyst¦puj¡ kombinacje liter: UCU, UCC, UCA, UCG, AGU lub AGC c) Ka»dy aminokwas jest zbudowany z kodonów, ka»dy kodon skªada si¦ z 3 nukleotydów (patrz Rys.3), aminokwas o nazwie seryna skªada si¦ z kodonu: UCU, UCC, UCA, UCG, AGU lub AGC. Znaj¡c fragment sekwencji nukleotydów biaªka tj. UUCUCGGACCUGGAGAUUCACAGU napisz program który ustali ile razy wyst¦puje w nim aminokwas seryna, rozwa» nast¦puj¡ce przypadki podziaªu: - UUC UCG GAC CUG GAG AUU CAC AGU - U UCU CGG ACC UGG AGA UUC ACA GU - UU CUC GGA CCU GGA GAU UCA CAG U Rysunek 3: Proces translacji PRZYPOMINAMY FUNKCJE Rysunek 4: 2