Spis treści 5 Budowa kwasów nukleinowych ...................................................................................................... 68 5.1 Nukleotydy ............................................................................................................................... 68 5.2 Łaocuch polinukleotydowy ...................................................................................................... 71 5.3 Nić komplementarna ............................................................................................................... 71 6 Centralny dogmat Biologii Molekularnej ....................................................................................... 74 7 Przepływ informacji genetycznej .................................................................................................... 76 7.1 Kod genetyczny ....................................................................................................................... 77 7.2 Rodzaje Mutacji ....................................................................................................................... 80 7.3 Poziomy mutacji ...................................................................................................................... 81 Skrypt Bioinformatyka DRAFT Strona 67 5 Budowa kwasów nukleinowych 5.1 Nukleotydy Kwasy nukleinowe (DNA i RNA) zbudowane są z nukleotydów. Nukleotydy zbudowane są z reszty cukrowej, zasady azotowej i reszty fosforanowej. Reszta cukrowa występująca w kwasach nukleinowych to pentoza: w DNA - deoksyryboza, która w pozycji 2 ma wodór zamiast grupy -OH (D-Deoksyryboza, 2-Deoksy-D-ryboza), a w RNA - ryboza. (Rysunek) H H 5' OH C H 5' OH O 1' 4' H 2' OH OH O 1' 4' H H 3' OH OH C H H 3' OH H H 2' H Rysunek. Ryboza i deoksyryboza. Zasady azotowe występujące w kwasach nukleinowych to puryny (R): adenina (A) i guanina (G), oraz pirymidyny (Y): tymina (T), cytozyna (C) i uracyl (U). W DNA występują A, G, T i C, w RNA zamiast T występuje U. Poza tymi pięcioma najbardziej znanymi zasadami w DNA i RNA występują jeszcze ich zmodyfikowane wersje. W DNA: 5-metylocytydyna (m5C), a RNA: pseudourydyna (Ψ), dihydrourydyna (D), inosyna (I), rybotymidyna (rT) i 7-metylguanosyna (m7G). Skrypt Bioinformatyka DRAFT Strona 68 puryny (R) pirymidyny (Y) H N H H 6 7 5 9 4 1 8 N 3 H N 2 3 H N 2 4 H N 6 5 1 N H H adenina (A) guanina (G) tymina (T) cytozyna (C) uracyl (U) Nukleozydy powstają w wyniku połączenia zasady azotowej z pentozą (węgiel C1) wiązaniem N-βglikozydowym. Zasady połączone z rybozą tworzą rybonukleozydy, a z deoksyrybozą deoksyrybonukleozydy. dA dG dT dC rA rG rU rC Skrypt Bioinformatyka DRAFT Strona 69 Reszta fosforanowa to reszta kwasu ortofosforowego, czyli nukleotydy są jego estrami: 5'-fosforany nukleozydów. 5'adenozyno monofosforan (AMP) : deoksy 5'adenozyno monofosforan (dAMP) : Skrypt Bioinformatyka DRAFT Strona 70 5.2 Łańcuch polinukleotydowy Nukleotydy łączą się wiązaniem fosfodiestrowym tworząc łańcuchy polinukleotydowe (DNA lub RNA) (rysunek: http://en.wikipedia.org/wiki/File:PhosphodiesterBondDiagram.png) [....] 5' i 3' koniec łańcucha więcej o nici DNA [....cdn] v 5.3 Nić komplementarna Skrypt Bioinformatyka DRAFT Strona 71 [....] wiązania wodorowe między nukleotydami, pary komplementarne, nić komplementarna [....] DNA i RNA - jedno i dwuniciowe, różne formy helis DNA Skrypt Bioinformatyka DRAFT Strona 72 (Rysunek: http://en.wikipedia.org/wiki/File:A-DNA,_B-DNA_and_Z-DNA.png) A-DNA, B-DNA, Z-DNA Skrypt Bioinformatyka DRAFT Strona 73 6 Centralny dogmat Biologii Molekularnej • informacja genetyczna przechowywana jest w sekwencji zasad polimeru DNA • trójki (tryplety) zasad DNA kodują 20 naturalnych aminokwasów • sekwencja aminokwasów w białku determinuje jego strukturę • sekwencja i struktura determinują funkcję Bioinformatyka Skrypt Bioinformatyka DRAFT Strona 74 Złożoność informacji i procesów komórkowych Człowiek posiada 1013 KOMÓREK! – każda ma identyczny skład DNA o długości około 3,2x109pz ... identyczny skład, ale zróżnicowane typy komórek i różne funkcje tkanek ... z 3,2x109pz tylko 1.5% koduje białka! Wielkość genomu nie koreluje się ze złożonością organizmu wśród bezkręgowców i kręgowców można znaleźć większe genomy od ludzkiego - jeden z gatunków ameby ma aż 100x więcej DNA niż człowiek - na ogół genomy prokariotyczne są mniejsze od eukariotycznych - genom prokariotyczny ma wielkość poniżej 5Mpz (np. Escherichia coli 4,64 Mpz) Gen/Genom Skrypt Bioinformatyka DRAFT Strona 75 GENOM... 7 Przepływ informacji genetycznej Skrypt Bioinformatyka DRAFT Strona 76 7.1 Kod genetyczny -translacja Otwarte ramki odczytu (ORF) otwarte ramki odczytu – ORF (Open Reading Frame). wszystkie możliwe sekwencje DNA rozpoczynające się kodonem ATG (kodon inicjujący translację) i kończące TAG, TAA lub TGA (kodony „stop”) w tej samej fazie odczytu. Skrypt Bioinformatyka DRAFT Strona 77 1' sekwencja czytana od pierwszego nukleotydu: +1, pierwsza ramka odczytu 2' sekwencja czytana od drugiego nukleotydu: +2, druga ramka odczytu 3' sekwencja czytana od trzeciego nukleotydu: +3, trzecia ramka odczytu sekwencja nici komplementarnej czytana od pierwszego nukleotydu: -1, czwarta ramka odczytu sekwencja nici komplementarnej czytana od drugiego nukleotydu: -2, piąta ramka odczytu sekwencja nici komplementarnej czytana od trzeciego nukleotydu: -3, szósta ramka odczytu Skrypt Bioinformatyka DRAFT Strona 78 Skrypt Bioinformatyka DRAFT Strona 79 7.2 Rodzaje Mutacji J.T. den Dunnen, S.E. Antonarakis: Hum Genet 109(1): 121-124, 2001 Zmienność sekwencji (sequence variation) mutacje - zmiany odpowiedzialne za choroby polimorfizm - zmiany nie wywołujące chorób, spotykane w częściej niż w 1% populacji Rodzaje mutacji chromosomowa - aberracja chromosomowa to zmiana liczby lub struktury chromosomów. genomowa - utrata lub pojawienie się dodatkowych pojedynczych chromosomów, lub zwielokrotnieniu całego genomu (poliploidalność) genowa - zmiana dziedziczna zachodząca w genie, na poziomie kwasu dezoksyrybonukleinowego DNA Skrypt Bioinformatyka DRAFT Strona 80 7.3 Poziomy mutacji Opis zmian powinien być dokonywany na najbardziej podstawowym poziomie. Np. w przypadku DNA na sekwencji genomowej lub cDNA Zmiany opisuje się względem sekwencji pierwotnej zdeponowanej w bazie danych: GenBank, EMBL, DDJB, SWISS-Prot. Poziomy: • DNA • RNA • Białko. Mutacje DNA Substytucja Substytucja (zamiana) oznaczana przez „>” 76A > C nukleotyd 76A zamieniony na C 88+1G > T (IVS2 +1G > T) G zamieniony na T w +1 intronu 2, pozycja 88-89 w odniesieniu do cDNA (+1 : ATG kodon inicjujący translacje, -1: brak zasady 0) Delecja Delecja (deletion) „del” za nukleotydem oznaczającym delecje 76_78del (76_78delACT) oznacza usunięcieACT zmiejsca 76 to 78 82_83del (82_83delTG) oznacza usunięcie TG z sekwencji ACTTTGTGCC (G jest 82 nukleotydem) wynik: ACTTTGCC Insercja Insercja (insertions) „ins” między nukleotydami, oznaczającymi miejsce wstawienia. (uwaga: czasami dodaje się "^"- np. 83^84insTG) 76_77insT oznacza wstawienie T między nukleotydami 76 a 77 83_84insTG oznacza wstawienie TG do sekwencji powtórzeń tandemu TG ACTTTGTGCC (G jest 83 nukleotydem) ACTTTGTGTGCC. insercja/delecja Skrypt Bioinformatyka DRAFT Strona 81 insertion/deletions (indels) delecja/insercja (delins) delecja, po której następuje insercja 112_117delinsTG lub 112_117delAGGTCAinsTG lub 112_117>TG oznacza zastąpienie nukleotydów 112 to 117 (AGGTCA) przez TG Powtórzenia Powtórzenia krótkiej sekwencji (variability of short sequence repeats), np..: ACTGTGTGCC (A jest 1991 nukleotydem) 1993(TG)3-6 sekwencja zawiera od miejsca 1993 TG-dwunukleotyd, który powtarza się w populacji 3-6 razy Duplikacje duplikacje (duplications) oznaczane przez „dup” ponukleotydzie oznaczajacym miejsce duplikacji 77_79dupCTG nukleotydy 77 do 79 są powielone 82_83dupTG (lub 83_84insTG) (short tandem repeats lub single nucleotide stretches) insercja TG do sekwencji powtórzeń tandemu TG: ACTTTGTGCC (A jest 76 nukleotydem) ACTTTGTGTGCC Inwersja Inwersja (inversions) oznaczana „inv” za nukleotydem oznaczającym miejsce rozpoczęcia inwersji. obrócenie sekwencji o 180o 203_506inv ( 203_506inv304) znacza, że 304 nukleotydy od 203 do 506 zostały odwrócone Inne mutacje DNA: translokacja zmienność w obrębie różnych alleli (choroby recesywne): o [zmiany w 1] + [zmiany w 2] zmienność w obrębie tego samego allela o [zmiana 1;2;3] Skrypt Bioinformatyka DRAFT Strona 82 Allel jest to jedna z wersji genu w określonym locus na danym chromosomie homologicznym. Mutacje białka Substytucja (zamiana, mutacje punktowe) „cicha” zamiana nukleotydów nie powodująca zmian w sekwencji aminokwasowej błędna (missense) W26C zamiana 26-tego tryptofanu na cysteine nonsensowna (nonsense) W26X zamiana 26-tego tryptofanu na kodon STOP p.? lub p.0 początkowa metionina (initiating Methionine M1) zaminiona np. na V (M1V niepoprawnie oznaczeni), - nie powstaje żadne białko Delecja Delecja oznaczana przez „del” K29del w sekwencji CKMGHQQQCC (C jest 28 ak) (usunięcie 29 lizyny) CMGHQQQCC Q35del w sekwencji CKMGHQQQCC (C jest 28 ak) CKMGHQQCC C28_M30del usunięcie 3 aminokwasów od Cysteiny 28 do Metioniny 30 Duplikacja Duplikacja oznaczana przez „dup” G31_Q22dup w sekwencji CKMGHQQQCC (C jest 28 ak) (duplikacja od G31 doQ33) CKMGHQGHQQQCC H34_Q35dup CKMGHQHQCC (C jest 28 ak) CKMGHQHQHQCC (lub insercja duplikująca tandem HQ: Q35_C36insHQ) Insercja Insercja oznaczana przez „ins” (uwaga czasami używany jest separator „^”: Q83^C84insQ) K29_M29insQSK wstawienie sekwencji QSK między Lyzynę 29 (K) and Metioninę 30 (M) CKMGHQQQCC → CKQSKMGHQQQCC Q35_C36insQ : CKMGHQQQCC → CKMGHQQQQCC (lub insercja duplikująca Q35dup) Skrypt Bioinformatyka DRAFT Strona 83 Insercja/delecja Insertion/deletions (indels) delecja trójki nukleotydów, po której nastapiła insercja inne trójki: C28_K29delinsW delecja dwóch trójek nukleotydów kodujących Cysteine 28 i Lysine 29, zastąpionych kodonem tryptofanu C28delinsWV usunięcie trójki nukleotydów kodujących cysteinę i wstawienie kodonów Tryptofanu (W) i waliny (V) Przesunięcie ramki frame shifting mutations: fs ◦ R97fsX121 (lub R97fs) przesunięcie ramki odczytu, zmieniające argininę (R97) w pierwszy amiokwas nowej ramki zakończonej po 23 aminokwasach (X121)= kodon STOP w pozycji 121 łańcucha białkowego. Skrypt Bioinformatyka DRAFT Strona 84