Wprowadzenie DNA i białka W uproszczeniu: „program działania” żywego organizmu zapisany jest w nici DNA i wykonuje się na maszynie białkowej. Białka: łańcuchy złożone z aminokwasów (kilkadziesiąt – kilkadziesiąt tys.). Pełnią rozmaite funkcje m. in. są budulcem (np. kolagen), lecz przede wszystkim są enzymami katalizującymi (tzn. przyspieszającymi) reakcje biochemiczne. Przyroda wykorzystuje 20 standardowych aminokwasów (zawierają grupę aminową –NH2 i karboksylową –COOH) Przykład. Tworzenie się wiązania peptydowego. Kolejność aminokwasów w łańcuchu białkowym (tzw. struktura pierwszorzędowa) decyduje o sposobie przestrzennego „zwinięcia się” makrocząsteczki, to zaś określa własności fizyczne i chemiczne białka. Sekwencję aminokwasów opisuje gen kodujący dane białko. 1 2 Nić DNA jest polinukleotydem. Pojedyncza „cegiełka” zbudowana jest z dezoksyrybozy (cukier 5–węglowy), reszty fosforanowej oraz jednej z czterech zasad azotowych: • puryny: adenina (A), guanina (G) • pirymidyny: tymina (T), cytozyna (C) Budowa pojedynczej nici. Tzw. koniec 3’ (grupa –OH) i koniec 5’ (fosforan). Nici o komplementarnej sekwencji zasad łatwo łączą się w strukturę dwuniciową. Podwójna helisa. Przeciwnie skierowane nici DNA łączą się parami komplementarnymi: C i G ze sobą (3 wiązania wodorowe) oraz A i T ze sobą (2 wiązania wodorowe). Wiązania między komplementarnymi zasadami 3 4 Nić RNA często występuje pojedynczo. Budowa podobna do DNA. • cukier dezoksyrybozę zastępuje ryboza • tyminę zastępuje uracyl Kod genetyczny i synteza białek W genie kodującym białko kolejne aminokwasy (20 rodzajów) opisywane są za pomocą kodonów tj. trójek nukleotydowych (43=64). Kod genetyczny jest nieomal identyczny w całej przyrodzie, a ew. różnice (np. geny mitochndrialne) dotyczą odmiennego znaczenia najwyżej kilku kodonów. • Materiał genetyczny (dwuniciowe DNA) jest zorganizowany w tzw. chromosomy. • U organizmów prokariotycznych (proste komórki bezjądrowe np. bakterie, sinice) występuje jeden kolisty chromosom zanurzony w cytoplazmie. • Eukariotyczne gromadzą DNA w liniowych chromosomach odizolowanych w jądrze komórkowym. • Przy rozmnażaniu płciowym genom jest diploidalny (2 pełne zestawy chromosomów: od matki i ojca). • Człowiek: 23 pary chromosomów, ~7mld par zasad tj. ~2 metry DNA na komórkę! 5 6 Transkrypcja („przepisywanie” DNA→RNA) • enzym polimeraza RNA przyczepia się w pobliżu początku genu (kodon metioniny), • wędruje po jednej z nici (tzw. nić matrycowa – mogą być różne dla różnych genów) w kierunku 3→5 budując komplementarną nić RNA, • gen kończy się kodonem STOP, a uwolniona nić mRNA przechodzi do cytoplazmy. Translacja (RNA→białko) • poza jądrem tzw. rybosomy przyłączają się do mRNA, • rybosom przesuwa się po nici (kierunek 5→3) przyłączając do powstającego białka aminokwasy odpowiadające kolejnym trójkom nukleotydowym, • po odczytaniu całego genu rybosom odłącza się od nici. Utworzone białko ulega „zwinięciu” w cytoplazmie. 7 Replikacja DNA • zachodzi przed każdym podziałem komórki, • zbiór kilku współpracujących enzymów rozwija podwójną helisę, dobudowując do każdej nici drugą komplementarną, • kopiowanie wzorcowych nici odbywa się zawsze w kierunku 3→5, jest to proces z korektą błędów, • powstają dwie „identyczne” (prawie ...) podwójne helisy przeznaczone dla komórek potomnych. Bąbel replikacyjny zakończony parą widełek replikacyjnych Ale wszystko czasem się psuje ... 8 Mutacje (są przekazywane komórkom potomnym po podziale) • synonimiczne – nukleotyd został wymieniony nie zmieniając znaczenia kodonu, • niesynonimiczne, • nonsensowne – pojawia się przedwczesny kodon Stop, • przesunięcia ramki odczytu – usunięcie (delecja) lub wstawienie nadmiarowego (insercja) nukleotydu. Przekłamuje resztę genu. Bardziej rozległe rearanżacje: • delecje dużych fragmentów nici lub jej wstawienia (np. duplikacja genu), • translokacje np. pomiędzy chromosomami, • inwersje (odwrócenia) kawałka nici, itp. to nie takie proste ... • Niektóre organelle komórek eukariotycznych (np. mitochondria, chloroplasty) mają własną nić kolistego DNA z „wewnętrznymi” genami. Np. DNA mitochondrialne (dziedziczy się tylko po matce). • W DNA poza genami „białek” mamy odcinki kodujące pewne nici RNA (np. „części” do rybosomów) – po transkrypcji nie ulegają one translacji. • Istnieje eznym odwrotnej transkryptazy przepisujący nić RNA na DNA (które może być później integrowane z genomem). Wykorzystywany przez retrowirusy, ale i niektóre transpozony zdolne do samodzielnego powielania się w jądrze komórki („zintegrowany” z genomem pasożyt). • Polimeraza DNA rozpoznaje początek genu po występującej wcześniej sekwencji promotorowej (są różne). Transkrypcja kończy się (terminuje) za genem, po napotkaniu odp. sekwencji – znamy je dla prokariotów. • Genom często towarzyszą ich „popsute kopie” czyli tzw. pseudogeny (np. brak promotora). • Podczas tworzenia się gamet (mejoza) homologiczne chromosomy (od matki i ojca) wymieniają się końcami (rekombinacja). Nieprecyzyjna rekombinacja może uszkodzić gen lub stworzyć jego zduplikowaną kopię. • W „okolicach” genu występują rozmaite sekwencje regulujące (wzmacniające, osłabiające) częstość jego ekspresji (np. cząsteczki współpracujące z hormonami, białka ułatwiające lub uniemożliwiające doczepienie polimerazy RNA itp.). Nie bardzo wiadomo gdzie ich szukać ... • Tzw. transpozony czyli „skaczące geny” kodujące enzymy zdolne do ich wycinania i przenoszenia w inne miejsca chromosomów. Często wywołują „duże” mutacje. Prawdopodobnie pozostałość powirusowa. 9 10 • Geny eukariotów zawierają fragmenty kodujące (eksony) przedzielone licznymi (niekiedy kilkadziesiąt) odcinkami niekodująymi (introny). Po transkrypcji z nici pre– mRNA usuwa się introny i łączy kolejne eksony (splicing). Dopiero „zredagowane” mRNA podlega translacji. Nie wiadomo jak odróżnić w sekwencji DNA fragmenty kodujące od intronów ... Oznaczenia • Σ – alfabet czyli skończony zbiór symboli (liter). • Słowo nad alfabetem – skończony ciąg liter. • ε – słowo puste (długości 0). Sekwencje nukleotydów można traktować jak słowa nad alfabetem czteroliterowym {G,C,A,T} dla DNA i {G,C,A,U} dla RNA. Polipeptydy są słowami nad alfabetem 20– literowym (aminokwasy). • Σ* – zbiór wszystkich słów nad Σ; Σ+=Σ*\{ε}. • |w| – długość słowa w∈Σ*. • w[i] – i–ty symbol słowa • w[i..j] – podsłowo od i–tej do j–tej litery • wv – konkatenacja (złączenie) dwóch słów • N, Z, Z , R, R – zbiory liczb: naturalnych, całkowitych, + + całkowitych nieujemnych, rzeczywistych, rzeczywistych nieujemnych. 11