Badanie doboru naturalnego na poziomie molekularnym Podstawy ewolucji molekulanej Jak ewoluują sekwencje Zmiany genetyczne w ewolucji • Mutacje • tworzą nowe allele genów • Inwersje • • • zmieniają układ genów na chromosomach mogą uniemożliwić rekombinację na danym odcinku i doprowadzić do utrwalenia haplotypu Duplikacje • dotyczą fragmentów DNA, w tym całych genów • lub całych chromosomów i całych genomów główne źródło innowacji ewolucyjnej Transfer horyzontalny • • • w tym zdarzenia symbiotyczne Mutacje • Podstawienia (substytucje) • Niewielkie delecje i insercje • niewielkie tzn. wpływające na sekwencję 1-2 genów Substytucje • Tranzycje zachodzą w naturze częściej od transwersji • mimo tego, że możliwych transwersji jest więcej • stosunek ts/tv od ~2 (nDNA) do ~15 (mtDNA człowieka) • wyjątek – mtDNA roślin • duże różnice ts/tv u różnych grup organizmów Tranzycje i transwersje • Dlaczego tranzycje są częstsze? • Wyjaśnienia selekcyjne (tranzycje rzadziej zmieniają aminokwas i częściej są neutralne) • Ale: • tranzycje są częstsze też w genach rRNA, pseudogenach i obszarach niekodujących • tranzycje są częstsze w pozycjach 4-krotnie zdegenerowanych (kodony typu CUN – Leu) Tranzycje i transwersje • Dlaczego tranzycje są częstsze? • Wyjaśnienia mechanistyczne – mechanizmy powstawania i naprawy mutacji • Tranzycje powstają w wyniku m. in.: • • przejść tautomerycznych • deaminacji (np. oksydacyjnej) Tranzycje w mniejszym stopniu zaburzają strukturę podwójnej helisy podczas replikacji • mniejsza wydajność naprawy przez system MMR Modele ewolucji sekwencji • Badając ewolucję nie dysponujemy z reguły sekwencją przodka • Liczbę mutacji musimy oszacować na podstawie różnic między sekwencjami współczesnymi • Konieczne jest uwzględnienie wielokrotnych mutacji w tej samej pozycji, zwłaszcza dla bardziej odległych sekwencji Problem obliczania odległości ACGGTGC C A GCGGTGA Modele ewolucji sekwencji • Modele Markova – stan w pokoleniu n +1 zależy tylko od stanu w pokoleniu n i reguł przekształcenia (macierz prawdopodobieństw zmiany stanów) • Modele o różnym stopniu skomplikowania • Mogą uwzględniać: • mutacje wielokrotne w tej samej pozycji (poprawka Poissona) • różne prawdopodobieństwa zmian nukleotydowych (lub białkowych) • różne prawdopodobieństwo mutacji w różnych pozycjach sekwencji • różne częstości nukleotydów Modele ewolucji DNA – model Jukesa-Cantora A C G T A 1-3α α α α C α 1-3α α α G α α 1-3α α T α α α 1-3α 3 4 DJC = − ln(1− D) 4 3 Inne modele • Kimura (K80, dwuparametrowy) - różne prawdopodobieństwo tranzycji i transwersji • Felsenstein (F81), Hasegawa-Kishino-Yano (HKY85) - różne częstości nukleotydów (F81) + różne prawd. tranzycji i transwersji (HKY85) • GTR (General Time Reversible, Tavare ‘86) Model GTR • Różne prawdopodobieństwo każdej substytucji (ale symetrycznie, czyli np. A→T = T→A) - 6 parametrów • Różne częstości nukleotydów - 4 parametry Rozkład gamma • Proste modele zakładają jednakowe prawdopodobieństwo zmiany w każdej pozycji - nierealistyczne • Rozkład prawdopodobieństw zmian w różnych pozycjach – rozkład gamma Ewolucja sekwencji aminokwasowych • • Trudno stworzyć model analityczny • złożoność kodu • aminokwasy o różnych właściwościach - konieczna miara niepodobieństwa Stosuje się empirycznie uzyskiwane macierze prawdopodobieństwa zmiany danego aminokwasu w inny Mutacje na poziomie kodu • Mutacje mogą: • zmienić kodon na inny, ale kodujący ten sam aminokwas • • zmienić kodon na kodujący inny aminokwas • • mutacje synonimiczne mutacje niesynonimiczne zmienić kodon na kodon STOP • mutacje nonsens • spowodować zmianę fazy odczytu • wpłynąć na ekspresję genu Mutacje i dobór naturalny • Efekty działania mutacji obserwujemy pośrednio • różnice sekwencji między populacjami (gatunkami) • polimorfizm sekwencji w obrębie populacji • Na allele wytworzone przez mutacje może działać dobór • Za zmiany częstości powstających alleli może odpowiadać dryf genetyczny • Obserwujemy mutacje utrwalone całkowicie lub częściowo (polimorfizmy) w puli genowej Podstawowe pytanie ewolucji molekularnej • • Jaka jest rola dryfu i doboru w wyjaśnieniu obserwowanego zróżnicowania sekwencji? • wewnątrzpopulacyjnego (polimorfizmy) • międzygatunkowego Pytanie dotyczy zróżnicowania ilościowego! • Nikt nie podaje w wątpliwość tego, że adaptacje w ewolucji powstają dzięki działaniu doboru! Dobor czy dryf? • Selekcjonizm • większość utrwalonych mutacji została wyselekcjonowana przed dobór • większość polimorfizmów jest utrzymywana przez dobór • • dobór równoważący, naddominacja, dobór zależny od częstości Neutralizm (Kimura, 1968) • większość utrwalonych mutacji została utrwalona przez dryf • za większość polimorfizmów odpowiada dryf • mutacje utrwalane przez dobór są rzadkie, nie mają wpływu na ilościową analizę zmienności molekularnej Mutacje i dobór • • • niekorzystne (szkodliwe) • s<0 • eliminowane przez dobór (oczyszczający/negatywny) neutralne • s ≈ 0 (a konkretniej, s ≤ 1/4N) • utrwalane przez dryf korzystne • s>0 • utrwalane przez dobór (z udziałem dryfu dla niewielkich s) Selekcjonizm i neutralizm • • Selekcjonizm: • większość mutacji jest niekorzystna • większość utrwalonych mutacji jest korzystna • mutacje neutralne są rzadkie (nie częstsze od korzystnych) Neutralizm • większość mutacji jest niekorzystna lub neutralna • większość utrwalonych mutacji jest neutralna • mutacje korzystne są rzadkie (znacznie rzadsze od neutralnych) Selekcjonizm i neutralizm selekcjonizm neutralizm pan-neutralizm Neutralizm nie oznacza pan-neutralizmu, czyli negowania znaczenia selekcyjnego mutacji! Przesłanki teorii neutralnej • Tempo zmian sekwencji i polimorfizm są zbyt duże, by dały się wyjaśnić doborem • Stałe tempo ewolucji molekularnej (zegar molekularny) • Sekwencje o mniejszym znaczeniu funkcjonalnym (pseudogeny, mniej istotne obszary białek) ewoluują szybciej, niż obszary kluczowe dla funkcji Stałe tempo ewolucji molekularnej • Wiele sekwencji ewoluuje w stałym tempie • Tempo to jest różne dla różnych sekwencji, ale stałe w czasie ewolucji dla danej sekwencji • Tzw. zegar molekularny Różnice sekwencji globin kręgowców Tempo ewolucji i dryf • Neutralny dryf jest procesem losowym, ale jego tempo będzie stałe w odpowiednio długim czasie • Zależy tylko od częstości mutacji (jedna zmiana na 1/µ pokoleń) • Dla doboru stałe tempo zmian oznacza stałe tempo zmian środowiska • Tempo zmian adaptacyjnych nie wydaje się być stałe Zegar molekularny • Jest konsekwencją neutralnego modelu ewolucji • Tempo akumulacji zmian w danej sekwencji jest stałe • • ale różne dla różnych sekwencji Weryfikacja – test względnego tempa KAC - KBC = 0 A • B C W rzeczywistości testuje stałość tempa pomiędzy gałęziami, ale nie w czasie Zegar molekularny - problem • W modelu neutralnym tempo utrwalania mutacji: 1 2N µ =µ 2N • Powinno być stałe w przeliczeniu na pokolenie • Czas generacji jest różny u różnych organizmów • Czyli nie powinna być obserwowana stałość tempa w czasie rzeczywistym • A często jest (w tych sekwencjach, które zachowują zegar) Stałe tempo ewolucji molekularnej • Wiele sekwencji ewoluuje w stałym tempie • Tempo to jest różne dla różnych sekwencji, ale stałe w czasie ewolucji dla danej sekwencji • Tzw. zegar molekularny Różnice sekwencji globin kręgowców Problem czasu generacji • Czas generacji różnych organizmów jest istotnie różny • Dlaczego nie wpływa to na tempo utrwalania mutacji? ~0,03 pokolenia/rok ~3 pokolenia/rok Zmiany prawie neutralne • Model Kimury dotyczy zmian neutralnych (s = 0), takie nie są (w sekwencji białek) częste • Mutacje zachowują się jak neutralne gdy spełnione jest: 1 s≤ 4N e • Mutacje o niewielkim współczynniku doboru s będą zachowywały się jak neutralne w małych populacjach, a w większych populacjach będą podlegały doborowi Zmiany prawie neutralne • Istnieje odwrotna korelacja między czasem generacji a wielkością populacji Zmiany prawie neutralne ~0,03 pokolenia/rok 1 s≤ 4N e ~3 pokolenia/rok Długi czas generacji Krótki czas generacji Mniej mutacji na rok Więcej mutacji na rok Populacja nieliczna (małe Ne) Populacja liczna (duże Ne) Więcej mutacji zachowuje się jak neutralne i utrwala przez dryf Więcej mutacji podlega doborowi (i jest eliminowane przez dobór oczyszczający) Efekty czasu generacji i wielkości populacji się znosząc, dając stałe tempo w czasie (Ohta & Kimura, 1971). Zegar molekularny • Dla sekwencji białek i zmian niesynonimicznych w DNA zmiany jednostajne w czasie • Na poziomie DNA, • • dla mutacji synonimicznych • pseudogenów • niektórych sekwencji niekodujących tempo ewolucji zależy od czasu generacji Tempo ewolucji sekwencji a funkcja • Sekwencje o mniejszym znaczeniu funkcjonalnym (pseudogeny, mniej istotne obszary białek) ewoluują szybciej, niż obszary kluczowe dla funkcji Degeneracja w kodzie miejsce 4-krotnie zdegenerowane miejsce 2-krotnie zdegenerowane Tempo ewolucji sekwencji a funkcja • Sekwencje o mniejszym znaczeniu funkcjonalnym (pseudogeny, mniej istotne obszary białek) ewoluują szybciej, niż obszary kluczowe dla funkcji Tempo zmian • Białka zaangażowane w podstawowe funkcje komórki ewoluują wolniej. • W sekwencji białka obszary kluczowe dla funkcji ewoluują wolniej. • Jednostka: PAM/108 lat • Jednostka czasu ewolucyjnego: ile lat (w milionach, 106) potrzeba do utrwalenia 1 mutacji/100 aa (1 PAM) Tempo zmian • Czynnikiem decydującym o tempie zmian jest dobór oczyszczający (negatywny) • w “ważniejszych” sekwencjach więcej zmian będzie niekorzystnych (eliminacja przez dobór) • w mniej istotnych sekwencjach więcej zmian będzie neutralnych (utrwalanie przez dryf) • zmiany bez znaczenia dla funkcji będą neutralne • pseudogeny • niekodujące obszary międzygenowe? • podstawienia synonimiczne? Status neutralizmu • Wyjaśnia wiele zjawisk obserwowanych w ewolucji molekularnej • wysoki polimorfizm sekwencji DNA i białek • zegar molekularny • • wolniejsza ewolucja sekwencji o kluczowym znaczeniu • • ale jest wiele odstępstw, nie istnieje globalny zegar prawdziwy dla wszystkich gałęzi drzewa życia to też można wyjaśnić modelem, w którym większość mutacji jest albo niekorzystna, albo korzystna, ale niekorzystnych jest więcej Jest bardzo przydatny jako hipoteza zerowa do badania doboru naturalnego na poziomie sekwencji! Status neutralizmu • Dane molekularne, zwłaszcza genomowe, pozwoliły ocenić zgodność modelu neutralnego z obserwacją zmienności sekwencji • Kimura: 1968 – nie były wtedy znane metody sekwencjonowania DNA! Status neutralizmu • Smith & Eyre-Walker 2002 – 45% podstawień aminokwasowych w ewolucji Drosophila sp. utwalonych przez dobór dodatni • Andolfatto 2005 – pomiędzy D. melanogaster i D. simulans dobór dodatni odpowiada za utrwalenie: • 20% podstawień w DNA w intronach i obszarach międzygenowych • 60% podstawień w DNA w sekwencjach UTR Status neutralizmu • Głównym i nieprzemijającym osiągnięciem jest stworzenie matematycznego opisu współdziałania dryfu i doboru naturalnego (dodatniego i oczyszczającego) w ewolucji molekularnej • Dzięki tym modelom opracowano testy poszukujące śladów doboru w sekwencjach (model neutralny jako hipoteza zerowa) • Istnieje znacząca liczba pozycji i sekwencji ewoluujących według modelu neutralnego • można dobrać sekwencje tak, by uzyskać zegar molekularny Status neutralizmu • Dryf genetyczny ma w ewolucji molekularnej bardzo znaczącą, ale nie wyłączną rolę • znaczne obszary genomu ewoluują w sposób bliski neutralnemu Spór wokół ENCODE • ENCODE - projekt opisujący sekwencje w genomie (Encyclopedia of DNA Elements) • Wiele sekwencji międzygenowych, niekodujących ulega transkrypcji • 80% genomu funkcjonalne • czy istnieje “śmieciowy DNA”? • Czy to znaczy, że są funkcjonalne? • Jeżeli nie ma śladów działania doboru nie ma funkcji! • Ślady działania doboru: 2-15% całego genomu Badanie doboru Poszukiwanie śladów działania doboru • Większość sekwencji zmienia się w jednostajnym tempie - zegar • Odchylenie od średniego tempa zmian w konkretnej linii - dobór działał w tej linii inaczej Stałe tempo Przyspieszenie Spowolnienie Badanie doboru • Założenie: mutacje synonimiczne są neutralne, sekwencje porównywane są parami • Ka (dN) – liczba mutacji niesynonimicznych na liczbę możliwych miejsc niesynonimicznych • Ks (dS) – liczba mutacji synonimicznych na liczbę możliwych miejsc synonimicznych • Stosunek Ka/Ks (ω) jest miarą działania doboru ω=1 – ewolucja całkowicie neutralna ω<1 – dobór negatywny (oczyszczający) dla części zmian ω>1 – dobór pozytywny Badanie doboru • Wartość ω rzadko przekracza 1 dla całej sekwencji (wyjątek np. geny MHC) • Średnia wartość ω w porównaniach między naczelnymi a gryzoniami wynosi 0,2, między człowiekiem a szympansem 0,4 • Odchylenie ω od średniej dla konkretnego genu w konkretnej linii ewolucyjnej może świadczyć o działaniu doboru • W sekwencji mogą występować obszary o różnej wartości ω, wskazując na działanie doboru na poszczególne regiony a nawet pozycje aminokwasowe w białku Badanie doboru II • Porównanie zmian synonimicznych i niesynonimicznych w obrębie populacji danego gatunku i pomiędzy gatunkami. Test McDonalda-Kreitmana • Stosunek mutacji synonimicznych do niesynonimicznych w obrębie populacji vs. taki sam stosunek dla różnic między gatunkami • Jeżeli zmiany są neutralne, wówczas stosunek ten powinien być w obu przypadkach taki sam Przykład: gen ADH u trzech gatunków Drosophila synonimiczne niesynonimiczne stosunek wewnątrzpopulacyjne 42 2 ~0,05 międzygatunkowe 17 7 ~0,41 Wniosek: zmiany niesynonimiczne są szybko utrwalane w specjacji – nie są neutralne Czy zmiany synonimiczne są neutralne • Kodony synonimiczne nie są równocenne • Zmiana kodonu częstego na rzadki może wpłynąć na poziom ekspresji i kinetykę translacji Czy zmiany synonimiczne są neutralne? Czy zmiany synonimiczne są neutralne?