Badanie doboru naturalnego na poziomie molekularnym

advertisement
Badanie doboru naturalnego na poziomie molekularnym
Podstawy ewolucji molekulanej
Jak ewoluują sekwencje
Zmiany genetyczne w ewolucji
•
Mutacje
• tworzą nowe allele genów
•
Inwersje
•
•
•
zmieniają układ genów na chromosomach
mogą uniemożliwić rekombinację na danym odcinku i doprowadzić do utrwalenia haplotypu
Duplikacje
• dotyczą fragmentów DNA, w tym całych genów
•
lub całych chromosomów i całych genomów
główne źródło innowacji ewolucyjnej
Transfer horyzontalny
•
•
•
w tym zdarzenia symbiotyczne
Mutacje
•
Podstawienia (substytucje)
•
Niewielkie delecje i insercje
•
niewielkie tzn. wpływające na sekwencję 1-2 genów
Substytucje
•
Tranzycje zachodzą w naturze częściej od
transwersji
•
mimo tego, że możliwych transwersji jest
więcej
•
stosunek ts/tv od ~2 (nDNA) do ~15
(mtDNA człowieka)
•
wyjątek – mtDNA roślin
•
duże różnice ts/tv u różnych grup
organizmów
Tranzycje i transwersje
•
Dlaczego tranzycje są częstsze?
•
Wyjaśnienia selekcyjne (tranzycje rzadziej zmieniają aminokwas i częściej są
neutralne)
•
Ale:
•
tranzycje są częstsze też w genach rRNA, pseudogenach i obszarach
niekodujących
•
tranzycje są częstsze w pozycjach 4-krotnie zdegenerowanych (kodony
typu CUN – Leu)
Tranzycje i transwersje
•
Dlaczego tranzycje są częstsze?
•
Wyjaśnienia mechanistyczne – mechanizmy powstawania i naprawy mutacji
•
Tranzycje powstają w wyniku m. in.:
•
•
przejść tautomerycznych
•
deaminacji (np. oksydacyjnej)
Tranzycje w mniejszym stopniu zaburzają strukturę podwójnej helisy podczas replikacji
•
mniejsza wydajność naprawy przez system MMR
Modele ewolucji sekwencji
•
Badając ewolucję nie dysponujemy z reguły sekwencją przodka
•
Liczbę mutacji musimy oszacować na podstawie różnic między sekwencjami
współczesnymi
•
Konieczne jest uwzględnienie wielokrotnych mutacji w tej samej pozycji,
zwłaszcza dla bardziej odległych sekwencji
Problem obliczania odległości
ACGGTGC
C
A
GCGGTGA
Modele ewolucji sekwencji
•
Modele Markova – stan w pokoleniu n +1 zależy tylko od stanu w pokoleniu n i reguł
przekształcenia (macierz prawdopodobieństw zmiany stanów)
•
Modele o różnym stopniu skomplikowania
•
Mogą uwzględniać:
•
mutacje wielokrotne w tej samej pozycji (poprawka Poissona)
•
różne prawdopodobieństwa zmian nukleotydowych (lub białkowych)
•
różne prawdopodobieństwo mutacji w różnych pozycjach sekwencji
•
różne częstości nukleotydów
Modele ewolucji DNA – model Jukesa-Cantora
A
C
G
T
A
1-3α
α
α
α
C
α
1-3α
α
α
G
α
α
1-3α
α
T
α
α
α
1-3α
3
4
DJC = − ln(1− D)
4
3
Inne modele
•
Kimura (K80, dwuparametrowy) - różne prawdopodobieństwo tranzycji i
transwersji
•
Felsenstein (F81), Hasegawa-Kishino-Yano (HKY85) - różne częstości
nukleotydów (F81) + różne prawd. tranzycji i transwersji (HKY85)
•
GTR (General Time Reversible, Tavare ‘86)
Model GTR
•
Różne prawdopodobieństwo każdej substytucji (ale symetrycznie, czyli np.
A→T = T→A) - 6 parametrów
•
Różne częstości nukleotydów - 4 parametry
Rozkład gamma
•
Proste modele zakładają jednakowe
prawdopodobieństwo zmiany w każdej
pozycji - nierealistyczne
•
Rozkład prawdopodobieństw zmian w
różnych pozycjach – rozkład gamma
Ewolucja sekwencji aminokwasowych
•
•
Trudno stworzyć model analityczny
•
złożoność kodu
•
aminokwasy o różnych właściwościach - konieczna miara niepodobieństwa
Stosuje się empirycznie uzyskiwane macierze prawdopodobieństwa zmiany
danego aminokwasu w inny
Mutacje na poziomie kodu
•
Mutacje mogą:
•
zmienić kodon na inny, ale kodujący ten sam aminokwas
•
•
zmienić kodon na kodujący inny aminokwas
•
•
mutacje synonimiczne
mutacje niesynonimiczne
zmienić kodon na kodon STOP
•
mutacje nonsens
•
spowodować zmianę fazy odczytu
•
wpłynąć na ekspresję genu
Mutacje i dobór naturalny
•
Efekty działania mutacji obserwujemy pośrednio
•
różnice sekwencji między populacjami (gatunkami)
•
polimorfizm sekwencji w obrębie populacji
•
Na allele wytworzone przez mutacje może działać dobór
•
Za zmiany częstości powstających alleli może odpowiadać dryf genetyczny
•
Obserwujemy mutacje utrwalone całkowicie lub częściowo (polimorfizmy) w puli genowej
Podstawowe pytanie ewolucji molekularnej
•
•
Jaka jest rola dryfu i doboru w wyjaśnieniu obserwowanego zróżnicowania
sekwencji?
•
wewnątrzpopulacyjnego (polimorfizmy)
•
międzygatunkowego
Pytanie dotyczy zróżnicowania ilościowego!
•
Nikt nie podaje w wątpliwość tego, że adaptacje w ewolucji powstają dzięki
działaniu doboru!
Dobor czy dryf?
•
Selekcjonizm
•
większość utrwalonych mutacji została wyselekcjonowana przed dobór
•
większość polimorfizmów jest utrzymywana przez dobór
•
•
dobór równoważący, naddominacja, dobór zależny od częstości
Neutralizm (Kimura, 1968)
•
większość utrwalonych mutacji została utrwalona przez dryf
•
za większość polimorfizmów odpowiada dryf
•
mutacje utrwalane przez dobór są rzadkie, nie mają wpływu na ilościową analizę zmienności
molekularnej
Mutacje i dobór
•
•
•
niekorzystne (szkodliwe)
•
s<0
•
eliminowane przez dobór (oczyszczający/negatywny)
neutralne
•
s ≈ 0 (a konkretniej, s ≤ 1/4N)
•
utrwalane przez dryf
korzystne
•
s>0
•
utrwalane przez dobór (z udziałem dryfu dla niewielkich s)
Selekcjonizm i neutralizm
•
•
Selekcjonizm:
•
większość mutacji jest niekorzystna
•
większość utrwalonych mutacji jest korzystna
•
mutacje neutralne są rzadkie (nie częstsze od korzystnych)
Neutralizm
•
większość mutacji jest niekorzystna lub neutralna
•
większość utrwalonych mutacji jest neutralna
•
mutacje korzystne są rzadkie (znacznie rzadsze od neutralnych)
Selekcjonizm i neutralizm
selekcjonizm
neutralizm
pan-neutralizm
Neutralizm nie oznacza pan-neutralizmu, czyli negowania znaczenia selekcyjnego
mutacji!
Przesłanki teorii neutralnej
•
Tempo zmian sekwencji i polimorfizm są zbyt duże, by dały się wyjaśnić
doborem
•
Stałe tempo ewolucji molekularnej (zegar molekularny)
•
Sekwencje o mniejszym znaczeniu funkcjonalnym (pseudogeny, mniej istotne
obszary białek) ewoluują szybciej, niż obszary kluczowe dla funkcji
Stałe tempo ewolucji molekularnej
•
Wiele sekwencji ewoluuje w stałym tempie
•
Tempo to jest różne dla różnych sekwencji, ale stałe w czasie ewolucji dla danej sekwencji
•
Tzw. zegar molekularny
Różnice sekwencji globin
kręgowców
Tempo ewolucji i dryf
•
Neutralny dryf jest procesem losowym, ale jego tempo będzie stałe w
odpowiednio długim czasie
•
Zależy tylko od częstości mutacji (jedna zmiana na 1/µ pokoleń)
•
Dla doboru stałe tempo zmian oznacza stałe tempo zmian środowiska
•
Tempo zmian adaptacyjnych nie wydaje się być stałe
Zegar molekularny
•
Jest konsekwencją neutralnego modelu ewolucji
•
Tempo akumulacji zmian w danej sekwencji jest stałe
•
•
ale różne dla różnych sekwencji
Weryfikacja – test względnego tempa
KAC - KBC = 0
A
•
B
C
W rzeczywistości testuje stałość tempa pomiędzy gałęziami, ale nie w czasie
Zegar molekularny - problem
•
W modelu neutralnym tempo utrwalania mutacji:
1
2N µ
=µ
2N
•
Powinno być stałe w przeliczeniu na pokolenie
•
Czas generacji jest różny u różnych organizmów
•
Czyli nie powinna być obserwowana stałość tempa w czasie rzeczywistym
•
A często jest (w tych sekwencjach, które zachowują zegar)
Stałe tempo ewolucji molekularnej
•
Wiele sekwencji ewoluuje w stałym tempie
•
Tempo to jest różne dla różnych sekwencji, ale stałe w czasie ewolucji dla danej sekwencji
•
Tzw. zegar molekularny
Różnice sekwencji globin
kręgowców
Problem czasu generacji
•
Czas generacji różnych organizmów jest
istotnie różny
•
Dlaczego nie wpływa to na tempo
utrwalania mutacji?
~0,03 pokolenia/rok
~3 pokolenia/rok
Zmiany prawie neutralne
•
Model Kimury dotyczy zmian neutralnych (s = 0), takie nie są (w sekwencji białek)
częste
•
Mutacje zachowują się jak neutralne gdy spełnione jest:
1
s≤
4N e
•
Mutacje o niewielkim współczynniku doboru s będą zachowywały się jak neutralne
w małych populacjach, a w większych populacjach będą podlegały doborowi
Zmiany prawie neutralne
•
Istnieje odwrotna korelacja między czasem
generacji a wielkością populacji
Zmiany prawie neutralne
~0,03 pokolenia/rok
1
s≤
4N e
~3 pokolenia/rok
Długi czas generacji
Krótki czas generacji
Mniej mutacji na rok
Więcej mutacji na rok
Populacja nieliczna (małe Ne)
Populacja liczna (duże Ne)
Więcej mutacji zachowuje się jak
neutralne i utrwala przez dryf
Więcej mutacji podlega doborowi (i jest
eliminowane przez dobór oczyszczający)
Efekty czasu generacji i wielkości populacji się znosząc, dając
stałe tempo w czasie (Ohta & Kimura, 1971).
Zegar molekularny
•
Dla sekwencji białek i zmian niesynonimicznych w DNA zmiany jednostajne w czasie
•
Na poziomie DNA,
•
•
dla mutacji synonimicznych
•
pseudogenów
•
niektórych sekwencji niekodujących
tempo ewolucji zależy od czasu generacji
Tempo ewolucji sekwencji a
funkcja
•
Sekwencje o mniejszym znaczeniu
funkcjonalnym (pseudogeny, mniej istotne
obszary białek) ewoluują szybciej, niż
obszary kluczowe dla funkcji
Degeneracja w kodzie
miejsce 4-krotnie
zdegenerowane
miejsce 2-krotnie
zdegenerowane
Tempo ewolucji sekwencji a
funkcja
•
Sekwencje o mniejszym znaczeniu
funkcjonalnym (pseudogeny, mniej istotne
obszary białek) ewoluują szybciej, niż
obszary kluczowe dla funkcji
Tempo zmian
•
Białka zaangażowane w podstawowe
funkcje komórki ewoluują wolniej.
•
W sekwencji białka obszary kluczowe dla
funkcji ewoluują wolniej.
•
Jednostka: PAM/108 lat
•
Jednostka czasu ewolucyjnego: ile lat
(w milionach, 106) potrzeba do
utrwalenia 1 mutacji/100 aa (1 PAM)
Tempo zmian
•
Czynnikiem decydującym o tempie zmian jest dobór oczyszczający (negatywny)
•
w “ważniejszych” sekwencjach więcej zmian będzie niekorzystnych (eliminacja przez
dobór)
•
w mniej istotnych sekwencjach więcej zmian będzie neutralnych (utrwalanie przez dryf)
•
zmiany bez znaczenia dla funkcji będą neutralne
•
pseudogeny
•
niekodujące obszary międzygenowe?
•
podstawienia synonimiczne?
Status neutralizmu
•
Wyjaśnia wiele zjawisk obserwowanych w ewolucji molekularnej
•
wysoki polimorfizm sekwencji DNA i białek
•
zegar molekularny
•
•
wolniejsza ewolucja sekwencji o kluczowym znaczeniu
•
•
ale jest wiele odstępstw, nie istnieje globalny zegar prawdziwy dla wszystkich gałęzi drzewa życia
to też można wyjaśnić modelem, w którym większość mutacji jest albo niekorzystna, albo
korzystna, ale niekorzystnych jest więcej
Jest bardzo przydatny jako hipoteza zerowa do badania doboru naturalnego na poziomie sekwencji!
Status neutralizmu
•
Dane molekularne, zwłaszcza genomowe, pozwoliły ocenić zgodność modelu
neutralnego z obserwacją zmienności sekwencji
•
Kimura: 1968 – nie były wtedy znane metody sekwencjonowania DNA!
Status neutralizmu
•
Smith & Eyre-Walker 2002 – 45% podstawień aminokwasowych w ewolucji
Drosophila sp. utwalonych przez dobór dodatni
•
Andolfatto 2005 – pomiędzy D. melanogaster i D. simulans dobór dodatni
odpowiada za utrwalenie:
•
20% podstawień w DNA w intronach i obszarach międzygenowych
•
60% podstawień w DNA w sekwencjach UTR
Status neutralizmu
•
Głównym i nieprzemijającym osiągnięciem jest stworzenie matematycznego opisu
współdziałania dryfu i doboru naturalnego (dodatniego i oczyszczającego) w ewolucji
molekularnej
•
Dzięki tym modelom opracowano testy poszukujące śladów doboru w sekwencjach
(model neutralny jako hipoteza zerowa)
•
Istnieje znacząca liczba pozycji i sekwencji ewoluujących według modelu neutralnego
•
można dobrać sekwencje tak, by uzyskać zegar molekularny
Status neutralizmu
•
Dryf genetyczny ma w ewolucji molekularnej bardzo znaczącą, ale nie
wyłączną rolę
•
znaczne obszary genomu ewoluują w sposób bliski neutralnemu
Spór wokół ENCODE
•
ENCODE - projekt opisujący sekwencje w
genomie (Encyclopedia of DNA Elements) •
Wiele sekwencji międzygenowych,
niekodujących ulega transkrypcji
•
80% genomu funkcjonalne
•
czy istnieje “śmieciowy DNA”?
•
Czy to znaczy, że są funkcjonalne?
•
Jeżeli nie ma śladów działania doboru nie ma funkcji!
•
Ślady działania doboru: 2-15% całego
genomu
Badanie doboru
Poszukiwanie śladów działania doboru
•
Większość sekwencji zmienia się w jednostajnym tempie - zegar
•
Odchylenie od średniego tempa zmian w konkretnej linii - dobór działał w tej linii inaczej
Stałe tempo
Przyspieszenie
Spowolnienie
Badanie doboru
•
Założenie: mutacje synonimiczne są neutralne, sekwencje porównywane są
parami
•
Ka (dN) – liczba mutacji niesynonimicznych na liczbę możliwych miejsc
niesynonimicznych
•
Ks (dS) – liczba mutacji synonimicznych na liczbę możliwych miejsc
synonimicznych
•
Stosunek Ka/Ks (ω) jest miarą działania doboru
ω=1 – ewolucja całkowicie neutralna
ω<1 – dobór negatywny (oczyszczający) dla części zmian
ω>1 – dobór pozytywny
Badanie doboru
•
Wartość ω rzadko przekracza 1 dla całej sekwencji (wyjątek np. geny MHC)
•
Średnia wartość ω w porównaniach między naczelnymi a gryzoniami wynosi
0,2, między człowiekiem a szympansem 0,4
•
Odchylenie ω od średniej dla konkretnego genu w konkretnej linii ewolucyjnej
może świadczyć o działaniu doboru
•
W sekwencji mogą występować obszary o różnej wartości ω, wskazując na
działanie doboru na poszczególne regiony a nawet pozycje aminokwasowe w
białku
Badanie doboru II
•
Porównanie zmian synonimicznych i niesynonimicznych w obrębie populacji
danego gatunku i pomiędzy gatunkami.
Test McDonalda-Kreitmana
•
Stosunek mutacji synonimicznych do niesynonimicznych w obrębie populacji
vs. taki sam stosunek dla różnic między gatunkami
•
Jeżeli zmiany są neutralne, wówczas stosunek ten powinien być w obu
przypadkach taki sam
Przykład: gen ADH u trzech gatunków Drosophila
synonimiczne
niesynonimiczne
stosunek
wewnątrzpopulacyjne
42
2
~0,05
międzygatunkowe
17
7
~0,41
Wniosek: zmiany niesynonimiczne są szybko utrwalane w
specjacji – nie są neutralne
Czy zmiany synonimiczne są
neutralne
•
Kodony synonimiczne nie są równocenne
•
Zmiana kodonu częstego na rzadki może
wpłynąć na poziom ekspresji i kinetykę
translacji
Czy zmiany synonimiczne są neutralne?
Czy zmiany synonimiczne są neutralne?
Download