PODSTAWOWE MODELE MATEMATYCZNE STOSOWANE W ANALIZIE STRUKTURY GENETYCZNEJ POPULACJI Fot. W. Wołkow Kierunek: Biomatematyka Prowadzący: dr Wioleta Drobik Katedra Genetyki i Ogólnej Hodowli Zwierząt GENETYKA POPULACJI Nauka która respektując zasady dziedziczenia z zakresu genetyki klasycznej bada mechanizmy dziedziczenia w odniesieniu do populacji Struktura genetyczna: opis alleli i genotypów w poszczególnych loci wraz z częstością (prawdopodobieństwem) ich występowania w populacji STRUKTURA GENETYCZNA POPULACJI - A1 - A2 W populacji organizmów haploidalnych frekwencja alleli jest równa frekwencji genotypów STRUKTURA GENETYCZNA POPULACJI N – ogólna liczba osobników m – liczba alleli w danym locus A – umownie oznaczamy allel dominujący a – umownie oznaczamy allel recesywny p+q=1 Loci dwualleliczne: Frekwencja występowania genotypów: f(AA) = częstość występowania homozygot dominujących AA f(Aa) = częstość występowania heterozygot Aa f(aa) = częstość występowania homozygot recesywnych aa p = częstość alellu A, p=f(AA)+1/2f(Aa), p ≤1 q = częstość allelu a, q=R+1/2Q, q≤1 Loci wieloalleliczne – liczba możliwych genotypów: m(m+1)/2 ZAŁOŻENIA DO PRAWA HARDY’EGO I WEINBERGA 1. 2. 3. 4. 5. 6. 7. Organizmy są diploidalne Rozmnażanie płciowe Pokolenia nie zachodzą na siebie Rozpatrywane są pojedyncze loci Kojarzenia wyłącznie losowe Populacja jest nieskończenie liczna Brak wpływu czynników zewnętrznych, które mogą zmieniać frekwencję genów i genotypów Migracja Dryf genetyczny Selekcja Mutacje PRAWO HARDY’EGO-WEINBERGA W populacji znajdującej się w stanie równowagi genetycznej częstość występowania genotypów zależy wyłącznie od częstości alleli i jest stała z pokolenia na pokolenie Locus dwualleliczne: p2 = frakcja homozygot AA 2pq = frakcja heterozygotyczna q2 = frakcja homozygot aa (p + q)2 = p2 + 2pq + q2 = 1 Postać ogólna modelu przy n alleli: (p1 + … + pn)2 f(AiAi)=pi2 f(AiAj)=2pipj Częstość genotypu CZĘSTOŚĆ GENOTYPÓW WYNIKAJĄCA Z PRAWA HARDY’EGO I WEINBERGA Częstość allelu a ZADANIA: 1) Mukowiscydoza jest jedną z najczęstszych chorób genetycznych u ludzi. Szacuje się, że mutacja delta F508 w genie CFTR, którą identyfikuje się u około 75% chorych występuje u europejczyków z częstością 0,02. Gen ten dziedziczony jest w sposób autosomalny recesywny. Ilu chorych i nosicieli jest w populacji europejskiej? 2) Grupy krwi u człowieka (ABO) warunkowane są serią trzech alleli wielokrotnych IA, IB oraz i. 1. IA - warunkuje obecność antygenu krwinkowego A, kodominujący z IB 2. IB - warunkuje obecność antygenu krwinkowego B, kodominujący z IA 3. i - warunkuje brak wymienionych antygenów, allel recesywny Frekwencja alleli IA oraz IB w populacji Polski wynosi w przybliżeniu odpowiednio 0,4 oraz 0,2. Ile osób o grupie krwi 0, a ile o grupie AB żyje w Polsce? Populacja polski wynosi w przybliżeniu 38 mln osób. RÓWNOWAGA HARDY’EGO-WEINBERGA A ANALIZA STRUKTURY GENETYCZNEJ POPULACJI Heterozygotyczność oczekiwana (He) – frekwencja heterozygot oszacowana dla frekwencji alleli danego locus w populacji w warunkach równowagi Hardy’ego-Weinberga. Heterozygotyczność obserwowana (Ho) – rzeczywista frekwencja heterozygot występujących w populacji. Odstępstwa od równowagi HW świadczą o obecności procesów demograficznych, które zmieniają (zaburzają) frekwencje i rozkład alleli JAK SPRAWDZIĆ CZY POPULACJA JEST W RÓWNOWADZE? Porównujemy obserwowane częstości genotypów z oczekiwanymi wg prawa Hardy’ego i Weinberga Jeżeli różnice są niewielkie sprawdzamy testem chi-kwadrat (ni pi N ) 2 pi N i k 2 emp k 1 m Przykład: W locus transferyny u pewnego gatunku karczowników (Myodes gapperi) występują trzy możliwe genotypy MM, MJ oraz JJ. W trakcie badań prowadzonych w 1976 w północnej Kanadzie odłowiono 12 osobników o genotypie MM, 53 MJ oraz 12 JJ. Czy populacja była w stanie równowagi genetycznej? CZY POPULACJA JEST W RÓWNOWADZE? Krasopani poziomkówka (Callimorpha dominula) -motyl z rodziny niedźwiedziówkowatych W pewnej lokalizacji w Anglii w populacji obserwowano: 408 BB, 144 Bb, 48 bb, Oblicz frekwencję alleli i genotypów Czy populacja jest w równowadze? http://www.hlasek.com/callimorpha_dominula_bs1566.html Genotypy spotykane w większości populacji: BB (najczęstszy typ) Bb bb (rzadkie) CZYNNIKI ZABURZAJĄCE RÓWNOWAGĘ GENETYCZNĄ MIGRACJE Zmiana frekwencji allelu zależy od stopnia nasilenia migracji (m) oraz różnicy frekwencji allelu pomiędzy subpopulacjami m – udział osobników migrujących w populacji miejscowej, wskazuje na tempo przepływu genów Udział osobników migrujących liczymy ze wzoru: Frekwencja allelu A po t pokoleniach migracji: pt= p* + (1-m)t (p-p*) p - frekwencja genu w populacji miejscowej pt - frekwencja genu po t pokoleniach p* - frekwencja genu w populacji z której pochodzą osobniki migrujące t – liczba pokoleń, lat Wyspa A NA=600 p=q 150 osobników Wyspa B NB=1000 p=0,3 Ile będzie równa frekwencja p oraz frekwencje genotypów: 1. w następnym pokoleniu 2. po 5 i 20 pokoleniach przy założeniu, że: a) b) imigracja była jednorazowa imigracja powtarzała się w każdym pokoleniu MIGRACJA WIELOKIERUNKOWA Wiele subpopulacji z możliwością swobodnego przemieszczania się, tzn wymiany osobników pomiędzy subpopulacjami pt= pm + (1-m)t (p0-pm) pm – frekwencja w grupie migrantów równa średniej frekwencji allelu w populacji p0 – wyjściowa frekwencja allelu w subpopulacji t – liczba pokoleń m – udział osobników migrujących ZADANIA: 1. Jak zmieni się frekwencja allelu p w subpopulacji III po 5 pokoleniach zakładając, że: a) m=0,1 b) m=0,4 Subpopulacja p0 I 0,3 II 0,5 III 0,7 Jakiej frekwencji p spodziewamy się w subpopulacjach po wielu pokoleniach migracji? I p=0,3 II p=0,5 III p=0,7 SELEKCJA Dotychczasowe założenie - wszystkie osobniki maja taką samą szansę zostawienia po sobie potomstwa. Proces dzięki któremu osobniki mają niejednakową szansę przekazania gamet następnemu pokoleniu nazywamy selekcją. Selekcję dzielimy na: naturalną sztuczną WSPÓŁCZYNNIK REPRODUKCJI NETTO Współczynnik reprodukcji netto (R) Liczba potomków przypadających na jednego osobnika, którzy dożywają do następnej reprodukcji Iloczyn liczby potomków (B) i ich prawdopodobieństwa przeżycia (S) R=B*S Jeżeli: R = 1 – populacja ma stałą liczebność R > 1 – populacja zwiększa liczebność R < 1 – populacja zmniejsza liczebność WSPÓŁCZYNNIK DOSTOSOWANIA w – współczynnik względnego dostosowania – współczynnik reprodukcji netto danego genotypu (np. Raa) dzielony przez najwyższy współczynnik reprodukcji dla danego zestawu genotypów (Rmax). Np.: Genotyp S B R w AA 0,75 2 1,5 1 Aa 0,60 2,5 1,5 1 aa 0,50 2 1 0,67 WSPÓŁCZYNNIK SELEKCJI Współczynnik selekcji: w=1-s Mówi w jakim stopniu działające w populacji czynniki selekcyjne wpływają na poszczególne genotypy Współczynnik selekcji przeciwko danemu genotypowi – liczba określająca jaką część gamet, które mógłby wytworzyć dany genotyp jest eliminowana na skutek selekcji. Wartości od 0 do 1 0 –selekcja nie eliminuje żadnej gamety danego genotypu 1 – selekcja eliminuje wszystkie gamety danego genotypu ZMIANA FREKWENCJI ALLELI NA SKUTEK SELEKCJI Genotyp Ogółem AA Aa aa p2 2pq q2 Współczynnik dostosowania wAA wAa waa Frekwencja po selekcji p2wAA 2pqwAa q2waa Pokolenie 0 p2+2pq+q2=1 = p2wAA+ 2pqwAa + q2waa Ogólny model rekurencyjny na frekwencje allelu A po t pokoleniach: Analogiczny wzór dla allelu a MODELE SELEKCJI AA Aa aa 1 1 1-s 1-s 1-s 1 Model Dominowanie kompletne 1 Selekcja przeciw genotypowi recesywnemu 2 Selekcja faworyzująca homozygoty recesywne Naddominacja 3 Selekcja faworuzująca heterozygoty 1-s1 1 1-s2 4 Selekcja faworuzująca homozygoty 1 1-s 1 1 1-s1 1-s2 Niepełna dominacja 5 Selekcja przeciw genotypowi recesywnemu oraz heterozygotom ZADANIA: Jaka jest frekwencja allelu S (koduje zmienioną formę beta hemoglobiny) w krajach, gdzie malaria jest częsta? Początkową frekwencje zakładamy na p=q, gdzie p oznacza frekwencje neutralnego alllelu A, natomiast q frekwencje allelu S. Współczynniki względnego dostosowania dla genotypów w krajach afrykańskich, w których występuje malaria przedstawiono w tabeli: wAA wAa waa 0,8 1 0,2 DOMINOWANIE KOMPLETNE SELEKCJA PRZECIW GENOTYPOWI RECESYWNEMU Zmiana we frekwencji frekwencji allelu a w wyniku selekcji s – selekcja przeciw genotypowi recesywnemu (s>0) Całkowita eliminacja homozygot: q0 – frekwencja allelu a w pokoleniu wyjściowym qt – frekwencja allelu a w pokoleniu t q – zmiana we frekwencji allelu t – liczba pokoleń ZADANIA: 1. Wykazano, że za odporność na insektycydy organofosforanowe i karbamatowe u komarów z rodzajów Culex i Anopheles odpowiadają 4 niezależne mutacje w genie esterazy acetylocholinowej. Jedna z nich sprawia, że enzym staje się niewrażliwy na inhibicję przez insektycydy. Odporność jest cechą dominującą i sprawia, że komary będące nosicielami mają 10 razy większe prawdopodobieństwo przetrwania i rozrodu. Jak zmieni się frekwencja alleli i genotypów po jednym dwóch pokoleniach jeżeli początkowa frekwencja allelu niezmutowanego była równa 0,95? ZADANIA: 1. Barwa żółta myszy uwarunkowana jest allelem AY, który w formie homozygotycznej powoduje śmierć osobnika w rozwoju zarodkowym. a) b) c) Jaka będzie frekwencja allelu AY po 2, 10, 100 pokoleniach jeżeli jego początkowa frekwencja wynosi q=0,2. Jaka będzie frekwencja allelu AY po 2, 10, 100 pokoleniach jeżeli jego początkowa frekwencja wynosi q=0,9. Po ilu pokoleniach frekwencja tego allelu spadnie do 0,001 (zakładając q0=0,2 oraz q0= 0,9)? aa AYa MUTACJE I SELEKCJA Dlaczego szkodliwe allele nie są na stałe eliminowane z populacji? Równowaga pomiędzy selekcją a mutacją Czym rzadziej występuje dany allel tym bardziej zwiększa się frekwencja mutacji Frekwencja allelu szkodliwego przy jednoczesnym wystepowaniu selekcji będzie w punkcie równowagi równa: DRYF GENETYCZNY Zmiany częstości występowania genów/alleli w populacji, które nie wynikają z doboru naturalnego, migracji czy mutacji, ale ze zdarzeń losowych losowe pobieranie prób o ograniczonej liczebności DRYF GENETYCZNY W przeciwieństwie do wcześniej prezentowanych modeli o charakterze deterministycznym mamy tutaj do czynienia z modelem stochastycznym Na podstawie danych wejściowych możemy przewidzieć wyniki końcowe z pewnym prawdopodobieństwem Jak przeprowadzana jest symulacja? Metody Monte Carlo (MC) Jedne z najczęściej wykorzystywanych metod symulacyjnych Za twórcę najczęściej uznaje się Stanisława Ulama (współtwórca bomby wodorowej) Wymaga generowania liczb pseudolosowych Jest to klasa algorytmów obliczeniowych polegających na wielokrotnym losowaniu z określonego wcześniej rozkładu GENEROWANIE LICZB PSEUDOLOSOWYCH Komputer nie jest w stanie generować liczb losowych Generujemy ciągi liczbowe o z góry ustalonych wartościach, które imitują ciągi liczb losowych Punkt startowy to ziarno losowania Ręcznie ustawione ziarno umożliwia replikacje obliczeń i symulacji DRYF GENETYCZNY pokolenie 1 pokolenie 2 pokolenie 3 pokolenie 4 ROZKŁAD BERNOULLIEGO (DWUMIANOWY) Prawdopodobieństwo zajścia pojedynczego scenariusza Rozkład Bernoulliego to rozkład liczby sukcesów w serii doświadczeń z których w każdym może pojawić się sukces albo porażka n Liczba „scenariuszy” ze zbioru n-elementowego k: 0 1 2 3 4 5 6 BOTTLENECK – EFEKT WĄSKIEGO GARDŁA Np. zagłada większości osobników w wyniku katastrofy ekologicznej – te które przeżyją będą losową próbą z istniejącej uprzednio populacji. Po wzroście liczebności populacji możemy mieć doczynienia z zupełnie inną populacją niż ta która przed katastrofą żyła na tym terenie. Przykład: Niezwykle mała zmienność genetyczna u gepardów jest najprawdopodobniej efektem drastycznie niskiej liczebności populacji (szacowna na 10 osobników) w okresie epoki lodowcowej EFEKT ZAŁOŻYCIELA Odłączenie się od populacji wyjściowej niewielkiej grupy osobników (o innej frekwencji alleli niż populacja wyjściowa) która migruje lub zostaje przeniesiona na nowy, odizolowany obszar. Np. z licznej populacji żyjącej na rozległym terenie kontynentu część osobników przedostaje się na odizolowaną wyspę Po wielu pokoleniach możemy mieć do czynienia z nową jednostką systematyczna np. podgatunkiem ZADANIA Jakie jest prawdopodobieństwo, że nowo założona populacja będzie homozygotyczna pod względem allelu A jeżeli jest zakładana przez : A. 5 osobników B. 15 osobników Frekwencja p w populacji wyjściowej wynosi 0,9. Bardzo duża populacja w której pod względem pewnego allelu p=q. Populacja doświadcza kataklizmu w wyniku którego przeżywa tylko 6 losowo wybranych osobników. Jakie jest prawdopodobieństwo, że będą wśród nich: A. same homozygoty B. tylko jeden osobnik o genotypie aa C. co najmniej dwie homozygoty aa