Mapowanie genów człowieka i badania asocjacji podstawy Sprzężenie } Geny leżące na różnych chromosomach spełniają II prawo Mendla Dla 2 genów: 4 równoliczne klasy gamet W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005 Sprzężenie } Allele genów leżących na tym samym chromosomie dziedziczą się razem – sprzężenie Dla 2 genów: 2 równoliczne klasy gamet rodzicielskich W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005 Sprzężenie } Crossing-over (rekombinacja chromatyd niesiostrzanych) Dla 2 genów: 2 równoliczne klasy gamet rodzicielskich 2 równoliczne klasy gamet zrekombinowanych Klasy zrekombinowane mniej liczne od rodzicielskich W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005 Mapowanie genów } Aby powstały gamety zrekombinowane, crossing-over musi zajść pomiędzy genami (loci) powstają gamety zrekombinowane W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005 Mapowanie genów Prawdopodobieństwo crossing-over pomiędzy genami jest proporcjonalne do odległości między nimi na chromosomie } Liczebność klas zrekombinowanych w potomstwie jest miarą odległości genetycznej } U Drosophila najlepiej mapować za pomocą heterozygotycznej samicy i samca recesywnego } A u człowieka? } Asocjacje } Nieprzypadkowe współwystępowanie czynników (alleli i fenotypów) na poziomie populacji (korelacja) } } } } 7 Czy zawsze asocjacja oznacza zależność przyczynową? Czy każda asocjacja ma wartość diagnostyczną? Czy asocjacja odkrywa “gen na ....”? Czy zawsze czynnik ryzyka? Geny na...? 8 Asocjacja Przyczyny asocjacji • losowa (i nieprawidłowe obliczanie p) • relacja przyczynowa § związek bezpośredni (plejotropizm, jednym z efektów allelu A jest podatność na chorobę) § dobór naturalny (allel A zwiększa fitness u chorych) § nie zawsze czynnik ryzyka • struktura populacji i efekty statystyczne § zależności etniczne § paradoks Simpsona (dodatkowa zmienna ukryta) • bliskie sprzężenie + historia (nierównowaga sprzężeń) 9 Struktura populacji } Lander & Schork, 1994 - w rejonie San Francisco jest wyraźna asocjacja między allelem HLA-A1 a umiejętnością jedzenia pałeczkami • HLA-A1 jest częstszy u Azjatów niż u Europejczyków 10 Asocjacje mogą być zwodne } } Allel 3A4 cytochromu P450 (CYP3A) i rak prostaty (bardziej zaawansowana postać w momencie diagnozy) CYP3A może w pływać na tempo hydroksylowania testosteronu - związek przyczynowy? • Nie ma wpływu allelu 3A4 na kinetykę metabolizmu testosteronu • Allel 3A4 częściej występuje u ludzi pochodzenia afrykańskiego (Afroamerykanie), niż europejskiego • Podobne korelacje dla raka prostaty dla innych alleli częstszych w populacji afrykańskiej • Bardziej zaawansowany rak prostaty u Afroamerykanów (przyczyny społeczne)? 11 Przyczyny asocjacji alleli Struktura populacji (ukryta zmienna) Paradoks Simpsona: Jeżeli zmieszamy dwie populacje, w których nie występuje asocjacja markera i choroby, ale są różne częstości występowania choroby (oraz markera), w zmieszanej populacji pojawi się asocjacja markera z chorobą (problem ukrytej zmiennej). Jest to przyczyna artefaktów Należy badać populacje jednorodne etnicznie, a nawet tylko pojedyncze duże rodziny 12 Paradoks Simpsona } Prosty przykład: uniwersytet powinien faworyzować kobiety przy przyjmowaniu na studia doktoranckie: Mężczyźni Kobiety Wydział historii 1/5 (20%) 2/8 (25%) Wydział geografii 6/8 (75%) 4/5 (80%) Razem 13 7/13 (54%) 6/13 (46%) University of California, Berkeley, 1973 Przyjęcia na studia doktoranckie Kierunek Mężczyźni (przyjęci) A Kobiety (przyjęte) 825 62% 108 82% B 560 63% 25 68% C 325 37% 593 34% D 417 33% 375 35% E 191 28% 393 24% Więcej kobiet zgłaszało kierunki. F 272się na trudniejsze 6% 341 7% Razem 14 8442 4321 44% 35% Przykład medyczny Porównywano dwie terapie kamieni nerkowych Terapia A Terapia B 78 % (273/350) 83% (289/350) Ale: Terapia A Terapia B Małe kamienie 93% (81/87) 87% (234/270) Duże kamienie 73% (192/263) 69% (55/80) Razem 78 % (273/350) 83% (289/350) Terapię A częściej stosowano u pacjentów z dużymi kamieniami, które trudniej się leczy. 15 Podwójna ślepa próba } Przy badaniach działania leków. terapii itp. } } Terapia vs. placebo; nowa terapia vs. dotychczasowa, itp. Ani pacjent, ani lekarz oceniający efekty nie wie, do której grupy należy dany pacjent 16 Asocjacja } Zależności funkcjonalne } } } często z allelami MHC (HLA) - związane z funkcjonowaniem układu odpornościowego poszukuje się asocjacji dla bardzo intensywnie poznawanych polimorfizmów SNP w genomie człowieka farmakogenetyka i farmakogenomika – polimorfizmy a działanie leków } } } 17 CRHR1 (receptor kortykotropiny) - skuteczność terapii kortykosteroidami w leczeniu astmy HLA-B27 - nadwrażliwość na skutki uboczne Abcaviru HTR2A (serotonina 2A) - reakcja na środki antydepresyjne Asocjacja - przykład } HLA-B27 i choroby autoimmunologiczne, np. zesztywniające zapalenie stawów Chorzy Zdrowi HLA-B27 + 90 1000 HLA-B27 - 10 9000 Ryzyko 8% Ryzyko 0,11% Ryzyko dla całej populacji ~1% test statystyczny Fishera (Fisher exact test): p≈2·10-76 18 19 Geny na...? 20 A w rzeczywistości... 21 A w rzeczywistości... Ryzyko schizofrenii u posiadaczy wariantu wzrasta z ~2% (w populacji) do ~4,5% (posiadający wariant) >95% posiadających wariant nie zachoruje (dla choroby dwubiegunowej, odpowiednio ~4% i ~10%) 22 Dla przypomnienia } HLA-B27 i choroby autoimmunologiczne, np. zesztywniające zapalenie stawów HLA-B27 Chorzy Zdrowi 90 1000 10 9000 + HLA-B27 - test statystyczny Fishera (Fisher exact test): p≈2·10-76 23 € 90 OR = 1000 = 81 10 9000 Asocjacja i sprzężenie } Sprzężenie - wspólna segregacja alleli genów leżących blisko siebie na chromosomie } } } } dotyczy loci, nie konkretnych alleli proste podłoże biologiczne (chromosomy, rekombinacja) badana w rodowodach i/lub parach krewnych Asocjacja - korelacja występowania konkretnych alleli genów w populacji } } } } dotyczy konkretnych alleli często złożone i/lub niejasne podłoże biologiczne - zjawisko statystyczne, niekiedy bez związku przyczynowego dotyczy populacji lub grupy, ale bez wymogu pokrewieństwa może niekiedy być związana ze sprzężeniem (nierównowaga sprzężeń) Metody } Sprzężenie - analiza sprzężeń (mapowanie) } } } metody parametryczne metody nieparametryczne Asocjacje - badania korelacji (testy statystyczne) Allel genu d w pobliżu markera A zmutował dając związany z chorobą allel D wiele pokoleń temu' mutacja A1 d A1 D Jeżeli odległość A do d jest niewielka, wówczas większość chromosomów w populacji niosących D niesie też A1 ' Ale nie odwrotnie!' Nierównowaga sprzężeń (linkage disequilibrium) – nieprzypadkowe skojarzenie alleli w sprzężonych loci – efekt założycielski. Maleje z czasem.' Asocjacja a sprzężenie Asocjacja alleli' Sprzężenie' • Na poziomie populacji' W rodzinie' • Wskazuje konkretne allele' Wskazuje loci' Sprzężenie markera i genu choroby } Asocjacja w obrębie rodziny } Z reguły brak asocjacji w populacji } Niezależne od struktury populacji } Asocjacja populacyjna dla rzadkiego allelu i bardzo bliskiego sprzężenia – nierównowaga sprzężeń Metody mapowania } Parametryczna (oparte na modelach) analiza lod } } } dwupunktowa wielopunktowa Nieparametryczna analiza sprzężeń } } współwystępowanie alleli klucz: IBD (identity by descent) vs. IBS (identity by state) Analiza nieparametryczna Dwa allele są identyczne przez pochodzenie (IBD) jeżeli są kopiami tego samego allelu rodzicielskiego A1A2 A1A1 A1A2 A1A2 IBD Analiza nieparametryczna } Korelacja względnego podobieństwa u par mapowanej cechy z podobieństwem markera } Badania bliźniąt } Badania chorego rodzeństwa (affected siblings method) } Badania rodzin (2-3 pokoleniowe) Analiza chorych krewniaków: czy w parach chorych krewnych allele markera (nieważne które) są wspólne częściej, niż w reszcie populacji?' Miarą odległości jest częstość rekombinacji } częstość rekombinacji θ=prawdopodobieństwo przekazania zrekombinowanej gamety } Loci na różnych chromosomach segregują niezależnie => θ = 0,5 } Loci blisko sprzężone segregują razem => θ = 0 } Terminologia } } θ<0,5 sprzężenie θ=0,5 brak sprzężenia Mapowanie } } Jednostka cM (centymorgan) = 1% rekombinacji W rzeczywistości zależność nie jest liniowa Podwójny crossing-over – gamety typu rodzicielskiego } Interferencja – zajście crossing-over w danym miejscu wpływa na prawdopodobieństwo zajścia kolejnego w pobliżu } Podwójny c-o – jeszcze bardziej złożony W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005 } Powstanie średnio 50% rekombinantów. Podobnie dla potrójnych itp. Funkcja mapowa – zależność odległości genetycznej od częstości rekombinacji Funkcja mapowa Haldane’a } } € uwzględnia interferencję } } } } nie uwzględnia interferencji w crossing-over Funkcja mapowa Kosambiego } ln(1− 2θ ) d= 2 $ 1+ 2θ ' ln& ) % 1− 2θ ( d= 4 crossing-over zmniejsza prawdopodobieństwo drugiego w pobliżu szeroko stosowana Dla małych wartości θ:€d≈θ Funkcja mapowa Wraz ze wzrostem odległości częstość c-o dąży do 0,5 } Dla genów niesprzężonych “rekombinantów” jest 50%, podobnie jak dla genów leżących w dużej odległości } 36 Mapy genetyczne a płeć } } } Całkowita mapa mężczyzny = 2851cM Całkowita mapa kobiety = 4296cM (wyłączając X) Dla ~3000Mb genomu autosomalnego ¨ ¨ 1 cM u mężczyzny ≈ 1.05 Mb 1 cM u kobiety ≈ 0.88Mb Wiarygodność (likelihood) } } Wiarygodność=prawdopodobieństwo uzyskania danych przy założeniach modelu i jego określonych parametrach W układzie w pełni informatywnym } } } } } dane: R=liczba rekombinantów, NR=liczba genotypów rodzicielskich parametr: częstość rekombinacji θ=prawd. rekombinacji Hipoteza zerowa – brak sprzężenia (θ=0,5) Stosunek wiarygodności L(θ)/L(θ=0,5) lod score (Z) = logarithm of odds – logarytm (dziesiętny) stosunku wiarygodności Jak obliczać lod score Dla każdego rodowodu (i) lod wynosi: ˆ) L( ped _ data / θ Z i (θˆ ) = log10 L( ped _ data /θ = 0,5) Dla danej wartości θ, sumuje się wartości lod-score z różnych rodowodów (F): F Z(θˆ ) = ∑ Z i (θˆ ) i=1 Wynik dwupunktowej analizy sprzężeń 4 Lod score curve -4 -2 lod 0 2 znaczące wykluczone 0.0 0.1 0.2 0.3 0.4 0.5 theta Tabela θ= 0.01, 0.10, 0.20, 0.30, 0.35, 0.40, 0.45, 0.50 lod= -5.0, -2.0, 1.0, 3.3, 4.0, 3.0, 1.0, 0.0 Markery w analizie sprzężeń człowieka } Sprzężenie dwóch genów o obserwowalnym fenotypie – praktycznie niespotykane } } } wyjątek – zespół paznokciowo-rzepkowy (NPS – Nail Patella Syndrome) i grupy krwi AB0 Loci w obrębie kompleksów MHC Markery molekularne } PCR, RFLP Markery Lokalizowanie genu I etap – zgrubne (markery co 8-20 cM) – ustalenie chromosomu, czy 1 locus itp. } II etap – dokładne (co 1-4 cM) } The Cooperative Human Linkage Center, www.chlc.org 1,2 2,2 1,1 1,2 1,2 2,2 2,2 1,2 1,2 1,2 2,2 1,1 1,2 1,2 2,2 2,2 * 1,2 1,2 1 rekombinant (R); 4 rodzicielskie (NR) Przy braku sprzężenia (θ=0,5) prawdopodobieństwo uzyskania R i NR jest równe i wynosi ½ L(θ=0,5)= (½)5 1,2 2,2 1,1 1,2 1,2 2,2 2,2 * 1,2 1,2 1 rekombinant (R); 4 rodzicielskie (NR) Dla sprzężenia θ prawdopodobieństwo uzyskania R wynosi θ (z definicji), więc prawdopodobieństwo uzyskania NR wynosi 1- θ L(θ)= θ·(1- θ)4 1R 4NR 1,2 2,2 1,1 1,2 1,2 2,2 2,2 * 1,2 1,2 1 rekombinant (R); 4 rodzicielskie (NR) L(θ=0,5)= (½)5 L(θ)= θ·(1- θ)4 Dla θ=0,1 L(θ=0,1) = 0,1·(0,9)4 $ 0,1⋅ 0,9 4 ' Z(θ = 0,1) = log10 & ) ≈ 0,32 5 % 0,5 ( 0' 0,02' 0,1' -∞ -0,23 0,32 0,2' 0,42 0,3' 0,36 0,4' 0,22 0,5' 0 0' 0,02' 0,1' 0,2' 0,3' 0,4' 0,5' -∞' -0,23' 0,32' 0,42' 0,36' 0,22' 0' 1,1 1,2 1,2 2,2 Nieznana faza u ojca 1,2 2,2 2,2 1,2 1,2 1,2 1,2 2,2 2,2 2,2 1,2 1,2 1 + 2 - 2 + albo 1R 4NR $ 0,2 ⋅ 0,8 4 ' L(θ = 0,2) = & ) 2 % ( 1 - 1NR 4R + $ 0,2 4 ⋅ 0,8 ' L(θ = 0,2) = & ) 2 % ( $ 0,2 ⋅ 0,8 4 0,2 4 ⋅ 0,8 ' + & ) 2 ) ≈ 0,12 Z(θ = 0,2) = log10 & € 2 5 0,5 && )) % ( } Nail-patella syndrome