Mapowanie genów człowieka i badania asocjacji

advertisement
Mapowanie genów człowieka i
badania asocjacji
podstawy
Sprzężenie
} 
Geny leżące na różnych chromosomach spełniają II prawo
Mendla
Dla 2 genów:
4 równoliczne klasy gamet
W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005
Sprzężenie
} 
Allele genów leżących na tym samym chromosomie
dziedziczą się razem – sprzężenie
Dla 2 genów:
2 równoliczne klasy gamet rodzicielskich
W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005
Sprzężenie
} 
Crossing-over (rekombinacja chromatyd niesiostrzanych)
Dla 2 genów:
2 równoliczne klasy gamet rodzicielskich
2 równoliczne klasy gamet zrekombinowanych
Klasy zrekombinowane mniej liczne od rodzicielskich
W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005
Mapowanie genów
} 
Aby powstały gamety zrekombinowane, crossing-over
musi zajść pomiędzy genami (loci)
powstają gamety zrekombinowane
W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005
Mapowanie genów
Prawdopodobieństwo crossing-over pomiędzy genami
jest proporcjonalne do odległości między nimi na
chromosomie
}  Liczebność klas zrekombinowanych w potomstwie jest
miarą odległości genetycznej
}  U Drosophila najlepiej mapować za pomocą
heterozygotycznej samicy i samca recesywnego
}  A u człowieka?
} 
Asocjacje
} 
Nieprzypadkowe współwystępowanie czynników (alleli i
fenotypów) na poziomie populacji (korelacja)
} 
} 
} 
} 
7
Czy zawsze asocjacja oznacza zależność przyczynową?
Czy każda asocjacja ma wartość diagnostyczną?
Czy asocjacja odkrywa “gen na ....”?
Czy zawsze czynnik ryzyka?
Geny na...?
8
Asocjacja
Przyczyny asocjacji
• losowa (i nieprawidłowe obliczanie p)
• relacja przyczynowa
§ związek bezpośredni (plejotropizm, jednym z efektów allelu A jest
podatność na chorobę)
§ dobór naturalny (allel A zwiększa fitness u chorych)
§ nie zawsze czynnik ryzyka
• struktura populacji i efekty statystyczne
§ zależności etniczne
§ paradoks Simpsona (dodatkowa zmienna ukryta)
• bliskie sprzężenie + historia (nierównowaga sprzężeń)
9
Struktura populacji
} 
Lander & Schork, 1994 - w rejonie San Francisco jest
wyraźna asocjacja między allelem HLA-A1 a umiejętnością
jedzenia pałeczkami
•  HLA-A1 jest częstszy u Azjatów niż u Europejczyków
10
Asocjacje mogą być zwodne
} 
} 
Allel 3A4 cytochromu P450 (CYP3A) i rak prostaty (bardziej
zaawansowana postać w momencie diagnozy)
CYP3A może w pływać na tempo hydroksylowania testosteronu - związek
przyczynowy?
•  Nie ma wpływu allelu 3A4 na kinetykę metabolizmu testosteronu
•  Allel 3A4 częściej występuje u ludzi pochodzenia afrykańskiego
(Afroamerykanie), niż europejskiego
•  Podobne korelacje dla raka prostaty dla innych alleli częstszych w
populacji afrykańskiej
•  Bardziej zaawansowany rak prostaty u Afroamerykanów (przyczyny
społeczne)?
11
Przyczyny asocjacji alleli
Struktura populacji (ukryta zmienna)
Paradoks Simpsona: Jeżeli zmieszamy dwie populacje, w
których nie występuje asocjacja markera i choroby, ale są
różne częstości występowania choroby (oraz markera), w
zmieszanej populacji pojawi się asocjacja markera z
chorobą (problem ukrytej zmiennej).
Jest to przyczyna artefaktów
Należy badać populacje jednorodne etnicznie, a nawet
tylko pojedyncze duże rodziny
12
Paradoks Simpsona
} 
Prosty przykład: uniwersytet powinien faworyzować kobiety przy
przyjmowaniu na studia doktoranckie:
Mężczyźni
Kobiety
Wydział historii
1/5 (20%)
2/8 (25%)
Wydział geografii
6/8 (75%)
4/5 (80%)
Razem
13
7/13 (54%)
6/13 (46%)
University of California, Berkeley, 1973
Przyjęcia na studia doktoranckie
Kierunek Mężczyźni (przyjęci)
A
Kobiety (przyjęte)
825
62%
108
82%
B
560
63%
25
68%
C
325
37%
593
34%
D
417
33%
375
35%
E
191
28%
393
24%
Więcej
kobiet
zgłaszało
kierunki.
F
272się na trudniejsze
6%
341
7%
Razem
14
8442
4321
44%
35%
Przykład medyczny
Porównywano dwie terapie kamieni nerkowych
Terapia A
Terapia B
78 % (273/350)
83% (289/350)
Ale:
Terapia A
Terapia B
Małe kamienie
93% (81/87)
87% (234/270)
Duże kamienie
73% (192/263)
69% (55/80)
Razem
78 % (273/350)
83% (289/350)
Terapię A częściej stosowano u pacjentów z dużymi kamieniami, które
trudniej się leczy.
15
Podwójna ślepa próba
} 
Przy badaniach działania leków. terapii itp.
} 
} 
Terapia vs. placebo; nowa terapia vs. dotychczasowa, itp.
Ani pacjent, ani lekarz oceniający efekty nie wie, do której
grupy należy dany pacjent
16
Asocjacja
} 
Zależności funkcjonalne
} 
} 
} 
często z allelami MHC (HLA) - związane z funkcjonowaniem
układu odpornościowego
poszukuje się asocjacji dla bardzo intensywnie poznawanych
polimorfizmów SNP w genomie człowieka
farmakogenetyka i farmakogenomika – polimorfizmy a działanie
leków
} 
} 
} 
17
CRHR1 (receptor kortykotropiny) - skuteczność terapii
kortykosteroidami w leczeniu astmy
HLA-B27 - nadwrażliwość na skutki uboczne Abcaviru
HTR2A (serotonina 2A) - reakcja na środki antydepresyjne
Asocjacja - przykład
} 
HLA-B27 i choroby autoimmunologiczne, np.
zesztywniające zapalenie stawów
Chorzy
Zdrowi
HLA-B27
+ 90
1000
HLA-B27
-
10
9000
Ryzyko 8%
Ryzyko 0,11%
Ryzyko dla całej populacji ~1%
test statystyczny Fishera (Fisher exact test):
p≈2·10-76
18
19
Geny na...?
20
A w rzeczywistości...
21
A w rzeczywistości...
Ryzyko schizofrenii u posiadaczy wariantu wzrasta z ~2% (w populacji) do ~4,5% (posiadający wariant) >95% posiadających wariant nie zachoruje (dla choroby dwubiegunowej, odpowiednio ~4% i ~10%) 22
Dla przypomnienia
} 
HLA-B27 i choroby autoimmunologiczne, np.
zesztywniające zapalenie stawów
HLA-B27
Chorzy
Zdrowi
90
1000
10
9000
+
HLA-B27
-
test statystyczny Fishera (Fisher exact test):
p≈2·10-76
23
€
90
OR = 1000 = 81
10
9000
Asocjacja i sprzężenie
} 
Sprzężenie - wspólna segregacja alleli genów leżących blisko
siebie na chromosomie
} 
} 
} 
} 
dotyczy loci, nie konkretnych alleli
proste podłoże biologiczne (chromosomy, rekombinacja)
badana w rodowodach i/lub parach krewnych
Asocjacja - korelacja występowania konkretnych alleli genów w
populacji
} 
} 
} 
} 
dotyczy konkretnych alleli
często złożone i/lub niejasne podłoże biologiczne - zjawisko statystyczne,
niekiedy bez związku przyczynowego
dotyczy populacji lub grupy, ale bez wymogu pokrewieństwa
może niekiedy być związana ze sprzężeniem (nierównowaga sprzężeń)
Metody
} 
Sprzężenie - analiza sprzężeń (mapowanie)
} 
} 
} 
metody parametryczne
metody nieparametryczne
Asocjacje - badania korelacji (testy statystyczne)
Allel genu d w pobliżu markera A zmutował dając związany
z chorobą allel D wiele pokoleń temu'
mutacja
A1
d
A1
D
Jeżeli odległość A do d jest niewielka, wówczas większość chromosomów w
populacji niosących D niesie też A1 '
Ale nie odwrotnie!'
Nierównowaga sprzężeń (linkage disequilibrium) – nieprzypadkowe skojarzenie
alleli w sprzężonych loci – efekt założycielski. Maleje z czasem.'
Asocjacja a sprzężenie
Asocjacja alleli'
Sprzężenie'
•  Na poziomie populacji'
W rodzinie'
•  Wskazuje konkretne allele'
Wskazuje loci'
Sprzężenie markera i genu choroby
} 
Asocjacja w obrębie rodziny
} 
Z reguły brak asocjacji w populacji
} 
Niezależne od struktury populacji
} 
Asocjacja populacyjna dla rzadkiego allelu i bardzo
bliskiego sprzężenia – nierównowaga sprzężeń
Metody mapowania
} 
Parametryczna (oparte na modelach) analiza lod
} 
} 
} 
dwupunktowa
wielopunktowa
Nieparametryczna analiza sprzężeń
} 
} 
współwystępowanie alleli
klucz: IBD (identity by descent) vs. IBS (identity by state)
Analiza nieparametryczna
Dwa allele są identyczne przez pochodzenie (IBD) jeżeli są kopiami tego
samego allelu rodzicielskiego
A1A2
A1A1
A1A2
A1A2
IBD
Analiza nieparametryczna
}  Korelacja
względnego podobieństwa u par
mapowanej cechy z podobieństwem markera
}  Badania
bliźniąt
}  Badania chorego rodzeństwa (affected siblings
method)
}  Badania rodzin (2-3 pokoleniowe)
Analiza chorych krewniaków: czy w parach
chorych krewnych allele markera (nieważne
które) są wspólne częściej, niż w reszcie
populacji?'
Miarą odległości jest częstość rekombinacji
} 
częstość rekombinacji θ=prawdopodobieństwo przekazania
zrekombinowanej gamety
} 
Loci na różnych chromosomach segregują niezależnie
=> θ = 0,5
} 
Loci blisko sprzężone segregują razem
=> θ = 0
} 
Terminologia
} 
} 
θ<0,5 sprzężenie
θ=0,5 brak sprzężenia
Mapowanie
} 
} 
Jednostka cM (centymorgan) = 1% rekombinacji
W rzeczywistości zależność nie jest liniowa
Podwójny crossing-over – gamety typu rodzicielskiego
}  Interferencja – zajście crossing-over w danym miejscu
wpływa na prawdopodobieństwo zajścia kolejnego w
pobliżu
} 
Podwójny c-o – jeszcze bardziej złożony
W. S Klug, M.R Cummings “Concepts of Genetics” 8th edition, Prentice Hall, 2005
} 
Powstanie średnio 50% rekombinantów. Podobnie dla potrójnych itp.
Funkcja mapowa – zależność odległości
genetycznej od częstości rekombinacji
Funkcja mapowa Haldane’a
} 
} 
€
uwzględnia interferencję
} 
} 
} 
} 
nie uwzględnia interferencji w crossing-over
Funkcja mapowa Kosambiego
} 
ln(1− 2θ )
d=
2
$ 1+ 2θ '
ln&
)
% 1− 2θ (
d=
4
crossing-over zmniejsza prawdopodobieństwo drugiego w pobliżu
szeroko stosowana
Dla małych wartości θ:€d≈θ
Funkcja mapowa
Wraz ze wzrostem odległości częstość c-o dąży do 0,5
}  Dla genów niesprzężonych “rekombinantów” jest 50%,
podobnie jak dla genów leżących w dużej odległości
} 
36
Mapy genetyczne a płeć
} 
} 
} 
Całkowita mapa mężczyzny = 2851cM
Całkowita mapa kobiety = 4296cM (wyłączając X)
Dla ~3000Mb genomu autosomalnego
¨ 
¨ 
1 cM u mężczyzny ≈ 1.05 Mb
1 cM u kobiety ≈ 0.88Mb
Wiarygodność (likelihood)
} 
} 
Wiarygodność=prawdopodobieństwo uzyskania danych przy założeniach
modelu i jego określonych parametrach
W układzie w pełni informatywnym
} 
} 
} 
} 
} 
dane: R=liczba rekombinantów, NR=liczba genotypów rodzicielskich
parametr: częstość rekombinacji θ=prawd. rekombinacji
Hipoteza zerowa – brak sprzężenia (θ=0,5)
Stosunek wiarygodności L(θ)/L(θ=0,5)
lod score (Z) = logarithm of odds – logarytm (dziesiętny) stosunku
wiarygodności
Jak obliczać lod score
Dla każdego rodowodu (i) lod wynosi:
ˆ)
L(
ped
_
data
/
θ
Z i (θˆ ) = log10
L( ped _ data /θ = 0,5)
Dla danej wartości θ, sumuje się wartości lod-score z
różnych rodowodów (F):
F
Z(θˆ ) = ∑ Z i (θˆ )
i=1
Wynik dwupunktowej analizy sprzężeń
4
Lod score curve
-4
-2
lod
0
2
znaczące
wykluczone
0.0
0.1
0.2
0.3
0.4
0.5
theta
Tabela
θ=
0.01, 0.10, 0.20, 0.30, 0.35, 0.40, 0.45, 0.50
lod=
-5.0, -2.0,
1.0,
3.3,
4.0,
3.0,
1.0,
0.0
Markery w analizie sprzężeń człowieka
} 
Sprzężenie dwóch genów o obserwowalnym fenotypie –
praktycznie niespotykane
} 
} 
} 
wyjątek – zespół paznokciowo-rzepkowy (NPS – Nail Patella
Syndrome) i grupy krwi AB0
Loci w obrębie kompleksów MHC
Markery molekularne
} 
PCR, RFLP
Markery
Lokalizowanie genu
I etap – zgrubne (markery co 8-20 cM) – ustalenie
chromosomu, czy 1 locus itp.
}  II etap – dokładne (co 1-4 cM)
} 
The Cooperative Human Linkage Center, www.chlc.org
1,2
2,2
1,1
1,2
1,2
2,2
2,2
1,2
1,2
1,2
2,2
1,1
1,2
1,2
2,2
2,2
*
1,2
1,2
1 rekombinant (R); 4 rodzicielskie (NR)
Przy braku sprzężenia (θ=0,5) prawdopodobieństwo uzyskania R i NR jest
równe i wynosi ½
L(θ=0,5)= (½)5
1,2
2,2
1,1
1,2
1,2
2,2
2,2
*
1,2
1,2
1 rekombinant (R); 4 rodzicielskie (NR)
Dla sprzężenia θ prawdopodobieństwo uzyskania R wynosi θ (z definicji),
więc prawdopodobieństwo uzyskania NR wynosi 1- θ
L(θ)= θ·(1- θ)4
1R
4NR
1,2
2,2
1,1
1,2
1,2
2,2
2,2
*
1,2
1,2
1 rekombinant (R); 4 rodzicielskie (NR)
L(θ=0,5)= (½)5
L(θ)= θ·(1- θ)4
Dla θ=0,1 L(θ=0,1) = 0,1·(0,9)4
$ 0,1⋅ 0,9 4 '
Z(θ = 0,1) = log10 &
) ≈ 0,32
5
% 0,5 (
0'
0,02' 0,1'
-∞
-0,23
0,32
0,2'
0,42
0,3'
0,36
0,4'
0,22
0,5'
0
0'
0,02'
0,1'
0,2'
0,3'
0,4'
0,5'
-∞'
-0,23'
0,32'
0,42'
0,36'
0,22'
0'
1,1
1,2
1,2
2,2
Nieznana faza u ojca
1,2
2,2
2,2
1,2
1,2
1,2
1,2
2,2
2,2
2,2
1,2
1,2
1 +
2 -
2 +
albo
1R 4NR
$ 0,2 ⋅ 0,8 4 '
L(θ = 0,2) = &
)
2
%
(
1 -
1NR 4R
+
$ 0,2 4 ⋅ 0,8 '
L(θ = 0,2) = &
)
2
%
(
$ 0,2 ⋅ 0,8 4 0,2 4 ⋅ 0,8 '
+
&
)
2
) ≈ 0,12
Z(θ = 0,2) = log10 & € 2
5
0,5
&&
))
%
(
} 
Nail-patella syndrome
Download