Skad sie biora ,,gorace`` miejsca na genomie?

advertisement
Wstęp
Model
Wyniki
Skąd się biorą „gorące” miejsca na genomie?
M. Bogdan1 D.O. Siegmund2 P. Szulc1 H. Tang3 R.W. Doerge4
1 Instytut
Matematyki i Informatyki, Politechnika Wrocławska
2 Department
of Statistics, Stanford University
3 Department
of Genetics, Stanford University
4 Department
of Statistics, Purdue University
12/2013
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Gen
Hot-spot
Plan
Plan prezentacji:
Co to są „gorące” miejsca na genomie?
W jaki sposób mogą powstawać?
Co zrobić, by się ich pozbyć?
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Gen
Hot-spot
Gen
Gen – fragment DNA
determinujący powstanie jednej
cząsteczki białka lub RNA.
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Gen
Hot-spot
Cis, mRNA
Element regulujący typu
cis – fragment DNA lub RNA
regulujący ekspresję genu,
znajdujący się w jego pobliżu.
Ekspresja genu – proces
przepisania informacji z genu
do białek lub RNA.
Ile mRNA zostało
wyprodukowane?
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Gen
Hot-spot
Wpływ innych genów
Zależność ilości
wyprodukowanego mRNA od
odległych genów.
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Gen
Hot-spot
Hot-spot
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Gen
Hot-spot
Interakcje
Sieć zależności
→ bardzo wiele genów
(wszystkie?) ma minimalny
wpływ na ilość mRNA
→ fałszywe hot-spoty.
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Model
Test
Model
yik =
m
X
βjk xij + ik , i = 1, ..., n, k = 1, ..., q.
j=1
xij = ±1 (dwie wersje genotypów),
ik ∼ N (0, σ 2 ),
βkk ∼ N (µ0 , τ02 ),
βjk ∼ N (µk , τ12 ), j 6= k, µk ∼ N (0, τ22 ), µk µ0 .
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Model
Test
Test
Dla każdego markera j porównujemy model
M1 : yik = β0k + βkk xik + ik
z modelem
M2 : yik = β0k + βkk xik + βjk xij + ik ,
przy pomocy testu
F =
RSS1jk − RSS2jk
(n − 3).
RSS2jk
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Hot-spot
Trajektorie
Jak pozbyć się fałszywych hot-spotów?
1000
500
0
cecha
1500
2000
Hot-spot
0
500
1000
1500
2000
marker
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Hot-spot
Trajektorie
Jak pozbyć się fałszywych hot-spotów?
6
4
2
0
F_mean
8
10
12
Średnia trajektoria
0
500
1000
1500
2000
marker
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Hot-spot
Trajektorie
Jak pozbyć się fałszywych hot-spotów?
Wartość oczekiwana testu F
F = ( RSS1
RSS2 − 1)(n − 3),
E(RSS1)
RSS1
E RSS2
≈ E(RSS2) ,

1 x1k
 ..
..
Dopasowujemy model Y = X̃ β̃ + , gdzie X̃ =  .
.
1 xnk

x1j
.. 
. 
xnj
Y T Y = Y T (X̃ (X̃ T X̃ )−1 X̃ T )Y + Y T (I − X̃ (X̃ T X̃ )−1 X̃ T )Y
Z twierdzenia Cochrana Y T AY ∼ χ2 (n − 3, (X β)T AX β),
gdzie A = I − X̃ (X̃ T X̃ )−1 X̃ T ,
E(RSS2) = n−3+Tr (AX Var(β)X T )+Tr (X T AX Var(E(β)) +
+ (E(E(β)))T X T AX E(E(β)).
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Hot-spot
Trajektorie
Jak pozbyć się fałszywych hot-spotów?
10
5
0
F
15
20
Trajektorie dla 5. chromosomu
0
20
40
60
80
100
marker
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Hot-spot
Trajektorie
Jak pozbyć się fałszywych hot-spotów?
Model mieszany
Przypomnienie:
yik =
m
X
βjk xij + ik , i = 1, ..., n, k = 1, ..., q.
j=1
Możemy napisać βjk ∼ µk + N (0, τ12 ) i rozważać model
yik = βkk xik + µk
m
X
xij + vik , i = 1, ..., n, k = 1, ..., q,
j=1
gdzie v ∼ N (0, σu2 XX T + σ2 I ).
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Wstęp
Model
Wyniki
Hot-spot
Trajektorie
Jak pozbyć się fałszywych hot-spotów?
1000
500
0
q
1500
2000
Wyniki
0
500
1000
1500
2000
m
P. Szulc
Skąd się biorą „gorące” miejsca na genomie?
Download