Wstęp Model Wyniki Skąd się biorą „gorące” miejsca na genomie? M. Bogdan1 D.O. Siegmund2 P. Szulc1 H. Tang3 R.W. Doerge4 1 Instytut Matematyki i Informatyki, Politechnika Wrocławska 2 Department of Statistics, Stanford University 3 Department of Genetics, Stanford University 4 Department of Statistics, Purdue University 12/2013 P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Gen Hot-spot Plan Plan prezentacji: Co to są „gorące” miejsca na genomie? W jaki sposób mogą powstawać? Co zrobić, by się ich pozbyć? P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Gen Hot-spot Gen Gen – fragment DNA determinujący powstanie jednej cząsteczki białka lub RNA. P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Gen Hot-spot Cis, mRNA Element regulujący typu cis – fragment DNA lub RNA regulujący ekspresję genu, znajdujący się w jego pobliżu. Ekspresja genu – proces przepisania informacji z genu do białek lub RNA. Ile mRNA zostało wyprodukowane? P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Gen Hot-spot Wpływ innych genów Zależność ilości wyprodukowanego mRNA od odległych genów. P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Gen Hot-spot Hot-spot P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Gen Hot-spot Interakcje Sieć zależności → bardzo wiele genów (wszystkie?) ma minimalny wpływ na ilość mRNA → fałszywe hot-spoty. P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Model Test Model yik = m X βjk xij + ik , i = 1, ..., n, k = 1, ..., q. j=1 xij = ±1 (dwie wersje genotypów), ik ∼ N (0, σ 2 ), βkk ∼ N (µ0 , τ02 ), βjk ∼ N (µk , τ12 ), j 6= k, µk ∼ N (0, τ22 ), µk µ0 . P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Model Test Test Dla każdego markera j porównujemy model M1 : yik = β0k + βkk xik + ik z modelem M2 : yik = β0k + βkk xik + βjk xij + ik , przy pomocy testu F = RSS1jk − RSS2jk (n − 3). RSS2jk P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Hot-spot Trajektorie Jak pozbyć się fałszywych hot-spotów? 1000 500 0 cecha 1500 2000 Hot-spot 0 500 1000 1500 2000 marker P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Hot-spot Trajektorie Jak pozbyć się fałszywych hot-spotów? 6 4 2 0 F_mean 8 10 12 Średnia trajektoria 0 500 1000 1500 2000 marker P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Hot-spot Trajektorie Jak pozbyć się fałszywych hot-spotów? Wartość oczekiwana testu F F = ( RSS1 RSS2 − 1)(n − 3), E(RSS1) RSS1 E RSS2 ≈ E(RSS2) , 1 x1k .. .. Dopasowujemy model Y = X̃ β̃ + , gdzie X̃ = . . 1 xnk x1j .. . xnj Y T Y = Y T (X̃ (X̃ T X̃ )−1 X̃ T )Y + Y T (I − X̃ (X̃ T X̃ )−1 X̃ T )Y Z twierdzenia Cochrana Y T AY ∼ χ2 (n − 3, (X β)T AX β), gdzie A = I − X̃ (X̃ T X̃ )−1 X̃ T , E(RSS2) = n−3+Tr (AX Var(β)X T )+Tr (X T AX Var(E(β)) + + (E(E(β)))T X T AX E(E(β)). P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Hot-spot Trajektorie Jak pozbyć się fałszywych hot-spotów? 10 5 0 F 15 20 Trajektorie dla 5. chromosomu 0 20 40 60 80 100 marker P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Hot-spot Trajektorie Jak pozbyć się fałszywych hot-spotów? Model mieszany Przypomnienie: yik = m X βjk xij + ik , i = 1, ..., n, k = 1, ..., q. j=1 Możemy napisać βjk ∼ µk + N (0, τ12 ) i rozważać model yik = βkk xik + µk m X xij + vik , i = 1, ..., n, k = 1, ..., q, j=1 gdzie v ∼ N (0, σu2 XX T + σ2 I ). P. Szulc Skąd się biorą „gorące” miejsca na genomie? Wstęp Model Wyniki Hot-spot Trajektorie Jak pozbyć się fałszywych hot-spotów? 1000 500 0 q 1500 2000 Wyniki 0 500 1000 1500 2000 m P. Szulc Skąd się biorą „gorące” miejsca na genomie?