PODSTAWY BIOINFORMATYKI 4 SEKWENCJONOWANIE GENOMÓW II SEKWENCJONOWANIE GENOMÓW 1. Przykłady zsekwencjonowanych genomów • Człowiek • Mysz • Bydło 2. Zagadnienia bioinformatyczne Copyright ©2013, Joanna Szyda HOMO SAPIENS Copyright ©2013, Joanna Szyda ZSEKWENCJONOWANE GENOMY CZŁOWIEK Copyright ©2010, Joanna Szyda ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ŹRÓDŁO DNA • mieszanka DNA różnych dawców • ♀/♂ • Europa / Afryka / Ameryki (pn, centralna, pd) / Azja • Craig Venter • ♂ plemniki ♀ krew Copyright ©2010, Joanna Szyda ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ROZMIARY GENOMU 300 250 Mbp 200 150 100 50 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y chromosom Copyright ©2010, Joanna Szyda ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ROZMIESZCZENIE GENÓW 35 30 gęstość genów 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y chromosom Copyright ©2010, Joanna Szyda ZSEKWENCJONOWANE GENOMY - CZŁOWIEK CHARAKTERYSTYKA • • • • • • • • Najnowsza wersja: GRCh38.p2 01.2015 Wielkość: 3 384 269 757 pz Liczba pz z wyłączeniem „N”: 3 061 458 910 Liczba przerw o Całkowita: 526 o Min: 1 (BHS13, BHS19) o Maks: 64 (BHS1) Liczba genów kodujących białka: 20 300 Liczba genów niekodujących białek: 24 885 Liczba pseudogenów: 14 424 Liczba transkryptów: 198 622 Copyright ©2015 Joanna Szyda ZSEKWENCJONOWANE GENOMY - CZŁOWIEK DALSZE BADANIA GENOMU • 5% genomu człowieka jest zgodna dla wszystkich ssaków • 1.5% - 2.0 % genomu koduje białka poznanie funkcji pozostałej części genomu projekt ENCODE: http://genome.ucsc.edu/ENCODE/ An integrated encyclopedia od DNA elements in the human genome Nature 2012: 489, 57-74 Copyright ©2016 Joanna Szyda ZSEKWENCJONOWANE GENOMY - CZŁOWIEK DALSZE BADANIA GENOMU • funkcjonalne elementy niekodujące w genomie regulacja ekspresji genów segregacja chromosomów w czasie podziału replikacja chromosomów niekodujące RNA metylacja DNA transcription factor binding sites • Inne elementy struktury genomu niezwiązane z DNA struktura chromatyny upakowanie chromosomów modyfikacje histonów regiony interakcji pomiędzy chromosomami Copyright ©2016 Joanna Szyda ZSEKWENCJONOWANE GENOMY - CZŁOWIEK DALSZE BADANIA GENOMU • 50 % genów ma nieznaną funkcję nadanie funkcji sekwencji genomu człowiekanp. np. baza danych OMIM: http://www.omim.org analizy GWAS genome-wide association studies Copyright ©2016 Joanna Szyda ZSEKWENCJONOWANE GENOMY - CZŁOWIEK DALSZE BADANIA GENOMU • Opis zmienności genetycznej Hapmap project: http://hapmap.ncbi.nlm.nih.gov/ 1000 genomes project: http://www.1000genomes.org/ Copyright ©2015 Joanna Szyda ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ZASTOSOWANIE INFORMACJI O SEKWENCJI GENOMU Green et al. Nature 470, 204–213 (2011) MUS MUSCULUS Copyright ©2013, Joanna Szyda ZSEKWENCJONOWANE GENOMY MYSZ Copyright ©2010, Joanna Szyda ZSEKWENCJONOWANE GENOMY - MYSZ ZAWARTOŚĆ G+C ♦ człowiek ♦ mysz Copyright ©2010, Joanna Szyda ZSEKWENCJONOWANE GENOMY - MYSZ FUNKCJE BIAŁEK ■ człowiek ■ mysz Copyright ©2010, Joanna Szyda ZSEKWENCJONOWANE GENOMY - MYSZ CHARAKTERYSTYKA • • • • • • • • Najnowsza wersja: GRCm38.p3 12.2014 Wielkość: 3 482 005 469 pz Liczba pz z wyłączeniem „N”: 2 720 699 037 Liczba przerw o Całkowita: 437 o Min: 1 (BHS6, BHS11, BHS12, BHS16, BHS18) o Maks: 99 (BHSX) Liczba genów kodujących białka: 22 606 Liczba genów niekodujących białek: 11 622 Liczba pseudogenów: 8 015 Liczba transkryptów: 103 734 Copyright ©2015, Joanna Szyda BOS TAURUS Copyright ©2013, Joanna Szyda ZSEKWENCJONOWANE GENOMY BYDŁO Copyright ©2010, Joanna Szyda ZSEKWENCJONOWANE GENOMY - BYDŁO Dominette, Hereford Norwegian red Copyright ©2010, Joanna Szyda ZSEKWENCJONOWANE GENOMY - BYDŁO QTL: 8 305 QTL, 467 cech QTL: 13 145 QTL, 492 cechy 04.2014 03.2015 600 liczba QTL 500 400 300 200 100 0 Copyright ©2015, Joanna Szyda ZSEKWENCJONOWANE GENOMY - BYDŁO CHARAKTERYSTYKA • • • • • • Najnowsza wersja: UMD3.1 09.2011 Wielkość: 2 649 685 036 pz Liczba genów kodujących białka: 19 994 Liczba genów niekodujących białek: 3 825 Liczba pseudogenów: 797 Liczba transkryptów: 26 740 Copyright ©2015, Joanna Szyda Candidatus omnitrophus Copyright ©2015, Joanna Szyda ZSEKWENCJONOWANE GENOMY - NAJNOWSZE Candidatus omnitrophus • j. Chiemsee, Bawaria • 16.03.2015 • whole genome shotgun • 3.15 Mpz • sekwencja genomu pojedynczej komórki Copyright ©2015 Joanna Szyda ZAGADNIENIA BIOINFORMATYCZNE 1. Łączenie fragmentów DNA • Błędy odczytu sekwencji • Niekompletne pokrycie genomu • Sekwencje powtarzalne • Polimorfizm • rozmiary danych • Programy: Celera Assembler, Jazz, Arachne, Phrap 2. Anotacja genomu • identyfikacja strukturalnych i funkcjonalnych elementów genomu • Programy: Basic Local Alignment Search Tool (BLAST) Copyright ©2010, Joanna Szyda ZAGADNIENIA BIOINFORMATYCZNE 3. Identyfikacje elementów struktury genomu • SNP - Single Nucleotide Polymorphisms • CNV – Copy Number Variation Copyright ©2011, Joanna Szyda 1. Przykłady zsekwencjonowanych genomów • Człowiek • Mysz • Bydło • Najnowszy genom 2. Zagadnienia bioinformatyczne Copyright ©2014, Joanna Szyda