podstawy bioinformatyki

advertisement
PODSTAWY BIOINFORMATYKI
4 SEKWENCJONOWANIE GENOMÓW II
SEKWENCJONOWANIE GENOMÓW
1. Przykłady zsekwencjonowanych genomów
•
Człowiek
•
Mysz
•
Bydło
2. Zagadnienia bioinformatyczne
Copyright ©2013, Joanna Szyda
HOMO SAPIENS
Copyright ©2013, Joanna Szyda
ZSEKWENCJONOWANE GENOMY
CZŁOWIEK
Copyright ©2010, Joanna Szyda
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
ŹRÓDŁO DNA
•
mieszanka DNA różnych dawców
•
♀/♂
•
Europa / Afryka / Ameryki (pn, centralna, pd) / Azja
•
Craig Venter
•
♂ plemniki
♀ krew
Copyright ©2010, Joanna Szyda
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
ROZMIARY GENOMU
300
250
Mbp
200
150
100
50
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y
chromosom
Copyright ©2010, Joanna Szyda
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
ROZMIESZCZENIE GENÓW
35
30
gęstość genów
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y
chromosom
Copyright ©2010, Joanna Szyda
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
CHARAKTERYSTYKA
•
•
•
•
•
•
•
•
Najnowsza wersja: GRCh38.p2 01.2015
Wielkość: 3 384 269 757 pz
Liczba pz z wyłączeniem „N”: 3 061 458 910
Liczba przerw
o Całkowita: 526
o Min: 1 (BHS13, BHS19)
o Maks: 64 (BHS1)
Liczba genów kodujących białka: 20 300
Liczba genów niekodujących białek: 24 885
Liczba pseudogenów: 14 424
Liczba transkryptów: 198 622
Copyright ©2015 Joanna Szyda
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
DALSZE BADANIA GENOMU
• 5% genomu człowieka jest zgodna dla wszystkich ssaków
• 1.5% - 2.0 % genomu koduje białka
 poznanie funkcji pozostałej części genomu
 projekt ENCODE:
http://genome.ucsc.edu/ENCODE/
An integrated encyclopedia od DNA elements in the human genome
Nature 2012: 489, 57-74
Copyright ©2016 Joanna Szyda
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
DALSZE BADANIA GENOMU
• funkcjonalne elementy niekodujące w genomie
 regulacja ekspresji genów
 segregacja chromosomów w czasie podziału
 replikacja chromosomów
 niekodujące RNA
 metylacja DNA
 transcription factor binding sites
• Inne elementy struktury genomu niezwiązane z DNA
 struktura chromatyny
 upakowanie chromosomów
 modyfikacje histonów
 regiony interakcji pomiędzy chromosomami
Copyright ©2016 Joanna Szyda
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
DALSZE BADANIA GENOMU
•
50 % genów ma nieznaną funkcję  nadanie funkcji
sekwencji genomu człowiekanp.
np.
baza danych OMIM: http://www.omim.org
analizy GWAS  genome-wide association studies
Copyright ©2016 Joanna Szyda
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
DALSZE BADANIA GENOMU
•
Opis zmienności genetycznej
Hapmap project: http://hapmap.ncbi.nlm.nih.gov/
1000 genomes project:
http://www.1000genomes.org/
Copyright ©2015 Joanna Szyda
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
ZASTOSOWANIE INFORMACJI O SEKWENCJI GENOMU
Green et al. Nature 470, 204–213 (2011)
MUS MUSCULUS
Copyright ©2013, Joanna Szyda
ZSEKWENCJONOWANE GENOMY
MYSZ
Copyright ©2010, Joanna Szyda
ZSEKWENCJONOWANE GENOMY - MYSZ
ZAWARTOŚĆ G+C
♦ człowiek
♦ mysz
Copyright ©2010, Joanna Szyda
ZSEKWENCJONOWANE GENOMY - MYSZ
FUNKCJE BIAŁEK
■ człowiek ■ mysz
Copyright ©2010, Joanna Szyda
ZSEKWENCJONOWANE GENOMY - MYSZ
CHARAKTERYSTYKA
•
•
•
•
•
•
•
•
Najnowsza wersja: GRCm38.p3 12.2014
Wielkość: 3 482 005 469 pz
Liczba pz z wyłączeniem „N”: 2 720 699 037
Liczba przerw
o Całkowita: 437
o Min: 1 (BHS6, BHS11, BHS12, BHS16, BHS18)
o Maks: 99 (BHSX)
Liczba genów kodujących białka: 22 606
Liczba genów niekodujących białek: 11 622
Liczba pseudogenów: 8 015
Liczba transkryptów: 103 734
Copyright ©2015, Joanna Szyda
BOS TAURUS
Copyright ©2013, Joanna Szyda
ZSEKWENCJONOWANE GENOMY
BYDŁO
Copyright ©2010, Joanna Szyda
ZSEKWENCJONOWANE GENOMY - BYDŁO
Dominette, Hereford
Norwegian red
Copyright ©2010, Joanna Szyda
ZSEKWENCJONOWANE GENOMY - BYDŁO
QTL: 8 305 QTL, 467 cech
QTL: 13 145 QTL, 492 cechy
 04.2014
 03.2015
600
liczba QTL
500
400
300
200
100
0
Copyright ©2015, Joanna Szyda
ZSEKWENCJONOWANE GENOMY - BYDŁO
CHARAKTERYSTYKA
•
•
•
•
•
•
Najnowsza wersja: UMD3.1 09.2011
Wielkość: 2 649 685 036 pz
Liczba genów kodujących białka: 19 994
Liczba genów niekodujących białek: 3 825
Liczba pseudogenów: 797
Liczba transkryptów: 26 740
Copyright ©2015, Joanna Szyda
Candidatus omnitrophus
Copyright ©2015, Joanna Szyda
ZSEKWENCJONOWANE GENOMY - NAJNOWSZE
Candidatus omnitrophus
•
j. Chiemsee, Bawaria
•
16.03.2015
•
whole genome shotgun
•
3.15 Mpz
•
sekwencja genomu pojedynczej komórki
Copyright ©2015 Joanna Szyda
ZAGADNIENIA BIOINFORMATYCZNE
1. Łączenie fragmentów DNA
• Błędy odczytu sekwencji
• Niekompletne pokrycie genomu
• Sekwencje powtarzalne
• Polimorfizm
• rozmiary danych
• Programy: Celera Assembler, Jazz,
Arachne, Phrap
2. Anotacja genomu
• identyfikacja strukturalnych i
funkcjonalnych elementów genomu
• Programy: Basic Local Alignment Search
Tool (BLAST)
Copyright ©2010, Joanna Szyda
ZAGADNIENIA BIOINFORMATYCZNE
3. Identyfikacje elementów struktury genomu
• SNP - Single Nucleotide Polymorphisms
• CNV – Copy Number Variation
Copyright ©2011, Joanna Szyda
1. Przykłady zsekwencjonowanych genomów
•
Człowiek
•
Mysz
•
Bydło
•
Najnowszy genom
2. Zagadnienia bioinformatyczne
Copyright ©2014, Joanna Szyda
Download