mapowanie genomu

advertisement
EWOLUCJA GENOMÓW
Bioinformatyka, wykład 6 (22.XI.2010)
[email protected]
Wykład 6 – spis treści
„
„
„
„
„
„
genomika
mapowanie genomów
początki ewolucji
świat RNA
świat wirusów (?)
ewolucja genomów
at
or
m
GENOMIKA
yk
a
GENOMIKA –
badanie struktury i funkcjonowania genomów
GENOMIKA
PORÓWNAWCZA
oi
bi
MAPOWANIE GENOMU:
genomów
ol
ek
ul
ar
na
&
• Ewolucja
•Mapy
IIgenetyczne
znaczenie:
•Mapy
fizyczne
=proteomika
strukturalna
GENOMIKA
FUNKCJONALNA
nf
GENOMIKA
STRUKTURALNA
• Ewolucja genów
•Regulacja transkrypcji
• Proteomika
Structural genomics
Comparative genomics
Functional genomics
Bi
ol
og
ia
m
SEKWENCJONOWANIE
• Transkryptomika
Mapy genomowe
MAPY GENETYCZNE
• powstają w oparciu o analizę
częstości rekombinacji między
badanymi markerami
• pokazują rozmieszczenie
markerów na chromosomie oraz
odległości genetyczne między
nimi
• jednostka:
1cM = 1% rekombinacji
(1 crossing – over na 100 mejoz)
u ludzi to ok.0,7 – 1 Mb
MAPY FIZYCZNE
• powstają poprzez bezpośrednią
lokalizację, technikami biologii
molekularnej, badanej sekwencji
DNA w genomie
• jednostka:
pary zasad – pz
(ang. bp, kbp)
Mapa genomu – graficzna prezentacja
położenia markerów/genów na chromosomie
MAPY
GENETYCZNE
MAPY
FIZYCZNE
cM
bp
Marker genetyczny
– polimorficzna sekwencja DNA
(specyficzna) z jednego miejsca na chromosomie,
używana do mapowania genetycznego,
może być związana z fenotypem.
Jest to podstawowe narzędzie genetyka
Marker genetyczny
klasa II (markery DNA)
klasa I (markery fenotypowe)
•są to sekwencje DNA, niekoniecznie
kodujące, np. RFLP, SSLP, SNP
•są to geny kodujące cechy jakościowe
organizmu np. antygeny erytrocytarne, antygeny •markery takie jako markery genetycze
głównego układu zgodności tkankowej
muszą mieć przynajmniej dwie alleliczne
(Major Histocompatibility Complex - MHC).
formy.
•markery tej klasy indentyfikowane są
metodami serologicznymi lub metodami
elektroforetycznymi.
•markery tego typu identyfikowane są
przy użyciu technik analizy molekularnej.
Częstość rekombinacji
Ten sam chromosom
Różne
chromosomy
Bardzo
blisko
Blisko
Daleko
Rzadko
Kilka
Często
Często
Sprzężenie
TAK
TAK
NIE
NIE
θ
0%
1-4%
50%
50%
Częstość
CROSSING-OVER
From: TISSUE ENGINEERING & HUMAN GENETICS LABORATORY
Markery genetyczne cd.
RFLPs (Restriction Fragment Lenght Polymorphisms) -polimorfizm długości fragmentów restrykcyjnych
Miejsce cięcia enzymu restrykcyjnego HindIII.
Markery genetyczne cd.
SNPs (Single Nucleotide Polymorphisms) –
polimorfizm pojedynczych nukleotydów
Genom ludzki: 37,8 mln SNPs
dbSNP @ NCBI
Analiza SNP umożliwia wykrycie polimorfizmu pojedynczego
nukleotydu w obrębie badanej sekwencji. Klasycznie polega to na
amplifikacji określonego fragmentu genomu w reakcji PCR
i sekwencjonowaniu uzyskanego produktu.
Zaletą tej techniki jest wysoka wydajność identyfikacji polimorfizmu
w obrębie badanej sekwencji, wadą jest wysoki koszt analizy.
Początki ewolucji
H2O, CO, CO2, N2, H2S and H2
Pierwotna „zupa” prostych
związków organicznych
pierwotny skład atmosfery ziemskiej
Experiment by Miller:
1953:
Eksperyment
Ureya-Millera
Początek życia
Ok. 14 miliardów lat temu
– Wielki Wybuch (Big Bang)
?
LUCA
Last Universal Common Ancestor
Hipoteza świata RNA
„oryginalny gen”
rybonukleotydy
krótkie polimery
RNA
Carl Woese, 1967.
Walter Gilbert,1986
komplementarne
łańcuchy RNA
komplementarne
łańcuchy RNA
traktowane jako
matryca do
robienia kopii
„oryginalnego genu”
Świat RNA/DNA
Monowarstwa
micele
dwuwarstwa
pęcherzyki z dwuwarstwy
Biological
Organisms
Biopolymers
Prebiological selection
Probionts
Prebiological
Polymers with the higher
degree of organization
Prebiological selection
Primitive Probionts
Oligo/polymers with low
degree of organization
Chemical
Non-specific self assembly
Free olygomers and
polymers
Major transitions in early evolution
Hipoteza!
Pre-LUCA
diversity
Rola wirusów. Hipoteza Forterre’a
Świat wirusów. Hipoteza Koonina
Powstanie eukariontów
Geny „informacyjne”
– z archeonów
Geny „operacyjne”
– z bakterii
Powstanie eukariontów
Geny „informacyjne” – z archeonów
Geny „operacyjne” – z bakterii
Początki kodowania białek
T
1-sza pozycja w kodonie
T
C
A
G
2-ga pozycja w kodonie
C
A
G
TTT Phe
TCT Ser
TAT Tyr
TGT Cys
TTC Phe
TCC Ser
TAC Tyr
TGC Cys
TTA Leu
TCA Ser
TAA Ochre
stop
stop
TGA Opal
TTG Leu
TCG Ser
TAGAmber
stop
TGG Trp
CTT Leu
CCT Pro
CAT His
CGT Arg
CTC Leu
CCC Pro
CAC His
CGC Arg
CTA Leu
CCA Pro
CAA Gln
CGA Arg
CTG Leu
CCG Pro
CAG Gln
CGG Arg
ATT Ile
ACT Thr
AAT Asn
AGT Ser
ATC Ile
ACC Thr
AAC Asn
AGC Ser
ATA Ile
ACA Thr
AAA Lys
AGA Arg
ATG Met
ACG Thr
AAG Lys
AGG Arg
GTT Val
GCT Ala
GAT Asp
GGT Gly
GTC Val
GCC Ala
GAC Asp
GGC Gly
GTA Val
GCA Ala
GAA Glu
GGA Gly
GTG Val
GCG Ala
GAG Glu
GGG Gly
KOD GENETYCZNY
A/Ala
C/Cys
D/Asp
E/Glu
F/Phe
G/Ala
H/His
I/Ile
K/Lys
L/Leu
M/Met
N/Asn
P/Pro
Q/Gln
R/Arg
S/Ser
T/Thr
V/Val
W/Trp
Y/Tyr
alanina
cysteina
kwas asparaginowy
kwas glutaminowy
fenyloalanina
glicyna
histydyna
izoleucyna
lizyna
leucyna
metionina
asparagina
prolina
glutamina
arginina
seryna
treonina
walina
tryptofan
tyrozyna
Własności kodu genetycznego
TRÓJKOWY
NIEZACHODZĄCY
… A G A C G A C U U …
a1
A
a2
… A G A C G A C U U …
a3
B
a4
a1
a2
a3
a5
a6
a7
… A G A C G A C U U …
C
a1
a2
a3
a4
Własności kodu genetycznego
TRÓJKOWY
NIEZACHODZĄCY
BEZPRZECINKOWY
JEDNOZNACZNY
KOLINEARNY
pierwsza
trójka
druga
trójka
trzecia
trójka
czwarta
trójka
G A A G A C C U U G A G …
Glu
pierwszy
amin.
Asp
drugi
amin.
Leu
trzeci
amin.
Glu
czwarty
amin.
kolejność trójek w mRNA
kolejność aminokwasów w białku
Własności kodu genetycznego
….
UNIWERSALNY
ZDEGENEROWANY
Trójka
ABC
Trójka
ABA
Trójka
CBC
Trójka
CBA
Trójka Trójka
AAA
AAC
Amin1
Amin2
Amin3
Am4 Am5
Amin3
NIEPRAWDA!!
Odstępstwa od kodu genetycznego
kodon Uniwersalny Mitochondria Mitochondria
drożdżowe
ssacze
kod
Mitochondria
Mitochondria
Drosophila
Aspergillus
TGA
STOP
tryptofan
tryptofan
tryptofan
tryptofan
AGA
arginina
STOP
arginina
seryna
arginina
ATA
izoleucyna
metionina
metionina
metionina
izoleucyna
CTN
leucyna
leucyna
treonina
leucyna
leucyna
AGG
Ewolucja genomów
Mutacje
Duplikacje genów
Rearanżacje genów
Utrata genów
Rearanżacje chromosomalne
Duplikacje genomów
...
Poziomy transfer genów
Powstawanie nowych genów.
Mutacje punktowe typu –
missense (nonsynonymous )
AUG
CCU
CAA
UUG
UAG
met
pro
gln
leu
STOP
Mutacje punktowe typu
– frameshift
AUG
CCC
UCA
AUU
GUA
met
pro
ser
ile
val
mutacja
AUG
CAU
CAA
UUG
UAG
met
his
gln
leu
STOP
X
duplikacje genów lub ich fragmentów
• nierówny crossing-over
X1
X2
X1
X2
• nierównomierna wymiana fragmentów
między siostrzanymi chromatydami
• duplikacja podczas replikacji
widełki
replikacyjne
rearanżacja istniejących genów
• duplikacja domen
Domena A
Domena B
A
B
Domena C
C
Duplikacja segmentu genowego B
Domena A
Domena B
A
B
Domena B
B
Domena C
C
• przetasowanie domen
X1
X2
Domena A
Domena B
Domena C
Domena X
Domena Y
A
B
C
X
Y
Przetasowanie domen
Domena A
Domena B
A
B
Domena X
X
Download