EWOLUCJA GENOMÓW Bioinformatyka, wykład 6 (22.XI.2010) [email protected] Wykład 6 – spis treści genomika mapowanie genomów początki ewolucji świat RNA świat wirusów (?) ewolucja genomów at or m GENOMIKA yk a GENOMIKA – badanie struktury i funkcjonowania genomów GENOMIKA PORÓWNAWCZA oi bi MAPOWANIE GENOMU: genomów ol ek ul ar na & • Ewolucja •Mapy IIgenetyczne znaczenie: •Mapy fizyczne =proteomika strukturalna GENOMIKA FUNKCJONALNA nf GENOMIKA STRUKTURALNA • Ewolucja genów •Regulacja transkrypcji • Proteomika Structural genomics Comparative genomics Functional genomics Bi ol og ia m SEKWENCJONOWANIE • Transkryptomika Mapy genomowe MAPY GENETYCZNE • powstają w oparciu o analizę częstości rekombinacji między badanymi markerami • pokazują rozmieszczenie markerów na chromosomie oraz odległości genetyczne między nimi • jednostka: 1cM = 1% rekombinacji (1 crossing – over na 100 mejoz) u ludzi to ok.0,7 – 1 Mb MAPY FIZYCZNE • powstają poprzez bezpośrednią lokalizację, technikami biologii molekularnej, badanej sekwencji DNA w genomie • jednostka: pary zasad – pz (ang. bp, kbp) Mapa genomu – graficzna prezentacja położenia markerów/genów na chromosomie MAPY GENETYCZNE MAPY FIZYCZNE cM bp Marker genetyczny – polimorficzna sekwencja DNA (specyficzna) z jednego miejsca na chromosomie, używana do mapowania genetycznego, może być związana z fenotypem. Jest to podstawowe narzędzie genetyka Marker genetyczny klasa II (markery DNA) klasa I (markery fenotypowe) •są to sekwencje DNA, niekoniecznie kodujące, np. RFLP, SSLP, SNP •są to geny kodujące cechy jakościowe organizmu np. antygeny erytrocytarne, antygeny •markery takie jako markery genetycze głównego układu zgodności tkankowej muszą mieć przynajmniej dwie alleliczne (Major Histocompatibility Complex - MHC). formy. •markery tej klasy indentyfikowane są metodami serologicznymi lub metodami elektroforetycznymi. •markery tego typu identyfikowane są przy użyciu technik analizy molekularnej. Częstość rekombinacji Ten sam chromosom Różne chromosomy Bardzo blisko Blisko Daleko Rzadko Kilka Często Często Sprzężenie TAK TAK NIE NIE θ 0% 1-4% 50% 50% Częstość CROSSING-OVER From: TISSUE ENGINEERING & HUMAN GENETICS LABORATORY Markery genetyczne cd. RFLPs (Restriction Fragment Lenght Polymorphisms) -polimorfizm długości fragmentów restrykcyjnych Miejsce cięcia enzymu restrykcyjnego HindIII. Markery genetyczne cd. SNPs (Single Nucleotide Polymorphisms) – polimorfizm pojedynczych nukleotydów Genom ludzki: 37,8 mln SNPs dbSNP @ NCBI Analiza SNP umożliwia wykrycie polimorfizmu pojedynczego nukleotydu w obrębie badanej sekwencji. Klasycznie polega to na amplifikacji określonego fragmentu genomu w reakcji PCR i sekwencjonowaniu uzyskanego produktu. Zaletą tej techniki jest wysoka wydajność identyfikacji polimorfizmu w obrębie badanej sekwencji, wadą jest wysoki koszt analizy. Początki ewolucji H2O, CO, CO2, N2, H2S and H2 Pierwotna „zupa” prostych związków organicznych pierwotny skład atmosfery ziemskiej Experiment by Miller: 1953: Eksperyment Ureya-Millera Początek życia Ok. 14 miliardów lat temu – Wielki Wybuch (Big Bang) ? LUCA Last Universal Common Ancestor Hipoteza świata RNA „oryginalny gen” rybonukleotydy krótkie polimery RNA Carl Woese, 1967. Walter Gilbert,1986 komplementarne łańcuchy RNA komplementarne łańcuchy RNA traktowane jako matryca do robienia kopii „oryginalnego genu” Świat RNA/DNA Monowarstwa micele dwuwarstwa pęcherzyki z dwuwarstwy Biological Organisms Biopolymers Prebiological selection Probionts Prebiological Polymers with the higher degree of organization Prebiological selection Primitive Probionts Oligo/polymers with low degree of organization Chemical Non-specific self assembly Free olygomers and polymers Major transitions in early evolution Hipoteza! Pre-LUCA diversity Rola wirusów. Hipoteza Forterre’a Świat wirusów. Hipoteza Koonina Powstanie eukariontów Geny „informacyjne” – z archeonów Geny „operacyjne” – z bakterii Powstanie eukariontów Geny „informacyjne” – z archeonów Geny „operacyjne” – z bakterii Początki kodowania białek T 1-sza pozycja w kodonie T C A G 2-ga pozycja w kodonie C A G TTT Phe TCT Ser TAT Tyr TGT Cys TTC Phe TCC Ser TAC Tyr TGC Cys TTA Leu TCA Ser TAA Ochre stop stop TGA Opal TTG Leu TCG Ser TAGAmber stop TGG Trp CTT Leu CCT Pro CAT His CGT Arg CTC Leu CCC Pro CAC His CGC Arg CTA Leu CCA Pro CAA Gln CGA Arg CTG Leu CCG Pro CAG Gln CGG Arg ATT Ile ACT Thr AAT Asn AGT Ser ATC Ile ACC Thr AAC Asn AGC Ser ATA Ile ACA Thr AAA Lys AGA Arg ATG Met ACG Thr AAG Lys AGG Arg GTT Val GCT Ala GAT Asp GGT Gly GTC Val GCC Ala GAC Asp GGC Gly GTA Val GCA Ala GAA Glu GGA Gly GTG Val GCG Ala GAG Glu GGG Gly KOD GENETYCZNY A/Ala C/Cys D/Asp E/Glu F/Phe G/Ala H/His I/Ile K/Lys L/Leu M/Met N/Asn P/Pro Q/Gln R/Arg S/Ser T/Thr V/Val W/Trp Y/Tyr alanina cysteina kwas asparaginowy kwas glutaminowy fenyloalanina glicyna histydyna izoleucyna lizyna leucyna metionina asparagina prolina glutamina arginina seryna treonina walina tryptofan tyrozyna Własności kodu genetycznego TRÓJKOWY NIEZACHODZĄCY … A G A C G A C U U … a1 A a2 … A G A C G A C U U … a3 B a4 a1 a2 a3 a5 a6 a7 … A G A C G A C U U … C a1 a2 a3 a4 Własności kodu genetycznego TRÓJKOWY NIEZACHODZĄCY BEZPRZECINKOWY JEDNOZNACZNY KOLINEARNY pierwsza trójka druga trójka trzecia trójka czwarta trójka G A A G A C C U U G A G … Glu pierwszy amin. Asp drugi amin. Leu trzeci amin. Glu czwarty amin. kolejność trójek w mRNA kolejność aminokwasów w białku Własności kodu genetycznego …. UNIWERSALNY ZDEGENEROWANY Trójka ABC Trójka ABA Trójka CBC Trójka CBA Trójka Trójka AAA AAC Amin1 Amin2 Amin3 Am4 Am5 Amin3 NIEPRAWDA!! Odstępstwa od kodu genetycznego kodon Uniwersalny Mitochondria Mitochondria drożdżowe ssacze kod Mitochondria Mitochondria Drosophila Aspergillus TGA STOP tryptofan tryptofan tryptofan tryptofan AGA arginina STOP arginina seryna arginina ATA izoleucyna metionina metionina metionina izoleucyna CTN leucyna leucyna treonina leucyna leucyna AGG Ewolucja genomów Mutacje Duplikacje genów Rearanżacje genów Utrata genów Rearanżacje chromosomalne Duplikacje genomów ... Poziomy transfer genów Powstawanie nowych genów. Mutacje punktowe typu – missense (nonsynonymous ) AUG CCU CAA UUG UAG met pro gln leu STOP Mutacje punktowe typu – frameshift AUG CCC UCA AUU GUA met pro ser ile val mutacja AUG CAU CAA UUG UAG met his gln leu STOP X duplikacje genów lub ich fragmentów • nierówny crossing-over X1 X2 X1 X2 • nierównomierna wymiana fragmentów między siostrzanymi chromatydami • duplikacja podczas replikacji widełki replikacyjne rearanżacja istniejących genów • duplikacja domen Domena A Domena B A B Domena C C Duplikacja segmentu genowego B Domena A Domena B A B Domena B B Domena C C • przetasowanie domen X1 X2 Domena A Domena B Domena C Domena X Domena Y A B C X Y Przetasowanie domen Domena A Domena B A B Domena X X