Mapowanie fizyczne genomów -konstrukcja map wyskalowanych w jednostkach fizycznych -najdokładniejszą mapą fizyczną genomu, o największej rozdzielczości jest sekwencja nukleotydowa -mapowanie fizyczne genomu to zadanie genomiki strukturalnej Dlaczego nie mapa genetyczna? Strategie tworzenia map fizycznych o wysokiej rozdzielczości – sekwencjonowania genomów 1. Strategia hierarchiczna 2. Strategia przypadkowej fragmentacji genomu tzw. „shotgun” Wspólną cechą obu strategii jest dekonstrukcja genomu a następnie jego rekonstrukcja Strategia hierarchiczna (albo inaczej kontigu klonów) 1. podzielenie genomu na „mniejsze” (rzędu dziesiątków lub setek tysięcy pz) części i sklonowanie do odpowiednich wektorów – biblioteka genomowa) 2. poukładanie klonów biblioteki w ciągi (kontigi) nachodzących na siebie fragmentów genomu w sposób który odzwierciedla taki sam liniowy porządek jaki występuje w genomie (chromosomie) z którego te fragmenty DNA powstały 3. Wybór minimalnego zestawu klonów i ich sekwencjonowanie Biblioteki genomowe (banki DNA) - zbiór klonów pokrywających cały genom •zwykle wstawki DNA w klonach biblioteki są duże •Zbiór ten musi być uporządkowany tak aby sklonowane fragmenty odzwierciedlały naturalny porządek DNA badanego organizmu •Uporządkowanie klonów biblioteki genomowej jest istotą strategii hierarchicznej •Jest możliwe dzięki ustaleniu pozycji charakterystycznych sekwencji w genomie za pomocą technik molekularnych (inżynierii genetycznej) Zanim skonstruujemy bibliotekę genomową powinniśmy ustalić: •Ile musi być takich klonów w naszej bibliotece? •Czym strawić genomowe DNA aby uzyskać fragmenty o dużej wielkości? •W jakim wektorze je sklonować? 1. Ile musi być klonów w bibliotece genomowej? czyli: Stopień pokrycia genomu przez bibliotekę Liczbę potrzebnych klonów łatwo obliczyć: •zależy to od wielkości genomu •wielkości fragmentów na które został podzielony (czyli de facto wielkości wstawki klonów biblioteki) •Dla 95% prawdopodobieństwa pokrycia przez bibliotekę całego genomu potrzeba 3x większego nadmiaru sklonowanych fragmentów genomu względem wielkości genomu, a dla 99% 5x większego nadmiaru sklonowanych fragmentów DNA - reprezentatywna biblioteka genomowa •Reprezentatywna biblioteka genomowa musi zawierać nadmiar fragmentów genomu (3-5 krotny) w postaci zrekombinowanych klonów np. plazmidowych w stosunku do wielkości genomu Biblioteka genomowa musi zawierać nadmiar fragmentów w postaci zrekombinowanych klonów np. plazmidowych w stosunku do wielkości genomu 2. Wybór enzymu do klonowania Liczba potrzebnych klonów zależy to od wielkości wstawki i wielkości genomu Zasada jest prosta: im większa wstawka tym mniej klonów do uporządkowania Organizm wielkość genomu enzym czwórkowy (n/256) enzym szóstkowy (n/4096) enzym ósemkowy (n/~65 kpz) E. coli 4,7 x 106 18 tys 1 tys 72 drożdże` 1,35 x 107 52 tys 3 tys 206 człowiek 3,0 x 109 ok. 1 mln 683 tys 420 Miejsca rozpoznawane przez enzymy rzadkotnące np. ósemkowe są rozmieszczone w genomach bardzo nierównomiernie •Jeśli wymagane są fragmenty o bardziej wyrównanej wielkości stosuje się tzw. trawienie częściowe lub ograniczone enzymem czwórkowym lub szóstkowym Zaleta: trawienie jest losowe – żadna część genomu nie jest pominięta, uzyskane fragmenty będą się częściowo nakładały (zachodziły) na siebie 3. Wybór wektora do tworzenia biblioteki System klonowania PAC – P1-derived artificial chromosome połączenie wektora P1 i plazmidu F, zachowuje pewne cechy wektora fagowego P1 (miejsca loxP), ale zamiast systemu pakowania w główki zrekombinowane PAC-i są wprowadzane przez elektroporację do komórek E. coli cre+. Rekombinaza Cre działa w miejscach loxP tworząc kolisty plazmid, który może być amplifikowany przez indukcję litycznego operonu P1 Zakres wielkości wstawek w PAC: 100-300 kpz, F ori elektroporacja Sztuczny chromosom bakteryjny – BAC (Bacterial Artificial Chromosome) •Bakteryjny system klonowania oparty na niskokopijnym plazmidzie E. coli – plazmidzie F •Łatwy w manipulacji •Zapewnia dużą stabilność sklonowanego DNA •Niechimeryczny •Wysoka wydajność transformacji Sztuczny chromosom bakteryjny BAC (Shizuya i in. 1992) •Wektory BAC skonstruowano, aby uniknąć problemów związanych ze stosowaniem wektorów YAC. •Do wektorów BAC można wstawić fragment o długości około 100-500 kpz. •W porównaniu do wektorów YAC, wektory BAC są bardziej stabilne, łatwiej transformuje się nimi komórki E. coli oraz łatwiej się je namnaża i izoluje z komórek bakteryjnych. Dysponując biblioteką musimy zestawić sklonowane fragmenty DNA w takim samym liniowym porządku, w jakim znajdowały się w genomie, z którego zostały otrzymane. Kontig – seria zachodzących fragmentów, które wspólnie pokrywają jakiś region chromosomu, cały chromosom lub cały genom Biblioteka genomowa – bardzo specyficzne „puzzle” Sprowadza się to do wyszukiwania w klonach biblioteki wspólnych molekularnych elementów pasujących do siebie. Ponieważ sklonowanych fragmentów DNA w bibliotece zwykle jest dużo, metoda ich układania czyli znajdowania pokrywających się odcinków powinna być szybka i wydajna 1. Tworzenie kontigu klonów przez spacery po chromosomie (chromosome walking) Wady metody spacerów po chromosomie: •Pracochłonność i czasochłonność, •Źle spisuje się jeśli DNA jest bogate w sekwencje powtarzające się – prowadzi wtedy do uzyskania błędnych wyników 2. Tworzenie kontigu klonów przez mapowanie restrykcyjne - metoda „odcisku palca” enzymów restrykcyjnych (restriction enzymes fingerprinting) Mapowanie restrykcyjne – polega na trawieniu poszczególnych klonów biblioteki DNA enzymem (najczęściej szóstkowym) i porównywanie wzorów trawienia Mapa kontigów powstaje z i nakładających się klonów, o podobnych wzorach restrykcyjnych Metoda „odcisku palca” enzymów restrykcyjnych (restriction enzymes fingerprinting) Nakładające się klony identyfikuje się na podstawie identyczności co najmniej 5 kolejnych miejsc trawienia – „podobnych odcisków palców” poszczególnych klonów Skalę mapowania restrykcyjnego ograniczają rozmiary fragmentów klonów biblioteki •Mapy restrykcyjne tworzy się łatwo kiedy jest mało miejsc restrykcyjnych, czyli dla stosunkowo krótkich fragmentów DNA (nie więcej niż 50 – 100 kpz) •Kiedy rośnie liczba miejsc rośnie liczba fragmentów do analizy, granicę stanowi moment kiedy jest tak dużo pojedynczych fragmentów że zaczynają się one ze sobą zlewać 3. Tworzenie kontigu klonów przez mapowanie tzw. etykietek sekwencyjnych (znaczników sekwencyjnych) typu STS i EST Wykorzystanie etykietek STS i EST jest jedną z najlepszych technik tworzenia kontigów klonów bibliotek genomowych Etykietki typu STS (STS – sequence tagged sites) - miejsca znaczone sekwencyjnie (czyli miejsca, których sekwencję DNA znamy i możemy dla tego miejsca zaprojektować startery do reakcji PCR) •STS – to krótka, znana sekwencja genomu (100-500 pz), łatwa do rozpoznania (np. możliwa do powielenie w reakcji PCR) •pojawiająca się w genomie tylko jeden raz – unikalna (nie powinna być zlokalizowana w obrębie sekwencji powtarzających się lub zawierać sekwencji powtórzonych !!!) •STS – mogą pochodzić np. z losowego sekwencjonowania końcówek wstawek biblioteki genomowej DNA Tworzenie kontigu polega na sprawdzaniu poprzez reakcję PCR- (łatwo ją zautomatyzować), które fragmenty (klony biblioteki) zawierają daną etykietkę sekwencyjną - STS. Fragmenty zawierające to samo STS muszą na siebie zachodzić Mapowanie EST (expressed sequence tag) – etykietki ekspresyjne (sekwencyjne znaczniki ekspresji) •specyficzny rodzaj STS-ów stosowany głównie w analizie genomów eukariotycznych •są to krótkie sekwencje uzyskiwane przez analizę klonów cDNA – powstałego w wyniku odwrotnej transkrypcji preparatów mRNA Zaletą używania EST-ów (poza takimi samymi jakie pełnią STS w mapowaniu) jest to, że wykazują bezpośredni związek z genami ulegającymi ekspresji w genomie, ponieważ pochodzą z mRNA Kiedy już poukładamy bibliotekę w kontigi…. Czy trzeba sekwencjonować wszystkie klony biblioteki genomowej? chromosom kontigi klonów biblioteki uzyskane sekwencje Zalety i wady strategii hierarchicznej chromosom kontigi klonów biblioteki uzyskane sekwencje Zalety 1. Łatwość wypełniania przerw w ciągłej sekwencji 2. Łatwiejsze składanie uzyskanych sekwencji szczególnie w przypadku złożonych genomów bogatych w sekwencje powtórzone Wady 1. Konieczność konstrukcji i układania klonów biblioteki 2. Czasochłonność Strategia przypadkowej fragmentacji genomu „shotgun” 1. nie wymaga tworzenia bibliotek i kontigów klonów Metoda szybsza (szybciej uzyskujemy sekwencję genomu), uznawana (niesłusznie!!!) za przydatną do sekwencjonowania jedynie małych genomów Izolacja DNA Przypadkowa fragmentacja genomu (trawienie lub sonikacja) Elektroforeza w żelu agarozowym i izolacja fragmentów DNA określonej wielkości (zwykle małe do 10 kpz, najczęściej jeszcze mniejsze 1.6-2.0 kpz Klonowanie w uniwersalne wektory (pUC) niekoniecznie (nieobligatoryjne w metodach sekwencjonowania NGS) Sekwencjonowanie ogromnej ilości klonów z użyciem uniwersalnych starterów wektora (suma uzyskanych odczytów sekwencji shot-gun musi co najmniej 6-8 krotnie pokrywać wielkość genomu) (w metodach NGS wiele więcej!!!) Składanie kontigów sekwencji i wypełnianie przerw Zalety: 1. Szybko uzyskujemy prawie pełną sekwencję genomu 2. Małe przerwy w ciągłej sekwencji można wypełniać stosując np. technikę wędrówki starterów WADY : 1. trzeba przeanalizować ogromną ilość klonów (duży ciężar badań przeniesiony na analizy bioinformatyczne) 2. problemem jest zamykaniem dużych przerw w sekwencji 3. problemem dla shot-gun są genomy bogate w sekwencje powtórzone 3. Problemem dla shot-gun są genomy bogate w sekwencje powtórzone Która strategia jest lepsza? Ukierunkowana strategia „shotgun” Strategia ukierunkowanego shotgun: •Większość sekwencji uzyskuje się na drodze sekwencjonowania klonów „biblioteki” o średniej wielkości wstawek ok. 2 kpz (80-90% sekwencji genomu) •Pozostałe sekwencje pochodzą z odczytania sekwencji klonów drugiej „biblioteki” o średniej wielkości wstawek rzędu 10 kpz lub więcej (10-20% sekwencji genomu) Zalety: •Zastosowanie dwóch „bibliotek” daje lepsze pokrycie genomu •Biblioteka klonów z dużymi wstawkami zapobiega błędom wynikającym z powtórzeń w genomie •Ułatwia składanie sekwencji zwłaszcza obejmujących powtórzone DNA