PODSTAWY BIOINFORMATYKI 2 SEKWENCJONOWANIE GENOMÓW PROJEKTY POZNANIA INNYCH GENOMÓW Seria 1 300 250 251 254 w trakcie scalania w trakcie realizacji 200 150 100 50 23 0 ukończone SEKWENCJONOWANIE GENOMÓW 1. Sekwencjonowanie 2. Automatyzacja sekwencjonowania 3. Sekwencjonowanie całych genomów • Metoda tradycyjna „BAC-to-BAC” • Metoda "shotgun" • Metoda "high throughoutput" 4. Zsekwencjonowane genomy - przykłady • Człowiek • Mysz • Bydło 5. Zagadnienia bioinformatyczne SEKWENCJONOWANIE • Fred Sanger • 2 nagrody Nobla • Laboratory of Molecular Biology, Cambridge UK • 1970-te metoda sekwencjonowania • metoda zakończenia łańcucha DNA SEKWENCJONOWANIE 1. W sekwencjonowaniu prowadzi się 4 osobne reakcje, kaŜda wykorzystuje: • Wzorcową nić DNA • Primer • Polimerazę DNA • Deoksyrybonukleotydy • 4 Dideoksyrybonukleotydy (kaŜdy w innej reakcji) 2. Denaturacja DNA na pojedyncze nici w temp. 94˚C 3. Przyłączenie primera w temp. 55˚C 4. Przyłączenie polimerazy w temp. 37˚C 5. Replikacja DNA SEKWENCJONOWANIE 6. W przypadku przyłączenia dideoksynukleotydu następuje zakończenie replikacji - zakończenie łańcucha DNA 7. Przyłączenie dideoksynukleotydu jest losowe otrzymujemy zbiór łańcuchów DNA o róŜnej długości zakończonych np. adeniną 8. Lub innym nukleotydem (w pozostałych reakcjach) 9. Produkty reakcji są poddane elektroforezie - 4 osobne linie dla A, C, T i G 10. Droga wędrówki łańcuchów DNA przez Ŝel zaleŜy od ich długości SEKWENCJONOWANIE 11. Wizualizacja pozycji poszczególnych fragmentów 12. Odczytywanie DNA - rozpoczynając od najkrótszych fragmentów = od dołu 13. Identyfikacja sekwencji nukleotydów 14. Typowa długość łańcucha 200-500 bp SEKWENCJONOWANIE AUTOMATYCZNE • Analiza całych genomów → automatyzacja procesu sekwencjonowania • Sekwenatory DNA → 384 próbki DNA, 24 analizy / doba SEKWENCJONOWANIE AUTOMATYCZNE 1. Substraty do sekwencjonowania • ? 2. Denaturacja DNA 3. Przyłączenie primera 4. Przyłączenie polimerazy 5. Replikacja 6. Zakończenie 7. Łańcuchy DNA o róŜnych długościach 8. Sekwenator → elektroforeza 9. Sekwenator → odczytanie fluorescencji A, C, T lub G 10. Program → plik wynikowy SEKWENCJONOWANIE CAŁYCH GENOMÓW 1. Metoda tradycyjna „BAC-to-BAC” 1980 Map based sequencing 2. Metoda „shotgun” 1997 Whole genome shotgun sequencing 3. Metoda nowej generacji Next generation sequencing ~2007 SEKWENCJONOWANIE GENOMÓW - SHOTGUN DEFRAGMENTACJA DNA fragmenty oczyszczonego DNA 150-200 kb losowo pocięte fragmenty DNA 2-4 kb SEKWENCJONOWANIE GENOMÓW - SHOTGUN WPROWADZANIE DNA DO PLAZMIDU SEKWENCJONOWANIE GENOMÓW - SHOTGUN WPROWADZANIE DNA DO GENOMU BAKTERII → REPLIKACJA → MILIARDY KOPII SEKWENCJONOWANIE GENOMÓW - SHOTGUN SEKWENCJONOWANIE FRAGMENTÓW 1 000 bp SEKWENCJONOWANIE GENOMÓW - SHOTGUN OSTATECZNY WYNIK - SEKWENCJA KONSENSUSOWA SEKWENCJONOWANIE GENOMÓW - SHOTGUN PROGRAMY KOMPUTEROWE: • Phrap → składanie zsekwencjonowanych fragmentów assembling • Consed → przygotowywanie ostatecznej sekwencji consensus sequence SEKWENCJONOWANIE GENOMÓW – SHOTGUN:BAC-to-BAC BAC-to-BAC SHOTGUN • Fragmentacja DNA: 150 kbp • Fragmentacja DNA: 2 kbp • Konstrukcja bibliotek BAC • Konstrukcja bibliotek plazmidowych • Konstrukcja ramowej mapy – kolejność fragmentów BAC SEKWENCJONOWANIE GENOMÓW – SHOTGUN:BAC-to-BAC BAC-to-BAC SHOTGUN • Fragmentacja BAC DNA – konstrukcja bibliotek M13 • Sekwencjonowanie bibliotek M13 • Sekwencjonowanie bibliotek plazmidowych • Łączenie sekwencji • Łączenie sekwencji SEKWENCJONOWANIE GENOMÓW – NEXT GENERATION METODA NOWEJ GENERACJI • Sekwencjonowanie bardzo krótkich fragmentów • 100-500 bp • DNA unieruchomione na płytce • Szybkie • Tanie • Platformy: 454 technology, Solexa, SOLiD ZSEKWENCJONOWANE GENOMY CZŁOWIEK ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ŹRÓDŁO DNA • mieszanka DNA róŜnych dawców • ♀/♂ • Europa / Afryka / Ameryki (pn, centralna, pd) / Azja • Craig Venter • ♂ plemniki ♀ krew ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ROZMIARY GENOMU 300 250 Mbp 200 150 100 50 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y chromosom ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ROZMIESZCZENIE GENÓW 35 30 gęstość ść genów 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y chromosom ZSEKWENCJONOWANE GENOMY - CZŁOWIEK CHARAKTERYSTYKA • • • • • • • • • • Wielkość: 2.91 – 3.16 Gbp % par nukleotydów: A – T 54 % (ubogie w geny) G – C 38 % (bogate w geny) nieznane 9 % Elementy powtarzalne: 35-46 % genomu Liczba genów: 39 114 Chromosom najbogatszy w geny: 19 (23 geny/1Mbp) Chromosom najuboŜszy w geny: 13 (5 genów/1Mbp) Średnia długość genu: 27 000 – 40 000 bp NajdłuŜszy gen: 2 400 000 bp Gen o największej liczbie egzonów: titina (234) 1 gen koduje średnio 3 białka ZSEKWENCJONOWANE GENOMY - CZŁOWIEK DALSZE BADANIA GENOMU • 59 % genów ma nieznaną funkcję wpływ genów na zdrowie wpływ na inne cechy człowieka współdziałanie pomiędzy genami imprinting • 2 % genomu koduje białka poznanie funkcji pozostałej części genomu • Analiza mapy sprzęŜeniowej częstość crossing over u róŜnych płci rekombinacyjne hot- i coldspots ZSEKWENCJONOWANE GENOMY - CZŁOWIEK WYKORZYSTANIE ZDOBYTEJ WIEDZY • medycyna rozwój metod diagnostycznych produkcja nowych (specyficznych) leków • antropologia badania ewolucji człowieka identyfikacja osobników: kontrola spokrewnienia, kryminalistyka ZSEKWENCJONOWANE GENOMY MYSZ ZSEKWENCJONOWANE GENOMY - MYSZ ZAWARTOŚĆ G+C ♦ człowiek ♦ mysz ZSEKWENCJONOWANE GENOMY - MYSZ FUNKCJE BIAŁEK ■ człowiek ■ mysz ZSEKWENCJONOWANE GENOMY - MYSZ CHARAKTERYSTYKA • • • • Wielkość: 2.5 Gbp Elementy powtarzalne: 38% genomu Liczba genów: 30 000 99% genów myszy ma homologi u człowieka ZSEKWENCJONOWANE GENOMY BYDŁO ZSEKWENCJONOWANE GENOMY - BYDŁO Dominette, Hereford Norwegian red ZSEKWENCJONOWANE GENOMY - BYDŁO QTL: 1 050 QTL, 91 cech 250 Liczba QTL 200 150 100 50 0 cecha ZAGADNIENIA BIOINFORMATYCZNE 1. Łączenie fragmentów DNA • Błędy odczytu sekwencji • Niekompletne pokrycie genomu • Sekwencje powtarzalne • Polimorfizm • rozmiary danych • Programy: Celera Assembler, Jazz, Arachne, Phrap 2. Anotacja genomu • identyfikacja strukturalnych i funkcjonalnych elementów genomu • Programy: Basic Local Alignment Search Tool (BLAST) 1. Sekwencjonowanie 2. Automatyzacja sekwencjonowania 3. Sekwencjonowanie całych genomów • Metoda tradycyjna „BAC-to-BAC” • Metoda "shotgun" • Metoda "high throughoutput" 4. Zsekwencjonowane genomy - przykłady • Człowiek • Mysz • Bydło 5. Zagadnienia bioinformatyczne