podstawy bioinformatyki

advertisement
PODSTAWY BIOINFORMATYKI
2 SEKWENCJONOWANIE GENOMÓW
PROJEKTY POZNANIA INNYCH GENOMÓW
Seria 1
300
250
251
254
w trakcie scalania
w trakcie realizacji
200
150
100
50
23
0
ukończone
SEKWENCJONOWANIE GENOMÓW
1. Sekwencjonowanie
2. Automatyzacja sekwencjonowania
3. Sekwencjonowanie całych genomów
•
Metoda tradycyjna „BAC-to-BAC”
•
Metoda "shotgun"
•
Metoda "high throughoutput"
4. Zsekwencjonowane genomy - przykłady
•
Człowiek
•
Mysz
•
Bydło
5. Zagadnienia bioinformatyczne
SEKWENCJONOWANIE
• Fred Sanger
• 2 nagrody Nobla
• Laboratory of Molecular Biology,
Cambridge UK
• 1970-te metoda sekwencjonowania
• metoda zakończenia łańcucha DNA
SEKWENCJONOWANIE
1. W sekwencjonowaniu prowadzi się 4 osobne reakcje,
kaŜda wykorzystuje:
•
Wzorcową nić DNA
•
Primer
•
Polimerazę DNA
•
Deoksyrybonukleotydy
•
4 Dideoksyrybonukleotydy (kaŜdy w innej reakcji)
2. Denaturacja DNA na pojedyncze nici w temp. 94˚C
3. Przyłączenie primera w temp. 55˚C
4. Przyłączenie polimerazy w temp. 37˚C
5. Replikacja DNA
SEKWENCJONOWANIE
6. W przypadku przyłączenia dideoksynukleotydu
następuje zakończenie replikacji - zakończenie
łańcucha DNA
7. Przyłączenie dideoksynukleotydu jest losowe otrzymujemy zbiór łańcuchów DNA o róŜnej długości
zakończonych np. adeniną
8. Lub innym nukleotydem (w pozostałych reakcjach)
9. Produkty reakcji są poddane elektroforezie - 4 osobne
linie dla A, C, T i G
10. Droga wędrówki łańcuchów DNA przez Ŝel zaleŜy od
ich długości
SEKWENCJONOWANIE
11. Wizualizacja pozycji poszczególnych fragmentów
12. Odczytywanie DNA - rozpoczynając od najkrótszych
fragmentów = od dołu
13. Identyfikacja sekwencji nukleotydów
14. Typowa długość łańcucha 200-500 bp
SEKWENCJONOWANIE AUTOMATYCZNE
• Analiza całych genomów → automatyzacja procesu
sekwencjonowania
• Sekwenatory DNA → 384 próbki DNA, 24 analizy / doba
SEKWENCJONOWANIE AUTOMATYCZNE
1. Substraty do sekwencjonowania
•
?
2. Denaturacja DNA
3. Przyłączenie primera
4. Przyłączenie polimerazy
5. Replikacja
6. Zakończenie
7. Łańcuchy DNA o róŜnych długościach
8. Sekwenator → elektroforeza
9. Sekwenator → odczytanie fluorescencji A, C, T lub G
10. Program → plik wynikowy
SEKWENCJONOWANIE CAŁYCH GENOMÓW
1. Metoda tradycyjna „BAC-to-BAC”
1980
Map based sequencing
2. Metoda „shotgun”
1997
Whole genome shotgun sequencing
3. Metoda nowej generacji
Next generation sequencing
~2007
SEKWENCJONOWANIE GENOMÓW - SHOTGUN
DEFRAGMENTACJA DNA
fragmenty
oczyszczonego
DNA
150-200 kb
losowo pocięte
fragmenty DNA
2-4 kb
SEKWENCJONOWANIE GENOMÓW - SHOTGUN
WPROWADZANIE DNA DO PLAZMIDU
SEKWENCJONOWANIE GENOMÓW - SHOTGUN
WPROWADZANIE DNA DO GENOMU BAKTERII →
REPLIKACJA → MILIARDY KOPII
SEKWENCJONOWANIE GENOMÓW - SHOTGUN
SEKWENCJONOWANIE FRAGMENTÓW 1 000 bp
SEKWENCJONOWANIE GENOMÓW - SHOTGUN
OSTATECZNY WYNIK - SEKWENCJA KONSENSUSOWA
SEKWENCJONOWANIE GENOMÓW - SHOTGUN
PROGRAMY KOMPUTEROWE:
•
Phrap → składanie zsekwencjonowanych fragmentów
assembling
•
Consed → przygotowywanie ostatecznej sekwencji
consensus sequence
SEKWENCJONOWANIE GENOMÓW – SHOTGUN:BAC-to-BAC
BAC-to-BAC
SHOTGUN
• Fragmentacja DNA: 150 kbp
• Fragmentacja DNA: 2 kbp
• Konstrukcja bibliotek BAC
• Konstrukcja bibliotek
plazmidowych
• Konstrukcja ramowej mapy –
kolejność fragmentów BAC
SEKWENCJONOWANIE GENOMÓW – SHOTGUN:BAC-to-BAC
BAC-to-BAC
SHOTGUN
• Fragmentacja BAC DNA –
konstrukcja bibliotek M13
• Sekwencjonowanie bibliotek
M13
• Sekwencjonowanie bibliotek
plazmidowych
• Łączenie sekwencji
• Łączenie sekwencji
SEKWENCJONOWANIE GENOMÓW – NEXT GENERATION
METODA NOWEJ GENERACJI
•
Sekwencjonowanie bardzo krótkich fragmentów
•
100-500 bp
•
DNA unieruchomione na płytce
•
Szybkie
•
Tanie
•
Platformy: 454 technology, Solexa, SOLiD
ZSEKWENCJONOWANE GENOMY
CZŁOWIEK
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
ŹRÓDŁO DNA
•
mieszanka DNA róŜnych dawców
•
♀/♂
•
Europa / Afryka / Ameryki (pn, centralna, pd) / Azja
•
Craig Venter
•
♂ plemniki
♀ krew
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
ROZMIARY GENOMU
300
250
Mbp
200
150
100
50
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y
chromosom
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
ROZMIESZCZENIE GENÓW
35
30
gęstość
ść genów
25
20
15
10
5
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y
chromosom
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
CHARAKTERYSTYKA
•
•
•
•
•
•
•
•
•
•
Wielkość: 2.91 – 3.16 Gbp
% par nukleotydów: A – T 54 % (ubogie w geny)
G – C 38 % (bogate w geny)
nieznane 9 %
Elementy powtarzalne: 35-46 % genomu
Liczba genów: 39 114
Chromosom najbogatszy w geny: 19 (23 geny/1Mbp)
Chromosom najuboŜszy w geny: 13 (5 genów/1Mbp)
Średnia długość genu: 27 000 – 40 000 bp
NajdłuŜszy gen: 2 400 000 bp
Gen o największej liczbie egzonów: titina (234)
1 gen koduje średnio 3 białka
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
DALSZE BADANIA GENOMU
•
59 % genów ma nieznaną funkcję
wpływ genów na zdrowie
wpływ na inne cechy człowieka
współdziałanie pomiędzy genami
imprinting
•
2 % genomu koduje białka
poznanie funkcji pozostałej części genomu
•
Analiza mapy sprzęŜeniowej
częstość crossing over u róŜnych płci
rekombinacyjne hot- i coldspots
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
WYKORZYSTANIE ZDOBYTEJ WIEDZY
•
medycyna
rozwój metod diagnostycznych
produkcja nowych (specyficznych) leków
•
antropologia
badania ewolucji człowieka
identyfikacja osobników: kontrola
spokrewnienia, kryminalistyka
ZSEKWENCJONOWANE GENOMY
MYSZ
ZSEKWENCJONOWANE GENOMY - MYSZ
ZAWARTOŚĆ G+C
♦ człowiek
♦ mysz
ZSEKWENCJONOWANE GENOMY - MYSZ
FUNKCJE BIAŁEK
■ człowiek ■ mysz
ZSEKWENCJONOWANE GENOMY - MYSZ
CHARAKTERYSTYKA
•
•
•
•
Wielkość: 2.5 Gbp
Elementy powtarzalne: 38% genomu
Liczba genów: 30 000
99% genów myszy ma homologi u człowieka
ZSEKWENCJONOWANE GENOMY
BYDŁO
ZSEKWENCJONOWANE GENOMY - BYDŁO
Dominette, Hereford
Norwegian red
ZSEKWENCJONOWANE GENOMY - BYDŁO
QTL: 1 050 QTL, 91 cech
250
Liczba QTL
200
150
100
50
0
cecha
ZAGADNIENIA BIOINFORMATYCZNE
1. Łączenie fragmentów DNA
• Błędy odczytu sekwencji
• Niekompletne pokrycie genomu
• Sekwencje powtarzalne
• Polimorfizm
• rozmiary danych
• Programy: Celera Assembler, Jazz,
Arachne, Phrap
2. Anotacja genomu
• identyfikacja strukturalnych i
funkcjonalnych elementów genomu
• Programy: Basic Local Alignment Search
Tool (BLAST)
1. Sekwencjonowanie
2. Automatyzacja sekwencjonowania
3. Sekwencjonowanie całych genomów
•
Metoda tradycyjna „BAC-to-BAC”
•
Metoda "shotgun"
•
Metoda "high throughoutput"
4. Zsekwencjonowane genomy - przykłady
•
Człowiek
•
Mysz
•
Bydło
5. Zagadnienia bioinformatyczne
Download