Najnowsze metody sekwencjonowania w analizie

advertisement
10/15/2015
Czytanie DNA
Jak zrozumieć miliard słów?
Dr hab. Marcin Filipecki
Katedra Genetyki, Hodowli i Biotechnologii Roślin
DNA

Każdy żywy organizm składa
się z komórek, a każda
komórka ma jądro.
Wikipedia (http://upload.wikimedia.org/wikipedia/commons/thumb/0/00/
Plant_cell_structure_svg_pl.svg/450px-Plant_cell_structure_svg_pl.svg.png)


W jądrze znajduje się DNA zwinięte w
chromosomy (materiał genetyczny).
DNA to bardzo długa cząsteczka
chemiczna – łańcuch, składający się z
nawet z setek milionów ogniw (czterech
rodzajów – A, T, C i G) ułożonych w
określonej kolejności.
1
10/15/2015

Gen to fragment łańcucha DNA (kilka
tysięcy ogniw) zawierający informację
o budowie białka.

Każda komórka człowieka, zwierzęcia
czy rośliny zawiera kilkadziesiąt
tysięcy genów.

Każdego dnia, od
początków ludzkości,
człowiek zjada 0,2–0,5
grama DNA czyli około
kilkudziesięciu biliardów
(1015) różnych genów –
roślinnych, zwierzęcych,
bakteryjnych czy
wirusowych.
Geny
2
10/15/2015

Metody sekwencjonowania:
 Enzymatyczna terminacji łańcuchów DNA -
1975 (100 kpz / dzień / urządzenie)
 Enzymatyczna rejestrująca aktywność
polimerazy
 Hybrydyzacyjna / h. z wykorzystaniem ligazy
 Bezpośredni odczyt sekwencji nukleotydów
na unieruchomionej pojedynczej cząsteczce

100 Mpz – 1Gpz na dzień / urządzenie
BIOINFORMATYKA
Gromadzenie informacji:


Literatura naukowa, Sekwencje DNA, RNA, białek,
charakterystyczne motywy, Inne cząsteczki biologiczne,
Struktury, Interakcje białek, Profile ekspresji, Szlaki
biochemiczne, Choroby, Mapy genetyczne
OGÓLNODOSTĘPNE BAZY DANYCH
SQ Sequence 1634 BP;
ctatatagcg tcaatcagtt
gcacgaaaaa ctcatggccg
ccttggtttc tcctcgatcc
tcgcaagccc ctgatgcacc
cttgccgcac agccaattgc
cacggcctac gcctaccagc
gcaacagcag cagcagcaac
cctggatctt tcccgtcgat
tcaaacaagc tacagctacg
gtatgccgcc caaatgcaac
gcaacaatta gcctccctgt
//
413 A; 537
ggattaaacc
ggcagttctt
gtaaactaac
accaccagta
cggttcaggg
agcagttgct
atcagcagct
gtgacagcgt
gcagtggttc
agcagcaaca
atcccgcttt
C; 378 G; 306 T; 0 other;
cagagaccat acaccgaaca ccatgctaat
cgatctcaag actggtaagt tggccacgcc
aaatcccctc tctctctcaa tctttgcaga
ccagcaccac cagcagcaac cgctgcacca
atccttgggc ctgcccaaaa tggatctgta
gggagctgcc ctcagtcagc agcaacaaca
gcagcagcag catacctcct ctgcagaggt
agagacgccc aggaagactc cctcgccgta
cccctcggct tcgcccacca gcaatcttct
tcagcagcaa caacagcaac agcagcagca
ttactacagc aacatcaagc aggagcaagc
60
120
180
240
300
360
420
480
540
600
660
3
10/15/2015
Przetwarzanie informacji - wnioskowanie:
 Na potrzeby baz danych
 Na potrzeby projektów badawczych:
• Edycja i opis podstawowych cech sekwencji
• Wyszukiwanie charakterystycznych rejonów
w sekwencjach
• Projektowanie oligonukleotydów
• Porównywanie, poszukiwanie polimorfizmu,
filogenetyka
• Przewidywanie struktury cząsteczek
istniejących
• Projektowanie nowych cząsteczek
J.Craig Venter - wizjoner nauki
czy biotechnologiczny biznesman?
• Genom ludzki
• Metagenomika
• Organizm syntetyczny
4
10/15/2015
Adams MD i in., Science, 21 czerwca 1991
Cele projektu
poznania genomu
ludzkiego






Ustalić sekwencję 3 miliardów par zasad z ludzkiego DNA,
Zidentyfikować wszystkie z około 30 000 genów w DNA
człowieka,
Przechowywać tę informację w bazach danych,
Opracować narzędzia do analizy danych,
Przenieść związane z projektem technologie do sektora
prywatnego
Zwrócić uwagę na wynikające z projektu problemy ważne ze
względów etycznych, cywilno-prawnych i społecznych.
http://genomics.energy.gov/
5
10/15/2015
Sekwencjonowanie hierarchiczne w HGP:
najpierw zmapowanie wielkoinsertowych
klonów, potem sekwencjonowanie losowe
Zastosowane
przez J.C. Venter’a
sekwencjonowanie
losowe całego
genomu (whole
genome shotgun
sequencing) omija
etap mapowania
klonów
Intl. Hum. Gen. Seq. Cons. (2001),
Nature 409: 860-921.
CELERA GENOMICS
Adams MD et al., (2000) Science 287(5461):2185-95
180 Mpz
6
10/15/2015
Human Genome Project & CELERA GENOMICS
26-06-2000
J. Craig Venter & Bill Clinton & Francis Collins








Intl. Hum. Gen. Seq. Cons.
(2001) Nature 409: 860-921
Udział 20 ośrodków z 6 krajów
Hierarchical shotgun sequencing
DNA od wielu osób
15 miesięcy*
Wybór kolekcji klonów o
minimalnym zachodzeniu,
pokrywających chromosomy
Losowe sekwencjonowanie
głównie klonów BAC i PAC (8
bibliotek) (wielkość fragmentów
sekwencjonowanych itp. zależne
od ośrodka)
Pokrycie genomu 4,5 x (dla
klonów)
Intl. Hum. Gen. Seq. Cons. (2001)
Nature 409: 860-921.
7
10/15/2015








Venter JC i in. (2001)
Science 291: 1304-51
CELERA GENOMICS
Whole genome shotgun
DNA od 5 osób
9 miesięcy
Wykorzystanie 500-600 ntd
sekwencji końców klonów o
średniej długości wstawki 2,
10 i 50 kpz
Włączenie sekwencji z
publicznych baz danych po
pofragmentowaniu na 500
– 600 ntd kawałki
Pokrycie genomu 5,11 x
Venter JC i in. (2001)
Science 291: 1304-51
Era genomów indywidualnych
Genom referencyjny
2001/2003
Watson 2007
Venter 2007
Anonimowy
Joruba, 2008
Anonimowy Han,
Chiny, 2007
HGP consortium &
Celera Genomics
454 Life Sciences
(Roche)
JC Venter
Institute
Illumina
(Solexa)
Beijing Genomics
Institute
3 000 000 000$
1 000 000 $
70 000 000 $
100 000 $
???
Intl. Hum. Gen. Seq.
Cons. (2001) Nature
409: 860-921.
Venter JC i in. (2001)
Science 291:1304-51
Wheeler DA i in.
(2008) Nature
452: 872-6
http://jimwatsonse
quence.cshl.edu/
(bez informacji o
wariancie ApoE)
Levy S. i in.
(2007) PLoS
Biology 5: e254
8
10/15/2015
Diploidalny genom J.C. Venter’a






Metoda Sangera
32 mln odczytów sekwencji, pokrycie genomu 7,5 x
4,1 mln zmian (12,3 Mpz)
22% zmian to nie SNP (znaczenie duplikacji!)
44% genów heterozygotycznych
Zróżnicowanie osobnicze ~1-2%
Levy S. i in. (2007) PLoS Biology 5: e254
Konsekwencje znajomości
genomu indywidualnego

Warianty genów J.C. Venter’a
wskazują na zwiększone
ryzyko wystąpienia m.in.:








choroby alkoholowej,
zachowań aspołecznych,
uzależnienia od papierosów,
innych uzależnień,
chorób serca,
ch. Alzheimer’a
Efekt obserwowanych
predyspozycji zależy
w znacznej mierze od
interakcji na poziomie
proteomu i czynników
środowiskowych
Ujawnienie własnego genomu
to również ujawnienie znacznej
części genomu krewnych
Jak wobec takiej informacji
zachowają się ubezpieczyciele
i pracodawcy?
Levy S. i in. (2007) PLoS Biology 5: e254
9
10/15/2015
METAGENOMIKA
Zastosowanie nowoczesnych technik
genomowych do badania populacji
mikroorganizmów, występujących w
danym środowisku, z ominięciem
izolacji i hodowli laboratoryjnej
poszczególnych gatunków
Jo Handelsman (2004) Microbiology and Molecular Biology Reviews 68: 669-685
Wyprawa H.M.S. Challenger (1872-1876)
pod kierownictwem Prof. Wyville Thomson’a
68 000 MM
 29 552 str.
Sprawozdania
 Prawie 4000
nowych
gatunków

10
10/15/2015
Global
Ocean
Sampling
Expedition
(GOS)
Pobieranie próbek w trakcie ekspedycji GOS
J.C. Venter Institute
11
10/15/2015
Ekspedycja „Global Ocean Sampling”







Pierwsza faza 8000MM
41 miejsc pobierania
7,7 mln sekwencji
6,3 mld pz
6,1 mln nowych białek
1700 brak podobieństwa
Seria 3 publikacji PLOS
Biology Marzec 2007
12
10/15/2015
Zróżnicowanie populacji drobnoustrojów,
a temperatura wody
85% unikalnych sekwencji w punkatach oddalonych o 200 MM
Biologia syntetyczna
13
10/15/2015
Minimal genome project

Mycoplasma genitalium
 Fraser CM et al. (1995) Science,
270:397-403






517 genów (482 kodujących
białka – 382 niezbędnych)
Około 580 000 pz
Projekt zsyntetyzowania
organizmu
Sztuczny mikroorganizm bioreaktor
Piąta zasada, nowe
„aminokwasy”
Peptide Nucleic Acids (PNA)
W stronę
syntetycznego życia





Synteza bakteriofaga ΦX174
(5386 pz) – 2003 r.
Transplantacja genomu M. capricolum
do cytoplazmy M. mycoides LC (2007)
Syteza genomu Mycoplasma
genitalium 582 970 pz (2008)
 Oligonukleotydy > 5-7 > 24 > 72
(1/8) > 144 (1/4) > 582,97 kpz (1/1)
Klonowanie genomu M. mycoides w
drożdżach i transplantacja do
cytoplazmy M. capricolum.
Transplantacja syntetycznego genomu
do cytoplazmy > powstanie Synthii
(Mycoplasma laboratorium) – 2010?
14
10/15/2015
Czy sekwencje genomów indywidualnych
pomogą w leczeniu chorób?
 Czy w genach organizmów z mórz
i oceanów jest odpowiedź na kryzys
paliwowy?
 Czy lawinowy przyrost ilości informacji
przerodzi się w jakość?
 Czy Synthia spełni pokładane w niej nadzieje?

W którym roku opublikowano „z grubsza”
pierwszą sekwencję genomu człowieka?
 Jaki jest całkowity poziom zróżnicowania
sekwencji genomów H. sapiens?
 Jaki jest poziom heterozygotyczności genomu
J. Craig’a Venter’a
 Długość genomu ludzkiego/muszki owocówki?
 Ile można wygrać za tanie zsekwencjonowanie
100 osób?

15
Download