10/15/2015 Czytanie DNA Jak zrozumieć miliard słów? Dr hab. Marcin Filipecki Katedra Genetyki, Hodowli i Biotechnologii Roślin DNA Każdy żywy organizm składa się z komórek, a każda komórka ma jądro. Wikipedia (http://upload.wikimedia.org/wikipedia/commons/thumb/0/00/ Plant_cell_structure_svg_pl.svg/450px-Plant_cell_structure_svg_pl.svg.png) W jądrze znajduje się DNA zwinięte w chromosomy (materiał genetyczny). DNA to bardzo długa cząsteczka chemiczna – łańcuch, składający się z nawet z setek milionów ogniw (czterech rodzajów – A, T, C i G) ułożonych w określonej kolejności. 1 10/15/2015 Gen to fragment łańcucha DNA (kilka tysięcy ogniw) zawierający informację o budowie białka. Każda komórka człowieka, zwierzęcia czy rośliny zawiera kilkadziesiąt tysięcy genów. Każdego dnia, od początków ludzkości, człowiek zjada 0,2–0,5 grama DNA czyli około kilkudziesięciu biliardów (1015) różnych genów – roślinnych, zwierzęcych, bakteryjnych czy wirusowych. Geny 2 10/15/2015 Metody sekwencjonowania: Enzymatyczna terminacji łańcuchów DNA - 1975 (100 kpz / dzień / urządzenie) Enzymatyczna rejestrująca aktywność polimerazy Hybrydyzacyjna / h. z wykorzystaniem ligazy Bezpośredni odczyt sekwencji nukleotydów na unieruchomionej pojedynczej cząsteczce 100 Mpz – 1Gpz na dzień / urządzenie BIOINFORMATYKA Gromadzenie informacji: Literatura naukowa, Sekwencje DNA, RNA, białek, charakterystyczne motywy, Inne cząsteczki biologiczne, Struktury, Interakcje białek, Profile ekspresji, Szlaki biochemiczne, Choroby, Mapy genetyczne OGÓLNODOSTĘPNE BAZY DANYCH SQ Sequence 1634 BP; ctatatagcg tcaatcagtt gcacgaaaaa ctcatggccg ccttggtttc tcctcgatcc tcgcaagccc ctgatgcacc cttgccgcac agccaattgc cacggcctac gcctaccagc gcaacagcag cagcagcaac cctggatctt tcccgtcgat tcaaacaagc tacagctacg gtatgccgcc caaatgcaac gcaacaatta gcctccctgt // 413 A; 537 ggattaaacc ggcagttctt gtaaactaac accaccagta cggttcaggg agcagttgct atcagcagct gtgacagcgt gcagtggttc agcagcaaca atcccgcttt C; 378 G; 306 T; 0 other; cagagaccat acaccgaaca ccatgctaat cgatctcaag actggtaagt tggccacgcc aaatcccctc tctctctcaa tctttgcaga ccagcaccac cagcagcaac cgctgcacca atccttgggc ctgcccaaaa tggatctgta gggagctgcc ctcagtcagc agcaacaaca gcagcagcag catacctcct ctgcagaggt agagacgccc aggaagactc cctcgccgta cccctcggct tcgcccacca gcaatcttct tcagcagcaa caacagcaac agcagcagca ttactacagc aacatcaagc aggagcaagc 60 120 180 240 300 360 420 480 540 600 660 3 10/15/2015 Przetwarzanie informacji - wnioskowanie: Na potrzeby baz danych Na potrzeby projektów badawczych: • Edycja i opis podstawowych cech sekwencji • Wyszukiwanie charakterystycznych rejonów w sekwencjach • Projektowanie oligonukleotydów • Porównywanie, poszukiwanie polimorfizmu, filogenetyka • Przewidywanie struktury cząsteczek istniejących • Projektowanie nowych cząsteczek J.Craig Venter - wizjoner nauki czy biotechnologiczny biznesman? • Genom ludzki • Metagenomika • Organizm syntetyczny 4 10/15/2015 Adams MD i in., Science, 21 czerwca 1991 Cele projektu poznania genomu ludzkiego Ustalić sekwencję 3 miliardów par zasad z ludzkiego DNA, Zidentyfikować wszystkie z około 30 000 genów w DNA człowieka, Przechowywać tę informację w bazach danych, Opracować narzędzia do analizy danych, Przenieść związane z projektem technologie do sektora prywatnego Zwrócić uwagę na wynikające z projektu problemy ważne ze względów etycznych, cywilno-prawnych i społecznych. http://genomics.energy.gov/ 5 10/15/2015 Sekwencjonowanie hierarchiczne w HGP: najpierw zmapowanie wielkoinsertowych klonów, potem sekwencjonowanie losowe Zastosowane przez J.C. Venter’a sekwencjonowanie losowe całego genomu (whole genome shotgun sequencing) omija etap mapowania klonów Intl. Hum. Gen. Seq. Cons. (2001), Nature 409: 860-921. CELERA GENOMICS Adams MD et al., (2000) Science 287(5461):2185-95 180 Mpz 6 10/15/2015 Human Genome Project & CELERA GENOMICS 26-06-2000 J. Craig Venter & Bill Clinton & Francis Collins Intl. Hum. Gen. Seq. Cons. (2001) Nature 409: 860-921 Udział 20 ośrodków z 6 krajów Hierarchical shotgun sequencing DNA od wielu osób 15 miesięcy* Wybór kolekcji klonów o minimalnym zachodzeniu, pokrywających chromosomy Losowe sekwencjonowanie głównie klonów BAC i PAC (8 bibliotek) (wielkość fragmentów sekwencjonowanych itp. zależne od ośrodka) Pokrycie genomu 4,5 x (dla klonów) Intl. Hum. Gen. Seq. Cons. (2001) Nature 409: 860-921. 7 10/15/2015 Venter JC i in. (2001) Science 291: 1304-51 CELERA GENOMICS Whole genome shotgun DNA od 5 osób 9 miesięcy Wykorzystanie 500-600 ntd sekwencji końców klonów o średniej długości wstawki 2, 10 i 50 kpz Włączenie sekwencji z publicznych baz danych po pofragmentowaniu na 500 – 600 ntd kawałki Pokrycie genomu 5,11 x Venter JC i in. (2001) Science 291: 1304-51 Era genomów indywidualnych Genom referencyjny 2001/2003 Watson 2007 Venter 2007 Anonimowy Joruba, 2008 Anonimowy Han, Chiny, 2007 HGP consortium & Celera Genomics 454 Life Sciences (Roche) JC Venter Institute Illumina (Solexa) Beijing Genomics Institute 3 000 000 000$ 1 000 000 $ 70 000 000 $ 100 000 $ ??? Intl. Hum. Gen. Seq. Cons. (2001) Nature 409: 860-921. Venter JC i in. (2001) Science 291:1304-51 Wheeler DA i in. (2008) Nature 452: 872-6 http://jimwatsonse quence.cshl.edu/ (bez informacji o wariancie ApoE) Levy S. i in. (2007) PLoS Biology 5: e254 8 10/15/2015 Diploidalny genom J.C. Venter’a Metoda Sangera 32 mln odczytów sekwencji, pokrycie genomu 7,5 x 4,1 mln zmian (12,3 Mpz) 22% zmian to nie SNP (znaczenie duplikacji!) 44% genów heterozygotycznych Zróżnicowanie osobnicze ~1-2% Levy S. i in. (2007) PLoS Biology 5: e254 Konsekwencje znajomości genomu indywidualnego Warianty genów J.C. Venter’a wskazują na zwiększone ryzyko wystąpienia m.in.: choroby alkoholowej, zachowań aspołecznych, uzależnienia od papierosów, innych uzależnień, chorób serca, ch. Alzheimer’a Efekt obserwowanych predyspozycji zależy w znacznej mierze od interakcji na poziomie proteomu i czynników środowiskowych Ujawnienie własnego genomu to również ujawnienie znacznej części genomu krewnych Jak wobec takiej informacji zachowają się ubezpieczyciele i pracodawcy? Levy S. i in. (2007) PLoS Biology 5: e254 9 10/15/2015 METAGENOMIKA Zastosowanie nowoczesnych technik genomowych do badania populacji mikroorganizmów, występujących w danym środowisku, z ominięciem izolacji i hodowli laboratoryjnej poszczególnych gatunków Jo Handelsman (2004) Microbiology and Molecular Biology Reviews 68: 669-685 Wyprawa H.M.S. Challenger (1872-1876) pod kierownictwem Prof. Wyville Thomson’a 68 000 MM 29 552 str. Sprawozdania Prawie 4000 nowych gatunków 10 10/15/2015 Global Ocean Sampling Expedition (GOS) Pobieranie próbek w trakcie ekspedycji GOS J.C. Venter Institute 11 10/15/2015 Ekspedycja „Global Ocean Sampling” Pierwsza faza 8000MM 41 miejsc pobierania 7,7 mln sekwencji 6,3 mld pz 6,1 mln nowych białek 1700 brak podobieństwa Seria 3 publikacji PLOS Biology Marzec 2007 12 10/15/2015 Zróżnicowanie populacji drobnoustrojów, a temperatura wody 85% unikalnych sekwencji w punkatach oddalonych o 200 MM Biologia syntetyczna 13 10/15/2015 Minimal genome project Mycoplasma genitalium Fraser CM et al. (1995) Science, 270:397-403 517 genów (482 kodujących białka – 382 niezbędnych) Około 580 000 pz Projekt zsyntetyzowania organizmu Sztuczny mikroorganizm bioreaktor Piąta zasada, nowe „aminokwasy” Peptide Nucleic Acids (PNA) W stronę syntetycznego życia Synteza bakteriofaga ΦX174 (5386 pz) – 2003 r. Transplantacja genomu M. capricolum do cytoplazmy M. mycoides LC (2007) Syteza genomu Mycoplasma genitalium 582 970 pz (2008) Oligonukleotydy > 5-7 > 24 > 72 (1/8) > 144 (1/4) > 582,97 kpz (1/1) Klonowanie genomu M. mycoides w drożdżach i transplantacja do cytoplazmy M. capricolum. Transplantacja syntetycznego genomu do cytoplazmy > powstanie Synthii (Mycoplasma laboratorium) – 2010? 14 10/15/2015 Czy sekwencje genomów indywidualnych pomogą w leczeniu chorób? Czy w genach organizmów z mórz i oceanów jest odpowiedź na kryzys paliwowy? Czy lawinowy przyrost ilości informacji przerodzi się w jakość? Czy Synthia spełni pokładane w niej nadzieje? W którym roku opublikowano „z grubsza” pierwszą sekwencję genomu człowieka? Jaki jest całkowity poziom zróżnicowania sekwencji genomów H. sapiens? Jaki jest poziom heterozygotyczności genomu J. Craig’a Venter’a Długość genomu ludzkiego/muszki owocówki? Ile można wygrać za tanie zsekwencjonowanie 100 osób? 15