2016-01-14 Czytanie DNA. Jak zrozumieć miliard słów? DNA Encyklopedia Życia – Warszawa 2010 Dr hab. Marcin Filipecki Katedra Genetyki, Hodowli i Biotechnologii Roślin DNA Każdy żywy organizm składa się z komórek, a każda komórka ma jądro. Wikipedia (http://upload.wikimedia.org/wikipedia/commons/thumb/0/00/ Plant_cell_structure_svg_pl.svg/450px-Plant_cell_structure_svg_pl.svg.png) W jądrze znajduje się DNA zwinięte w chromosomy (materiał genetyczny). DNA to bardzo długa cząsteczka chemiczna – łańcuch, składający się z nawet z setek milionów ogniw (czterech rodzajów – A, T, C i G) ułożonych w określonej kolejności. 1 2016-01-14 Gen to fragment łańcucha DNA (kilka tysięcy ogniw) zawierający informację o budowie białka. Każda komórka człowieka, zwierzęcia czy rośliny zawiera kilkadziesiąt tysięcy genów. Każdego dnia, od początków ludzkości, człowiek zjada 0,2–0,5 grama DNA czyli około kilkudziesięciu biliardów (1015) różnych genów – roślinnych, zwierzęcych, bakteryjnych czy wirusowych. Geny 2 2016-01-14 Metody sekwencjonowania: Enzymatyczna terminacji łańcuchów DNA - 1975 (100 kpz / dzień / urządzenie) Enzymatyczna rejestrująca aktywność polimerazy Hybrydyzacyjna / h. z wykorzystaniem ligazy Bezpośredni odczyt sekwencji nukleotydów na unieruchomionej pojedynczej cząsteczce Miliardy pz na dzień / urządzenie BIOINFORMATYKA Gromadzenie informacji: Literatura naukowa, Sekwencje DNA, RNA, białek, charakterystyczne motywy, Inne cząsteczki biologiczne, Struktury, Interakcje białek, Profile ekspresji, Szlaki biochemiczne, Choroby, Mapy genetyczne OGÓLNODOSTĘPNE BAZY DANYCH SQ Sequence 1634 BP; ctatatagcg tcaatcagtt gcacgaaaaa ctcatggccg ccttggtttc tcctcgatcc tcgcaagccc ctgatgcacc cttgccgcac agccaattgc cacggcctac gcctaccagc gcaacagcag cagcagcaac cctggatctt tcccgtcgat tcaaacaagc tacagctacg gtatgccgcc caaatgcaac gcaacaatta gcctccctgt // 413 A; 537 ggattaaacc ggcagttctt gtaaactaac accaccagta cggttcaggg agcagttgct atcagcagct gtgacagcgt gcagtggttc agcagcaaca atcccgcttt C; 378 G; 306 T; 0 other; cagagaccat acaccgaaca ccatgctaat cgatctcaag actggtaagt tggccacgcc aaatcccctc tctctctcaa tctttgcaga ccagcaccac cagcagcaac cgctgcacca atccttgggc ctgcccaaaa tggatctgta gggagctgcc ctcagtcagc agcaacaaca gcagcagcag catacctcct ctgcagaggt agagacgccc aggaagactc cctcgccgta cccctcggct tcgcccacca gcaatcttct tcagcagcaa caacagcaac agcagcagca ttactacagc aacatcaagc aggagcaagc 60 120 180 240 300 360 420 480 540 600 660 3 2016-01-14 Przetwarzanie informacji - wnioskowanie: Na potrzeby baz danych Na potrzeby projektów badawczych: • Edycja i opis podstawowych cech sekwencji • Wyszukiwanie charakterystycznych rejonów w sekwencjach • Projektowanie oligonukleotydów • Porównywanie, poszukiwanie polimorfizmu, filogenetyka • Przewidywanie struktury cząsteczek istniejących • Projektowanie nowych cząsteczek J.Craig Venter - wizjoner nauki czy biotechnologiczny biznesman? • Genom ludzki • Metagenomika • Organizm syntetyczny 4 2016-01-14 Adams MD i in., Science, 21 czerwca 1991 Cele projektu poznania genomu ludzkiego Ustalić sekwencję 3 miliardów par zasad z ludzkiego DNA, Zidentyfikować wszystkie z około 22000 genów w DNA człowieka, Przechowywać tę informację w bazach danych, Opracować narzędzia do analizy danych, Przenieść związane z projektem technologie do sektora prywatnego Zwrócić uwagę na wynikające z projektu problemy ważne ze względów etycznych, cywilno-prawnych i społecznych. http://genomics.energy.gov/ 5 2016-01-14 Sekwencjonowanie hierarchiczne w HGP: najpierw zmapowanie wielkoinsertowych klonów, potem sekwencjonowanie losowe Zastosowane przez J.C. Venter’a sekwencjonowanie losowe całego genomu (whole genome shotgun sequencing) omija etap mapowania klonów Intl. Hum. Gen. Seq. Cons. (2001), Nature 409: 860-921. CELERA GENOMICS Adams MD et al., (2000) Science 287(5461):2185-95 6 2016-01-14 Human Genome Project & CELERA GENOMICS 26-06-2000 J. Craig Venter & Bill Clinton & Francis Collins Intl. Hum. Gen. Seq. Cons. (2001) Nature 409: 860-921 Udział 20 ośrodków z 6 krajów Hierarchical shotgun sequencing DNA od wielu osób 15 miesięcy* Wybór kolekcji klonów o minimalnym zachodzeniu, pokrywających chromosomy Losowe sekwencjonowanie głównie klonów BAC i PAC (8 bibliotek) (wielkość fragmentów sekwencjonowanych itp. zależne od ośrodka) Pokrycie genomu 4,5 x (dla klonów) Intl. Hum. Gen. Seq. Cons. (2001) Nature 409: 860-921. 7 2016-01-14 Venter JC i in. (2001) Science 291: 1304-51 CELERA GENOMICS Whole genome shotgun DNA od 5 osób 9 miesięcy Wykorzystanie 500-600 ntd sekwencji końców klonów o średniej długości wstawki 2, 10 i 50 kpz Włączenie sekwencji z publicznych baz danych po pofragmentowaniu na 500 – 600 ntd kawałki Pokrycie genomu 5,11 x Venter JC i in. (2001) Science 291: 1304-51 Era genomów indywidualnych Genom referencyjny 2001/2003 Watson 2007 Venter 2007 Anonimowy Joruba, 2008 Anonimowy Han, Chiny, 2007 HGP consortium & Celera Genomics 454 Life Sciences (Roche) JC Venter Institute Illumina (Solexa) Beijing Genomics Institute 3 000 000 000$ 1 000 000 $ 70 000 000 $ 100 000 $ ??? Intl. Hum. Gen. Seq. Cons. (2001) Nature 409: 860-921. Venter JC i in. (2001) Science 291:1304-51 Wheeler DA i in. (2008) Nature 452: 872-6 http://jimwatsonse quence.cshl.edu/ (bez informacji o wariancie ApoE) Levy S. i in. (2007) PLoS Biology 5: e254 8 2016-01-14 Diploidalny genom J.C. Venter’a Metoda Sangera 32 mln odczytów sekwencji, pokrycie genomu 7,5 x 4,1 mln zmian (12,3 Mpz) 22% zmian to nie SNP (znaczenie duplikacji!) 44% genów heterozygotycznych Zróżnicowanie osobnicze ~1-2% Levy S. i in. (2007) PLoS Biology 5: e254 Konsekwencje znajomości genomu indywidualnego Warianty genów J.C. Venter’a wskazują na zwiększone ryzyko wystąpienia m.in.: choroby alkoholowej, zachowań aspołecznych, uzależnienia od papierosów, innych uzależnień, chorób serca, ch. Alzheimer’a Efekt obserwowanych predyspozycji zależy w znacznej mierze od interakcji na poziomie proteomu i czynników środowiskowych Ujawnienie własnego genomu to również ujawnienie znacznej części genomu krewnych Jak wobec takiej informacji zachowają się ubezpieczyciele i pracodawcy? Levy S. i in. (2007) PLoS Biology 5: e254 9 2016-01-14 UWAGA WYŚCIG !! + 1 milion $ za listę 100, w tym sławy: Nagroda 10 milionów $ 100 genomów ludzkich 10 dni lub szybciej < 10,000 $ na genom Pokrycie >98% Błędy <1/10000 http://genomics.xprize.org/ Dziennikarz TV Larry King Kosmolog Stephen Hawking Współtwórca Google Larry Page Współtwórca Microsoft Paul Allen Finansista – filantrop Michael Milken Oraz lista osób chorych wytypowana przez odpowiednie rady wspierające Startują: Visigen Biotechnologies 454 Life Sciences Foundation for Applied Molecular Evolution Reveo base4 innovation Personal Genome X-team METAGENOMIKA Zastosowanie nowoczesnych technik genomowych do badania populacji mikroorganizmów, występujących w danym środowisku, z ominięciem izolacji i hodowli laboratoryjnej poszczególnych gatunków Jo Handelsman (2004) Microbiology and Molecular Biology Reviews 68: 669-685 10 2016-01-14 Wyprawa H.M.S. Challenger (1872-1876) pod kierownictwem Prof. Wyville Thomson’a 68 000 MM 29 552 str. Sprawozdania Prawie 4000 nowych gatunków Global Ocean Sampling Expedition (GOS) 11 2016-01-14 Pobieranie próbek w trakcie ekspedycji GOS J.C. Venter Institute 12 2016-01-14 Ekspedycja „Global Ocean Sampling” Pierwsza faza 8000MM 41 miejsc pobierania 7,7 mln sekwencji 6,3 mld pz 6,1 mln nowych białek 1700 brak podobieństwa Seria 3 publikacji PLOS Biology Marzec 2007 13 2016-01-14 Zróżnicowanie populacji drobnoustrojów, a temperatura wody 85% unikalnych sekwencji w punkatach oddalonych o 200 MM Biologia syntetyczna 14 2016-01-14 Minimal genome project Mycoplasma genitalium Fraser CM et al. (1995) Science, 270:397-403 517 genów (482 kodujących białka – 382 niezbędnych) Około 580 000 pz Projekt zsyntetyzowania organizmu Sztuczny mikroorganizm bioreaktor Piąta zasada, nowe „aminokwasy” Peptide Nucleic Acids (PNA) W stronę syntetycznego życia Synteza bakteriofaga ΦX174 (5386 pz) – 2003 r. Transplantacja genomu M. capricolum do cytoplazmy M. mycoides LC (2007) Syteza genomu Mycoplasma genitalium 582 970 pz (2008) Oligonukleotydy > 5-7 > 24 > 72 (1/8) > 144 (1/4) > 582,97 kpz (1/1) Klonowanie genomu M. mycoides w drożdżach i transplantacja do cytoplazmy M. capricolum. Transplantacja syntetycznego genomu do cytoplazmy > powstanie Synthii (Mycoplasma laboratorium) – 2010? 15 2016-01-14 Czy sekwencje genomów indywidualnych pomogą w leczeniu chorób? Czy w genach organizmów z mórz i oceanów jest odpowiedź na kryzys paliwowy? Czy lawinowy przyrost ilości informacji przerodzi się w jakość? Czy Synthia spełni pokładane w niej nadzieje? 16