11/21/2013 Genom ludzki Cała informacja genetyczna wDNA. Zawiera sekwencje kodujące i niekodujące Lokalizacja genów •Rozpoczęty w 1989 • Pierwsza wersja w 2000 •Koszt $3 mld • 3 *109 bp (base pairs) • 20,000 genów 1 Struktura genomu Informacja genetyczna zawarta jest w jądrze komórkowym, w którym umieszczone są podwójne chromosomy oraz w mitochondrium, w którym mieści się pojedyncze koliste DNA mitochondrialne, u ssaków dziedziczone wyłącznie po matce. Nukleotydy i ich łańcuchy DNA/RNA Na nici DNA znajdują się nukleotydy, 4 rodzaje, które kodują informację genetyczną . Tworzą podwójną prawostronną helisę, połączoną wiązaniami wodorowymi Pirymidyny i Puryny Zasada Fosforan Cukier - pentoza 1 11/21/2013 Podwójna Helisa DNA Replikacja DNA łączenie w łańcuchu głównym Każda zasada ma wolną grupę fosforanową przy 3 i 5 atomie węgla. Kolejność w sekwencji DNA podajemy : 5’ do 3’ (5’ – wolne 5) łączenie pomiędzy łańcuchami bocznymi 2 helis . (A-T / G-C) Komplementarność 2 nici redukuje błędy w DNA. Parowanie (A-T / G-C) Watsona-Cricka jest jednym z możliwych, ale najkorzystniejsze energetycznie Wykorzystanie informacji z DNA RNA – typy, funkcje mRNA tRNA siRNA miRNA RNA – budowa Transportowe RNA (t-RNA) 2 11/21/2013 Transkrypcja Kodony aminokwasów (RNA) W DNA zamiast U jest T 14 SPLICING SPLICING ALTERNATYWNY Typowe dla Eukariota. Prokariota mają bardziej oszczędny genom Funkcjonalna struktura genu EUKARIOTA Co to jest GEN? GEN to molekularna jednostka dziedziczenia w organizmach żywych. Nazywa się tak fragmenty DNA lub RNA, które kodują: białko jednego typu lub łańcuch RNA, który pełni jakąś funkcję w organizmie. Współczesna definicja techniczna: Możliwy do lokalizacji obszar sekwencji genomu, odpowiadający jednostce dziedziczenia, która odpowiada za: -obszar transkrybowany (przepisywany, DNA do mRNA) -obszar regulacyjny - inny funkcjonalny obszar sekwencji 3 11/21/2013 Rybosomy Nobel z chemii 2009 Translacja białek Venkatraman Ramakrishnan Thomas A. Steitz Ada E. Yonath DNA mitochondrialne (mtDNA) cDNA Komplementarny DNA (complementary DNA) Uzyskany przez odwrotną transkrypcję mRNA (obecnego w komórce) na DNA. Często w bazach danych DNA . Dlaczego? Podstawowe narzędzia w inżynierii genetycznej PCR Metylacja i enzymy restrykcyjne (endonukleazy) Elektroforeza żelowa DNA 4 11/21/2013 Open Reading Frame - ORF Gen Otwarta ramka odczytu pomiędzy kodonem START i STOP – niekoniecznie rzeczywiście tłumaczona na białko. Kandydat na gen, szczególnie jeżeli jest długą sekwencją. 26 Zmienność genetyczna Organizacja materiału genetycznego. Chromosom Wariant sekwencji DNA (o zmienności osobniczej) w danym położeniu chromosomu (locus) nazywamy allelem. 1. Chromatyda 2. Centromer 3. Krótkie (p) ramię 4. Długie (q) ramię Allele tego samego genu różnią się jednym lub kilkoma nukleotydami. Występowanie więcej niż jednej wersji danego genu określa się jako polimorfizm. Dzięki zdegenerowaniu kodu genetycznego tylko część tych różnic przekłada się na różnice w budowie kodowanych białek SNP – Single Nucleotide Polymorphism Homolog – wyewoluował niezależnie, ale z tego samego przodka Element nazwy 6 p 21.3 Gen z bazach danych locus Wyjaśnienie Numer chromosomu. Ramię chromosomu - p („petit”) krótkie ramię, q - długie ramię. Pierwsza liczba oznacza prążek na chromosomie, widoczny pod mikroskopem. Prążki liczy się od strony centromeru (przewężenia) do końca chromosomu. W niektórych prążkach, przy wyższej rozdzielczości mikroskopu, można wyróżnić subprążki. Pozycję subprążka określa druga liczba (po kropce). Chromosom zawiera ciąg par nukleotydów i białka. Może być liniowy lub kolisty (np. mitochondrium). Chromosomy mogą się między sobą różnić. Mapowanie Mapa genetyczna to uporządkowana lista loci dla danego genomu. Mapowanie genów jest proces określenia locus dla danej cechy biologicznej. Gen o locus 6p21.3 znajduje się w chromosomie 6 na jego krótkim ramieniu, w prążku 21 licząc od centromeru, w subprążku 3. Tel4q1 , Chr4, q arm 1- oznacza telomer (końcówkę chromosomu) 5 11/21/2013 Jakie geny już znamy? Struktura genu PANTHER Pie Chart RNA 31 32 Promotor Eukariota Odcinek DNA, położony zazwyczaj powyżej sekwencji kodującej genu, który zawiera sekwencje rozpoznawane przez polimerazę RNA zależną od DNA. Po połączeniu się polimerazy RNA z promotorem rozpoczyna się transkrypcja (proces przepisywania informacji genetycznej z DNA na RNA). Promotory eukariotyczne zawierają także sekwencje rozpoznawane przez czynniki transkrypcyjne, które wiążąc się z DNA umożliwiają związanie się polimerazy RNA z nicią DNA i rozpoczęcie transkrypcji. Minimalny promotor (ang. core promoter) – do -35 par zasad Promotor bliższy (proximal promoter) może mieć długość od kilkudziesięciu do kilkuset nukleotydów. DNA 33 34 Trudności Rodziny wielogenowe Open Reading Frame (ORF) 3 możliwości dla każdej nici Dla organizmów 2niciowych 6 możliwości Operon (jednostka transkrypcji i regulacji– równocześnie przetwarzana) u prokariota. U ludzi rodziny wielogenowe nie podlegają wspólnej regulacji. 35 36 6 11/21/2013 Znajdowanie ORF Narzędzia • Białka 100-kilka tysięcy aminokwasów • ORF zaczyna się kodonem Met (M) • Kończy się kodonem STOP • ORF-finder http://www.ncbi.nlm.nih.gov/projects/gorf/ (często też pod koniec sekwencje palindromowe tworzące spinkę RNA o słabych wiązaniach par A-U, łatwy rozpad). • Niewłaściwy ORF często napotyka na zbyt wczesny kodon STOP. • Introny (Eucariota) mają dużo kodonów STOP, b. długie (100 do kilka mln pz). Miejsca splicingu często mają charakterystyczne motywy Narzędzia Narzędzia (obszary promotorowe) • ORF-finder http://www.ncbi.nlm.nih.gov/projects/gorf/ • • • • • • • • BDGP-NNPP CorePromoter TSSG TSSW ProScan FunSiteP Promoter PromoterInspector Nakładanie się genów Trudności (bardzo powszechne także u Eucariota!) Nakładanie się genów Przykład nakładania się 3 ludzkich genów. Zielone eksony: ciemne białka, jasne - UTR (ang.„untranslated regions”, obszary regulatorowe eksonów), pozostałe – introny. 41 Ponadto : Alternatywne wycinanie (alternative splicing) umożliwia kodowanie kilku białek przez jeden gen (środowisko). Dzięki temu o wiele więcej białek niż 20 tys (tyle genów) 7 11/21/2013 Trudności Nie-białko •Introny •Obszary nie-tłumaczone UTR (UnTranslated Region) •Obszary nie kodujące ncRNA Kodon START wcale nie musi być na początku eksonu. UTR (UnTranslated Region) 43 Trudności 44 Trudności Epigenetyka Transpozony czyli nie każdy gen zawsze ulegnie ekspresji Jak je rozpoznac? 45 46 Charakterystyczne logo Co wiemy? Czy jest jakaś regularność? Miejsca wiążące rybosomu i kodon startu (E. Coli) 47 48 8 11/21/2013 Częstotliwość kodonów aminokwasowych w genach i poza nimi Długość genu Echols, N.A.R., 2002 49 Długości eksonów i intronów 50 Obszary charakterystyczne w genach • VNTR (Variable Number Tandem Repeats) – minisatelity, 10-100 pz, genetyczny odcisk palca, rozkład rozmiaru jest markerem • STRP (Short Tandem Repeat Polymorfism) – mikrosatelity, 2-5 pz , 10-30 kopii każde, równomierny rozkład w genomie ludzkim (np. CAG – choroba Huntingtona) 51 Narzędzia Jakie bazy danych mogą pomóc? • HMMGene (HMM) •FGenesh (HMM) •GeneScan •GrailExp •GeneBuilder •GeneWalker •Glimmer •GeneMark •Orpheus Homologi w znanych już • eksonach • EST (Expressed Sequence Tags) – krótkie (200-500 pz) sekwencje z 3’ UTR • cDNA (complementary DNA uzyskany „do tyłu” z RNA) 53 54 9 11/21/2013 Adnotacja genu Mukowiscydoza czyli Jaką funkcję pełni białko Przyczyny niewydolności i zgonów – wynikiem adnotacji genów 55 56 Poszukiwanie genów Słownictwo przeszukiwania Ontologia Genów (GO) Funkcjonowanie: Serwisy Systems Biology 57 58 Wielkie/ciekawe projekty genetyczne Aktualnie http://www.ncbi.nlm.nih.gov/bioproject 10 11/21/2013 1000 genomes http://www.1000genomes.org/ Międzynarodowy projekt o największej dotychczas skali 2500 genomów nieznanych ludzi (po 500 z każdego kontynentu, 25 populacji) Cel – Katalog wariantów genetycznych ludzi Chrobowe odmiany genomu, łącznie z SNP 1000-genomes Charakterystyka grup badanych- Kliknąć poniżej Wynikiem ma być: 1. Odkrycie wariantów typu SNP o częstotliwości co najmniej 1% w rozmaitych populacjach 2. To samo, ale 0.1 - 0.5% 3. Odkrycie wariantów strukturalnych, np. warianty ilości kopii, insercje, delecje, inwersje. Human ENCODE ENCODE http://research.nhgri.nih.gov/ENCODEdb/ http://genome.ucsc.edu/ENCODE/ Cel -Identyfikacja wszystkich elementów funkcjonalnych na bazie szerokiego zbioru ludzkich sekwencji, otrzymanego metodami dużej wydajności. -Adnotacja elementów funkcjonalnych w sekwencjach. Ścisła współpraca pomiędzy doświadczalnikami i bioinformatykami. The Human Microbiome Project (HMP) https://commonfund.nih.gov/hmp/ Cel- Genotyp mikroflory żyjącej w ludzkim organizmie i analiza jego roli w stanach chorobowych. Obiekt -DNA mikroorganizmów dotychczas wyizolowanych z ludzkiego ciała - 16S rybosomowe RNA (mała podjednostka rybosomu prokariontów) mikroorganizmów z przewodu pokarmowego, ust, skóry, nosa, dróg rodnych Metagenomika – co to jest? http://genome.ucsc.edu/ENCODE/ HMP Reference Set of Microbial Genome Sequences and Preliminary Characterization of the Human Microbiome Relationship Between Disease and Changes in the Human Microbiome New Technologies and Tools for Computational Analysis Data and Analysis Coordinating Center (DACC) Resource Repository Ethical, Legal, and Social Implications (ELSI) 11 11/21/2013 Genographic Project Nie tylko NCBI i EMBL-EBI Czyli jak migrowaliśmy Projekt: National Geographic Society, IBM Waitt Family Foundation https://genographic.nationalgeographic.com/genographic/index.html Genographic sample Co testuje Genographic? „Kits that are marked "maternal lineage" receive the mitochondrial DNA (mtDNA) test to reveal direct maternal ancestry. We test the Hypervariable Region 1 (HVR1: 16001 to 16569) and compares your results to the Cambridge Reference Sequence. Kits marked "paternal" receive the Y-chromosome test to reveal direct paternal ancestry. (Males only.) This is a 12marker test. Additional testing such as a SNP test may be run on a Y-chromosome sample if analysis of the 12 STR values does not conclusively indicate a Haplogroup assignment”. Neanderthal genome project http://www.eva.mpg.de/neandertal/ © 2009, Max Planck Institute for Evolutionary Anthropology, Leipzig Max Planck Institute for Evolutionary Anthropology - The Neandertal Genome Project 12