Lokalizacja genów

advertisement
11/21/2013
Genom ludzki
Cała informacja genetyczna wDNA. Zawiera sekwencje
kodujące i niekodujące
Lokalizacja genów
•Rozpoczęty w 1989
• Pierwsza wersja w 2000
•Koszt $3 mld
• 3 *109 bp (base pairs)
• 20,000 genów
1
Struktura genomu
Informacja genetyczna zawarta jest w jądrze
komórkowym, w którym umieszczone są podwójne
chromosomy oraz w mitochondrium, w którym mieści
się pojedyncze koliste DNA mitochondrialne, u ssaków
dziedziczone wyłącznie po matce.
Nukleotydy i ich łańcuchy
DNA/RNA
Na nici DNA znajdują się nukleotydy, 4 rodzaje, które
kodują informację genetyczną .
Tworzą podwójną prawostronną helisę, połączoną
wiązaniami wodorowymi
Pirymidyny i Puryny
Zasada
Fosforan
Cukier - pentoza
1
11/21/2013
Podwójna
Helisa DNA
Replikacja DNA
łączenie w
łańcuchu
głównym
Każda zasada ma wolną
grupę fosforanową przy 3
i 5 atomie węgla.
Kolejność w sekwencji
DNA podajemy : 5’ do 3’
(5’ – wolne 5)
łączenie
pomiędzy
łańcuchami
bocznymi 2
helis .
(A-T / G-C)
Komplementarność 2 nici redukuje błędy w DNA.
Parowanie (A-T / G-C) Watsona-Cricka jest jednym z
możliwych, ale najkorzystniejsze energetycznie
Wykorzystanie informacji z DNA
RNA – typy, funkcje
mRNA
tRNA
siRNA
miRNA
RNA – budowa
Transportowe RNA (t-RNA)
2
11/21/2013
Transkrypcja
Kodony aminokwasów (RNA)
W DNA zamiast U jest T
14
SPLICING
SPLICING ALTERNATYWNY
Typowe dla Eukariota.
Prokariota mają bardziej oszczędny genom
Funkcjonalna struktura genu
EUKARIOTA
Co to jest GEN?
GEN to molekularna jednostka dziedziczenia w organizmach
żywych. Nazywa się tak fragmenty DNA lub RNA, które
kodują: białko jednego typu lub łańcuch RNA, który pełni
jakąś funkcję w organizmie.
Współczesna definicja techniczna:
Możliwy do lokalizacji obszar sekwencji genomu,
odpowiadający jednostce dziedziczenia, która
odpowiada za:
-obszar transkrybowany (przepisywany, DNA do mRNA)
-obszar regulacyjny
- inny funkcjonalny obszar sekwencji
3
11/21/2013
Rybosomy
Nobel z chemii 2009
Translacja białek
Venkatraman Ramakrishnan
Thomas A. Steitz
Ada E. Yonath
DNA mitochondrialne (mtDNA)
cDNA
Komplementarny DNA (complementary DNA)
Uzyskany przez odwrotną transkrypcję mRNA (obecnego
w komórce) na DNA.
Często w bazach danych DNA .
Dlaczego?
Podstawowe narzędzia w inżynierii
genetycznej
PCR
Metylacja i enzymy restrykcyjne (endonukleazy)
Elektroforeza
żelowa DNA
4
11/21/2013
Open Reading Frame - ORF
Gen
Otwarta ramka odczytu pomiędzy kodonem START i
STOP – niekoniecznie rzeczywiście tłumaczona na
białko.
Kandydat na gen, szczególnie jeżeli jest długą
sekwencją.
26
Zmienność
genetyczna
Organizacja materiału genetycznego.
Chromosom
Wariant sekwencji DNA (o zmienności osobniczej) w danym
położeniu chromosomu (locus) nazywamy allelem.
1. Chromatyda
2. Centromer
3. Krótkie (p)
ramię
4. Długie (q) ramię
Allele tego samego genu różnią się jednym lub kilkoma
nukleotydami. Występowanie więcej niż jednej wersji danego genu
określa się jako polimorfizm. Dzięki zdegenerowaniu kodu
genetycznego tylko część tych różnic przekłada się na różnice w
budowie kodowanych białek
SNP – Single Nucleotide Polymorphism
Homolog – wyewoluował niezależnie, ale z tego samego przodka
Element nazwy
6
p
21.3
Gen z bazach danych locus
Wyjaśnienie
Numer chromosomu.
Ramię chromosomu - p („petit”) krótkie ramię, q
- długie ramię.
Pierwsza liczba oznacza prążek na chromosomie,
widoczny pod mikroskopem. Prążki liczy się od
strony centromeru (przewężenia) do końca
chromosomu. W niektórych prążkach, przy
wyższej rozdzielczości mikroskopu, można
wyróżnić subprążki. Pozycję subprążka określa
druga liczba (po kropce).
Chromosom zawiera ciąg par nukleotydów i białka.
Może być liniowy lub kolisty (np. mitochondrium).
Chromosomy mogą się między sobą różnić.
Mapowanie
Mapa genetyczna to uporządkowana lista loci dla
danego genomu.
Mapowanie genów jest proces określenia locus dla
danej cechy biologicznej.
Gen o locus 6p21.3 znajduje się w chromosomie 6 na jego krótkim ramieniu, w prążku 21
licząc od centromeru, w subprążku 3.
Tel4q1 , Chr4, q arm 1- oznacza telomer (końcówkę chromosomu)
5
11/21/2013
Jakie geny już znamy?
Struktura genu
PANTHER Pie Chart
RNA
31
32
Promotor
Eukariota
Odcinek DNA, położony zazwyczaj powyżej sekwencji kodującej
genu, który zawiera sekwencje rozpoznawane przez polimerazę
RNA zależną od DNA.
Po połączeniu się polimerazy RNA z promotorem rozpoczyna się
transkrypcja (proces przepisywania informacji genetycznej z DNA na
RNA).
Promotory eukariotyczne zawierają także sekwencje rozpoznawane
przez czynniki transkrypcyjne, które wiążąc się z DNA umożliwiają
związanie się polimerazy RNA z nicią DNA i rozpoczęcie transkrypcji.
Minimalny promotor (ang. core promoter) – do -35 par zasad
Promotor bliższy (proximal promoter) może mieć długość od
kilkudziesięciu do kilkuset nukleotydów.
DNA
33
34
Trudności
Rodziny wielogenowe
Open Reading
Frame (ORF)
3 możliwości dla
każdej nici
Dla organizmów 2niciowych
6 możliwości
Operon (jednostka transkrypcji i regulacji– równocześnie
przetwarzana) u prokariota.
U ludzi rodziny wielogenowe nie podlegają wspólnej regulacji.
35
36
6
11/21/2013
Znajdowanie ORF
Narzędzia
• Białka 100-kilka tysięcy aminokwasów
• ORF zaczyna się kodonem Met (M)
• Kończy się kodonem STOP
• ORF-finder
http://www.ncbi.nlm.nih.gov/projects/gorf/
(często też pod koniec sekwencje palindromowe tworzące
spinkę RNA o słabych wiązaniach par A-U, łatwy rozpad).
• Niewłaściwy ORF często napotyka na zbyt
wczesny kodon STOP.
• Introny (Eucariota) mają dużo kodonów STOP,
b. długie (100 do kilka mln pz). Miejsca
splicingu często mają charakterystyczne
motywy
Narzędzia
Narzędzia (obszary promotorowe)
• ORF-finder
http://www.ncbi.nlm.nih.gov/projects/gorf/
•
•
•
•
•
•
•
•
BDGP-NNPP
CorePromoter
TSSG
TSSW
ProScan
FunSiteP
Promoter
PromoterInspector
Nakładanie się genów
Trudności
(bardzo powszechne także u Eucariota!)
Nakładanie się
genów
Przykład nakładania się 3 ludzkich genów. Zielone eksony:
ciemne białka, jasne - UTR (ang.„untranslated regions”, obszary
regulatorowe eksonów), pozostałe – introny.
41
Ponadto :
Alternatywne wycinanie (alternative splicing) umożliwia
kodowanie kilku białek przez jeden gen (środowisko). Dzięki temu
o wiele więcej białek niż 20 tys (tyle genów)
7
11/21/2013
Trudności
Nie-białko
•Introny
•Obszary nie-tłumaczone UTR (UnTranslated Region)
•Obszary nie kodujące ncRNA
Kodon START wcale
nie musi być na
początku eksonu.
UTR (UnTranslated
Region)
43
Trudności
44
Trudności
Epigenetyka
Transpozony
czyli nie każdy gen
zawsze ulegnie
ekspresji
Jak je
rozpoznac?
45
46
Charakterystyczne logo
Co wiemy?
Czy jest jakaś regularność?
Miejsca wiążące rybosomu i
kodon startu (E. Coli)
47
48
8
11/21/2013
Częstotliwość kodonów aminokwasowych w
genach i poza nimi
Długość genu
Echols, N.A.R., 2002
49
Długości eksonów i intronów
50
Obszary charakterystyczne w genach
•
VNTR (Variable Number Tandem Repeats) –
minisatelity, 10-100 pz, genetyczny odcisk
palca, rozkład rozmiaru jest markerem
•
STRP (Short Tandem Repeat Polymorfism) –
mikrosatelity, 2-5 pz , 10-30 kopii każde,
równomierny rozkład w genomie ludzkim (np.
CAG – choroba Huntingtona)
51
Narzędzia
Jakie bazy danych mogą pomóc?
• HMMGene (HMM)
•FGenesh (HMM)
•GeneScan
•GrailExp
•GeneBuilder
•GeneWalker
•Glimmer
•GeneMark
•Orpheus
Homologi w znanych już
• eksonach
• EST (Expressed Sequence Tags) – krótkie
(200-500 pz) sekwencje z 3’ UTR
• cDNA (complementary DNA uzyskany „do
tyłu” z RNA)
53
54
9
11/21/2013
Adnotacja genu
Mukowiscydoza
czyli
Jaką funkcję pełni białko
Przyczyny niewydolności i zgonów – wynikiem
adnotacji genów
55
56
Poszukiwanie genów
Słownictwo
przeszukiwania
Ontologia Genów
(GO)
Funkcjonowanie:
Serwisy
Systems Biology
57
58
Wielkie/ciekawe projekty genetyczne
Aktualnie
http://www.ncbi.nlm.nih.gov/bioproject
10
11/21/2013
1000 genomes
http://www.1000genomes.org/
Międzynarodowy projekt o największej dotychczas skali
2500 genomów nieznanych ludzi (po 500 z każdego kontynentu, 25
populacji)
Cel – Katalog wariantów genetycznych ludzi
Chrobowe odmiany genomu, łącznie z SNP
1000-genomes
Charakterystyka grup badanych- Kliknąć poniżej
Wynikiem ma być:
1. Odkrycie wariantów typu SNP o częstotliwości co najmniej 1% w
rozmaitych populacjach
2. To samo, ale 0.1 - 0.5%
3. Odkrycie wariantów strukturalnych, np. warianty ilości kopii,
insercje, delecje, inwersje.
Human ENCODE
ENCODE
http://research.nhgri.nih.gov/ENCODEdb/
http://genome.ucsc.edu/ENCODE/
Cel
-Identyfikacja wszystkich elementów funkcjonalnych na bazie
szerokiego zbioru ludzkich sekwencji, otrzymanego metodami
dużej wydajności.
-Adnotacja elementów funkcjonalnych w sekwencjach.
Ścisła współpraca pomiędzy doświadczalnikami i
bioinformatykami.
The Human Microbiome Project (HMP)
https://commonfund.nih.gov/hmp/
Cel- Genotyp mikroflory żyjącej w ludzkim organizmie i analiza
jego roli w stanach chorobowych.
Obiekt
-DNA mikroorganizmów dotychczas wyizolowanych z ludzkiego
ciała
- 16S rybosomowe RNA (mała podjednostka rybosomu
prokariontów) mikroorganizmów z przewodu pokarmowego,
ust, skóry, nosa, dróg rodnych
Metagenomika – co to jest?
http://genome.ucsc.edu/ENCODE/
HMP
Reference Set of Microbial Genome Sequences and
Preliminary Characterization of the Human
Microbiome
Relationship Between Disease and Changes in the
Human Microbiome
New Technologies and Tools for Computational
Analysis
Data and Analysis Coordinating Center (DACC)
Resource Repository
Ethical, Legal, and Social Implications (ELSI)
11
11/21/2013
Genographic Project
Nie tylko NCBI i EMBL-EBI
Czyli jak migrowaliśmy
Projekt:
National Geographic Society,
IBM
Waitt Family Foundation
https://genographic.nationalgeographic.com/genographic/index.html
Genographic sample
Co testuje Genographic?
„Kits that are marked "maternal lineage" receive the
mitochondrial DNA (mtDNA) test to reveal direct maternal
ancestry. We test the Hypervariable Region 1 (HVR1: 16001 to
16569) and compares your results to the Cambridge
Reference Sequence.
Kits marked "paternal" receive the Y-chromosome test to
reveal direct paternal ancestry. (Males only.) This is a 12marker test. Additional testing such as a SNP test may be run
on a Y-chromosome sample if analysis of the 12 STR values
does not conclusively indicate a Haplogroup assignment”.
Neanderthal genome project
http://www.eva.mpg.de/neandertal/
© 2009, Max Planck Institute for Evolutionary Anthropology, Leipzig
Max Planck Institute for Evolutionary Anthropology - The Neandertal Genome Project
12
Download