Bioinformatyczna analiza danych - Katedra Genetyki i Ogólnej

advertisement
Bioinformatyczna analiza danych
Wykład 1
Dr Wioleta Drobik-Czwarno
Katedra Genetyki i Ogólnej Hodowli Zwierząt
Sprawy organizacyjne
• Prowadzący przedmiot:
▫ Dr Wioleta Drobik-Czwarno – koordynator przedmiotu, wykłady,
ćwiczenia




Pokój:35 (Katedra Genetyki i Ogólnej Hodowli Zwierząt)
Telefon: 22 59 36582
Email: [email protected]; [email protected]
Konsultacje: wtorek 9-11 (lub inny termin po wcześniejszym
umówieniu się)
▫ Dr Zuzanna Nowak – 1 blok ćwiczeniowy
 Pokój 28, email: [email protected]
▫ Mgr inż. Marlena Wojciechowska – 1 blok ćwiczeniowy
 Pokój 23, email: [email protected]
Sprawy organizacyjne
• Organizacja przedmiotu
▫ ECTS: 3 pkt
▫ 10 h wykładów – 1 h wykładu w tygodniu
▫ 30 h ćwiczeń – 3 h ćwiczeń w tygodniu
▫ Planowane daty zakończenia zajęć: 22.05 (wykład, ćw gr 1) i
23.05 (ćw gr 2) – do uzgodnienia
Zasady zaliczenia przedmiotu
• Egzamin – 40%
▫ Pytania z części wykładowej i ćwiczeniowej
▫ Pytania otwarte – odpowiedź na kilka zdań, uzupełnianie,
uszeregowanie
• Przykładowe pytania:
▫ Wymień znane ci rodzaje mikromacierzy DNA oraz ich
zastosowanie
▫ W jakim celu wykonujemy analizę PCA przed GWAS?
▫ Wypisz etapy analizy bioinformatycznej mającej na celu
wykrywanie polimorfizmów typu SNP na podstawie NGS.
Zasady zaliczenia części ćwiczeniowej
• Projekt ~ 40% oceny
▫ Prowadzący dostarcza: dane, zarys problemu badawczego
▫ Należy przygotować prezentację w której znajdą się:
1. Wstęp, zarys problemu badawczego
2. Metodologia
3. Wyniki
4. Podsumowanie i wnioski
• Czas na prezentację projektu: 15-20 minut
• Grupy od 2 do 4 osób, istnieje możliwość przygotowania
projektu samodzielnie.
Zasady zaliczenia części ćwiczeniowej
• Praca na zajęciach ~ 20% oceny
▫ Jak wyżej, czyli zaangażowanie w ćwiczenia, wykonanie
przewidzianych analiz
▫ Po danym bloku tematycznym (co 1-2 tygodnie) każdy ma
obowiązek nadesłać pytanie drogą mailową
 Czas - do czwartku w danym tygodniu zajęć
 Pytanie może dotyczyć wykładu lub ćwiczeń. Nie może być to
pytanie, o coś na co odpowiedz była już podana. Pytamy o to
czego nie zrozumieliśmy, co nas zaintrygowało, w stosunku do
czego mamy wątpliwości.
Czym będziemy zajmowali się na
zajęciach
• Programy do zaawansowanych analiz bioinformatycznych
▫ analiza danych z mikromacierzy SNP
▫ analiza stratyfikacji populacji (analiza głównych składowych PCA, ang.
Principal Component Analysis)
▫ analiza asocjacyjna w skali genomu (GWAS, and. Genome-Wide
Association Studies)
▫ sekwencjonowanie nowej generacji (NGS, ang. Next Generation
Sequencing)
▫ analiza ekspresji genów
• Podstawy obsługi command line w systemie linux
• Podstawy programowania w języku Python
• Do czego przydaje się środowisko R w bioinformatyce
Mikromacierze DNA
Mikromacierze DNA
• Podstawowe rodzaje mikromacierzy DNA:
▫ Mikromacierze cDNA
▫ Mikromacierze oligonukleotydowe
▫ aCGH (ang. Agilent Comparative Genomic Hybridization) –
porównawcza hybrydyzacja genomowa do mikromacierzy, służy do
szacowania liczby kopii (ang. CNV)
Mikromacierze cDNA
• Umożliwia porównanie ekspresji
genów w próbie eksperymentalnej i
kontrolnej poprzez wyznakowanie
prób dwoma różnymi barwnikami
• Etapy:
1.
2.
3.
4.
Izolacja RNA
Przepisanie RNA na komplementarny
jednoniciowy DNA
Dołączanie znakowanych nukleotydów
do powstających cząsteczek DNA
Wizualizacja wyników – natężenie
fluorescencji jest proporcjonalna do
ilości wyznakowanych cząstek
Veronique Vermeeren and Luc Michiels (2011)
Evolution towards the implementation of point-ofcare biosensors. ISBN 978-953-307-443-6
Mikromacierze SNP
• Inaczej chipy DNA, mikromacierze genotypowe
• Służą do wykrywania wielu, nawet setek tysięcy polimofizmów
jednocześnie
• Największe firmy biotechnologiczne zajmujące się produkcją
chipów DNA dla ludzi i zwierząt:
• Affymetrix - statyczne chipy DNA, sondy syntetyzowane są bezpośrednio na
płytce w technice fitolitografii
• Illumina - sondy zakotwiczone są na powierzchni silikonowych ziaren (ang.
beads), każde ziarno to setki tysięcy kopii jednej sondy
Techniki wykrywania polimorfizmu DNA
•
•
•
•
•
RFLP - polimorfizm długości fragmentów restrykcyjnych
AFLP - polimorfizm długości amplifikowanych fragmentów
SSCP - Polimorfizm konformacyjny jednoniciowych fragmentów
RAPD - Polimorfizm losowo amplifikowanych fragmentów
Polimorfizm sekwencji powtarzających się tandemowo
• Sekwencje mikrosatelitarne (STR)
▫ Sekwencje minisatelitarne (VNTR)
▫ Zmienność liczby kopii (CNV)
• Mikromacierze SNP
• Sekwencjonowanie
Mikromacierze SNP
1.
2.
3.
4.
5.
Izolacja DNA z materiału biologicznego
Powielenie DNA w procesie amplifikacji oraz fragmentacja
Naniesienie na powierzchnię mikromacierzy
Hybrydyzacja jednoniciowych fragmentów DNA z sondami o komplementarnej
sekwencji
Wyznakowanie sondy poprzez dodanie znakowanego fluorescencyjnie nukleotydu
Źródło: Affymetrix
Zastosowanie mikromacierzy SNP
• Zwierzęta:
▫
▫
▫
▫
Badania asocjacyjne prowadzone na całym genomie (GWAS)
Selekcja genomowa
Kontrola pochodzenia
Genetyka populacyjna
• Medycyna:
▫ Diagnostyka chorób genetycznych i chorób zakaźnych
▫ Wykrywanie aberracji chromosomowych
▫ Identyfikacja genów min. odporności na antybiotyki
Programy do analizy surowych
danych z mikromacierzy SNP
Illumina Genome Studio – demonstracja na ćwiczeniach
Axiom Analysis Suite
Axiom Analysis Suite
• Umożliwia przeprowadzenie
pełnej analizy w jednym
programie
▫ Import plików
▫ Konfiguracja ustawień
▫ Ustawienia filtrów QC (ang.
Quality Control)
▫ Domyślne ustawienia dla
gatunków di- oraz
poliploidalnych
▫ Wizualizacja wyników
Np. Axiom CNV Summary Tool
A. Pliki .CEL
• Przechowuje informację o poziomie intensywności
fluorescencji każdej z sond mikromacierzowych
B. Ustawienia analizy
• Przygotowywujemy pliki do dalszych analiz
• Nazywamy projekt
C. Kontrola jakości
• Sample QC – jakość płytki, procent próbek, które przechodzą
kontrolę jakości
• SNP QC – parametry jakości dotyczące markerów SNP
C. Kontrola jakości
SNP Cluster Graph
Generowane dla każdego markera
Literatura
• Charon K., Świtoński M. 2012. Genetyka i Genomika Zwierząt. PWN.
• Wojciechowska M., Olech W. 2013. Wykorzystanie mikromacierzy DNA w badaniach
dzikich zwierząt. Studia i Materiały CEPL w Rogowie. R. 15. Zeszyt 36 / 3 / 2013.
• Platforma Affymetrix: http://www.affymetrix.com/
• Platforma Illumina: https://www.illumina.com/
Download