Bioinformatyczna analiza danych Wykład 1 Dr Wioleta Drobik-Czwarno Katedra Genetyki i Ogólnej Hodowli Zwierząt Sprawy organizacyjne • Prowadzący przedmiot: ▫ Dr Wioleta Drobik-Czwarno – koordynator przedmiotu, wykłady, ćwiczenia Pokój:35 (Katedra Genetyki i Ogólnej Hodowli Zwierząt) Telefon: 22 59 36582 Email: [email protected]; [email protected] Konsultacje: wtorek 9-11 (lub inny termin po wcześniejszym umówieniu się) ▫ Dr Zuzanna Nowak – 1 blok ćwiczeniowy Pokój 28, email: [email protected] ▫ Mgr inż. Marlena Wojciechowska – 1 blok ćwiczeniowy Pokój 23, email: [email protected] Sprawy organizacyjne • Organizacja przedmiotu ▫ ECTS: 3 pkt ▫ 10 h wykładów – 1 h wykładu w tygodniu ▫ 30 h ćwiczeń – 3 h ćwiczeń w tygodniu ▫ Planowane daty zakończenia zajęć: 22.05 (wykład, ćw gr 1) i 23.05 (ćw gr 2) – do uzgodnienia Zasady zaliczenia przedmiotu • Egzamin – 40% ▫ Pytania z części wykładowej i ćwiczeniowej ▫ Pytania otwarte – odpowiedź na kilka zdań, uzupełnianie, uszeregowanie • Przykładowe pytania: ▫ Wymień znane ci rodzaje mikromacierzy DNA oraz ich zastosowanie ▫ W jakim celu wykonujemy analizę PCA przed GWAS? ▫ Wypisz etapy analizy bioinformatycznej mającej na celu wykrywanie polimorfizmów typu SNP na podstawie NGS. Zasady zaliczenia części ćwiczeniowej • Projekt ~ 40% oceny ▫ Prowadzący dostarcza: dane, zarys problemu badawczego ▫ Należy przygotować prezentację w której znajdą się: 1. Wstęp, zarys problemu badawczego 2. Metodologia 3. Wyniki 4. Podsumowanie i wnioski • Czas na prezentację projektu: 15-20 minut • Grupy od 2 do 4 osób, istnieje możliwość przygotowania projektu samodzielnie. Zasady zaliczenia części ćwiczeniowej • Praca na zajęciach ~ 20% oceny ▫ Jak wyżej, czyli zaangażowanie w ćwiczenia, wykonanie przewidzianych analiz ▫ Po danym bloku tematycznym (co 1-2 tygodnie) każdy ma obowiązek nadesłać pytanie drogą mailową Czas - do czwartku w danym tygodniu zajęć Pytanie może dotyczyć wykładu lub ćwiczeń. Nie może być to pytanie, o coś na co odpowiedz była już podana. Pytamy o to czego nie zrozumieliśmy, co nas zaintrygowało, w stosunku do czego mamy wątpliwości. Czym będziemy zajmowali się na zajęciach • Programy do zaawansowanych analiz bioinformatycznych ▫ analiza danych z mikromacierzy SNP ▫ analiza stratyfikacji populacji (analiza głównych składowych PCA, ang. Principal Component Analysis) ▫ analiza asocjacyjna w skali genomu (GWAS, and. Genome-Wide Association Studies) ▫ sekwencjonowanie nowej generacji (NGS, ang. Next Generation Sequencing) ▫ analiza ekspresji genów • Podstawy obsługi command line w systemie linux • Podstawy programowania w języku Python • Do czego przydaje się środowisko R w bioinformatyce Mikromacierze DNA Mikromacierze DNA • Podstawowe rodzaje mikromacierzy DNA: ▫ Mikromacierze cDNA ▫ Mikromacierze oligonukleotydowe ▫ aCGH (ang. Agilent Comparative Genomic Hybridization) – porównawcza hybrydyzacja genomowa do mikromacierzy, służy do szacowania liczby kopii (ang. CNV) Mikromacierze cDNA • Umożliwia porównanie ekspresji genów w próbie eksperymentalnej i kontrolnej poprzez wyznakowanie prób dwoma różnymi barwnikami • Etapy: 1. 2. 3. 4. Izolacja RNA Przepisanie RNA na komplementarny jednoniciowy DNA Dołączanie znakowanych nukleotydów do powstających cząsteczek DNA Wizualizacja wyników – natężenie fluorescencji jest proporcjonalna do ilości wyznakowanych cząstek Veronique Vermeeren and Luc Michiels (2011) Evolution towards the implementation of point-ofcare biosensors. ISBN 978-953-307-443-6 Mikromacierze SNP • Inaczej chipy DNA, mikromacierze genotypowe • Służą do wykrywania wielu, nawet setek tysięcy polimofizmów jednocześnie • Największe firmy biotechnologiczne zajmujące się produkcją chipów DNA dla ludzi i zwierząt: • Affymetrix - statyczne chipy DNA, sondy syntetyzowane są bezpośrednio na płytce w technice fitolitografii • Illumina - sondy zakotwiczone są na powierzchni silikonowych ziaren (ang. beads), każde ziarno to setki tysięcy kopii jednej sondy Techniki wykrywania polimorfizmu DNA • • • • • RFLP - polimorfizm długości fragmentów restrykcyjnych AFLP - polimorfizm długości amplifikowanych fragmentów SSCP - Polimorfizm konformacyjny jednoniciowych fragmentów RAPD - Polimorfizm losowo amplifikowanych fragmentów Polimorfizm sekwencji powtarzających się tandemowo • Sekwencje mikrosatelitarne (STR) ▫ Sekwencje minisatelitarne (VNTR) ▫ Zmienność liczby kopii (CNV) • Mikromacierze SNP • Sekwencjonowanie Mikromacierze SNP 1. 2. 3. 4. 5. Izolacja DNA z materiału biologicznego Powielenie DNA w procesie amplifikacji oraz fragmentacja Naniesienie na powierzchnię mikromacierzy Hybrydyzacja jednoniciowych fragmentów DNA z sondami o komplementarnej sekwencji Wyznakowanie sondy poprzez dodanie znakowanego fluorescencyjnie nukleotydu Źródło: Affymetrix Zastosowanie mikromacierzy SNP • Zwierzęta: ▫ ▫ ▫ ▫ Badania asocjacyjne prowadzone na całym genomie (GWAS) Selekcja genomowa Kontrola pochodzenia Genetyka populacyjna • Medycyna: ▫ Diagnostyka chorób genetycznych i chorób zakaźnych ▫ Wykrywanie aberracji chromosomowych ▫ Identyfikacja genów min. odporności na antybiotyki Programy do analizy surowych danych z mikromacierzy SNP Illumina Genome Studio – demonstracja na ćwiczeniach Axiom Analysis Suite Axiom Analysis Suite • Umożliwia przeprowadzenie pełnej analizy w jednym programie ▫ Import plików ▫ Konfiguracja ustawień ▫ Ustawienia filtrów QC (ang. Quality Control) ▫ Domyślne ustawienia dla gatunków di- oraz poliploidalnych ▫ Wizualizacja wyników Np. Axiom CNV Summary Tool A. Pliki .CEL • Przechowuje informację o poziomie intensywności fluorescencji każdej z sond mikromacierzowych B. Ustawienia analizy • Przygotowywujemy pliki do dalszych analiz • Nazywamy projekt C. Kontrola jakości • Sample QC – jakość płytki, procent próbek, które przechodzą kontrolę jakości • SNP QC – parametry jakości dotyczące markerów SNP C. Kontrola jakości SNP Cluster Graph Generowane dla każdego markera Literatura • Charon K., Świtoński M. 2012. Genetyka i Genomika Zwierząt. PWN. • Wojciechowska M., Olech W. 2013. Wykorzystanie mikromacierzy DNA w badaniach dzikich zwierząt. Studia i Materiały CEPL w Rogowie. R. 15. Zeszyt 36 / 3 / 2013. • Platforma Affymetrix: http://www.affymetrix.com/ • Platforma Illumina: https://www.illumina.com/