Programowanie w języku Perl dla biologów

advertisement
Tytuł kursu
Programowanie w języku Perl dla biologów
Czas trwania warsztatu Sugerowany czas: 1-2 tygodnie, 15 godzin lekcyjnych
Wycena warsztatu
Zajęcia będą odbywać się w pracowni komputerowej Wydziału
Biotechnologii
Cel warsztatu
Celem kursu będzie zapoznanie uczestników z możliwościami pisania
skryptów w języku Perl na przykładzie danych biologicznych i
bioinformatycznych oraz zautomatyzowania pracy na dużych zbiorach
danych.
Efekty kształcenia:
• Wiedza: uczestnik warsztatów: zaznajomi się z możliwościami
zastosowań języka Perl w analizie danych biologicznych i
bioinformatycznych; pozna powszechnie stosowane formaty plików z
bazy GenBank przechowujące informacje o sekwencjach białek i kwasów
nukleinowych;
• Umiejętności: uczestnik warsztatów będzie potrafił napisać skrypty
przetwarzające pliki pochodzące z bazy danych GenBank oraz inne pliki
tekstowe zwierające dane biologiczne; przy pisaniu skryptów będzie
umiał zastosować pętle, instrukcje warunkowe, podstawowe funkcje oraz
operacje na wyrażeniach regularnych;
• Kompetencje: uczestnik warsztatów będzie rozumiał idee i potrzebę
programowania oraz automatyzację pracy na dużych zbiorach danych
bioinformatycznych i biologicznych.
Plan warsztatu
1. Charakterystyka i użyteczność języka Perl; instalowanie i konfiguracja
edytora do pisania skryptów; podstawowe operacje na zmiennych
łańcuchowych i tablicowych oraz wykorzystanie funkcji podstawienia,
transliteracji, print i reverse na przykładzie analiz sekwencji
nukleotydowych; odczytywanie danych z pliku (uchwyt pliku);
2. Idea i zastosowanie instrukcji warunkowych oraz pętli while na
przykładzie poszukiwania motywów w sekwencjach; zastosowanie
wyrażeń regularnych i dopasowanie wzorców;
3. Zastosowanie pętla for i funkcji chomp, split i substr oraz przypisania i
inkrementacji do liczenia znaków (nukleotydów) w sekwencjach; zapis
wyniku do pliku; zastosowanie tablic asocjacyjnych do tłumaczenia
sekwencji nukleotydowych na aminokwasowe;
4. Struktura plików fasta i GenBank oraz ich przetwarzanie. pliku w
formacie GenBank; ciąg zmiana separatorów wejściowych, zastosowanie
modyfikatorów dopasowania i metaznaków ilościowych.
Liczba uczestników
Sugerowana liczba uczestników: 5-10.
Sugerowany termin
„druga połowa września”
Download