Statystyczna analiza danych I – zadania przygotowujace ˛ do EGZAMINU Anna Gambin 12 czerwca 2012 Uwaga: Zadania prosz˛e rozwiazać ˛ (pisemnie) i rozwiazania ˛ przynieść ze soba˛ na egzamin ustny w dniu 21 czerwca 2012. Zadanie 1 Poniżej podajemy kod genetyczny, w którym symbol ’Z’ jest rozumiany jako ’STOP’. Literka ’C’ w pierwszym (’T”) bloku w czwartej (’G’) kolumnie i drugim (’C’) rz˛edzie oznacza, że trójka ’TGC’ koduje aminokwas ’C’ czyli cystein˛e. T C T F F L L L L L L C A G S Y C S Y C S Z Z S Z W P H R P H R P Q R P Q R T C A G T C A G T I I I M V V V V A G C T T T T A A A A A N N K K D D E E G S S R R G G G G T C A G T C A G Załóż, że sekwencja trzech liter jest wylosowana jednostajnie z alfabetu DNA {A, C, G, T }. Jakie jest prawdopodobieństwo, że ta sekwencja koduje każdy poszczególny aminokwas ? Z jakim prawdopodobieństwem sekwencja nie koduje żadnego aminokwasu ? 1 Przyjmij, że aminokwas został wylosowany jednostajnie ze zbioru wszystkich dwudziestu aminokwasów, a nast˛epnie wylosowaliśmy trójk˛e nukleotydów (jednostajnie) spośród kodonów kodujacych ˛ ten aminokwas. Jakie jest prawdopodobieństwo wyst˛epowania cytozyny na pozycji pierwszej, drugiej i trzeciej kodonu ? Jakie jest prawdopodobieństwo uzyskania dinukleotydu ’CC’ na pozycjach 1 i 2, oraz na pozycjach 2 i 3. Policz to prawdopodobieństwo dla dinukleotydu ’CG’. Jakie jest prawdopodobieństwo warunkowe ’C’ na pozycji 2 pod warunkiem wyst˛epowania ’C’ na pozycji pierwszej. Czy te zdarzenia sa˛ niezależne ? Zadanie 2 Czasteczka ˛ radioaktywna została umiejscowiona w losowym punkcie kwadratu o boku 1. Niech X i Y oznaczaja˛ współrz˛edne czasteczki. ˛ Sensownym modelem probabilistycznym jej lokalizacji jest nast˛epujaca ˛ dwuwymiarowa zmienna losowa: ( 1 dla 0 ≤ X ≤ 1 oraz 0 ≤ Y ≤ 1 p= 0 wpp. a. oblicz: P (X − Y ≥ 0.5) b. oblicz: P (X · Y ≤ 0.5) c. znajdź rozkłady brzegowe zmiennych X i Y . d. czy te zmienne sa˛ niezależne ? e. oblicz: E[X − Y ] E[X · Y ] E[X 2 + Y 2 ] Var[X · Y ] Zadanie 3 Zgodnie z teoria˛ dziedziczenia zaproponowana˛ przez Grzegorza Mendla, groszek pachnacy ˛ kwitnie na biało, różowo lub czerwono odpowiednio z prawdopodobieństwem 14 , 12 , 14 . W celu sprawdzenia tej teorii zbadano próbk˛e 564 roślin i naliczono 141 białych kwiatów, 291 różowych oraz 132 czerwonych. Przetestuj zgodność obserwacji z teoria: ˛ 2 a. opisz adekwatny test statystyczny. b. ile stopni swobody ma badany rozkład ? c. podaj wartość krytyczna˛ statystyki testowej dla bł˛edu typu I na poziomie 5%. d. Sformułuj hipotez˛e zerowa˛ i alternatywna.˛ e. policz odpowiednia˛ statystyk˛e i rozstrzygnij czy należy odrzucić hipotez˛e zerowa.˛ 3