Statystyczna analiza danych I

advertisement
Statystyczna analiza danych I – zadania
przygotowujace
˛ do EGZAMINU
Anna Gambin
12 czerwca 2012
Uwaga:
Zadania prosz˛e rozwiazać
˛
(pisemnie) i rozwiazania
˛
przynieść ze soba˛ na egzamin ustny w
dniu 21 czerwca 2012.
Zadanie 1
Poniżej podajemy kod genetyczny, w którym symbol ’Z’ jest rozumiany jako ’STOP’. Literka ’C’ w pierwszym (’T”) bloku w czwartej (’G’) kolumnie i drugim (’C’) rz˛edzie oznacza,
że trójka ’TGC’ koduje aminokwas ’C’ czyli cystein˛e.
T
C
T
F
F
L
L
L
L
L
L
C A G
S Y C
S Y C
S Z Z
S Z W
P H R
P H R
P Q R
P Q R
T
C
A
G
T
C
A
G
T
I
I
I
M
V
V
V
V
A
G
C
T
T
T
T
A
A
A
A
A
N
N
K
K
D
D
E
E
G
S
S
R
R
G
G
G
G
T
C
A
G
T
C
A
G
Załóż, że sekwencja trzech liter jest wylosowana jednostajnie z alfabetu DNA {A, C, G, T }.
Jakie jest prawdopodobieństwo, że ta sekwencja koduje każdy poszczególny aminokwas ? Z
jakim prawdopodobieństwem sekwencja nie koduje żadnego aminokwasu ?
1
Przyjmij, że aminokwas został wylosowany jednostajnie ze zbioru wszystkich dwudziestu
aminokwasów, a nast˛epnie wylosowaliśmy trójk˛e nukleotydów (jednostajnie) spośród kodonów kodujacych
˛
ten aminokwas. Jakie jest prawdopodobieństwo wyst˛epowania cytozyny na
pozycji pierwszej, drugiej i trzeciej kodonu ?
Jakie jest prawdopodobieństwo uzyskania dinukleotydu ’CC’ na pozycjach 1 i 2, oraz
na pozycjach 2 i 3. Policz to prawdopodobieństwo dla dinukleotydu ’CG’. Jakie jest prawdopodobieństwo warunkowe ’C’ na pozycji 2 pod warunkiem wyst˛epowania ’C’ na pozycji
pierwszej. Czy te zdarzenia sa˛ niezależne ?
Zadanie 2 Czasteczka
˛
radioaktywna została umiejscowiona w losowym punkcie kwadratu o
boku 1. Niech X i Y oznaczaja˛ współrz˛edne czasteczki.
˛
Sensownym modelem probabilistycznym jej lokalizacji jest nast˛epujaca
˛ dwuwymiarowa zmienna losowa:
(
1 dla 0 ≤ X ≤ 1 oraz 0 ≤ Y ≤ 1
p=
0 wpp.
a. oblicz:
P (X − Y ≥ 0.5)
b. oblicz:
P (X · Y ≤ 0.5)
c. znajdź rozkłady brzegowe zmiennych X i Y .
d. czy te zmienne sa˛ niezależne ?
e. oblicz:
E[X − Y ]
E[X · Y ]
E[X 2 + Y 2 ]
Var[X · Y ]
Zadanie 3
Zgodnie z teoria˛ dziedziczenia zaproponowana˛ przez Grzegorza Mendla, groszek pachnacy
˛ kwitnie na biało, różowo lub czerwono odpowiednio z prawdopodobieństwem 14 , 12 , 14 .
W celu sprawdzenia tej teorii zbadano próbk˛e 564 roślin i naliczono 141 białych kwiatów,
291 różowych oraz 132 czerwonych.
Przetestuj zgodność obserwacji z teoria:
˛
2
a. opisz adekwatny test statystyczny.
b. ile stopni swobody ma badany rozkład ?
c. podaj wartość krytyczna˛ statystyki testowej dla bł˛edu typu I na poziomie 5%.
d. Sformułuj hipotez˛e zerowa˛ i alternatywna.˛
e. policz odpowiednia˛ statystyk˛e i rozstrzygnij czy należy odrzucić hipotez˛e zerowa.˛
3
Download