Zad 1. W kolejnych 5-ciu urnach wyciągniemy kulę białą z prawdopodobieństwem odpowiednio – 0,3 ; 0,4 ; 0,5 ; 0,6 ; 0,7. Jakie jest prawdopodobieństwo, że wyciągniemy: a). 4 kule białe b). przynajmniej jedną kulę białą. Zad 2. Automat tokarski produkuje nity, których średnica ma rozkład normalny z odchyleniem standardowym 0,04 mm. Wartość oczekiwana może być regulowana przez odpowiednio ustawienie automatu. Nit spełnia normę jeżeli jego średnica mieści się w przedziale < 2,9 mm , 3,1 mm >. a). Jakie jest prawdopodobieństwo wyprodukowania braku, gdy automat ustawiono tak, że wartość oczekiwana wynosi 3,04 mm. b). Jak powinien być ustawiony automat, żeby prawdopodobieństwo wyprodukowania nitu nie zgodnie z normą była najmniejsza. Zad 3. Rozkład prawdopodobieństwa zmiennej losowej X jest następujący: xi pi 0 0,1 2 0,4 4 0,2 6 0,3 a). Oblicz E(X), D2(X), D(X). b). Podaj wartość P(X > 0) Zad 4. Dla jakiej wartości c funkcja c x dla 0 x 4 f ( x) dla pozostalych x 0 może być gęstością prawdopodobieństwa zmiennej losowej X. Obliczyć: a). Wartość oczekiwaną zmiennej losowej b). Wyznaczyć dystrybuantę tej zmiennej. c). P( 1<X < 3). d). Wyznaczyć funkcję gęstości zmiennej losowej Y=X2. Zad 5. Na trasie samochodu znajdują się 5 sygnalizatory świetlne z których każdy z prawdopodobieństwem 0,5 przepuszcza lub zatrzymuje ruch. Znaleźć rozkład liczby sygnalizatorów, które minął samochód przed pierwszym zatrzymaniem się. Tzn. wyznaczyć zmienną losową i jej wartość oczekiwaną przyjmująca wartości liczbę sygnalizatorów przejechanych do momentu pierwszego zatrzymania się. Zad 6. W celu oszacowania błędu standardowego pewnego przyrządu pomiarowego (odchylenia standardowego tego przyrządu) dokonano 4 pomiarów pewnej wielkości i otrzymano wyniki: 8,2 ; 8,15 ; 8,05 ; 8,14 . Zakładając, że wskazania przyrządu mają rozkład normalny podać przedział ufności dla błędu (odchylenia standardowego) na poziomie ufności 0,95. Zad 7. Analizując wydajność pracy w pewnym zakładzie w czasie dnia po wprowadzeniu reorganizacji otrzymano następujące wyniki: Wykonano sztuk 140 150 160 170 180 liczba pracowników 5 10 15 10 5 Badając wydajność pracy przed reorganizacją na 70 pracownikach otrzymano, że średnia liczba zrobionych sztuk wynosi 150 i odchylenie standardowe 12 sztuk. a). Czy na poziomie istotności 0,05 można twierdzić, że reorganizacja zwiększyła wydajność pracy w zakładzie. b). Na poziomie ufności 1- =0,95 oszacować metodą przedziałową wartość oczekiwaną liczby zrobionych sztuk przez pracownika przed reorganizacją. Ad 7a). Niech X oznacza zmienną losową badanej cechy w pierwszej populacji. Próbę n - elementową x1 , x2 , x3 ,...., xn będziemy traktować jaką realizację ciągu zmiennych losowych X 1 , X 2 , X 3 ,...., X n gdzie zmienna losowa X i przyjmuje wartości – wartość i tego pomiaru cechy w próbie i 1,2,..., n . Dla różnych prób n - elementowych wartości są zazwyczaj różne. Ponieważ próba jest próbą losową prostą / tzn. wybieramy elementy z populacji tak aby każdy element miał jednakowe prawdopodobieństwo trafienia do próby/ i populacja jest duża /wtedy wylosowany element nie wpływa na stan populacji / to zmienne losowe X 1 , X 2 , X 3 ,...., X n są niezależne i rozkład tych zmiennych jest taki sam co rozkład zmiennej losowej X co zapisujemy X ~ X i i 1,2,....., n Niech Y oznacza zmienną losową badanej cechy w drugiej populacji. Próbę k - elementową y1 , y2 , y3 ,...., yk będziemy traktować jaką realizację ciągu zmiennych losowych Y1 , Y2 , Y3 ,...., Yk gdzie zmienna losowa Yi przyjmuje wartości – wartość i tego pomiaru cechy w próbie i 1,2,..., k . Z tych samych powodów zmienne losowe Y1 , Y2 , Y3 ,...., Yk są niezależne i rozkład tych zmiennych jest taki sam co rozkład zmiennej losowej Y , co zapisujemy Y ~ Yi Niech mx EX E ( X ) my EY E(Y ) x2 D 2 X D 2 ( X ) . x2 D 2 ( X i ) Wtedy mx EX i i 1,2,....., n,... oraz jeżeli y2 D2Y D2 (Y ) to wtedy y2 D 2 (Yi ) my EYi i 1,2,....., k i 1,2,....., k ,... 1 n 1 k X Yi X ( n ) Y( k ) n, k N i k n i 1 i 1 1 n 1 k X ( n ) X i , Y( k ) Yi n, k N . mamy zmiennych n i 1 k i 1 1 n 1 k 1 n 1 k EZ n ,k E ( X i Yi ) EX i EYi mx m y n, k N n i 1 k i 1 n i 1 k i 1 Dla ciągu zmiennych losowych Z n ,k D 2 Z n ,k D 2 ( 1 n 1 k 1 X Yi ) 2 i n i 1 k i 1 n n D2 X i i 1 1 k2 k x2 i 1 n D 2Yi y2 z niezależności również n, k N k Korzystaliśmy z podstawowych ogólnych wzorów i własności na obliczanie wartości oczekiwanej i wariancji. Jest ten ciąg asymptotycznie normalny i standaryzacja dla dużych n i k (n,k>30) daje statystykę Z (mx m y ) U n ,k n ,k ~ N (0,1) w przybliżeniu normalną standaryzowaną. x2 n y2 k Przy prawdziwości hipotezy zerowej H o : m x m y statystyka U n ,k X ( n )Y( k ) x2 n y2 ~ N (0,1) k Gdy zastąpimy wariancje teoretyczne wariancjami uzyskanymi w próbie uzyskamy również U n ,k X ( n )Y( k ) 2 x S y2 S n k ~ N (0,1) Liczba pracowników Wykonano sztuk xi składniki ni 140 150 160 170 180 7200 160 45 2 y 150 sy x składniki ( xi x ) 2 ni xi ni 5 700 2000 10 1500 1000 15 2400 0 10 1700 1000 5 900 2000 n = = 45 = 7200 = 6000 6000 2 sx 133,33 s x 133,33 11,55 45 12 2 144 k 70 160 150 4,55 133,33 144 45 70 Aby odpowiedzieć na postawione pytanie bierzemy hipotezę alternatywną H 3 : mx m y u0 Wartość statystyki Związaną z testem prawostronnym, a obszarem krytycznym będzie obszar K (u 2 , ) u 2 u0,1 1,645 czyli K (1,645 , ) . Wartość statystyki należy do przedziału krytycznego tzn. u0 4,55 K 1,645 ; to oznacza, że w założeniach występuje nieprawda czyli hipoteza zerowa jest fałszywa i jest prawdziwa hipoteza alternatywna z prawdopodobieństwem przynajmniej 0,95 . Może zaistnieć błąd pierwszego rodzaju z prawdopodobieństwem 0,05, że hipoteza zerowa jest prawdziwa a przyjęliśmy alternatywną. Na podstawie tych danych twierdzimy, że reorganizacja wpływa na wydajność. Jest to zdanie prawdziwe z prawdopodobieństwem przynajmniej 0,95. Ad 7b). Dla zmiennej Y( n ) 1 n Yi n i 1 EY( n ) 1 n EYi m y n i 1 Z twierdzenia granicznego Lindeberga-Levy’ego X n n1 Dla ciągu niezależnych zmiennych losowych 2 D Y( n ) 1 2 n n D Y 2 i 1 i y2 n o jednakowym rozkładzie, o wartości przeciętnej m i skończonej wariancji 2 0 ciąg Fn n1 dystrybuant standardowych średnich arytmetycznych X n albo n standardowych sum X k 1 i n Yn Xn m X k 1 i nm n n Jest zbieżny do dystrybuanty rozkładu N (0,1) . Wynika, że zmienne losowa U n Y( n ) m y Y( n ) m y n ~ N (0,1) dla dużych n ma w przybliżeniu rozkład n normalny standaryzowany. Zastępując odchylenie teoretyczne odchyleniem uzyskanym w próbie uzyskamy przedział ufności którego wzór wyprowadzaliśmy na ćwiczeniach S S S S 1 P(Y( n ) u m y Y( n ) u ) P(Y( n ) u m y Y( n ) u ) Stąd n n n n 150 1,96 Stąd 12 70 m 150 1,96 12 70 ponieważ u u 0, 05 1,96 z tablic rozkładu normalnego. 146,5 m 153,5 . Ten przedział z prawdopodobieństwem 0,95 pokrywa teoretyczną wydajność pracy pracowników przed reorganizacją. Zad 2). W punkcie a) należało wyznaczyć P(2,9 U 3,1) ? gdzie U ~ N (3,04 ; 0,04) 2,9 3,04 U 3,04 3,1 3,04 P(2,9 U 3,1) P P 3,5 W 1,5 (1,5) (3,5) 0,04 0,04 0,04 0,933195 0,000233 0,93296 . Prawdopodobieństwo wyprodukowania braku będzie wynosić p 1 0,93296 0,06704 6,7% W punkcie b) przy zmianie wartości oczekiwanej wykres funkcji gęstości tylko przesuwa się wzdłuż osi OX . Najmniejsze prawdopodobieństwo wyprodukowania detalu nie zgodnie z normą będzie wtedy, gdy pole nad przedziałem <2,9 ; 3,1> i do wykresu funkcji gęstości będzie największe . Ze względu na symetryczność funkcji gęstości względem prostej x m pole będzie największe gdy wartość oczekiwana będzie w środku przedziału tzn. gdy m 3 . Wtedy automat tokarski będzie produkował nity zgodnie z normą z prawdopodobieństwem P(2,9 U 3,1) ? gdzie U ~ N (3 ; 0,04) 2,9 3 U 3 3,1 3 P(2,9 U 3,1) P P(2,5 W 2,5) (2,5) (2,5) 0,04 0,04 0,04 0,99379 0,006209 0,987581 Prawdopodobieństwo wyprodukowania braku będzie wynosić p 1 0,987581 0,0124 1,24% Większość modeli do estymacji i testowania hipotez przerobiliśmy, i wskazałem miejsce gdzie można znaleźć te modele, mając oficjalnie wydrukowaną ściągę. Większość wykorzystywanych tam własności wyprowadziliśmy.