Zadanie na rozkład

advertisement
Zad 1.
W kolejnych 5-ciu urnach wyciągniemy kulę białą z prawdopodobieństwem odpowiednio –
0,3 ; 0,4 ; 0,5 ; 0,6 ; 0,7. Jakie jest prawdopodobieństwo, że wyciągniemy:
a). 4 kule białe
b). przynajmniej jedną kulę białą.
Zad 2.
Automat tokarski produkuje nity, których średnica ma rozkład normalny z odchyleniem standardowym 0,04 mm.
Wartość oczekiwana może być regulowana przez odpowiednio ustawienie automatu. Nit spełnia normę jeżeli jego
średnica mieści się w przedziale < 2,9 mm , 3,1 mm >.
a). Jakie jest prawdopodobieństwo wyprodukowania braku, gdy automat ustawiono tak, że wartość oczekiwana
wynosi 3,04 mm.
b). Jak powinien być ustawiony automat, żeby prawdopodobieństwo wyprodukowania nitu nie zgodnie z normą
była najmniejsza.
Zad 3.
Rozkład prawdopodobieństwa zmiennej losowej X jest następujący:
xi
pi
0
0,1
2
0,4
4
0,2
6
0,3
a). Oblicz E(X), D2(X), D(X).
b). Podaj wartość P(X > 0)
Zad 4. Dla jakiej wartości c funkcja
c x dla 0  x  4
f ( x)  
dla pozostalych x
0
może być gęstością
prawdopodobieństwa zmiennej losowej X. Obliczyć:
a). Wartość oczekiwaną zmiennej losowej
b). Wyznaczyć dystrybuantę tej zmiennej.
c). P( 1<X < 3).
d). Wyznaczyć funkcję gęstości zmiennej losowej Y=X2.
Zad 5.
Na trasie samochodu znajdują się 5 sygnalizatory świetlne z których każdy z prawdopodobieństwem 0,5
przepuszcza lub zatrzymuje ruch. Znaleźć rozkład liczby sygnalizatorów, które minął samochód przed pierwszym
zatrzymaniem się. Tzn. wyznaczyć zmienną losową i jej wartość oczekiwaną przyjmująca wartości liczbę
sygnalizatorów przejechanych do momentu pierwszego zatrzymania się.
Zad 6. W celu oszacowania błędu standardowego pewnego przyrządu pomiarowego (odchylenia
standardowego tego przyrządu) dokonano 4 pomiarów pewnej wielkości i otrzymano wyniki:
8,2 ; 8,15 ; 8,05 ; 8,14 . Zakładając, że wskazania przyrządu mają rozkład normalny podać przedział
ufności dla błędu (odchylenia standardowego) na poziomie ufności 0,95.
Zad 7. Analizując wydajność pracy w pewnym zakładzie w czasie dnia po wprowadzeniu reorganizacji otrzymano
następujące wyniki:
Wykonano sztuk
140
150
160
170
180
liczba pracowników
5
10
15
10
5
Badając wydajność pracy przed reorganizacją na 70 pracownikach otrzymano, że średnia liczba zrobionych sztuk
wynosi 150 i odchylenie standardowe 12 sztuk.
a). Czy na poziomie istotności 0,05 można twierdzić, że reorganizacja zwiększyła wydajność pracy w zakładzie.
b). Na poziomie ufności 1- =0,95 oszacować metodą przedziałową wartość oczekiwaną liczby zrobionych sztuk
przez pracownika przed reorganizacją.
Ad 7a).
Niech X oznacza zmienną losową badanej cechy w pierwszej populacji. Próbę n - elementową
x1 , x2 , x3 ,...., xn będziemy traktować jaką realizację ciągu zmiennych losowych X 1 , X 2 , X 3 ,...., X n
gdzie zmienna losowa X i przyjmuje wartości – wartość i  tego pomiaru cechy w próbie i  1,2,..., n .
Dla różnych prób n - elementowych wartości są zazwyczaj różne. Ponieważ próba jest próbą losową
prostą / tzn. wybieramy elementy z populacji tak aby każdy element miał jednakowe
prawdopodobieństwo trafienia do próby/ i populacja jest duża /wtedy wylosowany element nie wpływa
na stan populacji / to zmienne losowe X 1 , X 2 , X 3 ,...., X n są niezależne i rozkład tych zmiennych jest
taki sam co rozkład zmiennej losowej X
co zapisujemy X ~ X i
i  1,2,....., n
Niech Y oznacza zmienną losową badanej cechy w drugiej populacji. Próbę k - elementową
y1 , y2 , y3 ,...., yk będziemy traktować jaką realizację ciągu zmiennych losowych Y1 , Y2 , Y3 ,...., Yk gdzie
zmienna losowa Yi przyjmuje wartości – wartość i  tego pomiaru cechy w próbie i  1,2,..., k . Z tych
samych powodów zmienne losowe Y1 , Y2 , Y3 ,...., Yk są niezależne i rozkład tych zmiennych jest taki sam
co rozkład zmiennej losowej Y , co zapisujemy Y ~ Yi
Niech mx  EX  E ( X )
my  EY  E(Y )
 x2  D 2 X  D 2 ( X ) .
 x2  D 2 ( X i )
Wtedy mx  EX i
i  1,2,....., n,... oraz jeżeli
 y2  D2Y  D2 (Y ) to wtedy
 y2  D 2 (Yi )
my  EYi
i  1,2,....., k
i  1,2,....., k ,...
1 n
1 k
X

Yi  X ( n )  Y( k )
n, k  N
 i k
n i 1
i 1
1 n
1 k
X ( n )   X i , Y( k )   Yi
n, k  N . mamy
zmiennych
n i 1
k i 1
1 n
1 k
1 n
1 k
EZ n ,k  E (  X i   Yi )   EX i   EYi  mx  m y
n, k  N
n i 1
k i 1
n i 1
k i 1
Dla ciągu zmiennych losowych Z n ,k 
D 2 Z n ,k  D 2 (
1 n
1 k
1
X

Yi )  2


i
n i 1
k i 1
n
n
 D2 X i 
i 1
1
k2
k
 x2
i 1
n
 D 2Yi 

 y2
z niezależności również
n, k  N
k
Korzystaliśmy z podstawowych ogólnych wzorów i własności na obliczanie wartości oczekiwanej i wariancji.
Jest ten ciąg asymptotycznie normalny i standaryzacja dla dużych n i k (n,k>30) daje statystykę
Z  (mx  m y )
U n ,k  n ,k
~ N (0,1) w przybliżeniu normalną standaryzowaną.
 x2
n

 y2
k
Przy prawdziwości hipotezy zerowej
H o : m x  m y statystyka U n ,k 
X ( n )Y( k )
 x2
n

 y2
~ N (0,1)
k
Gdy zastąpimy wariancje teoretyczne wariancjami uzyskanymi w próbie uzyskamy również
U n ,k 
X ( n )Y( k )
2
x
S y2
S

n
k
~ N (0,1)
Liczba
pracowników
Wykonano sztuk
xi
składniki
ni
140
150
160
170
180
7200
 160
45
2
y  150
sy
x
składniki
( xi  x ) 2 ni
xi ni
5
700
2000
10
1500
1000
15
2400
0
10
1700
1000
5
900
2000
n =  = 45
 = 7200
 = 6000
6000
2
sx 
 133,33 s x  133,33  11,55
45
 12 2  144
k  70
160  150
 4,55
133,33 144

45
70
Aby odpowiedzieć na postawione pytanie bierzemy hipotezę alternatywną H 3 : mx  m y
u0 
Wartość statystyki
Związaną z testem prawostronnym, a obszarem krytycznym będzie obszar K  (u 2 ,  )
u 2  u0,1  1,645 czyli K  (1,645 ,  ) . Wartość statystyki należy do przedziału krytycznego tzn.
u0  4,55  K  1,645 ;   to oznacza, że w założeniach występuje nieprawda czyli hipoteza zerowa jest
fałszywa i jest prawdziwa hipoteza alternatywna z prawdopodobieństwem przynajmniej 0,95 . Może
zaistnieć błąd pierwszego rodzaju z prawdopodobieństwem 0,05, że hipoteza zerowa jest prawdziwa a
przyjęliśmy alternatywną.
Na podstawie tych danych twierdzimy, że reorganizacja wpływa na wydajność. Jest to zdanie prawdziwe z
prawdopodobieństwem przynajmniej 0,95.
Ad 7b).
Dla zmiennej Y( n )
1 n
  Yi
n i 1
EY( n )
1 n
  EYi  m y
n i 1
Z twierdzenia granicznego Lindeberga-Levy’ego
X n 
n1
Dla ciągu niezależnych zmiennych losowych
2
D Y( n )
1
 2
n
n
D Y
2
i 1
i

 y2
n
o jednakowym rozkładzie, o wartości przeciętnej

m i skończonej wariancji  2  0 ciąg Fn n1 dystrybuant standardowych średnich arytmetycznych X n albo
n
standardowych sum
X
k 1
i
n
Yn 
Xn  m


X
k 1
i
 nm
 n
n
Jest zbieżny do dystrybuanty  rozkładu N (0,1) .
Wynika, że zmienne losowa U n 
Y( n )  m y


Y( n )  m y

n ~ N (0,1) dla dużych n ma w przybliżeniu rozkład
n
normalny standaryzowany. Zastępując odchylenie teoretyczne odchyleniem uzyskanym w próbie uzyskamy
przedział ufności którego wzór wyprowadzaliśmy na ćwiczeniach
S
S
S
S
1    P(Y( n )  u
 m y  Y( n )  u
)  P(Y( n )  u
 m y  Y( n )  u
) Stąd
n
n
n
n
150  1,96
Stąd
12
70
 m  150  1,96
12
70
ponieważ
u  u 0, 05  1,96
z tablic rozkładu normalnego.
146,5  m  153,5 .
Ten przedział z prawdopodobieństwem 0,95 pokrywa teoretyczną wydajność pracy pracowników przed
reorganizacją.
Zad 2).
W punkcie a) należało wyznaczyć P(2,9  U  3,1)  ? gdzie
U ~ N (3,04 ; 0,04)
 2,9  3,04 U  3,04 3,1  3,04 
P(2,9  U  3,1)  P


  P 3,5  W  1,5  (1,5)  (3,5) 
0,04
0,04 
 0,04
0,933195  0,000233  0,93296 .
Prawdopodobieństwo wyprodukowania braku będzie wynosić p  1  0,93296  0,06704  6,7%
W punkcie b) przy zmianie wartości oczekiwanej wykres funkcji gęstości tylko przesuwa się wzdłuż osi OX .
Najmniejsze prawdopodobieństwo wyprodukowania detalu nie zgodnie z normą będzie wtedy, gdy pole nad
przedziałem <2,9 ; 3,1> i do wykresu funkcji gęstości będzie największe . Ze względu na symetryczność funkcji
gęstości względem prostej x  m pole będzie największe gdy wartość oczekiwana będzie w środku przedziału tzn.
gdy m  3 .
Wtedy automat tokarski będzie produkował nity zgodnie z normą z prawdopodobieństwem
P(2,9  U  3,1)  ? gdzie
U ~ N (3 ; 0,04)
 2,9  3 U  3 3,1  3 
P(2,9  U  3,1)  P


  P(2,5  W  2,5)  (2,5)  (2,5) 
0,04
0,04 
 0,04
0,99379  0,006209  0,987581
Prawdopodobieństwo wyprodukowania braku będzie wynosić p  1  0,987581  0,0124  1,24%
Większość modeli do estymacji i testowania hipotez przerobiliśmy, i wskazałem miejsce gdzie można znaleźć te
modele, mając oficjalnie wydrukowaną ściągę. Większość wykorzystywanych tam własności wyprowadziliśmy.
Download