Dowody twierdzeń z teorii prawdopodobieństwa

advertisement
Zadania z teorii prawdopodobieństwa
by NOWIESZ
Pewien wyrób pakuje się w zestawach po 50 sztuk. Prawdopodobieństwo wystąpienia w
opakowaniu sztuk wadliwych wynosi: 0 sztuk – 0.5, 1 szt. – 0.3, 2 szt. – 0.2, >2 szt. 0.
Obliczyć prawdopodobieństwo wylosowania 10 sztuk bez wad.
Niech A0, A1, A2 oznaczają odpowiednio zdarzenia: w zestawie mamy 0 sztuk wadliwych, 1
sztukę wadliwą, 2 sztuki wadliwe, ponad 2 sztuki wadliwe. Zgodnie z treścią zadania:
P(A0) = 0.5
P(A1) = 0.3
P(A2) = 0.2
Niech zdarzenie Bj (j=1,...10) oznacza zdarzenie: trafiono sztukę bez wady przy j-tym
losowaniu.
Gdy wybieramy sztuki zwracając je to zdarzenia Bj są niezależne i są osiągane z tym samym
prawdopodobieństwem – dotyczy to także prawdopodobieństw warunkowych:
P(Bj|A0) = 1
P(Bj|A1) = 0.98
P(Bj|A2) = 0.96
Zdarzenia A0, A1, A2 tworzą podział przestrzeni zdarzeń elementarnych (czyli są rozłączne i
ich suma daje całą przestrzeń), więc można skorzystać z twierdzenia o prawdop. całkowitym:
P(Bj) = (i=1..3)P(Ai)*P(Bj|Ai) = 0.5*1 + 0.3*0.98 + 0.2*0.96 = 0.986
Jeżeli C będzie oznaczać zdarzenie; wylosowano 10 sztuk bez wad to:
P(C) = P(B1B2...B10) =(z niezależności) P(B1)*P(B2)*...*P(B10) = P(Bj)10 = 0.98610  86.85%
Wiadomo, że 96% produkcji pewnego wyrobu spełnia wymagania normy. Stosując
uproszczoną kontrolę wyboru sztukę uznaje się za prawidłową gdy spełnia normy z
prawdopodobieństwem 0.98 i nie prawidłową gdy spełnia normy z
prawdopodobieństwem 0.05. Obliczyć prawdopodobieństwo, że sztuka uznana za
prawidłową spełnia wymagania normy oraz że sztuka uznana za nieprawidłową tych
wymagań nie spełnia.
NIE WIEM CZY DOBRZE ZINTERPRETOWALEM ZDANIE !!!!!
Zdarzenia:
A – produkt spełnia normy
P(A) = 0.96
A’ – produkt nie spełnia norm
P(A’) = 1-P(A) = 0.04
B – produkt uznany za prawidłowy
B’ – produkt uznano za nieprawidłowy
B|A – produkt spełniający normy został uznany za prawidłowy
P(B|A) = 0.98
B|A’ – produkt nie spełniający norm został uznany za prawidłowy
P(B|A’) = 0.05
A|B – produkt uznany za prawidłowy spełnia normy
P(A|B) = ?
A’|B’ – produkt uznany za nieprawidłowy nie spełnia norm
P(A’|B’) = ?
Z twierdzenia o prawdopodobieństwie całkowitym mamy:
P(B) = P(A)*P(B|A)+P(A’)*P(B|A’) = 0.9428
P(B’) = 1-P(B) = 0.0572
Z twierdzenia Bayesa mamy:
P(A|B) = Error! = Error!  0.9979
P(A’|B’) = Error! = Error! = Error!  0.6643
Wykreślić dystrybuantę zmiennej losowej opisującą rzut sześcienny kostką
Oczywiście bierzemy najprostszą zmienną losową opisującą rzut ostką. X(„wyrzucono i”)=i.
Wszystkie możliwości zachodzą z równym prawdopodobieństwem pi=1/6.
Zatem dystrybuanta wygląda następująco (rysunek nie mów, więc dlatego taki brzydki):
W wyniku długotrwałych obserwacji znana jest wariancja pomiarów pewnej wielkości
2=0.02. Ilu trzeba dokonać pomiarów tej wielkości, aby z prawdopodobieństwem 0.99
średnia arytmetyczna otrzymanych wyników różniła się od wartości średniej o 0.1?
UWGA !!! ZMIANA ROZWIĄZANIA !!!
Mamy nierówność Czebyszewa, która mówi że dla każdego >0 P(|X-m|)Error!. Tutaj
naszą zmienną losową jest Mn, której wartość średnia jest równa m, a jej wariancja Mn2=2/n.
Mamy zatem:
P(|Mn-m|0.1)  Error!
P(|Mn-m|0.1)  1-Error!
Musimy dobrać tak liczbę pomiarów n, żeby prawdopodobieństwo było co najmniej 0.99, co
na pewno zachodzi gdy:
1-Error!  0.99
Error!  0.01
n  Error!
n  200
To znaczy, że musimy dokonać co najmniej 200 pomiarów, żeby uzyskać żądaną dokładność.
Rozpatrzmy dwukrotnie rzut monetą. Niech zmienna losowa X charakteryzuje rzut
pierwszy, a zmienna losowa Y charakteryzuje rzut drugi. Sprawdzić czy te zmienne
losowe są niezależne.
Mamy dwie zmienne losowe X i Y. Niech X(„Orzeł”)=Y(„Orzeł”)=1 i
X(„Reszka”)=Y(„Reszka”)=1. Z natury rzutu monetą prawdopodobieństwo pojawienia się
każdego ze zdarzeń dla pojedynczego rzutu jest równe i wynosi 0.5. Czyli
P(X=0)=P(X=1)=P(Y=0)=P(Y=1)=0.5.
Dla
łącznej
zmiennej
losowej
(X,Y)
prawdopodobieństwo wypadnięcia każdego z czterech zdarzeń także jest równe i wynosi 0.25.
Czyli P(X=0,Y=0)=P(X=1,Y=0)=P(X=0,Y=1)=P(X=1,Y=1)=0.25.
P({: X()=0}{: Y()=0}) = P(X=0,Y=0) = 0.25 = 0.5*0.5 = P(X=0)*P(Y=0) =
= P{: X()=0}*P{: Y()=0}
Czyli widać spełniona jest definicja niezależności, co można też wykazać dla wszystkich
innych zbiorów, więc zmienne losowe są niezależne.
Niech (X,Y) będzie zmienną losową o łącznej funkcji gęstości f(x,y)=0.5*sin(x+y), 0x,y
Error!. Wyznaczyć E(X), E(Y) oraz macierz korelacyjną.
Jako, że funkcja gęstości przyjmuje jakieś wartości w przedziale od 0 do Error! (w
pozostałych miejscach osiąga zapewne wartość 0), to wszelkie całki obliczane w tym właśnie
przedziale, a nie - do , jak to zazwyczaj bywa.
E(X) = (0;/2)(0;/2)x*0.5*sin(x+y) dy dx = 0.5*(0;/2)x*(0;/2)sin(x+y) dy dx =
= 0.5*(0;/2)x*[-cos(x+y)]y(0;/2) dx = 0.5*(0;/2)x*[-cos(x+Error!)+cos(x)] dx =
= {przez części: u=x; v’=-cos(x+/2)+cos(x)  u’=1; v=-sin(x+/2)+sin(x)} =
= 0.5*{[x*(-sin(x+Error!)+sin(x))]x(0;/2) - (0;/2)[-sin(x+Error!)+sin(x)] dx} =
= 0.5*{[x*(-sin(x+Error!)+sin(x))]x(0;/2) - [cos(x+Error!)-cos(x)]x(0;/2)} =
= 0.5*(Error! - 0) = Error!
Jako, że funkcja gęstości jest symetryczna i do tego można sobie całki miejscami przestawiać
to E(X)=E(Y).
Jeśli chodzi o macierz korelacyjną to trzeba obliczyć jej elementy:
K11 = E(X-E(X))2 = (0;/2)*(0;/2)(x-Error!)2*0.5*sin(x+y) dy dx
K22 = E(Y-E(Y))2 = (0;/2)*(0;/2)(y-Error!)2*0.5*sin(x+y) dy dx
Przy czym z symetrii funkcji gęstości K11=K22.
K12 = K21 = E[(X-E(X))*(Y-E(Y))] = (0;/2)*(0;/2)(x-Error!)*(y-Error!)*0.5*sin(x+y) dy dx
Pozwolicie jednak, że sobie to odpuszczę.
Partia elementów elektronicznych zawiera 3% braków. Z partii tej losujemy próbę
liczącą 100 sztuk. Obliczyć prawdopodobieństwo, że w próbie tej będzie 0, 5, 10 braków.
Jeżeli do próby będziemy brać elementy i je zwracać to wynik kolejnych losowań jest
całkowicie niezależny od wyników poprzednich losowań i prawdopodobieństwo trafienia na
brak jest zawsze takie samo. Zatem zmienna losowa charakteryzująca liczbę braków w
wylosowanej próbie ma rozkład dwumianowy (Bernoulliego).
P(X=k) = (nk)*pk*qn-k
W naszym przypadku n=100, p=0.03, q=0.97 i mamy zbadać prawdopodobieństwo dla k=0,
5, 10.
P(X=0) = (1000)*0.030*0.97100  4.76%
P(X=5) = (1005)*0.035*0.9795  10.13%
P(X=10) = (10010)*0.0310*0.9790  0.07%
W pewnym urządzeniu trzeba przeciętnie 7 razy w roku (~7000h pracy) wymieniać
pewien podzespół. Zakładając, że liczba wymian tego podzespołu w danym okresie ma
rozkład Poissona, wyliczyć prawdopodobieństwo tego, że konieczność wymiany
podzespołu wstąpi po 10, 100 i 1000 godzinach pracy.
Mamy tu do czynienia z procesem losowym X(t). Dla pewnego konkretnego t zmienna losowa
X(t) ma rozkład Poissona, czyli:
P(X(t)=k) = Error!*e-
Wiedząc E(X(t))= i znając wartość średnią z warunków zadania jesteśmy w stanie wyliczyć
sobie  w każdej chwili t.
Wiemy, że dla 1000 godzin wymienia się średnio jeden raz (bo co 7000 7), co 100 – 0.1, co
10 – 0.01. Zatem:
1000 = E(X(1000))= 1
100 = E(X(1000))= 0.1
10 = E(X(1000))= 0.01
Policzmy sobie, prawdopodobieństwo niezawodności w danym czasie i weźmy dopełnienie:
1-P(X(1000)=0) = 1 - Error!*e-1  63.21%
1-P(X(100)=0) = 1 - Error!*e-0.1  9.52%
1-P(X(10)=0) = 1 - Error!*e-0.01  1%
Długość pewnego detalu produkowanego w pewnym automacie jest zmienną losową o
rozkładzie N(20,0.2) Jaki % tego detalu będzie miał długość zawartą między 19.9 i 20.3?
Zmienna losowa X charakteryzująca długość ma rozkład normalny – N(20,0.2). Wprowadźmy
sobie zmienną losową Y=Error!, która ma rozkład N(0,1) i niech F(y) będzie dystrybuantą tej
zmiennej – jej wartości można odczytać z tablic.
P(X20.3) = P(YError!) = P(Y1.5) = F(1.5)
P(X<19.9) = P(Y<Error!) = P(Y<-0.5) = 1-P(Y-0.5)
Tak się szczęśliwie składa, że funkcja gęstości rozkładu N(0,1) jest symetryczna względem
osi OY, zatem prawdopodobieństwo, że zmienna losowa wpadnie w obszar powyżej -0.5 jest
identyczne z prawdopodobieństwem, że zmienna wpadnie w obszar poniżej 0.5, co znaczy, że
P(Y-0.5)=P(Y0.5).
P(X<19.9) = 1-P(Y0.5) = 1-F(0.5)
P(19.9X20.3) = P(X20.3)-P(X<19.9) = F(1.5)-[1-F(0.5)] = F(1.5)+F(0.5)-1
Wartości F(1.5) i F(0.5) można odczytać z tablic. Nie dysonuję tablicami, w których jest
dokładnie F(1.5), ale w przybliżeniu wychodzi to około 60%.
Z populacji generalnej o wartości średniej m=5000 i odchyleniu standardowym =50
obrano próbę 30-elementową, z której wyznaczono średnią arytmetyczną. Z jakim
prawdopodobieństwem średnia ta będzie należała do przedziału:
- <5050;5100>,
- <4900;5100>?
Jako, że próba jest duża (n=30) to rozkład cechy populacji generalnej można przybliżyć
rozkładem
normalnym.
Zatem
estymator
Mn
będzie
mieć
rozkład
N(m,/n)=N(5000,50/30).
Stwórzmy sobie zmienną Y=Error!, o dystrybuancie F(y), która ma rozkład N(0,1).
P(Mn5100) = P(YError!) = P(Y2*30) = F(2*30)
P(Mn<5050) = P(Y<Error!) = P(Y<30) = F(30)
P(Mn<4900) = P(Y<Error!) = P(Y<-2*30) = F(-2*30) = 1-F(2*30)
P(5050Mn5100) = P(Mn5100)-P(Mn<5050) = F(2*30)-F(30)
P(4900Mn5100) = P(Mn5100)-P(Mn<4900) = F(2*30)-[1-F(2*30)] = 2*F(2*30)-1
Wartości F(30) i F(2*30) można odczytać z tablic rozkładu normalnego.
OJ!! CHYBA COŚ SKOPAŁEM – NIE MA W TABLICACH TAK DUŻYCH WARTOŚCI.
W populacji generalnej o nieznanym rozkładzie, =12, nie znamy m. Należy znaleźć
przedział ufności, który z prawdopodobieństwem pk=0.95 pokryje nieznaną wartość m.
Załóżmy, że w tym celu pobraliśmy próbę o liczności n=36 i wyznaczyliśmy z niej
średnią arytmetyczną, która wynosi 120.
Mamy do czynienia z dużą próbą (n=36), więc rozkład cechy populacji generalnej można
przybliżyć przez rozkład normalny. Co za tym idzie estymator wartości średniej Mn ma także
rozkład normalny N(m,/n) (u nas: N(m,2) – m jest nieznane).
Weźmy sobie zmienną Y=Error! o rozkładzie N(0,1) i wyliczmy dla niej przedział ufności o
zadanym prawdopodobieństwie pk.
pk = P(-yYy) = 1-2*F(y)
F(y) = Error! = 0.975
Teraz wystarczy w tablicach rozkładu normalnego znaleźć takie y, że F(y)=0.975 – y1.96.
pk = P(-yYy) = P(-yError!y) = P(-y*/nMn-my*/n) =
= P(-y*/n+Mnmy*/n+Mn)
Więc widzimy, że m<-y*/n+Mn ; y*/n+Mn>. Znamy  i n. Mamy także daną
realizację Mn (wiemy, że średnia arytmetyczna próby jest równa 120). Dodatkowo mamy
wyliczone y.
Czyli przedział ufności parametru m dla poziomu ufności 0.95 to <116.08;123.92>.
Cecha X populacji generalnej ma rozkład normalny. Pobrano z niej próbę n=10
elementową, z której wyznaczono średnią arytmetyczną =24 oraz n’=2.7. Wyznaczyć
przedział ufności dla estymatora Mn dla pk=0.98.
Tym razem nie znamy odchylenia standardowego dla cechy populacji generalnej i to też
musimy estymować. Więc weźmy sobie zmienną T=Error!, o rozkładzie T-Studenta o n-1=9
stopniach swobody.
pk = P(-tTt) = P(|T|t) = 1-P(|T|t)
P(|T|t) = 1-pk
P(|T|t) = 0.02
Teraz wystarczy w tablicach rozkładu T-Studenta (o 9 stopniach swobody) znaleźć takie t, że
P(|T|t)=0.02 – t2.821.
pk = P(-tTt) = P(-tError!t) = P(-t*Sn’/nMn-mt*Sn’/n) =
= P(-t*Sn’/n+Mnmt*Sn’/n+Mn)
Więc widzimy, że m<-t*Sn’/n+Mn ; t*Sn’/n+Mn>. Znamy n. Mamy także daną realizację
Mn (średnia arytmetyczna równa 24) oraz Sn’ (odchylenie standardowe n’=2.7). Dodatkowo
mamy wyliczone t. Więc jesteśmy w stanie wyliczyć przedział ufności: <21.591;26.49>.
Cecha X populacji generalnej ma rozkład normalny. Pobrano z niej próbę 20elementową, z której wyliczono n2’=0.015. Wyznaczyć przedział ufności dla estymatora
Sn2’ przy poziomie ufności pk=0.90.
Tym razem musimy znaleźć przedział ufności dla wariancji 2 populacji generalnej. Służy do
tego zmienna losowa 2=Error! o rozkładzie 2 o n-1 stopniach swobody (chi-kwadrat). Jej
rozkład niestety nie jest symetryczny, więc trzeba znaleźć odrębnie oba końce przedziału.
Zakładając, że pk=1-, szukamy takich c1<c2, że P(2c1)=/2 (czyli P(2c1)=1-/2) oraz
P(2c2)=/2, co musimy znaleźć z tablic rozkładu chi-kwadrat o 19 stopniach swobody.
pk = P(c12c2) = P(c1Error!c2) = P(Error!2Error!)
Więc widzimy, że 2<Error! ; Error!>. Znamy n. Mamy także dane n2’=0.015, które jest
realizacją Sn2’ dla badanej próby. Natomiast c1 i c2 można sobie wyliczyć.
Download