Zadania z teorii prawdopodobieństwa by NOWIESZ Pewien wyrób pakuje się w zestawach po 50 sztuk. Prawdopodobieństwo wystąpienia w opakowaniu sztuk wadliwych wynosi: 0 sztuk – 0.5, 1 szt. – 0.3, 2 szt. – 0.2, >2 szt. 0. Obliczyć prawdopodobieństwo wylosowania 10 sztuk bez wad. Niech A0, A1, A2 oznaczają odpowiednio zdarzenia: w zestawie mamy 0 sztuk wadliwych, 1 sztukę wadliwą, 2 sztuki wadliwe, ponad 2 sztuki wadliwe. Zgodnie z treścią zadania: P(A0) = 0.5 P(A1) = 0.3 P(A2) = 0.2 Niech zdarzenie Bj (j=1,...10) oznacza zdarzenie: trafiono sztukę bez wady przy j-tym losowaniu. Gdy wybieramy sztuki zwracając je to zdarzenia Bj są niezależne i są osiągane z tym samym prawdopodobieństwem – dotyczy to także prawdopodobieństw warunkowych: P(Bj|A0) = 1 P(Bj|A1) = 0.98 P(Bj|A2) = 0.96 Zdarzenia A0, A1, A2 tworzą podział przestrzeni zdarzeń elementarnych (czyli są rozłączne i ich suma daje całą przestrzeń), więc można skorzystać z twierdzenia o prawdop. całkowitym: P(Bj) = (i=1..3)P(Ai)*P(Bj|Ai) = 0.5*1 + 0.3*0.98 + 0.2*0.96 = 0.986 Jeżeli C będzie oznaczać zdarzenie; wylosowano 10 sztuk bez wad to: P(C) = P(B1B2...B10) =(z niezależności) P(B1)*P(B2)*...*P(B10) = P(Bj)10 = 0.98610 86.85% Wiadomo, że 96% produkcji pewnego wyrobu spełnia wymagania normy. Stosując uproszczoną kontrolę wyboru sztukę uznaje się za prawidłową gdy spełnia normy z prawdopodobieństwem 0.98 i nie prawidłową gdy spełnia normy z prawdopodobieństwem 0.05. Obliczyć prawdopodobieństwo, że sztuka uznana za prawidłową spełnia wymagania normy oraz że sztuka uznana za nieprawidłową tych wymagań nie spełnia. NIE WIEM CZY DOBRZE ZINTERPRETOWALEM ZDANIE !!!!! Zdarzenia: A – produkt spełnia normy P(A) = 0.96 A’ – produkt nie spełnia norm P(A’) = 1-P(A) = 0.04 B – produkt uznany za prawidłowy B’ – produkt uznano za nieprawidłowy B|A – produkt spełniający normy został uznany za prawidłowy P(B|A) = 0.98 B|A’ – produkt nie spełniający norm został uznany za prawidłowy P(B|A’) = 0.05 A|B – produkt uznany za prawidłowy spełnia normy P(A|B) = ? A’|B’ – produkt uznany za nieprawidłowy nie spełnia norm P(A’|B’) = ? Z twierdzenia o prawdopodobieństwie całkowitym mamy: P(B) = P(A)*P(B|A)+P(A’)*P(B|A’) = 0.9428 P(B’) = 1-P(B) = 0.0572 Z twierdzenia Bayesa mamy: P(A|B) = Error! = Error! 0.9979 P(A’|B’) = Error! = Error! = Error! 0.6643 Wykreślić dystrybuantę zmiennej losowej opisującą rzut sześcienny kostką Oczywiście bierzemy najprostszą zmienną losową opisującą rzut ostką. X(„wyrzucono i”)=i. Wszystkie możliwości zachodzą z równym prawdopodobieństwem pi=1/6. Zatem dystrybuanta wygląda następująco (rysunek nie mów, więc dlatego taki brzydki): W wyniku długotrwałych obserwacji znana jest wariancja pomiarów pewnej wielkości 2=0.02. Ilu trzeba dokonać pomiarów tej wielkości, aby z prawdopodobieństwem 0.99 średnia arytmetyczna otrzymanych wyników różniła się od wartości średniej o 0.1? UWGA !!! ZMIANA ROZWIĄZANIA !!! Mamy nierówność Czebyszewa, która mówi że dla każdego >0 P(|X-m|)Error!. Tutaj naszą zmienną losową jest Mn, której wartość średnia jest równa m, a jej wariancja Mn2=2/n. Mamy zatem: P(|Mn-m|0.1) Error! P(|Mn-m|0.1) 1-Error! Musimy dobrać tak liczbę pomiarów n, żeby prawdopodobieństwo było co najmniej 0.99, co na pewno zachodzi gdy: 1-Error! 0.99 Error! 0.01 n Error! n 200 To znaczy, że musimy dokonać co najmniej 200 pomiarów, żeby uzyskać żądaną dokładność. Rozpatrzmy dwukrotnie rzut monetą. Niech zmienna losowa X charakteryzuje rzut pierwszy, a zmienna losowa Y charakteryzuje rzut drugi. Sprawdzić czy te zmienne losowe są niezależne. Mamy dwie zmienne losowe X i Y. Niech X(„Orzeł”)=Y(„Orzeł”)=1 i X(„Reszka”)=Y(„Reszka”)=1. Z natury rzutu monetą prawdopodobieństwo pojawienia się każdego ze zdarzeń dla pojedynczego rzutu jest równe i wynosi 0.5. Czyli P(X=0)=P(X=1)=P(Y=0)=P(Y=1)=0.5. Dla łącznej zmiennej losowej (X,Y) prawdopodobieństwo wypadnięcia każdego z czterech zdarzeń także jest równe i wynosi 0.25. Czyli P(X=0,Y=0)=P(X=1,Y=0)=P(X=0,Y=1)=P(X=1,Y=1)=0.25. P({: X()=0}{: Y()=0}) = P(X=0,Y=0) = 0.25 = 0.5*0.5 = P(X=0)*P(Y=0) = = P{: X()=0}*P{: Y()=0} Czyli widać spełniona jest definicja niezależności, co można też wykazać dla wszystkich innych zbiorów, więc zmienne losowe są niezależne. Niech (X,Y) będzie zmienną losową o łącznej funkcji gęstości f(x,y)=0.5*sin(x+y), 0x,y Error!. Wyznaczyć E(X), E(Y) oraz macierz korelacyjną. Jako, że funkcja gęstości przyjmuje jakieś wartości w przedziale od 0 do Error! (w pozostałych miejscach osiąga zapewne wartość 0), to wszelkie całki obliczane w tym właśnie przedziale, a nie - do , jak to zazwyczaj bywa. E(X) = (0;/2)(0;/2)x*0.5*sin(x+y) dy dx = 0.5*(0;/2)x*(0;/2)sin(x+y) dy dx = = 0.5*(0;/2)x*[-cos(x+y)]y(0;/2) dx = 0.5*(0;/2)x*[-cos(x+Error!)+cos(x)] dx = = {przez części: u=x; v’=-cos(x+/2)+cos(x) u’=1; v=-sin(x+/2)+sin(x)} = = 0.5*{[x*(-sin(x+Error!)+sin(x))]x(0;/2) - (0;/2)[-sin(x+Error!)+sin(x)] dx} = = 0.5*{[x*(-sin(x+Error!)+sin(x))]x(0;/2) - [cos(x+Error!)-cos(x)]x(0;/2)} = = 0.5*(Error! - 0) = Error! Jako, że funkcja gęstości jest symetryczna i do tego można sobie całki miejscami przestawiać to E(X)=E(Y). Jeśli chodzi o macierz korelacyjną to trzeba obliczyć jej elementy: K11 = E(X-E(X))2 = (0;/2)*(0;/2)(x-Error!)2*0.5*sin(x+y) dy dx K22 = E(Y-E(Y))2 = (0;/2)*(0;/2)(y-Error!)2*0.5*sin(x+y) dy dx Przy czym z symetrii funkcji gęstości K11=K22. K12 = K21 = E[(X-E(X))*(Y-E(Y))] = (0;/2)*(0;/2)(x-Error!)*(y-Error!)*0.5*sin(x+y) dy dx Pozwolicie jednak, że sobie to odpuszczę. Partia elementów elektronicznych zawiera 3% braków. Z partii tej losujemy próbę liczącą 100 sztuk. Obliczyć prawdopodobieństwo, że w próbie tej będzie 0, 5, 10 braków. Jeżeli do próby będziemy brać elementy i je zwracać to wynik kolejnych losowań jest całkowicie niezależny od wyników poprzednich losowań i prawdopodobieństwo trafienia na brak jest zawsze takie samo. Zatem zmienna losowa charakteryzująca liczbę braków w wylosowanej próbie ma rozkład dwumianowy (Bernoulliego). P(X=k) = (nk)*pk*qn-k W naszym przypadku n=100, p=0.03, q=0.97 i mamy zbadać prawdopodobieństwo dla k=0, 5, 10. P(X=0) = (1000)*0.030*0.97100 4.76% P(X=5) = (1005)*0.035*0.9795 10.13% P(X=10) = (10010)*0.0310*0.9790 0.07% W pewnym urządzeniu trzeba przeciętnie 7 razy w roku (~7000h pracy) wymieniać pewien podzespół. Zakładając, że liczba wymian tego podzespołu w danym okresie ma rozkład Poissona, wyliczyć prawdopodobieństwo tego, że konieczność wymiany podzespołu wstąpi po 10, 100 i 1000 godzinach pracy. Mamy tu do czynienia z procesem losowym X(t). Dla pewnego konkretnego t zmienna losowa X(t) ma rozkład Poissona, czyli: P(X(t)=k) = Error!*e- Wiedząc E(X(t))= i znając wartość średnią z warunków zadania jesteśmy w stanie wyliczyć sobie w każdej chwili t. Wiemy, że dla 1000 godzin wymienia się średnio jeden raz (bo co 7000 7), co 100 – 0.1, co 10 – 0.01. Zatem: 1000 = E(X(1000))= 1 100 = E(X(1000))= 0.1 10 = E(X(1000))= 0.01 Policzmy sobie, prawdopodobieństwo niezawodności w danym czasie i weźmy dopełnienie: 1-P(X(1000)=0) = 1 - Error!*e-1 63.21% 1-P(X(100)=0) = 1 - Error!*e-0.1 9.52% 1-P(X(10)=0) = 1 - Error!*e-0.01 1% Długość pewnego detalu produkowanego w pewnym automacie jest zmienną losową o rozkładzie N(20,0.2) Jaki % tego detalu będzie miał długość zawartą między 19.9 i 20.3? Zmienna losowa X charakteryzująca długość ma rozkład normalny – N(20,0.2). Wprowadźmy sobie zmienną losową Y=Error!, która ma rozkład N(0,1) i niech F(y) będzie dystrybuantą tej zmiennej – jej wartości można odczytać z tablic. P(X20.3) = P(YError!) = P(Y1.5) = F(1.5) P(X<19.9) = P(Y<Error!) = P(Y<-0.5) = 1-P(Y-0.5) Tak się szczęśliwie składa, że funkcja gęstości rozkładu N(0,1) jest symetryczna względem osi OY, zatem prawdopodobieństwo, że zmienna losowa wpadnie w obszar powyżej -0.5 jest identyczne z prawdopodobieństwem, że zmienna wpadnie w obszar poniżej 0.5, co znaczy, że P(Y-0.5)=P(Y0.5). P(X<19.9) = 1-P(Y0.5) = 1-F(0.5) P(19.9X20.3) = P(X20.3)-P(X<19.9) = F(1.5)-[1-F(0.5)] = F(1.5)+F(0.5)-1 Wartości F(1.5) i F(0.5) można odczytać z tablic. Nie dysonuję tablicami, w których jest dokładnie F(1.5), ale w przybliżeniu wychodzi to około 60%. Z populacji generalnej o wartości średniej m=5000 i odchyleniu standardowym =50 obrano próbę 30-elementową, z której wyznaczono średnią arytmetyczną. Z jakim prawdopodobieństwem średnia ta będzie należała do przedziału: - <5050;5100>, - <4900;5100>? Jako, że próba jest duża (n=30) to rozkład cechy populacji generalnej można przybliżyć rozkładem normalnym. Zatem estymator Mn będzie mieć rozkład N(m,/n)=N(5000,50/30). Stwórzmy sobie zmienną Y=Error!, o dystrybuancie F(y), która ma rozkład N(0,1). P(Mn5100) = P(YError!) = P(Y2*30) = F(2*30) P(Mn<5050) = P(Y<Error!) = P(Y<30) = F(30) P(Mn<4900) = P(Y<Error!) = P(Y<-2*30) = F(-2*30) = 1-F(2*30) P(5050Mn5100) = P(Mn5100)-P(Mn<5050) = F(2*30)-F(30) P(4900Mn5100) = P(Mn5100)-P(Mn<4900) = F(2*30)-[1-F(2*30)] = 2*F(2*30)-1 Wartości F(30) i F(2*30) można odczytać z tablic rozkładu normalnego. OJ!! CHYBA COŚ SKOPAŁEM – NIE MA W TABLICACH TAK DUŻYCH WARTOŚCI. W populacji generalnej o nieznanym rozkładzie, =12, nie znamy m. Należy znaleźć przedział ufności, który z prawdopodobieństwem pk=0.95 pokryje nieznaną wartość m. Załóżmy, że w tym celu pobraliśmy próbę o liczności n=36 i wyznaczyliśmy z niej średnią arytmetyczną, która wynosi 120. Mamy do czynienia z dużą próbą (n=36), więc rozkład cechy populacji generalnej można przybliżyć przez rozkład normalny. Co za tym idzie estymator wartości średniej Mn ma także rozkład normalny N(m,/n) (u nas: N(m,2) – m jest nieznane). Weźmy sobie zmienną Y=Error! o rozkładzie N(0,1) i wyliczmy dla niej przedział ufności o zadanym prawdopodobieństwie pk. pk = P(-yYy) = 1-2*F(y) F(y) = Error! = 0.975 Teraz wystarczy w tablicach rozkładu normalnego znaleźć takie y, że F(y)=0.975 – y1.96. pk = P(-yYy) = P(-yError!y) = P(-y*/nMn-my*/n) = = P(-y*/n+Mnmy*/n+Mn) Więc widzimy, że m<-y*/n+Mn ; y*/n+Mn>. Znamy i n. Mamy także daną realizację Mn (wiemy, że średnia arytmetyczna próby jest równa 120). Dodatkowo mamy wyliczone y. Czyli przedział ufności parametru m dla poziomu ufności 0.95 to <116.08;123.92>. Cecha X populacji generalnej ma rozkład normalny. Pobrano z niej próbę n=10 elementową, z której wyznaczono średnią arytmetyczną =24 oraz n’=2.7. Wyznaczyć przedział ufności dla estymatora Mn dla pk=0.98. Tym razem nie znamy odchylenia standardowego dla cechy populacji generalnej i to też musimy estymować. Więc weźmy sobie zmienną T=Error!, o rozkładzie T-Studenta o n-1=9 stopniach swobody. pk = P(-tTt) = P(|T|t) = 1-P(|T|t) P(|T|t) = 1-pk P(|T|t) = 0.02 Teraz wystarczy w tablicach rozkładu T-Studenta (o 9 stopniach swobody) znaleźć takie t, że P(|T|t)=0.02 – t2.821. pk = P(-tTt) = P(-tError!t) = P(-t*Sn’/nMn-mt*Sn’/n) = = P(-t*Sn’/n+Mnmt*Sn’/n+Mn) Więc widzimy, że m<-t*Sn’/n+Mn ; t*Sn’/n+Mn>. Znamy n. Mamy także daną realizację Mn (średnia arytmetyczna równa 24) oraz Sn’ (odchylenie standardowe n’=2.7). Dodatkowo mamy wyliczone t. Więc jesteśmy w stanie wyliczyć przedział ufności: <21.591;26.49>. Cecha X populacji generalnej ma rozkład normalny. Pobrano z niej próbę 20elementową, z której wyliczono n2’=0.015. Wyznaczyć przedział ufności dla estymatora Sn2’ przy poziomie ufności pk=0.90. Tym razem musimy znaleźć przedział ufności dla wariancji 2 populacji generalnej. Służy do tego zmienna losowa 2=Error! o rozkładzie 2 o n-1 stopniach swobody (chi-kwadrat). Jej rozkład niestety nie jest symetryczny, więc trzeba znaleźć odrębnie oba końce przedziału. Zakładając, że pk=1-, szukamy takich c1<c2, że P(2c1)=/2 (czyli P(2c1)=1-/2) oraz P(2c2)=/2, co musimy znaleźć z tablic rozkładu chi-kwadrat o 19 stopniach swobody. pk = P(c12c2) = P(c1Error!c2) = P(Error!2Error!) Więc widzimy, że 2<Error! ; Error!>. Znamy n. Mamy także dane n2’=0.015, które jest realizacją Sn2’ dla badanej próby. Natomiast c1 i c2 można sobie wyliczyć.