Dr Maria Wieczorek Zmienne losowe. Rozkłady statystyk z próby. 1..Dana jest funkcja rozkładu prawdopodobieństwa zmiennej losowej X: xi -2 -1 1 3 pi 0,1 0,3 0,4 0,2 a) Określ rozkład zmiennej losowej Y=3X b) Wyznacz parametry (wartość oczekiwaną i odchylenie standardowe) rozkładu zmiennej Y 2. Łucznik oddaje do tarczy 5 strzałów. Prawdopodobieństwo chybienia w pojedynczym strzale wynosi 0,1. a) Obliczyć prawdopodobieństwo, że w serii 5 strzałów chybi tylko raz. b) Pozostałe wyniki prezentujemy poniżej: P(X=0) = 0,59049 P(X=2) = 0,0729 P(X=3) = 0,0081 P(X=4) = 0,00045 P(X=5) = 0,00001 Wyznaczyć dwoma sposobami wartość oczekiwaną liczby chybionych strzałów w serii pięciu strzałów do tarczy 3.Na 10 małżeństw w Zambii 7 jest nosicielem wirusa HIV. Wiedząc, że szansa przekazania przez rodziców wirusa dziecku wynosi 3:4, obliczyć prawdopodobieństwo, że w małżeństwie z czwórką dzieci: a) wszystkie dzieci będą zdrowe b) wszystkie dzieci będą zarażone wirusem HIV 4. Zużycie paliwa ( w l. na 100 km) w samochodzie SEAT ma rozkład normalny z parametrami 8 ; 1,2 . a) Obliczyć prawdopodobieństwo tego, że zużycie paliwa w losowo wybranym samochodzie przekroczy 7,6 l b) Podać interpretację graficzną wyniku z punktu a) na wykresie funkcji gęstości. c) Dla jakiej wielkości zużycia paliwa dystrybuanta w badanym rozkładzie przyjmuje wartość 0,75? Zinterpretować tę wielkość. 5. Czas spędzany dziennie przed ekranem TV przez osobę dorosłą jest zmienną losową o rozkładzie normalnym z wartością oczekiwaną 90 minut i odchyleniem standardowym równym 20 min. a) jakie jest prawdopodobieństwo, że losowo wybrana osoba spędza przed ekranem mniej niż 76 min? b) zaznaczyć wynik z p.a) na wykresie funkcji gęstości przed i po standaryzacji. 6. Czas przejazdu trasy slalomu (min) jest zmienną losową o rozkładzie N(1,5; 0,2) a) Jaki czas przejazdu miało 10 % najlepszych zawodników. b) Jakie jest prawdopodobieństwo, że odchylenie standardowe (nieobciążone) czasu wyznaczone dla 20 losowo wybranych zawodników nie przekroczy 0,239. 7.Czas oczekiwania na tramwaj linii 33 jest zmienną losową o rozkładzie normalnym z odchyleniem standardowym równym 1 min. a) ile wynosi przeciętny czas oczekiwania na tramwaj, jeśli 75.8% osób oczekujących na ten tramwaj czeka nie krócej niż 4 min? b) ile co najwyżej min czekają na tramwaj osoby należące do 10% osób oczekujących najkrócej 8.Poziom cholesterolu we krwi jest zmienną losową o rozkładzie N(200,30) a) Jaki odsetek ludzi ma poziom cholesterolu nie przekraczający 185? b) Zaznaczyć wynik z punktu a) na wykresie dystrybuanty c) Jaki poziom cholesterolu ma 15 % osób o najwyższym jego poziomie? 9. Czas przejazdu trasy slalomu jest zmienną losową o rozkładzie normalnym. Najwięcej zawodników przejeżdżało tę trasę w ciągu (około) 1,5 minuty, zaś 33 % zawodników jechało dłużej niż 1,588. Jaki czas przejazdu miało 10 % najgorszych zawodników ? 10. Zmienna losowa W ma rozkład normalny o wartości oczekiwanej 105 i wariancji 9. a) Oblicz, ile wynosi trzeci kwartyl w tym rozkładzie. b) Oblicz wartość oczekiwaną i wariancję zmiennej Z = 250 – 2W 11. Zmienne X1 i X2 są niezależnymi zmiennymi losowymi o rozkładach odpowiednio: N(20;3) i N(4;2). Należy obliczyć: a) wartość oczekiwaną, wariancję i współczynnik asymetrii zmiennej Y= X1-2X2, b) prawdopodobieństwo P(Y>9,6) i wynik przedstawić graficznie. 12.Zmienna losowa X ma rozkład N(5,2). a) Obliczyć prawdopodobieństwo, że zmienna X przyjmie wartości z przedziału (3;7) b) Obliczyć prawdopodobieństwo, że średnia z 16 elementowej próby będzie należała do przedziału (4,5; 5,5). Skomentuj relację między uzyskanymi wynikami 13.Miesięczne zużycie energii elekt.(kWh) w rodz. czteroosobowych ma rozkład N(300,100). a) Obliczyć prawdopodobieństwo zużycia ponad 450 kWh w miesiącu przez losowo wybraną rodzinę czteroosobową. b) Obliczyć prawdopodobieństwo, że wśród 25 losowo wybranych rodzin średnie zużycie energii będzie niższe niż 320 kWh. 14. Przypuszcza się , że czas eksploatacji komputerów (w latach) jest zmienną losową o rozkładzie normalnym N (6;1,2) a) Podać prawdopodobieństwo, że losowo wybrany komputer będzie eksploatowany krócej niż 5 lat i jeden kwartał. b) Zaznaczyć obliczone w p. a) prawdopodobieństwo na wykresie funkcji gęstości oraz dystrybuanty rozkładu normalnego. c) Jaki czas pracy ma 80 % komputerów najszybciej wycofanych z eksploatacji? d) Wiedząc, że komputery stoją w pracowniach po 16 sztuk, odpowiedzieć, jakie jest prawdopodobieństwo, że średni czas eksploatacji komputerów w losowo wybranej pracowni przekroczy 6,5 roku 15. Zmienne X1 i X2 mają rozkłady normalne odpowiednio: N(90,12) i N(30,8). Sprawdź, czy przy założeniu, że pobrane niezależnie próby losowe liczyły po 25 jednostek, zachodzi P(55 x1 x2 65) nierówność: 2 P( x1 90) 16.Przeciętne miesięczne wydatki na reklamę w małych firmach handlowych mają rozkład normalny o wartości oczekiwanej 300 zł i odchyleniu standardowym 60 zł. Odpowiednie wartości dla rozkładu wydatków na reklamę w zakładach usługowych wynoszą: 280 zł oraz 80 zł. a) oblicz prawdopodobieństwo, że średnie miesięczne wydatki na reklamę 36 losowo wybranych firm handlowych będą większe niż 310 zł i jednocześnie mniejsze niż 320 zł; b) oblicz prawdopodobieństwo, że średnie miesięczne wydatki na reklamę 36 losowo wybranych firm handlowych będą mniejsze od średnich miesięcznych wydatków na reklamę 64 losowo wybranych zakładów usługowych. 17. Miesięczne zużycie wody na osobę w m3 ma w pewnym osiedlu rozkład N (10; 4). W końcu 1997 roku dokonano generalnego remontu sieci wodno-kanalizacyjnej i zamontowano liczniki wody - ocenia się, że to zużycie ma teraz rozkład N(8;3). Obliczyć prawdopodobieństwo, że średnie zużycie 36 losowo wybranych osób zmniejszyło się w stosunku do średniego zużycia tych samych osób sprzed remontu co najmniej o 2,5 m3 . 18.Wskaźnik inteligencji osób kupujących płyty zespołu A ma rozkład normalny N(75, 10), zaś osób czytających tygodnik B rozkład N(70,15). Z pierwszej grupy wylosowano 50 osób, z drugiej 40. Ile wynosi prawdopodobieństwo, że średni iloraz inteligencji w pierwszej próbie okaże się większy o co najmniej 10 punktów od średniej obliczonej na podstawie drugiej próby. 19. Na podstawie danych o wysokości opłat ( €) za wizytę u lekarza internisty w krajach Unii Europejskiej ustalono, że rozkład opłat był zgodny z rozkładem normalnym o przeciętnej równej 33,68 €. a) Określ typ rozkładu średniej opłaty dla 9 losowo wybranych krajów, jeśli dodatkowo wiadomo, że w grupie tych krajów nieobciążone odchylenie standardowe wyniosło 23,10€. b) Oblicz P( x9 48) . Wynik zilustruj graficznie. 20.Trener ( a zarazem miłośnik statystyki) oświadczył trójskoczkowi, że pojedzie na olimpiadę do Pekinu, jeśli będzie skakał daleko i regularnie tzn. spełni dwa poniższe warunki: średni wynik wśród 25 losowo wybranych skoków w sezonie nie będzie niższy niż 16,32 m rozrzut wyników (mierzony odchyleniem standardowym) wśród losowo wybranych 25 skoków nie przekroczy 0,38 m. Który z warunków łatwiej będzie spełnić trójskoczkowi, jeśli rozkład jego wyników jest N(16,2 ; 0,5) 21.Pewien żłobek zakupił partię 900 opakowań mleka w proszku. Wkrótce okazało się, że w tym regionie 10 % opakowań mleka zakażonych jest gronkowcem. a) Jaki jest dokładny rozkład odsetka opakowań zakażonych gronkowcem w badanej partii mleka? b) Jaki jest graniczny rozkład badanej statystyki? c) Jakie jest prawdopodobieństwo, że odsetek zakażonych opakowań przekroczy w tej partii 12 %. Uzasadnić metodę rozwiązania. 22.Szacuje się, że 27% mieszkańców naszego kraju wyraziłoby zgodę na lokalizację dyskoteki w sąsiedztwie swego miejsca zamieszkania. a) Jaki rozkład ma odsetek wyrażających zgodę na dyskotekę w sąsiedztwie w grupie 400 osób? Odpowiedź uzasadnij, b) Jakie jest prawdopodobieństwo, że w grupie 400 osób mniej niż jedna czwarta zaakceptuje pomysł lokalizacji dyskoteki obok swego domu? 23. Szacuje się, że co czwarty mieszkaniec naszego kraju nie weźmie udziału w wyborach samorządowych. a) Oblicz prawdopodobieństwo, że w losowej, sondażowej próbie 300 osób, ponad 72 nie weźmie udziału w wyborach. b) Oblicz prawdopodobieństwo, że w losowej próbie 300 osób odsetek nie biorących udziału w wyborach przekroczy 24%. c) Czy wyniki uzyskane w a) i b) są zaskakujące – uzasadnij metodę rozwiązania. 24.W pewnym kraju dwaj kandydaci na prezydenta A i B cieszą się jednakowym, 50% poparciem wyborców. a) Jakie jest prawdopodobieństwo, że przedwyborczy sondaż przeprowadzony na 625 osobowej losowo dobranej próbie wyborców wskaże, że kandydat B ma poparcie wyższe niż 53 %? b) Jakie jest prawdopodobieństwo, że wśród 6 przypadkowych osób, zapytanych o zdanie przez dziennikarza TV, 5 osób będzie popierać kandydata B, a jedna kandydata A. 25. Na studiach dziennych 25% studentów wybiera specjalizację w zakresie zarządzania i marketingu, na studiach zaocznych tę samą specjalizację wybiera 20% studentów. Jakie jest prawdopodobieństwo, że w losowo wybranej próbie liczącej 200 studentów studiów dziennych udział wybierających badaną specjalizację będzie przynajmniej o 7% wyższy od udziału specjalizujących się w zarządzaniu i marketingu w grupie 150 studentów studiów zaocznych. 26.W rozgrywkach sportowych można zdobyć maksymalnie 50 punktów, przy czym rozkład liczby punktów zdobytych przez pojedynczego gracza ma wartość oczekiwaną 30 i odchylenie standardowe 5. a) Jakie jest prawdopodobieństwo, że drużyna licząca 30 graczy zdobędzie wspólnie ponad 1000 punktów? b) Jakie jest prawdopodobieństwo, że średnia liczba punktów zdobytych przez 30 graczy jest większa niż 32. 27. Zakład ubezpieczeń Poli S.A. zatrudnia 400 agentów (ubezpieczeniowych). Liczba klientów zdobywanych przez każdego z nich miesięcznie ma jednakowy rozkład z wartością oczekiwaną 50 klientów i wariancją 100 klientów2. Za każdego zdobytego klienta zakład wypłaca premię 25 zł. Obliczyć i zinterpretować prawdopodobieństwo, że w losowo wybranym miesiącu wartość wypłaconych premii przekroczy 525 tys. zł. 28. W Urzędzie ds. Walki z Biurokracją pracuje 900 osób. Każda z nich pisze średnio 40 notatek służbowych w miesiącu, przy wariancji 49 notatek2. Rozkład liczby notatek w miesiącu jest taki sam dla każdego pracownika. Za każdą notatkę pracownik płaci karę 10 zł. Obliczyć i zinterpretować prawdopodobieństwo, że w losowo wybranym miesiącu łączna wartość zapłaconych kar będzie mniejsza niż 347 400. 29. a)Wiadomo, że miesięczne wydatki na produkt S w rodzinach czteroosobowych mają rozkład N (300, 50). Podać, jaki rozkład będą miały średnie wydatki na ten produkt w 100 elementowej próbie rodzin. b) Wiadomo, że miesięczne wydatki na produkt T mają rozkład Weibulla z parametrami E(X)=300, D(X)=50. Podać i uzasadnić jaki rozkład będą miały średnie wydatki na ten produkt w 100 elementowej próbie rodzin. c) Czy prawdopodobieństwo, że średnie wydatki wyznaczone w oparciu o 100 elementową próbę przekroczą 295 zł i jednocześnie będą niższe niż 308 jest w przypadku obu produktów jednakowe. Oblicz to prawdopodobieństwo. 30. Liczba kroków wykonanych przez lunatyków w czasie snu w ciągu tygodnia ma rozkład Pareto z wartością oczekiwaną 350 i odchyleniem standardowym 73. Jaki rozkład ma średnia liczba kroków dla 300 lunatyków? 31. W ciągu dnia zespół sklepów warzywnych sprzedaje średnio towary za 6 000 zł, przy odchyleniu standardowym 750 zł. Obliczyć prawdopodobieństwo, że: a) Średnia wartość dziennych obrotów, zrealizowanych w ciągu 100 losowo wybranych dni, będzie zawierać się w przedziale od 5925 zł do 6075 zł b) Obroty osiągane w tym okresie przekroczą łącznie 590 000 zł. 32. Rozkład zmiennej losowej opisującej zysk z gry osoby grającej w 3 karty jest następujący: Zysk: Prawdopodobieństwo: +10 zł ⅓ -10 zł ⅔ a) Oblicz wartość oczekiwaną i odchylenie standardowe tej zmiennej losowej b) Posługując się odpowiednim twierdzeniem oblicz prawdopodobieństwo, że łączny wynik 130 rozegranych gier będzie dodatni. c) Jakie jest prawdopodobieństwo dodatniego zysku w więcej niż 2 spośród 4 gier. PYTANIA TEORETYCZNE – w każdym pytaniu wskaż prawdziwe odpowiedzi. 33. Jeśli zmienna losowa X ma rozkład 0-1, to: a) rozkład prawdopodobieństwa zmiennej X zależy tylko od jednego parametru; b) wartość oczekiwana jest równa odchyleniu standardowemu; c) X ma maksymalną wariancję, gdy parametr rozkładu wynosi ½ . 34. Zmienna losowa X o rozkładzie dwumianowym : a) jest sumą n niezależnych zmiennych losowych 0-1 o tej samej wartości oczekiwanej; b) jest sumą n niezależnych zmiennych losowych 0-1 o identycznym rozkładzie; c) jest granicznym rozkładem dla rozkładu normalnego; d) ma odchylenie standardowe np(1-p); e) ma takie same parametry jak inna zmienna losowa o rozkładzie dwumianowym X+1 35. Rozkład Poissona: a) można wykorzystywać w statystycznej kontroli jakości; b) jest zdefiniowany przez jeden parametr; c) jest zdefiniowany tylko dla liczb nieujemnych; d) charakteryzuje się asymetrią prawostronną. 36. W rozkładzie N(0,1) a) Φ(1,64) = P u 1,64 b) Φ(1,64) < P u 1,64 f) Φ(1,64) > P u 1,64 37. Statystyka z próby: a) jest zmienną losową; b) jest funkcją zmiennych losowych, stanowiących próbę losową; c) dla dużych prób jest zawsze równa odpowiedniemu parametrowi populacji; d) jest tym samym co estymator. 38. W jaki sposób czterokrotne zwiększenie liczebności próby wpływa na błąd standardowy średniej: a) błąd ulega dwukrotnemu zwiększeniu; b) błąd ulega czterokrotnemu zwiększeniu; c) błąd ulega dwukrotnemu zmniejszeniu; d) błąd ulega czterokrotnemu zmniejszeniu. ODPOWIEDZI: 1b) 1,5; 4,88 2a) 0,32805; b)0,5; 3. 0,0039; 0,3164; 4.Φ(0,33); 5a) 1-Φ(0,7) 6 a) <1,244 b)0,9 7.a) 4,7; b)3,42; 8. a)1-Φ(0,5); c) 231,2 9 >1,756 10. a) 107,025 b) 40; 36 11.a) 12; 25; 0 b) Φ(0,48)=0,6844 12. a) i b) 2Φ(1)-1 13. a) 1-Φ(1,5) b)Φ(1); 14. a) Ф(-0,625); c) <7,008 d)0,0475; 15. 1,83; nie; 16. a) Φ(2) –Φ(1); b) Φ(-1,41) 17. 1-Φ(0,6) 18. 1-Ф(1,81) 19. a) t-St(33,68; 7,7) b)0,05 20. 0,1151; 0,05 21c) 1-Φ(2) 22 b) Φ(-0,9) 23. Φ(0,4) = 0,6554 24: a) 0,0668; b) 0,0937 25. 1-Ф(0,45) 26 a) 0 b) 1-Φ(2,19) 27. 1- Φ(5) 28.0 29c) Φ(1,6)-Φ(-1) 30. N(350,4,21) 31. a)2Ф(1) -1 b) Ф(1,33)=0,9082 32: a) -3,33; 9,426; b) 0 c) 0,11