Zmienne losowe - E-SGH

advertisement
Dr Maria Wieczorek
Zmienne losowe. Rozkłady statystyk z próby.
1..Dana jest funkcja rozkładu prawdopodobieństwa zmiennej losowej X:
xi
-2
-1
1
3
pi
0,1
0,3
0,4
0,2
a) Określ rozkład zmiennej losowej Y=3X
b) Wyznacz parametry (wartość oczekiwaną i odchylenie standardowe) rozkładu
zmiennej Y
2. Łucznik oddaje do tarczy 5 strzałów. Prawdopodobieństwo chybienia w pojedynczym
strzale wynosi 0,1.
a) Obliczyć prawdopodobieństwo, że w serii 5 strzałów chybi tylko raz.
b) Pozostałe wyniki prezentujemy poniżej:
P(X=0) = 0,59049
P(X=2) = 0,0729
P(X=3) = 0,0081
P(X=4) = 0,00045
P(X=5) = 0,00001
Wyznaczyć dwoma sposobami wartość oczekiwaną liczby chybionych strzałów w serii pięciu
strzałów do tarczy
3.Na 10 małżeństw w Zambii 7 jest nosicielem wirusa HIV. Wiedząc, że szansa przekazania
przez rodziców wirusa dziecku wynosi 3:4, obliczyć prawdopodobieństwo, że w małżeństwie
z czwórką dzieci:
a) wszystkie dzieci będą zdrowe
b) wszystkie dzieci będą zarażone wirusem HIV
4. Zużycie paliwa ( w l. na 100 km) w samochodzie SEAT ma rozkład normalny z
parametrami 8 ; 1,2 .
a) Obliczyć prawdopodobieństwo tego, że zużycie paliwa w losowo wybranym samochodzie
przekroczy 7,6 l
b) Podać interpretację graficzną wyniku z punktu a) na wykresie funkcji gęstości.
c) Dla jakiej wielkości zużycia paliwa dystrybuanta w badanym rozkładzie przyjmuje
wartość 0,75? Zinterpretować tę wielkość.
5. Czas spędzany dziennie przed ekranem TV przez osobę dorosłą jest zmienną losową o
rozkładzie normalnym z wartością oczekiwaną 90 minut i odchyleniem standardowym
równym 20 min.
a) jakie jest prawdopodobieństwo, że losowo wybrana osoba spędza przed ekranem mniej
niż 76 min?
b) zaznaczyć wynik z p.a) na wykresie funkcji gęstości przed i po standaryzacji.
6. Czas przejazdu trasy slalomu (min) jest zmienną losową o rozkładzie N(1,5; 0,2)
a) Jaki czas przejazdu miało 10 % najlepszych zawodników.
b) Jakie jest prawdopodobieństwo, że odchylenie standardowe (nieobciążone) czasu
wyznaczone dla 20 losowo wybranych zawodników nie przekroczy 0,239.
7.Czas oczekiwania na tramwaj linii 33 jest zmienną losową o rozkładzie normalnym z
odchyleniem standardowym równym 1 min.
a) ile wynosi przeciętny czas oczekiwania na tramwaj, jeśli 75.8% osób oczekujących na ten
tramwaj czeka nie krócej niż 4 min?
b) ile co najwyżej min czekają na tramwaj osoby należące do 10% osób oczekujących
najkrócej
8.Poziom cholesterolu we krwi jest zmienną losową o rozkładzie N(200,30)
a) Jaki odsetek ludzi ma poziom cholesterolu nie przekraczający 185?
b) Zaznaczyć wynik z punktu a) na wykresie dystrybuanty
c) Jaki poziom cholesterolu ma 15 % osób o najwyższym jego poziomie?
9. Czas przejazdu trasy slalomu jest zmienną losową o rozkładzie normalnym. Najwięcej
zawodników przejeżdżało tę trasę w ciągu (około) 1,5 minuty, zaś 33 % zawodników jechało
dłużej niż 1,588. Jaki czas przejazdu miało 10 % najgorszych zawodników ?
10. Zmienna losowa W ma rozkład normalny o wartości oczekiwanej 105 i wariancji 9.
a) Oblicz, ile wynosi trzeci kwartyl w tym rozkładzie.
b) Oblicz wartość oczekiwaną i wariancję zmiennej Z = 250 – 2W
11. Zmienne X1 i X2 są niezależnymi zmiennymi losowymi o rozkładach odpowiednio:
N(20;3) i N(4;2). Należy obliczyć:
a) wartość oczekiwaną, wariancję i współczynnik asymetrii zmiennej Y= X1-2X2,
b) prawdopodobieństwo P(Y>9,6) i wynik przedstawić graficznie.
12.Zmienna losowa X ma rozkład N(5,2).
a) Obliczyć prawdopodobieństwo, że zmienna X przyjmie wartości z przedziału (3;7)
b) Obliczyć prawdopodobieństwo, że średnia z 16 elementowej próby będzie należała do
przedziału (4,5; 5,5).
Skomentuj relację między uzyskanymi wynikami
13.Miesięczne zużycie energii elekt.(kWh) w rodz. czteroosobowych ma rozkład N(300,100).
a) Obliczyć prawdopodobieństwo zużycia ponad 450 kWh w miesiącu przez losowo wybraną
rodzinę czteroosobową.
b) Obliczyć prawdopodobieństwo, że wśród 25 losowo wybranych rodzin średnie zużycie
energii będzie niższe niż 320 kWh.
14. Przypuszcza się , że czas eksploatacji komputerów (w latach) jest zmienną losową o
rozkładzie normalnym N (6;1,2)
a) Podać prawdopodobieństwo, że losowo wybrany komputer będzie eksploatowany krócej
niż 5 lat i jeden kwartał.
b) Zaznaczyć obliczone w p. a) prawdopodobieństwo na wykresie funkcji gęstości oraz
dystrybuanty rozkładu normalnego.
c) Jaki czas pracy ma 80 % komputerów najszybciej wycofanych z eksploatacji?
d) Wiedząc, że komputery stoją w pracowniach po 16 sztuk, odpowiedzieć, jakie jest
prawdopodobieństwo, że średni czas eksploatacji komputerów w losowo wybranej
pracowni przekroczy 6,5 roku
15. Zmienne X1 i X2 mają rozkłady normalne odpowiednio: N(90,12) i N(30,8). Sprawdź,
czy przy założeniu, że pobrane niezależnie próby losowe liczyły po 25 jednostek, zachodzi
P(55  x1  x2  65)
nierówność:
2
P( x1  90)
16.Przeciętne miesięczne wydatki na reklamę w małych firmach handlowych mają rozkład
normalny o wartości oczekiwanej 300 zł i odchyleniu standardowym 60 zł. Odpowiednie
wartości dla rozkładu wydatków na reklamę w zakładach usługowych wynoszą: 280 zł oraz
80 zł.
a) oblicz prawdopodobieństwo, że średnie miesięczne wydatki na reklamę 36 losowo
wybranych firm handlowych będą większe niż 310 zł i jednocześnie mniejsze niż 320 zł;
b) oblicz prawdopodobieństwo, że średnie miesięczne wydatki na reklamę 36 losowo
wybranych firm handlowych będą mniejsze od średnich miesięcznych wydatków na reklamę
64 losowo wybranych zakładów usługowych.
17. Miesięczne zużycie wody na osobę w m3 ma w pewnym osiedlu rozkład N (10; 4). W
końcu 1997 roku dokonano generalnego remontu sieci wodno-kanalizacyjnej i zamontowano
liczniki wody - ocenia się, że to zużycie ma teraz rozkład N(8;3). Obliczyć
prawdopodobieństwo, że średnie zużycie 36 losowo wybranych osób zmniejszyło się w
stosunku do średniego zużycia tych samych osób sprzed remontu co najmniej o 2,5 m3 .
18.Wskaźnik inteligencji osób kupujących płyty zespołu A ma rozkład normalny N(75, 10),
zaś osób czytających tygodnik B rozkład N(70,15). Z pierwszej grupy wylosowano 50 osób,
z drugiej 40. Ile wynosi prawdopodobieństwo, że średni iloraz inteligencji w pierwszej próbie
okaże się większy o co najmniej 10 punktów od średniej obliczonej na podstawie drugiej
próby.
19. Na podstawie danych o wysokości opłat ( €) za wizytę u lekarza internisty w krajach Unii
Europejskiej ustalono, że rozkład opłat był zgodny z rozkładem normalnym o przeciętnej
równej 33,68 €.
a) Określ typ rozkładu średniej opłaty dla 9 losowo wybranych krajów, jeśli dodatkowo
wiadomo, że w grupie tych krajów nieobciążone odchylenie standardowe wyniosło 23,10€.
b) Oblicz P( x9  48) . Wynik zilustruj graficznie.
20.Trener ( a zarazem miłośnik statystyki) oświadczył trójskoczkowi, że pojedzie na
olimpiadę do Pekinu, jeśli będzie skakał daleko i regularnie tzn. spełni dwa poniższe warunki:
 średni wynik wśród 25 losowo wybranych skoków w sezonie nie będzie niższy niż 16,32 m
 rozrzut wyników (mierzony odchyleniem standardowym) wśród losowo wybranych 25
skoków nie przekroczy 0,38 m.
Który z warunków łatwiej będzie spełnić trójskoczkowi, jeśli rozkład jego wyników jest
N(16,2 ; 0,5)
21.Pewien żłobek zakupił partię 900 opakowań mleka w proszku. Wkrótce okazało się, że w
tym regionie 10 % opakowań mleka zakażonych jest gronkowcem.
a) Jaki jest dokładny rozkład odsetka opakowań zakażonych gronkowcem w badanej partii
mleka?
b) Jaki jest graniczny rozkład badanej statystyki?
c) Jakie jest prawdopodobieństwo, że odsetek zakażonych opakowań przekroczy w tej partii
12 %. Uzasadnić metodę rozwiązania.
22.Szacuje się, że 27% mieszkańców naszego kraju wyraziłoby zgodę na lokalizację
dyskoteki w sąsiedztwie swego miejsca zamieszkania.
a) Jaki rozkład ma odsetek wyrażających zgodę na dyskotekę w sąsiedztwie w grupie 400
osób? Odpowiedź uzasadnij,
b) Jakie jest prawdopodobieństwo, że w grupie 400 osób mniej niż jedna czwarta
zaakceptuje pomysł lokalizacji dyskoteki obok swego domu?
23. Szacuje się, że co czwarty mieszkaniec naszego kraju nie weźmie udziału w wyborach
samorządowych.
a) Oblicz prawdopodobieństwo, że w losowej, sondażowej próbie 300 osób, ponad 72 nie
weźmie udziału w wyborach.
b) Oblicz prawdopodobieństwo, że w losowej próbie 300 osób odsetek nie biorących
udziału w wyborach przekroczy 24%.
c) Czy wyniki uzyskane w a) i b) są zaskakujące – uzasadnij metodę rozwiązania.
24.W pewnym kraju dwaj kandydaci na prezydenta A i B cieszą się jednakowym, 50%
poparciem wyborców.
a) Jakie jest prawdopodobieństwo, że przedwyborczy sondaż przeprowadzony na 625
osobowej losowo dobranej próbie wyborców wskaże, że kandydat B ma poparcie wyższe niż
53 %?
b) Jakie jest prawdopodobieństwo, że wśród 6 przypadkowych osób, zapytanych o zdanie
przez dziennikarza TV, 5 osób będzie popierać kandydata B, a jedna kandydata A.
25. Na studiach dziennych 25% studentów wybiera specjalizację w zakresie zarządzania i
marketingu, na studiach zaocznych tę samą specjalizację wybiera 20% studentów. Jakie jest
prawdopodobieństwo, że w losowo wybranej próbie liczącej 200 studentów studiów
dziennych udział wybierających badaną specjalizację będzie przynajmniej o 7% wyższy od
udziału specjalizujących się w zarządzaniu i marketingu w grupie 150 studentów studiów
zaocznych.
26.W rozgrywkach sportowych można zdobyć maksymalnie 50 punktów, przy czym rozkład
liczby punktów zdobytych przez pojedynczego gracza ma wartość oczekiwaną 30 i
odchylenie standardowe 5.
a) Jakie jest prawdopodobieństwo, że drużyna licząca 30 graczy zdobędzie wspólnie ponad
1000 punktów?
b) Jakie jest prawdopodobieństwo, że średnia liczba punktów zdobytych przez 30 graczy
jest większa niż 32.
27. Zakład ubezpieczeń Poli S.A. zatrudnia 400 agentów (ubezpieczeniowych). Liczba
klientów zdobywanych przez każdego z nich miesięcznie ma jednakowy rozkład z wartością
oczekiwaną 50 klientów i wariancją 100 klientów2. Za każdego zdobytego klienta zakład
wypłaca premię 25 zł. Obliczyć i zinterpretować prawdopodobieństwo, że w losowo
wybranym miesiącu wartość wypłaconych premii przekroczy 525 tys. zł.
28. W Urzędzie ds. Walki z Biurokracją pracuje 900 osób. Każda z nich pisze średnio 40
notatek służbowych w miesiącu, przy wariancji 49 notatek2. Rozkład liczby notatek w
miesiącu jest taki sam dla każdego pracownika. Za każdą notatkę pracownik płaci karę 10 zł.
Obliczyć i zinterpretować prawdopodobieństwo, że w losowo wybranym miesiącu łączna
wartość zapłaconych kar będzie mniejsza niż 347 400.
29. a)Wiadomo, że miesięczne wydatki na produkt S w rodzinach czteroosobowych mają
rozkład N (300, 50). Podać, jaki rozkład będą miały średnie wydatki na ten produkt w 100
elementowej próbie rodzin.
b) Wiadomo, że miesięczne wydatki na produkt T mają rozkład Weibulla z parametrami
E(X)=300, D(X)=50. Podać i uzasadnić jaki rozkład będą miały średnie wydatki na ten
produkt w 100 elementowej próbie rodzin.
c) Czy prawdopodobieństwo, że średnie wydatki wyznaczone w oparciu o 100 elementową
próbę przekroczą 295 zł i jednocześnie będą niższe niż 308 jest w przypadku obu
produktów jednakowe. Oblicz to prawdopodobieństwo.
30. Liczba kroków wykonanych przez lunatyków w czasie snu w ciągu tygodnia ma rozkład
Pareto z wartością oczekiwaną 350 i odchyleniem standardowym 73. Jaki rozkład ma średnia
liczba kroków dla 300 lunatyków?
31. W ciągu dnia zespół sklepów warzywnych sprzedaje średnio towary za 6 000 zł, przy
odchyleniu standardowym 750 zł. Obliczyć prawdopodobieństwo, że:
a) Średnia wartość dziennych obrotów, zrealizowanych w ciągu 100 losowo wybranych dni,
będzie zawierać się w przedziale od 5925 zł do 6075 zł
b) Obroty osiągane w tym okresie przekroczą łącznie 590 000 zł.
32. Rozkład zmiennej losowej opisującej zysk z gry osoby grającej w 3 karty jest następujący:
Zysk:
Prawdopodobieństwo:
+10 zł
⅓
-10 zł
⅔
a) Oblicz wartość oczekiwaną i odchylenie standardowe tej zmiennej losowej
b) Posługując się odpowiednim twierdzeniem oblicz prawdopodobieństwo, że łączny wynik
130 rozegranych gier będzie dodatni.
c) Jakie jest prawdopodobieństwo dodatniego zysku w więcej niż 2 spośród 4 gier.
PYTANIA TEORETYCZNE – w każdym pytaniu wskaż prawdziwe odpowiedzi.
33. Jeśli zmienna losowa X ma rozkład 0-1, to:
a) rozkład prawdopodobieństwa zmiennej X zależy tylko od jednego parametru;
b) wartość oczekiwana jest równa odchyleniu standardowemu;
c) X ma maksymalną wariancję, gdy parametr rozkładu wynosi ½ .
34. Zmienna losowa X o rozkładzie dwumianowym :
a) jest sumą n niezależnych zmiennych losowych 0-1 o tej samej wartości oczekiwanej;
b) jest sumą n niezależnych zmiennych losowych 0-1 o identycznym rozkładzie;
c) jest granicznym rozkładem dla rozkładu normalnego;
d) ma odchylenie standardowe np(1-p);
e) ma takie same parametry jak inna zmienna losowa o rozkładzie dwumianowym X+1
35. Rozkład Poissona:
a) można wykorzystywać w statystycznej kontroli jakości;
b) jest zdefiniowany przez jeden parametr;
c) jest zdefiniowany tylko dla liczb nieujemnych;
d) charakteryzuje się asymetrią prawostronną.
36. W rozkładzie N(0,1)
a) Φ(1,64) = P u  1,64
b) Φ(1,64) < P u  1,64
f) Φ(1,64) > P u  1,64
37. Statystyka z próby:
a) jest zmienną losową;
b) jest funkcją zmiennych losowych, stanowiących próbę losową;
c) dla dużych prób jest zawsze równa odpowiedniemu parametrowi populacji;
d) jest tym samym co estymator.
38. W jaki sposób czterokrotne zwiększenie liczebności próby wpływa na błąd standardowy
średniej:
a) błąd ulega dwukrotnemu zwiększeniu;
b) błąd ulega czterokrotnemu zwiększeniu;
c) błąd ulega dwukrotnemu zmniejszeniu;
d) błąd ulega czterokrotnemu zmniejszeniu.
ODPOWIEDZI:
1b) 1,5; 4,88
2a) 0,32805; b)0,5; 3. 0,0039; 0,3164; 4.Φ(0,33); 5a) 1-Φ(0,7) 6 a)
<1,244 b)0,9 7.a) 4,7; b)3,42; 8. a)1-Φ(0,5); c) 231,2 9 >1,756
10. a) 107,025 b)
40; 36
11.a) 12; 25; 0 b) Φ(0,48)=0,6844
12. a) i b) 2Φ(1)-1 13. a) 1-Φ(1,5)
b)Φ(1); 14. a) Ф(-0,625); c) <7,008 d)0,0475; 15. 1,83; nie; 16. a) Φ(2) –Φ(1);
b) Φ(-1,41) 17. 1-Φ(0,6) 18. 1-Ф(1,81)
19. a) t-St(33,68; 7,7) b)0,05 20. 0,1151;
0,05 21c) 1-Φ(2)
22 b) Φ(-0,9)
23. Φ(0,4) = 0,6554
24: a) 0,0668; b) 0,0937
25. 1-Ф(0,45) 26 a) 0 b) 1-Φ(2,19)
27. 1- Φ(5) 28.0
29c) Φ(1,6)-Φ(-1)
30. N(350,4,21) 31. a)2Ф(1) -1 b) Ф(1,33)=0,9082 32: a) -3,33; 9,426; b) 0 c) 0,11
Download