Dr inż. Małgorzata Krętowska Wydział Informatyki PB METODY PROBABILISTYCZNE I STATYSTYKA Zadania do realizacji na ćwiczeniach Zajęcia nr 2 Teoria: Klasyczna definicja prawdopodobieństwa; Prawdopodobieństwo całkowite; Wzór Bayesa; Prawdopodobieństwo warunkowe; Niezależność zdarzeń; Zad 1 Obliczyć prawdopodobieństwo, że: a) wybrany losowo punkt kwadratu |x|<1, |y|<1 leży wewnątrz okręgu x2 + y2 =1; b) że 3 przypadkowo wybrane punkty kwadratu są punktami koła. Zad 2 Czterech strzelców oddaje po jednym strzale. Prawdopodobieństwa trafienia do celu przez każdego z nich wynoszą 0.6;0.5; 0.7; 0.9. Obliczyć prawdopodobieństwo, że cel został trafiony. Zad 3 W windzie jest 7 pasażerów. Nikt nie wsiada. Winda zatrzymuje się na 10 piętrach. Obliczyć prawdopodobieństwo, że 2 lub więcej pasażerów nie wysiądzie na jednym piętrze. Zad 4 Robotnik obsługuje dwie maszyny. Długotrwałe obserwacje wykazały, że każdej poświęca jednorazowo 8 minut w ciągu godziny. Znaleźć prawdopodobieństwo tego, że w ciągu godziny maszyna wymaga interwencji robotnika wtedy, gdy jest on zajęty drugą maszyną. (Zakładamy, że konieczność interwencji robotnika w odniesieniu do każdej z maszyn jest jednakowo możliwa w każdym momencie czasu). Zad 5 Wiadomo, że 37 % pewnej populacji ma grupę krwi „A”, 13% grupę krwi „B”, 44% grupę krwi „0” i 6% grupę krwi „AB”. Osoba z grupą krwi „B” może otrzymać podczas transfuzji krew grupy „B” lub „0”. a) Obliczyć prawdopodobieństwo, że mąż może być dawcą krwi dla żony, która ma krew grupy „B” b) Obliczyć prawdopodobieństwo, że w losowo wybranej parze małżeńskiej żona ma grupę krwi „B”, a mąż grupę krwi „A”. c) Obliczyć prawdopodobieństwo, że w losowo wybranym małżeństwie jedno z małżonków ma grupę krwi „A” a drugie grupę „B” d) Obliczyć prawdopodobieństwo, że przynajmniej jedno z małżonków ma grupę krwi „0”. Zad 6 Kanałem łączności nadaje się na wyjściu tylko 3 rodzaje sygnałów: AAAA, BBBB, CCCC, odpowiednio z prawdopodobieństwem 0.4; 0.3; 0.3. Litery te (sygnały) podlegają niezależnie losowym zakłóceniom w rezultacie czego np. litera A może być odebrana jako litera B albo C. Prawdopodobieństwo poprawnego przesłania albo przekłamania podaje tablica: Sygnały nadane A B C A 0.8 0.1 0.1 Sygnały odebrane B 0.1 0.8 0.1 C 0.1 0.1 0.8 1. Znaleźć prawdopodobieństwo odebrania na wyjściu sygnału BBBB. 2. Na wyjściu odebrano sygnał BBBA. Obliczyć prawdopodobieństwo, że został on nadany jako BBBB. Zad 7 W grupie 40 studentów, 10 studentów zna 90% odpowiedzi na pytania egzaminacyjne z obowiązujących trzech działów, 14 zna 70% odpowiedzi, 8-60% i 8-50%. Na egzaminie student z tej grupy odpowiedział poprawnie na 2 pytania z dwóch działów i nie znał odpowiedzi na pytanie z trzeciego działu. Jakie jest prawdopodobieństwo, że dany student nauczył się 70% materiału? Zad 8 W szkole zawodowej jest n uczniów, z których nk (k=1, 2, 3) uczy się w k-tej klasie. Okazało się, że jeden z dwóch losowo wybranych uczniów uczy się w wyższej klasie niż drugi. Jakie jest prawdopodobieństwo, że starszy z nich uczy się w trzeciej klasie? Zad 9 Trzej gracze rzucają kolejno monetą. Wygrywa ten, który pierwszy wyrzuci orła. Obliczyć prawdopodobieństwo wygranej każdego z graczy. Zad 10 W hali fabrycznej znajduje się sześć urządzeń. Na podstawie wcześniejszych doświadczeń szacujemy, że prawdopodobieństwa tego, że danego dnia jest niesprawnych 0, 1, 2, 3, 4, 5 lub 6 urządzeń wynoszą odpowiednio 0.6, 0.2, 0.08, 0.06, 0.04, 0.02. Pewnego dnia przeprowadzono badanie dwu losowo wybranych urządzeń. Jak zmienią się oszacowania powyższych prawdopodobieństw, jeżeli wybrane urządzenia okazały się niesprawne? Zajęcia nr 3 Teoria: Rozkłady zmiennej dyskretnej: zero-jedynkowy, Bernouliego, geometryczny, jednostajny; Zmienna losowa ciągła: funkcja gęstości, dystrybuanta; Rozkłady zmiennej losowej ciągłej: normalny, standaryzowany normalny, wykładniczy, jednostajny Uwaga: Obowiązuje znajomość wszystkich rozkładów zmiennej losowej dyskretnej i ciągłej ze szczególnym uwzględnieniem wymienionych wyżej. Zad 1 Dana jest funkcja rozkładu prawdopodobieństwa zmiennej losowej X: xi -2 -1 0 3 4 pi 0.2 0.2 0.1 a 0.1 1. Wyznaczyć stałą a. 2. Sporządzić wykres funkcji rozkładu prawdopodobieństwa i jej histogram. 3. Określić dystrybuantę i jej wykres. 4. Jakie jest prawdopodobieństwo, że zmienna losowa X=0? 5. Obliczyć P(0 ≤ X <3). Zad 2 Zakładając, że zmienna X ma dystrybuantę 0 dla x < -2 0.3 dla -2≤ x < 2 F(x) = 0.4 dla 2≤x <3 0.6 dla 3≤x <5 1 dla x≥5 znaleźć: a) rozkład zmiennej X; b) P(X≤3); b) P(-0.4<X≤4) Zad 3 Pewna gra polega na jednoczesnym rzucie monetą i kostką. Wygrana następuje przy jednoczesnym wyrzuceniu orła i podzielnej przez 3 liczby oczek. Obliczyć prawdopodobieństwo, że na 4 gry a) będą dokładnie 2 wygrane b) nie będzie wygranej Zad 4 Oszacowano, że 3% samochodów w Polsce ma zainstalowane katalizatory. W pewnym dniu stacja benzynowa obsłużyła 200 samochodów. Jakie jest prawdopodobieństwo, że a) dwa samochody miały katalizatory, b) więcej niż dwa samochody miały katalizatory, c) żaden samochód nie miał katalizatora, d) nie więcej niż trzy samochody miały katalizatory Zad 5 Egzaminator zadaje studentowi pytanie. Prawdopodobieństwo tego, że student odpowie na każde pytanie jest równe 0.8. Egzaminator przerywa egzamin w chwili, gdy student nie umie odpowiedzieć na zadane pytanie. Podać rozkład i dystrybuantę zmiennej losowej X, będącej liczbą pytań, które egzaminator zadawał studentowi. Zad 6 Wiedząc, że funkcja gęstości prawdopodobieństwa zmiennej losowej X dana jest wzorem: 1/9 x2 dla 0< x ≤ 3 f(x)= 0 w pozostałych przypadkach Znaleźć dystrybuantę zmiennej losowej F(x) i P(2<X<4). Zad 7 Do wypełniania kartonów z sokiem wykorzystywany jest automat. Waga soku w wypełnianych pojemnikach ma rozkład N(1 kg; 0,005 kg). a) Jakie jest prawdopodobieństwo, że waga losowo wybranego kartonu jest mniejsza niż 0,95 kg? b) Jakie jest prawdopodobieństwo, że waga kartonu przekroczy 1,05 kg? c) Jaki procent kartonów waży więcej niż 1 kg? Zad 8 Czas oczekiwania na realizację zamówienia w pizzerii jest zmienną losową i wynosi od 15 do 35 minut. Przyjmując, że prawdopodobieństwo otrzymania zamówionego dania jest jednakowe w tym czasie, określić funkcję gęstości dla rozkładu czasu oczekiwania w tej pizzerii. Podać jaki jest średni czas oczekiwania. Obliczyć prawdopodobieństwo realizacji zamówienia w czasie od 20 do 25 min. Zad 9 Jest 10000 torebek cukru. Wiadomo, że rozmieszczono w nich losowo 5000 oznakowanych kryształków cukru. Jakie jest prawdopodobieństwo, że w dowolnie ustalonej torebce będzie znajdował się przynamniej jeden oznakowany kryształek? Zad 10 Dystrybuanta zmiennej losowej X dana jest wzorem: 0 dla x ≤0 F(x)= (1/36) x2 dla 0< x ≤6 1 dla x > 6 Dla jakich wartości x0 ∈[0, 6) spełnione jest równanie P(x0< X ≤ 4)=1/3? Zad 11 Wyznaczyć stałą A tak, aby funkcja 0 dla x≤0 f(x)= Ae-3x dla x>0 była gęstością prawdopodobieństwa zmiennej losowej X. Znaleźć dystrybuantę F(x). Obliczyć P(X>1) i zinterpretować to prawdopodobieństwo na wykresie gęstości i dystrybuanty. Zajęcia nr 4 Teoria: Charakterystyki liczbowe zmiennej losowej: wartość oczekiwana, wariancja, odchylenie standardowe, mediana, dominanta, współczynnik asymetrii i spłaszczenia, momenty; Funkcje zmiennej losowej dyskretnej i ciągłej. Zad 1 Dana jest funkcja rozkładu prawdopodobieństwa zmiennej losowej X: -2 -1 2 4 8 xi 0.3 0.1 0.4 0.1 0.1 pi Obliczyć: wartość przeciętną, wariancję, odchylenie standardowe, medianę, dominantę. Zad 2 Funkcja gęstości zmiennej losowej X ma postać: 3x2 dla 0≤x≤1 f(x) = 0 w pozostałych przypadkach Obliczyć wartość oczekiwaną, wariancję, medianę, kwartyl górny (trzeci) Zad 3 Zmienna losowa X ma rozkład o gęstości: 6x(1-x) dla 0<x<1 f(x)= 0 w pozostałych przypadkach Niech Y=4X-2. Obliczyć EY i VY korzystając z EX i VX. Zad 4 Naszkicować wykres gęstości prawdopodobieństwa zmiennej losowej X: 1/(2x2) dla |x|>1 f(x)= 0 w pozostałych przypadkach Wyznaczyć medianę zmiennej losowej X. Zad 5 Niezależne zmienne losowe X i Y mają następujące funkcje prawdopodobieństwa: 1 3 yi 2 4 a xi 0,55 0,45 pi 0,6 0,3 0,1 pi a) Wyznaczyć rozkład zmiennej losowej U=X2; b) Podać wartość parametru a, jeśli wiadomo, że wartość oczekiwana zmiennej losowej Z=X+Y jest równa 4,9. Zad 6 Znaleźć gęstość prawdopodobieństwa zmiennej losowej Y wyrażającej pole powierzchni kwadratu, jeżeli bok kwadratu jest zmienną losową o rozkładzie jednostajnym w przedziale (0, a). Zad 7 Zmienna X1 opisana jest rozkładem normalnym N(1,2) a zmienna X2 rozkładem N(-1,2). Obliczyć prawdopodobieństwo P(2<Y<4), gdzie Y=2X1-X2. Zad 8 Dana jest zmienna losowa X o rozkładzie f(x) i ściśle rosnącej dystrybuancie F(x). Znaleźć rozkład zmiennych losowych: a) Y = e-X, b) Y = F(X). Zad 9 Niech zmienna losowa X ma rozkład geometryczny z parametrem θ. Znaleźć gęstość zmiennej Y = 4 - 5 X. Zad 10 Przyjmujemy, że czas świecenia każdej z trzech żarówek może być traktowany jako zmienna losowa rozkładzie wykładniczym z parametrem a = 1/4 [1/miesiąc]. Podać średni czas świecenia układu zbudowanego z tych żarówek w sposób: a) równoległy, b) szeregowy Zad 11 Ile średnio powinno przypadać rodzynków na bułeczkę, aby prawdopodobieństwo, że w bułeczce znajdzie się choćby jeden rodzynek było nie mniejsze niż 0.99? Zajęcia nr 5 Teoria: Zmienna losowa dwuwymiarowa dyskretna i ciągła: funkcja rozkładu prawdopodobieństwa, dystrybuanta, rozkłady brzegowe, rozkłady warunkowe; Rozkłady zmiennej losowej dwuwymiarowej; Charakterystyki zmiennej losowej dwuwymiarowej. Zad 1 W 10 elementowej partii pewnego towaru są 2 sztuki wadliwe. Wylosowano bez zwrotu 2 sztuki. Niech zmienna losowa X przyjmuje wartości równe liczbie sztuk wadliwych wśród wylosowanych sztuk, Y zaś przyjmuje wartość 1 jeśli pierwsza wylosowana sztuka jest wadliwa, oraz 0 jeśli nie jest wadliwa. a) Wyznaczyć rozkład 2-wymiarowej zmiennej losowej (X,Y) oraz jej dystrybuantę; b) Zbadać czy zmienne są niezależne; c) Obliczyć E(X/Y=0) i V(X/Y=0); d) Obliczyć P(X+Y=1) oraz E(X+Y) Zad 2 Dwuwymiarowa zmienna losowa (X,Y) ma następujący rozkład: X Y 1 2 3 0.1 0.2 0.3 0 0.1 0.1 0.2 1 obliczyć rozkład warunkowy zmiennej Y względem X. Zad 3 Wyznaczyć gęstość prawdopodobieństwa i dystrybuantę dwuwymiarowej zmiennej losowej (X, Y), dla 0<=x<=3, 2<=y<=2, jeżeli zmienne losowe X i Y są niezależne i mają rozkłady prostokątne w tych przedziałach, a są równe 0 poza tymi przedziałami. Zad 4 Zmienna losowa (X, Y) ma rozkład dany gęstością: 2 dla x>0, y>0, x+y<1 f(x, y)= 0 w pozostałych przypadkach Wyznaczyć rozkłady brzegowe zmiennej X i Y. Zad 5 Gęstość rozkładu zmiennej losowej dwuwymiarowej jest dana przez: 3x(y+x)/5 dla 0<x<1,0<y<2 f(x,y)= 0 w pozostałych przypadkach Oblicz E(X), V(Y), E(XY). Zad 6 Dwuwymiarowy rozkład zmiennych losowych X i Y dany jest za pomocą tablicy \ X 0 1 2 3 4 5 Y 0 0.01 0.05 0.12 0.02 0 0.01 1 0.02 0 0.01 0.05 0.02 0.02 2 0 0.05 0.1 0 0.3 0.05 3 0.01 0 0.02 0.01 0.03 0.1 Obliczyć: a) P{X=2/Y=2}, b) E(Y/X=1), c) P{X + Y ≤ 3}, d) E(X+Y) Zad 7 W produkcji pewnego zakładu braki ze względu na własności mechaniczne produkcji (X) stanowią 3%, a braki ze względu na własności elektryczne (Y) tego produktu 4.5%. Produkcja dobra stanowi 95% całej produkcji. Znaleźć rozkład dwuwymiarowej zmiennej losowej (X,Y). Zajęcia nr 6 Teoria: Współczynnik kowariancji i korelacji; Regresja I i II rodzaju. Zad 1 Zmienne losowe są związane zależnością funkcyjną Y=X2 . Zmienna losowa X przyjmuje wartości –1, 0, 1 każdą z jednakowym prawdopodobieństwem p=1/3. Wykazać, że kowariancja (X,Y) jest równa 0. Zad 2 Dla poniższych danych: xi 2 2 3 5 5 6 6 yi 2 5 4 1 3 1 2 1. Obliczyć współczynnik korelacji; 2. Sporządzić wykresy linii I rodzaju zmiennej X względem Y i Y względem X. 3. Wyznaczyć równania prostych regresji II rodzaju zmiennej X względem Y i Y względem X. Zad 3 Niech gęstością prawdopodobieństwa dwuwymiarowej zmiennej losowej (X, Y) będzie: 0.5 dla (x, y)∈ K f(x,y)= 0 dla pozostałych (x,y) przy czym obszar K jest kwadratem o wierzchołkach w punktach (-1, 0), (1,0), (0, -1), (0,1). Oblicz współczynnik korelacji zmiennych X, Y. Zad 4 Prawdopodobieństwo rozkładu liczby treningów drużyny piłkarskiej w ciągu tygodnia (Y) i liczby meczy w sezonie (X) kształtuje się następująco: xi 1 2 3 yk 0 0,04 0 0 1 0,04 0,12 0,04 2 0 0,12 0,19 3 0 0,15 0,3 a) wyznaczyć rozkłady brzegowe zmiennych X i Y. b) znaleźć oczekiwaną wartość warunkową E(Y/X=3) i wariancje warunkowe V(Y/X=3) c) obliczyć współczynnik korelacji pomiędzy tygodniową liczba treningów a liczbą wygranych meczy Zad 5 W urnie znajduje się 21 pasków papieru. Na każdym z pasków napisano jedną z liczb naturalnych 1, 2, 3,...........,20, 21, przy czym każda z tych liczb występuje tylko raz. Paski są losowane ze zwracaniem. Interesują nas dwie cechy: X – parzystość (x =1 – liczba parzysta, x =0 – liczba nieparzysta) Y – podzielność przez trzy (y =1 – liczba podzielna przez trzy, y = 0 – liczba niepodzielna przez trzy) Obliczyć wartość współczynnika korelacji ρ(X,Y), macierz kowariancji Σ oraz równania regresji pierwszego rodzaju i drugiego rodzaju Y względem X oraz X względem Y. Zad 6 Gęstość rozkładu zmiennej losowej jest dana przez: c dla x>0, y>0, x+y<1 f(x,y)= 0 w pozostałych przypadkach Dla jakiego c funkcja f(x,y) jest funkcją gęstości. Znaleźć korelację między zmiennymi. Zajęcia nr 7 Kolokwium Zajęcia nr 8 Teoria: Twierdzenia graniczne: centralne twierdzenie graniczne Lindeberga - Levy’ego, integralne twierdzenie Moivre’a – Laplace’a; Prawa wielkich liczb: mocne prawo wielkich liczb, słabe prawo wielkich liczb Zad 1 Jakie jest prawdopodobieństwo, że wśród 10 tys. noworodków będzie więcej chłopców niż dziewczynek przy czym prawdopodobieństwo urodzenia chłopca jest p=0.517. Zad 2 Zmienne losowe X1, X2, …, X100 są niezależnymi zmiennymi losowymi o jednakowych rozkładach P(Xi=k)= (e-1.2 * 1.2k)/k!, k=0,1,2,... 100 Obliczyć prawdopodobieństwo p = P ( ∑X i < 30) i =1 Zad 3 Prawdopodobieństwo uszkodzenia elementu w ciągu określonego czasu T jest p=0.2. Jak duża powinna być liczba n elementów aby co najmniej 50 spośród nich z prawdopodobieństwem 0.9 nie uległo uszkodzeniu w ciągu rozważanego czasu T? Zad 4 Zmienne losowe Xi są niezależne i Xk ma rozkład normalny N(0, k1/2) dla k=1, 2... Zbadać, czy dla ciągu {Xk} zachodzi prawo wielkich liczb. Zad 5 Sprawdzić, czy zachodzi prawo wielkich liczb dla ciągu {Xk} niezależnych zmiennych losowych określonych następująco: P(Xk = ±2k) = 2-( 2k + 1 ) , P(Xk = 0) = 1 - 2-2k, k=1,2,... Zad 6 Rzucamy 1000 razy kostką do gry. Znaleźć granice, w których z prawdopodobieństwem 0.99 będzie zawierać się łączna liczba oczek? Zad 7 Prawidłowe działanie urządzeń zależy od sprawności dwu podukładów. Czas bezawaryjnej pracy każdego z podukładów ma rozkład wykładniczy o wartości oczekiwanej T = 1000 h. Urządzenie pierwszego typu zawiera podukłady połączone szeregowo, drugiego typu równolegle. Jakie jest prawdopodobieństwo, że spośród 1000 urządzeń każdego z typów co najmniej 900 będzie pracowało dłużej niż 600 godzin? Zad 8 Telewizor zawiera 4 obwody scalone. Prawdopodobieństwo, że w telewizorze oddanym do naprawy należy wymienić dokładnie k elementów jest równe pk , k=0, 1, 2, 3, 4, przy czym p0=0.2, p1=0.4, p2=0.3, p3=0.05, p4=0.05. Obliczyć prawdopodobieństwo, że w n=1000 naprawianych telewizorach wymieniono więcej niż 1300 elementów. Zajęcia nr 9 Teoria: Rozkłady statystyk z próby: rozkład średniej arytmetycznej, rozkład różnicy średnich arytmetycznych, rozkład wariancji, rozkład wskaźnika struktury, rozkład różnicy dwóch wskaźników struktury; Metody estymacji punktowej: Metoda największej wiarogodności Zad 1 Na podstawie n-elementowej próby losowej pobranej z populacji, w której badana cecha ma rozkład Poissona wyznaczyć, metodą największej wiarogodności, estymator parametru lambda tego rozkładu. Zad 2 Na podstawie n-elementowej próby losowej pobranej z populacji, w której badana cecha ma rozkład normalny N(m, s) wyznaczyć, metodą największej wiarogodności, estymatory parametrów m i s2 tego rozkładu. Zad 3 W wyniku obserwacji liczby błędów literowych popełnianych w 20-stronicowym tekście komputerowym pisanym w czasie egzaminu przez ogół kandydatek na sekretarki stwierdzono, że średnio biorąc, każda z nich popełnia 20 błędów. W losowo wybranej próbie 49 kandydatek odchylenie standardowe liczby błędów wynosiło 5. Zakładając, że rozkład liczby popełnianych błędów jest normalny, obliczyć jakie jest prawdopodobieństwo, że w wylosowanej próbie średnia liczba błędów popełnianych przez kandydatkę na sekretarkę w pisanym tekście będzie: a) niższa od 18; b) wyższa od 23. Zad 4 w roku szkolnym 1993/1994 w szkołach podstawowych 18% ogółu uczniów uczyło się języków obcych. Ustalić, jakie jest prawdopodobieństwo tego, że wśród 900 losowo wybranych uczniów szkól podstawowych w tym roku języka angielskiego uczyło się: a) mniej niż 20% ogółu; b) od 180 do 200 uczniów. Zad 5 Czas przeznaczony w ciągu tygodnia na czytanie książek i czasopism przez ogół mieszkańców Polski ma rozkład normalny z odchyleniem standardowym równym 1.5 godziny. Jakie jest prawdopodobieństwo, że odchylenie standardowe czasu przeznaczonego na czytanie książek i prasy przez 26 losowo wybranych studentów nie przekroczy 2 godzin. Zad 6 Pięciu strzelców strzelało do celu do momentu pierwszego trafienia. Pierwszy trafił za trzecim strzałem, drugi za czwartym, trzeci za trzecim, czwarty za drugim, piąty za siódmym strzałem. Przyjmując, że prawdopodobieństwa trafienia jednym strzałem do tego celu jest dla każdego strzelca jednakowe i równe p, na podstawie wyników tego strzelania znaleźć ocenę nieznanej wartości p. Zad 7 Wariancja każdej z 2500 niezależnych zmiennych losowych o jednakowym rozkładzie jest równa 5. Obliczyć prawdopodobieństwo, że średnia tych zmiennych odchyli się od jej wartości oczekiwanej nie więcej niż 0.05. Zajęcia nr 10 Teoria: Przedziały ufności dla: średniej, wariancji, wskaźnika struktury (procentu); Minimalna liczność próby. Zad 1 W grupie 3600 losowo wybranych pasażerów warszawskiego metra 1584 osoby stwierdziły, że metro jest dla nich jedynym środkiem dojazdu do pracy. a) Zbudować przedział ufności dla nieznanej frakcji osób, dla których metro jest jedynym środkiem dojazdu do pracy wśród ogółu pasażerów. Przyjąć współczynnik ufności na poziomie 0.90. b) Ocenić jak zmieni się precyzja oszacowania, jeśli liczebność próby zmniejszymy do 900 osób. Zad 2 Z dużej partii słupków betonowych wybrano próbkę losową o liczności 50 sztuk. Średnia wytrzymałość na ściskanie osiowe obliczona w tej próbie wynosiła 248.31 kg/cm2, odchylenie standardowe zaś 2 kg/cm2. a) Oszacować średnią wytrzymałość słupków. Zakładając, że badana cecha ma rozkład normalny oszacować wartość oczekiwaną tej zmiennej za pomocą przedziału ufności na poziomie ufności 0.99. b) Jaki będzie przedział ufności, jeżeli poziom ufności zmniejszymy do 0.95? c) Jaka powinna być liczność próbki, żeby przedział ufności był krótszy od 0.5 kg/cm2. Zad 3 Wymiary 6 losowo wybranych detali, wyrażone w mm, kształtowały się następująco: 6,3; 5,9; 6,2; 5,8; 5,7; 6,1. 1. Przyjmując założenie, że rozkład wymiarów ogółu produkowanych detali jest normalny, przy współczynniku ufności równym 0.90 oszacować nieznane odchylenie standardowe wymiarów ogółu produkowanych detali. 2. Co należałoby uczynić, aby zwiększyć dokładność oszacowania? Zad 4 Średnia frekwencja widzów w kinie na seansie filmowym w jednym z kin warszawskich ma rozkład N(*,40). Na podstawie obserwacji liczby widzów na 25 losowo wybranych seansach kinowych oszacowano przedział liczbowy (184, 216) dla nieznanej średniej frekwencji na wszystkich seansach. 1. Jaki poziom współczynnika ufności przyjęto przy estymacji? 2. Ile wynosiła średnia liczba widzów w zbadanej próbie 25 seansów kinowych? Zad 5 Poniższy szereg rozdzielczy przedstawia strukturę 1000 losowo wybranych mieszkań na osiedlu Ursynów w Warszawie według liczby izb. Liczba izb w mieszkaniu 2 3 4 5 6 Liczba mieszkań 96 288 404 168 44 Oszacowano na podstawie powyższej próby przedział liczbowy dla odsetka lokali 4-izbowych w populacji wszystkich mieszkań na Ursynowie: (37,4%; 43.4%). 1. Jaki współczynnik ufności przyjęto przy konstrukcji powyższego przedziału? 2. Jak zmieni się precyzja oszacowania, jeśli przy założeniu niezmienności struktury oraz przy tym samym współczynniku ufności liczebność próby zmniejszymy do 250 mieszkań? Zad 6 Jaka powinna być minimalna liczebność próby niezbędna do oszacowania odsetka uczniów zamierzających po maturze kontynuować studia, jeśli w klasie liczącej 40 uczniów 40% z nich nie zamierza kontynuować nauki w szkole wyższej? Przyjąć współczynnik ufności 0.90 i maksymalny błąd szacunku równy 6%. Zad 7 Zmienna losowa X ma rozkład Poissona z parametrem χ. Skonstruować przybliżony przedział ufności dla tego parametru oparty na próbie o dużej liczności n na poziomie ufności 1 - α. Zajęcia nr 11 Teoria: Parametryczne testy istotności dla: średniej, wariancji, wskaźnika struktury, dwóch średnich, dwóch wariancji, dwóch wskaźników struktury. Zad 1 Z wieloletnich obserwacji liczby kontuzji, jakim ulegli zawodnicy sekcji judo Warszawskiego Klubu Sportowego „Gwardia” wynika, że średnia liczba kontuzji wynosi 2 z odchyleniem standardowym równym 1,3. W grupie 25 losowo wybranych zawodników tej sekcji w 1994 r. zanotowano łącznie 55 kontuzji, a odchylenie standardowe liczby kontuzji było równe 1,5: Czy na podstawie powyższych wyników można uznać, że: 1. Średnia liczba kontuzji w 1994r. nie różniła się w porównaniu ze średnią w poprzednich latach? 2. Wariancja liczby kontuzji w 1994r. była wyższa w porównaniu z wariancją w poprzednich latach? Przyjąć poziom istotności 0.02. Zad 2 W teście badającym pamięć uczniów, dla 8 wylosowanych uczniów otrzymano następujące liczby zapamiętanych przez nich elementów: 16, 13, 14, 21, 19, 18, 26, 17. Natomiast po specjalnym treningu pamięci grupa ta wykazała następujące wyniki: 21, 17, 20, 26, 23, 22, 21, 18. Przyjmując poziom istotności alfa = 0.05 zweryfikować hipotezę, że trening zwiększa liczbę zapamiętanych przez uczniów elementów. Zad 3 Wysunięto hipotezę, że studenci AM palą rzadziej papierosy niż studenci Politechniki. W celu jej sprawdzenia wylosowano po 250 studentów z każdej uczelni i zapytano ich czy palą. W grupie studentów AM paliło 68 osób, a w grupie studentów Politechniki - 86 osób. 1. Na poziomie istotności równym 0.05 zweryfikować prawdziwość postawionej hipotezy. 2. Przy jakim poziomie istotności podjęta decyzja weryfikacyjna może ulec zmianie? Zad 4 Analiza rozkładu ocen z matematyki uzyskanych w dwóch 100-osobowych, losowo wybranych grupach kandydatów zdających do liceów ogólnokształcących na kierunek matematyczno-fizyczny i biologiczno-chemiczny dostarczyła m.in. informacji, że wartość drugiego momentu centralnego w rozkładzie ocen na kierunek matematyczno-fizyczny wynosiła 0.7424, a na kierunek biologiczno-chemiczny – 1.6016. 1. Czy na tej podstawie można uznać, że wariancje ocen z matematyki na oba kierunki są różne? 2. Określić graniczny poziom istotności, przy którym następuje zmiana w podejmowaniu decyzji weryfikacyjnej. Zad 5 W grupie 100 losowo wybranych pracowników Banku PKO S.A. 36 osób otrzymało w lutym 1995r. premię w wysokości 15-20%. W lutym 1994r. w podobnej próbie 100 pracowników premię w takiej wysokości otrzymały 24 osoby. 1. Czy można twierdzić, że odsetek ogółu pracowników Banku PKO S.A. otrzymujących premię w wysokości 15-20% był w 1994r. niższy w porównaniu z rokiem 1995? Przy weryfikacji przyjąć poziom istotności równy 0.05. 2. Do jakiego przedziału liczbowego powinna należeć wartość odpowiedniej statystyki z próby, aby nie było podstaw do odrzucenia hipotezy zerowej? Zad 6 Rozkład tygodniowego czasu poświęconego na naukę poza uczelnią studentów I roku studiów dziennych SGH jest rozkładem N(m,5), natomiast w rozkładzie normalnym tygodniowego czasu studentów II roku odchylenie standardowe wynosi 6 godzin. Pobrano niezależnie 10 elementową próbę studentów I roku oraz 24 elementową studentów II roku; średnie w tych próbach wynosiły odpowiednio: 20 godzin oraz 15 godzin. 1. Czy na poziomie istotności 0,1 można przyjąć iż średni czas nauki poza uczelnią ogółu studentów I roku jest wyższy niż na roku II. 2. Do jakiego przedziału liczbowego powinny należeć wartości odpowiedniej statystyki, aby nie było podstaw do odrzucenia weryfikowanej hipotezy? Zajęcia nr 12 Teoria: Testy zgodności: Chi-kwadrat Pearsona, Kołmogorowa. Zad 1 Koszty materiałowe w pewnej gałęzi gospodarki narodowej przy produkcji pewnego wyrobu były w wylosowanych 120 zakładach następujące (w zł): Dochody 150250350450550650750850950250 350 450 550 650 750 850 950 1050 Liczba studentów 7 10 21 30 19 15 10 6 2 Na poziomie istotności alfa=0.10 zweryfikować hipotezę, że rozkład kosztów materiałowych przy produkcji tego wyrobu jest normalny N(540, 200). (test Kolmogorowa) Zad 2 W celu sprawdzenia, czy kostka sześcienna do gry jest rzetelna (symetryczna) wykonano 120 rzutów tą kostką i otrzymano następujące wyniki: Liczba oczek Liczba rzutów 1 11 2 30 3 14 4 10 5 33 6 22 Na poziomie istotności zweryfikować hipotezę, że wszystkie liczby oczek w rzucie tą kostką mają identyczne prawdopodobieństwo wyrzucenia. (test chi-kwadrat Pearsona) Zad 3 Rozkład liczby brakujących zapałek w pudełkach o nominalnej liczbie 48 zapałek był w wylosowanych 260 pudełkach zapałek następujący: Liczba brakujących 0 1 2 3 4 5 6 7 8 9 zapałek Liczba pudełek 9 18 36 53 54 41 27 14 5 3 Na poziomie istotności zweryfikować hipotezę, że rozkład liczby brakujących zapałek w pudełkach jest rozkładem Poissona. (test chi-kwadrat Pearsona) Zad 4 Zakłada się, że rozkład wagi noworodków (w kg) jest rozkładem normalnym o wartości średniej równej 3.5kg oraz odchyleniu standardowym 0.5kg. Na podstawie losowej próby 200 noworodków ustalono, co następuje: Numer przedziału 1 2 3 4 5 6 7 Ogółem Liczebności teoretyczne 10 15 50 ..... .... 20 18 200 w przedziale 1. Obliczyć i zinterpretować liczebności teoretyczne w czwartym i piątym przedziale, wiedząc, że [xo4, x14]= [3.0; 3.5]. 2. Z jakiego przedziału liczbowego pochodzi obliczona wartość statystyki chi-kwadrat, jeśli przy poziomie istotności równym 0.1 nie odrzucamy hipotezy zerowej? Zajęcia nr 13 Teoria: Moc testu; Test ilorazowy Zad 1 Weryfikację hipotezy o wadliwości p pewnej partii towaru przeprowadzono w oparciu o wynik pięcioelementowej (n=5) próby prostej za pomocą następującego testu: jeżeli w próbie zaobserwujemy więcej niż jedną sztukę wadliwą to hipotezę H0 odrzucamy w przeciwnym przypadku nie ma podstaw do jej odrzucenia. Znaleźć poziom istotności testu oraz prawdopodobieństwo błędu drugiego rodzaju, jeśli : H0 : p = 0.2 oraz H1: p = 0.3 Zad 2 Do weryfikacji hipotezy H0:X~N(4,3) przy alternatywie H1:N(2,2) zastosowano test xn <c(n), gdzie xn jest średnią z próby (H0 odrzucamy, gdy xn<c(n)). Wyznaczyć taką liczbę c(n) aby poziom istotności alfa=0.05. Jaka powinna być liczba pomiarów n, aby moc testu była nie mniejsza niż 0.99. Zad 3 Zmienna X ma rozkład Poissona o parametrze λ. Chcemy zweryfikować na poziomie istotności α ≤ 0.05 hipotezę H0: λ=0.02 przeciwko alternatywie H1: 1.0. Dysponujemy próbą 5-elementową. Jaka może być maksymalna moc tego testu? Zad 4 W celu weryfikacji hipotezy H0: X – N(1,2), H1: X – N(-2,3) na poziomie istotności 0.05 pobrano próbkę 10-elementową. Jaka jest moc testu o obszarze krytycznym K=[-2.0; 0]. Jaki jest obszar krytyczny i moc testu najmocniejszego?