ĆWICZENIA nr 6 Cel zajęć: Zdefiniowanie pojęcia estymacji przedziałowej, konstrukcja przedziałów ufności dla wartości oczekiwanej oraz wyznaczanie minimalnej liczebności próby niezbędnej do uzyskania przedziału ufności o zadanej długości. Wprowadzenie teoretyczne Estymator, czyli określona na podstawie próby ocena parametru, stanowi jego przybliżoną wartość. Do estymacji można podejść również w inny sposób – określić przedział, w którym znajduje się prawdziwa wartość parametru. Przedział taki nazywany jest przedziałem ufności. Ustala się go dla z góry założonego prawdopodobieństwa α. Przedział (x1, x2) jest przedziałem ufności parametru µ, określonym na poziomie ufności 1-α, jeżeli P(x1 < µ < x2) = 1 – α. Przedział (x1, x2), w którym x1 i x2 przyjmują wartości skończone, nazywa się dwustronnym przedziałem ufności. Liczbę 1 – α nazywa się współczynnikiem ufności. Załóżmy, że badana cecha X ma w populacji rozkład normalny o nieznanej wartości oczekiwanej µ oraz znanym odchyleniu standardowym σ. Z populacji została wylosowana nelementowa próba. Najkrótszy przedział ufności dla parametru µ jest wówczas postaci: − , + √ √ gdzie jest kwantylem rozkładu normalnego rzędu 1 − . Jeżeli badana cecha X ma w populacji rozkład normalny o nieznanej wartości oczekiwanej µ oraz nieznanym odchyleniu standardowym σ, wówczas najkrótszy przedział ufności dla parametru µ jest postaci: − , , + , √ − 1 √ − 1 gdzie , jest kwantylem rozkładu t Studenta rzędu 1 − o − 1 stopniach swobody oraz = ∑ − . Jeżeli mamy cechę X o dowolnym rozkładzie o nieznanej wartości oczekiwanej µ i nieznanej skończonej wariancji σ2 oraz próbę wylosowanej z tej populacji o liczebności równej przynajmniej 100, wówczas najkrótszy przedział ufności dla parametru µ jest postaci: ∗ ∗ − , + √ √ gdzie jest kwantylem rozkładu normalnego rzędu 1 − oraz ∗ = ∑ − . Na ogół długość przedziału ufności maleje wraz ze wzrostem wielkości próby. W przypadku, gdy zależy nam na tym, aby konstruowany przedział ufności nie przekraczał pewnej długości 2l, wyliczamy minimalną liczebność próby niezbędnej do wyznaczenia tego przedziału. Jeżeli badana cecha ma w populacji rozkład normalny o znanym odchyleniu standardowym σ, wówczas minimalną liczbę elementów do konstrukcji przedziału dla wartości oczekiwanej µ wyznacza się z wzoru: = " #+1 ! gdzie [] oznacza wartość całkowitą z danej liczby oraz jest kwantylem rozkładu normalnego rzędu 1 − . Zadania 1. Wyznaczyć przedziały ufności oraz ich długości dla prób zawartych w plikach średnia5_10.txt, średnia5_100.txt i średnia5_1000.txt: (a) na poziomie ufności 95% przy znanym σ, (b) na poziomie ufności 99% przy znanym σ, (c) na poziomie ufności 95%, przy założeniu, że σ nie jest znane, (d) na poziomie ufności 99%, przy założeniu, że σ nie jest znane. 2. Odpowiedzieć na następujące pytania. (a) Jak założony poziom ufności wpływa na długość przedziału ufności? (b) Jak wielkość próby wpływa na długość przedziału ufności wielkość próby? (c) Jak zmienność cechy wpływa na długość przedziału ufności? (d) Jak wpływa na długość przedziału ufności fakt, że znana jest wariancja cechy dla całej populacji? 3. Policzono jaja złożone w 20 jamkach lęgowych przez ślimaka winniczka, otrzymując średnią 30.8 jaj w jamce, z odchyleniem standardowym 6.2 jaja. Zakładając, że badana próba jest niezależną próba losową oraz, że badana cecha ma rozkład normalny, dla średniej liczby jaj w jamce lęgowej wyznaczyć przedział ufności na poziomie 95% i 99%. Obliczyć i porównać długości przedziałów. 4. Zmierzono czaszki 15 samców kozic z Tatr. Średnia długość czaszki wyniosła 198,1 mm, a odchylenie standardowe to 15,2 mm. Wyznaczyć przedział ufności na poziomie 95% dla wartości oczekiwanej długości czaszki samców kozic z Tatr. Przyjąć, że badana cecha ma rozkład normalny. 5. Wykonuje się pomiary głębokości morza w pewnym określonym miejscu. Ilu niezależnych pomiarów należy dokonać, aby utworzyć przedział ufności na poziomie 95% i wyznaczyć średnią głębokość morza z błędem nie przekraczającym 10 m? Przyjąć, że rozkład cechy jest normalny z wariancją σ2 = 180 m2. Ile powinno być takich pomiarów do utworzenia przedziału ufności na poziomie 99%? Porównać i uzasadnić otrzymane wyniki. 6. Z grupy robotników pewnego zakładu produkcyjnego, wykonujących tę samą pracę, wybrano w sposób losowy 13 pracowników i zbadano wydajność ich pracy (w sztukach na godzinę). Uzyskano następujące wyniki: 21, 12, 11, 15, 9, 10, 17, 8, 16, 13, 12, 9, 18. Zakładając, że badana cecha ma rozkład normalny, wyznaczyć przedział ufności na poziomie 95% dla wartości oczekiwanej wydajności pracy w tym zakładzie. 7. Zmierzono średnice 151 drzew wybranych losowo z lasu sosnowego i otrzymano średnią średnicę równą 37.3 cm oraz wariancję próbkowa równą 13.5 cm2. Wyznaczyć przedział ufności na poziomie 99% dla wartości oczekiwanej średnicy sosny w tym lesie. 8. Obliczyć niezbędną ilość pomiarów, jaką należy wykonać w celu skonstruowania przedziału ufności na poziomie 95% o długości nie przekraczającej 0.08 mm dla wartości oczekiwanej grubości tkaniny, wiedząc, że badana cecha ma rozkład normalny z odchylenie standardowym σ = 0.1 mm. Źródła: Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M. „Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach – część II: Statystyka matematyczna”, PWN, Warszawa 2004 Łomnicki A. „Wprowadzenie do statystyki dla przyrodników”, PWN, Warszawa 2007 Magiera R. „Modele i metody statystyki matematycznej”, Oficyna Wydawnicza GiS, Wrocław 2002 Żuk B. „Biometria stosowana”, PWN, Warszawa 1989