PRZEDZIAŁY UFNOŚCI DLA WARTOŚCI OCZEKIWANEJ Przeprowadzamy doświadczenia, w wyniku których mamy próbę losową (x1, . . . , xn). Na podstawie próby chcemy oszacować wartość nieznanego parametru θ (tutaj rozważamy tylko przypadek, gdy θ = µ, czyli jest nieznaną wartością oczekiwaną rozkładu cechy). Pojęcie przedziału ufności precyzuje ideę estymacji z określoną dokładnością. Niech α ∈ (0, 1) będzie ustaloną liczbą (standardowo α = 0.05); liczbę 1 − α nazywamy poziomem ufności. Definicja. Estymatorem przedziałowym (przedziałem ufności) parametru µ na poziomie ufności 1 − α nazywamy przedział [µ−, µ+], końce którego są statystykami (czyli µ− = µ−(x1, . . . , xn), µ+ = µ+(x1, . . . , xn)), taki, że dla dowolnego µ zachodzi P (µ ∈ [µ−, µ+]) > 1 − α. Tak naprawdę, zawsze staramy się skonstruować przedział ufności, dla którego powyższe prawdopodobieństwo jest równe 1 − α, ponieważ im mniejsze jest prawdopodobieństwo, tym, na ogół, krótszy jest przedział 1 [µ−, µ+], a krótszy przedział, przy takim samym poziomie ufności, oznacza bardziej precyzyjne oszacowanie. Konstrukcja przedziałów ufności dla przypadków: 1. cecha ma rozkład normalny, wariancja σ 2 jest znana; 2. cecha ma rozkład normalny, wariancja σ 2 nie jest znana; 3. cecha ma rozkład dowolny, ale n jest duże. 1. {xi} - niezależne zmienne losowe o rozkładzie √ x̄−µ σ2 2 N (µ, σ ) =⇒ x̄ ∼ N (µ, n ) =⇒ n σ ∼ N (0, 1). Bierzemy taką liczbę z1−α/2, żeby √ x̄ − µ P (−z1−α/2 6 n 6 z1−α/2) = 1 − α σ (liczba ta nazywana jest kwantylem rzędu 1 − α/2 rozkładu N (0, 1)). Estymator przedziałowy dla µ ma postać: [ ] σ σ [µ−, µ+] = x̄ − z1−α/2 √ , x̄ + z1−α/2 √ . n n Długość tego przedziału ufności wynosi 2z1−α/2 √σn i jest nielosowa. 2 √ ∑n 2 2. Zamiast σ bierzemy s = j=1 (xj − x̄) . √ X̄−µ Wówczas n S ma rozkład Studenta o (n − 1) stopniach swobody. Estymator przedziałowy dla µ ma postać: [ ] s s [µ−, µ+] = x̄ − t1−α/2,n−1 √ , x̄ + t1−α/2,n−1 √ , n n 1 n−1 gdzie t1−α/2 jest kwantylem rzędu 1 − α/2 rozkładu Studenta o (n − 1) stopniach swobody. Długość tego przedziału ufności wynosi 2t1−α/2,n−1 √sn i jest losowa. 3. (estymator przybliżony) √ x̄−µ Na mocy CTG zmienna losowa n σ dąży, według rozkładu, do zmiennej losowej o rozkładzie N (0, 1), gdy n → ∞. Jak też wiemy, s2 jest mocno zgodnym estymatorem σ 2, czyli s2/σ 2 → 1 z prawdopodobieństwem 1, gdy n → ∞. Stąd wnioskujemy, że s/σ → 1 z prawdopodobieństwem 1, gdy n → ∞. Zatem, na mocy znanego lematu Słuckiego, √ x̄ − µ s n → N (0, 1), → 1 =⇒ σ σ √ x̄ − µ s √ x̄ − µ n : = n → N (0, 1), n → ∞. σ σ s 3 Przybliżony estymator przedziałowy dla µ ma zatem postać: ] [ s s [µ−, µ+] = x̄ − z1−α/2 √ , x̄ + z1−α/2 √ . n n Przykład Jednostki statystyczne albo posiadają pewną własność (1), albo nie (0). Naszym celem jest oszacowanie nieznanej proporcji p jednostek posiadających tą własność. (x1, . . . , xn) - próba z rozkładu zero-jedynkowego o nieznanym prawdopodobieństwie p: P (X = 1) = p, P (X = 0) = 1−p, EX = p, VarX = p(1 − p). n Jako estymator punktowy dla p bierzemy pb = x1+···+x . n p(1−p) n Wówczas E pb = p, Varb p = Var x1+···+x = n n . Na mocy de Moivre’a-Laplace’a zmienna √ Twierdzenia losowa n √x̄−p dąży, według rozkładu, do zmienp(1−p) nej losowej o rozkładzie N (0, 1), gdy n → ∞. Oprócz tego, pb jest mocno zgodnym estymatorem dla p, skąd wynika, że pb(1 − pb√ ) jest mocno zgodnym estymatorem dla p(1−p), czyli √ pb(1−b p) p(1−p) → 1, gdy n → ∞, z prawdo- podobieństwem 1. A zatem na mocy już wspominanego 4 lematu Słuckiego mamy √ √ pb(1 − pb) √ pb − p pb − p n√ :√ = n√ → N (0, 1). p(1 − p) p(1 − p) pb(1 − pb) Przybliżony estymator przedziałowy dla p ma zatem postać: [ ] √ √ pb(1 − pb) pb(1 − pb) [p−, p+] = pb − z1−α/2 , pb + z1−α/2 . n n Dla dobrego przybliżenia, oprócz wymaganego warunku, że n jest duże (powiedzmy n > 100), często wymagane jest, by nb p > 5 oraz n(1 − pb) > 5. 5