PRZEDZIAŁY UFNOŚCI DLA WARTOŚCI OCZEKIWANEJ

advertisement
PRZEDZIAŁY UFNOŚCI DLA WARTOŚCI
OCZEKIWANEJ
Przeprowadzamy doświadczenia, w wyniku których mamy próbę losową (x1, . . . , xn). Na podstawie próby chcemy oszacować wartość nieznanego parametru θ (tutaj
rozważamy tylko przypadek, gdy θ = µ, czyli jest nieznaną wartością oczekiwaną rozkładu cechy).
Pojęcie przedziału ufności precyzuje ideę estymacji z
określoną dokładnością.
Niech α ∈ (0, 1) będzie ustaloną liczbą (standardowo
α = 0.05); liczbę 1 − α nazywamy poziomem ufności.
Definicja. Estymatorem przedziałowym (przedziałem
ufności) parametru µ na poziomie ufności 1 − α nazywamy przedział [µ−, µ+], końce którego są statystykami
(czyli µ− = µ−(x1, . . . , xn), µ+ = µ+(x1, . . . , xn)), taki,
że dla dowolnego µ zachodzi
P (µ ∈ [µ−, µ+]) > 1 − α.
Tak naprawdę, zawsze staramy się skonstruować przedział ufności, dla którego powyższe prawdopodobieństwo jest równe 1 − α, ponieważ im mniejsze jest prawdopodobieństwo, tym, na ogół, krótszy jest przedział
1
[µ−, µ+], a krótszy przedział, przy takim samym poziomie ufności, oznacza bardziej precyzyjne oszacowanie.
Konstrukcja przedziałów ufności dla przypadków:
1. cecha ma rozkład normalny, wariancja σ 2 jest znana;
2. cecha ma rozkład normalny, wariancja σ 2 nie jest
znana;
3. cecha ma rozkład dowolny, ale n jest duże.
1. {xi} - niezależne zmienne losowe o rozkładzie
√ x̄−µ
σ2
2
N (µ, σ ) =⇒ x̄ ∼ N (µ, n ) =⇒ n σ ∼ N (0, 1).
Bierzemy taką liczbę z1−α/2, żeby
√ x̄ − µ
P (−z1−α/2 6 n
6 z1−α/2) = 1 − α
σ
(liczba ta nazywana jest kwantylem rzędu 1 − α/2 rozkładu N (0, 1)). Estymator przedziałowy dla µ ma postać:
[
]
σ
σ
[µ−, µ+] = x̄ − z1−α/2 √ , x̄ + z1−α/2 √ .
n
n
Długość tego przedziału ufności wynosi 2z1−α/2 √σn i jest
nielosowa.
2
√
∑n
2
2. Zamiast σ bierzemy s =
j=1 (xj − x̄) .
√ X̄−µ
Wówczas n S ma rozkład Studenta o (n − 1) stopniach swobody. Estymator przedziałowy dla µ ma postać:
[
]
s
s
[µ−, µ+] = x̄ − t1−α/2,n−1 √ , x̄ + t1−α/2,n−1 √ ,
n
n
1
n−1
gdzie t1−α/2 jest kwantylem rzędu 1 − α/2 rozkładu
Studenta o (n − 1) stopniach swobody.
Długość tego przedziału ufności wynosi 2t1−α/2,n−1 √sn i
jest losowa.
3. (estymator przybliżony)
√ x̄−µ
Na mocy CTG zmienna losowa n σ dąży, według
rozkładu, do zmiennej losowej o rozkładzie N (0, 1), gdy
n → ∞. Jak też wiemy, s2 jest mocno zgodnym estymatorem σ 2, czyli s2/σ 2 → 1 z prawdopodobieństwem
1, gdy n → ∞. Stąd wnioskujemy, że s/σ → 1 z prawdopodobieństwem 1, gdy n → ∞. Zatem, na mocy
znanego lematu Słuckiego,
√ x̄ − µ
s
n
→ N (0, 1), → 1
=⇒
σ
σ
√ x̄ − µ s √ x̄ − µ
n
: = n
→ N (0, 1), n → ∞.
σ
σ
s
3
Przybliżony estymator przedziałowy dla µ ma zatem
postać:
]
[
s
s
[µ−, µ+] = x̄ − z1−α/2 √ , x̄ + z1−α/2 √ .
n
n
Przykład Jednostki statystyczne albo posiadają pewną
własność (1), albo nie (0). Naszym celem jest oszacowanie nieznanej proporcji p jednostek posiadających tą
własność.
(x1, . . . , xn) - próba z rozkładu zero-jedynkowego o nieznanym prawdopodobieństwie p:
P (X = 1) = p, P (X = 0) = 1−p, EX = p, VarX =
p(1 − p).
n
Jako estymator punktowy dla p bierzemy pb = x1+···+x
.
n
p(1−p)
n
Wówczas E pb = p, Varb
p = Var x1+···+x
=
n
n .
Na mocy
de Moivre’a-Laplace’a zmienna
√ Twierdzenia
losowa n √x̄−p dąży, według rozkładu, do zmienp(1−p)
nej losowej o rozkładzie N (0, 1), gdy n → ∞. Oprócz
tego, pb jest mocno zgodnym estymatorem dla p, skąd
wynika, że pb(1 − pb√
) jest mocno zgodnym estymatorem
dla p(1−p), czyli √
pb(1−b
p)
p(1−p)
→ 1, gdy n → ∞, z prawdo-
podobieństwem 1. A zatem na mocy już wspominanego
4
lematu Słuckiego mamy
√
√
pb(1 − pb) √
pb − p
pb − p
n√
:√
= n√
→ N (0, 1).
p(1 − p)
p(1 − p)
pb(1 − pb)
Przybliżony estymator przedziałowy dla p ma zatem
postać:
[
]
√
√
pb(1 − pb)
pb(1 − pb)
[p−, p+] = pb − z1−α/2
, pb + z1−α/2
.
n
n
Dla dobrego przybliżenia, oprócz wymaganego warunku,
że n jest duże (powiedzmy n > 100), często wymagane
jest, by nb
p > 5 oraz n(1 − pb) > 5.
5
Download