Przedziały ufności dla wariancji i odchylenia standardowego. Model

advertisement
Przedziały ufności dla wariancji i odchylenia standardowego.
Model I.
Cecha X populacji genaralnej ma rozkład normalny N (µ, σ). W oparciu o wyniki małej próby (n < 50) szacujemy
metodą przedziałową nieznaną wariancję σ 2 (lub odchylenie standardowe σ) przy nieznanej wartości średniej µ.
Przedział ufności budujemy w oparciu o statystykę
nS 2
.
σ2
2
2
Z teorii statystyki wiadomo, że zmienna nS
σ 2 ma rozkład χ (chi-kwadrat) o n − 1 stopniach swobody. Oznacza to, że
w tablicach tego rozkładu dla n − 1 stopni swobody można znaleźć zawsze takie liczby χ21 oraz χ22 , aby przy ustalonym
z góry współczynniku ufności 1 − α spełniona była zależność
nS 2
P χ21 < 2 < χ22 = 1 − α.
σ
Na liczby χ21 oraz χ22 nakłada się warunek
P (χ2 < χ21 ) = P (χ2 > χ22 ) =
1
α.
2
Dla ustalonego współczynnika ufności 1 − α, liczbę χ21 odczytujemy z tablic wartości krytycznych rozkładu χ2 dla
prawdopodobieństwa 1 − 12 α, zaś liczbę χ22 dla prawdopodobieństwa 12 α przy n − 1 stopniach swobody.
Po przekształceniach otrzymujemy przedział ufności dla parametru σ 2
2
nS
nS 2
σ2 ∈
,
.
χ22
χ21
Po uwzględnieniu równości nS 2 = (n − 1)Ŝ 2 otrzymujemy równoważny przedział ufności dla parametru σ 2
!
(n − 1)Ŝ 2 (n − 1)Ŝ 2
2
σ ∈
,
.
χ22
χ21
Dla odchylenia standardowego σ otrzymujemy przedział ufności
√ !
√
S n S n
σ∈ p 2, p 2
χ2
χ1
lub równoważny
σ∈
!
√
√
Ŝ n − 1 Ŝ n − 1
p
, p 2
.
χ22
χ1
Model II.
Cecha X populacji genaralnej ma rozkład normalny N (µ, σ) lub asymptotycznie normalny. W oparciu o wyniki
dużej próby (n > 50) szacujemy metodą przedziałową nieznane odchylenie standardowe σ przy nieznanej wartości
średniej µ.
Zmienna losowa S dla dużej próby ma rozkład asymptotycznie normalny N (σ, √σ2n ), zatem zmienna losowa
U=
S−σ
√σ
2n
=
S − σ√
2n
σ
ma rozkład normalny N (0, 1). Oznacza to, że istnieje takie uα , że dla ustalonego współczynnika ufności 1−α spełniony
jest warunek
S − σ√ P 2n < uα ≈ 1 − α.
σ
Po przekształceniach otrzymujemy następujący przedział ufności dla parametru σ
!
√
√
S 2n
S 2n
, √
.
σ∈ √
2n + uα
2n − uα
1
Przedział ufności dla wskaźnika struktury.
Dotychczas przy budowie przedziałów ufności uwzględnialiśmy tylko cechy (zmienne losowe) o charakterze mierzalnym.
W praktyce jednak często dysponujemy informacjami o charakterze jakościowym. Wtedy informacje ograniczają się
tylko do dwóch wielkości: n - liczby obserwacji w próbie oraz k - liczby elementów wyróżnionych w tej próbie ze względu
na określoną cechę X. Takie zagadnienie sprowadza się do oszacowania prawdopodobieństwa p zdarzenia losowego
(wskaźnika struktury), a więc prawdopodobieństwa wylosowania z danej populacji elementu posiadającego cechę X.
Prawdopodobieństwo p interpretowane jest jako wskaźnik struktury elementów z wyróżnioną cechą w rozpatrywanej
populacji.
Estymatorem wskaźnika struktury jest statystyka K
n , gdzie K jest liczbą sztuk wyróżnonych w n-elementowej próbie.
Wartość tej statystyki dla określonej próby oznaczona będzie przez nk .
Budowa przedziału ufności dla wskaźnika struktury p (zwanego też frakcją) opiera się na rozkładzie estymatora K
n
(dokładnym lub granicznym). Przypadek małej próby jest uciążliwy rachunkowo, więc opracowano tablice, które
podają przedziały ufności dla wskaźników struktury w przypadku małych prób. Jeżeli natomiast dysponujemy dużą
próbą, to wykorzystujemy graniczny rozkład estymatora K
n.
!
r
p(1 − p)
K
Dla dużej próby (n > 100) estymator n ma rozkład asymtotycznie normalny N p,
. Wynika stąd, że
n
dla ustalonego współczynnika ufności 1 − α można znaleźć w tablicach rozkładu normalnego N (0, 1) taką liczbę uα ,
dla której spełniony jest warunek


K
P −uα < qn
−p
p(1−p)
n
Przybliżony przedział ufności określa więc wzór
s

K
(1 −
K
p ∈  − uα n
n
n
K
n)
< uα  = 1 − α.
s
K
,
+ uα
n
K
n (1
−
n

K
n )
.
Rozkład χ2
— Zmienna losowa χ2 ma rozkład χ2 o n stopniach swobody, jeżeli jej funkcja gęstości wyraża się wzorem

0
dla x 6 0,


f (x) =
1 n−1 − 1 x

 x 2 e n2
dla x > 0.
2
Γ( n
2 )2
— Funkcja Γ nazywa się funkcją gamma Eulera i jest określona wzorem
+∞
Z
Γ(x) =
tx−1 e−t dt, x > 0.
0
— Liczbę
χ2α
2
taką, że P (χ >
χ2α )
+∞
Z
=
f (x)dx = α nazywamy wartością krytyczną rozkładu zmiennej losowej
χ2α
χ2 .
— Wartości krytyczne χ2α dla danego α i danej liczby stopni swobody n są stablicowane.
— Wraz ze wzrostem liczby stopni swobody do nieskończoności rozkład χ2 dąży do rozkładu normalnego. Gdy liczba
stopni swobody jest większa od 30, rozkład normalny daje na ogół dostatecznie dobre przybliżenie rozkładu χ2 .
2
Download