Testowanie hipotez

advertisement
Testowanie hipotez
Niech X = (X1 , . . . , Xn ) będzie próbą losową na przestrzeni X , zaś P = {Pθ , θ ∈ Θ}
rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby X .
Definicja 1. Hipotezą zerową Θ0 ⊂ Θ nazywamy hipotezę, której prawdziwość chcemy
zweryfikować na podstawie obserwacji. Hipoteza alternatywna jest postaci Θ1 = Θ\Θ0 .
Hipoteza prosta zawiera jeden element, np. H0 : θ = 2, hipoteza złożona zawiera więcej
niż jeden element, np. H0 : θ > 4.
Definicja 2. Obszar krytyczny testu jest to obszar odrzucenia hipotezy zerowej. Najczęściej ma on postać K = {X : T (X) > c}, gdzie c jest poziomem krytycznym testu,
wyznaczonym przez kwantyl rozkładu, z jakiego pochodzi statystyka testowa przy założeniu prawdziwości hipotezy zerowej (zależy on od przyjętego poziomu istotności testu).
Definicja 3. Test można identyfikować z jego obszarem krytycznym K lub funkcją krytyczną ϕ : X −→ {0, 1} postaci
1, gdy X ∈ K,
ϕ(X) = 1K (X) =
0, gdy X ∈
/ K,
Definicja 4. Prawdopodobieństwo błędu pierwszego rodzaju to prawdopodobieństwo odrzucenia hipotezy zerowej, gdy jest ona prawdziwa:
αI (θ) = Pθ (X ∈ K),
θ ∈ Θ0 .
Definicja 5. Prawdopodobieństwo błędu drugiego rodzaju to prawdopodobieństwo przyjęcia hipotezy zerowej, gdy jest ona fałszywa:
αII (θ) = Pθ (X ∈ K c ) = 1 − Pθ (X ∈ K),
θ ∈ Θ1 .
Definicja 6. Funkcją mocy testu nazywamy β : Θ −→ [0, 1] postaci
β(θ) = Pθ (X ∈ K) = Eθ ϕ(X).
Z reguły bada się moc testu na alternatywie, czyli θ = θ1 .
Definicja 7. Test o funkcji krytycznej ϕ (o obszarze krytycznym K) jest testem na
poziomie istotności α ∈ (0, 1), jeżeli
∀θ∈Θ0
Eθ ϕ(X) = Pθ (X ∈ K) = β(θ) ≤ α.
Definicja 8. Rozmiarem testu o funkcji krytycznej ϕ (obszarze krytycznym K) nazywamy
wielkość
β = sup Eθ ϕ(X) = sup β(θ).
θ∈Θ0
∗
θ∈Θ0
∗
Definicja 9. Test ϕ (K ) na poziomie istotności α jest testem jednostajnie najmocniejszym (JNM) w klasie testów Φ (K) na poziomie α, jeżeli
∀ϕ∈Φ
β ∗ (θ) ≥ β(θ).
∀θ∈Θ1
1
Twierdzenie (podstawowy lemat Neymana-Pearsona) Niech P0 i P1 będą rozkładami prawdopodobieństwa i niech f0 i f1 będą gęstościami tych rozkładów (względem
pewnej ustalonej miary µ). Niech α ∈ (0, 1) będzie ustaloną liczbą.
(a) (istnienie testu) Istnieją stałe c i

 1,
γ,
ϕ(x) =

0,
γ > 0 takie, że
gdy f1 (x) > cf0 (x),
gdy f1 (x) = cf0 (x),
gdy f1 (x) < tf0 (x),
jest testem hipotezy H0 : P0 przeciwko H1 : P1 na poziomie istotności α, tzn.
E0 ϕ(X) = α.
(1)
(b) (dostateczność) Jeżeli test ϕ spełnia warunek (1) i dla pewnego c warunek
1, gdy f1 (x) > cf0 (x),
ϕ(x) =
(2)
0, gdy f1 (x) < tf0 (x),
to ϕ jest testem najmocniejszym dla testowania H0 przeciwko H1 na poziomie istotności α.
(c) (konieczność) Jeżeli φ jest testem najmocniejszym na poziomie istotności α dla
testowania H0 przeciwko H1 , to dla pewnego c spełnia on warunek (2).
Podsumowując, test statystyczny składa się z:
1. Hipotezy zerowej H0 i hipotezy alternatywnej H1 ,
2. Statystyki testowej T (X),
3. Obszaru krytycznego K.
4. Poziomu istotności α,
Decyzja: jeżeli T (X) ∈ K, to odrzucamy hipotezę H0 , jeżeli T (X) ∈
/ K, to nie mamy
podstaw do odrzucenia hipotezy zerowej.
Definicja 10. P-wartość (p-value) to graniczny poziom istotności - najmniejszy, przy którym zaobserwowana wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej.
Jest to więc taki poziom istotności, przy którym zmienia się decyzja testu (zaczynając
od lewej - od małego poziomu α, kiedy to nie mamy podstaw do odrzucenia H0 , po
przekroczeniu p-wartości zaczynamy odrzucać H0 ).
P-wartość pozwala bezpośrednio ocenić wiarygodność hipotezy. Im p-wartość jest
większa, tym bardziej hipoteza H0 jest prawdziwa. Mała p-wartość świadczy przeciwko
hipotezie zerowej.
Znajomość p-wartości pozwala przeprowadzić testowanie dla dowolnego poziomu istotności:
-odrzucamy hipotezę zerową H0 , gdy
p-wartość ≤ α,
-nie mamy podstaw do odrzucenia hipotezy zerowej H0 , gdy
p-wartość > α.
2
Test Chi-kwadrat zgodności
nr klasy
liczebności empiryczne
1
n1
2
n2
3
n3
4
n4
5
n5
...
...
• Hipotezy
H0 : X ∼ F,
H1 : X F,
F jest dowolnym rozkładem prawdopodobieństwa.
• Statystyka testowa
χ2 =
k
X
(ni − nt )2
i
i=1
nti
,
gdzie
k - liczba klas,
ni - liczebności empiryczne (zaobserwowane),
nti = n · pti - liczebności teoretyczne,
pti = PF (Xprzyjeła wartosc z klasy i) - prawdopodobieństwa teoretyczne.
Przy założeniu prawdziwości hipotezy zerowej statystyka χ2 ma rozkład chi-kwadrat
z (k − r − 1) stopniami swobody (r jest liczbą nieznanych parametrów hipotetycznego rozkładu F ).
• Obszar krytyczny
(1 − α), +∞),
K = (Fχ−1
2
k−1
gdzie Fχ−1
(1 − α) jest kwantylem rzędu 1 − α rozkładu chi-kwadrat z (k − r − 1)
2
k−1
stopniami swobody.
Test Chi-kwadrat niezależności
Tablica kontyngencji:
Cecha 1
2 ...
n12 . . .
n22 . . .
... ...
nr2 . . .
Cecha 2 1
1
n11
2
n21
...
...
r
nr1
k
n1k
n23
...
nrk
• Hipotezy
H0 : X, Y są niezależne,
3
vs H1 : X, Y są zależne
• Statystyka testowa
k X
r
X
(nij − ntij )2
χ =
,
ntij
j=1 i=1
2
gdzie
k - liczba kolumn w tablicy kontyngencji,
r - liczba wierszy w tablicy kontyngencji,
nij - liczebności empiryczne (zaobserwowane),
ntij - liczebności teoretyczne, dane wzorem
k
P
ntij
gdzie n =
k P
r
P
=
nij ·
j=1
r
P
nij
i=1
n
,
nij .
j=1 i=1
Przy założeniu prawdziwości hipotezy zerowej statystyka χ2 ma rozkład chi-kwadrat
z (k − 1)(r − 1) stopniami swobody.
• Obszar krytyczny
K = (Fχ−1
2
(1 − α), +∞),
(k−1)(r−1)
gdzie Fχ−1
(1 − α) jest kwantylem rzędu 1 − α rozkładu chi-kwadrat z (k − r − 1)
2
k−1
stopniami swobody.
Test Kołmogorowa
Test Kołmogorowa testuje zgodność z rozkładem F dla jednej próby (Test Kołmogorowa
- Smirnowa dla dwóch prób testuje zgodność rozkładów w obu próbach).
• Hipotezy
H0 : X ∼ F,
H1 : X F,
gdzie F jest ciągłym rozkładem prawdopodobieństwa.
1. n ≤ 100
• Statystyka testowa
i
i
−
1
, − F (Xi:n )
Dn = sup |F (x) − Fn (x)| = max max F (Xi:n ) −
,
1≤i≤n
n n
x∈R
4
• Obszar krytyczny
K = (FD−1n (1 − α), 1],
gdzie FD−1n (1−α) jest kwantylem rzędu 1−α rozkładu statystyki Kołmogorowa (Dn ).
2. n > 100
• Statystyka testowa
√
nDn ,
• Obszar krytyczny
K = (λ1−α , +∞),
gdzie λ√1−α jest kwantylem rzędu 1 − α granicznego rozkładu statystyki Kołmogorowa ( nDn ).
Test Shapiro-Wilka
Jest to test normalności rozkładu.
• Hipotezy
H0 : X ∼ N,
H1 : X N
• Statystyka testowa
W =
n
P
2
ai xi:n
i=1
n
P
,
(xi −
x)2
i=1
gdzie stałe ai są dane wzorem
(a1 , . . . , an ) = √
m> V −1
m> V −1 V −1 m
,
gdzie m = (m1 , . . . , mn )> , są wartościami oczekiwanymi statystyk pozycyjnych z
pochodzących z próby iid z rozkładu standardowego normalnego a V jest ich macierzą kowariancji (stablicowane).
• Obszar krytyczny
K = (Wn (1 − α), +∞),
gdzie Wn (1 − α) jest kwantylem rzędu 1 − α rozkładu statystyki Shapiro-Wilka W .
5
Test t-studenta
Jest to test parametryczny dla jednej lub dwóch prób, polegający na testowaniu równości
wartości oczekiwanych (test istotności). Zakładamy, że pomiary podlegają rozkładowi
normalnemu, oraz że wariancje w próbach nie różnią się od siebie istotnie.
1. Test t dla jednej próby
• Hipotezy
H0 : µ = µ0 ,
H1 : µ > µ0 ,
µ < µ0 ,
µ 6= µ0
(3)
(4)
(5)
• Statystyka testowa
T =
gdzie s2X =
1
n−1
n
P
√ X̄ − µ0
n
,
sX
(Xi − X̄)2 to próbkowe odchylenie standardowe. Statystyka te-
i=1
stowa T ma rozkład t-studenta o (n − 1) stopniach swobody.
• Obszar krytyczny
Zależy od postaci hipotezy alternatywnej w następujący sposób:
K1 = (Ft−1
(1 − α), +∞),
n−1
K2 = (−∞, −Ft−1
(1 − α)),
n−1
−1
(1 − α2 ), +∞),
K3 = (−∞, −Ftn−1 (1 − α2 )) ∪ (Ft−1
n−1
gdzie Ft−1
(a) to kwantyl rzędu a rozkładu t-studenta z (n − 1) stopniami swobody.
n−1
Jeżeli wariancja rozkładu jest znana, wówczas sX zastępujemy przez odchylenie
standardowe rozkładu, zaś Ft−1
(a) zastępujemy przez Φ−1 (a).
n−1
2. Test t dla dwóch prób niezależnych
• Hipotezy
H0 : µ1 = µ2 ,
H1 : µ1 6= µ2
• Statystyka testowa
T =
X̄1 − X̄2
,
SX̄1 −X̄2
gdzie
s
SX̄1 −X̄2 =
(n1 − 1)s21 + (n2 − 1)s22
n1 + n2 − 2
1
1
+
,
n1 n2
s1 , s2 to nieznane odchylenia standardowe z próbek, zaś n1 , n2 to liczebności próbek.
Statystyka testowa T ma rozkład t-studenta o (n1 + n2 − 2) stopniach swobody.
6
• Obszar krytyczny
(1 −
K = (−∞, −Ft−1
n1 +n2 −2
α
α
(1 − ), +∞)
)) ∪ (Ft−1
n1 +n2 −2
2
2
3. Test dla dwóch prób zależnych
• Hipotezy
H0 : µ1 = µ2 ,
H1 : µ1 6= µ2
• Statystyka testowa
T =
d¯
,
Sd¯
gdzie
n
1X
d¯ =
di ,
n i=1
di = x1i − x2i , i = 1, . . . , n,
v
u
n
u 1 X
t
¯ 2,
Sd¯ =
(di − d)
n − 1 i=1
zaś x1i , x2i oznaczają wartości cechy X dla i-tego obiektu w pierwszym i drugim
badaniu. Statystyka testowa T ma rozkład t-studenta o (n − 1) stopniach swobody.
• Obszar krytyczny
K = (−∞, −Ft−1
(1 −
n−1
α
α
)) ∪ (Ft−1
(1 − ), +∞)
n−1
2
2
UWAGA: Gdy liczebność próby jest duża (n > 30, n1 + n2 > 30), to kwantyl rozkładu
t-studenta zastępujemy przez kwantyl rozkładu standardowego normalnego (Ft−1
' Φ).
n
7
Download