Metody probabilistyczne i statystyka Hipoteza statystyczna

advertisement
Hipoteza statystyczna
Hipoteza statystyczna - przypuszczenie dotycz ce rozkładu populacji
Rodzaje hipotez:
podział I
• parametryczne - dotycz warto ci parametru rozkładu np. wariancje dwóch populacji o
rozkładzie normalnym s sobie równe
• nieparametryczne - dotycz postaci funkcyjnej rozkładu populacji np.: populacja
generalna ma rozkład Poissona
podział II
• proste - hipotezy, które jednoznacznie specyfikuj rozkład populacji generalnej np.:
parametr λ w rozkładzie Poissona jest równy 3 (hipotez równie parametryczna)
• zło one - hipotezy, które niejednoznacznie specyfikuj rozkład populacji generalnej np.:
wariancja populacji generalnej jest wi ksza od 5
przy weryfikacji hipotez:
• hipoteza zerowa (H0) - bezpo rednio sprawdzana
• hipoteza alternatywna (H1) - hipoteza konkurencyjna do hipotezy H0.
(H0: m=2; H1:m=5); (H0: p=0.3; H1: p>0.3); (H0: f(x)=f0(x); H1:f(x) ≠ f1(x))
Metody probabilistyczne i statystyka
Wykład 3: Weryfikacja hipotez.
Testy istotno ci
Małgorzata Kr towska
Wydział Informatyki
Politechnika Białostocka
e-mail: [email protected]
Modele statystyczne (studia zaoczne)
1
Modele statystyczne (studia zaoczne)
Weryfikacja hipotez
2
Przykład cd
Weryfikuj c dan hipotez statystyczn na podstawie zaobserwowanych wyników
próby, ponosimy pewne ryzyko podj cia bł dnej decyzji. Mo liwe sytuacje
ilustruje tabelka:
0.4
g1
g0
Hipoteza H
Decyzja
jest prawdziwa
jest fałszywa
decyzja poprawna
decyzja bł dna
przyjmujemy H
1-α
β
bł d drugiego rodzaju
decyzja bł dna
decyzja poprawna
odrzucamy H
1-β
α
moc testu
bł d pierwszego rodzaju;
poziom istotno ci
f(x)
0.3
0.2
0.1
0.0
2
c
5
srednia arytmetyczna
obszar krytyczny
obszar krytyczny (K) - obszar odrzucenia hipotezy H0
w powy szym przypadku K∈<c, +∞)
Modele statystyczne (studia zaoczne)
3
Modele statystyczne (studia zaoczne)
4
Zale no bł dów I i II rodzaju
od liczno ci próby
Przykład cd
0.4
0.4
g1
g0
g1
0.2
f(x)
0.2
0.3
f(x)
g0
f(x)
0.5
0.1
0.1
2
0.0
β c α 5
1-α
α
2
c
5
g1
0.2
0.0
0.0
1-β
β
x ~ N m,
gdzie Zn - statystyka z próby
Modele statystyczne (studia zaoczne)
5
Testy istotno ci
5
srednia arytmetyczna
X~N(m,8)
n=16
1-α=P(Zn∉K/H0)
1- β=P(Zn∈K/H1)
c
2
c 5
srednia arytmetyczna
2
srednia arytmetyczna
srednia arytmetyczna
α=P(Zn∈K/H0)
β=P(Zn∉K/H1)
g0
0.1
X~N(m,8)
n=64
8
= N (m,2 )
16
x ~ N m,
8
= N (m,1)
64
Modele statystyczne (studia zaoczne)
6
Testowane hipotezy i obszary krytyczne
W praktyce wykorzystuje si testy, w których nie oblicza si bł du II rodzaju. Test
buduje si w ten sposób, aby zagwarantowa mał warto bł du I rodzaju,
dan z góry jako poziom istotno ci α. S to testy istotno ci.
Postaci hipotez w testach istotno ci:
Budowa testu istotno ci:
1. Ustalenie postaci hipotezy zerowej H0 i hipotezy alternatywnej H1
2. Wyznaczenie statystyki Zn z próby
3. Okre lenie obszaru krytycznego (K) przy danym poziomie istotno ci α
4. Sprawdzenie czy statystyka Zn nale y do obszaru krytycznego K
5. Sformułowanie wniosku:
– odrzuceniu hipotezy H0 na korzy H1 (przyj cie hipotezy H1)
– brak podstaw do odrzucenie hipotezy H0
H0: θ = θ0
(θ - parametr rozkładu populacji generalnej)
H1: θ ≠ θ0;
H1: θ > θ0;
H1: θ ≠ θ0
H1: θ < θ0
1.0
H0: θ = θ0
f(x)
f(x)
0.4
1.0
0.3
0.3
0.0
g1
g0
0.5
g0
α/2
α/2
0.0
Zn
obszar krytyczny dwustronny
Modele statystyczne (studia zaoczne)
7
Modele statystyczne (studia zaoczne)
8
Wnioskowanie w testach istotno ci
Testowane hipotezy i obszary krytyczne
H0: θ = θ0
H0: θ = θ0
H1: θ > θ0
H1: θ < θ0
1.0
α
0.0
0.5
g0
1.0
0.0
Zn
0.5
Zn
obszar krytyczny prawostrony
Modele statystyczne (studia zaoczne)
9
Warto
f(x)
f(x)
1.0
α
0.0
Zn
0.5
α
0.0
uα
uα
Zn
Modele statystyczne (studia zaoczne)
p (p-value)
g0
0.5
α
g0
obszar krytyczny lewostronny
0.0
1.0
1.0
g0
α
f(x)
0.5
statystyki z próby Zn nale y do obszaru krytycznego:
Zn ∈K => odrzucamy H0 na korzy hipotezy H1
(przyjmujemy H1)
• je eli warto statystyki z próby Zn nie nale y do obszaru krytycznego:
Zn ∉K => brak podstaw do odrzucenia hipotezy H0
(co nie jest jednoznaczne z przyj ciem H0)
Ad 1)
Ad 2)
f(x)
g0
f(x)
f(x)
1.0
• je eli warto
10
Testy dla warto ci redniej
g0
Postaci hipotez:
H0: m=m0
H1: m≠m0;
0.5
m>m0;
m<m0;
p
0.0
uα
α=P(Z < uα)
gdzie uα- warto
Model 1
Zało enia: próba losowa pobrana z populacji o rozkładzie N(m, σ); σ jest znane;
Zn
Estymator parametru m:
p=P(Z<Zn)
graniczna obszaru K
Zn – statystyka z próby
1
n
n
i =1
xi ~ N m,
σ
n
σ
Wnioskowanie:
je eli p ≤ α => odrzucamy H0 na korzy H1
je eli p>α => brak podstaw do odrzucenia hipotezy H0
Przy zało eniu prawdziwo ci hipotezy H0: x ~ N m0 ,
n
Standaryzuj c otrzymujemy statystyk U:
Warto p - najmniejszy poziom istotno ci, przy którym zaobserwowana
warto statystyki testowej prowadzi do odrzucenia hipotezy zerowej.
Modele statystyczne (studia zaoczne)
x=
U=
która ma rozkład N(0,1).
11
Modele statystyczne (studia zaoczne)
x − m0
σ
n
12
Testy dla warto ci redniej
Testy dla warto ci redniej
Model 2
Zało enia: próba losowa pobrana z populacji o rozkładzie N(m, σ); σ jest
nieznane; liczno próby mała (n ≤ 30)
Model 3
Zało enia: próba losowa pobrana z populacji o rozkładzie N(m, σ); σ jest
nieznane; liczno próby duza (n > 30)
Przy estymacji warto ci m korzystamy ze statystyki t Studenta z n-1 stopniami
swobody:
X −m
1 n
t=
n −1
s
=
( xi − X ) 2
s
n
Estymator parametru m:
Modele statystyczne (studia zaoczne)
n −1 =
X − m0
sˆ
n
sˆ =
n
i =1
xi ~ N m,
s
n
s
Przy zało eniu prawdziwo ci hipotezy H0, otrzymujemy:
X − m0
s
1
n
Przy zało eniu prawdziwo ci hipotezy H0: x ~ N m0 ,
n
Standaryzuj c otrzymujemy statystyk U:
i =1
t=
x=
U=
1 n
( xi − X ) 2
n − 1 i =1
x − m0
s
n
która ma rozkład N(0,1).
13
Modele statystyczne (studia zaoczne)
14
Download