Weryfikacja hipotez statystycznych, parametryczne testy istotności w

advertisement
Metody probabilistyczne i statystyka
Wykład
Weryfikacja hipotez
statystycznych, parametryczne
testy istotności w populacji
Dr Joanna Banaś
Zakład Badań Systemowych
Instytut Sztucznej Inteligencji i Metod Matematycznych
Wydział Informatyki Politechniki Szczecińskiej
9
Metody probabilistyczne i statystyka
Wykład 9
23. Weryfikacja hipotez statystycznych
Cel weryfikacji hipotez statystycznych – ustalenie, czy estymacja
parametrów populacji (lub jej rozkładu) uzyskana na podstawie próbki
jest do przyjęcia
Działanie
porównanie wyników otrzymanych z próbki z założeniami teoretycznymi
porównanie wyników otrzymanych z dwóch próbek
Określamy przy tym, czy porównywane wyniki różnią się
w sposób istotny, czy przypadkowy
Podstawowe pojęcia
hipoteza statystyczna
test statystyczny
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Podstawowe pojęcia
Hipoteza statystyczna – dowolne przypuszczenie o nieznanym rozkładzie
badanej cechy populacji, o prawdziwości lub fałszywości którego
wnioskuje się w oparciu o pobraną próbkę
Hipoteza nieparametryczna – przypuszczenie dotyczy postaci rozkładu cechy
populacji
Hipoteza parametryczna – przypuszczenie dotyczy wartości parametrów
rozkładu cechy populacji
Test statystyczny – reguła postępowania, która każdej możliwej realizacji
próby (x1,…, xn) przyporządkowuje (z ustalonym prawdopodobieństwem)
decyzję przyjęcia albo odrzucenia sprawdzanej hipotezy
Test parametryczny – dotyczy hipotezy parametrycznej
Test nieparametryczny (test zgodności) – dotyczy hipotezy nieparametrycznej
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Elementy testu statystycznego
X – badana cecha populacji
H0 – pewna hipoteza statystyczna, dotycząca rozkładu cechy
X, zwana hipotezą zerową
H1 – hipoteza alternatywna, którą będziemy skłonni przyjąć,
gdyby H0 okazała się fałszywa
Statystyka testowa albo sprawdzian – statystyka Un = Un
(X1,…, Xn), dobrana jako miernik rozbieżności między
wynikami próby a postacią hipotetyczną
Obszar krytyczny – przedział liczbowy K, do którego prawie
na pewno nie powinna należeć żadna realizacja statystyki Un,
jeśli H0 jest prawdziwa
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Błędy przy podejmowaniu decyzji
Dla próbki (x1,…, xn) wartości cechy X obliczamy un = Un (X1,…, Xn)
i podejmujemy jedną z decyzji:
odrzucamy H0 i przyjmujemy H1, jeśli un∈ K
przyjmujemy H0 i odrzucamy H1, jeśli un∉ K
Przy weryfikacji hipotezy w oparciu o wyniki próbki można popełnić dwa
rodzaje błędów:
błąd pierwszego rodzaju – odrzucenie hipotezy H0, gdy jest ona prawdziwa
(prawdopodobieństwo popełnienia tego błędu nazywamy poziomem istotności
i oznaczamy przez α)
(23.1)
α = P (Un∈ K / H0)
błąd drugiego rodzaju – przyjęcie hipotezy H0, gdy jest ona fałszywa
(prawdopodobieństwo popełnienia oznaczamy przez β)
(23.2)
β = P (Un ∉ K / H1) = 1− P (Un ∈ K / H1)
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Błędy przy podejmowaniu decyzji
Tablica 23.1. Decyzje słuszne i błędy przy podejmowaniu decyzji
Sytuacja
H0 – prawdziwa
H0 – fałszywa
Przyjęcie H0
decyzja słuszna
1–α
błąd 2-go rodzaju
β
Odrzucenie H0
błąd 1-go rodzaju
α
decyzja słuszna
1–β
Decyzja
Dla ustalonego α∈(0,1) bliskiego zera, obszar krytyczny K dobiera się tak, aby β
było możliwie najmniejsze (wówczas test jest najmocniejszy)
Ponieważ najczęściej β jest dość duże, albo nie jest znane, zamiast wysoce
ryzykownej decyzji „przyjmujemy H0„ podejmujemy ostrożniejszą:
„nie ma podstaw do odrzucenia H0„
Testy istotności – testy, w których nie uwzględnia się błędu 2-go rodzaju
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
24. Parametryczne testy istotności
w populacji
(24.1) Wartość oczekiwana (średnia)
Model 1 (rozkład normalny, znana wariancja)
X – zmienna losowa o rozkładzie normalnym N(m,σ),
wartość oczekiwana m = EX nie jest znana,
wariancja σ2 = D2X jest znana
Statystyka
X − m0
U=
n
σ
ma rozkład N(0,1) przy założeniu prawdziwości hipotezy zerowej
H0: m = m0
Dla przykładu pokażemy konstrukcję obszaru krytycznego dla
hipotezy alternatywnej H1: m > m0
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wartości średniej – model 1
Dla ustalonego α∈(0,1) mamy
α = P (U∈ K / m = m0)
Obszar krytyczny K dobiera się tak, aby β było możliwie najmniejsze,
tzn. P (U ∈ K / H1) było największe
Ponieważ H1: m > m0, więc
α = P (U ≥ k) = 1 − P (U < k) = 1 − Φ(k) dla pewnego k
f ( x)
Stąd Φ(k) = 1−α
N (0,1)
Oznacza to, że k jest kwantylem rzędu 1−α
α
1−0.1
α
i będziemy go oznaczać przez u(1−α)
0
W rezultacie
k
K = ⟨u(1−α); ∞) Rys.24.1. Gęstość rozkładu N(0,1)
Dla pozostałych hipotez obszary krytyczne buduje się analogicznie
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wartości średniej – model 1
Tablica 24.1. Tablica testu dla średniej – model 1
Hipoteza
zerowa
alternatywna
Statystyka
testowa U
H1: m < m0
Uwagi
( −∞; −u (1 − α2 )⟩
H1: m ≠ m0
H0: m = m0
Obszar
krytyczny K
N (0,1)
α
2
∪⟨u (1 − α2 ); ∞)
X − m0
n
σ
α
2
1 −0.1
α
−u (1 − α2 )
0
u (1 − α2 )
N (0,1)
( −∞; −u (1 − α)⟩
α
1− α
0.1
−u (1 − α) = u (α) 0
N (0,1)
H1: m > m0
⟨u (1 − α); ∞)
α
1 −0.1
α
0
u (1 − α)
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wartości średniej – model 1
Przykład (do modelu 1)
Norma przewiduje, że waga produkowanego wyrobu powinna
wynosić 50 dag
Wysunięto przypuszczenie, że producent zawyża wagę wyrobów
Aby potwierdzić przypuszczenie wylosowano 16 wyrobów, dla
których średnia waga wynosiła 51 dag
Wiadomo, że odchylenie standardowe wynosi 1.1 dag
Waga wyrobów ma rozkład normalny
Na poziomie istotności 0.05 zweryfikować hipotezę, że
waga wyrobów według normy i waga rzeczywista są
równe wobec hipotezy alternatywnej, że są różne
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wartości średniej – model 2
Model 2 (rozkład normalny, parametry nieznane)
X – zmienna losowa o rozkładzie normalnym N(m,σ),
parametry m i σ nie są znane
Statystyka
t=
X − m0
n −1
S
ma rozkład Studenta z n−1 stopniami swobody przy
założeniu, że prawdziwa jest hipoteza zerowa H0: m = m0
Ponieważ funkcja gęstości rozkładu Studenta ma podobne
własności jak krzywa Gaussa, obszary krytyczne dla
hipotez alternatywnych H1: m ≠ m0 , H1: m < m0 oraz
H1: m > m0 buduje się podobnie jak w modelu 1
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wartości średniej – model 2
Tablica 24.2. Tablica testu dla średniej – model 2
Hipoteza
zerowa
alternatywna
H1: m ≠ m0
H0: m = m0 H1: m < m0
Statystyka
testowa t
Obszar krytyczny
K
( −∞; −t (1 − α2 , n − 1)⟩
∪⟨t (1 − α2 , n − 1); ∞)
X − m0
n − 1 ( −∞; −t (1 − α, n − 1)⟩
S
Uwagi
t
α
2
α
2
1 −0.1
α
−t (1 − α2 , n − 1) 0 t (1 − α2 , n − 1)
t
α
1− α
0.1
−t (1 − α, n − 1)
0
t
H1: m > m0
⟨t (1 − α, n − 1); ∞)
α
1 −0.1
α
0 t (1 − α, n − 1)
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wartości średniej – model 2
Przykład (do modelu 2)
Norma przewiduje, że średni czas potrzebny na wykonanie
pewnego detalu wynosi 1.5 h
Robotnicy skarżą się, że czas ten jest zbyt krótki
Aby sprawdzić zasadność skargi, zmierzono faktyczny czas
produkcji 17 losowo wybranych detali i otrzymano wartość
średniej z próbki 1.6 h, a odchylenia standardowego 0.2 h
Zakładamy, że czas potrzebny do wykonania detalu jest zmienną
losową o rozkładzie normalnym
Na poziomie istotności 0.05 stwierdzić, czy uzyskane
wyniki stanowią podstawę do zwiększenia normy
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wartości średniej – model 3
Model 3 (rozkład nieznany, duża próba n ≥ 100 )
X – zmienna losowa o nieznanym rozkładzie, istnieją wartość oczekiwana
EX = m i wariancja σ2 = D2X > 0
Jeśli próba jest duża ( n ≥ 100 ), to statystyka
X −m
U=
n
σ
ma w przybliżeniu rozkład normalny N(0,1), a nieznaną wartość parametru σ
możemy oszacować za pomocą estymatora S, gdzie
n
2
S 2 = 1n ∑ i =1 ( X i − X )
W rezultacie do weryfikacji hipotez stosujemy statystykę
X − m0
U=
n
S
przy założeniu, że prawdziwa jest hipoteza zerowa H0: m = m0
Obszary krytyczne dla hipotez alternatywnych H1: m ≠ m0 , H1: m < m0 oraz
H1: m > m0 wyznaczamy tak samo jak w modelu 1
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wariancji – model 1
(24.2) Wariancja (lub odchylenie standardowe)
Model 1 (rozkład normalny, parametry nieznane)
X – zmienna losowa o rozkładzie normalnym N(m,σ),
parametry m i σ nie są znane
Statystyka
nS 2
2
χ = 2
σ0
ma rozkład χ2 z n−1 stopniami swobody przy założeniu,
że prawdziwa jest hipoteza zerowa
H0: σ2 = σ02 ( lub H0: σ = σ0 )
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wariancji – model 1
Tablica 24.3. Tablica testu dla wariancji – model 1
Hipoteza
zerowa
Statystyka
Obszar krytyczny K
2
alternatywna testowa χ
H1:
σ2
≠
Uwagi
χ2
f ( x)
2 α
2
⟨ 0; χ ( , n − 1)⟩ ∪
σ02
2
α
2
α
2
⟨χ (1 − , n − 1); ∞)
1− α
2
f ( x)
H0: σ2 = σ02 H1: σ2 < σ02
nS
σ 02
χ 2 (1 − α2 , n − 1)
0 χ ( α2 , n − 1)
χ
2
⟨ 0; χ 2 (α, n − 1)⟩
α
α
2
1− α
2
0 χ (α, n − 1)
f ( x)
H1: σ2 > σ02
⟨χ 2 (1 − α, n − 1); ∞)
1− α
0
x
2
x
χ
2
α
χ 2 (1 − α, n − 1)
Opracowała Joanna Banaś
x
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wariancji – model 1
Przykład (do modelu 1)
Dokonano 10 pomiarów pewnej wielkości
Otrzymano odchylenie standardowe z próbki 1.5
W teorii pomiarów zakładamy, że wynik pomiaru jest
zmienną losową o rozkładzie normalnym N(m,σ), zaś
odchylenie standardowe jest miarą dokładności
pomiarów
Zweryfikować hipotezę H0: σ = 1.0 wobec
hipotezy alternatywnej H1: σ > 1.0 na poziomie
istotności 0.05
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wariancji – model 2
Model 2 (rozkład normalny, duża próba n ≥ 50 )
X – zmienna losowa o rozkładzie normalnym N(m,σ),
parametry m i σ nie są znane
Jeśli próba jest duża ( n ≥ 50 ), to statystyka
U = 2χ 2 − 2n − 3
ma w przybliżeniu rozkład normalny N(0,1), przy założeniu, że
prawdziwa jest hipoteza zerowa H0: σ2 = σ02 ( lub H0: σ = σ0 )
Obszary krytyczne dla hipotez alternatywnych
H1: σ2 ≠ σ02, H1: σ2 < σ02 oraz H1: σ2 > σ02
wyznaczamy tak samo jak w modelu 1 dla średniej
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wariancji – model 3
Model 3 (rozkład nieznany, duża próba n ≥ 100 )
X – zmienna losowa o rozkładzie normalnym N(m,σ),
parametry m i σ nie są znane
Jeśli próba jest duża ( n ≥ 100 ), to statystyka
Sˆ 2 − σ 02
U=
σ 02
n
2
ma w przybliżeniu rozkład normalny N(0,1), przy założeniu, że
prawdziwa jest hipoteza zerowa H0: σ2 = σ02 ( lub H0: σ = σ0 )
Obszary krytyczne dla hipotez alternatywnych
H1: σ2 ≠ σ02, H1: σ2 < σ02 oraz H1: σ2 > σ02
wyznaczamy tak samo jak w modelu 1 dla średniej
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy dotyczącej
wariancji
Przykład
Wylosowano 200 robotników pewnego zakładu
Zbadano stopień wykonania normy [%]
Wyniki przedstawiono w szeregu rozdzielczym
Stopień wykonania
normy [%]
70
80
90 100 110 120 130 140 150
Liczba pracowników
3
15
29
70
50
17
12
3
1
Na poziomie istotności 0.05 zweryfikować hipotezę, że
odchylenie standardowe stopnia wykonania normy jest
równe 10 % wobec hipotezy alternatywnej, że jest
mniejsze od 10 %
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy o wskaźniku
struktury
(24.3) Wskaźnik struktury
Model (rozkład 0-1, parametr p nieznany, duża próba n ≥ 100 )
X – zmienna losowa o rozkładzie 0-1, parametr p nie jest znany
Jeśli próba jest duża ( n ≥ 100 ), to statystyka
U=
− p0
p0 (1 − p 0 )
n
M
n
gdzie M jest zmienną losową, której wartości są liczbami wyróżnionych
elementów w n-elementowej próbce, ma rozkład w przybliżeniu normalny
N(0,1), przy założeniu, że prawdziwa jest hipoteza zerowa H0: p = p0
Obszary krytyczne dla hipotez alternatywnych
H1: p ≠ p0, H1: p < p0 oraz H1: p > p0
wyznaczamy tak samo jak w modelu 1 dla średniej
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład 9
Weryfikacja hipotezy o wskaźniku
struktury
Przykład
Zbadano 2000 pacjentów pewnego szpitala
8 % miało grupę krwi AB
25 % pacjentów z grupą krwi AB miało czynnik RH–
Na poziomie istotności 0.01 zweryfikować
hipotezę, ze odsetek osób o grupie krwi AB RH–
wynosi 3 % wobec alternatywnej, że jest mniejszy
niż 3 %
Opracowała Joanna Banaś
Metody probabilistyczne i statystyka
Wykład
9
Dziękuję za uwagę
Opracowała Joanna Banaś
Download