Metody probabilistyczne i statystyka Wykład Weryfikacja hipotez statystycznych, parametryczne testy istotności w populacji Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej 9 Metody probabilistyczne i statystyka Wykład 9 23. Weryfikacja hipotez statystycznych Cel weryfikacji hipotez statystycznych – ustalenie, czy estymacja parametrów populacji (lub jej rozkładu) uzyskana na podstawie próbki jest do przyjęcia Działanie porównanie wyników otrzymanych z próbki z założeniami teoretycznymi porównanie wyników otrzymanych z dwóch próbek Określamy przy tym, czy porównywane wyniki różnią się w sposób istotny, czy przypadkowy Podstawowe pojęcia hipoteza statystyczna test statystyczny Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Podstawowe pojęcia Hipoteza statystyczna – dowolne przypuszczenie o nieznanym rozkładzie badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się w oparciu o pobraną próbkę Hipoteza nieparametryczna – przypuszczenie dotyczy postaci rozkładu cechy populacji Hipoteza parametryczna – przypuszczenie dotyczy wartości parametrów rozkładu cechy populacji Test statystyczny – reguła postępowania, która każdej możliwej realizacji próby (x1,…, xn) przyporządkowuje (z ustalonym prawdopodobieństwem) decyzję przyjęcia albo odrzucenia sprawdzanej hipotezy Test parametryczny – dotyczy hipotezy parametrycznej Test nieparametryczny (test zgodności) – dotyczy hipotezy nieparametrycznej Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Elementy testu statystycznego X – badana cecha populacji H0 – pewna hipoteza statystyczna, dotycząca rozkładu cechy X, zwana hipotezą zerową H1 – hipoteza alternatywna, którą będziemy skłonni przyjąć, gdyby H0 okazała się fałszywa Statystyka testowa albo sprawdzian – statystyka Un = Un (X1,…, Xn), dobrana jako miernik rozbieżności między wynikami próby a postacią hipotetyczną Obszar krytyczny – przedział liczbowy K, do którego prawie na pewno nie powinna należeć żadna realizacja statystyki Un, jeśli H0 jest prawdziwa Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Błędy przy podejmowaniu decyzji Dla próbki (x1,…, xn) wartości cechy X obliczamy un = Un (X1,…, Xn) i podejmujemy jedną z decyzji: odrzucamy H0 i przyjmujemy H1, jeśli un∈ K przyjmujemy H0 i odrzucamy H1, jeśli un∉ K Przy weryfikacji hipotezy w oparciu o wyniki próbki można popełnić dwa rodzaje błędów: błąd pierwszego rodzaju – odrzucenie hipotezy H0, gdy jest ona prawdziwa (prawdopodobieństwo popełnienia tego błędu nazywamy poziomem istotności i oznaczamy przez α) (23.1) α = P (Un∈ K / H0) błąd drugiego rodzaju – przyjęcie hipotezy H0, gdy jest ona fałszywa (prawdopodobieństwo popełnienia oznaczamy przez β) (23.2) β = P (Un ∉ K / H1) = 1− P (Un ∈ K / H1) Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Błędy przy podejmowaniu decyzji Tablica 23.1. Decyzje słuszne i błędy przy podejmowaniu decyzji Sytuacja H0 – prawdziwa H0 – fałszywa Przyjęcie H0 decyzja słuszna 1–α błąd 2-go rodzaju β Odrzucenie H0 błąd 1-go rodzaju α decyzja słuszna 1–β Decyzja Dla ustalonego α∈(0,1) bliskiego zera, obszar krytyczny K dobiera się tak, aby β było możliwie najmniejsze (wówczas test jest najmocniejszy) Ponieważ najczęściej β jest dość duże, albo nie jest znane, zamiast wysoce ryzykownej decyzji „przyjmujemy H0„ podejmujemy ostrożniejszą: „nie ma podstaw do odrzucenia H0„ Testy istotności – testy, w których nie uwzględnia się błędu 2-go rodzaju Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 24. Parametryczne testy istotności w populacji (24.1) Wartość oczekiwana (średnia) Model 1 (rozkład normalny, znana wariancja) X – zmienna losowa o rozkładzie normalnym N(m,σ), wartość oczekiwana m = EX nie jest znana, wariancja σ2 = D2X jest znana Statystyka X − m0 U= n σ ma rozkład N(0,1) przy założeniu prawdziwości hipotezy zerowej H0: m = m0 Dla przykładu pokażemy konstrukcję obszaru krytycznego dla hipotezy alternatywnej H1: m > m0 Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wartości średniej – model 1 Dla ustalonego α∈(0,1) mamy α = P (U∈ K / m = m0) Obszar krytyczny K dobiera się tak, aby β było możliwie najmniejsze, tzn. P (U ∈ K / H1) było największe Ponieważ H1: m > m0, więc α = P (U ≥ k) = 1 − P (U < k) = 1 − Φ(k) dla pewnego k f ( x) Stąd Φ(k) = 1−α N (0,1) Oznacza to, że k jest kwantylem rzędu 1−α α 1−0.1 α i będziemy go oznaczać przez u(1−α) 0 W rezultacie k K = 〈u(1−α); ∞) Rys.24.1. Gęstość rozkładu N(0,1) Dla pozostałych hipotez obszary krytyczne buduje się analogicznie Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wartości średniej – model 1 Tablica 24.1. Tablica testu dla średniej – model 1 Hipoteza zerowa alternatywna Statystyka testowa U H1: m < m0 Uwagi ( −∞; −u (1 − α2 )〉 H1: m ≠ m0 H0: m = m0 Obszar krytyczny K N (0,1) α 2 ∪〈u (1 − α2 ); ∞) X − m0 n σ α 2 1 −0.1 α −u (1 − α2 ) 0 u (1 − α2 ) N (0,1) ( −∞; −u (1 − α)〉 α 1− α 0.1 −u (1 − α) = u (α) 0 N (0,1) H1: m > m0 〈u (1 − α); ∞) α 1 −0.1 α 0 u (1 − α) Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wartości średniej – model 1 Przykład (do modelu 1) Norma przewiduje, że waga produkowanego wyrobu powinna wynosić 50 dag Wysunięto przypuszczenie, że producent zawyża wagę wyrobów Aby potwierdzić przypuszczenie wylosowano 16 wyrobów, dla których średnia waga wynosiła 51 dag Wiadomo, że odchylenie standardowe wynosi 1.1 dag Waga wyrobów ma rozkład normalny Na poziomie istotności 0.05 zweryfikować hipotezę, że waga wyrobów według normy i waga rzeczywista są równe wobec hipotezy alternatywnej, że są różne Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wartości średniej – model 2 Model 2 (rozkład normalny, parametry nieznane) X – zmienna losowa o rozkładzie normalnym N(m,σ), parametry m i σ nie są znane Statystyka t= X − m0 n −1 S ma rozkład Studenta z n−1 stopniami swobody przy założeniu, że prawdziwa jest hipoteza zerowa H0: m = m0 Ponieważ funkcja gęstości rozkładu Studenta ma podobne własności jak krzywa Gaussa, obszary krytyczne dla hipotez alternatywnych H1: m ≠ m0 , H1: m < m0 oraz H1: m > m0 buduje się podobnie jak w modelu 1 Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wartości średniej – model 2 Tablica 24.2. Tablica testu dla średniej – model 2 Hipoteza zerowa alternatywna H1: m ≠ m0 H0: m = m0 H1: m < m0 Statystyka testowa t Obszar krytyczny K ( −∞; −t (1 − α2 , n − 1)〉 ∪〈t (1 − α2 , n − 1); ∞) X − m0 n − 1 ( −∞; −t (1 − α, n − 1)〉 S Uwagi t α 2 α 2 1 −0.1 α −t (1 − α2 , n − 1) 0 t (1 − α2 , n − 1) t α 1− α 0.1 −t (1 − α, n − 1) 0 t H1: m > m0 〈t (1 − α, n − 1); ∞) α 1 −0.1 α 0 t (1 − α, n − 1) Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wartości średniej – model 2 Przykład (do modelu 2) Norma przewiduje, że średni czas potrzebny na wykonanie pewnego detalu wynosi 1.5 h Robotnicy skarżą się, że czas ten jest zbyt krótki Aby sprawdzić zasadność skargi, zmierzono faktyczny czas produkcji 17 losowo wybranych detali i otrzymano wartość średniej z próbki 1.6 h, a odchylenia standardowego 0.2 h Zakładamy, że czas potrzebny do wykonania detalu jest zmienną losową o rozkładzie normalnym Na poziomie istotności 0.05 stwierdzić, czy uzyskane wyniki stanowią podstawę do zwiększenia normy Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wartości średniej – model 3 Model 3 (rozkład nieznany, duża próba n ≥ 100 ) X – zmienna losowa o nieznanym rozkładzie, istnieją wartość oczekiwana EX = m i wariancja σ2 = D2X > 0 Jeśli próba jest duża ( n ≥ 100 ), to statystyka X −m U= n σ ma w przybliżeniu rozkład normalny N(0,1), a nieznaną wartość parametru σ możemy oszacować za pomocą estymatora S, gdzie n 2 S 2 = 1n ∑ i =1 ( X i − X ) W rezultacie do weryfikacji hipotez stosujemy statystykę X − m0 U= n S przy założeniu, że prawdziwa jest hipoteza zerowa H0: m = m0 Obszary krytyczne dla hipotez alternatywnych H1: m ≠ m0 , H1: m < m0 oraz H1: m > m0 wyznaczamy tak samo jak w modelu 1 Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wariancji – model 1 (24.2) Wariancja (lub odchylenie standardowe) Model 1 (rozkład normalny, parametry nieznane) X – zmienna losowa o rozkładzie normalnym N(m,σ), parametry m i σ nie są znane Statystyka nS 2 2 χ = 2 σ0 ma rozkład χ2 z n−1 stopniami swobody przy założeniu, że prawdziwa jest hipoteza zerowa H0: σ2 = σ02 ( lub H0: σ = σ0 ) Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wariancji – model 1 Tablica 24.3. Tablica testu dla wariancji – model 1 Hipoteza zerowa Statystyka Obszar krytyczny K 2 alternatywna testowa χ H1: σ2 ≠ Uwagi χ2 f ( x) 2 α 2 〈 0; χ ( , n − 1)〉 ∪ σ02 2 α 2 α 2 〈χ (1 − , n − 1); ∞) 1− α 2 f ( x) H0: σ2 = σ02 H1: σ2 < σ02 nS σ 02 χ 2 (1 − α2 , n − 1) 0 χ ( α2 , n − 1) χ 2 〈 0; χ 2 (α, n − 1)〉 α α 2 1− α 2 0 χ (α, n − 1) f ( x) H1: σ2 > σ02 〈χ 2 (1 − α, n − 1); ∞) 1− α 0 x 2 x χ 2 α χ 2 (1 − α, n − 1) Opracowała Joanna Banaś x Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wariancji – model 1 Przykład (do modelu 1) Dokonano 10 pomiarów pewnej wielkości Otrzymano odchylenie standardowe z próbki 1.5 W teorii pomiarów zakładamy, że wynik pomiaru jest zmienną losową o rozkładzie normalnym N(m,σ), zaś odchylenie standardowe jest miarą dokładności pomiarów Zweryfikować hipotezę H0: σ = 1.0 wobec hipotezy alternatywnej H1: σ > 1.0 na poziomie istotności 0.05 Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wariancji – model 2 Model 2 (rozkład normalny, duża próba n ≥ 50 ) X – zmienna losowa o rozkładzie normalnym N(m,σ), parametry m i σ nie są znane Jeśli próba jest duża ( n ≥ 50 ), to statystyka U = 2χ 2 − 2n − 3 ma w przybliżeniu rozkład normalny N(0,1), przy założeniu, że prawdziwa jest hipoteza zerowa H0: σ2 = σ02 ( lub H0: σ = σ0 ) Obszary krytyczne dla hipotez alternatywnych H1: σ2 ≠ σ02, H1: σ2 < σ02 oraz H1: σ2 > σ02 wyznaczamy tak samo jak w modelu 1 dla średniej Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wariancji – model 3 Model 3 (rozkład nieznany, duża próba n ≥ 100 ) X – zmienna losowa o rozkładzie normalnym N(m,σ), parametry m i σ nie są znane Jeśli próba jest duża ( n ≥ 100 ), to statystyka Sˆ 2 − σ 02 U= σ 02 n 2 ma w przybliżeniu rozkład normalny N(0,1), przy założeniu, że prawdziwa jest hipoteza zerowa H0: σ2 = σ02 ( lub H0: σ = σ0 ) Obszary krytyczne dla hipotez alternatywnych H1: σ2 ≠ σ02, H1: σ2 < σ02 oraz H1: σ2 > σ02 wyznaczamy tak samo jak w modelu 1 dla średniej Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy dotyczącej wariancji Przykład Wylosowano 200 robotników pewnego zakładu Zbadano stopień wykonania normy [%] Wyniki przedstawiono w szeregu rozdzielczym Stopień wykonania normy [%] 70 80 90 100 110 120 130 140 150 Liczba pracowników 3 15 29 70 50 17 12 3 1 Na poziomie istotności 0.05 zweryfikować hipotezę, że odchylenie standardowe stopnia wykonania normy jest równe 10 % wobec hipotezy alternatywnej, że jest mniejsze od 10 % Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy o wskaźniku struktury (24.3) Wskaźnik struktury Model (rozkład 0-1, parametr p nieznany, duża próba n ≥ 100 ) X – zmienna losowa o rozkładzie 0-1, parametr p nie jest znany Jeśli próba jest duża ( n ≥ 100 ), to statystyka U= − p0 p0 (1 − p 0 ) n M n gdzie M jest zmienną losową, której wartości są liczbami wyróżnionych elementów w n-elementowej próbce, ma rozkład w przybliżeniu normalny N(0,1), przy założeniu, że prawdziwa jest hipoteza zerowa H0: p = p0 Obszary krytyczne dla hipotez alternatywnych H1: p ≠ p0, H1: p < p0 oraz H1: p > p0 wyznaczamy tak samo jak w modelu 1 dla średniej Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Weryfikacja hipotezy o wskaźniku struktury Przykład Zbadano 2000 pacjentów pewnego szpitala 8 % miało grupę krwi AB 25 % pacjentów z grupą krwi AB miało czynnik RH– Na poziomie istotności 0.01 zweryfikować hipotezę, ze odsetek osób o grupie krwi AB RH– wynosi 3 % wobec alternatywnej, że jest mniejszy niż 3 % Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 9 Dziękuję za uwagę Opracowała Joanna Banaś