Weryfikacja hipotez statystycznych — Hipotezą statystyczną nazywamy każde przypuszczenie dotyczące nieznanego rozkładu badanej cechy populacji, o prawdziwości lub fałszywości którego wnioskuje się na podstawie pobranej próbki. — Przypuszczenia te najczęściej dotyczą postaci rozkładu lub wartości jego parametrów. — Hipotezy, które dotyczą wyłącznie wartości parametru (bądź parametrów) określonej klasy rozkładów nazywamy hipotezami parametrycznymi, a pozostałe hipotezami nieparametrycznymi. — Jeżeli hipoteza parametryczna precyzuje dokładne wartości wszystkich nieznanych parametrów rozkładu badanej cechy nazywamy ją hipotezą prostą, a w przeciwnym przypadku hipotezą złożoną. Weryfikacja hipotez statystycznych — W praktyce przy weryfikacji hipotez postępuje się w ten sposób, że oprócz weryfikowania danej hipotezy wyróżnia się jeszcze inną hipotezę (prostą albo złożoną), zwaną hipotezą alternatywną. — Hipoteza, którą chcemy sprawdzić nazywamy hipotezą zerową i oznaczamy symbolem H0 , zaś hipotezę alternatywną oznaczamy przez H1 . — Wyróżniona hipoteza H0 może być prawdziwa lub fałszywa. Postępowanie, w wyniku którego następuje przyjęcie lub odrzucenie hipotezy nazywamy sprawdzaniem lub weryfikowaniem hipotezy statystycznej. — Weryfikacja hipotezy statystycznej składa się z dwóch etapów: wyboru odpowiedniego testu i ustalenia tzw. zbioru krytycznego. Weryfikacja hipotez statystycznych — Testem hipotezy H0 przeciw hipotezie alternatywnej H1 nazywamy każdą statystykę Y , której wartość obliczona na podstawie próby będzie podstawą do zdecydowania, czy hipotezę H0 odrzucić, czy też przyjąć. — Pierwszy etap weryfikacji hipotezy statystycznej polega na wyborze odpowiedniej statystyki i wyznaczeniu jej rozkładu przy założeniu, że weryfikowana hipoteza H0 jest prawdziwa. — Test służący do weryfikacji hipotezy oparty jest na statystyce, której rozkład jest nam znany. — Jeżeli próba jest duża, to wykorzystujemy rozkład graniczny, jeżeli próba jest mała, to rozkład dokładny. Weryfikacja hipotez statystycznych — Drugi etap weryfikacji hipotez polega na ustaleniu tzw. zbioru krytycznego. — Zbiorem krytycznym testu (zbiorem odrzuceń hipotezy) nazywamy taki zbiór W wartości wybranego testu, których wystąpienie powodować będzie odrzucenie weryfikowanej hipotezy H0 . Jest to więc zbiór tych wartości statystyki Y , których występowanie uważamy za zaprzeczenie hipotezie zerowej H0 . — Zbiór W 0 będący dopełnieniem zbioru W nazywamy zbiorem przyjęć hipotezy. Błędy przy testowaniu hipotez statystycznych Przy weryfikacji hipotez statystycznych można podjąć poprawną decyzję lub można popełnić jeden z dwóch błędów: — błąd I rodzaju polegający na odrzuceniu testowanej hipotezy H0 , gdy jest ona prawdziwa; — błąd II rodzaju polegający na przyjęciu hipotezy H0 , gdy jest ona fałszywa (tzn. prawdziwa jest hipoteza alternatywna H1 ). Błędy przy testowaniu hipotez statystycznych Decyzja H0 jest prawdziwa H0 jest faszywa przyj hipotez H0 decyzja poprawna decyzja bdna (bd II rodzaju) odrzuci hipotez H0 decyzja bdna (bd I rodzaju) decyzja poprawna 1 Poziom istotności testu — Prawdopodobieństwo odrzucenia hipotezy H0 przy założeniu, że jest ona prawdziwa nazywamy poziomem istotności testu i oznaczamy symbolem α. — Fakt ten zapisujemy następująco P (y ∈ W |H0 ) = α. — Poziom istotności testu jest więc prawdopodobieństwem popełnienia błędu I rodzaju. Wybór tego prawdopodobieństwa jest dowolny, ale zwykle przyjmuje się jedną z wartości α = 0, 01 albo α = 0, 05. Moc testu — Prawdopodobieństwo odrzucenia hipotezy H0 w przypadku, gdy prawdziwa jest hipoteza alternatywna H1 nazywamy mocą testu. — Prawdopodobieństwo popełnienia błędu II rodzaju oznaczamy symbolem β. Fakt ten zapisujemy następująco P (y ∈ W 0 |H1 ) = 1 − P (y ∈ W |H1 ) = β. — Moc testu jest więc równa P (y ∈ W |H1 ) = 1 − β. Test najmocniejszy — Test statystyczny powinien oczywiście być taki, aby prawdopodobieństwo popełnienia błędów I i II rodzaju było jak najmniejsze. — Idealnym rozwiązaniem byłoby α = 0 oraz β = 0. — Nie jest to jednak możliwe. — Zmniejszenie wartości α pociąga za sobą zwiększenie β. Wybierając więc poziom istotności α należy minimalizować β, czyli maksymalizować moc testu. — Test, który przy ustalonym prawdopodobieństwie błędu I rodzaju minimalizuje prawdopodobieństwo błędu II rodzaju nazywamy testem najmocniejszym dla hipotezy H0 względem prostej hipotezy alternatywnej H1 . — Jeżeli test jest najmocniejszy względem każdej złożonej hipotezy alternatywnej H1 , to nazywamy go testem jednostajnie najmocniejszym względem H1 . Etapy przy weryfikacji hipotez statystycznych — — — — Aby skonstruować test statystyczny pozwalający weryfikować hipotezę H0 , należy określić następujące elementy: wybrać statystykę testową stosownie do treści postawionej hipotezy H0 ; ustalić dopuszczalne prawdopodobieństwo α błędu pierwszego rodzaju, tzn. ustalić poziom istotności testu; określić hipotezę alternatywną; wyznaczyć zbiór krytyczny tak, aby przy danym poziomie istotności α zminimalizować prawdopodobieństwo błędu drugiego rodzaju. Testy istotności — Testem istotności nazywamy test, którego celem jest jedynie zweryfikowanie jednej wysuniętej hipotezy pod kątem jej fałszywości z pominięciem innych hipotez. — Testy istotności uwzględniają jedynie prawdopodobieństwo popełnienia błędu I rodzaju. — Należy pamiętać, że nieodrzucenie weryfikowanej hipotezy H0 nie oznacza jej przyjęcia. Test istotności dla wartości średniej. Model I — Obserwowana w próbie zmienna X ma rozkład normalny N (µ, σ) o znanym odchyleniu standardowym σ = σ0 . — Liczebność próby jest dowolna. — Hipotezy H0 i H1 mają postać H0 : µ = µ0 ; H1 : µ 6= µ0 , gdzie µ0 jest hipotetyczną wartością średniej. — Do weryfikacji hipotezy H0 wykorzystujemy średnią arytmetyczną z próby X. σ — Statystyka X ma rozkład normalny N µ, √ . n 2 Test istotności dla wartości średniej. Model I — Zmienna X − µ0 √ n σ ma przy założeniu prawdziwości hipotezy H0 (µ = µ0 ) rozkład normalny N (0, 1). — Z tablic rozkładu N (0, 1) odczytujemy wartość krytyczną uα w ten sposób, by spełniony był warunek U= P (|U | > uα ) = α albo Φ(uα ) = 1 − α . 2 — Zbiór krytyczny W ma postać W = {u : |u| > uα } = (−∞, −uα i ∪ huα , +∞). Test istotności dla wartości średniej. Model I — Jeżeli wartość statystyki U wyznaczona dla danej próby jest równa u0 oraz u0 ∈ W , to hipotezę H0 odrzucamy. — Jeżeli natomiast u0 ∈ / W , to nie mamy podstaw do odrzucenia hipotezy H0 . — Jest to test dwustronny. Test istotności dla wartości średniej. Model I Test lewostronny — Hipotezy H0 i H1 mają postać H0 : µ = µ0 ; H1 : µ < µ0 . — Z tablic rozkładu N (0, 1) odczytujemy wartość krytyczną uα w ten sposób, by spełniony był warunek P (U 6 uα ) = α albo Φ(uα ) = α. — Zbiór krytyczny W ma postać W = {u : u 6 uα } = (−∞, uα i. Test istotności dla wartości średniej. Model I Test prawostronny Hipotezy H0 i H1 mają postać H0 : µ = µ0 ; H1 : µ > µ0 . Z tablic rozkładu N (0, 1) odczytujemy wartość krytyczną uα w ten sposób, by spełniony był warunek P (U > uα ) = α albo Φ(uα ) = 1 − α. Zbiór krytyczny W ma postać W = {u : u > uα } = huα , +∞). 3