5 1. Weryfikacja hipotez statystycznych Hipotezą statystyczną nazywamy każdą taką hipotezę, która dotyczy bądź postaci rozkładu, bądź wartości parametrów rozkładu pewnej zmiennej losowej i która może być weryfikowana statystycznie, to znaczy w oparciu o wyniki zaobserwowane w próbie. Testem statystycznym nazywamy każdą jednoznacznie zdefiniowaną regułę postępowania określającą warunki przy których należy weryfikowaną hipotezę przyjąć bądź odrzucić. Weryfikacja hipotez statystycznych odbywa się na podstawie wyników zaobserwowanych w próbie. W rezultacie test statystyczny podaje reguły, przy jakiego rodzaju wynikach próby sprawdzaną hipotezę się przyjmuje, a przy jakich odrzuca. Weryfikowaną hipotezę nazywa się zwykle hipotezą zerową: H0 D e cy z j a Hipoteza H0 Przyjąć H0 Jest prawdziwa Decyzja poprawna Błąd I rodzaju. Prawdopodobieństwo popełnienia tego błędu = Błąd II rodzaju Decyzja poprawna Jest fałszywa Odrzucić H0 Wartość prawdopodobieństwa popełnienia błędu I rodzaju - nazywamy poziomem istotności testu; najczęściej przyjmuje się = 0,05 , lub = 0,1. Oprócz hipotezy zerowej formułujemy również hipotezę H1 ( hipotezę alternatywna), którą skłonni jesteśmy przyjąć, jeśli weryfikowaną hipotezę H0 należy odrzucić. Sprawdzian hipotezy jest to pewna funkcja wyników z próby, na podstawie której decydujemy, czy można hipotezę H0 przyjąć, czy odrzucić. Przez obszar krytyczny rozumie się taki zbiór wartości sprawdzianu hipotezy, że jeżeli zaobserwowana wartość sprawdzianu znajdzie się w tym obszarze, to odrzuca się hipotezę H 0 na korzyść H1. Prawdopodobieństwo tego, że sprawdzian przyjmie wartość należącą do obszaru krytycznego, jest przy założeniu prawdziwości hipotezy H0 równe założonemu poziomowi istotności . 1. 1. Testy istotności dla wartości oczekiwanej (średniej) Model 1. Załóżmy, że populacja generalna ma rozkład normalny N(m,) o nieznanej wartości średniej m oraz znanym odchyleniu standardowym . Z populacji tej wylosowano n elementową próbę w celu zweryfikowania hipotezy H0: m = m0 wobec hipotezy alternatywnej H1: m m0 , gdzie m0 jest pewną hipotetyczna wartością średniej w populacji. Sprawdzianem hipotezy jest statystyka: 6 U xm σ 0 n , (1) która przy założeniu prawdziwości hipotezy H0 ma rozkład normalny N(0, 1). Jeśli H0 jest prawdziwa, to wartość bezwzględna U nie powinna przekraczać wartości krytycznej u , odczytanej z tablic rozkładu normalnego przy ustalonym poziomie istotności . Jeżeli odchylenie standardowe w populacji generalnej nie jest znane, to we wzorze (1) można je zastąpić odchyleniem standardowym s obliczonym z próby. jest to uzasadnione tylko wtedy, gdy próba jest duża: n > 30. Model 2. Dla małych prób losowych (n 30) do sprawdzania hipotezy H0: m = m0 wykorzystujemy statystykę: t gdzie s xm s 0 n -1 , (2) 1 n 2 (x i x) . n i 1 Statystyka (2) przy założeniu prawdziwości hipotezy H0 ma rozkład t Studenta o n-1 stopniach swobody. 1.2. Test istotności dla wariancji Załóżmy, że populacja generalna ma rozkład normalny N(m,) o nieznanych parametrach wartości średniej m i odchyleniu standardowym . Z populacji tej wylosowano n elementową próbę w celu zweryfikowania hipotezy H 0 : σ 2 σ 02 H 0 : σ 2 σ 02 , gdzie σ 02 jest pewną wobec hipotezy alternatywnej hipotetyczną wartością wariancji w populacji. Sprawdzianem hipotezy jest statystyka: n s2 2 σ2 0 (3) Statystyka ta ma przy założeniu prawdziwości H0 – rozkład 2 o n-1 stopniach swobody. 7 2.3. Test istotności dla wskaźnika struktury Na podstawie n-elementowej próby (n>100) weryfikujemy hipotezę : H0: p = p0 wobec hipotezy alternatywnej: H1: p p0 , Sprawdzianem hipotezy jest statystyka: U X p 0 n , p (1 p ) o 0 n (4) która przy założeniu prawdziwości hipotezy H0 ma rozkład normalny N(0, 1), przy czym X oznacza ilość jednostek o wyróżnionej wartości cechy w n-elementowej próbie.