Weryfikacja hipotez statystycznych Hipoteza statystyczna – założenie co do wartości parametru (parametrów) rozkładu prawdopodobieństwa. Test statystyczny – narzędzie weryfikacji tej hipotezy. Hipoteza prosta – zakłada wartości wszystkich parametrów rozkładu. Hipoteza złożona – co wartość co najmniej jednego parametru jest nieznana (np. zakładamy tylko postać funkcyjną rozkładu). Hipoteza zerowa (Ho) – hipoteza, którą weryfikujemy. Hipoteza alternatywna (H1) – co najmniej jeden z parametrów rozkłady jest różny od tego z hipotezy zerowej. Błędy popełniane podczas weryfikacji hipotez statystycznych Błąd pierwszego rodzaju (false negative) – odrzucenie prawdziwej hipotezy Ho. Błąd drugiego rodzaju (false positive) – przyjęcie fałszywej hipotezy Ho. Poziom istotności (a) P(|x|xo)=a (test dwustronny) P(xxo)=a (test jednostronny) Obszar krytyczny (Sc): P(xSc|Ho)=a Poziom istotności definiuje prawdopodobieństwo popełnienia błędu pierwszwego rodzaju (odrzucenia prawdziwej hipotezy zerowej). Moc testu: prawdopodobieństwo odrzucenia hipotezy zerowej w zależności od hipotezy alternatywnej. M(Sc,l)=P(XSc|H)=P(XSc|l) Test najmocniejszy hipotezy prostej Ho względem hipotezy alternatywnej H1: P(Sc,l1)=1-b=max Test jednostajnie najmocniejszy: test najmocniejszy względem jakiejkolwiek hipotezy alternatywnej. Test F Fishera równości wariancji Mamy dwie populacje o rozkładzie normalnym (np. przypadek pomiaru tej samej wielkości różnymi przyrządami). Pytanie: czy te populacje mają tą samą wariancję. W tym celu rozważamy iloraz F=s12/s22 X 12 ( N1 1) s12 f 2 2 1 1 f 2 2 f 2 X 12 F f1 X 22 1 f 2 fs12 2 1 1 2 2 ( f 2) X 22 ( N 2 1) s22 1 2 exp 2 2 2 fs22 22 s12 X 12 W ( F ) P 2 F P 2 F s2 X2 f1 f 2 f1 f 2 f1 F f1 1 2 2 f1 f 2 F 2 1 1 F dF f2 f 2 f1 f 2 0 2 2 s12 P 2 F1a 1 a s2 Porównywanie wartości średnich (test Studenta) N 1 2 2 x j x sx N ( N 1) j 1 Nf x N t x x sx sx x Nf F (t ) P ( t ) P t 1 1 ( f 1) (f 1) t 2 2 2 1 F( t ) d f 1 f f 2 t 'a 1 0 f ()d 2 (1 a) Weryfikacja hipotezy, że x=l0 | x l0 | N | t | t 1 1 a sx 2 Weryfikacja hipotezy o równości wartości średnich z dwóch serii pomiarów || |x y| | t | s s N1 N 2 2 s s s s N1 N 2 2 s 2 2 x 2 y ( N1 1) s ( N 2 1) s 2 x ( N1 1) ( N 2 1) 2 y Test 2 dobroci dopasowania gi: wynik i-tego pomiaru fi: wartość teoretyczna wyniku i-tego pomiaru i: odchylenie standardowe i-tego pomiaru. ui gi fi i gi fi T u i i 1 i 1 N N 2 2 i Wielkości ui mają rozkład normalny o zerowej średniej i jednostkowej wariancji a zatem wielkość T ma rozkład 2 o N-p stopniach swobody, gdzie p jest liczbą estymowanych parametrów funkcji f. Dopasowanie uznajemy za złe na poziomie istotności a jeżeli T21a Zastosowanie testu 2 do weryfikacji hipotezy o rozkładzie częstości obserwacji f(x) } } } } 1 2 … k … r x pi P( x i ) f ( x)dx i ni: liczba obserwacji wielkości w i-tym przedziale; n: całkowita liczba obserwacji. npi: wartość oczekiwana liczby obserwacji w i-tym przedziale r 2 i 1 r n ni i 1 (ni npi ) 2 i 2 (ni npi ) npi i 1 r 2 Wartość oczekiwana wariancji liczby obserwacji. Hipotezę o zgodności rozkładu obserwowanego z rozkładem założonym odrzucamy na poziomie istotności a jeżeli 221a dla f stopni swobody. f=liczba stopni swobody=r-p-1 gdzie p jest liczbą parametrów rozkładu (najwyżej r-1 stopni swobody). Przykład: porównanie liczby zliczeń par elektron-pozyton w komorze pęcherzykowej naświetlonej promieniowaniem g z rozkładem Poissona. p(k ) lk e l k! ~ l k nk / k! 2=10.44 20.99=16.81 Nie ma zatem podstaw do odrzucenia rozkładu Poissona. Zastosowanie testu 2 do analizy tabeli wkładów x, y: zmienne losowe mogące przyjmować wartości odpowiednio x1, x2,…, xk oraz y1, y2,…, yl. Każdej kombinacji zmiennych (xi,yj) przyporządkowana jest liczba obserwacji nij. y1 y2 … yl x1 n11 n12 … n1l x2 n21 n22 … n2l … … … … … xk nk1 nk2 … nkl ~ ~ )2 ( n n p q ij i j 2 n~ p q~ k l i 1 j 1 l 1 ~ pi nij n j 1 k i j k 1 q~ j nij n i 1 l n nij i 1 j 1 Jeżeli zmienne są współzależne na poziomie istotności a to 221a dla f=kl-1(k+l-2)=(k-1)(l-1) stopni swobody. Przykład z medycyny: ocena skuteczności dwóch metod leczenia danej choroby. x1: pierwsza metoda leczenia y1 y2 x1 n11=a n12=b x2 n21=c n22=d x2: druga metoda leczenia y1: przypadki wyleczone y2: przypadki niewyleczone n(ad bc) (a b)(c d )( a c)(b d ) 2 2 f=liczba stopni swobody=(2-1)(2-1)=1 Jeżeli metody leczenia mają różną skuteczność to 221a