STATYSTYKA MATEMATYCZNA WYKŁAD 5 2 listopada 2009 Poprzedni wykład: przedział ufności dla µ, σ nieznane Rozkład N(µ, σ). Wnioskowanie o średniej µ, gdy σ nie jest znane Testowanie H : µ = µ0 , K : µ < µ0 Jeżeli H jest prawdziwa, to statystyka testu ma rozkład t Studenta z (n − 1) stopniami swobody: X̄ − µ0 √ n − 1 ∼ tn−1 S Obszar krytyczny testu na poziomie istotności α: ( ) X̄ − µ0 √ n − 1 < tn−1 (α) S Rozkład N(µ, σ). Wnioskowanie o średniej µ, gdy σ nie jest znane Testowanie H : µ = µ0 , K : µ < µ0 Moc testu: ( β(µ, σ) = PN(µ,σ) ) X̄ − µ0 √ n − 1 < tn−1 (α) S Rozkład N(µ, σ). Wnioskowanie o średniej µ, gdy σ nie jest znane Testowanie H : µ = µ0 , K : µ < µ0 Moc testu: ( β(µ, σ) = PN(µ,σ) ) X̄ − µ0 √ n − 1 < tn−1 (α) S Jeżeli X ∼ N(µ, σ), to X̄ − µ0 √ n−1= S jest ilorazem zmiennej losowej N q χ2n−1 /(n − 1) X̄ −µ √ µ−µ0 √ n σq n + σ nS 2 /(n − 1) σ2 µ−µ0 √ n, 1 σ i zmiennej losowej Moc testu t Studenta H : µ = µ0 , K : µ < µ0 Przypominam: Jeżeli zmienna losowa ξ ma rozkład normalny N(0, 1), zmienna losowa η ma rozkład chi-kwadrat o ν stopniach swobody i jeżeli te zmienne losowe są niezależne, to rozkład zmiennej losowej ξ t= p η/ν nazywa się rozkładem t Studenta o ν stopniach swobody Moc testu t Studenta H : µ = µ0 , K : µ < µ0 Przypominam: Jeżeli zmienna losowa ξ ma rozkład normalny N(0, 1), zmienna losowa η ma rozkład chi-kwadrat o ν stopniach swobody i jeżeli te zmienne losowe są niezależne, to rozkład zmiennej losowej ξ t= p η/ν nazywa się rozkładem t Studenta o ν stopniach swobody DEFINICJA: Jeżeli zmienna losowa ξ ma rozkład normalny N(µ, 1), zmienna losowa η ma rozkład chi-kwadrat o ν stopniach swobody i jeżeli te zmienne losowe są niezależne, to rozkład zmiennej losowej ξ t=p η/ν nazywa się NIECENTRALNYM ROZKŁADEM t STUDENTA O ν STOPNIACH SWOBODY I PARAMETRZE NIECENTRALŚCI µ Moc testu t Studenta H : µ = µ0 , K : µ < µ0 Gęstość rozkładu t Studenta z ν stopniami swobody oznaczyliśmy przez gν (x). Gęstość niecentralnego rozkładu t Studenta z ν stopniami swobody i parametrem niecentralności λ oznaczymy przez gν,λ (x) i dystrybuantę przez Gν,λ (x) R: nct1.R Moc testu: β(µ, σ) = Gn−1, µ−µ0 √n (tn−1 (α)) σ R: nct1-moc.R (∗) test dwustronny POZIOM KRYTYCZNY TESTU Poziom krytyczny testu = najmniejszy poziom istotności, przy którym następuje odrzucenie weryfikowanej hipotezy α - założony poziom istotności testu wk - wartość krytyczna testu T (T 0 ) - zaobserwowana wartość statystyki testu pk (pk 0 ) - poziom krytyczny testu α - założony poziom istotności testu wk - wartość krytyczna testu T (T 0 ) - zaobserwowana wartość statystyki testu pk (pk 0 ) - poziom krytyczny testu pk α pk 0 .................................................... .......... ....... ...... ..... ..... ..... .... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... .... ..... ..... ..... ...... ....... .......... ............................. T wk T0 POZIOM KRYTYCZNY TESTU Poziom krytyczny testu = najmniejszy poziom istotności, przy którym następuje odrzucenie weryfikowanej hipotezy POZIOM KRYTYCZNY TESTU Poziom krytyczny testu = najmniejszy poziom istotności, przy którym następuje odrzucenie weryfikowanej hipotezy największy poziom istotności, przy którym jeszcze przyjmujemy sprawdzamy hipotezę (WK s. 214) POZIOM KRYTYCZNY TESTU Poziom krytyczny testu = najmniejszy poziom istotności, przy którym następuje odrzucenie weryfikowanej hipotezy największy poziom istotności, przy którym jeszcze przyjmujemy sprawdzamy hipotezę (WK s. 214) jak mało prawdopodobny jest wynik, który otrzymaliśmy, gdy H jest prawdziwa POZIOM KRYTYCZNY TESTU Poziom krytyczny testu = najmniejszy poziom istotności, przy którym następuje odrzucenie weryfikowanej hipotezy największy poziom istotności, przy którym jeszcze przyjmujemy sprawdzamy hipotezę (WK s. 214) jak mało prawdopodobny jest wynik, który otrzymaliśmy, gdy H jest prawdziwa Gdyby zaobserwowana wartość statystyki testu była wartością krytyczną, to jaki byłby poziom istotności tego testu POZIOM KRYTYCZNY TESTU Poziom krytyczny testu = najmniejszy poziom istotności, przy którym następuje odrzucenie weryfikowanej hipotezy największy poziom istotności, przy którym jeszcze przyjmujemy sprawdzamy hipotezę (WK s. 214) jak mało prawdopodobny jest wynik, który otrzymaliśmy, gdy H jest prawdziwa Gdyby zaobserwowana wartość statystyki testu była wartością krytyczną, to jaki byłby poziom istotności tego testu Popularny termin angielski: p-value PRZYKŁAD Dla testowania H : µ = µ0 , K : µ > µ0 na poziomie istotności α skonstruowaliśmy test z obszarem krytycznym σ X̄ > µ0 + z1−α √ n Poziom krytyczny tego testu: n PK (X̄obs ) = Pµ0 X̄ > X̄obs R: PK-t1.R o X̄obs − µ0 √ =1−Φ n σ ! Komputerowe pakiety statystyczne: Przykład: R: test-t1.R Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) Porównanie średnich (1) σx , σy - znane (2) σx = σy = σ - znane (3) σx = σy = σ - nieznane (4) σx = k ∗ σy = σ, k - znane (5) σx , σy - nieznane (6) Obserwacje powiązane w pary Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (1) Porównanie średnich, σx , σy - znane X∼ N(µx ,σx ), Y ∼N(µy ,σy ) =⇒ X −Y ∼ N(µx −µy , q σx2 + σy2 ) Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (1) Porównanie średnich, σx , σy - znane X∼ N(µx ,σx ), Y ∼N(µy ,σy ) =⇒ X −Y ∼ N(µx −µy , X1 , X2 , . . . , Xm , Y1 , Y2 , . . . , Yn q σx2 + σy2 ) Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (1) Porównanie średnich, σx , σy - znane X∼ N(µx ,σx ), Y ∼N(µy ,σy ) =⇒ X −Y ∼ N(µx −µy , X1 , X2 , . . . , Xm , q Y1 , Y2 , . . . , Yn √ √ X̄m∼ N(µx ,σx / m), Ȳn∼N(µy ,σy / n) =⇒ X̄m − Ȳn ∼ N µx − µy , q σx2 /m + σy2 /n σx2 + σy2 ) Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (1) Porównanie średnich, σx , σy - znane (X̄m − Ȳn ) − (µx − µy ) v u 2 uσ t x σ2 + y m n ∼ N(0, 1) Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (1) Porównanie średnich, σx , σy - znane WERYFIKACJA HIPOTEZ: Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (1) Porównanie średnich, σx , σy - znane WERYFIKACJA HIPOTEZ: H : µx = µy , K : µx > µy Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (1) Porównanie średnich, σx , σy - znane WERYFIKACJA HIPOTEZ: H : µx = µy , H : µx = µy , K : µx > µy K : |µx − µy | > 0 Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (1) Porównanie średnich, σx , σy - znane PRZYKŁAD: Zadanie 13 Test dwustronny (!?): H : µx = µy , K : |µx − µy | > 0 X̄m − Ȳn s σx2 σy2 + m n ∼ N(0, 1) Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (1) Porównanie średnich, σx , σy - znane PRZYKŁAD: Zadanie 13 (cd) Obszar krytyczny testu na poziomie istotności α: X̄m − Ȳn s σ2 σy2 x + m n ­ z1−α/2 580 − 610 = −2.54, Tutaj : q 900 1000 + 10 20 z0.975 = 1.96 # Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (1) Porównanie średnich, σx , σy - znane PRZYKŁAD: Zadanie 13 (cd) MOC TESTU X̄ − Ȳ m n β(µx , µy ) = Pµx ,µy s 2 σy2 σx + m n ­ z1−α/2 µ x − µy + Φ zα/2 − sµx − µy = 1 − Φ z1−α/2 − s σx2 σy2 σx2 σy2 + + m n m n R: por2siznane.R Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (2) Porównanie średnich, σx = σy = σ – znane (X̄m − Ȳn ) − (µx − µy ) v u u t 1 1 σ + m n ∼ N(0, 1) Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (3) Porównanie średnich, σx = σy = σ – nieznane (X̄m − Ȳn ) − (µx − µy ) s σ ∼ N(0, 1) 1 1 + m n nSy2 mSx2 + nSy2 mSx2 2 2 ∼ χ , ∼ χ , ∼ χ2m+n−2 m−1 n−1 σ2 σ2 σ2 Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (3) Porównanie średnich, σx = σy = σ – nieznane (X̄m − Ȳn ) − (µx − µy ) r mSx2 +nSy2 m+n−2 1 m + 1 n ∼ tm+n−2 Obszar krytyczny testu hipotezy H : µx = µy , K : µx 6= µy : X̄ − Ȳ α m n r mS 2 +nS 2 > tm+n−2 (1 − 2 ) x y 1 1 m+n−2 m + n Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (3) Porównanie średnich, σx = σy = σ – nieznane Moc testu hipotezy H : µx = µy , K : µx 6= µy : X̄ − Ȳ α m n r mS 2 +nS 2 > tm+n−2 (1 − 2 ) x y 1 1 m+n−2 m + n Moc(µx , µy ) : niecentralny test Studenta (∗) Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (4) Porównanie średnich, σx = kσy , k – znane (∗) Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (5) Porównanie średnich, σx , σy – nieznane Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (5) Porównanie średnich, σx , σy – nieznane Problem Behrensa–Fishera Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (5) Porównanie średnich, σx , σy – nieznane Problem Behrensa–Fishera Jarosław Bartoszewicz (1996): Nie znaleziono dotychczas dokładnego rozwiązania tego problemu, istnieją jedynie rozwiązania przybliżone Problem dwóch prób: X∼ N(µx ,σx ), Y ∼N(µy ,σy ) (5) Porównanie średnich, σx , σy – nieznane TEST WELCHA Statystyka t Studenta: X̄m − Ȳn r Sx2 m−1 + Sy2 n−1 Liczba stopni swobody: ν= R: Welch.R 1 c2 m−1 + (1−c)2 n−1 , c= Sx2 m−1 Sx2 m−1 + Sy2 n−1 (∗9) Wyk5: tu koniec 2.XI.09