Przykłady testów Prawdopodobieństwo i statystyka Wykład XII: Testowanie hipotez - przykłady 19 stycznia 2015 Prawdopodobieństwo i statystyka Wykład XII: Testowanie hipotez - przykłady Przykłady testów Test zgodności Kołmogorowa Test χ2 Pearsona Test zgodności Kołmogorowa Definicja dystrybuanty empirycznej Niech X1 , X2 , . . . , XN będzie próbą prostą z rozkładu o dystrybuancie F . Funkcję R1 × Ω 3 (x, ω) 7→ FN (x, ω) = FN (x) = N 1 X 1I (Xk (ω)) N k=1 (−∞,x] nazywamy dystrybuantą empiryczną (z próby długości N). Uwaga: Z mocnego prawa wielkich liczb wynika, że dla każdego x ∈ R1 i P-prawie wszędzie FN (x) → F (x). Prawdopodobieństwo i statystyka Wykład XII: Testowanie hipotez - przykłady Przykłady testów Test zgodności Kołmogorowa Test χ2 Pearsona Test zgodności Kołmogorowa - cd. Twierdzenie (Gliwienko-Cantelli) Niech X1 , X2 , . . . będzie ciągiem niezależnych zmiennych losowych o rozkładzie zadanym dystrybuantą F . Wtedy ! P sup |FN (x) − F (x)| → 0 = 1. x∈R1 Uwaga: Powyższe twierdzenie bywa nazywane podstawowym twierdzeniem statystyki matematycznej. Niech teraz H0 : zmienne maja rozkład o dystrybuancie F , a alternatywa H1 : zmienne mają inny rozkład G . Jak przetestować tę hipotezę? Prawdopodobieństwo i statystyka Wykład XII: Testowanie hipotez - przykłady Przykłady testów Test zgodności Kołmogorowa Test χ2 Pearsona Test zgodności Kołmogorowa - cd. Niech zmienne będą miały rozkład G i niech GN będzie odpowiednią dystrybuantą empiryczną. Określamy statystykę DN = sup |GN (x) − F (x)|. x∈R1 Jeżeli G = F , to statystyka powinna przyjmować małe wartości; jeżeli G 6= F , to wartości powinny być znacząco większe. Określamy więc zbiór krytyczny dla poziomu istotności α wzorem KDN ,α = {DN > DN (α)}, gdzie PF (KDN ,α ) ¬ α. Problem: PF (KDN ,α ) zależy od F ! Jak obliczyć to prawdopodobieństwo dla każdego F ? Na szczęście w obszernej klasie rozkładów PF (KDN ,α ) nie zależy od F ! Prawdopodobieństwo i statystyka Wykład XII: Testowanie hipotez - przykłady Przykłady testów Test zgodności Kołmogorowa Test χ2 Pearsona Test zgodności Kołmogorowa - cd. Jeżeli f jest funkcją niemalejącą, to dla dowolnej zmiennej losowej X i t ∈ R1 {f (X ) < f (t)} ⊂ {X ¬ t} ⊂ {f (X ) ¬ f (t)}. Niech F będzie dystrybuantą zmiennej losowej X . Jeśli F jest ciągła, to F (X ) ∼ U(0, 1). Niech X1 , X2 , . . . , XN będzie próbką prostą z F . Jeżeli F jest ciągła, to F (X1 ), F (X2 ), . . . jest próbką prostą z rozkładu U(0, 1). Prawdopodobieństwo i statystyka Wykład XII: Testowanie hipotez - przykłady Przykłady testów Test zgodności Kołmogorowa Test χ2 Pearsona Test zgodności Kołmogorowa - cd. Twierdzenie Jeżeli F jest ciągła, to PF (DN > DN (α)) = = PU(0,1) X 1 N sup 1I [Uj ,1) (u) − u > DN (α) , N u∈[0,1] j=1 gdzie U1 , U2 , . . . jest próbką prostą z rozkładu U(0, 1). Prawdopodobieństwo i statystyka Wykład XII: Testowanie hipotez - przykłady Test zgodności Kołmogorowa Test χ2 Pearsona Przykłady testów Test zgodności χ2 („chi-kwadrat”) Pearsona Niech zmienne losowe X1 , X2 , . . . , XN o jednakowych rozkładach przyjmują wartości ai z prawdopodobieństwem pi > 0, p1 + . . . + pk = 1. Określamy: νi = N X 1I {Xj =ai } . j=1 Jeśli n1 + n2 + . . . + nk = N i zmienne losowe są niezależne, to P(ν1 = n1 , ν2 = n2 , . . . , νk = nk ) = n! p n1 p n2 . . . pknk . n1 !n2 ! . . . nk ! 1 2 (rozkład wielomianowy). H0 : (ν1 , ν2 , . . . , νk ) ∼ Mult(n; p1 , p2 , . . . , pk ). Prawdopodobieństwo i statystyka Wykład XII: Testowanie hipotez - przykłady Przykłady testów Test zgodności Kołmogorowa Test χ2 Pearsona Test zgodności χ2 („chi-kwadrat”) Pearsona - cd. 2 χ = k X (νi − Npi )2 i=1 Npi . Twierdzenie (Karl Pearson) Przy założeniu H0 , gdy N → ∞, statystyka χ2 zmierza według rozkładu do rozkładu χ2 z k − 1 stopniami swobody. Rozkład χ2 z k-stopniami swobody to rozkład zmiennej losowej χ2k ∼ X12 + X22 + . . . + Xk2 , gdzie X1 , X2 , . . . , Xk są niezależne o rozkładzie N (0, 1). χ2k ma rozkład Gamma(k/2, 1/2). Prawdopodobieństwo i statystyka Wykład XII: Testowanie hipotez - przykłady