Prawdopodobienstwo i statystyka

advertisement
Przykłady testów
Prawdopodobieństwo i statystyka
Wykład XII:
Testowanie hipotez - przykłady
19 stycznia 2015
Prawdopodobieństwo i statystyka
Wykład XII: Testowanie hipotez - przykłady
Przykłady testów
Test zgodności Kołmogorowa
Test χ2 Pearsona
Test zgodności Kołmogorowa
Definicja dystrybuanty empirycznej
Niech X1 , X2 , . . . , XN będzie próbą prostą z rozkładu o
dystrybuancie F . Funkcję
R1 × Ω 3 (x, ω) 7→ FN (x, ω) = FN (x) =
N
1 X
1I
(Xk (ω))
N k=1 (−∞,x]
nazywamy dystrybuantą empiryczną (z próby długości N).
Uwaga: Z mocnego prawa wielkich liczb wynika, że dla każdego
x ∈ R1 i P-prawie wszędzie
FN (x) → F (x).
Prawdopodobieństwo i statystyka
Wykład XII: Testowanie hipotez - przykłady
Przykłady testów
Test zgodności Kołmogorowa
Test χ2 Pearsona
Test zgodności Kołmogorowa - cd.
Twierdzenie (Gliwienko-Cantelli)
Niech X1 , X2 , . . . będzie ciągiem niezależnych zmiennych losowych
o rozkładzie zadanym dystrybuantą F . Wtedy
!
P
sup |FN (x) − F (x)| → 0
= 1.
x∈R1
Uwaga: Powyższe twierdzenie bywa nazywane podstawowym
twierdzeniem statystyki matematycznej.
Niech teraz H0 : zmienne maja rozkład o dystrybuancie F , a
alternatywa H1 : zmienne mają inny rozkład G . Jak przetestować
tę hipotezę?
Prawdopodobieństwo i statystyka
Wykład XII: Testowanie hipotez - przykłady
Przykłady testów
Test zgodności Kołmogorowa
Test χ2 Pearsona
Test zgodności Kołmogorowa - cd.
Niech zmienne będą miały rozkład G i niech GN będzie
odpowiednią dystrybuantą empiryczną. Określamy statystykę
DN = sup |GN (x) − F (x)|.
x∈R1
Jeżeli G = F , to statystyka powinna przyjmować małe
wartości; jeżeli G 6= F , to wartości powinny być znacząco
większe. Określamy więc zbiór krytyczny dla poziomu
istotności α wzorem
KDN ,α = {DN > DN (α)},
gdzie PF (KDN ,α ) ¬ α.
Problem: PF (KDN ,α ) zależy od F ! Jak obliczyć to
prawdopodobieństwo dla każdego F ? Na szczęście w obszernej
klasie rozkładów PF (KDN ,α ) nie zależy od F !
Prawdopodobieństwo i statystyka
Wykład XII: Testowanie hipotez - przykłady
Przykłady testów
Test zgodności Kołmogorowa
Test χ2 Pearsona
Test zgodności Kołmogorowa - cd.
Jeżeli f jest funkcją niemalejącą, to dla dowolnej zmiennej
losowej X i t ∈ R1
{f (X ) < f (t)} ⊂ {X ¬ t} ⊂ {f (X ) ¬ f (t)}.
Niech F będzie dystrybuantą zmiennej losowej X . Jeśli F jest
ciągła, to
F (X ) ∼ U(0, 1).
Niech X1 , X2 , . . . , XN będzie próbką prostą z F . Jeżeli F jest
ciągła, to F (X1 ), F (X2 ), . . . jest próbką prostą z rozkładu
U(0, 1).
Prawdopodobieństwo i statystyka
Wykład XII: Testowanie hipotez - przykłady
Przykłady testów
Test zgodności Kołmogorowa
Test χ2 Pearsona
Test zgodności Kołmogorowa - cd.
Twierdzenie
Jeżeli F jest ciągła, to
PF (DN > DN (α)) =
= PU(0,1)
X
1 N
sup 1I [Uj ,1) (u) − u > DN (α) ,
N
u∈[0,1]
j=1
gdzie U1 , U2 , . . . jest próbką prostą z rozkładu U(0, 1).
Prawdopodobieństwo i statystyka
Wykład XII: Testowanie hipotez - przykłady
Test zgodności Kołmogorowa
Test χ2 Pearsona
Przykłady testów
Test zgodności χ2 („chi-kwadrat”) Pearsona
Niech zmienne losowe X1 , X2 , . . . , XN o jednakowych
rozkładach przyjmują wartości ai z prawdopodobieństwem
pi > 0, p1 + . . . + pk = 1.
Określamy:
νi =
N
X
1I {Xj =ai } .
j=1
Jeśli n1 + n2 + . . . + nk = N i zmienne losowe są niezależne, to
P(ν1 = n1 , ν2 = n2 , . . . , νk = nk ) =
n!
p n1 p n2 . . . pknk .
n1 !n2 ! . . . nk ! 1 2
(rozkład wielomianowy).
H0 : (ν1 , ν2 , . . . , νk ) ∼ Mult(n; p1 , p2 , . . . , pk ).
Prawdopodobieństwo i statystyka
Wykład XII: Testowanie hipotez - przykłady
Przykłady testów
Test zgodności Kołmogorowa
Test χ2 Pearsona
Test zgodności χ2 („chi-kwadrat”) Pearsona - cd.
2
χ =
k
X
(νi − Npi )2
i=1
Npi
.
Twierdzenie (Karl Pearson)
Przy założeniu H0 , gdy N → ∞, statystyka χ2 zmierza według
rozkładu do rozkładu χ2 z k − 1 stopniami swobody.
Rozkład χ2 z k-stopniami swobody to rozkład zmiennej
losowej
χ2k ∼ X12 + X22 + . . . + Xk2 ,
gdzie X1 , X2 , . . . , Xk są niezależne o rozkładzie N (0, 1).
χ2k ma rozkład Gamma(k/2, 1/2).
Prawdopodobieństwo i statystyka
Wykład XII: Testowanie hipotez - przykłady
Download