Interpolacja wielomianowa

advertisement
Weryfikacja hipotez statystycznych
Hipoteza statystyczna – założenie co do wartości
parametru (parametrów) rozkładu prawdopodobieństwa.
Test statystyczny – narzędzie weryfikacji tej hipotezy.
Hipoteza prosta – zakłada wartości wszystkich parametrów
rozkładu.
Hipoteza złożona – co wartość co najmniej jednego
parametru jest nieznana (np. zakładamy tylko postać
funkcyjną rozkładu).
Hipoteza zerowa (Ho) – hipoteza, którą weryfikujemy.
Hipoteza alternatywna (H1) – co najmniej jeden z
parametrów rozkłady jest różny od tego z hipotezy
zerowej.
Błędy popełniane podczas weryfikacji hipotez
statystycznych
Błąd pierwszego rodzaju (false negative) –
odrzucenie prawdziwej hipotezy Ho.
Błąd drugiego rodzaju (false positive) –
przyjęcie fałszywej hipotezy Ho.
Poziom istotności (a)
P(|x|xo)=a
(test dwustronny)
P(xxo)=a
(test jednostronny)
Obszar krytyczny (Sc):
P(xSc|Ho)=a
Poziom istotności definiuje
prawdopodobieństwo popełnienia błędu
pierwszwego rodzaju (odrzucenia prawdziwej
hipotezy zerowej).
Moc testu: prawdopodobieństwo odrzucenia
hipotezy zerowej w zależności od hipotezy
alternatywnej.
M(Sc,l)=P(XSc|H)=P(XSc|l)
Test najmocniejszy hipotezy prostej Ho
względem hipotezy alternatywnej H1:
P(Sc,l1)=1-b=max
Test jednostajnie najmocniejszy: test
najmocniejszy względem jakiejkolwiek hipotezy
alternatywnej.
Test F Fishera równości wariancji
Mamy dwie populacje o rozkładzie normalnym (np.
przypadek pomiaru tej samej wielkości różnymi
przyrządami). Pytanie: czy te populacje mają tą samą
wariancję. W tym celu rozważamy iloraz F=s12/s22
X 12 
( N1  1) s12
 
f 
2

2
1

1
f 
  2
2
f 2 X 12
F
f1 X 22
1
f
2
fs12

2
1
 
1
2 2 ( f 2)
X 22 
( N 2  1) s22
 1 2
exp    
 2 

2
2

fs22
 22

 s12

 X 12
W ( F )  P 2  F   P 2  F  

 s2

 X2
 f1  f 2 
f1  f 2
f1


 F f1 1

2
2


 f1 
f
2
 F 2 1  1 F 

 
dF



f2 

 f 2   f1  f 2  0
2  2

 s12
P 2  F1a   1  a

 s2
Porównywanie wartości średnich (test
Studenta)
N
1
2
2
x j  x 
sx 

N ( N  1) j 1
Nf
x
N
t x
x
sx
sx

 x Nf

F (t )  P (  t )  P
 t
 



1

1

( f 1)
 (f  1)  t
2
2
  
2


1  
F( t ) 
d

f 
1 



 f  f
2 
t 'a
1
0 f ()d  2 (1  a)
Weryfikacja hipotezy, że x=l0
| x  l0 | N
| t |
t 1
1 a
sx
2
Weryfikacja hipotezy o równości wartości średnich z dwóch
serii pomiarów
|| |x y|
| t |

s
s
N1  N 2 2
s s s 
s
N1 N 2
2

s 
2
2
x
2
y
( N1  1) s  ( N 2  1) s
2
x
( N1  1)  ( N 2  1)
2
y
Test 2 dobroci dopasowania
gi: wynik i-tego pomiaru
fi: wartość teoretyczna wyniku i-tego pomiaru
i: odchylenie standardowe i-tego pomiaru.
ui 
gi  fi
i
 gi  fi 

T   u  
i 
i 1
i 1 
N
N
2
2
i
Wielkości ui mają rozkład normalny o zerowej średniej i jednostkowej wariancji a
zatem wielkość T ma rozkład 2 o N-p stopniach swobody, gdzie p jest liczbą
estymowanych parametrów funkcji f.
Dopasowanie uznajemy za złe na poziomie istotności a jeżeli T21a
Zastosowanie testu 2 do weryfikacji
hipotezy o rozkładzie częstości obserwacji
f(x)
}
}
}
}
1 2 … k … r
x
pi  P( x   i )   f ( x)dx
i
ni: liczba obserwacji wielkości w i-tym przedziale; n: całkowita
liczba obserwacji.
npi: wartość oczekiwana liczby obserwacji w i-tym przedziale
r
 
2
i 1
r
n   ni
i 1
(ni  npi )

2
i
2
(ni  npi )

npi
i 1
r
2
Wartość oczekiwana wariancji
liczby obserwacji.
Hipotezę o zgodności rozkładu obserwowanego z rozkładem założonym
odrzucamy na poziomie istotności a jeżeli 221a dla f stopni swobody.
f=liczba stopni swobody=r-p-1 gdzie p jest liczbą parametrów rozkładu (najwyżej r-1
stopni swobody).
Przykład: porównanie liczby
zliczeń par elektron-pozyton w
komorze pęcherzykowej
naświetlonej promieniowaniem
g z rozkładem Poissona.
p(k ) 
lk
e l
k!
~
l  k nk / k!
2=10.44
20.99=16.81
Nie ma zatem podstaw do
odrzucenia rozkładu Poissona.
Zastosowanie testu 2 do analizy tabeli wkładów
x, y: zmienne losowe mogące przyjmować wartości odpowiednio
x1, x2,…, xk oraz y1, y2,…, yl.
Każdej kombinacji zmiennych (xi,yj) przyporządkowana jest
liczba obserwacji nij.
y1
y2
…
yl
x1 n11
n12
…
n1l
x2 n21
n22
…
n2l
… …
…
…
…
xk nk1
nk2
…
nkl
~
~ )2
(
n

n
p
q
ij
i j
 2  
n~
p q~
k
l
i 1 j 1
l
1
~
pi   nij
n j 1
k
i
j
k
1
q~ j   nij
n i 1
l
n   nij
i 1 j 1
Jeżeli zmienne są współzależne na poziomie istotności a to 221a dla f=kl-1(k+l-2)=(k-1)(l-1) stopni swobody.
Przykład z medycyny: ocena skuteczności dwóch metod
leczenia danej choroby.
x1: pierwsza metoda leczenia
y1
y2
x1 n11=a n12=b
x2 n21=c n22=d
x2: druga metoda leczenia
y1: przypadki wyleczone
y2: przypadki niewyleczone
n(ad  bc)
 
(a  b)(c  d )( a  c)(b  d )
2
2
f=liczba stopni swobody=(2-1)(2-1)=1
Jeżeli metody leczenia mają różną skuteczność to 221a
Download