korelacja i regresja wielowymiarowa

advertisement
ESTYMACJA PRZEDZIAŁOWA
Przedział ufności dla wartości średniej m
populacji.
Przedział ufności dla wartości średniej m
populacji.
Algorytm
Model I
Populacja ma rozkład N(m, σ),
wartość przeciętna
1
X
n
n
X
i
i 1
m – nieznany parametr,
odchylenie standardowe
σ – znany parametr.
PrU  u   
wartość odczytaną z
tablicy kwantyli rozkładu
N(0,1).


 
Pr X  u
 m  X  u
  1  
n
n

Przedział ufności dla wartości średniej m
populacji.
Algorytm
Model II
1
X
n
n

Xi
i 1
1
S 
n
2
n
2


x

x
 i
i 1
Populacja ma rozkład N(m, σ),
m, σ – nieznane parametry,
próba mała - n  30 .
Pr t  t   

Pr X  t

wartość kwantyla
rzędu rozkładu
Studenta o n-1
stopniach swobody
S
 m  X  t
n 1
S 
  1  
n 1 
Przedział ufności dla wartości średniej m
populacji.
Algorytm
Model III
Populacja ma rozkład N(m, σ)
bądź dowolny inny o średniej
m i o wariancji skończonej
S2 = σ 2,
m, σ – nieznane parametry,
próba duża - n > 30 .
1
X
n
s
*2
n
X
i
i 1
n 2
1 n
2



s 
x

x
 i
n 1
n  1 i 1
PrU  u   
wartość odczytaną z
tablicy kwantyli rozkładu
N(0,1).

s*
s* 
  1  
Pr X  u
 m  X  u
n
n

Przedział ufności dla wariancji i odchylenia
standardowego σ populacji.
Model I
Dana jest populacja
generalna o rozkładzie
normalnym N(m, σ);
parametry m i σ są
nieznane. Należy
oszacować wariancję
populacji σ 2 , n  30 .
Algorytm
1
S2 
n
n
2


x

x
 i
i 1
 



 2 1  , n  1 oraz  2  , n  1
2


2

są odpowiednimi kwantylami rozkładu
2 o n-1 stopniach swobody
dla wariancji




2
2
nS
nS


,
 2 


2 
   1  , n  1   , n  1 
2

2

 
dla odchylenia standardowego




n
n


S
,
S



 
2
2 
  , n  1 
  1  , n  1
2


2
 

Przedział ufności dla wariancji i odchylenia
standardowego σ populacji.
Model II
Dana jest populacja
generalna o rozkładzie
normalnym N(m, σ);
parametry m i σ są
nieznane, n > 30 .
Algorytm
1
2
S 
n
 
u 1  
 2
n
2


x

x
 i
i 1
wartość odczytaną z
tablicy kwantyli 1 – ½ 
rozkładu N(0,1).
przedział ufności dla parametru b – odchylenia standardowego


S 2n

,

 
2
n

3

u

1  
2




S 2n

 
2 n  3  u 1   
2 

Wielkość próby potrzebna do oszacowania
parametru m z zadaną dokładnością.
Szukamy na danym poziomie ufności 1 –  takiej minimalnej liczby prób, aby
otrzymać przedział ufności dla wartości przeciętnej o długości nie większej niż 2k.
Zakładajmy, że badana populacja ma rozkład N(m,b), gdzie m i b są nieznanymi
parametrami.
Pobieramy wstępną próbę o liczności n0 i obliczamy:
1
x0 
n0
n0

i 1
xi
oraz
1
S 
n0
2
n0
2


x

x
i

i 1
2
  
S
r   t 1  , n 0  1   1
2
k
 
Jeżeli r  n0, to pozostajemy przy wybranej próbce o liczności n0.
Jeżeli r > n0, to do próbki wstępnej dobieramy jeszcze co najmniej n1 elementów,
gdzie n1 = [r] - n0 +1.
W przypadku, gdy znamy wartość σ rozkładu populacji, możemy wyznaczyć
liczność próby n bezpośrednio z nierówności
2d  2k
Przedziały ufności dla parametru p w rozkładzie
dwumianowym
n k
nk
PK  k     p 1  p 
k 
P( p1  p)  P( p  p 2 )  1 

2
k
p1 
1

k  (n  k  1)  qF 
,2  n  k  1,2  k 
 2

1

k  1 qF 
,2  k  1,2  (n  k ) 
2


p2 
1

n  k  (k  1)  qF 
,2  k  1,2  (n  k ) 
 2

Przedziały ufności dla parametru p w rozkładzie
dwumianowym
n k
nk
PK  k     p 1  p 
k 
P( p1  p)  P( p  p 2 )  1 

2
k
p1 
1

k  (n  k  1)  qF 
,2  n  k  1,2  k 
 2

1

k  1 qF 
,2  k  1,2  (n  k ) 
2


p2 
1

n  k  (k  1)  qF 
,2  k  1,2  (n  k ) 
 2

k  np 
np1  p 
k  np 
2
 u  np1  p 
2
2
Testy parametryczne
Populacja generalna ma rozkład N(m,), odchylenie standardowe
jest znane. Nieznany jest parametr m, dla którego stawiamy
hipotezę H0: m=m0, przeciwko hipotezie H1: m  m0
U
X  m0

n
Pr( U  u )  
Pr( U  u )  2 Pr(U  u )  2(1  u )  
u   1 

2
(,u )  (u , )
Populacja generalna ma rozkład N(m,), odchylenie
standardowe nie jest znane. Hipoteza H0: m=m0, przeciwko
hipotezie H1: m  m0
X  m0
t
S

1 
S    xi  x 
n i 1 

n
2
2
n 1 
X  m0
^
n
S


1
 xi  x 
S 


n  1 i 1 

^
2
Pr( t  t )  
n
2
Testy dla wariancji
H0:   
H1:  2   02
2
2
0
 
2
nS

2
0
2
nS

2
0
 
2
2
nS2

Pr(     )  
2
2
2
0
 
2
Dla dużych n

N n 1, 2(n 1)
U
 2  n  1
2n  1

DZIĘKUJĘ ZA UWAGĘ
Download