Wykład 4 Statystyki dostateczne, zupełne, swobodne

advertisement
Wykład 4
Statystyki dostateczne, zupełne, swobodne
Magdalena Frąszczak
Wrocław, 26 października 2016r
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystyki dostateczne
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Rozkłady warunkowe - przypomnienie
Definicja 4.1
Niech X i Y oznaczają zmienne losowe typu dyskretnego, oraz
niech P(Y = yj ) > 0, dla każdego j = 1, 2, . . . , i. Rozkład
warunkowy zmiennej losowej X pod warunkiem, że Y = yj
określamy wzorem:
P(X = xi |Y = yj ) =
P(X = xi , Y = yj )
,
P(Y = yj )
Magdalena Frąszczak
i = 1, 2, . . . .
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Rozkłady warunkowe - przypomnienie
Jeżeli (X1 , X2 ) jest wektorem ciągłych zmiennych losowych, to
gęstością brzegową zmiennej losowej X1 nazywamy funkcję:
Z ∞
fX1 (x1 ) =
−∞
fX1 ,X2 (x1 , t)dt.
Definicja 4.2
Niech X i Y oznaczają ciągłe zmienne losowe. Przez f (x, y )
oznaczamy gęstość łączną wektora losowego (X , Y ). Gęstością
rozkładu warunkowego zmiennej losowej X pod warunkiem, że
Y = y nazywamy funkcję zdefiniowaną następująco:
fX |y (x) =
Magdalena Frąszczak
fX ,Y (x, y )
fY (y )
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystki dostateczne
Definicja 4.3
Statystyka T nazywa się statystyką dostateczną dla parametru θ
(statystyką dostateczną dla P), jeżeli dla każdej wartości t tej
statystyki rozkład warunkowy P(·|T = t) nie zależy od θ.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystki dostateczne. Przykład 4.1
Niech X = (X1 , X2 , . . . , Xn )0 będzie próbą z rozkładu
dwumianowego, P(Xi = 1) = p, P(Xi = 0) = q = 1 − p.
P
Niech T = ni=1 Xi .
Dla 0 ¬ t ¬ n.
P[X = x|T (X) = t] = P[(X1 , X2 , . . . , Xn )0 = (x1 , x2 , . . . , xn )0 |T (X) = t] =
=
P[X=x,T (X)=t]
P[T (X)=t]
Qn−1
=
i=1
Pn−1 =
P X1 =x1 ,X2 =x2 ,...,Xn−1 =xn−1 ,Xn =t−
Pn
P[
Pn−1
t−
x
x =t ]
i=1 i
1−t+
i=1 i (1−p)
{pxi (1−p)1−xi }·p
n
t
( t )p (1−p)n−t
Pn−1
i=1
xi
=
i=1
xi
=
1
(nt)
oraz P[X = x|T (X) = t] = 0 w przeciwnym wypadku. Zatem
Pn
i=1 Xi jest statystyką dostateczną.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Kryterium faktoryzacji
Twierdzenie 4.2 (kryterium faktoryzacji)
Statystyka T jest dostateczna wtedy i tylko wtedy, gdy gęstość
rozkładu prawdopodobieństwa próby X1 , X2 , . . . , Xn można
przedstawić w postaci
fθ (x1 , x2 , · · · , xn ) = gθ (T (x1 , x2 , . . . , xn ))h(x1 , x2 , · · · , xn ),
gdzie funkcja h nie zależy od θ, a funkcja gθ , zależna od θ, zależy
od x1 , x2 , · · · , xn tylko poprzez wartość statystyki T.
Uwaga
Cała próba jest statystyką dostateczną, jest to tzn. trywialna
statystyka dostateczna.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystki dostateczne. Przykład 4.2
Niech X = (X1 , X2 , . . . , Xn )0 będzie próbą z rozkładu jednostajnego
na odcinku (0, θ), U(0, θ); θ > 0.
f (xi ; θ) = 1θ I[0,θ] (xi ).
Gęstość łączna jest postaci:
n
Y
i=1
f (xi ; θ) =
n
1
1 Y
I[0,θ] (xi ) = n I[0,∞] (x1:n )I[0,θ] (xn:n ).
n
θ i=1
θ
Tutaj
gθ (T (x)) = θ1n I[0,θ] (xn:n );
h(x) = I[0,∞] (x1:n )
Zatem z kryterium faktoryzacji, statystyka T (X) = Xn:n jest
statystyką dostateczną dla θ.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Minimalne statystyki dostateczne
Definicja 4.4
Statystykę dostateczną S nazywamy minimalną statystyką
dostateczną dla rodziny rozkładów P jeżeli dla każdej statystyki
dostatecznej T dla rodziny P istnieje funkcja h, taka że
S(x) = h(T (x))
dla prawie wszystkich x.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Wykładnicze rodziny rozkładów
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Wykładnicze rodziny rozkładów
Definicja 4.5
Rodzina rozkładów prawdopodobieństwa {Pθ , θ ∈ Θ} nazywa się
wykładniczą rodziną rozkładów, gdy gęstości tych rozkładów są
postaci:


n
X
f (x; θ) = C (θ) exp  Qj (θ)Tj (x) · h(x),
j=1
gdzie Qj , Tj , j = 1, 2, . . . , k, C i h są pewnymi funkcjami.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Wykładnicze rodziny rozkładów. Przykład 4.3
{b(n, p), p ∈ (0, 1)}
!
f (x; p) =
Zatem:
n x
p
p (1 − p)n−x = (1 − p)n exp x log
x
1−p
!
n
.
x
C (p) = (1 − p)n h(x) = xn
p
T (x) = x
Q(p) = log 1−p
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Wykładnicze rodziny rozkładów
Twierdzenie 4.3
Jeżeli {Pθ , θ ∈ Θ} jest wykładniczą rodziną rozkładów z
gęstościami:
f (x; θ) = exp

k
X

j=1
θj Tj (x) − b(θ)



to (T1 (X ), T2 (X ), ..., Tk (X )) jest (k-wymiarową) minimalną
statystyką dostateczną.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystyki zupełne i swobodne
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystyki zupełne
Definicja 4.6
Mówimy, że rodzina rozkładów P jest zupełna (ograniczenie
zupełna), jeżeli każda rzeczywista mierzalna funkcja ψ spełniająca
warunek:
Eθ (ψ(X )) = 0, dla każdego θ ∈ Θ
jest równa zero prawie wszędzie P.
Definicja 4.7
Statystyka nazywa się zupełna, jeżeli rodzina jej rozkładów jest
zupełna.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystyki zupełne - Przykład 4.4
P = {b(n, p), p ∈ (0, 1)}
Dla dowolnej funkcji ψ określonej na X = {0, 1, 2, . . . , n} i takiej,
że:
n
X
!
n
X
!
n x
Ep [ψ(X )] =
ψ(x)
p (1−p)n−x = 0
x
x=0
dla każdego p ∈ (0, 1)
mamy dalej
n
Ep [ψ(X )] =
ψ(x)
x
x=0
p
1−p
Magdalena Frąszczak
x
=0
dla każdego p ∈ (0, 1)
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystyki zupełne. Przykład 4.4 - c.d.
oznaczając ρ =
p
1−p
> 0 otrzymujemy:
n
X
!
n x
Ep [ψ(X )] =
ψ(x)
ρ =0
x
x=0
ρ>0
stąd dla każdego x = 0, 1, 2, . . . , n ψ(x) = 0, a stąd rodzina
rozkładów bernoulliego jest zupełna.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystyki zupełne. Przykład 4.5
P = {N(µ, σ 2 ); µ ∈ R, σ > 0}
1
Eµ,σ [ψ(X )] = √
2πσ
Z ∞
2
1 (x−µ)
σ2
ψ(x)e − 2
dx = 0
dla każdego µ, σ > 0.
−∞
Mamy
Z ∞
Eµ,σ [ψ(X )] =
1 x2
mx
ψ(x)e − 2 σ2 e σ2 dx = 0
dla każdego µ, σ > 0.
−∞
Oznaczmy, przez θ =
Z ∞
Eµ,σ [ψ(X )] =
µ
.
σ2
Wówczas:
1 x2
e θx ψ(x)e − 2 σ2 = 0
−∞
Magdalena Frąszczak
dla każdego θ ∈ R.
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystyki zupełne. Przykład 4.5 - c.d.
∞
Znanym faktem jest, że przekształcenie postaci: −∞
e θx · f (x)dx
nazywa się dwustronnym przekształceniem Laplace’a funkcji f .
Wiadomo, że jeśli przekształcenie Laplace’a funkcji całkowalnej jest
równa zeru, to funkcja ta jest równa zeru prawie wszędzie.
Przenosząc tą wiedzę na nasz przypadek otrzymujemy:
R
1 x2
f (x) = ψ(x)e − 2 σ2 = 0,
czyli ψ(x) = 0. Zatem rodzina rozkładów normalnych jest rodziną
zupełną.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystyki zupełne. Przykład 4.6
P = {N(1, σ 2 ); σ > 0}
1
Eσ [ψ(X )] = √
2πσ
Z ∞
2
1 (x−1)
σ2
ψ(x)e − 2
dx
−∞
Przyjmijmy ψ(x) = x − 1, czyli ψ(x) 6= 0 dla każdego x. Wówczas
Z ∞
Eσ [ψ(X )] =
xe
− 12
(x−1)2
σ2
dx −
−∞
Z ∞
2
1 (x−1)
σ2
e− 2
dx = 1 − 1 = 0
−∞
dla każdego σ > 0. Stąd rodzina ta nie jest zupełna.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystyki zupełne
Twierdzenie 4.4
Jeżeli T jest statystyką dostateczną zupełną, to jest minimalną
statystyką dostateczną.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystyki swobodne
Definicja 4.8
Statystykę V nazywamy statystyką swobodną, gdy jej rozkład nie
zależy od parametru.
Statystykę V nazywamy statystyką swobodną pierwszego rzędu,
gdy E [V ] nie zależy od parametru.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystyki swobodne. Przykład 4.7
Niech będzie dana próba (X1 , X2 , . . . , Xn ) z rozkładu normalnego
N(µ, σ 2 ).
Rozpatrzmy funkcję niezmienniczą na przesunięcia, czyli
spełniającą warunek:
ϕ(x1 , x2 , . . . , xn ) = ϕ(x1 + a, x2 + a, . . . , xn + a), dla każdego
a ∈ R i każdego wektora (x1 , x2 , . . . , xn ) ∈ Rn .
Niech teraz:
V = ϕ(X1 , X2 , . . . , Xn )0 .
Znanym faktem jest, że zmienne losowe:
Xi − µ ∼ N(0, σ 2 ),
a stąd rozkład statystyki V nie zależy od parametru µ.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Statystyki swobodne. Przykład 4.7 - c.d.
Przykładowo każda funkcja statystyki
(X1 − X̄ , X2 − X̄ , . . . , Xn − X̄ ) jest statystyką swobodną dla µ.
Np.:
V =
n
X
(Xi − X̄ )2
i=1
jest statystką swobodną dla µ.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Twierdzenie Basu
Twierdzenie 4.5
Jeżeli T jest statystyką dostateczną zupełną w rodzinie rozkładów
{Pθ } i jeżeli V jest statystyką swobodną, to statystyki T i V są
niezależne.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Twierdzenie Basu. Przykład 4.8
Niech X = (X1 , X2 , . . . , Xn )0 będzie próbą z rozkładu normalnego
N(µ, σ 2 ), µ ∈ R, σ > 0.
Statystyką dostateczną dla parametru µ jest X̄ . Dodatkowo
rodzina rozkładów statystyki X̄ jest zupełna (przykład 4.5).
Z przykładu 4.7 statystyka V = ϕ(X1 , X2 , . . . , Xn )0 , gdzie ϕ jak w
przykładzie 4.7, jest statystyką swobodną dla parametru µ.
Zatem z Twierdzenia Basu statystyki X̄ i V są niezależne
stochastycznie.
1 Pn
2
W szczególnym przypadku statystyki X̄ i S 2 = n−1
i=1 (Xi − X̄ )
są niezależne stochastycznie.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Literatura:
Bartoszewicz J.,Wykłady ze statystyki matematycznej, PWN,
Warszawa 1989.
M. Krzyśko,Statystyka matematyczna, Wyd. UAM, Poznań
2004.
R. Zieliński,Siedem wykładów wprowadzających do statystyki
matematycznej, PWN, Warszawa 1990.
Magdalena Frąszczak
Wykład 4 Statystyki dostateczne, zupełne, swobodne
Download