Funkcja generująca momenty oraz funkcja generująca

advertisement
Funkcja generująca momenty oraz funkcja generująca
kumulanty
Funkcja generująca momenty (FGM) to funkcja zmiennej rzeczywistej (powiedzmy t)
określona dla danej zmiennej losowej (powiedzmy X) w sposób następujący:
∞
∫e
M x (t ) = E (e ) =
tx
tx
dFX ( x)
−∞
Oczywiście dla dyskretnych rozkładów prawdopodobieństwa całkę interpretujemy jako
odpowiedni szereg:
∞
M x (t ) = E (e tx ) = ∑ e tk ⋅ P( X = k )
k =0
Bardzo ważną cechą FGM jest to, że dwie zmienne losowe o różnych rozkładach
prawdopodobieństwa mają różne FGM. Zatem FGM wyznacza jednoznacznie rozkład
zmiennej losowej.
Wprowadźmy następujące oznaczenia:
mk = EX k - czyli k – ty moment zwykły;
µ k = E ( X − EX ) k - czyli k – ty moment centralny;
Jeżeli rozkład zmiennej losowej X jest taki, że istnieją momenty zwykłe dowolnego
rzędu, to momenty te możemy wyznaczyć z wzoru:
mk =
∂ k M x (t )
dt k
t =0
Wzór ten uzasadnia nazwę funkcji. Wymagamy oczywiście, aby FGM wraz z
pochodnymi rzędu k przyjmowała skończone wartości na otwartym otoczeniu zera.
Zauważmy, że jeżeli warunek ten jest spełniony, wtedy możemy rozwinąć funkcję
wykładniczą w szereg potęgowy:
M x (t ) = E (e tx ) = E (1 + tX +
t 2 m 2 t 3 m3
(tX ) 2 (tX ) 3
+
+ ...) = 1 + tm1 +
+
+ ...
2!
3!
2!
3!
i zauważyć, że k – ta pochodna tej funkcji jest postaci:
t 2 mk + 2
∂ k M x (t )
= mk + tmk +1 +
+ ...
2!
dt k
czyli w punkcie t = 0 przyjmuje ona wartość równą mk.
Najbardziej użyteczna własność FGM dotyczy sumowania niezależnych zmiennych
losowych. Jeżeli Z = X + Y, gdzie X, Y to niezależne zmienne losowe, to:
M Z (t ) = E (e tZ ) = E (e t ( X +Y ) ) = E (e tX ⋅ e tY ) = E (e tX ) ⋅ E (e tY ) = M X (t ) ⋅ M Y (t )
Wykorzystaliśmy fakt, że funkcje dwóch niezależnych zmiennych losowych są również
niezależnymi zmiennymi losowymi, oraz iż wartość oczekiwana iloczynu dwóch
niezależnych zmiennych losowych równa jest iloczynowi ich wartości oczekiwanych.
Możemy więc stwierdzić, że suma niezależnych zmiennych losowych ma FGM równą
iloczynowi FGM każdego ze składników tej sumy.
Popatrzmy na własności rozkładów Gamma korzystając z FGM. Przypomnijmy że
rozkład Gamma o parametrach (α,β) (α,β– przyjmują wartości dodatnie) ma funkcję gęstości
daną wzorem:
β α α −1 − βx
f ( x) =
x e dla x > 0
Γ(α )
Funkcja Γ definiowana jest jako:
∞
Γ(α ) = ∫ s α −1e − s ds dla α > 0
0
Bardzo ważne szczególne przypadki to: rozkład wykładniczy, który otrzymujemy przyjmując
α = 1, oraz rozkład chi – kwadrat o n stopniach swobody, który otrzymujemy
n 1
przyjmując (α , β ) =  ,  .
 2 2
Obliczmy FGM rozkładu Gamma:
∞
 β 
β α α −1 − βx

M X (t ) = ∫ e
x e dx = 
Γ(α )
 β −t
0
xt
α∞
( β − t )α α −1 −( β −t ) x
dx
∫0 Γ(α ) x e
Widać, że dla t ≥ β uzyskana całka jest rozbieżna, natomiast dla t < β wynosi jeden, ponieważ
jest całką z gęstości rozkładu Gamma(α,β - t). Czyli:
α
 β 
 dla t < β
M X (t ) = 
 β −t
Weźmy pod uwagę Z = X + Y, gdzie X ~ G(α1,β), Y ~ G(α2,β)
 β 

M Z (t ) = M X (t ) ⋅ M Y (t ) = 
 β −t
α1 +α 2
Zatem Z ma również rozkład Gamma z parametrami (α1 + α2,β). Analogicznie stwierdzamy
że jeżeli zmienna X ~ G(α,β), to zmienna cX ~ G(α,β/c). Teraz możemy wyznaczyć pochodne
kolejnych rzędów FGM dla t = 0. Otrzymujemy następujące wyniki:
α
β
α (α + 1)
m2 =
β2
α (α + 1)(α + 2) ⋅ ...(α + k )
mk =
βk
m1 =
Oto FGM niektórych rozkładów zmiennych losowych:
Rozkład
Poissona (λ)
Geometryczny (q)
Ujemny binomialny (r,n)
Gamma (α,β)
Normalny (µ,σ)
Funkcja gęstości
Funkcja generująca momenty
−λ k
e λ
M X (t ) − exp(λ (exp(t ) − 1))
, k = 0,1,2,...
P( X = k ) =
k!
1− q
P( X = k ) = (1 − q)q k
M X (t ) =
1 − qe t
k = 0,1,2,...
r
 r + k − 1
(1 − q) r q k
 1− q 
P( X = k ) = 

M X (t ) = 
 k 
1 − qe t 

k = 0,1,2, ...
β α α −1 − βx
f ( x) =
x e dla x > 0
Γ(α )
f ( x) =
 (x − µ)2 

exp −
2
2
σ
2π σ


1
 β 

M X (t ) = 
 β −t
α
1
M X (t ) = exp(tµ + t 2σ 2 )
2
Przypomnijmy definicję skośności oraz kurtozy. Współczynnikiem skośności
nazywamy następującą charakterystykę zmiennej losowej:
γ =
µ3
, gdzie σ oznacza odchylenie standartowe;
σ3
Współczynnik skośności mówi o asymetrii rozkładu zmiennej losowej i przyjmuje wartości
dodatnie dla rozkładów prawoskośnych (tzn. rozrzut po prawej stronie wartości oczekiwanej
jest większy niż po stronie lewej), oraz wartości ujemne dla rozkładów lewoskośnych.
Kurtozą (wskaźnikiem ekscesu) nazywamy natomiast następującą charakterystykę:
γ2 =
µ4
−3
σ4
Kurtoza jest wrażliwa na pojawianie się wielkich odchyleń od wartości oczekiwanej
(ujemnych i dodatnich) dużo bardziej niż wariancja.
Funkcja generująca kumulanty (FGK) określona jest w następujący sposób:
C X (t ) = ln(M X (t ))
Z definicji tej widać od razu, że FGK dla sumy niezależnych zmiennych losowych jest sumą
FGK charakteryzujących składniki. Zdefiniujmy teraz kumulantę zmiennej losowej X rzędu k
jako:
ck =
∂ k C X (t )
∂t k
t =0
Przyjmijmy jeszcze jedno oznaczenie: Mk dla k – tej pochodnej FGM. Policzmy kilka
pierwszych kumulant:
∂C (t ) ∂ ln(M (t )) M 1
=
=
∂t
∂t
Mo
c1 =
co po podstawieniu t = 0 daje m1, czyli wartość oczekiwaną zmiennej losowej.
c2 =
∂ 2 C (t ) ∂ 2 ln(M (t )) M 2 M 0 − M 12
=
=
∂t 2
∂t 2
M 02
co po podstawieniu t = 0 daje m2 – (m1)2, co jest równe wariancji, czyli drugiemu momentowi
centralnemu. Następne obliczenia dają:
c3 =
∂ 3C (t ) ∂ 3 ln(M (t )) M 3 M 02 − 3M 2 M 1 M 0 + 2M 13
=
=
∂t 3
∂t 3
M 04
Po obliczeniu czwartej pochodnej otrzymujemy:
c 4 = µ 4 − 3(σ 2 ) 2
czyli czwarta kumulanta nie jest równa czwartemu momentowi centralnemu. Wracając
jeszcze do skośności i kurtozy zauważmy, że:
γ =
c3
σ3
γ2 =
c4
σ4
Dla omawianego wcześniej rozkładu Gamma (α,β) charakterystyki te wynoszą:
γ =
2
γ2 =
6
α
α
Download