Funkcja generująca momenty oraz funkcja generująca kumulanty Funkcja generująca momenty (FGM) to funkcja zmiennej rzeczywistej (powiedzmy t) określona dla danej zmiennej losowej (powiedzmy X) w sposób następujący: ∞ ∫e M x (t ) = E (e ) = tx tx dFX ( x) −∞ Oczywiście dla dyskretnych rozkładów prawdopodobieństwa całkę interpretujemy jako odpowiedni szereg: ∞ M x (t ) = E (e tx ) = ∑ e tk ⋅ P( X = k ) k =0 Bardzo ważną cechą FGM jest to, że dwie zmienne losowe o różnych rozkładach prawdopodobieństwa mają różne FGM. Zatem FGM wyznacza jednoznacznie rozkład zmiennej losowej. Wprowadźmy następujące oznaczenia: mk = EX k - czyli k – ty moment zwykły; µ k = E ( X − EX ) k - czyli k – ty moment centralny; Jeżeli rozkład zmiennej losowej X jest taki, że istnieją momenty zwykłe dowolnego rzędu, to momenty te możemy wyznaczyć z wzoru: mk = ∂ k M x (t ) dt k t =0 Wzór ten uzasadnia nazwę funkcji. Wymagamy oczywiście, aby FGM wraz z pochodnymi rzędu k przyjmowała skończone wartości na otwartym otoczeniu zera. Zauważmy, że jeżeli warunek ten jest spełniony, wtedy możemy rozwinąć funkcję wykładniczą w szereg potęgowy: M x (t ) = E (e tx ) = E (1 + tX + t 2 m 2 t 3 m3 (tX ) 2 (tX ) 3 + + ...) = 1 + tm1 + + + ... 2! 3! 2! 3! i zauważyć, że k – ta pochodna tej funkcji jest postaci: t 2 mk + 2 ∂ k M x (t ) = mk + tmk +1 + + ... 2! dt k czyli w punkcie t = 0 przyjmuje ona wartość równą mk. Najbardziej użyteczna własność FGM dotyczy sumowania niezależnych zmiennych losowych. Jeżeli Z = X + Y, gdzie X, Y to niezależne zmienne losowe, to: M Z (t ) = E (e tZ ) = E (e t ( X +Y ) ) = E (e tX ⋅ e tY ) = E (e tX ) ⋅ E (e tY ) = M X (t ) ⋅ M Y (t ) Wykorzystaliśmy fakt, że funkcje dwóch niezależnych zmiennych losowych są również niezależnymi zmiennymi losowymi, oraz iż wartość oczekiwana iloczynu dwóch niezależnych zmiennych losowych równa jest iloczynowi ich wartości oczekiwanych. Możemy więc stwierdzić, że suma niezależnych zmiennych losowych ma FGM równą iloczynowi FGM każdego ze składników tej sumy. Popatrzmy na własności rozkładów Gamma korzystając z FGM. Przypomnijmy że rozkład Gamma o parametrach (α,β) (α,β– przyjmują wartości dodatnie) ma funkcję gęstości daną wzorem: β α α −1 − βx f ( x) = x e dla x > 0 Γ(α ) Funkcja Γ definiowana jest jako: ∞ Γ(α ) = ∫ s α −1e − s ds dla α > 0 0 Bardzo ważne szczególne przypadki to: rozkład wykładniczy, który otrzymujemy przyjmując α = 1, oraz rozkład chi – kwadrat o n stopniach swobody, który otrzymujemy n 1 przyjmując (α , β ) = , . 2 2 Obliczmy FGM rozkładu Gamma: ∞ β β α α −1 − βx M X (t ) = ∫ e x e dx = Γ(α ) β −t 0 xt α∞ ( β − t )α α −1 −( β −t ) x dx ∫0 Γ(α ) x e Widać, że dla t ≥ β uzyskana całka jest rozbieżna, natomiast dla t < β wynosi jeden, ponieważ jest całką z gęstości rozkładu Gamma(α,β - t). Czyli: α β dla t < β M X (t ) = β −t Weźmy pod uwagę Z = X + Y, gdzie X ~ G(α1,β), Y ~ G(α2,β) β M Z (t ) = M X (t ) ⋅ M Y (t ) = β −t α1 +α 2 Zatem Z ma również rozkład Gamma z parametrami (α1 + α2,β). Analogicznie stwierdzamy że jeżeli zmienna X ~ G(α,β), to zmienna cX ~ G(α,β/c). Teraz możemy wyznaczyć pochodne kolejnych rzędów FGM dla t = 0. Otrzymujemy następujące wyniki: α β α (α + 1) m2 = β2 α (α + 1)(α + 2) ⋅ ...(α + k ) mk = βk m1 = Oto FGM niektórych rozkładów zmiennych losowych: Rozkład Poissona (λ) Geometryczny (q) Ujemny binomialny (r,n) Gamma (α,β) Normalny (µ,σ) Funkcja gęstości Funkcja generująca momenty −λ k e λ M X (t ) − exp(λ (exp(t ) − 1)) , k = 0,1,2,... P( X = k ) = k! 1− q P( X = k ) = (1 − q)q k M X (t ) = 1 − qe t k = 0,1,2,... r r + k − 1 (1 − q) r q k 1− q P( X = k ) = M X (t ) = k 1 − qe t k = 0,1,2, ... β α α −1 − βx f ( x) = x e dla x > 0 Γ(α ) f ( x) = (x − µ)2 exp − 2 2 σ 2π σ 1 β M X (t ) = β −t α 1 M X (t ) = exp(tµ + t 2σ 2 ) 2 Przypomnijmy definicję skośności oraz kurtozy. Współczynnikiem skośności nazywamy następującą charakterystykę zmiennej losowej: γ = µ3 , gdzie σ oznacza odchylenie standartowe; σ3 Współczynnik skośności mówi o asymetrii rozkładu zmiennej losowej i przyjmuje wartości dodatnie dla rozkładów prawoskośnych (tzn. rozrzut po prawej stronie wartości oczekiwanej jest większy niż po stronie lewej), oraz wartości ujemne dla rozkładów lewoskośnych. Kurtozą (wskaźnikiem ekscesu) nazywamy natomiast następującą charakterystykę: γ2 = µ4 −3 σ4 Kurtoza jest wrażliwa na pojawianie się wielkich odchyleń od wartości oczekiwanej (ujemnych i dodatnich) dużo bardziej niż wariancja. Funkcja generująca kumulanty (FGK) określona jest w następujący sposób: C X (t ) = ln(M X (t )) Z definicji tej widać od razu, że FGK dla sumy niezależnych zmiennych losowych jest sumą FGK charakteryzujących składniki. Zdefiniujmy teraz kumulantę zmiennej losowej X rzędu k jako: ck = ∂ k C X (t ) ∂t k t =0 Przyjmijmy jeszcze jedno oznaczenie: Mk dla k – tej pochodnej FGM. Policzmy kilka pierwszych kumulant: ∂C (t ) ∂ ln(M (t )) M 1 = = ∂t ∂t Mo c1 = co po podstawieniu t = 0 daje m1, czyli wartość oczekiwaną zmiennej losowej. c2 = ∂ 2 C (t ) ∂ 2 ln(M (t )) M 2 M 0 − M 12 = = ∂t 2 ∂t 2 M 02 co po podstawieniu t = 0 daje m2 – (m1)2, co jest równe wariancji, czyli drugiemu momentowi centralnemu. Następne obliczenia dają: c3 = ∂ 3C (t ) ∂ 3 ln(M (t )) M 3 M 02 − 3M 2 M 1 M 0 + 2M 13 = = ∂t 3 ∂t 3 M 04 Po obliczeniu czwartej pochodnej otrzymujemy: c 4 = µ 4 − 3(σ 2 ) 2 czyli czwarta kumulanta nie jest równa czwartemu momentowi centralnemu. Wracając jeszcze do skośności i kurtozy zauważmy, że: γ = c3 σ3 γ2 = c4 σ4 Dla omawianego wcześniej rozkładu Gamma (α,β) charakterystyki te wynoszą: γ = 2 γ2 = 6 α α