Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki 22 listopada 2016 Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Uprzednio wprowadzone pojęcia i ich własności Definicja zmiennej losowej Zmienna losowa na przestrzeni probabilistycznej (Ω, F, P) to funkcja X : Ω → R1 posiadająca własność X −1 ((a, +∞)) = {ω ; X (ω) > a} ∈ F, a ∈ R1 . Dowiedzielismy się, że ten fakt pociąga dużo więcej: X −1 (B) ∈ F, dla każdego B ∈ B 1 , gdzie B 1 = σ{(a, +∞) ; a ∈ IR 1 } jest σ-algebrą podzbiorów borelowskich IR 1 . Jeśli X jest zmienną lsową, to f (X ) też jest zmienną losową, o ile f : IR 1 → IR 1 jest funkcją borelowską, tzn. f −1 ((a, +∞)) = {f > a} ∈ B1 , dla każdego a ∈ IR 1 . Funkcje monotoniczne, schodkowe i ciągłe są funkcjami borelowskimi. Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Uprzednio wprowadzone pojęcia i ich własności Definicja wartości oczekiwanej Wartość oczekiwana lub wartość średnia nieujemnej zmiennej losowe X jest określona jako całka EX := Z +∞ P(X > u) du ∈ [0, +∞]. 0 Niech f będzie funkcją o wartościach rzeczywistych. Część dodatnia f + i część ujemna f − funkcji f są określone jako h+ (f ) h− (f ), gdzie h+ (x) = 0 ∨ x i h− (x) = 0 ∨ (−x). Niech X będzie zmienna losową. Jeśli EX + < +∞ oraz EX − < +∞, to mówimy, że wartość oczekiwana X istnieje i definiujemy ją jako EX := EX + − EX − ∈ (−∞, +∞). Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Własności wartości oczekiwanej Twierdzenie 1 Jeśli X ­ 0, to EX ­ 0. 2 Jeśli X ­ 0 i EX = 0, to P(X = 0) = 1. 3 |EX | ¬ E |X |. 4 Jeśli E |X | < +∞ i E |Y | < +∞, to dla dowolnych liczb α, β ∈ R1 funkcja αX + βY jest całkowalną zmienna losową i mamy: E (αX + βY ) = αEX + βEY . 5 Jeśli Y ­ X i wartości oczekiwane istnieją, to EY ­ EX . Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Dystrubuanta zmiennej losowej Niech X ­ 0. Jak obliczyć EX 2 ? Odpowiedź: EX 2 = 2 Z ∞ uP X > u du. 0 W ogólności możemy obliczyć Ef (X ) gdy znamy prawdopodobieństwa P X > u , lub, równoważnie, 1−P X >u =P X ¬u . Definicja dystrybuanty Dystrybuantą zmiennej losowej X nazywamy funkcję FX : R1 → [0, 1] określoną wzorem FX (u) = P(X ¬ u) ( = PX ((−∞, u]) ) . Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Własności dystrybuanty Twierdzenie 1 Jeżeli u ¬ v , to FX (u) ¬ FX (v ) (monotoniczność). 2 FX jest funkcją prawostronnie ciągłą. 3 lim FX (u) = 0, u→−∞ lim FX (u) = 1. u→+∞ Twierdzenie (O dystrybuantach) Jeżeli funkcja F : R1 → [0, 1] spełnia warunki 1-3 z powyższego twierdzenia, to istnieje zmienna losowa X taka, że F = FX . Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Rozkład zmiennej losowej Wiemy, że B 1 = σ{(u, +∞) ; u ∈ IR 1 } = σ{(−∞, u] ; u ∈ IR 1 }. Mając daną FX (u) możemy określić funkcję PX na pewnym podzbiorze B 1 , n.p. PX (−∞, u] = FX (u), PX (u, +∞) = 1 − FX (u), PX (u, v ] = FX (v ) − FX (u), PX (−∞, u) = lim FX (t) =: FX (u−), t%u PX (u, v ) = lim FX (t) − FX (u) = FX (v −) − FX (u), t%v PX [u, v ] = FX (v ) − lim FX (u) = FX (v ) − FX (u−), t%u PX {u} = FX (u) − FX (u−). Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Rozkład zmiennej losowej Twierdzenie Niech F będzie dystrybuantą na IR 1 . Istnieje dokładnie jedna miara probabilistyczna PF na B 1 taka, że PF (u, v ] = F (v ) − F (u). Definicja Rozkładem zmiennej losowej X nazywamy jedyną miarę probabilistyczną PX na B 1 zadaną na odcinkach wzorem PX ((u, v ]) := P(u < X ¬ v ) = P ({ω ; X (ω) ∈ (u, v ]}) . Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Rozkład zmiennej losowej Wniosek 1 Znamy PX dokładnie wtedy, gdy znamy FX . R +∞ 2 Jeśli X ­ 0, to EX = 0 PX (u, +∞) du i, bardziej ogólnie, dla f dostatecznie regularnej Ef (X ) = Z +∞ 0 f 0 (u)PX (u, +∞) du. Wartość oczekiwana jest więc funkcją rozkładu (albo dystrubuanty) zmiennej losowej. Wynika stąd, że miary probabilistyczne na (IR 1 , B 1 ) odgrywaja szczególną rolę. Nazywamy je „rozkładami” lub „rozkładami prawdopodobieństwa”. Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Rozkłady dyskretne i absolutnie ciągłe Rozkłady dyskretne Zmienna losowa X ma rozkład dyskretny, jeśli istnieją liczby x1 , x2 , . . . ∈ R1 i prawdopodobieństwa p1 , p2 , . . . ­ 0, P∞ j=1 pj = 1, takie, że P(X = xj ) = pj , j = 1, 2, . . .. Rozkłady absolutnie ciągłe Zmienna losowa X ma rozkład absolutnie ciągły o gęstości p(x), jeśli dla każdych a < b P(a < X ¬ b) = Z b p(x) dx. a (Wtedy p(x) ­ 0 `-prawie wszędzie i p(x) dx = 1). Gęstość rozkładu absolutnie ciągłego jest wyznaczona jednoznacznie z dokładnością do równości `-prawie wszędzie (` jest miarą Lebesgue’a). R Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Więcej o rozkładach prawdopodobieństwa Skoki dystrybuanty PX {x} = P(X = x) > 0 dokładnie wtedy, gdy dystrybuanta FX ma skok (nieciągłość) has w x i wtedy FX (x) − FX (x−) = P(X = x). Pochodna dystrybuanty a gęstość Każda dystrybuanta F jest `-prawie wszędzie różniczkowalna i jej pochodna F 0 (określona `-prawie wszędzie) spełnia następujący warunek. F (x) ­ Z F 0 (x) dx. (−∞,x] MożeR się zdarzyć, że R1 F 0 (x) dx < 1. Jeśli R1 F 0 (x) dx = 1, to rozkład odpowiadający F jest absolutnie ciągły z gęstością p(x) = F 0 (x). R Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Więcej o rozkładach prawdopodobieństwa Obliczanie EX dla rozkładów dyskretnych Jeśli X ma rozkład dyskretny, to dla dowolnej funkcji f : R1 → R1 mamy Ef (X ) = ∞ X f (xi )P(X = xi ) = i=1 ∞ X f (xi )pi , i=1 przy czym Ef (X ) istnieje (jest skończona) dokładnie wtedy, gdy ∞ X |f (xi )|pi < +∞. i=1 Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Więcej o rozkładach prawdopodobieństwa Obliczanie EX dla rozkładów absolutnie ciągłych Jeśli rozkład X jest absolutnie ciągły z gęstością p(x), to dla każdej funkcji borelowskiej f : R1 → R1 mamy Ef (X ) = Z +∞ f (x)p(x) dx, −∞ przy czym Ef (X ) istnieje dokładnie wtedy, gdy R +∞ −∞ |f (x)|p(x) dx < +∞. Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Najważniejsze rozkłady dyskretne 1 Rozkład zdegenerowany w C („miara Diraca” δC ): P(X = C ) = 1. 2 Rozkład B(p) („0 − 1” lub Bernoullego): P(X = 1) = p = 1 − P(X = 0). 3 Rozkład dwumianowy Bi (N, p): ! N k P(X = k) = p (1 − p)N−k , k 4 Rozkład Poissona Po(λ): λk , k! Rozkład geometryczny Ge(p): P(X = k) = e −λ 5 k = 0, 1, 2, . . . , N. k = 0, 1, 2, . . . . P(X = k) = p(1 − p)k−1 , Prawdopodobieństwo i statystyka k = 1, 2, . . . . Wykład VII: Rozkład i jego charakterystyki Najważniejsze rozkłady absolutnie ciągłe 1 Rozkład jednostajny U(a, b) na odcinku (a, b): p(x) = 2 1 I(a,b) (x). b−a Rozkład normalny (lub gaussowski) N (m, σ 2 ) z parametrami m ∈ IR 1 i σ 2 > 0: p(x) = √ 3 (x−m)2 1 e − 2σ2 . 2πσ Rozkład Cauchy’ego Ca(θ): θ . p(x) = π x 2 + θ2 Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Najważniejsze rozkłady absolutnie ciągłe 4 Rozkład wykładniczy Ex (λ) z parametrem λ > 0. p(x) = λe −λx I(0,+∞) (x). 5 Rozkład gamma G(α, λ) z parametrami α, λ > 0: p(x) = 6 7 λα α−1 −λx x e I(0,+∞) (x). Γ(α) Rozkład χ-kwadrat z n stopniami swobody (χ2 (n)) jest rozkładem gamma z α = n/2, λ = 1/2. Zauważmy również, że Ex (λ) = G(1, λ). Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki Słowniczek teorii prawdopodobieństwa Definicje Moment absolutny rzędu p > 0 zmiennej losowej X jest określony wzorem mp = mp (X ) = E |X |p . Jeśli X jest całkowalna z kwadratem (tzn. EX 2 < +∞), wtedy jej wariancja jest określona wzorem D 2 (X ) = VarX := E (X − EX )2 = EX 2 − (EX )2 . Odchylenie standardowe całkowalnej z kwadratem zmiennej losowej X jest dane wzorem √ D(X ) := VarX = Prawdopodobieństwo i statystyka q E (X − EX )2 . Wykład VII: Rozkład i jego charakterystyki Słowniczek teorii prawdopodobieństwa Definicje Medianą zmiennej losowej X (właściwie: rozkładu zmiennej losowej) nazywamy taką liczbę x1/2 , że P(X ¬ x1/2 ) ­ 1/2, P(X ­ x1/2 ) ­ 1/2. Kwantylem rzędu p, p ∈ (0, 1), rozkładu zmiennej losowej X nazywamy taką liczbę xp , że P(X ¬ xp ) ­ p, P(X ­ xp ) ­ 1 − p. Zadanie: Przypuśćmy, że znamy dystrybuantę FX zmiennej losowej X . Jak znaleźć medianę i kwantyle tej zmiennej? Prawdopodobieństwo i statystyka Wykład VII: Rozkład i jego charakterystyki