Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe i charakterystyki ich rozkładów 13 października 2014 Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Zmienne losowe Wartość oczekiwana Dystrybuanty „Słowniczek” teorii prawdopodobieństwa, cz. II Definicja zmiennej losowej i jej rozkładu Zmienną losową na przestrzeni probabilistycznej (Ω, F, P) nazywamy funkcję X : Ω → R1 dla której określone są prawdopodobieństwa P(X > u) = P ({ω ; X (ω) > u}) , u ∈ R1 . Rozkładem zmiennej losowej X nazywamy prawdopodobieństwo PX na R1 zadane na odcinkach wzorem PX ((a, b]) := P(a < X ¬ b) = P ({ω ; X (ω) ∈ (a, b]}) . Uwaga: PX ((a, +∞)) = P(X ∈ (a, +∞)), PX ((−∞, a]) = P(X ∈ (−∞, a]). Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Zmienne losowe Wartość oczekiwana Dystrybuanty „Słowniczek” teorii prawdopodobieństwa, cz. II, cd. Definicja wartości oczekiwanej zmiennej losowej Wartością oczekiwaną nieujemnej zmiennej losowej X nazywamy całkę Z +∞ EX := P(X > u) du ∈ [0, +∞]. 0 Niech X będzie zmienną losową. Symbolem X + oznaczamy złożenie tej zmiennej z funkcją h+ (x) = 0 ∨ x. Podobnie X − jest złożeniem X z funkcją h− (x) = 0 ∨ (−x). Niech X będzie zmienna losową i niech EX + < +∞ i EX − < +∞. Wartością oczekiwaną zmiennej losowej X nazywamy liczbę EX := EX + − EX − ∈ (−∞, +∞). Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Zmienne losowe Wartość oczekiwana Dystrybuanty Interpretacja formalizmu Wartość zmiennej losowej X (ω) to liczbowa (na ogół niepełna) charakterystyka wyniku eksperymentu losowego ω ∈ Ω. Rozkład zmiennej losowej określa wartości oczekiwane Ef (X ) (w szczególności prawdopodobieństwa zdarzeń P(X ∈ A)). Dzięki prawom wielkich liczb i innym rezultatom teoretycznym możemy przyjąć, że potrafimy obliczać Ef (X ). Wynika stąd, że w ramach eksperymentów losowych potrafimy badać własności rozkładów zmiennych losowych. Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Zmienne losowe Wartość oczekiwana Dystrybuanty Własności wartości oczekiwanej Uwaga: zmienna losowa X ma skończoną wartość oczekiwaną dokładnie wtedy, gdy E |X | < +∞. Mówimy również, że zmienna X jest całkowalna i piszemy X ∈ L1 (P). Twierdzenie (Własności wartości oczekiwanej) 1 Jeżeli X ­ 0, to EX ­ 0. Jeżeli X ­ 0 i EX = 0, to P(X = 0) = 1. 2 |EX | ¬ E |X |. 3 Jeżeli E |X | < +∞ i E |Y | < +∞, to dla dowolnych liczb α, β ∈ R1 funkcja αX + βY jest zmienna losową i ma miejsce równość: E (αX + βY ) = αEX + βEY . 4 Jeżeli Y ­ X , to EY ­ EX pod warunkiem, że wartości oczekiwane istnieją. Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Zmienne losowe Wartość oczekiwana Dystrybuanty „Słowniczek” teorii prawdopodobieństwa, cz. II, cd. Definicja dystrybuanty zmiennej losowej Dystrybuantą zmiennej losowej X nazywamy funkcję FX : R1 → [0, 1] określoną wzorem FX (u) = P(X ¬ u) ( = PX ((−∞, u]) ) . Wniosek: rozkład PX zmiennej losowej jest znany dokładnie wtedy gdy znana jest dystrybuanta FX tej zmiennej. Wniosek: jeśli X ­ 0, to EX = R +∞ 0 (1 − FX (u)) du. Wniosek: Wartość oczekiwana jest funkcją rozkładu (dystrybuanty) zmiennej losowej, a nie samej zmiennej. W ten sposób prawdopodobieństwa na (R1 , B 1 ) pełnią szczególną rolę. Nazywamy je rozkładami prawdopodobieństwa. Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Zmienne losowe Wartość oczekiwana Dystrybuanty Własności dystrybuanty Twierdzenie (Własności dystrybuanty zmiennej losowej) 1 Jeżeli u ¬ v , to FX (u) ¬ FX (v ) (monotoniczność). 2 FX jest funkcją prawostronnie ciągłą. 3 lim FX (u) = 0, u→−∞ lim FX (u) = 1. u→+∞ Twierdzenie (O dystrybuantach) Jeżeli funkcja F : R1 → [0, 1] spełnia warunki 1-3 z powyższego twierdzenia, to istnieje zmienna losowa X taka, że F = FX . Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Definicje Obliczenia Charakterystyki liczbowe Rozkłady dyskretne i absolutnie ciągłe Rozkłady dyskretne Zmienna losowa X ma rozkład dyskretny, jeśli istnieją liczby P x1 , x2 , . . . ∈ R1 i prawdopodobieństwa p1 , p2 , . . . ­ 0, ∞ j=1 pj = 1, takie, że P(X = xj ) = pj , j = 1, 2, . . .. Rozkłady absolutnie ciągłe Zmienna losowa X ma rozkład absolutnie ciągły o gęstości p(x), jeśli dla każdych a < b P(a < X ¬ b) = Z b p(x) dx. a R (Wtedy p(x) ­ 0 i p(x) dx = 1). Gęstość rozkładu absolutnie ciągłego jest wyznaczona jednoznacznie z dokładnością do równości `-prawie wszędzie (gdzie ` jest miarą Lebesgue’a). Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Definicje Obliczenia Charakterystyki liczbowe Rozkłady dyskretne i absolutnie ciągłe cd. PX {x} = P(X = x) > 0 wtedy i tylko wtedy, gdy dystrybuanta FX ma skok w punkcie x i FX (x) − FX (x−) = P(X = x). Gęstość a pochodna dystrybuanty Można pokazać, że każda dystrybuanta F jest `-prawie wszędzie różniczkowalna i pochodna F 0 (określona `-prawie wszędzie) spełnia warunek Z F 0 (x) dx. F (x) ­ (−∞,x] Może się więc zdarzyć, że R1 F 0 (x) dx < 1. Jeżeli R 0 R1 F (x) dx = 1, to rozkład odpowiadający dystrybuancie F jest absolutnie ciągły z gęstością p(x) = F 0 (x). R Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Definicje Obliczenia Charakterystyki liczbowe Jak liczyć EX ? Jeżeli X ma rozkład dyskretny, to dla dowolnej funkcji f : R1 → R1 Ef (X ) = ∞ X f (xi )P(X = xi ) = i=1 ∞ X f (xi )pi , i=1 przy czym Ef (X ) istnieje dokładnie wtedy, gdy ∞ X |f (xi )|pi < +∞. i=1 Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Definicje Obliczenia Charakterystyki liczbowe Jak liczyć EX ? cd. Jeżeli X ma rozkład absolutnie ciągły o gęstości p(x), to dla dowolnej funkcji (borelowskiej) f : R1 → R1 Z +∞ f (x)p(x) dx, Ef (X ) = −∞ przy czym Ef (X ) istnieje dokładnie wtedy, gdy −∞ |f (x)|p(x) dx < +∞. R +∞ Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Definicje Obliczenia Charakterystyki liczbowe „Słowniczek” teorii prawdopodobieństwa, cz. III Definicja Momentem absolutnym rzędu p > 0 zmiennej losowej X nazywamy liczbę mp = mp (X ) = E |X |p . Uwaga: E |X |p = Z ∞ P(|X |p > u) du = 0 Z ∞ P(|X | > u 1/p ) du 0 Z ∞ =p v p−1 P(|X | > v ) dv . 0 Skończoność momentu oznacza więc odpowiednie tempo malenia “ogonów rozkładu”. Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Definicje Obliczenia Charakterystyki liczbowe „Słowniczek” teorii prawdopodobieństwa, cz. III Definicje Niech zmienna losowa X będzie całkowalna z kwadratem (EX 2 < +∞). Wariancją X nazywamy liczbę D 2 (X ) = VarX := E (X − EX )2 = EX 2 − (EX )2 . Odchyleniem standardowym X nazywamy liczbę √ D(X ) := VarX = q E (X − EX )2 . Uwaga: Jeżeli 0 < D(X ) < +∞, to zmienna standaryzowana Y = spełnia EY = 0, X − EX D(X ) D(Y ) = 1. Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Definicje Obliczenia Charakterystyki liczbowe „Słowniczek” teorii prawdopodobieństwa, cz. III, cd. Definicje Medianą zmiennej losowej X (właściwie: rozkładu zmiennej losowej) nazywamy taką liczbę x1/2 , że P(X ¬ x1/2 ) ­ 1/2, P(X ­ x1/2 ) ­ 1/2. Kwantylem rzędu p, p ∈ (0, 1), rozkładu zmiennej losowej X nazywamy taką liczbę xp , że P(X ¬ xp ) ­ p, P(X ­ xp ) ­ 1 − p. Zadanie: Przypuśćmy, że znamy dystrybuantę FX zmiennej losowej X . Jak znaleźć medianę i kwantyle tej zmiennej? Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Najważniejsze rozkłady dyskretne Najważniejsze rozkłady absolutnie ciągłe Najważniejsze rozkłady dyskretne 1 Rozkład zdegenerowany w C („miara delta Diraca” δC ): P(X = C ) = 1. 2 Rozkład B(p) („0 − 1” lub Bernoullego): P(X = 1) = p = 1 − P(X = 0). 3 Rozkład dwumianowy Bi (N, p): ! P(X = k) = 4 N k p (1 − p)N−k , k Rozkład Poissona Po(λ): λk , k! Rozkład geometryczny Ge(p): P(X = k) = e −λ 5 k = 0, 1, 2, . . . , N. k = 0, 1, 2, . . . . P(X = k) = p(1 − p)k−1 , Prawdopodobieństwo i statystyka k = 1, 2, . . . . Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Najważniejsze rozkłady dyskretne Najważniejsze rozkłady absolutnie ciągłe Najważniejsze rozkłady absolutnie ciągłe 1 Rozkład jednostajny U(a, b) na odcinku (a, b): p(x) = 2 1 I (x). b − a (a,b) Rozkład normalny N (m, σ 2 ) z parametrami m ∈ R1 i σ 2 > 0: p(x) = √ 3 (x−m)2 1 e − 2σ2 . 2πσ Rozkład Cauchy’ego Ca(θ): p(x) = Prawdopodobieństwo i statystyka π x2 θ . + θ2 Wykład II: Zmienne losowe Zmienne losowe Rozkłady dyskretne i absolutnie ciągłe Najważniejsze rozkłady prawdopodobieństwa Najważniejsze rozkłady dyskretne Najważniejsze rozkłady absolutnie ciągłe Najważniejsze rozkłady absolutnie ciągłe - cd. 4 Rozkład wykładniczy Ex (λ) z parametrem λ > 0. p(x) = λe −λx I(0,+∞) (x). 5 Rozkłady gamma G(α, λ) z parametrami α, λ > 0: p(x) = 6 7 λα α−1 −λx x e I(0,+∞) (x). Γ(α) Rozkład χ2 (n) z n stopniami swobody, to rozkład gamma z parametrami α = n/2, λ = 1/2. Zauważmy, że również Ex (λ) = G(1, λ). Prawdopodobieństwo i statystyka Wykład II: Zmienne losowe