Wykład 4 Rozkłady i ich dystrybuanty Dwa typy zmiennych losowych • Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x1 , x2 , ...}, to mówimy, że jest to zmienna dyskretna. • Jeśli wszystkich wartości zmiennej NIE MOŻNA wypisać w postaci ciągu, to mówimy, że jest to zmienna ciągła. • Tak jest zawsze, gdy zbiór wartości zawiera jakiś przedział (a, b). Rozkład zmiennej losowej dyskretnej Rozkład takiej zmiennej to opis jej możliwych wartości i prawdopodobieństw, z jakimi te wartości zmienna przyjmuje. • X = wynik rzutu symetryczną kostką • Wartości, jakie może przyjąć X to 1, 2, 3, 4, 5 i 6. • Prawdopodobieństwo każdej z tych wartości jest równe 61 . • Wygodnie jest podać ten rozkład w tabelce: xk pk 1 2 3 4 5 6 1 6 1 6 1 6 1 6 1 6 1 6 • Wartość średnia zmiennej losowej • Jeżeli P (X = xk ) = pk , k = 0, 1, 2, 3, ..., to • wartość średnia (wartość oczekiwana) zmiennej X E(X) = X xk · pk . k • Intuicja: na prostej rozmieszczamy masy pi w punktach xi , i = 0, 1, 2.... • Wartość średnia to środek ciężkości tego układu (może nie istnieć!) • Jaka jest wartość średnia (wartość oczekiwana) liczby oczek w jednym rzucie kostką? Wariancja zmiennej losowej • Jeżeli P (X = xk ) = pk , k = 0, 1, 2, 3, ..., to • wariancja zmiennej X V ar(X) = X (xk − E(X))2 · pk . k • Wariancję oznacza się też symbolem D2 (X). • Wariancja mierzy rozrzut wyników — średnie odchylenie od wartości średniej. • Wariancję można też obliczyć ze wzoru V ar(X) = X k 1 x2k · pk − (E(X))2 . Rozkłady ciągłe (z gęstością) • Jeśli dana jest taka funkcja f : R → [0, ∞), że R∞ −∞ f (x) dx = 1, to • f nazywamy gęstością rozkładu zmiennej X i obliczamy • prawdopodobieństwa Z b P (a < X < b) = f (x) dx. a Przykłady gęstości • Rozkład jednostajny na odcinku [a, b] • f (x) = 1 b−a , gdy x ∈ [a, b], 0, gdy x ∈ / [a, b]. Przykłady gęstości • Rozkład normalny z parametrami m ∈ R i σ > 0 • f (x) = √ (x−m)2 1 e− 2σ2 , 2π σ x∈R Przykłady gęstości • Rozkład wykładniczy z parametrem λ > 0 • f (x) = 0, gdy x < 0, λe−λx , gdy x ­ 0. Wartość średnia • Gdy rozkład ma gęstość f (x), to • Z ∞ E(X) = x f (x) dx, gdy całka jest zbieżna. −∞ • Gdy całka nie jest zbieżna, to E(X) nie istnieje. Wariancja • Gdy rozkład ma gęstość f (x), to • D2 (X) = Z ∞ (x − E(X))2 f (x) dx, gdy całka zbieżna. −∞ • Gdy całka nie jest zbieżna, to D2 (X) nie istnieje. • Wariancję można też liczyć ze wzoru 2 Z ∞ D (X) = x2 f (x) dx − (E(X))2 . −∞ Jak opisać cały rozkład jedną funkcją? 2 • Przypuśćmy, że na prostej rozłożyliśmy masę jednostkową. • Aby znać masę każdego odcinka, wystarczy znać masę każdej półprostej (−∞, t) dla wszystkich t ∈ R, bo wtedy • m(a, b) = m(−∞, b) − m(−∞, a]. • Analogicznie: aby znać rozkład zmiennej X, musimy umieć obliczyć P (a < X < b) dla dowolnych a < b. • W tym celu wystarczy znać P (−∞ < X < t) dla wszystkich t ∈ R, bo wtedy • P (a < X < b) = P (−∞ < X < b) − P (−∞ < X ¬ a). Dystrybuanta rozkładu Niech X będzie zmienną losową. Funkcję zmiennej t ∈ R określoną wzorem FX (t) = P (X < t) nazywamy dystrybuantą rozkładu zmiennej X. Przykłady dystrybuant • Jeżeli X jest stała, to znaczy X ≡ c, wtedy • ( FX (t) = 0, 1, gdy t ¬ c, gdy t > c, Przykłady dystrybuant • Jeżeli X ma rozkład dwupunktowy, to znaczy dla pewnych x1 < x2 ( X= x1 x2 z prawdopodobieństwem p, z prawdopodobieństwem 1 − p, • wtedy dystrybuantą jest funkcja • FX (t) = 0, gdy t ¬ x1 , gdy x1 < t ¬ x2 , gdy t > x2 , p, 1, Przykłady dystrybuant • Jeżeli Sn ma rozkład Bernoulliego z parametrami n oraz p, to • FX (t) = 0, ..., ..., .... 1, gdy gdy gdy ... gdy t ¬ 0, 0 < t ¬ 1, 1 < t ¬ 2, t > n. Przykłady dystrybuant • Jeżeli X ma rozkład jednostajny na odcinku [a, b], to • FX (t) = 0, t−a b−a , 1, 3 gdy t ¬ a, gdy a < t ¬ b, gdy t > b. Przykłady dystrybuant • Jeżeli X ma standardowy rozkład normalny, to znaczy z parametrami m = 0 i σ = 1, wówczas • Z t FX (t) = −∞ 1 2 √ e−x /2 dx. 2π • Ta pierwotna nie jest funkcją elementarną, więc trzeba było: • nadać jej nazwę (oznaczenie) oraz • stablicować wartości. • Nazwano ją Φ(t), • tablice jej wartości dla t ∈ [0, 3] można znaleźć w większości podręczników do statystyki lub w internecie, np. http://neyman.im.pwr.wroc.pl/˜szajow/sas/node40.html Własności dystrybuanty Każda dystybuanta F : R −→ R ma następujące trzy własności: • F jest funkcją niemalejącą. • F jest funkcją lewostronnie ciągłą (bo w definicji przyjęliśmy P (X < t)). • limt→−∞ F (t) = 0, limt→∞ F (t) = 1. Jak rozpoznać dystrybuantę? Jeśli dana jest funkcja F : R −→ R, która jest • niemalejąca, • lewostronnie ciągła i • ma granice: 0 w −∞ oraz 1 w ∞, • to jest ona dystrybuantą rozkładu pewnej zmiennej losowej. Zadanie Dla jakich stałych a oraz b funkcja F (t) = dla t ¬ 0, dla 0 < t ¬ 1, dla t > 1, 0, at + b, 1, jest dystrybuantą? Rozwiązanie: • Granice są już takie, jak trzeba. • Tak określona funkcja jest lewostronnie ciagła. • Dla jakich a, b jest niemalejąca? • Oczywiście a ­ 0. • Nie może maleć w otoczeniu zera, więc b ­ 0. • Nie może maleć w otoczeniu jedynki, więc a + b ¬ 1. Kiedy rozkład jest ciągły tzn. ma gęstość? • Dana jest dystrybuanta F (t). Jak poznać, czy ten rozkład ma gęstość? • Dystrybuanta rozkładu z gęstością to całka z tej gęstości, więc 4 • gęstość to pochodna dystrybuanty. • Gdy na przykład F (t) = 1 π • gęstość jest równa F 0 (t) = arctg x + 12 , to 1 1 π 1+t2 . Kiedy rozkład jest ciągły? • Gdy dystrybuanta FX (t) ma pochodną (poza co najwyżej skończoną liczbą punktów), • ta pochodna jest nieujemna i • całka po całej prostej z tej pochodnej jest równa 1, • to ta pochodna jest gęstością rozkładu. • Wówczas Z b P (a < X < b) = a FX0 (t)dt. Kiedy rozkład jest dyskretny? • Gdy dystrybuanta jest funkcją stałą na przedziałach, a rośnie tylko w punktach skoków, • to jest dystrybuantą zmiennej X o rozkładzie dyskretnym. • Jeśli xi jest punktem skoku dystrybuanty, to • P (X = xi )= wysokość skoku dystrybuanty w tym punkcie. Parametry rozkładu normalnego Przypuśćmy, że zmienna losowa X ma rozkład normalny z parametrami m ∈ R oraz σ > 0, tzn. • rozkład o gęstości f (x) = √ −(x−m)2 1 e 2σ2 . 2π σ • E(X) =? • V ar(X) =? • E(X) = m • V ar(X) = σ 2 Mediana Przypuśćmy, że dana jest zmienna losowa X. • Medianą zmiennej X nazywamy każdą taką liczbę m, dla której zachodzą nierówności: • 1 P (−∞ < X ¬ m) ­ , 2 1 P (m ¬ X < ∞) ­ . 2 • Mediana m dzieli rozkład „na połowy” tzn. • na lewo od m jest co najmniej połowa prawdopodobieństwa i • na prawo od m jest co najmniej połowa prawdopodobieństwa. • Jak obliczać medianę za pomoca dystrybuanty? • Dlaczego definicja formalna jest tak skomplikowana? Kwantyle i kwartyle Przypuśćmy, że dana jest zmienna losowa X. 5 • Kwantylem rzędu p nazywamy każdą taką liczbę xp , dla której zachodzą nierówności: • P (−∞ < X ¬ xp ) ­ p, P (xp ¬ X < ∞) ­ 1 − p. • To znaczy na lewo od xp jest co najmniej p, a na prawo co najmniej 1 − p całego prawdopodobieństwa. • Kwartyle to kwantyle rzędu 14 , 12 , 3 4 oraz 44 . • Mediana to kwantyl rzędu 12 . • Jak liczyć kwartyle (kwantyle) za pomocą dystrybuanty? 6