Zmienne losowe typu ciągłego. Parametry zmiennych losowych. Izolda Gorgol wyciąg z prezentacji (wykład III) Zmienna losowa typu ciągłego — Zmienna losowa X o ciągłej dystrybuancie F nazywa się zmienną losową typu ciągłego, jeżeli istnieje nieujemna i całkowalna funkcja f taka, że dla każdej liczby rzeczywistej x zachodzi Zx F (x) = f (t)dt. −∞ — Funkcję f nazywamy gęstością prawdopodobieństwa lub gęstością zmiennej losowej X. Własności gęstości prawdopodobieństwa — f (x) > 0 dla każdego x ∈ R +∞ Z f (x)dx = 1 — −∞ — f (x) = F 0 (x), jeżeli dystrybuanta F jest funkcją różniczkowalną Zmienna losowa typu ciągłego Zauważmy, że dla zmiennej losowej X typu ciągłego mamy: — P (X = a) = 0 dla każdego a ∈ R; — P (a 6 X < b) = P (a 6 X 6 b) = P (a < X 6 b) = Zb = P (a < X < b) = f (x)dx = F (b) − F (a). a Rozkład prawdopodobieństwa zmiennej losowej ciągłej Mówimy, że dany jest rozkład prawdopodobieństwa zmiennej losowej X, jeśli dana jest dystrybuanta zmiennej losowej X, względnie gdy dana jest jej gęstość prawdopodobieństwa. Podstawowe rozkłady ciągłe — rozkład jednostajny (prostokątny, równomierny) na przedziale ha, bi — rozkład normalny (Gaussa) o parametrach m, σ — rozkład wykładniczy Rozkład jednostajny na przedziale ha, bi — Gęstość prawdopodobieństwa rozkładu jednostajnego jest określona wzorem: dla x < a, 0 1 dla a 6 x 6 b, f (x) = b−a 0 dla x > b. y 1 b−a 0 a b x Rysunek 1. Wykres funkcji gęstości rozkładu jednostajnego 1 Rozkład jednostajny na przedziale ha, bi — Dystrybuanta rozkładu jednostajnego ma postać: 0 F (x) = x−a b−a 1 — EX = dla x 6 a, dla a < x 6 b, dla x > b. a+b (b − a)2 , D2 (X) = 2 12 Rozkład normalny N (m, σ) — Rozkład normalny z parametrami m, σ oznaczany jest symbolem N (m, σ). — Gęstość prawdopodobieństwa rozkładu normalnego jest określona wzorem: f (x) = (x−m)2 1 √ e− 2σ2 , gdzie m ∈ R, σ > 0. σ 2π y=√ y 0 m−σ m (x−m)2 1 e− 2σ2 2πσ x m+σ Rysunek 2. Wykres funkcji gęstości rozkładu normalnego N (m, σ) Rozkład normalny N (0, 1) — Jeżeli m = 0 i σ = 1, to funkcja gęstości prawdopodobieństwa ma postać x2 f (x) = √12π e− 2 i oznaczamy ją przez ϕ(x). y x2 1 ϕ(x) = √ e− 2 2π √1 2π 0 −1 x σ=1 Rysunek 3. Wykres funkcji gęstości rozkładu normalnego N (0, 1) Rozkład normalny N (0, 1) — Dystrybuanta rozkładu normalnego N (0, 1) ma postać: 1 Φ(x) = √ 2π Zx t2 e− 2 dt. −∞ 1 φ(x) = √ 2π y 1 Zx t2 e− 2 dt −∞ 1 2 0 x Rysunek 4. Wykres dystrybuanty rozkładu normalnego N (0, 1) 2 Rozkład normalny — Funkcje ϕ i Φ są stablicowane. — Fakt, że zmienna losowa ma rozkład normalny z parametrami m, σ zapisujemy skrótowo X ∼ N (m, σ). — EX = m, D2 (X) = σ 2 . Standaryzacja zmiennej losowej — Jeżeli zmienna losowa X ma rozkład N (m, σ), to zmienna losowa Y = X−m ma rozkład N (0, 1). σ x−m x−m x−m — Wtedy F (x) = P (X < x) = P X−m < = P Y < = Φ , σ σ σ σ gdzie Φ jest dystrybuantą zmiennej losowej Y . — Taki proces nazywamy standaryzacją zmiennej losowej. Rozkład normalny N (0, 1) — Z symetrii wykresu gęstości ϕ względem osi OY wynika, że Φ(−x) = 1 − Φ(x). — Często w tablicach, zamiast wartości funkcji Φ(x), podane są wartości funkcji 1 Φ0 (x) = √ 2π Zx t2 e− 2 dt. 0 — Z własności dystrybuanty Φ(x) mamy wtedy: Φ(x) = 1 + Φ0 (x). 2 Rozkład wykładniczy — Gęstość prawdopodobieństwa rozkładu wykładniczego jest określona wzorem: dla x < 0, 0 f (x) = 1 − λx dla x > 0, gdzie λ > 0. λe y 1 λ f (x) = ( 0, 1 1 −λ x λe dla x < 0, dla x > 0 0 x Rysunek 5. Wykres funkcji gęstości rozkładu wykładniczego Rozkład wykładniczy — Dystrybuanta rozkładu wykładniczego ma postać: 0 F (x) = x 1 − e− λ dla x 6 0, dla x > 0. — EX = λ, D2 (X) = λ2 Inne rozkłady zmiennych losowych wykorzystywane w statystyce 3 — rozkład t-Studenta — rozkład χ2 (chi kwadrat) — rozkład F -Snedecora Parametry rozkładu zmiennej losowej — — — — — wartość oczekiwana (wartość przeciętna, wartość średnia, nadzieja matematyczna) wariancja odchylenie standardowe mediana moda Wartość oczekiwana — Wartością oczekiwaną (wartością przeciętną, wartością średnią, nadzieją matematyczną) zmiennej losowej X typu skokowego o rozkładzie pi = P (X = xi ), gdzie i ∈ {1, 2, . . . }, nazywamy liczbę X EX = xi pi , i=1 przy założeniu, że suma X xi pi jest skończona albo szereg nieskończony i=1 ∞ X |xi |pi jest zbieżny. i=1 Wartość oczekiwana — Wartością oczekiwaną zmiennej losowej X typu ciągłego o funkcji gęstości prawdopodobieństwa f nazywamy liczbę +∞ Z EX = xf (x)dx, −∞ +∞ Z |x|f (x)dx jest zbieżna. przy założeniu, że całka −∞ Podstawowe własności wartości oczekiwanej — E(aX + b) = aEX + b, gdzie a, b ∈ R — jeżeli X i Y są dowolnymi zmiennymi losowymi, dla których istnieją wartości oczekiwane EX oraz EY , to E(X + Y ) = EX + EY — jeżeli istnieje E|X|, to prawdziwa jest nierówność |EX| 6 E|X| — wartość oczekiwana jest miarą położenia, parametrem pozycyjnym: wskazuje punkt środkowy rozkładu, tzn. punkt, wokół którego grupują się wartości zmiennej losowej — interpretacja fizyczna: wartość oczekiwaną można utożsamiać z pojęciem środka ciężkości, jeśli prawdopodobieństwa zinterpretujemy jako masy Uwaga. Jak wynika z definicji, wartość oczekiwana dla niektórych zmiennych losowych nie istnieje (odpowiedni szereg lub odpowiednia całka nie są zbieżne). Wariancja — Wariancją zmiennej losowej X nazywamy liczbę D2 (X) = E(X − EX)2 . — Jeżeli X jest zmienną losową typu skokowego o rozkładzie pi = P (X = xi ), i ∈ {1, 2, . . . }, i wartości oczekiwanej EX = m, to X D2 (X) = (xi − m)2 pi . i 4 — Jeżeli X jest zmienną losową typu ciągłego o funkcji gęstości prawdopodobieństwa f i wartości oczekiwanej EX = m, to +∞ Z D2 (X) = (x − m)2 f (x)dx. −∞ Podstawowe własności wariancji — — — — 2 2 2 D (X) = E(X ) − (EX) D2 (aX + b) = a2 D2 (X), gdzie a, b ∈ R D2 (X) > 0 dla dowolnej zmiennej losowej X wariancja jest miarą rozrzutu (rozproszenia) wartości zmiennej losowej wokół wartości oczekiwanej Odchylenie standardowe — Odchyleniem standardowym nazywamy liczbę D(X) = p D2 (X). — Podstawowe własności odchylenia standardowego: — D(aX + b) = |a|D(X), gdzie a, b ∈ R — D(X) > 0 dla dowolnej zmiennej losowej X — odchylenie standardowe jest miarą rozrzutu (rozproszenia) wartości zmiennej losowej Wartości EX oraz D2 (X) dla podstawowych rozkładów skokowych — Rozkład jednopunktowy: . — Rozkład zero-jedynkowy: EX = p, D2 (X) = pq. — Rozkład Bernoulliego: EX = np, D2 (X) = npq. — Rozkład Poissona z parametrem λ: EX = λ, D2 (X) = λ. Wartości EX oraz D2 (X) dla podstawowych rozkładów ciągłych — Rozkład jednostajny na przedziale ha, bi: a+b (b − a)2 EX = , D2 (X) = . 2 12 — Rozkład normalny N (m, σ): EX = m, D2 (X) = σ 2 . — Rozkład wykładniczy z parametrem λ: EX = λ, D2 (X) = λ2 . Mediana — Medianą zmiennej losowej X nazywamy liczbę M e spełniającą warunki: P (X 6 M e) > 1 1 oraz P (X > M e) > . 2 2 — W przypadku zmiennej losowej typu ciągłego o gęstości f powyższe nierówności redukują się do jednego z dwóch równań: +∞ ZM e Z 1 1 f (x)dx = lub f (x)dx = . 2 2 −∞ Me — Mediana jest parametrem, który nie zawsze jest wyznaczony w sposób jednoznaczny. Czasami zdarza się nawet, że mediana jest dowolną liczbą z pewnego przedziału domkniętego. 5 Moda — Modą M o (dominantą) zmiennej losowej X nazywamy: — w przypadku zmiennej losowej typu skokowego - wartość zmiennej losowej, której odpowiada największe prawdopodobieństwo; — w przypadku zmiennej losowej typu ciągłego - wartość, dla której gęstość prawdopodobieństwa przyjmuje maksimum lokalne. — Moda jest więc wartością, która należy do zbioru wartości zmiennej losowej. Istnieją rozkłady jednomodalne (jest tylko jedna moda), wielomodalne (więcej niż jedna moda) oraz takie, dla których moda nie istnieje. — Mediana i moda to, podobnie jak wartość oczekiwana, parametry charakteryzujące położenie zbioru wartości zmiennej losowej. Są to tzw. wskaźniki położenia lub inaczej charakterystyki pozycyjne. 6