Rozdział 1 Wybrane rozkłady zmiennych losowych i ich charakterystyki 1.1 Wybrane rozkłady zmiennych losowych typu skokowego 1.1.1 Rozkład równomierny Rozpatrzmy eksperyment, który może skończyć się jednym z n możliwych wyników ze zbioru WX = {x1 , x2 , . . . , xn } (wynikiem jest tu liczba rzeczywista), z których każdy wynik jest jednakowo prawdopodobny. Np. takim eksperymentem może być losowanie jednej kuli z urny zawierającej n kul oznaczonych różnymi liczbami x1 , x2 , . . . , xn . Niech zmienna losowa X oznacza liczbę na wylosowanej kuli. Wówczas P (X = xi ) = 1 , n (1.1) dla każdego xi ∈ WX . Mówimy, że zmienna losowa X ma rozkład równomierny na zbiorze WX , jeżeli jest on określony wzorem (1.1). Wartość oczekiwana zmiennej losowej o rozkładzie równomiernym wyraża się wzorem E(X) = n ∑ xi i=1 n 1∑ 1 = xi = x̄, n n i=1 natomiast wariancja tej zmiennej jest postaci Var(X) = n 1∑ x2 − (x̄)2 . n i=1 i 1 1.1.2 Rozkład dwumianowy B(n, p) Rozpatrzmy eksperyment, który może skończyć się jednym z dwóch możliwych wyników, które to wyniki można interpretować jako sukces, oznaczany przez 1, i porażkę, oznaczaną przez 0. Niech p oznacza prawdopodobieństwo sukcesu. Taki eksperyment nazywamy próbą Bernoulliego z prawdopodobieństwem sukcesu p. Jeżeli eksperyment ten powtarzamy n razy, tak, że wyniki w poszczególnych krokach są wzajemnie niezależne, to taki n-elementowy ciąg eksperymentów nazywamy schematem Bernoulliego. Niech X oznacza liczbę sukcesów w n próbach Bernoulliego z prawdopodbieństwen sukcesu p. Wówczas ( ) n k p (1 − p)n−k , k P (X = k) = (1.2) dla k = 0, 1, 2, . . . , n. Mówimy, że zmienna losowa X ma rozkład dwumianowy z parametrami n i p, oznaczany przez B(n, p), jeżeli jest on określony wzorem (1.2). Wartość oczekiwana zmiennej losowej X o rozkładzie dwumianowym B(n, p) jest postaci E(X) = np, natomiast wariancja tej zmiennej jest postaci Var(X) = np(1 − p). Fakt 1 Jeżeli zmienna losowa X ma rozkład dwumianowy B(n, p) oraz (n + 1)p jest liczbą całkowitą, to zmienna X ma dwie wartości modalne (n + 1)p oraz (n + 1)p − 1; jeżeli natomiast (n + 1)p nie jest liczbą, to wartość modalna zmiennej losowej X wynosi [(n + 1)p], gdzie [a] oznacza największą liczbę całkowitą nie przekraczającą a. 1.1.3 Rozkład ujemny dwumianowy (Pascala) N B(r, p) Zmienna losowa X ma rozkład ujemny dwumianowy N B(r, p) (rozkład Pascala) z parametrami r i p, r ∈ N, p ∈ (0, 1), jeżeli jej funkcja prawdopodobieństwa jest postaci ( ) r+k−1 k pk = P (X = k) = p (1 − p)r , r−1 dla k = 0, 1, . . . . Zmienną losową o rozkładzie ujemnym dwumianowym z parametrami r i p można interpretować jako liczbę sukcesów w próbach Bernoulliego z prawdopodobieństwem sukcesu 2 p, prowadzonych do momentu uzyskania r-tej porażki. W przypadku, gdy r = 1, rozkład ujemny dwumianowy nazywany jest rozkładem geometrycznym z parametrem p. Wartość oczekiwana zmiennej losowej X o rozkładzie ujemnym dwumianowym N B(r, p) jest postaci rp , 1−p E(X) = natomiast wariancja tej zmiennej jest postaci rp . (1 − p)2 Var(X) = 1.1.4 Rozkład hipergeometryczny H(N, M, n) Zmienna losowa X ma rozkład hipergeometryczny H(N, M, n) z parametrami N, M, n, gdzie N, M, n są liczbami naturalnymi oraz M ¬ N i n ¬ N, jeżeli jej funkcja prawdopodobieństwa jest postaci ( M k pk = P (X = k) = )( ) N −M n−k ( ) , N n dla k = max{0, n + M − N }, . . . , min{n, M }. Zmienna losowa X o rozkładzie hipergeometrycznym ma następującą interpretację: jest ona liczbą elementów mających wyróżnioną cechę A wśród n elementów wylosowanych bez zwracania ze zbioru N elementów, wśród których przed rozpoczęciem losowania znajdowało się M elementów mających cechę A. Fakt 2 W przypadku, gdy N jest duże w stosunku do n, to rozkład hipergeometryczny można przybliżać rozkładem dwumianowym, tzn. ( M k )( N −M n−k ( ) N n ) ( ) n k p (1 − p)n−k , k ≈ gdzie p = M/N. 3 Rozkład Poissona P(λ) 1.1.5 Zmienna losowa X ma rozkład Poissona P(λ) z parametrem λ, λ > 0, jeżeli jej funkcja prawdopodobieństwa jest postaci pk = P (X = k) = λk −λ e , k! k = 0, 1, 2, . . . . Wartość oczekiwana zmiennej losowej X o rozkładzie Poissona P(λ) jest postaci E(X) = λ, natomiast wariancja tej zmiennej jest postaci Var(X) = λ. Rozkład Poissona ma zastosowania opisane w poniższym fakcie. Fakt 3 Dla dużych n rozkład dwumianowy B(n, p) można przybliżać rozkładem Poissona, tzn. ( ) n k λk −λ n−k p (1 − p) ≈ e , k k! gdzie λ = np. Przybliżenie to jest dla celów praktycznych wystarczająco dokładne, gdy n ­ 50, p ¬ 0.1, np ¬ 10. 1.2 Wybrane rozkłady zmiennych losowych typu ciągłego 1.2.1 Rozkład jednostajny U(a, b) na odcinku [a, b] Zmienna losowa ma rozkład jednostajny U(a, b) na odcinku [a, b], jeżeli jej funkcja gęstości wyraża się wzorem 1 , gdy x ∈ [a, b], b − a f (x) = 0, gdy x ∈ / [a, b]. 4 Dystrybuanta rozkładu jednostajnego na odcinku [a, b] wyraża się wzorem 0, gdy x ¬ a x − a F (x) = b − a , gdy a < x ¬ b, 1, gdy x > b. Wartość oczekiwana zmiennej losowej X o rozkładzie jednostajnym U(a, b) na odcinku [a, b] jest postaci E(X) = (a + b)/2, natomiast wariancja tej zmiennej jest postaci Var(X) = (b − a)2 /12. 1.2.2 Rozkład wykładniczy E(λ) Zmienna losowa ma rozkład wykładniczy E(λ) z parametrem λ, jeżeli jej funkcja gęstości wyraża się wzorem 1 exp{− x }, gdy x > 0, λ f (x) = λ 0, gdy x ¬ 0. Dystrybuanta rozkładu E(λ) wyraża się wzorem 1 − exp{− x }, λ F (x) = 0, gdy x > 0, gdy x ¬ 0. Wartość oczekiwana zmiennej losowej X o rozkładzie wykładniczym E(λ) jest postaci E(X) = λ, natomiast wariancja tej zmiennej jest postaci Var(X) = λ2 . 1.2.3 Rozkład normalny N (µ, σ 2 ) Zmienna losowa ma rozkład normalny N (µ, σ 2 ) z parametrami µ ∈ R i σ ∈ (0, ∞), jeżeli jej funkcja gęstości wyraża się wzorem [ ] 1 (x − µ)2 f (x) = √ exp − . 2σ 2 2πσ Rozkład normalny N (0, 1) nazywamy standardowym rozkładem normalnym. Nie istnieje jawna postać dystrybuanty rozkładu normalnego. 5 Fakt 4 Jeżeli zmienna losowa X ma rozkład normalny N (µ, σ 2 ), to zmienna losowa Y = X −µ σ ma rozkład N (0, 1) (standardowy rozkład normalny). Powyższe przekształcenie zmiennej losowej X nazywamy standaryzacją zmiennej losowej. Z powyższego faktu wynika, że wartość dystrybuanty dowolnego rozkładu normalnego N (µ, σ 2 ), można wyrazić przez odpowiednią wartość dystrybuanty standardowego rozkładu normalnego N (0, 1). Dokładnie opisuje to poniższy wniosek. Wniosek 1 Jeżeli zmienna losowa X ma rozkład normalny N (µ, σ 2 ), to P (X ¬ x) = P ( ) ( ) x−µ X −µ x−µ ¬ =Φ , σ σ σ gdzie Φ oznacza dystrybuantę zmiennej losowej o standardowym rozkładzie normalnym. Dla dodatnich wartości argumentów x (gdzie x jest dane z dokładnością do dwóch miejsc po przecinku), wartości dystrybuanty standardowego rozkładu normalnego są stablicowane. Stąd, że gęstość standardowego rozkładu normalnego jest funkcją parzystą, jej wykres jest symetryczny względem osi Y , mamy, że dla ujemnych wartości argumentów x wartość dystrybuanty standardowego rozkładu normalnego jest równa Φ(x) = 1 − Φ(−x), gdzie Φ(−x) możemy już odczytać z tablic wartości dystrybuanty standardowego rozkładu normalnego. Przykład 1 Niech X będzie zmienną losową o rozkładzie normalnym N (1, 4). Wówczas P (X ¬ 2) = P ( ) ( ) 1 X −1 2−1 ¬ =Φ = 0, 6915, 2 2 2 gdzie Φ oznacza dystrybuantę zmiennej losowej o standardowym rozkładzie normalnym i wartość Φ ( ) 1 2 została odczytana z tablic wartości dystrybuanty rozkładu normalnego. Wartość oczekiwana zmiennej losowej X o rozkładzie normalnym N (µ, σ 2 ) jest postaci E(X) = µ, natomiast wariancja tej zmiennej jest postaci Var(X) = σ 2 . 6