Zmienne losowe 1. Pojęcie zmiennej losowej Podstawowymi pojęciami związanymi z zagadnieniem zmiennej losowej i zarazem będącymi jego podstawą są podstawowe pojęcia rachunku podobieństwa: zdarzenie elementarne, zdarzenie losowe, prawdopodobieństwo, zbiór zdarzeń elementarnych. Najprostszy wynik doświadczenia losowego, jaki może zajść przy danym doświadczeniu losowym nazywamy zdarzeniem elementarnym, natomiast ich zbiór zbiorem zdarzeń elementarnych. Zmienną losową X jest funkcja, która przy zajściu każdego zdarzenia losowego ω przyjmuje konkretną wartość x(ω), co można zapisać formalnie w sposób następujący: X: ω → x(ω) ε R Tzn. zmienna losowa X jest liczbową prezentacją wyniku doświadczenia losowego. A więc jej wartość zależna jest od przypadku. Np. jeśli doświadczenie polega na kontroli jakości 20 komputerów wyprodukowanych przez producenta tych wyrobów, to zmienną losową będzie liczba wadliwych komputerów, która może przyjąć wartość: od 0 do 20. 2. Zmienne losowe typu skokowego Zmienna losowa jest typu skokowego (dyskretnego), jeżeli istnieje skończony albo przeliczalny zbiór Wx = {x1, x2, …, xn} jej wartości taki, że P(X = xi) = pi, i N ∑i=1 pi=1 gdzie górna granica sumowania wynosi n (zbiór skończony) lub ∞ (zbiór przeliczalny). Wartościom zmiennej losowej odpowiadają prawdopodobieństwa (i = 1, 2, ..., n lub i = 1,2,...), które można zdefiniować w sposób następujący: Pi = P (X = xi), przy czym: ∑pi = 1 (i = 1, 2, ..., n lub i = 1, 2, ...). Przykładem zmiennej losowej skokowej jest wielkość popytu na określone dobro. Popyt zależy bowiem od wielu czynników, takich jak: cena dobra, ceny innych dóbr (substytucyjnych), dochód do dyspozycji gospodarstwa domowego zgłaszającego popyt na to dobro itp. Jest zatem, przynajmniej częściowo, zależny od przypadku. Innym przykładem zmiennej losowej typu skokowego jest zmienna "liczba autobusów komunikacji miejskiej stolic Europy " - trudno przyjąć, by mogła ona przyjąć wartość 103,3. Funkcje opisujące rozkład zmiennej losowej skokowej (dyskretnej): Funkcję prawdopodobieństwa, przypisując każdej przyjmowanej przez zmienną losową X wartości xi określone prawdopodobieństwo wystąpienia pi, nazywamy funkcją rozkładu prawdopodobieństwa zmiennej losowe skokowej X: P( X = xi ) = pi ≥0, i =1,2,…,n ∑pi = 1 gdzie: xi – wartości, które przyjmuje zmienna X pi - prawdopodobieństwa, z jakimi te mogą być przyjmowane lub xi x1 x2 … xn … pi p1 p2 … pn … f(xi) xi Rysunek 1: Graficzna prezentacja rozkładu zmiennej losowej Przykład liczbowy: Źródło: opracowanie własne i 1 2 3 4 5 6 suma xi -7,5 -6,5 -5,5 -4,5 -3,5 -2,5 pi 0,1 0,4 0,15 0,15 0,14 0,06 1 2 0,5 0,4 0,3 0,2 0,1 0 -8 -6 -4 -2 0 Rysunek 2: Wykres funkcji rozkładu prawdopodobieństwa zmiennej losowej skokowej Dystrybuanta zmiennej losowej X – funkcja określona na całym zbiorze liczb rzeczywistych: F(x) = P(X < x), x R Przykład: Dystrybuanta zmiennej losowej skokowej : 0 dla x< 0,5 0,1 dla 0,5 ≤ x < 2 0,4 dla 2 ≤ x < 3,5 0,5 dla 3,5 ≤ x < 5 0,7 dla 5 ≤ x < 6,5 1 dla 6,5 ≤ x < 8 i 1 2 3 4 5 6 suma xi 0,5 2 3,5 5 6,5 8 pi 0,1 0,1 0,3 0,1 0,2 0,2 1 F(x) 0 0,1 0,4 0,5 0,7 1 3 Rysunek 3: Wykres dystrybuanty zmiennej losowej skokowej 3. Zmienne losowe typu ciągłego Zmienna losowa X przyjmująca wartości z pewnego przedziału (lub przedziałów), dla której istnieje nieujemna funkcja f taka, że dystrybuantę F zmiennej losowej X można przedstawić w postaci: x F(X ) f (t )dt dla x R nazywamy zmienna losową ciągła, a funkcje f jej gęstością. Własności funkcji gęstości: o Jeżeli x jest punktem ciągłości f, to F'(x) = f(x) o f ( x)dx 1 b o P(a < X < b ) = f ( x)dx a o P(a < X < b) F (b) F (a) Przykład: Na pewnym przystanku co 10 minut podjeżdża autobus. Zmienną losową ciągłą jest czas oczekiwania na autobus. Waha się on w przedziale <0,10>, zmienna losowa może wiec przyjąć każdą wartość z tego przedziału. Prawdopodobieństwo w przedziale <0,10>, jest funkcja stałą, ponieważ wszystkie wartości zmiennej losowej są tak samo prawdopodobne. 4 Możemy zatem zapisać: 0 dla x< 0 f(x)= a dla 0≤ x ≤ 10 0 dla x> 10 Wyznaczamy wartość stałej: f ( x)dx P( < X ) 1 0 10 0 8 f ( x)dx 0dx adx 0dx 0 ax (od 0 do 10) +0 = 10a 10a =1 1 a= 10 0 dla x < 0 f(x) = 1 dla 0 ≤ x ≤ 10 10 0 dla x > 10 Rysunek 4: Wykres funkcji gęstości 5 Rozkład zmiennej losowej możemy również zapisać w postaci dystrybuanty: 0 dla x < 0 1 dla 0 ≤ x ≤ 8 10 f(x) = 0 dla x > 8 Korzystając ze wzoru: x f(x) = f (t )dt Otrzymujemy: x f(x) = 0dt 0 dla x < 0 0 f(x) = 0 f(x) = x 1 1 1 x dt 0 t (od 0 do x) = 10 10 10 0 0dt 10 x 1 dt 0dt 0 1 0 1 10 0 10 0dt dla x ≥ 10 0 dla x < 0 f(x) = dla 0 ≤ x ≤ 1= 1 x dla 0 ≤ x ≤ 10 10 1 dla x > 10 6 Rysunek 5: Wykres dystrybuanty 4. Charakterystyki liczbowe zmiennych losowych typu skokowego Moment zwykły: ar = x r i pi i i xi pi xi*pi xi2*pi 1 2 3 4 5 6 Suma 0,5 2 3,5 5 6,5 8 0,1 0,1 0,3 0,1 0,2 0,2 0,05 0,2 1,05 0,5 1,3 1,6 4,7 0,025 0,4 3,675 2,5 8,45 12,8 27,85 7 xi3*pi 0,0125 0,8 12,8625 12,5 54,925 102,4 183,5 xi4*pi 0,00625 1,6 45,01875 62,5 357,0125 819,2 1285,338 moment centralny: r ( xi a1 ) r pi i i xi pi 1 2 3 4 5 6 0,5 2 3,5 5 6,5 8 Suma 0,1 0,1 0,3 0,1 0,2 0,2 (xi-a1)*pi (xi-a1)2*pi (xi-a1)3*pi -0,375 -0,225 -0,225 0,075 0,45 0,75 0,45 Odchylenie standardowe: Współczynnik skośności: Współczynnik spłaszczenia: 1,40625 0,50625 0,16875 0,05625 1,0125 2,8125 5,9625 -5,273438 -1,139063 -0,126563 0,0421875 2,278125 10,546875 6,328125 (xi-a1)4*pi 19,7753906 2,56289063 0,09492188 0,03164063 5,12578125 39,5507813 67,1414063 2,441823 0,07244 0,314762 Wariancja: 5,9 Średni kwadrat odchyleń wartości od ich wartości średniej wynosi 5,9 Odchylenie standardowe: 2,44 Odchylenie standardowe wartości podanych w szeregu odbiegają średnio (w dół lub górę) od średniej o 2,44 Współczynnik skośności: 0,072 Istnieją w szeregu , aczkolwiek nieliczne wartości, które silnie odbiegają od pozostałych ku mniejszym wielkościom, pociągając za sobą średnią. W takim przypadku więcej jest wartości większych względem średniej. Średnia jest sztucznie zaniżona. Współczynnik spłaszczenia: 0,31 5. Rozkład normalny zmiennej losowej ciągłej Rozkład normalny to najważniejszy rozkład zmiennej losowej ciągłej. Mówimy, że zmienna losowa X ma rozkład normalny z parametrami µ i σ > 0, co zapisujemy X: N (µ, σ) lub X~ N(µ, σ), jeśli jej funkcja gęstości jest określona wzorem f ( x) 2 2 1 e ( x ) / 2 , 2 dla x (;) 8 Wykresem jest krzywa Gaussa-Laplace’a. Wykres gęstości dla µ=0, σ=1 1 x2 exp( ) 2 2 Dana funkcja w całej swej dziedzinie przyjmuje wartości dodatnie, przy x=µ osiąga maksimum. Ramiona f(x) maja punkty przegięcia dla x= µ-σ oraz x= µ+σ Kształt funkcji gęstości zależy od dwóch parametrów µ i σ f ( x) Przykład liczbowy: Źródło: opracowanie własne Wartości funkcji gęstości prawdopodobieństwa rozkładu normalnego o średniej zero i odchyleniu standardowym 1: xi -1,8 -1,7 -1,6 -1,5 -1,4 -1,3 -1,2 -1,1 -1 -0,9 -0,8 -0,7 -0,6 -0,5 -0,4 -0,3 -0,2 -0,1 -5,33E-14 0,1 0,2 3,00E-01 0,4 0,5 0,6 0,7 0,8 0,9 1 f(x) 0,07895 0,094049 0,110921 0,129518 0,149727 0,171369 0,194186 0,217852 0,241971 0,266085 0,289692 0,312254 0,333225 0,352065 0,36827 0,381388 0,391043 0,396953 0,398942 0,396953 0,391043 0,381388 0,36827 0,352065 0,333225 0,312254 0,289692 0,266085 0,241971 9 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 0,217852 0,194186 0,171369 0,149727 0,129518 0,110921 0,094049 0,07895 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 -2 -1,5 -1 -0,5 0 0,5 1 1,5 Rysunek 6: Wykres funkcji gęstości Dystrybuanta zmiennej rozkładu normalnego: 1 f ( x) 2 z 1 x exp[ 2 ( )2 xi f(x) Skumulowane wartości skum.* 0,1 -1,8 -1,7 -1,6 -1,5 -1,4 -1,3 -1,2 -1,1 -1 -0,9 -0,8 -0,7 -0,6 -0,5 0,07895 0,094049 0,110921 0,129518 0,149727 0,171369 0,194186 0,217852 0,241971 0,266085 0,289692 0,312254 0,333225 0,352065 0,078950158 0,172999236 0,28392007 0,413437666 0,563165132 0,734533724 0,928719779 1,146571956 1,38854268 1,65462793 1,944319483 2,256573416 2,589798019 2,941863346 0,00789502 0,01729992 0,02839201 0,04134377 0,05631651 0,07345337 0,09287198 0,1146572 0,13885427 0,16546279 0,19443195 0,22565734 0,2589798 0,29418633 10 2 -0,4 -0,3 -0,2 -0,1 -5,33E-14 0,1 0,2 3,00E-01 0,4 0,5 0,6 0,7 0,8 0,9 1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 0,36827 0,381388 0,391043 0,396953 0,398942 0,396953 0,391043 0,381388 0,36827 0,352065 0,333225 0,312254 0,289692 0,266085 0,241971 0,217852 0,194186 0,171369 0,149727 0,129518 0,110921 0,094049 0,07895 3,310133486 3,691521302 4,082563996 4,479516543 4,878458824 5,275411371 5,666454065 6,04784188 6,416112021 6,768177348 7,10140195 7,413655884 7,703347437 7,969432686 8,211403411 8,429255588 8,623441643 8,794810235 8,944537701 9,074055296 9,184976131 9,279025208 9,357975367 0,33101335 0,36915213 0,4082564 0,44795165 0,48784588 0,52754114 0,56664541 0,60478419 0,6416112 0,67681773 0,7101402 0,74136559 0,77033474 0,79694327 0,82114034 0,84292556 0,86234416 0,87948102 0,89445377 0,90740553 0,91849761 0,92790252 0,93579754 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 -2 -1,5 -1 -0,5 0 0,5 1 Rysunek 7: Wykres dystrybuanty 11 1,5 2 6. Rozkład dwupunktowy Z rozkładem dwupunktowym mamy do czynienia wówczas, gdy w wyniku doświadczenia możemy uzyskać tylko jedną z dwóch wartości zmiennej losowej x1 lub x2 z prawdopodobieństwami odpowiednio p oraz 1-p (q). w szczególnym przypadku, gdy x1=0 oraz x2=1 rozkład ten nazywany jest rozkładem zero-jedynkowym. Funkcja prawdopodobieństwa w tym rozkładzie ma postać: xi 0 1 pi 1-p p Dystrybuanta rozkładu zero-jedynkowego ma postać: 0 dla x < 0 F(x) = 1-p dla 0 ≤ x < 1 1 dla x ≥ 1 Wartość oczekiwana zmiennej w rozkładzie zero-jedynkowym wynosi: E(X)= 0* (1-p)+1*p=p Natomiast wariancja: D2(X)= (0-p)2 * (1-p)+ (1-p)2*p= p(1-p) Przykład: Źródło: opracowanie własne Prawdopodobieństwo, że losowo wybrany student odda projekt wynosi 75%. 1 jeżeli student odda projekt X= 0 jeżeli student nie odda projektu Otrzymujemy: P = 0,75 Q = 0,25 Rozkład prawdopodobieństwa zmiennej losowej X: P(X=1) = 0,75 P(X=0) = 0,35 wartość zmiennej losowej prawdopodobieństwo 0 0,25 1 0,75 12 Wartość oczekiwana: 0,75 Wariacja: 0,1875 Odchylenie standardowe: 0,433 Dystrybuanta: 0 dla x < 0 F(x) = 0,25 dla 0 ≤ x < 1 1 dla x ≥ 1 7. Rozkład dwumianowy (Bernoulliego) Rozkład dwumianowy występuje wówczas, gdy przeprowadza się n jednakowych doświadczeń, z których każde może zakończyć się jednym z dwóch wyników: „sukcesem” z prawdopodobieństwem p lub „porażką” z prawdopodobieństwem 1-p. zmienną losową X w tym eksperymencie jest liczba sukcesów w n próbach. Może ona przyjmować wartości z przedziału 0, n . Rozkład prawdopodobieństwa w rozkładzie Bernoulliego jest określony wzorem: P( X k ) n! p k (1 p) nk k!(n k )! dla k= 0,1,2…, n Przyjmę za p=0,1 prawdopodobieństow pojedyńczego sukcesu zdarzenia elementarnego a n=10 liczbę prób w doświadczeniach Bernouliego: p 0,1 n 10 q 0,9 Obliczę prawdopodobieństwa k- liczby sukcesów w 10 ciu doświadczeniach Bernouliego (np rzut dziesięciościanem o ponumerowanych ścianach żądając, aby k razy pojawiła się liczba 3 ). k 1 2 3 4 5 6 7 8 9 10 n po k 10 45 120 210 252 210 120 45 10 1 p^k 0,1 0,01 0,001 0,0001 0,00001 0,000001 0,0000001 0,00000001 0,000000001 1E-10 q^n-k 0,387420489 0,43046721 0,4782969 0,531441 0,59049 0,6561 0,729 0,81 0,9 1 13 iloczyn 0,38742049 0,19371024 0,05739563 0,01116026 0,00148803 0,00013778 8,748E-06 3,645E-07 9E-09 1E-10 8. Rozkład jednostajny Jest to najprostszy z rozkładów zmiennej losowej ciągłej. Mamy z nim do czynienia wtedy, gdy prawdopodobieństwo zajścia zdarzenia jest stałe w pewnym przedziale a, b . Funkcja gęstości tego rozkładu jest dana wzorem: f(x)= 0 dla x < a 1 dla a≤ x ≤ b ba 0 dla x > b Przyjmę następujące parametry rozkładu jednostajnego: a b 5 8 x f(x) 3 0 3,5 0 4 0 4,5 0 5 5,5 6 6,5 7 7,5 8 8,5 9 9,5 10 10,5 11 11,5 12 12,5 0,333 0,333 0,333 0,333 0,333 0,333 0,333 0 0 0 0 0 0 0 0 0 14 Dystrybuanta: 0 dla x ≤ a f(x) = xa dla x (a, b) ba 1 dla x ≥ b 15 x f(x) 3 0 3,5 0 4 0 4,5 0 5 5,5 6 6,5 7 7,5 8 8,5 9 9,5 10 10,5 11 11,5 12 12,5 0,333 0,333 0,333 0,333 0,333 0,333 0,333 0 0 0 0 0 0 0 0 0 F(x) 0 0 0 0 0 0,166666667 0,333333333 0,5 0,666666667 0,833333333 1 1 1 1 1 1 1 1 1 1 Rysunek 8: Wykres dystrybuanty 16