DWUWYMIAROWE ZMIENNE LOSOWE Rozkład łączny pary zmiennych losowych ( X , Y ) określonych na tej samej przestrzeni zdarzeń elementarnych: P(( X , Y ) A) , A - dowolny podzbiór zbioru par wartości zmiennych X, Y. Definicja. Dystrybuantą zmiennej losowej ( X , Y ) nazywamy funkcję F ( x, y) P( X x, Y y) , gdzie x , y . Twierdzenie. Łączny rozkład prawdopodobieństwa zmiennej losowej ( X , Y ) określony jest jednoznacznie przez jej dystrybuantę. Zmienne dyskretne Funkcja prawdopodobieństwa ( łącznego ) dwuwymiarowej zmiennej losowej dyskretnej: f ( x, y) P( X x, Y y) . Własności: (i) f ( x, y) 0 , dla dowolnej pary wartości ( x, y) , (ii) f ( x, y ) 1, x y (iii) (iv) P(( X , Y ) A) f ( x, y ) , ( x , y ) A F ( x, y ) f ( s , t ) . s x t y Przykład. W każdym z dwóch etapów teleturnieju można otrzymać 0, 1, lub 2 punkty. Niech zmienne losowe X, Y oznaczają liczby punktów uzyskane w etapie I i II, odpowiednio, przez losowo wybranego uczestnika. Funkcję prawdopodobieństwa łącznego określa tabela: Y X 0 1 2 0,5 0,05 0,01 0,2 0,1 0,06 0,02 0,03 A 0 1 2 Znaleźć: (a) f (2,2) P( X 2, Y 2) (b) P(Y 2) (c) F (1,1) . 2 (a) 2 f ( x, y ) = 1. Stąd x 0 y 0 f (2,2) = A = 1 – ( 0,5 + 0,05 + 0,01 + 0,2 + 0,1 + + 0,06 + 0,02 + 0,03 ) = 1 – 0,97 = 0,03. 2 (b) P(Y 2) P( X x, Y 2) = x 0 f (0,2) f (1,2) f (2,2) = 0,01 + 0,06 + 0,03 = 0,1. (c) F (1,1) = P( X 1, Y 1) = = f (0,0) f (0,1) f (1,0) f (1,1) = = 0,5 + 0,05 + 0,2 + 0,1 = 0,85. Zmienne ciągłe Zmienna losowa ( X ,Y ) jest dwuwymiarową ciągłą zmienną losową, jeśli jej łączny rozkład prawdopodobieństwa określony jest przez funkcję gęstości łącznej ( łączną gęstość prawdopodobieństwa ), taką że (i) f ( x, y) 0 (ii) f ( x, y )dxdy 1 (iii) P(( X , Y ) A) f ( x, y )dxdy A W szczególności dla A (, x] (, y] : x y F ( x, y ) = P( X x, Y y ) f ( s, t )dtds . 2 f ( x, y ) F ( x, y ) , x , y . xy Przykład. Zmienna losowa ( X , Y ) ma gęstość prawdopodobieństwa x y f ( x, y ) gdy 0 0 x 1,0 y 1 przeciwnie Obliczyć 0, 5 1 P( X 0,5, Y 0,25) = ( x y )dydx = 0 0, 25 0, 5 2 1 ( xy y / 2) 0,25 dx = 0 0,5 ( x 0,5 0,25x 0,625 / 2)dx = ? 0 . Rozkłady brzegowe Niech ( X , Y ) będzie dwuwymiarową zmienną losową o rozkładzie prawdopodobieństwa określonym przez funkcję f ( x, y) ( funkcja prawdopodobieństwa lub gęstość ). Rozkład brzegowy = rozkład prawdopodobieństwa zmiennej losowej X lub zmiennej losowej Y. (a) dla dyskretnych zmiennych X, Y , brzegowe funkcje prawdopodobieństwa są postaci f X ( x ) P ( X x ) f ( x, y ) y fY ( y ) P(Y y ) f ( x, y ) x (b) dla ciągłych zmiennych X, Y , brzegowe gęstości są postaci f X ( x) f ( x, y )dy fY ( y ) f ( x, y )dx . D. (a) f X (x) P( X x) P( X x, Y y}) = y P ( X x, Y y ) f ( x, y ) . y (b) y FX ( x) P( X x) = P( X x, Y ) = x f ( s, t )dtds . Stąd d f X (x) FX (x) = f ( x, t ) dt . dx Przykład. Dwuwymiarowa zmienna losowa ( X , Y ) ma gęstość 3( x y ) 2 / 8 f ( x, y ) 0 gdy 1 x 1,1 y 1 przeciwnie Znaleźć gęstość zmiennej losowej X. Niech 1 x 1. 31 f X ( x) f ( x, y )dy = ( x y ) 2 dy 8 1 31 2 2 ( x 2 xy y )dy = 8 1 1 3 2 1 3 2 2 3 = x . [ x y xy y / 3] 4 4 1 8 (3x 2 1) / 4 gdy f X ( x) 0 1 x 1 . przeciwnie Gęstość zmiennej losowej Y ma identyczną postać. Rozkłady warunkowe (a) Niech ( X , Y ) będzie dyskretną zmienną losową mającą funkcję prawdopodobieństwa f ( x, y) . Niech y – ustalone oraz fY ( y ) 0 . Rozkład warunkowy zmiennej losowej X pod warunkiem, że Y = y określa warunkowa funkcja prawdopodobieństwa: f ( x y) = f ( x y) = f ( x, y ) , x – dowolna wartość zmiennej X. fY ( y ) P ( X x, Y y ) P( X x Y y ) = P (Y y ) funkcja prawdopodobieństwa zmiennej X pod warunkiem, że zmienna Y przyjęła wartość y. Analogicznie: f ( y x) = Notacja: f ( x, y ) = P(Y y X x) , gdzie f X ( x) 0 . f X ( x) f ( x y) f X Y ( x y) f ( y x) fY X ( y x) (b) Niech ( X , Y ) będzie ciągłą zmienną losową o łącznej gęstości f ( x, y) . Niech y – ustalone oraz fY ( y ) 0 . Warunkową gęstością prawdopodobieństwa zmiennej losowej X pod warunkiem, że Y y nazywamy funkcję f ( x y) = f ( x, y ) , x . fY ( y ) Przykład. (kontynuacja) 1 x 1,1 y 1 3( x y ) 2 / 8 gdy f ( x, y ) przeciwnie 0 1 y 1 (3 y 2 1) / 4 fY ( y ) gdy przeciwnie 0 Niech 1 y 1 - ustalone. 3( x y ) 2 3( x y ) 2 / 8 f ( x y) = = dla x [1,1] 2 2 6y 2 (3 y 1) / 4 f ( x y ) = 0 dla x [1,1]. Uwaga. Analogicznie określamy rozkład warunkowy zmiennej losowej Y pod warunkiem X = x. Zatem f ( x, y ) f ( y x) = , gdzie y – dowolna wartość Y, f X ( x) x - ustalone, takie że f X ( x) 0 . Notacja: f ( y x) fY X ( y x) , f ( x y) f X Y ( x y) Przykład. (kontynuacja) (a) Znaleźć rozkład brzegowy zmiennej Y, liczby punktów uzyskanych w II etapie teleturnieju przez losowo wybranego uczestnika. (b) Wyznaczyć rozkład warunkowy Y pod warunkiem, że w I etapie uzyskano 2 punkty, tzn. X = 2. Y X 0 1 2 0,5 0,05 0,01 0,2 0,1 0,06 0,02 0,03 0,03 0 1 2 Y X 0 1 2 0,5 0,05 0,01 0,2 0,1 0,06 0,02 0,03 0,03 0 1 2 (a) fY ( y ) = f (0, y) f (1, y) f (2, y) . Stąd Y fY ( y ) (b) f ( y 2) = 0 0,72 1 0,18 2 0,1 f ( 2, y ) = ? f X ( 2) f (0 2) = fY X (0 2) = f (2,0) / f X (2) = = 0,02/(0,02 + 0,03 + 0,03) =1/4, f (1 2) = fY X (1 2) = f (2,1) / f X (2) = = 0,03/0,08 = 3/8, f (2 2) = fY X (2 2) = f (2,2) / f X (2) = = 0,03/0,08 = 3/8. Niezależne zmienne losowe Definicja. Niech ( X , Y ) będzie dwuwymiarową zmienna losową o dystrybuancie F ( x, y ) oraz dystrybuantach brzegowych FX (x), FY ( y ) , x, y (, ) . Zmienne losowe X, Y są niezależne, jeśli F ( x, y ) FX ( x) FY ( y ) , dla wszystkich wartości x, y. Twierdzenie. Zmienne losowe X, Y są niezależne wtedy i tylko wtedy gdy f ( x, y ) f X ( x ) f Y ( y ) , dla wszystkich wartości x, y. Wniosek. Poniższe warunki są równoważne: (i) Zmienne losowe X, Y są niezależne. (ii) f ( x y ) f X ( x) , x , dla wszystkich y, takich że fY ( y ) 0 . (iii) f ( y x) fY ( y ) , y , dla wszystkich x, takich że f X ( x) 0 . Przykład. ( kontynuacja ) Czy liczby punktów uzyskane w I i II etapie teleturnieju przez losowo wybranego uczestnika są niezależnymi zmiennymi losowymi ? Y X 0 1 2 0,5 0,05 0,01 0,2 0,1 0,06 0,02 0,03 0,03 0 1 2 f X (0) f (0,0) f (0,1) f (0,2) = 0,5 + 0,05 + + 0,01 = 0,56. fY (0) f (0,0) f (1,0) f (2,0) = 0,5 + 0,2 + 0,02 = 0,72. Stąd f (0,0) 0,5 0,56 0,72 f X (0) fY (0) , Zmienne losowe X , Y są zależne. Przykład. ( kontynuacja ). Czy X, Y są niezależnymi zmiennymi losowymi, jeśli ich łączna gęstość ma postać: 3( x y ) 2 / 8 f ( x, y ) 0 gdy 1 x 1,1 y 1 przeciwnie Dla x, y [1,1] : f X ( x) (3x 2 1) / 4 oraz fY ( y) (3 y 2 1) / 4 . f ( x, y ) f X ( x ) f Y ( y ) . Przykład. Czasy poprawnej pracy dwu podzespołów są niezależnymi zmiennymi losowymi X, Y o rozkładach wykładniczych z parametrami 1 , 2 , odpowiednio. Średnie czasy pracy podzespołów wynoszą 1000 (godzin ) i 1200 ( godzin ). Obliczyć prawdopodobieństwo zdarzenia takiego, że każdy podzespół nie ulegnie awarii przed upływem 1500 godzin. E ( X ) 1 / 1 1000 (godz.), E (Y ) 1 / 2 1200 (godz.) Stąd 1 1 / 1000 (1/godz.) 2 1 / 1200 (1/godz.). P( X 1500, Y 1500) = P( X 1500) P(Y 1500) = e 11500 e 2 1500 = e 1500 / 1000 e 1500 / 1200 = = 0,2231 0,2865 = 0,0639. Wartość oczekiwana. Kowariancja. E[ g ( X , Y )] = g ( x, y ) f ( x, y ) , x y gdy X, Y są dyskretne, E[ g ( X , Y )] = g ( x, y ) f ( x, y )dxdy , gdy X, Y są ciągłe. Uwaga. Dla g ( X , Y ) X lub g ( X , Y ) Y otrzymujemy wartości oczekiwane brzegowych zmiennych losowych X lub Y. Np. E[X ] = xf ( x, y ) = x f ( x, y ) = x y x y = xf X ( x) X . x Stwierdzenie. Niech c będzie dowolną stałą, a g ( X , Y ) , g1 ( X , Y ) , g 2 ( X , Y ) zmiennymi losowymi jednowymiarowymi. Wówczas E[cg ( X , Y ) cE[ g ( X , Y )] , E[ g1 ( X , Y ) g 2 ( X , Y )] E[ g1 ( X , Y )] E[ g 2 ( X , Y )]. D. Dowód jest bezpośrednią konsekwencją definicji wartości oczekiwanej oraz własności całki i sumowania. Stwierdzenie. Jeśli zmienne losowe X, Y są niezależne, to E ( XY ) E ( X ) E (Y ) . D. Niezależność zmiennych jest równoważna f ( x, y ) f X ( x) fY ( y ) . Stąd i z definicji wartości oczekiwanej mamy (a) (zmienne dyskretne ) E[ g ( X , Y )] = g ( x, y ) f ( x, y ) . x y E ( XY ) = xyf ( x, y ) = xyf X ( x) fY ( y ) = x y x y xf X ( x) yfY ( y ) = yfY ( y ) xf X ( x) = x y y x E (Y ) E ( X ) E ( X ) E (Y ) . (b) (zmienne ciągłe) Dowód analogiczny - Sumowanie należy zastąpić całkowaniem. Definicja. Niech X i Y będą zmiennymi losowymi o łącznej funkcji prawdopodobieństwa ( gęstości ) f ( x, y) . Kowariancją zmiennych X i Y nazywamy liczbę: XY E[( X X )(Y Y )]. Uwaga. Z definicji XY oraz E[ g ( X , Y )] , przyjmując g ( x, y ) ( x X )( y Y ) , otrzymujemy wzory: XY ( x X )( y Y ) f ( x, y ) , x y gdy X, Y są dyskretne XY ( x X )( y Y ) f ( x, y )dxdy , gdy X, Y są ciągłe. Notacja: Zamiast XY często piszemy Cov (X,Y). Interpretacja. Kowariancja określa pewną współzależność między zmiennymi losowymi: (a) Jeśli „dużym” wartościom zmiennej X przewyższającym X towarzyszą zwykle „duże” wartości zmiennej Y przewyższające Y , a wartościom X mniejszym od X towarzyszą zwykle wartości Y mniejsze od Y , to XY > 0. (b) Jeśli wartościom zmiennej X większym od X towarzyszą zwykle wartości Y mniejsze od Y wartościom X mniejszym od X towarzyszą zwykle wartości Y większe od od Y , to XY < 0. Stwierdzenie. Cov(X,Y) = E ( XY ) X Y . D. Cov(X,Y) = E[( X X )(Y Y )] = = E ( XY XY Y X X Y ) = = E ( XY ) E ( XY ) E (Y X ) X Y = = E ( XY ) X Y . Twierdzenie. Jeśli zmienne losowe X i Y są niezależne, to Cov(X,Y) = 0. D. Dla niezależnych zmiennych losowych E ( XY ) E ( X ) E (Y ) . Stąd oraz wzoru na kowariancję mamy: Cov(X,Y) = E ( XY ) X Y = = E ( X ) E (Y ) X Y = 0. Uwaga. Twierdzenie odwrotne nie jest na ogół prawdziwe. Twierdzenie. Dla dowolnych stałych a, b Var( aX bY ) = a 2 Var(X) + b 2 Var(Y) + 2 ab Cov(X,Y). D. E{ (aX bY ) (a X bY )2 } = E{ a( X X ) b(Y Y )2 } = E{ a( X X ))2 } + E 2ab( X X )(Y Y ) + E{ b(Y Y )2 } = = a 2 Var(X) + 2abCov(X,Y) + b 2 Var(Y). c.k.d. Wniosek. Jeśli zmienne losowe X i Y są niezależne, to Var( aX bY ) = a 2 Var(X) + b 2 Var(Y). Definicja. Współczynnikiem korelacji między zmiennymi losowymi X i Y nazywamy liczbę: Cov( X , Y ) . Var ( X ) Var (Y ) Przykład. ? Y X 0 1 2 0,5 0,05 0,01 0,2 0,1 0,06 0,02 0,03 0,03 0 1 2 E (X ) = x f ( x, y ) = 0 (0,5 + 0,05 + 0,01) + x y + 1 (0,2 + 0,1 + 0,06) + 2 (0,02+0,03+0,03) = 0,52. E (Y ) = y f ( x, y ) = 0 (0,5 + 0,2 + 0,02) + x y + 1 (0,05 + 0,1 + 0,03) + 2 (0,01+0,06+0,03) = 0,38. Y X 0 1 2 0,5 0,05 0,01 0,2 0,1 0,06 0,02 0,03 0,03 0 1 2 E ( XY ) = xyf ( x, y ) = 0 + 0 + 0 + 0 + 1 1 0,1 + x y + 1 2 0,06 + 2 1 0,03 + 2 2 0,03 = 0,31. Cov(X,Y) = 0,31 – 0,52 0,38 = 0,1124. E ( X 2 ) 12 (0,2 + 0,1 + 0,06) + + 22 (0,02 0,03 0,03) = 0,68 E (Y 2 ) 12 (0,05 + 0,1 + 0,03) + + 22 (0,01 0,06 0,03) = 0,58. Var(X) = E ( X 2 ) [ E ( X )]2 0,68 0,522 = 0,4096 Var(Y) = E (Y 2 ) [ E (Y )]2 0,58 0,382 = 0,4356 0,1124 0,2661. 0,4096 0,4356 Własności współczynnika korelacji (i) 1 1 (ii) Jeśli a i b są stałymi, oraz jeśli Y = a + bX, to 1 gdy 1 b0 b0 (iii) Jeśli zmienne losowe X i Y są niezależne, to 0. (iv) Jeśli 1, to między zmiennymi losowymi X, Y istnieje liniowa zależność funkcyjna. Interpretacja. Współczynnik korelacji jest miarą zależności liniowej między zmiennymi losowymi. Dwuwymiarowy rozkład normalny Zmienna losowa ( X , Y ) ma dwuwymiarowy rozkład normalny, jeśli ma gęstość postaci: 1 q ( x, y ) , f ( x, y ) exp 2 2 X Y 2(1 ) 1 gdzie q ( x, y ) ( x X )2 X2 2 ( x X )( y Y ) XY ( y Y ) 2 y2 , x , y , stałe X , Y , spełniają warunki X > 0, Y > 0, 1 1. Notacja: ( X , Y ) ~ N ( X , Y , X , Y , ) Twierdzenie. Jeśli ( X , Y ) ~ N ( X , Y , X , Y , ) , to (i) X ~ N ( X , X ) , (ii) Cov(X,Y) = . Y ~ N ( Y , Y ) . (iii) X, Y są niezależne wtedy i tylko wtedy gdy = 0. Twierdzenie. Zmienna losowa (X,Y) ma dwuwymiarowy rozkład normalny wtedy i tylko wtedy gdy zmienna losowa aX + bY ma rozkład normalny, a, b są dowolnymi stałymi. CIĄGI ZMIENNYCH LOSOWYCH Niech X1, X 2 ,..., X n będą zmiennymi losowymi określonymi na tej samej przestrzeni zdarzeń elementarnych S . F ( x1, x2 ,..., xn ) = P( X1 x1, X 2 x2 ,..., X n xn ) = dystrybuanta wektora losowego ( X1, X 2 ,..., X n ). f ( x1, x2 ,..., xn ) = funkcja prawdopodobieństwa łącznego lub funkcja gęstości łącznej wektora losowego ( X1, X 2 ,..., X n ). Definicja. Zmienne losowe X1, X 2 ,..., X n są niezależne, jeśli F ( x1, x2 ,..., xn ) = FX 1 ( x1 ) FX 2 ( x2 ) ... FX n ( xn ) , gdzie FX i ( x i ) P( X i xi ) , i = 1,2,...,n. Definicja. E[ g ( X1, X 2 , , , , X n )] = ... g ( x1 , x2 ,..., xn ) f ( x1 , x2 ,..., xn ) , x1 x 2 xn lub ... g ( x1 , x2 ,..., x n ) f ( x1 , x2 ,..., xn )dx1dx2 ...dxn . Stwierdzenie. E (a1 X1 a2 X 2 ... an X n ) = a1E ( X1 ) a2 E ( X 2 ) ... an E ( X n ) . 1 n Wniosek. Niech X X i , E ( X i ) , i = 1,2,..,n. n i 1 E( X ) = . 1 D. W stwierdzeniu trzeba przyjąć ai , i = 1,2,..,n. n Stwierdzenie. Jeśli X1, X 2 ,..., X n są niezależnymi zmiennymi losowymi, to Var (a1 X1 a2 X 2 ... an X n ) = a12 Var( X 1 ) + a2 2 Var( X 2 ) + ... + a n 2 Var( X n ). 1 W szczególności, jeśli Var( X i ) = 2 oraz ai , n i = 1,2,..,n, to 2 Var( X ) = . n Przykład. Dokonujemy n jednakowych, niezależnych doświadczeń Bernoulli’ego o prawdopodobieństwie sukcesu p, 0 p 1. Znaleźć wartość oczekiwaną i wariancję zmiennej losowej Y będącej liczbą sukcesów. Niech X i 1, gdy sukces w i-tym doświadczeniu, X i 0, gdy porażka w i-tym doświadczeniu. Wówczas X1, X 2 ,..., X n są niezależnymi zmiennymi losowymi o funkcjach prawdopodobieństwa: f X i (1) p , f X i (0) 1 p . Stąd: E ( X i ) p , Var( X i ) = p(1 p) . Liczba sukcesów = Y X1 X 2 ... X n . E (Y ) = E ( X1 X 2 ... X n ) = E ( X1 ) E ( X 2 ) ... E ( X n ) = np . Var(Y) = Var( X 1 ) + Var( X 2 ) + ... + Var( X n ) = np(1 p) Definicja. Prostą próbą losową o liczności n nazywamy ciąg niezależnych zmiennych losowych X1, X 2 ,..., X n określonych na przestrzeni zdarzeń elementarnych S i takich, że każda ze zmiennych ma taki sam rozkład. Twierdzenie. ( CENTRALNE TWIERDZENIE GRANICZNE) Niech X1, X 2 ,..., X n będzie prostą próbą losową z rozkładu o średniej i wariancji 2 . Wówczas dla dużych liczności próby n rozkład prawdopodobieństwa standaryzowanej średniej ( = standaryzowanej sumy X1 X 2 ... X n ) jest bliski standardowemu rozkładowi normalnemu N (0,1) , dokładniej dla dowolnych liczb a, b, a b P( a X b) P(a Z b) (b) (a), / n przy n . Równoważnie rozkład średniej X jest bliski rozkładowi normalnemu N ( , / n ) . Przykład. Załóżmy, że rozkład codziennego dojazdu do pracy jest w przybliżeniu rozkładem jednostajnym na przedziale [0,5 godz., 1 godz. ] i że czasy dojazdów w różne dni są niezależne. Obliczyć przybliżone prawdopodobieństwo zdarzenia, że średni dzienny dojazd w ciągu 30 dni przekroczy 0,8 godz. Niech X i oznacza czas dojazdu w i-tym dniu , i 1,2,...,30 . 0,5 1 3 E( X i ) , 2 4 2 ( 1 0 , 5 ) 1 2 Var ( X i ) . 12 48 3 1 E ( X ) , Var ( X ) 4 30 48 P ( X 0,8) = P( X 3/ 4 0,8 3 / 4 ) 1 /(30 48) 1 /(30 48) P( Z 1,89) 1 (1,89) 0,03.