DWUWYMIAROWE ZMIENNE LOSOWE ( X , Y ) : S (, ) (, ) np. X = wzrost, Y = waga losowo wybranej osoby z pewnej populacji; X = ocena z analizy, Y = ocena z baz danych studenta PJWSTK, .... Łącznym rozkładem prawdopodobieństwa ( lub rozkładem łącznym ) pary zmiennych losowych ( X , Y ) określonych na tej samej przestrzeni zdarzeń elementarnych nazywamy przyporządkowanie A P(( X , Y ) A) , gdzie A - dowolny podzbiór zbioru par wartości zmiennych X, Y. Definicja. Dystrybuantą zmiennej losowej ( X , Y ) nazywamy funkcję F ( x, y) P( X x, Y y) , gdzie x , y . Twierdzenie. Łączny rozkład prawdopodobieństwa zmiennej losowej ( X , Y ) określony jest jednoznacznie przez jej dystrybuantę. ZMIENNE DYSKRETNE Funkcja prawdopodobieństwa ( łącznego ) dwuwymiarowej zmiennej losowej dyskretnej: f ( x, y) P( X x, Y y) . Własności: (i) f ( x, y) 0 , dla dowolnej pary wartości ( x, y) , (ii) f ( x, y ) 1, x y (iii) (iv) P(( X , Y ) A) f ( x, y ) , ( x , y ) A F ( x, y ) f ( s , t ) . s x t y Przykład. W każdym z dwóch etapów teleturnieju można otrzymać 0, 1, lub 2 punkty. Niech zmienne losowe X, Y oznaczają liczby punktów uzyskane w etapie I i II, odpowiednio, przez losowo wybranego uczestnika. Funkcję prawdopodobieństwa łącznego określa tabela: Y X 0 1 2 0,5 0,05 0,01 0,2 0,1 0,06 0,02 0,03 A 0 1 2 Znaleźć: (a) f (2,2) P( X 2, Y 2) , (b) P(Y 2) , (c) F (1,1) . 2 (a) 2 f ( x, y ) = 1. Stąd x 0 y 0 f (2,2) = A = 1 – ( 0,5 + 0,05 + 0,01 + 0,2 + 0,1 + + 0,06 + 0,02 + 0,03 ) = 1 – 0,97 = 0,03. 2 (b) P(Y 2) P( X x, Y 2) = x 0 f (0,2) f (1,2) f (2,2) = 0,01 + 0,06 + 0,03 = 0,1. (c) F (1,1) = P( X 1, Y 1) = = f (0,0) f (0,1) f (1,0) f (1,1) = = 0,5 + 0,05 + 0,2 + 0,1 = 0,85. ZMIENNE CIĄGŁE Zmienna losowa ( X , Y ) jest dwuwymiarową ciągłą zmienną losową, jeśli jej łączny rozkład prawdopodobieństwa określony jest przez funkcję gęstości łącznej ( łączną gęstość prawdopodobieństwa ), taką że (i) f ( x, y) 0 (ii) f ( x, y )dxdy 1 (iii) P(( X , Y ) A) f ( x, y )dxdy A W szczególności dla A (, x] (, y] : x y F ( x, y ) = P( X x, Y y ) f ( s, t )dtds . 2 f ( x, y ) F ( x, y ) , x , y . xy Przykład. Zmienna losowa ( X , Y ) ma ( łączną ) gęstość prawdopodobieństwa x y f ( x, y ) gdy 0 0 x 1,0 y 1 przeciwnie Obliczyć 0, 5 1 P( X 0,5, Y 0,25) = ( x y )dydx = 0 0, 25 0, 5 2 1 ( xy y / 2 ) 0, 25 dx = 0 0,5 ( x 0,5 0,25x 0,625 / 2)dx = 0 . 0,5 x2 0 , 75 0 , 1775 x 0,09375 0,08875 0,005. 2 0 ROZKŁADY BRZEGOWE Niech ( X , Y ) będzie dwuwymiarową zmienną losową o rozkładzie prawdopodobieństwa określonym przez funkcję f ( x, y) (= funkcja prawdopodobieństwa lub gęstość ). Rozkład brzegowy = rozkład prawdopodobieństwa zmiennej losowej X lub zmiennej losowej Y. (a) dla dyskretnych zmiennych X, Y , brzegowe funkcje prawdopodobieństwa są postaci f X ( x ) P ( X x ) f ( x, y ) y fY ( y ) P(Y y ) f ( x, y ) x (b) dla ciągłych zmiennych X, Y , brzegowe gęstości są postaci f X ( x) f ( x, y )dy fY ( y ) f ( x, y )dx . D. (a) f X (x) P( X x) P( X x, Y y}) = y P ( X x, Y y ) f ( x, y ) . y (b) y FX ( x) P( X x) = P( X x, Y ) = x f ( s, t )dtds . Stąd d f X (x) FX (x) = f ( x, t ) dt . dx Przykład. Dwuwymiarowa zmienna losowa ( X , Y ) ma gęstość 3( x y ) 2 / 8 f ( x, y ) 0 1 x 1,1 y 1 gdy przeciwnie Znaleźć gęstość zmiennej losowej X. Niech 1 x 1 . 31 f X ( x) f ( x, y )dy = ( x y ) 2 dy 8 1 31 2 2 ( x 2 xy y )dy = 8 1 1 3 2 1 3 2 = x . [ x y xy 2 y 3 / 3] 4 4 1 8 (3x 2 1) / 4 gdy f X ( x) 0 1 x 1 . przeciwnie Gęstość zmiennej losowej Y ma identyczną postać. ROZKŁADY WARUNKOWE (a) Niech ( X , Y ) będzie dyskretną zmienną losową mającą funkcję prawdopodobieństwa f ( x, y) . Niech y – ustalone oraz fY ( y ) 0 . Rozkład warunkowy zmiennej losowej X pod warunkiem, że Y = y określa warunkowa funkcja prawdopodobieństwa: f ( x y) = f ( x y) = f ( x, y ) , x – dowolna wartość zmiennej X. fY ( y ) P ( X x, Y y ) P( X x Y y ) = P (Y y ) funkcja prawdopodobieństwa WARUNKOWEGO zmiennej X pod warunkiem, że zmienna Y przyjęła wartość y. Analogicznie: f ( y x) = Notacja: f ( x, y ) = P(Y y X x) , gdzie f X ( x) 0 . f X ( x) f ( x y) f X Y ( x y) f ( y x) fY X ( y x) (b) Niech ( X , Y ) będzie ciągłą zmienną losową o łącznej gęstości f ( x, y) . Niech y – ustalone oraz fY ( y ) 0 . Warunkową gęstością prawdopodobieństwa zmiennej losowej X pod warunkiem, że Y y nazywamy funkcję f ( x y) = f ( x, y ) , x . fY ( y ) Przykład. (kontynuacja) 1 x 1,1 y 1 3( x y ) 2 / 8 gdy f ( x, y ) przeciwnie 0 1 y 1 (3 y 2 1) / 4 fY ( y ) gdy przeciwnie 0 Niech 1 y 1 - ustalone. 3( x y ) 2 3( x y ) 2 / 8 f ( x y) = = dla x [1,1] 2 2 6y 2 (3 y 1) / 4 f ( x y ) = 0 dla x [1,1]. Uwaga. Analogicznie określamy rozkład warunkowy zmiennej losowej Y pod warunkiem X = x. Zatem f ( y x) = f ( x, y ) , gdzie y – dowolna wartość Y, f X ( x) x - ustalone, takie że f X ( x) 0 . Notacja: f ( y x) fY X ( y x) , f ( x y) f X Y ( x y) Przykład. (kontynuacja) (a) Znaleźć rozkład brzegowy zmiennej Y, liczby punktów uzyskanych w II etapie teleturnieju przez losowo wybranego uczestnika. (b) Wyznaczyć rozkład warunkowy Y pod warunkiem, że w I etapie uzyskano 2 punkty, tzn. X = 2. Y X 0 1 2 0,5 0,05 0,01 0,2 0,1 0,06 0 1 0,02 0,03 0,03 2 (a) fY ( y ) = f (0, y) f (1, y) f (2, y) . Stąd Y fY ( y ) (b) f ( y 2) = 0 0,72 1 0,18 2 0,1 f ( 2, y ) = ? f X ( 2) f (0 2) = fY X (0 2) = f (2,0) / f X (2) = = 0,02/(0,02 + 0,03 + 0,03) =1/4, f (1 2) = fY X (1 2) = f (2,1) / f X (2) = = 0,03/0,08 = 3/8, f (2 2) = fY X (2 2) = f (2,2) / f X (2) = = 0,03/0,08 = 3/8. Niezależne zmienne losowe Definicja. Niech ( X , Y ) będzie dwuwymiarową zmienna losową o dystrybuancie F ( x, y ) oraz dystrybuantach brzegowych FX (x), FY ( y ) , x, y (, ) . Zmienne losowe X, Y są niezależne, jeśli F ( x, y ) FX ( x) FY ( y ) , dla wszystkich wartości x, y. Twierdzenie. Zmienne losowe X, Y są niezależne wtedy i tylko wtedy gdy f ( x, y ) f X ( x ) f Y ( y ) , dla wszystkich wartości x, y. Wniosek. Poniższe warunki są równoważne: (i) Zmienne losowe X, Y są niezależne. (ii) f ( x y ) f X ( x) , x , dla wszystkich y, takich że fY ( y ) 0 . (iii) f ( y x) fY ( y ) , y , dla wszystkich x, takich że f X ( x) 0 . Przykład. ( kontynuacja ) Czy liczby punktów uzyskane w I i II etapie teleturnieju przez losowo wybranego uczestnika są niezależnymi zmiennymi losowymi ? y 0 1 2 f X (x ) x 0 0,5 0,05 0,01 0,56 1 0,2 0,1 0,06 0,36 2 0,02 0,03 0,03 0,08 fY ( y ) 0,72 0,18 0,1 f X (0) f (0,0) f (0,1) f (0,2) = 0,5 + 0,05 + + 0,01 = 0,56. fY (0) f (0,0) f (1,0) f (2,0) = 0,5 + 0,2 + 0,02 = 0,72. Stąd f (0,0) 0,5 0,56 0,72 f X (0) fY (0) , Zmienne losowe X , Y są zależne. Przykład. ( kontynuacja ). Czy X, Y są niezależnymi zmiennymi losowymi, jeśli ich łączna gęstość ma postać: 3( x y ) 2 / 8 f ( x, y ) 0 gdy 1 x 1,1 y 1 przeciwnie Dla ( x, y) [1,1] [1,1] : f X ( x) (3x 2 1) / 4 oraz fY ( y) (3 y 2 1) / 4 . f ( x, y ) f X ( x ) f Y ( y ) . Stąd X, Y są zależnymi zmiennymi losowymi. Przykład. Czasy poprawnej pracy dwu podzespołów są niezależnymi zmiennymi losowymi X, Y o rozkładach wykładniczych z parametrami 1 , 2 , odpowiednio. Średnie czasy pracy podzespołów wynoszą 1000 (godzin ) i 1200 ( godzin ). Obliczyć prawdopodobieństwo zdarzenia takiego, że każdy podzespół nie ulegnie awarii przed upływem 1500 godzin. E ( X ) 1 / 1 1000 (godz.), E (Y ) 1 / 2 1200 (godz.) Stąd 1 1 / 1000 (1/godz.) 2 1 / 1200 (1/godz.). P( X 1500, Y 1500) = P( X 1500) P(Y 1500) = e 11500 e 2 1500 = e 1500 / 1000 e 1500 / 1200 = = 0,2231 0,2865 = 0,0639. Wartość oczekiwana. Kowariancja. E[ g ( X , Y )] = g ( x, y) f ( x, y) , x y gdy X, Y są dyskretne, E[ g ( X , Y )] = g ( x, y ) f ( x, y )dxdy , gdy X, Y są ciągłe. Uwaga. Dla g ( X , Y ) X lub g ( X , Y ) Y otrzymujemy wartości oczekiwane brzegowych zmiennych losowych X lub Y, gdyż (a) w przypadku dyskretnym E (X ) = xf ( x, y ) = x f ( x, y ) = xf X ( x) X . x y x x y E (Y ) = yf ( x, y) = y f ( x, y ) = yfY ( y ) Y x y y x y (b) w przypadku ciągłym E (X ) = xf ( x, y )dxdy = x f ( x, y )dy dx = xf X ( x)dx X . Analogicznie otrzymujemy E (Y ) yf ( x, y )dxdy yfY ( y )dy = Y . Stwierdzenie. Niech c będzie dowolną stałą, a g ( X , Y ) , g1 ( X , Y ) , g 2 ( X , Y ) zmiennymi losowymi jednowymiarowymi. Wówczas E[cg ( X , Y ) cE[ g ( X , Y )] , E[ g1 ( X , Y ) g 2 ( X , Y )] E[ g1 ( X , Y )] E[ g 2 ( X , Y )] . Stwierdzenie. Jeśli zmienne losowe X, Y są niezależne, to E ( XY ) E ( X ) E (Y ) . D. Niezależność zmiennych jest równoważna f ( x, y ) f X ( x) fY ( y ) . Stąd i z definicji wartości oczekiwanej mamy (a) (zmienne dyskretne ) E[ g ( X , Y )] = g ( x, y) f ( x, y) . x y E ( XY ) = xyf ( x, y ) = xyf X ( x) fY ( y ) = x y x y xf X ( x) yfY ( y ) = yfY ( y ) xf X ( x) = x y y x E (Y ) E ( X ) E ( X ) E (Y ) . (b) (zmienne ciągłe) Dowód analogiczny - Sumowanie należy zastąpić całkowaniem. Definicja. Niech X i Y będą zmiennymi losowymi o łącznej funkcji prawdopodobieństwa ( gęstości ) f ( x, y) . Kowariancją zmiennych X i Y nazywamy liczbę: XY E[( X X )(Y Y )]. Uwaga. Z definicji XY oraz E[ g ( X , Y )] , przyjmując g ( x, y ) ( x X )( y Y ) , otrzymujemy wzory: XY ( x X )( y Y ) f ( x, y) , x y gdy X, Y są dyskretne XY ( x X )( y Y ) f ( x, y )dxdy , gdy X, Y są ciągłe. Notacja: Zamiast XY często piszemy Cov (X,Y). Interpretacja. Kowariancja określa pewną współzależność między zmiennymi losowymi: (a) Jeśli „dużym” wartościom zmiennej X przewyższającym X towarzyszą zwykle „duże” wartości zmiennej Y przewyższające Y , a wartościom X mniejszym od X towarzyszą zwykle wartości Y mniejsze od Y , to XY > 0. (b) Jeśli wartościom zmiennej X większym od X towarzyszą zwykle wartości Y mniejsze od Y wartościom X mniejszym od X towarzyszą zwykle wartości Y większe od Y , to XY < 0. Stwierdzenie. Cov(X,Y) = E ( XY ) X Y . D. Cov(X,Y) = E[( X X )(Y Y )] = = E ( XY XY Y X X Y ) = = E ( XY ) E ( XY ) E (Y X ) X Y = = E ( XY ) X Y . Notacja: Zamiast XY często piszemy Cov (X,Y). Twierdzenie. Jeśli zmienne losowe X i Y są niezależne, to Cov(X,Y) = 0. D. Dla niezależnych zmiennych losowych E ( XY ) E ( X ) E (Y ) . Stąd oraz wzoru na kowariancję mamy: Cov(X,Y) = E ( XY ) X Y = = E ( X ) E (Y ) X Y = 0. Uwaga. Twierdzenie odwrotne nie jest na ogół prawdziwe. Twierdzenie. Dla dowolnych stałych a, b Var( aX bY ) = a 2 Var(X) + b 2 Var(Y) + 2 ab Cov(X,Y). D. E{ (aX bY ) (a X bY )2 } = E{ a( X X ) b(Y Y )2 } = E{ a( X X ))2 } + E 2ab( X X )(Y Y ) + E{ b(Y Y )2 } = = a 2 Var(X) + 2abCov(X,Y) + b 2 Var(Y). c.k.d. Wniosek. Jeśli zmienne losowe X i Y są niezależne, to Var( aX bY ) = a 2 Var(X) + b 2 Var(Y). Definicja. Współczynnikiem korelacji między zmiennymi losowymi X i Y nazywamy liczbę: Cov( X , Y ) . Var ( X ) Var (Y ) Zadanie. Zmienna losowa ( X , Y ) ma rozkład ciągły o gęstości 0 x y 1 Cy f ( x, y ) dla . przeciwnie 0 a) Wyznaczyć stałą C. b) Obliczyć kowariancję pomiędzy zmiennymi X, Y. c) Czy zmienne losowe X, Y są niezależne ? 1 1 1 0 x 0 2 a) f ( x, y )dxdy = dx Cydy = C y / 2 1 1 x dx = 1 x2 = C dx = C ( 1/2 - 1/6 ) = 1. Stąd C = 3. 2 0 2 1 1 0 x b) E ( X ) xf ( x, y )dxdy = xdx 3 ydy = x2 x4 1 x x3 = 3 x y / 2 dx = 3 dx = 3 = x 2 8 0 0 2 0 4 1 2 1 1 = 3/8 1 1 0 x E (Y ) = yf ( x, y )dxdy = dx 3 y 2 dy = 11 x3 = 3 dx = 3 03 x4 1 x = 1 – 1/4 = 3/4 4 0 1 1 0 x E ( XY ) = xyf ( x, y )dxdy = xdx 3 y 2 dy = 1 xdx = 3 x(1 x )dx = 3( x =3 x y 0 3 1 1 3 2 0 1 / 2 x 5 / 5) = 0 = 0,9 Cov(X,Y) = 0,9 – (3/8)(3/4) = 99/160. (c) Cov(X,Y) 0, więc zmienne nie są niezależne, tzn. są zależne. Przykład (kontynuacja ) y 0 1 ? 2 f X (x ) x 0 0,5 0,05 0,01 0,56 1 0,2 0,1 0,06 0,36 2 0,02 0,03 0,03 0,08 fY ( y ) 0,72 0,18 0,1 E (X ) = x f ( x, y ) = 0 0,56 + 1 0,36 + 2 0,08 = x y 0,52. E (Y ) = y f ( x, y ) = 0 72 + 1 0,18 + 2 0,1 = x y 0,38. E ( XY ) = xyf ( x, y ) = 0 + 0 + 0 + 0 + 1 1 0,1 + x y + 1 2 0,06 + 2 1 0,03 + 2 2 0,03 = 0,4 Cov(X,Y) = 0,4 – 0,52 0,38 = 0,2024. E ( X 2 ) 12 0,36 + 2 2 0,08 = 0,68. E (Y 2 ) 12 0,18 + 2 2 0,1 = 0,58. Var(X) = E ( X 2 ) [ E ( X )]2 = 0,68 0,52 2 = 0,4096. Var(Y) = E (Y 2 ) [ E (Y )]2 = 0,58 0,38 2 0,4356. 0,2024 0,4096 0,4356 0,47916. Własności współczynnika korelacji (i) (ii) 1 1 Jeśli a i b są stałymi, oraz jeśli Y = a + bX, to 1 gdy 1 b0 b0 (iii) Jeśli 1, to między zmiennymi losowymi X, Y istnieje liniowa zależność funkcyjna. (iv) Jeśli zmienne losowe X i Y są niezależne, to 0. Interpretacja. Współczynnik korelacji jest miarą zależności liniowej między zmiennymi losowymi. Dwuwymiarowy rozkład normalny Zmienna losowa ( X , Y ) ma dwuwymiarowy rozkład normalny, jeśli ma gęstość postaci: f ( x, y ) 1 q ( x , y ) exp , 2 2 X Y 2(1 ) 1 gdzie q ( x, y ) ( x X )2 X2 2 ( x X )( y Y ) XY ( y Y ) 2 y2 x , y , stałe X , Y , spełniają warunki X > 0, Y > 0, 1 1. Notacja: ( X , Y ) ~ N ( X , Y , X , Y , ) Twierdzenie. Jeśli ( X , Y ) ~ N ( X , Y , X , Y , ) , to (i) X ~ N ( X , X ) , Y ~ N ( Y , Y ) . , (ii) Cov(X,Y) = . (iii) X, Y są niezależne wtedy i tylko wtedy gdy = 0. Twierdzenie. Zmienna losowa (X,Y) ma dwuwymiarowy rozkład normalny wtedy i tylko wtedy gdy zmienna losowa aX + bY ma rozkład normalny, a, b są dowolnymi stałymi. Zadanie. Niech zmienna losowa X oznacza dzienną wartość sprzedaży ( w 100 zł. ) dyskietek a zmienna losowa Y dzienną wartość sprzedaży papieru kserograficznego ( w 100 zł.). Wiadomo, że dwuwymiarowa zmienna losowa ( X , Y ) ma rozkład normalny o parametrach: X 5 , Y 6 , X 0,5 , Y 0,2 0,1. (a) Obliczyć średnią łączną wartość sprzedaży w ciągu 10 dni, jeśli wartości sprzedaży obu artykułów w kolejnych dniach są niezależnymi zmiennymi losowymi o rozkładach takich jak rozkład zmiennej ( X , Y ) . (b) Obliczyć prawdopodobieństwo, że łączna wartość sprzedaży w ciągu 10 dni przekroczy 10000 zł. (a) Łączna wartość sprzedaży: S10 ( X1 Y1 ) ... ( X10 Y10 ) . E(S10 ) 10 [ E ( X ) E(Y )] 10(5 6) 110(100 zł.) Średnia łączna wartość sprzedaży to 11000 zł. Var( S10 ) = 10 Var(X +Y) = 10 [Var(X) + Var(Y) + 2Cov(X,Y)] = 10( 0,52 0,22 2 0,1 0,5 0,2) = = 30 (100 2 zł. ). (b) S10 ~ N (110, 30) . Zatem po standaryzacji S10 110 ~ N (0,1) , skąd 30 S10 110 100 110 P = P( S10 100) = 30 30 P( Z 1,8257) = 1 (1,8257) = 1 –[ 1 (1,8257) ] = (1,8257) = 0,966. CIĄGI ZMIENNYCH LOSOWYCH Niech X1, X 2 ,..., X n będą zmiennymi losowymi określonymi na tej samej przestrzni zdarzeń elementarnych S . F ( x1, x2 ,..., xn ) = P( X1 x1, X 2 x2 ,..., X n xn ) = dystrybuanta wektora losowego ( X1, X 2 ,..., X n ). f ( x1, x2 ,..., xn ) = funkcja prawdopodobieństwa łącznego lub funkcja gęstości łącznej wektora losowego ( X1, X 2 ,..., X n ). Definicja. Zmienne losowe X1, X 2 ,..., X n są niezależne, jeśli F ( x1, x2 ,..., xn ) = FX 1 ( x1 ) FX 2 ( x2 ) ... FX n ( xn ) , gdzie FX i ( x i ) P( X i xi ) , i = 1,2,...,n. Definicja. E[ g ( X1, X 2 , , , , X n )] = ... g ( x1 , x2 ,..., xn ) f ( x1 , x2 ,..., xn ) , x1 x 2 lub xn ... g ( x1 , x2 ,..., x n ) f ( x1 , x2 ,..., xn )dx1dx2 ...dxn . Stwierdzenie. E (a1 X1 a2 X 2 ... an X n ) = a1E ( X1 ) a2 E ( X 2 ) ... an E ( X n ) . 1 n Wniosek. Niech X X i , E ( X i ) , i = 1,2,..,n. n i 1 E( X ) = . 1 D. W stwierdzeniu trzeba przyjąć ai , i = 1,2,..,n. n Stwierdzenie. Jeśli X1, X 2 ,..., X n są niezależnymi zmiennymi losowymi, to Var (a1 X1 a2 X 2 ... an X n ) = a12 Var( X 1 ) + a2 2 Var( X 2 ) + ... + a n 2 Var( X n ). 1 W szczególności, jeśli Var( X i ) = 2 oraz ai , n i = 1,2,..,n, to 2 Var( X ) = . n Przykład. Dokonujemy n jednakowych, niezależnych doświadczeń Bernoulli’ego o prawdopodobieństwie sukcesu p, 0 p 1. Znaleźć wartość oczekiwaną i wariancję zmiennej losowej Y będącej liczbą sukcesów. Niech X i 1, gdy sukces w i-tym doświadczeniu, X i 0, gdy porażka w i-tym doświadczeniu. Wówczas X1, X 2 ,..., X n są niezależnymi zmiennymi losowymi o funkcjach prawdopodobieństwa: f X i (1) p , f X i (0) 1 p . Stąd: E ( X i ) p , Var( X i ) = p(1 p) . Liczba sukcesów = Y X1 X 2 ... X n . E (Y ) = E ( X1 X 2 ... X n ) = E ( X1 ) E ( X 2 ) ... E ( X n ) = np . Var(Y) = Var( X 1 ) + Var( X 2 ) + ... + Var( X n ) = np(1 p) Definicja. Prostą próbą losową o liczności n nazywamy ciąg niezależnych zmiennych losowych X1, X 2 ,..., X n określonych na przestrzeni zdarzeń elementarnych S i takich, że każda ze zmiennych ma taki sam rozkład. Twierdzenie. ( CENTRALNE TWIERDZENIE GRANICZNE) Niech X1, X 2 ,..., X n będzie prostą próbą losową z rozkładu o średniej i wariancji 2 . Wówczas dla dużych liczności próby n rozkład prawdopodobieństwa standaryzowanej średniej ( = standaryzowanej sumy X1 X 2 ... X n ) jest bliski standardowemu rozkładowi normalnemu N (0,1) , dokładniej X b) P(a Z b) (b) (a), / n przy n . Równoważnie rozkład średniej X jest bliski rozkładowi normalnemu N ( , / n ) . P(a Przykład. Załóżmy, że rozkład codziennego dojazdu do pracy jest w przybliżeniu rozkładem jednostajnym na przedziale [0,5 godz., 1 godz. ] i że czasy dojazdów w różne dni są niezależne. Obliczyć przybliżone prawdopodobieństwo zdarzenia, że średni dzienny dojazd w ciągu 30 dni przekroczy 0,8 godz. Niech X i oznacza czas dojazdu w i-tym dniu , i 1,2,...,30 . 0,5 1 3 , 2 4 (1 0,5) 2 1 2 Var ( X i ) . 12 48 E( X i ) 3 1 / 48 = 0,00069. E ( X ) , Var ( X ) 4 30 P ( X 0,8) = P( X 3/ 4 0,8 3 / 4 ) 1 /(30 48) 1 /(30 48) P( Z 1,89) 0,03.