Wykład 3 Jednowymiarowe zmienne losowe Niech (Ω, F, P ) b˛edzie ustalona˛ przestrzenia˛ probabilistyczna.˛ Definicja 1 Jednowymiarowa˛ zmienna˛ losowa˛ (o wartościach rzeczywistych), określona˛ na przestrzeni probabilistycznej (Ω, F, P ) nazywamy funkcj˛e X : Ω → R taka,˛ że dla każdego x ∈ R X −1 ((−∞; x)) = {ω ∈ Ω : X(ω) < x} ∈ F. Przykład 1. Rzucamy jeden raz symetryczna˛ kostka.˛ Jeśli wypadnie ”6” otrzymujemy 90zł; jeśli wypadnie nieparzysta liczba oczek otrzymujemy 10zł; w pozostałych przypadkach nie otrzymujemy nic. Wtedy Ω = {1, 2, 3, 4, 5, 6}. Niech X oznacza wygrana˛ w tej grze. Wtedy X jest zmienna˛ losowa˛ określona˛ w nast˛epujacy ˛ sposób: 10 , ω ∈ {1, 3, 5} 90 , ω = 6 X(ω) = . 0 , ω ∈ {2, 4} X jest przykładem zmiennej losowej o rozkładzie dyskretnym. Przykład 2. Rozważmy czas oczekiwania na autobus majacy ˛ przyjechać w ciagu ˛ godziny. Można przyjać, ˛ że Ω = [0; 1]. Wtedy, jeśli X oznacza czas oczekiwania, to X(ω) = ω. W tym przypadku X jest przykładem zmiennej losowej o rozkładzie ciagłym. ˛ 1. Zmienna losowa o rozkładzie dyskretnym Rozkład prawdopodobieństwa zmiennej losowej określa zakres jej wartości oraz prawdopodobieństwa, z jakimi te wartości sa˛ przyjmowane. Oznaczenie: P (X = x) = P ({ω : X(ω) = x}) - prawdopodobieństwo, że zmienna losowa X przyjmie wartość x. Definicja 2 Zmienna losowa X ma rozkład dyskretny (skokowy), jeśli istnieje przeliczalny podzbiór SX ⊂ R, zwany zbiorem punktów skokowych, taki, że 1. P (X = xi ) > 0 dla każdego xi ∈ SX ; � 2. P (X = xi ) = 1. xi ∈SX Definicja 3 Niech X b˛edzie zmienna˛ losowa˛ o rozkładzie dyskretnym. Jeśli dla każdego xi ∈ SX znajdziemy P (X = xi ), to otrzymamy funkcj˛e prawdopodobieństwa zmiennej losowej X. Uwaga. Funkcja prawdopodobieństwa zmiennej losowej dyskretnej X jednoznacznie wyznacza jej rozkład. 2. Dystrybuanta zmiennej losowej W praktyce cz˛esto interesuja˛ nas P (X � x) dla dowolnego x ∈ R. Prawdopodobieństwa takie można wyznaczać za pomoca˛ dystrybuanty. Definicja 4 Dystrybuanta˛ jednowymiarowej zmiennej losowej X : Ω → R nazywamy funkcj˛e FX : R → R określona˛ wzorem FX (x) = P (X � x) = P (X −1 (−∞, x]). Twierdzenie 1 Rozkład zmiennej losowej X jest jednoznacznie wyznaczony przez jej dystrybuant˛e. Wniosek. Jeśli dwie zmienne losowe maja˛ te same dystrybuanty, to maja˛ ten sam rozkład. Własności dystrybuanty Twierdzenie 2 Funkcja F : R → R jest dystrybuanta˛ jednowymiarowej zmiennej losowej wtedy i tylko wtedy, gdy 1. lim F (x) = 0 , lim F (x) = 1; x→−∞ x→+∞ 2. F jest funkcja˛ niemalejac ˛ a˛ (x1 < x2 → F (x1 ) � F (x2 )); 3. F jest funkcja˛ co najmniej prawostronnie ciagł ˛ a.˛ Przy pomocy dystrybuanty można wyznaczyć prawdopodobieństwa zdarzeń polegajacych ˛ na tym, że zmienna losowa przyjmie wartość z ustalonego przedziału. Uwaga. Niech a, b ∈ R i niech a < b. Wtedy: 1. P (X � a) = FX (a); 2. P (X = a) = FX (a) − lim− FX (x); x→a 3. P (X � a) = 1 − lim FX (x); x→a− 4. P (a � X < b) = lim− FX (x) − lim− FX (x); x→b x→a 5. P (a < X � b) = FX (b) − FX (a); 6. P (a < X < b) = lim FX (x) − FX (a); x→b− 7. P (a � X � b) = FX (b) − limx→a− FX (x); 8. P (X < a) = limx→a− FX (x). 2.1 Dystrybuanta zmiennej losowej o rozkładzie dyskretnym Twierdzenie 3 Jeśli X ma rozkład dyskretny, to FX (x) = � P (X = xi ). xi �x Uwaga. Aby wyznaczyć rozkład zmiennej losowej o rozkładzie dyskretnym trzeba: albo znaleźć funkcj˛e prawdopodobieństwa albo dystrybuant˛e. 2. Zmienna losowa o rozkładzie ciagłym ˛ Definicja 5 Zmienna losowa X o dystrybuancie FX ma rozkład ciagły ˛ (jest typu ciagłego), ˛ jeżeli istnieje funkcja fX : R → R taka, że �x FX (x) = fX (t)dt. −∞ Funkcj˛e fX nazywamy wtedy g˛estościa˛ rozkładu zmiennej losowej X. Wnioski. Jeśli X ma rozkład ciagły, ˛ to: 1. FX jest funkcja˛ ciagł ˛ a˛ w zbiorze R. � 2. FX (x) = f (x) w każdym punkcie ciagłości ˛ x funkcji fX . Twierdzenie 4 Funkcja f : R → R jest g˛estościa˛ jednowymiarowej zmiennej losowej wtedy i tylko wtedy, gdy 1. f (x) � 0 prawie wsz˛edzie; +∞ � 2. f (x)dx = 1. −∞ Uwaga. Jeśli X ma rozkład ciagły, ˛ to P (X = a) = 0 dla każdego a ∈ R. Uwaga. Jeśli X ma rozkład ciagły, ˛ to dla dowolnych a, b ∈ R takich, że a < b P (a � X < b) = P (a < X � b) = P (a < X < b) = P (a � X � b). Uwaga. Rozkład zmiennej losowej typu ciagłego ˛ jest jednoznacznie wyznaczony przez funkcj˛e g˛estości. Wyznaczanie prawdopodobieństwa za pomoca˛ g˛estości Jeśli X ma rozkład ciagły, ˛ to dla dowolnych a, b ∈ R takich, że a < b: � b 1. P (X < b) = P (X � b) = fX (x)dx; −∞ 2. P (X > a) = P (X � a) = � ∞ fX (x)dx; a 3. P (a � X < b) = P (a < X � b) = P (a < X < b) = P (a � X � b) = � b fX (x)dx. a Uwaga. Aby wyznaczyć rozkład zmiennej losowej o rozkładzie ciagłym ˛ trzeba: albo znaleźć funkcj˛e g˛estości albo dystrybuant˛e. Wykład 4 Charakterystyki liczbowe jednowymiarowych zmiennych losowych 1. Wartość oczekiwana Wartość oczekiwana jest wskaźnikiem położenia zmiennej losowej. Wskazuje ona średnia˛ wartość zmiennej losowej. 1.1 Wartość oczekiwana zmiennej losowej o rozkładzie dyskretnym Definicja 1 Niech X b˛edzie zmienna˛ losowa˛ o rozkładzie dyskretnym ze zbiorem punktów skokowych SX . Wtedy, jeśli � |xi | · P (X = xi ) < ∞, xi ∈SX to wartościa˛ oczekiwana˛ zmiennej losowej X nazywamy liczb˛e � EX = xi · P (X = xi ). xi ∈SX W przeciwnym przypadku mówimy, że wartość oczekiwana nie istnieje. Definicja 2 Niech X b˛edzie zmienna˛ o rozkładzie dyskretnym i niech g : R → R b˛edzie funkcja˛ taka,˛ że g(X) też jest zmienna˛ losowa.˛ Wtedy, jeśli � |g(xi )| · P (X = xi ) < ∞, xi ∈SX to E(g(X)) = � g(xi ) · P (X = xi ). xi ∈SX 1.2 Wartość oczekiwana zmiennej losowej o rozkładzie ciagłym ˛ Definicja 3 Niech X b˛edzie zmienna˛ losowa˛ o rozkładzie ciagłym ˛ z funkcja˛ g˛estości fX . Wtedy, jeśli � ∞ |x| · fX (x) dx < ∞, −∞ to wartościa˛ oczekiwana˛ zmiennej losowej X nazywamy liczb˛e � ∞ EX = x · fX (x) dx. −∞ W przeciwnym przypadku mówimy, że wartość oczekiwana nie istnieje. Przykład 1. Niech czas oczekiwania (w godzinach) na autobus b˛edzie zmienna˛ losowa˛ X o rozkładzie ciagłym ˛ z funkcja˛ g˛estości � 1 , x ∈ [0; 1] fX (x) = . 0 , x∈ / [0; 1] Jeśli pytamy o to, jaki b˛edzie średni czas oczekiwania, to musimy obliczyć � 1 1 EX = x · 1 dx = . 2 0 To oznacza, że średnio na utobus b˛edziemy czekać pół godziny. Definicja 4 Niech X b˛edzie zmienna˛ o rozkładzie ciagłym ˛ i niech g : R → R b˛edzie funkcja˛ taka,˛ że g(X) też jest zmienna˛ losowa.˛ Wtedy, jeśli � ∞ to −∞ |g(x)| · fX (x) dx < ∞, E(g(X)) = � ∞ −∞ 1 g(x) · fX (x) dx. 1.3 Własności wartości oczekiwanej Niech X i Y b˛eda˛ zmiennymi losowymi, dla których istnieja˛ EX i EY . Wtedy: 1. E(b) = b dla każdego b ∈ R; 2. E(a · X) = a · EX dla każdego a ∈ R; 3. E(X + Y ) = EX + EY ; 4. Jeśli X � 0, to EX � 0. 5. Z własności 3 wynika, że dla skończonej liczby zmiennych losowych X1 , . . . , Xn zachodzi równość E(X1 + · · · + Xn ) = EX1 + · · · + EXn . 2. Wariancja i odchylenie standardowe Wariancja jest wskaźnikiem rozproszenia wartości zmiennej losowej wokół jej wartości oczekiwanej (wskazuje, jak bardzo wartości zmiennej losowej odbiegaja˛ od wartości średniej). Definicja 5 Jeśli istnieje E(X 2 ), to wariancja˛ zmiennej losowej X nazywamy liczb˛e Liczb˛e σX = √ V X = E(X − EX)2 . V X nazywamy odchyleniem standardowym zmiennej losowej X. Twierdzenie 1 Jeśli istnieje E(X 2 ), to V X = E(X 2 ) − (EX)2 . Dowód VX = E(X − EX)2 = E(X 2 − 2X · EX + (EX)2 ) = E(X 2 ) − 2E(X · EX) + E((EX)2 ) = E(X 2 ) − 2EX · EX + (EX)2 = E(X 2 ) − (EX)2 . � Przykład 2. Dla zmiennej losowej z przykładu 1 mamy: E(X 2 ) = � 1 0 x2 · 1 dx = co oznacza, że V X = E(X 2 ) − (EX)2 = 2.1 Własności wariancji Jeśli X jest zmienna˛ losowa,˛ dla której istnieje V X, to 1. V X � 0; 2. V (aX + b) = a2 · V X dla wszystkich a, b ∈ R. 2 1 − 3 1 , 3 � �2 1 1 = . 2 12 Wykład czwarty Przeglad ˛ rozkładów jednowymiarowych 1. Rozkłady dyskretne 1. Rozkład jednopunktowy: Zmienna losowa X ma rozkład jednopunktowy skupiony w punkcie x0 , jeśli SX = {x0 } oraz P (X = x0 ) = 1. Jest to najprostszy rozkład prawdopodobieństwa. Dystrybuanta tego rozkładu ma postać � 0 , x � x0 F (x) = . 1 , x > x0 Uwaga. Jeśli X = a, gdzie a ∈ R, to X ma rozkład jednopunktowy skupiony w punkcie a. Zatem każda˛ stała˛ można traktować jako zmienna˛ losowa˛ o rozkładzie jednopunktowym. Jeśli X ma rozkład jednopunktowy skupiony w punkcie x0 , to EX = x0 , V X = 0. 2. Rozkład zero-jedynkowy: X ma rozkład zero-jedynkowy, jeśli SX = {0, 1} oraz P (X = 0) = p ∈ (0; 1), P (X = 1) = 1 − p. Dystrybuanta tego rozkładu ma postać 0 , x<0 p , 0�x<1 . F (x) = 1 , x�1 Ponadto EX = 1 − p, V X = p(1 − p). � Przykład modelu: Rzucamy symetryczna˛ moneta.˛ Jeśli przyjmiemy, że � 0 , gdy wypadnie orzeł X= , 1 , gdy wypadnie reszka to funkcja prawdopodobieństwa rozkładu zmiennej losowej X b˛edzie postaci 1 P (X = 0) = P (X = 1) = . 2 To oznacza, że X ma rozkład zero-jedynkowy. 3. Rozkład Bernoulliego (dwumianowy): X ma rozkład Bernoulliego z parametrami n i p (X ∼ B(n, p)), gdzie p ∈ (0, 1) i n ∈ N, jeśli SX = {0, 1, . . . , n} oraz � � n k P (X = k) = p (1 − p)n−k . k Zmienna˛ losowa˛ o rozkładzie dwumianowym można interpretoważ jako liczb˛e sukcesów w n doświadczeniach Bernoulliego, jeśli prawdopodobieństwo sukcesu w jednym doświadczeniu wynosi p. Jeśli X ∼ B(n, p), to EX = np, V X = np(1 − p). 1 4. Rozkład geometryczny: X ma rozkład geometryczny z parametrem p ∈ (0, 1) (X ∼ g(p)), jeśli SX = N oraz P (X = k) = (1 − p)k−1 p. Uwaga. Zmienna˛ losowa˛ o rozkładzie geometrycznym można interpretować jako liczb˛e prób do pierwszego sukcesu w schemacie Bernoulliego. � Przykład modelu: � � 2 Rzucamy moneta˛ P (O) = . Niech X oznacza liczb˛e rzutów do momentu, aż pojawi si˛e po 5 raz pierwszy orzeł. Wtedy � �k−1 2 2 P (X = k) = 1 − , k = 1, 2, . . . , 5 5 2 to znaczy X ma rozkład geometryczny z parametrem p = . 5 Dla rozkładu geometrycznego spełniona jest własność "braku pami˛eci"(własność Markowa): Twierdzenie 1. Jeśli X ma rozkład geometryczny z parametrem p, to dla dowolnych n, m ∈ N P (X > n + m| X > n) = (1 − p)m = P (X > m). Dowód. P (X > n + m ∧ X > n) P (X > n + m) = = P (X > n) P (X > n) ∞ � p(1 − p)k−1 p(1 − p)n+m k=n+m+1 = = = (1 − p)m = P (X > m). ∞ n � p(1 − p) p(1 − p)k−1 P (X > n + m| X > n) = k=n+1 1 p Jeśli X ∼ g(p), to EX = , V X = . p 1 − p2 5. Rozkład Poissona: Zmienna losowa X ma rozkład Poissona z parametrem λ > 0 (X ∼ P (λ)), jeśli SX = N ∪ {0} oraz λk P (X = k) = e−λ . k! Wartości prawdopodobieństw dla rozkładu Poissona sa˛ stablicowane. Zmienna losowa o rozkładzie Poissona może być interpretowana jako liczba awarii systemu, liczba klientów zgłaszajacych ˛ si˛e do banku, liczba samochodów przejeżdżajacych ˛ przez określony punkt drogi w określonym przedziale czasowym, liczba czastek ˛ emitowanych przez substancj˛e radioaktywna˛ w ustalonych odst˛epach czasu. Rozkład Poissona ma zwiazek ˛ z rozkładem Bernoulliego: Dla dużych n � � n k λk p (1 − p)n−k � e−λ · , k k! gdzie λ = np. Przybliżenie to jest dla celów praktycznych wystarczajaco ˛ dokładne gdy n � 50, p � 0, 1. Jeśli X ∼ P (λ), to EX = V X = λ. 2. Rozkłady ciagłe ˛ 1. Rozkład jednostajny: Zmienna losowa X ma rozkład jednostajny na przedziale [a; b] (X ∼ U ([a; b])), jeśli jej funkcja g˛estości oraz dystrybuanta maja˛ postać � 1 0 , x�a x− a , x ∈< a ; b > , a<x�b . f (x) = , F (x) = b−a b − a 0 , x ∈< / a; b > 1 , x>b Zmienna˛ losowa˛ X o rozkładzie jednostajnym na przedziale [a; b] można interpretować jako wynik eksperymentu polegajacego ˛ na losowym i "jednostajnym"wyborze wartości z odcinka [a; b]. a+b (b − a)2 Jeśli X ∼ U ([a; b]), to EX = VX = . 2 12 2. Rozkład normalny (Gaussa): Zmienna losowa X ma rozkład normalny z parametrami m i σ 2 , gdzie m ∈ R oraz σ > 0 (X ∼ N (m, σ 2 )), jeśli jej funkcja g˛estości jest postaci � � 1 (x − m)2 f (x) = √ exp − . 2σ 2 2π · σ Szczególny przypadek: Standardowy rozkład normalny Rozkład N (0, 1) nazywany jest standardowym rozkładem normalnym. Jeśli X ∼ N (0, 1), to � 2� 1 x f (x) = √ exp − . 2 2π Dystrybuant˛e rozkładu normalnego N (0, 1) oznaczać b˛edziemy symbolem F(x): � � � x 1 1 2 F(x) = √ exp − t dt. 2 2π −∞ Wyznaczanie prawdopodobie/nstw dla zmiennych losowych o rozkładach N (m, σ 2 ): Dystrybuanta rozkładu normalnego N (0, 1) jest stablicowana. Za jej pomoca˛ można obliczyć wartości dystrybuanty dla dowolnej zmiennej losowej o rozkładzie N (m, σ 2 ): Jeśli X ∼ N (m, σ ), to FX (x) = F 2 W szczególności, jeśli X ∼ N (m, σ 2 ), to P (X < b) = P (X � b) = F � � x−m σ b−m σ � � . ; P (a < X < b) = P (a � X � b) = P (a < X � b) = P (a � X < b) = FX (b) − FX (a) � � � � b−m a−m = F −F . σ σ Cz˛esto korzysta si˛e z tablic funkcji Φ(x), gdzie Φ jest funkcja˛ Laplace’a. Definicja 1. Funkcja˛ Lapalce’a nazywamy funkcj˛e Φ taka,˛ że 1 Φ(x) = √ 2π df �x 0 � u2 exp − 2 � du. Twierdzenie 2. Funkcja Laplace’a ma nast˛epujace ˛ własności: (a) Φ(x) jest funkcja˛ nieparzysta; ˛ (b) Dla każdego x ∈ R F(x) = � 0, 5 + Φ(x) , x�0 . 0, 5 − Φ(−x) , x < 0 Twierdzenie 3. (Reguła trzech sigm) Jeśli X ∼ N (m, σ 2 ), to P (X ∈ / [m − 3σ, m + 3σ]) = 0, 0027. Dowód. Jeśli X ∼ N (m, σ 2 ), to P (|X − m| � 3σ) = P (X ∈ [m − 3σ , m + 3σ]) = FX (m + 3σ) − FX (m − 3σ) = = F(3) − F(−3) = 2 · Φ(3) = 2 · 0.49865 = 0.9973. Zatem P (X ∈ / [m − 3σ, m + 3σ]) = 1 − 0.9973 = 0, 0027. Z reguły trzech sigm wynika, że jeśli X ∼ N (m, σ 2 ), to szansa przyj˛ecia przez zmienna˛ losowa˛ X wartości poza przedziałem [m − 3σ, m + 3σ] jest bliska zeru. Jeśli X ∼ N (m, σ 2 ), to EX = m, V X = σ 2 . Wykład szósty Zmienne losowe dwuwymiarowe Definicja 1 Niech X i Y b˛eda˛ zmiennymi losowymi określonymi na przestrzeni probabilistycznej (Ω, F, P ). Funkcj˛e X = (X, Y ) : Ω → R2 nazywamy zmienna˛ losowa˛ dwuwymiarowa.˛ Rozkład łaczny ˛ zmiennej losowej - rozkład wektora (X, Y ). 1. Typy rozkładów zmiennych losowych dwuwymiarowych 1.1. Rozkład dyskretny Definicja 2 Dwuwymiarowa zmienna losowa (X, Y ) ma rozkład dyskretny, jeśli istnieje przeliczalny zbiór SXY ⊂ R2 taki, że 1. P (X = x, Y = y) > 0 dla każdego punktu (x, y) ∈ SXY ; � 2. P (X = x, Y = y) = 1. (x,y)∈SXY Wtedy SXY nazywamy zbiorem punktów skokowych rozkładu zmiennej losowej (X, Y ). Definicja 3 Jeśli (X, Y ) ma rozkład dyskretny i dla każdego punktu (x, y) ∈ SXY znajdziemy P (X = x, Y = y), to wyznaczymy funkcj˛e prawdopodobieństwa rozkładu zmiennej losowej (X, Y ). Twierdzenie 1 Funkcja prawdopodobieństwa dwuwymiarowej zmiennej losowej o rozkładzie dyskretnym jednoznacznie wyznacza jej rozkład. 1.2. Rozkład ciagły ˛ Definicja 4 Dwuwymiarowa zmienna losowa (X, Y ) ma rozkład ciagły, ˛ jeśli istnieje funkcja 2 fXY : R → R zwana g˛estościa˛ rozkładu zmiennej zmiennej losowej (X, Y ) taka że �x �y FXY (x, y) = fXY (u, t)du dt, −∞ −∞ gdzie FXY jest dystrybuanta˛ zmiennej losowej (X, Y ). Twierdzenie 2 Funkcja f : R2 → R jest g˛estościa˛ dwuwymiarowej zmiennej losowej wtedy i tylko wtedy, gdy 1. �∞ �∞ f (x, y)dx dy = 1; −∞ −∞ 2. f (x, y) � 0 prawie wsz˛edzie. Twierdzenie 3 Jeśli funkcja f : R2 → R jest g˛estościa˛ dwuwymiarowej zmiennej losowej (X, Y ), to: 1. ∂ 2 FXY (x, y) = f (x, y) prawie wsz˛edzie; ∂x∂y 2. Dla każdego A ∈ B(R2 ) zachodzi P ((X, Y ) ∈ A) = � � f (x, y)dx dy. A Twierdzenie 4 Funkcja g˛estości jednoznacznie wyznacza rozkład dwuwymiarowej zmiennej losowej o rozkładzie ciagłym. ˛ 1 2. Dystrybuanta zmiennej losowej dwuwymiarowej Definicja 5 Dystrybuanta˛ dwuwymiarowej zmiennej losowej (X, Y ) nazywamy funkcj˛e FXY : R2 → [0; 1] dana˛ wzorem FXY (x, y) = P (X � x, Y � y). Własności dystrybuanty dwuwymiarowej zmiennej losowej (X, Y ) Twierdzenie 5 Dla dowolnych x1 < x2 , y1 < y2 zachodzi równość P (x1 < X � x2 , y1 < Y � y2 ) = FXY (x2 , y2 ) − FXY (x1 , y2 ) − FXY (x2 , y1 ) + FXY (x1 , y1 ). Twierdzenie 6 Funkcja F : R2 → R jest dystrybuanta˛ dwuwymiarowej zmiennej losowej wtedy i tylko wtedy, gdy � � 1. lim F (x, y) = 0 , lim F (x, y) = 0 , lim F (x, y) = 1; y∈R x→−∞ x∈R y→−∞ x→+∞ y→+∞ 2. Funkcja F jest niemalejaca ˛ ze wzgl˛edu na każda˛ zmienna; ˛ 3. Funkcja F jest co najmniej prawostronnie ciagła ˛ ze wzgl˛edu na każda˛ zmienna; ˛ � � F (x2 , y2 ) − F (x1 , y2 ) − F (x2 , y1 ) + F (x1 , y1 ) � 0. 4. x1 <x2 y1 <y2 Twierdzenie 7 Dla dowolnych a, b ∈ R zachodzi równość P (X = a, Y = b) = FXY (a, b) + FXY (a− , b− ) − FXY (a− , b) − FXY (a, b− ). Uwaga. Dystrybuanta zmiennej losowej dwuwymiarowej jednoznacznie wyznacza jej rozkład łaczny. ˛ Jeśli znajdziemy osobno rozkład dla zmiennej losowej X i osobno rozkład dla Y , to otrzymamy rozkłady brzegowe. 3. Rozkłady brzegowe zmiennych losowych dwuwymiarowych 3.1. Dystrybuanty brzegowe Twierdzenie 8 Niech (X, Y ) b˛edzie dwuwymiarowa˛ zmienna˛ losowa˛ o dystrybuancie FXY . Wówczas FX (x) = lim FXY (x, y) − dystrybuanta brzegowa zmiennej losowej X, y→+∞ FY (y) = lim FXY (x, y) − dystrybuanta brzegowa zmiennej losowej Y. x→+∞ 3.2. Rozkłady brzegowe zmiennej losowej o łacznym ˛ rozkładzie dyskretnym Twierdzenie 9 Zmienna losowa (X, Y ) ma rozkład dyskretny wtedy i tylko wtedy, gdy rozkłady brzegowe zmiennych X i Y też sa˛ dyskretne. Ponadto 1. SXY ⊂ SX × SY ; 2. P (X = xk ) = � j: (xk ,yj )∈SXY P (Y = yj ) = � k: (xk ,yj )∈SXY P (X = xk , Y = yj ) − rozkład brzegowy zmiennej losowej X , P (X = xk , Y = yj ) − rozkład brzegowy zmiennej losowej Y . 3.2. Rozkłady brzegowe zmiennej losowej o łacznym ˛ rozkładzie ciagłym ˛ Twierdzenie 10 Jeśli zmienna losowa (X, Y ) ma rozkład ciagły, ˛ to rozkłady brzegowe zmiennych losowych X i Y też sa˛ ciagłe. ˛ Ponadto +∞ � fXY (x, y)dy − g˛estość brzegowa zmiennej losowej X , fX (x) = −∞ +∞ � fY (y) = fXY (x, y)dx − g˛estość brzegowa zmiennej losowej Y . −∞ 3 Wykład siódmy Niezależność zmiennych losowych 1. Niezależność zmiennych losowych Definicja 1 Jednowymiarowe zmienne losowe X, Y określone na przestrzeni probabilistycznej (Ω, F, P) nazywamy niezależnymi, jeżeli dla wszystkich zbiorów borelowskich B1 , B2 zachodzi równość P (X ∈ B1 , Y ∈ B2 ) = P (X ∈ B1 ) · P (Y ∈ B2 ). Zmienne losowe, które nie sa˛ niezależne, nazywamy zależnymi. Twierdzenie 1 Zmienne losowe X, Y sa˛ niezależne wtedy i tylko wtedy, gdy dla wszystkich x, y ∈ R FXY (x, y) = FX (x) · FY (y). Przykład 1. Dwuwymiarowa zmienna losowa (X, Y ) ma rozkład określony dystrybuanta˛ 0 x�0 ∨ y�0 x 0<x�1 ∧ y�x F (x, y) = . y 0<y�1 ∧ x>y 1 x>1 ∧ y>1 Zbadać niezależność zmiennych losowych X i Y . Wyznaczymy dystrybuanty brzegowe: 0 , x�0 0 x , 0 < x � 1 , FY (y) = y FX (x) = 1 , x>1 1 , y�0 , 0<y�1 . , y>1 Zauważmy, że X i Y maja˛ rozkłady ciagłe ˛ mimo, że rozkład łaczny ˛ nie jest ciagły. ˛ Sprawdzimy, czy FX (x) · FY (y) = F (x, y). Mamy: 0 x�0 ∨ y�0 xy 0 < x � 1 ∧ 0 < y�1 x 0<x�1 ∧ y>1 FX (x) · FY (y) = �= F (x, y). y x > 1 ∧ 0 < y � 1 1 x>1 ∧ y>1 Zatem X i Y nie sa˛ niezależne (sa˛ zależne). Twierdzenie 2 (Niezależność zmiennych losowych o rozkładach dyskretnych) Zmienne losowe X i Y o rozkładach dyskretnych sa˛ niezależne wtedy i tylko wtedy, gdy 1. SXY = SX × SY ; 2. Dla każdego punktu (x, y) ∈ SXY P (X = x, Y = y) = P (X = x) · P (Y = y). Twierdzenie 3 (Niezależność zmiennych losowych o łacznym ˛ rozkładzie ciagłym) ˛ Zmienne losowe X i Y o łacznym ˛ rozkładzie ciagłym ˛ sa˛ niezależne wtedy i tylko wtedy, gdy fXY (x, y) = fX (x) · fY (y) prawie wsz˛edzie. Twierdzenie 4 Jeśli zmienne losowe X i Y sa˛ niezależne oraz g1 , g2 sa˛ funkcjami takimi, że, g1 (X), g2 (Y ) tez sa zmiennymi losowymi, to g1 (X) i g2 (Y ) również sa˛ niezależne. 1 Wykład ósmy Charakterystyki liczbowe wielowymiarowych zmiennych losowych 1. Wartość oczekiwana Definicja 1 Niech (X, Y ) b˛edzie dwuwymiarowa˛ zmienna˛ losowa˛ taka,˛ że istnieja˛ EX i EY . Wartościa˛ oczekiwana˛ zmiennej losowej (X, Y ) nazywamy wektor (EX, EY ). Twierdzenie 1 Niech g(X, Y ) b˛edzie jednowymiarowa˛ zmienna˛ losowa.˛ Wtedy: 1. Jeśli (X, Y ) ma rozkład dyskretny, to � E (g(X, Y )) = (x,y)∈SXY g(x, y) · P (X = x, Y = y). 2. Jeśli (X, Y ) ma rozkład ciagły, ˛ to E (g(X, Y )) = � +∞ � +∞ −∞ g(x, y)fXY (x, y) dxdy. −∞ Twierdzenie 2 Jeśli X, Y sa˛ niezależnymi zmiennymi losowymi, to E (g1 (X) · g2 (Y )) = E (g(X)) · E (g2 (Y )) . 2. Kowariancja Definicja 2 Kowariancja˛ zmiennych losowych X i Y , dla których istnieja˛ EX, EY, E(XY ), nazywamy liczb˛e cov(X, Y ) = E(X − EX)(Y − EY ). Twierdzenie 3 cov(X, Y ) = E(X · Y ) − EX · EY. Własności kowariancji: Niech X, Y, X1 , X2 , Y1 , Y2 b˛eda˛ jednowymiarowymi zmiwnnymi losowymi. Wtedy: 1. cov(X, Y ) = cov(Y, X); 2. cov(X, X) = V X; 3. cov(a, X) = 0 dla a ∈ R; 4. cov(aX + b, cY + d) = a · c · cov(X, Y ) dla a, b, c, d ∈ R; 5. cov(aX1 + bX2 , cY1 + dY2 ) = a · c · cov(X1 , Y1 ) + a · d · cov(X1 , Y2 ) + b · c · cov(X2 , Y1 ) + b · d · cov(X2 , Y2 ). Twierdzenie 4 Jeśli X i Y sa˛ zmiennymi losowymi, dla których istnieja˛ wariancje, to V (X + Y ) = V X + 2cov(X, Y ) + V Y, V (X − Y ) = V X − 2cov(X, Y ) + V Y. Definicja 3 Zmienne losowe X i Y nazywamy nieskorelowanymi, jeśli cov(X, Y ) = 0. Uwaga. Jeśli X i X sa˛ nieskorelowane, to V (X + Y ) = V (X − Y ) = V X + V Y . Uwaga. Jeśli zmienne losowe X i Y sa˛ niezależne, to cov(X, Y ) = 0. Ale: z tego, że X i Y sa˛ nieskorelowane nie wynika, że sa˛ niezależne! Wyjatkiem ˛ jest rozkład normalny: Jeśli (X, Y ) ma rozkład normalny, to X i Y sa˛ niezależne ←→ cov(X, Y ) = 0. 3. Współczynnik korelacji Definicja 4 Niech X i Y b˛eda˛ zmiennymi losowymi takimi, że V X > 0 i V Y > 0. Współczynnikiem korelacji zmiennych X i Y nazywamy liczb˛e cov(X, Y ) ρ(X, Y ) = √ . VX ·VY Własności współczynnika korelacji: 1. |ρ(X, Y )| � 1; 2. |ρ(X, Y )| = 1 ←→ istnieja˛ a, b ∈ R takie, że Y = aX + b (istnieje liniowa zależność mi˛edzy X i Y ); 3. X i Y sa˛ nieskorelowane ←→ ρ(X, Y ) = 0. Wykład ósmy Centralne Twierdzenie Graniczne Twierdzenie 1. Centralne Twierdzenie Graniczne Lindeberga-Levy’ego Niech (Xk )nk=1 b˛edzie ciagiem ˛ niezależnych zmiennych losowych o takim �n samym rozkładzie takich, że 2 EXk = m, V Xk = σ dla każdego k = 1, . . . , n. Niech Sn = k=1 Xk . Wtedy dla dowolnych a, b ∈ R takich, że a < b � � Sn − n · m √ lim P a < < b = F(b) − F(a). (1) n→∞ σ· n Twierdzenie 2. Twierdzenie Moivre’a-Laplace’a Jeśli (Xk )nk=1 jest ciagiem ˛ niezależnych zmiennych losowych o rozkładzie zero-jedynkowym takim, że P (Xk = 1) = p dla każdego k = 1, . . . n, to wzór (1) przyjmuje postać � � Sn − n · p lim P a < � < b = F(b) − F(a). n→∞ n · p · (1 − p) Przykład 2. Zakładajac, ˛ że prawdopodobieństwa urodzenia chłopca i dziewczynki sa˛ takie same oszacować prawdopodobieństwo, że wśród 10 000 000 mieszkańców pewnego miasteczka, b˛edzie przynajmniej 4 000 000 kobiet. 000 000 Rozwiazanie: ˛ Niech (Xk )10 b˛edzie ciagiem ˛ niezależnych zmiennych losowych takich, że k=1 � 1 , jeśli k-ta osoba jest kobieta˛ Xk = . 0 , jeśli k-ta osoba jest m˛eżczyzna˛ Wtedy S10 000 000 jest zmienna˛ losowa˛ oznaczajac ˛ a˛ liczb˛e kobiet w miasteczku. Zauważmy, że dla każdego k = 1, . . . , 10 000 000 P (Xk = 1) = p = 0, 5, P (Xk = 0) = 0, 5. Zatem zmienne losowe Xk maja˛ rozkłady zero-jedynkowe. Z twierdzenia 2 mamy zatem P (S10 000 000 > 4 000 000) = 1 − P (S10 000 000 � 4 000 000) � � 4 000 000 − 10 000 000 · 0, 5 S10 000 000 − 10 000 000 · 0, 5 √ � √ = 1−P 10 000 000 · 0, 5 · 0, 5 10 000 000 · 0, 5 · 0, 5 1 − F(−632, 46) ≈ 1. 1