Wykład 3 Jednowymiarowe zmienne losowe

advertisement
Wykład 3
Jednowymiarowe zmienne losowe
Niech (Ω, F, P ) b˛edzie ustalona˛ przestrzenia˛ probabilistyczna.˛
Definicja 1 Jednowymiarowa˛ zmienna˛ losowa˛ (o wartościach rzeczywistych), określona˛ na przestrzeni probabilistycznej (Ω, F, P ) nazywamy funkcj˛e X : Ω → R taka,˛ że dla każdego x ∈ R
X −1 ((−∞; x)) = {ω ∈ Ω : X(ω) < x} ∈ F.
Przykład 1. Rzucamy jeden raz symetryczna˛ kostka.˛ Jeśli wypadnie ”6” otrzymujemy 90zł; jeśli wypadnie
nieparzysta liczba oczek otrzymujemy 10zł; w pozostałych przypadkach nie otrzymujemy nic. Wtedy Ω =
{1, 2, 3, 4, 5, 6}. Niech X oznacza wygrana˛ w tej grze. Wtedy X jest zmienna˛ losowa˛ określona˛ w nast˛epujacy
˛
sposób:

 10 , ω ∈ {1, 3, 5}
90 , ω = 6
X(ω) =
.

0 , ω ∈ {2, 4}
X jest przykładem zmiennej losowej o rozkładzie dyskretnym.
Przykład 2. Rozważmy czas oczekiwania na autobus majacy
˛ przyjechać w ciagu
˛ godziny. Można przyjać,
˛ że
Ω = [0; 1]. Wtedy, jeśli X oznacza czas oczekiwania, to X(ω) = ω. W tym przypadku X jest przykładem
zmiennej losowej o rozkładzie ciagłym.
˛
1. Zmienna losowa o rozkładzie dyskretnym
Rozkład prawdopodobieństwa zmiennej losowej określa zakres jej wartości oraz prawdopodobieństwa, z jakimi
te wartości sa˛ przyjmowane.
Oznaczenie: P (X = x) = P ({ω : X(ω) = x}) - prawdopodobieństwo, że zmienna losowa X przyjmie
wartość x.
Definicja 2 Zmienna losowa X ma rozkład dyskretny (skokowy), jeśli istnieje przeliczalny podzbiór SX ⊂ R,
zwany zbiorem punktów skokowych, taki, że
1. P (X = xi ) > 0 dla każdego xi ∈ SX ;
�
2.
P (X = xi ) = 1.
xi ∈SX
Definicja 3 Niech X b˛edzie zmienna˛ losowa˛ o rozkładzie dyskretnym. Jeśli dla każdego xi ∈ SX znajdziemy
P (X = xi ), to otrzymamy funkcj˛e prawdopodobieństwa zmiennej losowej X.
Uwaga. Funkcja prawdopodobieństwa zmiennej losowej dyskretnej X jednoznacznie wyznacza jej rozkład.
2. Dystrybuanta zmiennej losowej
W praktyce cz˛esto interesuja˛ nas P (X � x) dla dowolnego x ∈ R. Prawdopodobieństwa takie można wyznaczać za pomoca˛ dystrybuanty.
Definicja 4 Dystrybuanta˛ jednowymiarowej zmiennej losowej X : Ω → R nazywamy funkcj˛e FX : R → R
określona˛ wzorem
FX (x) = P (X � x) = P (X −1 (−∞, x]).
Twierdzenie 1 Rozkład zmiennej losowej X jest jednoznacznie wyznaczony przez jej dystrybuant˛e.
Wniosek. Jeśli dwie zmienne losowe maja˛ te same dystrybuanty, to maja˛ ten sam rozkład.
Własności dystrybuanty
Twierdzenie 2 Funkcja F : R → R jest dystrybuanta˛ jednowymiarowej zmiennej losowej wtedy i tylko wtedy,
gdy
1.
lim F (x) = 0 , lim F (x) = 1;
x→−∞
x→+∞
2. F jest funkcja˛ niemalejac
˛ a˛ (x1 < x2 → F (x1 ) � F (x2 ));
3. F jest funkcja˛ co najmniej prawostronnie ciagł
˛ a.˛
Przy pomocy dystrybuanty można wyznaczyć prawdopodobieństwa zdarzeń polegajacych
˛
na tym, że zmienna
losowa przyjmie wartość z ustalonego przedziału.
Uwaga. Niech a, b ∈ R i niech a < b. Wtedy:
1. P (X � a) = FX (a);
2. P (X = a) = FX (a) − lim− FX (x);
x→a
3. P (X � a) = 1 − lim FX (x);
x→a−
4. P (a � X < b) = lim− FX (x) − lim− FX (x);
x→b
x→a
5. P (a < X � b) = FX (b) − FX (a);
6. P (a < X < b) = lim FX (x) − FX (a);
x→b−
7. P (a � X � b) = FX (b) − limx→a− FX (x);
8. P (X < a) = limx→a− FX (x).
2.1 Dystrybuanta zmiennej losowej o rozkładzie dyskretnym
Twierdzenie 3 Jeśli X ma rozkład dyskretny, to
FX (x) =
�
P (X = xi ).
xi �x
Uwaga. Aby wyznaczyć rozkład zmiennej losowej o rozkładzie dyskretnym trzeba: albo znaleźć funkcj˛e prawdopodobieństwa albo dystrybuant˛e.
2. Zmienna losowa o rozkładzie ciagłym
˛
Definicja 5 Zmienna losowa X o dystrybuancie FX ma rozkład ciagły
˛
(jest typu ciagłego),
˛
jeżeli istnieje
funkcja fX : R → R taka, że
�x
FX (x) =
fX (t)dt.
−∞
Funkcj˛e fX nazywamy wtedy g˛estościa˛ rozkładu zmiennej losowej X.
Wnioski. Jeśli X ma rozkład ciagły,
˛
to:
1. FX jest funkcja˛ ciagł
˛ a˛ w zbiorze R.
�
2. FX
(x) = f (x) w każdym punkcie ciagłości
˛
x funkcji fX .
Twierdzenie 4 Funkcja f : R → R jest g˛estościa˛ jednowymiarowej zmiennej losowej wtedy i tylko wtedy, gdy
1. f (x) � 0 prawie wsz˛edzie;
+∞
�
2.
f (x)dx = 1.
−∞
Uwaga. Jeśli X ma rozkład ciagły,
˛
to P (X = a) = 0 dla każdego a ∈ R.
Uwaga. Jeśli X ma rozkład ciagły,
˛
to dla dowolnych a, b ∈ R takich, że a < b
P (a � X < b) = P (a < X � b) = P (a < X < b) = P (a � X � b).
Uwaga. Rozkład zmiennej losowej typu ciagłego
˛
jest jednoznacznie wyznaczony przez funkcj˛e g˛estości.
Wyznaczanie prawdopodobieństwa za pomoca˛ g˛estości
Jeśli X ma rozkład ciagły,
˛
to dla dowolnych a, b ∈ R takich, że a < b:
� b
1. P (X < b) = P (X � b) =
fX (x)dx;
−∞
2. P (X > a) = P (X � a) =
�
∞
fX (x)dx;
a
3. P (a � X < b) = P (a < X � b) = P (a < X < b) = P (a � X � b) =
�
b
fX (x)dx.
a
Uwaga. Aby wyznaczyć rozkład zmiennej losowej o rozkładzie ciagłym
˛
trzeba: albo znaleźć funkcj˛e g˛estości
albo dystrybuant˛e.
Wykład 4
Charakterystyki liczbowe jednowymiarowych zmiennych losowych
1. Wartość oczekiwana
Wartość oczekiwana jest wskaźnikiem położenia zmiennej losowej. Wskazuje ona średnia˛ wartość zmiennej
losowej.
1.1 Wartość oczekiwana zmiennej losowej o rozkładzie dyskretnym
Definicja 1 Niech X b˛edzie zmienna˛ losowa˛ o rozkładzie dyskretnym ze zbiorem punktów skokowych SX .
Wtedy, jeśli
�
|xi | · P (X = xi ) < ∞,
xi ∈SX
to wartościa˛ oczekiwana˛ zmiennej losowej X nazywamy liczb˛e
�
EX =
xi · P (X = xi ).
xi ∈SX
W przeciwnym przypadku mówimy, że wartość oczekiwana nie istnieje.
Definicja 2 Niech X b˛edzie zmienna˛ o rozkładzie dyskretnym i niech g : R → R b˛edzie funkcja˛ taka,˛ że g(X)
też jest zmienna˛ losowa.˛ Wtedy, jeśli
�
|g(xi )| · P (X = xi ) < ∞,
xi ∈SX
to
E(g(X)) =
�
g(xi ) · P (X = xi ).
xi ∈SX
1.2 Wartość oczekiwana zmiennej losowej o rozkładzie ciagłym
˛
Definicja 3 Niech X b˛edzie zmienna˛ losowa˛ o rozkładzie ciagłym
˛
z funkcja˛ g˛estości fX . Wtedy, jeśli
� ∞
|x| · fX (x) dx < ∞,
−∞
to wartościa˛ oczekiwana˛ zmiennej losowej X nazywamy liczb˛e
� ∞
EX =
x · fX (x) dx.
−∞
W przeciwnym przypadku mówimy, że wartość oczekiwana nie istnieje.
Przykład 1. Niech czas oczekiwania (w godzinach) na autobus b˛edzie zmienna˛ losowa˛ X o rozkładzie ciagłym
˛
z funkcja˛ g˛estości
�
1 , x ∈ [0; 1]
fX (x) =
.
0 , x∈
/ [0; 1]
Jeśli pytamy o to, jaki b˛edzie średni czas oczekiwania, to musimy obliczyć
� 1
1
EX =
x · 1 dx = .
2
0
To oznacza, że średnio na utobus b˛edziemy czekać pół godziny.
Definicja 4 Niech X b˛edzie zmienna˛ o rozkładzie ciagłym
˛
i niech g : R → R b˛edzie funkcja˛ taka,˛ że g(X) też
jest zmienna˛ losowa.˛ Wtedy, jeśli
�
∞
to
−∞
|g(x)| · fX (x) dx < ∞,
E(g(X)) =
�
∞
−∞
1
g(x) · fX (x) dx.
1.3 Własności wartości oczekiwanej
Niech X i Y b˛eda˛ zmiennymi losowymi, dla których istnieja˛ EX i EY . Wtedy:
1. E(b) = b dla każdego b ∈ R;
2. E(a · X) = a · EX dla każdego a ∈ R;
3. E(X + Y ) = EX + EY ;
4. Jeśli X � 0, to EX � 0.
5. Z własności 3 wynika, że dla skończonej liczby zmiennych losowych X1 , . . . , Xn zachodzi równość
E(X1 + · · · + Xn ) = EX1 + · · · + EXn .
2. Wariancja i odchylenie standardowe
Wariancja jest wskaźnikiem rozproszenia wartości zmiennej losowej wokół jej wartości oczekiwanej (wskazuje,
jak bardzo wartości zmiennej losowej odbiegaja˛ od wartości średniej).
Definicja 5 Jeśli istnieje E(X 2 ), to wariancja˛ zmiennej losowej X nazywamy liczb˛e
Liczb˛e σX =
√
V X = E(X − EX)2 .
V X nazywamy odchyleniem standardowym zmiennej losowej X.
Twierdzenie 1 Jeśli istnieje E(X 2 ), to
V X = E(X 2 ) − (EX)2 .
Dowód
VX
= E(X − EX)2 = E(X 2 − 2X · EX + (EX)2 ) = E(X 2 ) − 2E(X · EX) + E((EX)2 )
= E(X 2 ) − 2EX · EX + (EX)2 = E(X 2 ) − (EX)2 .
�
Przykład 2. Dla zmiennej losowej z przykładu 1 mamy:
E(X 2 ) =
�
1
0
x2 · 1 dx =
co oznacza, że
V X = E(X 2 ) − (EX)2 =
2.1 Własności wariancji
Jeśli X jest zmienna˛ losowa,˛ dla której istnieje V X, to
1. V X � 0;
2. V (aX + b) = a2 · V X dla wszystkich a, b ∈ R.
2
1
−
3
1
,
3
� �2
1
1
=
.
2
12
Wykład czwarty
Przeglad
˛ rozkładów jednowymiarowych
1. Rozkłady dyskretne
1. Rozkład jednopunktowy:
Zmienna losowa X ma rozkład jednopunktowy skupiony w punkcie x0 , jeśli SX = {x0 } oraz
P (X = x0 ) = 1.
Jest to najprostszy rozkład prawdopodobieństwa. Dystrybuanta tego rozkładu ma postać
�
0 , x � x0
F (x) =
.
1 , x > x0
Uwaga. Jeśli X = a, gdzie a ∈ R, to X ma rozkład jednopunktowy skupiony w punkcie a.
Zatem każda˛ stała˛ można traktować jako zmienna˛ losowa˛ o rozkładzie jednopunktowym.
Jeśli X ma rozkład jednopunktowy skupiony w punkcie x0 , to EX = x0 , V X = 0.
2. Rozkład zero-jedynkowy:
X ma rozkład zero-jedynkowy, jeśli SX = {0, 1} oraz
P (X = 0) = p ∈ (0; 1), P (X = 1) = 1 − p.
Dystrybuanta tego rozkładu ma postać

 0 , x<0
p , 0�x<1 .
F (x) =

1 , x�1
Ponadto EX = 1 − p, V X = p(1 − p).
� Przykład modelu:
Rzucamy symetryczna˛ moneta.˛ Jeśli przyjmiemy, że
�
0 , gdy wypadnie orzeł
X=
,
1 , gdy wypadnie reszka
to funkcja prawdopodobieństwa rozkładu zmiennej losowej X b˛edzie postaci
1
P (X = 0) = P (X = 1) = .
2
To oznacza, że X ma rozkład zero-jedynkowy.
3. Rozkład Bernoulliego (dwumianowy):
X ma rozkład Bernoulliego z parametrami n i p (X ∼ B(n, p)), gdzie p ∈ (0, 1) i n ∈ N, jeśli
SX = {0, 1, . . . , n} oraz
� �
n k
P (X = k) =
p (1 − p)n−k .
k
Zmienna˛ losowa˛ o rozkładzie dwumianowym można interpretoważ jako liczb˛e sukcesów w n
doświadczeniach Bernoulliego, jeśli prawdopodobieństwo sukcesu w jednym doświadczeniu
wynosi p.
Jeśli X ∼ B(n, p), to EX = np, V X = np(1 − p).
1
4. Rozkład geometryczny:
X ma rozkład geometryczny z parametrem p ∈ (0, 1) (X ∼ g(p)), jeśli SX = N oraz
P (X = k) = (1 − p)k−1 p.
Uwaga. Zmienna˛ losowa˛ o rozkładzie geometrycznym można interpretować jako liczb˛e prób do
pierwszego sukcesu w schemacie Bernoulliego.
� Przykład modelu:
�
�
2
Rzucamy moneta˛ P (O) =
. Niech X oznacza liczb˛e rzutów do momentu, aż pojawi si˛e po
5
raz pierwszy orzeł. Wtedy
�
�k−1
2
2
P (X = k) = 1 −
, k = 1, 2, . . . ,
5
5
2
to znaczy X ma rozkład geometryczny z parametrem p = .
5
Dla rozkładu geometrycznego spełniona jest własność "braku pami˛eci"(własność Markowa):
Twierdzenie 1. Jeśli X ma rozkład geometryczny z parametrem p, to dla dowolnych n, m ∈ N
P (X > n + m| X > n) = (1 − p)m = P (X > m).
Dowód.
P (X > n + m ∧ X > n)
P (X > n + m)
=
=
P (X > n)
P (X > n)
∞
�
p(1 − p)k−1
p(1 − p)n+m
k=n+m+1
=
=
= (1 − p)m = P (X > m).
∞
n
�
p(1
−
p)
p(1 − p)k−1
P (X > n + m| X > n) =
k=n+1
1
p
Jeśli X ∼ g(p), to EX = , V X =
.
p
1 − p2
5. Rozkład Poissona:
Zmienna losowa X ma rozkład Poissona z parametrem λ > 0 (X ∼ P (λ)), jeśli SX = N ∪ {0}
oraz
λk
P (X = k) = e−λ .
k!
Wartości prawdopodobieństw dla rozkładu Poissona sa˛ stablicowane.
Zmienna losowa o rozkładzie Poissona może być interpretowana jako liczba awarii systemu,
liczba klientów zgłaszajacych
˛
si˛e do banku, liczba samochodów przejeżdżajacych
˛
przez określony
punkt drogi w określonym przedziale czasowym, liczba czastek
˛
emitowanych przez substancj˛e
radioaktywna˛ w ustalonych odst˛epach czasu.
Rozkład Poissona ma zwiazek
˛
z rozkładem Bernoulliego: Dla dużych n
� �
n k
λk
p (1 − p)n−k � e−λ · ,
k
k!
gdzie λ = np.
Przybliżenie to jest dla celów praktycznych wystarczajaco
˛ dokładne gdy n � 50, p � 0, 1.
Jeśli X ∼ P (λ), to EX = V X = λ.
2. Rozkłady ciagłe
˛
1. Rozkład jednostajny:
Zmienna losowa X ma rozkład jednostajny na przedziale [a; b] (X ∼ U ([a; b])), jeśli jej funkcja
g˛estości oraz dystrybuanta maja˛ postać

� 1
0
, x�a

 x−
a
, x ∈< a ; b >
, a<x�b .
f (x) =
,
F (x) =
b−a

b
−
a

0
, x ∈<
/ a; b >
1
, x>b
Zmienna˛ losowa˛ X o rozkładzie jednostajnym na przedziale [a; b] można interpretować jako
wynik eksperymentu polegajacego
˛
na losowym i "jednostajnym"wyborze wartości z odcinka
[a; b].
a+b
(b − a)2
Jeśli X ∼ U ([a; b]), to EX =
VX =
.
2
12
2. Rozkład normalny (Gaussa):
Zmienna losowa X ma rozkład normalny z parametrami m i σ 2 , gdzie m ∈ R oraz σ > 0
(X ∼ N (m, σ 2 )), jeśli jej funkcja g˛estości jest postaci
�
�
1
(x − m)2
f (x) = √
exp −
.
2σ 2
2π · σ
Szczególny przypadek: Standardowy rozkład normalny
Rozkład N (0, 1) nazywany jest standardowym rozkładem normalnym.
Jeśli X ∼ N (0, 1), to
� 2�
1
x
f (x) = √ exp −
.
2
2π
Dystrybuant˛e rozkładu normalnego N (0, 1) oznaczać b˛edziemy symbolem F(x):
�
�
� x
1
1 2
F(x) = √
exp − t dt.
2
2π −∞
Wyznaczanie prawdopodobie/nstw dla zmiennych losowych o rozkładach N (m, σ 2 ):
Dystrybuanta rozkładu normalnego N (0, 1) jest stablicowana. Za jej pomoca˛ można obliczyć
wartości dystrybuanty dla dowolnej zmiennej losowej o rozkładzie N (m, σ 2 ):
Jeśli X ∼ N (m, σ ), to FX (x) = F
2
W szczególności, jeśli X ∼ N (m, σ 2 ), to
P (X < b) = P (X � b) = F
�
�
x−m
σ
b−m
σ
�
�
.
;
P (a < X < b) = P (a � X � b) = P (a < X � b) = P (a � X < b) = FX (b) − FX (a)
�
�
�
�
b−m
a−m
= F
−F
.
σ
σ
Cz˛esto korzysta si˛e z tablic funkcji Φ(x), gdzie Φ jest funkcja˛ Laplace’a.
Definicja 1. Funkcja˛ Lapalce’a nazywamy funkcj˛e Φ taka,˛ że
1
Φ(x) = √
2π
df
�x
0
�
u2
exp −
2
�
du.
Twierdzenie 2. Funkcja Laplace’a ma nast˛epujace
˛ własności:
(a) Φ(x) jest funkcja˛ nieparzysta;
˛
(b) Dla każdego x ∈ R
F(x) =
�
0, 5 + Φ(x)
, x�0
.
0, 5 − Φ(−x) , x < 0
Twierdzenie 3. (Reguła trzech sigm) Jeśli X ∼ N (m, σ 2 ), to
P (X ∈
/ [m − 3σ, m + 3σ]) = 0, 0027.
Dowód. Jeśli X ∼ N (m, σ 2 ), to
P (|X − m| � 3σ) = P (X ∈ [m − 3σ , m + 3σ]) = FX (m + 3σ) − FX (m − 3σ) =
= F(3) − F(−3) = 2 · Φ(3) = 2 · 0.49865 = 0.9973.
Zatem
P (X ∈
/ [m − 3σ, m + 3σ]) = 1 − 0.9973 = 0, 0027.
Z reguły trzech sigm wynika, że jeśli X ∼ N (m, σ 2 ), to szansa przyj˛ecia przez zmienna˛ losowa˛
X wartości poza przedziałem [m − 3σ, m + 3σ] jest bliska zeru.
Jeśli X ∼ N (m, σ 2 ), to EX = m, V X = σ 2 .
Wykład szósty
Zmienne losowe dwuwymiarowe
Definicja 1 Niech X i Y b˛eda˛ zmiennymi losowymi określonymi na przestrzeni probabilistycznej (Ω, F, P ).
Funkcj˛e
X = (X, Y ) : Ω → R2
nazywamy zmienna˛ losowa˛ dwuwymiarowa.˛
Rozkład łaczny
˛
zmiennej losowej - rozkład wektora (X, Y ).
1. Typy rozkładów zmiennych losowych dwuwymiarowych
1.1. Rozkład dyskretny
Definicja 2 Dwuwymiarowa zmienna losowa (X, Y ) ma rozkład dyskretny, jeśli istnieje przeliczalny
zbiór SXY ⊂ R2 taki, że
1. P (X = x, Y = y) > 0 dla każdego punktu (x, y) ∈ SXY ;
�
2.
P (X = x, Y = y) = 1.
(x,y)∈SXY
Wtedy SXY nazywamy zbiorem punktów skokowych rozkładu zmiennej losowej (X, Y ).
Definicja 3 Jeśli (X, Y ) ma rozkład dyskretny i dla każdego punktu (x, y) ∈ SXY znajdziemy
P (X = x, Y = y), to wyznaczymy funkcj˛e prawdopodobieństwa rozkładu zmiennej losowej (X, Y ).
Twierdzenie 1 Funkcja prawdopodobieństwa dwuwymiarowej zmiennej losowej o rozkładzie dyskretnym
jednoznacznie wyznacza jej rozkład.
1.2. Rozkład ciagły
˛
Definicja 4 Dwuwymiarowa zmienna losowa (X, Y ) ma rozkład ciagły,
˛
jeśli istnieje funkcja
2
fXY : R → R zwana g˛estościa˛ rozkładu zmiennej zmiennej losowej (X, Y ) taka że
�x �y
FXY (x, y) =
fXY (u, t)du dt,
−∞ −∞
gdzie FXY jest dystrybuanta˛ zmiennej losowej (X, Y ).
Twierdzenie 2 Funkcja f : R2 → R jest g˛estościa˛ dwuwymiarowej zmiennej losowej wtedy i tylko wtedy,
gdy
1.
�∞ �∞
f (x, y)dx dy = 1;
−∞ −∞
2. f (x, y) � 0 prawie wsz˛edzie.
Twierdzenie 3 Jeśli funkcja f : R2 → R jest g˛estościa˛ dwuwymiarowej zmiennej losowej (X, Y ), to:
1.
∂ 2 FXY
(x, y) = f (x, y) prawie wsz˛edzie;
∂x∂y
2. Dla każdego A ∈ B(R2 ) zachodzi
P ((X, Y ) ∈ A) =
� �
f (x, y)dx dy.
A
Twierdzenie 4 Funkcja g˛estości jednoznacznie wyznacza rozkład dwuwymiarowej zmiennej losowej o
rozkładzie ciagłym.
˛
1
2. Dystrybuanta zmiennej losowej dwuwymiarowej
Definicja 5 Dystrybuanta˛ dwuwymiarowej zmiennej losowej (X, Y ) nazywamy funkcj˛e
FXY : R2 → [0; 1] dana˛ wzorem
FXY (x, y) = P (X � x, Y � y).
Własności dystrybuanty dwuwymiarowej zmiennej losowej (X, Y )
Twierdzenie 5 Dla dowolnych x1 < x2 , y1 < y2 zachodzi równość
P (x1 < X � x2 , y1 < Y � y2 ) = FXY (x2 , y2 ) − FXY (x1 , y2 ) − FXY (x2 , y1 ) + FXY (x1 , y1 ).
Twierdzenie 6 Funkcja F : R2 → R jest dystrybuanta˛ dwuwymiarowej zmiennej losowej wtedy i tylko
wtedy, gdy
�
�
1.
lim F (x, y) = 0 ,
lim F (x, y) = 0 , lim F (x, y) = 1;
y∈R x→−∞
x∈R y→−∞
x→+∞
y→+∞
2. Funkcja F jest niemalejaca
˛ ze wzgl˛edu na każda˛ zmienna;
˛
3. Funkcja F jest co najmniej prawostronnie ciagła
˛ ze wzgl˛edu na każda˛ zmienna;
˛
�
�
F (x2 , y2 ) − F (x1 , y2 ) − F (x2 , y1 ) + F (x1 , y1 ) � 0.
4.
x1 <x2 y1 <y2
Twierdzenie 7 Dla dowolnych a, b ∈ R zachodzi równość
P (X = a, Y = b) = FXY (a, b) + FXY (a− , b− ) − FXY (a− , b) − FXY (a, b− ).
Uwaga. Dystrybuanta zmiennej losowej dwuwymiarowej jednoznacznie wyznacza jej rozkład łaczny.
˛
Jeśli znajdziemy osobno rozkład dla zmiennej losowej X i osobno rozkład dla Y , to otrzymamy rozkłady
brzegowe.
3. Rozkłady brzegowe zmiennych losowych dwuwymiarowych
3.1. Dystrybuanty brzegowe
Twierdzenie 8 Niech (X, Y ) b˛edzie dwuwymiarowa˛ zmienna˛ losowa˛ o dystrybuancie FXY . Wówczas
FX (x) = lim FXY (x, y) − dystrybuanta brzegowa zmiennej losowej X,
y→+∞
FY (y) = lim FXY (x, y) − dystrybuanta brzegowa zmiennej losowej Y.
x→+∞
3.2. Rozkłady brzegowe zmiennej losowej o łacznym
˛
rozkładzie dyskretnym
Twierdzenie 9 Zmienna losowa (X, Y ) ma rozkład dyskretny wtedy i tylko wtedy, gdy rozkłady brzegowe
zmiennych X i Y też sa˛ dyskretne. Ponadto
1. SXY ⊂ SX × SY ;
2.
P (X = xk ) =
�
j: (xk ,yj )∈SXY
P (Y = yj ) =
�
k: (xk ,yj )∈SXY
P (X = xk , Y = yj ) − rozkład brzegowy zmiennej losowej X ,
P (X = xk , Y = yj ) − rozkład brzegowy zmiennej losowej Y .
3.2. Rozkłady brzegowe zmiennej losowej o łacznym
˛
rozkładzie ciagłym
˛
Twierdzenie 10 Jeśli zmienna losowa (X, Y ) ma rozkład ciagły,
˛
to rozkłady brzegowe zmiennych losowych
X i Y też sa˛ ciagłe.
˛
Ponadto
+∞
�
fXY (x, y)dy − g˛estość brzegowa zmiennej losowej X ,
fX (x) =
−∞
+∞
�
fY (y) =
fXY (x, y)dx − g˛estość brzegowa zmiennej losowej Y .
−∞
3
Wykład siódmy
Niezależność zmiennych losowych
1. Niezależność zmiennych losowych
Definicja 1 Jednowymiarowe zmienne losowe X, Y określone na przestrzeni probabilistycznej (Ω, F, P) nazywamy niezależnymi, jeżeli dla wszystkich zbiorów borelowskich B1 , B2 zachodzi równość
P (X ∈ B1 , Y ∈ B2 ) = P (X ∈ B1 ) · P (Y ∈ B2 ).
Zmienne losowe, które nie sa˛ niezależne, nazywamy zależnymi.
Twierdzenie 1 Zmienne losowe X, Y sa˛ niezależne wtedy i tylko wtedy, gdy dla wszystkich x, y ∈ R
FXY (x, y) = FX (x) · FY (y).
Przykład 1. Dwuwymiarowa zmienna losowa (X, Y ) ma rozkład określony dystrybuanta˛

0
x�0
∨ y�0



x 0<x�1 ∧ y�x
F (x, y) =
.
y 0<y�1 ∧ x>y



1
x>1
∧ y>1
Zbadać niezależność zmiennych losowych X i Y .
Wyznaczymy dystrybuanty brzegowe:


 0 , x�0
 0
x , 0 < x � 1 , FY (y) =
y
FX (x) =


1 , x>1
1
, y�0
, 0<y�1 .
, y>1
Zauważmy, że X i Y maja˛ rozkłady ciagłe
˛ mimo, że rozkład łaczny
˛
nie jest ciagły.
˛
Sprawdzimy, czy FX (x) · FY (y) = F (x, y). Mamy:

0
x�0
∨
y�0




xy
0
<
x
�
1
∧
0
<
y�1

x 0<x�1 ∧
y>1
FX (x) · FY (y) =
�= F (x, y).


y
x
>
1
∧
0
<
y
�
1



1
x>1
∧
y>1
Zatem X i Y nie sa˛ niezależne (sa˛ zależne).
Twierdzenie 2 (Niezależność zmiennych losowych o rozkładach dyskretnych)
Zmienne losowe X i Y o rozkładach dyskretnych sa˛ niezależne wtedy i tylko wtedy, gdy
1. SXY = SX × SY ;
2. Dla każdego punktu (x, y) ∈ SXY
P (X = x, Y = y) = P (X = x) · P (Y = y).
Twierdzenie 3 (Niezależność zmiennych losowych o łacznym
˛
rozkładzie ciagłym)
˛
Zmienne losowe X i Y o łacznym
˛
rozkładzie ciagłym
˛
sa˛ niezależne wtedy i tylko wtedy, gdy
fXY (x, y) = fX (x) · fY (y)
prawie wsz˛edzie.
Twierdzenie 4 Jeśli zmienne losowe X i Y sa˛ niezależne oraz g1 , g2 sa˛ funkcjami takimi, że, g1 (X), g2 (Y ) tez
sa zmiennymi losowymi, to g1 (X) i g2 (Y ) również sa˛ niezależne.
1
Wykład ósmy
Charakterystyki liczbowe wielowymiarowych zmiennych losowych
1. Wartość oczekiwana
Definicja 1 Niech (X, Y ) b˛edzie dwuwymiarowa˛ zmienna˛ losowa˛ taka,˛ że istnieja˛ EX i EY . Wartościa˛
oczekiwana˛ zmiennej losowej (X, Y ) nazywamy wektor
(EX, EY ).
Twierdzenie 1 Niech g(X, Y ) b˛edzie jednowymiarowa˛ zmienna˛ losowa.˛ Wtedy:
1. Jeśli (X, Y ) ma rozkład dyskretny, to
�
E (g(X, Y )) =
(x,y)∈SXY
g(x, y) · P (X = x, Y = y).
2. Jeśli (X, Y ) ma rozkład ciagły,
˛
to
E (g(X, Y )) =
�
+∞ � +∞
−∞
g(x, y)fXY (x, y) dxdy.
−∞
Twierdzenie 2 Jeśli X, Y sa˛ niezależnymi zmiennymi losowymi, to
E (g1 (X) · g2 (Y )) = E (g(X)) · E (g2 (Y )) .
2. Kowariancja
Definicja 2 Kowariancja˛ zmiennych losowych X i Y , dla których istnieja˛ EX, EY, E(XY ), nazywamy
liczb˛e
cov(X, Y ) = E(X − EX)(Y − EY ).
Twierdzenie 3
cov(X, Y ) = E(X · Y ) − EX · EY.
Własności kowariancji: Niech X, Y, X1 , X2 , Y1 , Y2 b˛eda˛ jednowymiarowymi zmiwnnymi losowymi.
Wtedy:
1. cov(X, Y ) = cov(Y, X);
2. cov(X, X) = V X;
3. cov(a, X) = 0 dla a ∈ R;
4. cov(aX + b, cY + d) = a · c · cov(X, Y ) dla a, b, c, d ∈ R;
5. cov(aX1 + bX2 , cY1 + dY2 ) = a · c · cov(X1 , Y1 ) + a · d · cov(X1 , Y2 ) + b · c · cov(X2 , Y1 )
+ b · d · cov(X2 , Y2 ).
Twierdzenie 4 Jeśli X i Y sa˛ zmiennymi losowymi, dla których istnieja˛ wariancje, to
V (X + Y ) = V X + 2cov(X, Y ) + V Y, V (X − Y ) = V X − 2cov(X, Y ) + V Y.
Definicja 3 Zmienne losowe X i Y nazywamy nieskorelowanymi, jeśli cov(X, Y ) = 0.
Uwaga. Jeśli X i X sa˛ nieskorelowane, to V (X + Y ) = V (X − Y ) = V X + V Y .
Uwaga. Jeśli zmienne losowe X i Y sa˛ niezależne, to cov(X, Y ) = 0.
Ale: z tego, że X i Y sa˛ nieskorelowane nie wynika, że sa˛ niezależne! Wyjatkiem
˛
jest rozkład normalny:
Jeśli (X, Y ) ma rozkład normalny, to X i Y sa˛ niezależne ←→ cov(X, Y ) = 0.
3. Współczynnik korelacji
Definicja 4 Niech X i Y b˛eda˛ zmiennymi losowymi takimi, że V X > 0 i V Y > 0. Współczynnikiem
korelacji zmiennych X i Y nazywamy liczb˛e
cov(X, Y )
ρ(X, Y ) = √
.
VX ·VY
Własności współczynnika korelacji:
1. |ρ(X, Y )| � 1;
2. |ρ(X, Y )| = 1 ←→ istnieja˛ a, b ∈ R takie, że Y = aX + b
(istnieje liniowa zależność mi˛edzy X i Y );
3. X i Y sa˛ nieskorelowane ←→ ρ(X, Y ) = 0.
Wykład ósmy
Centralne Twierdzenie Graniczne
Twierdzenie 1. Centralne Twierdzenie Graniczne Lindeberga-Levy’ego
Niech (Xk )nk=1 b˛edzie ciagiem
˛
niezależnych zmiennych losowych o takim
�n samym rozkładzie takich, że
2
EXk = m, V Xk = σ dla każdego k = 1, . . . , n. Niech Sn =
k=1 Xk . Wtedy dla dowolnych
a, b ∈ R takich, że a < b
�
�
Sn − n · m
√
lim P a <
< b = F(b) − F(a).
(1)
n→∞
σ· n
Twierdzenie 2. Twierdzenie Moivre’a-Laplace’a
Jeśli (Xk )nk=1 jest ciagiem
˛
niezależnych zmiennych losowych o rozkładzie zero-jedynkowym takim, że
P (Xk = 1) = p dla każdego k = 1, . . . n, to wzór (1) przyjmuje postać
�
�
Sn − n · p
lim P a < �
< b = F(b) − F(a).
n→∞
n · p · (1 − p)
Przykład 2. Zakładajac,
˛ że prawdopodobieństwa urodzenia chłopca i dziewczynki sa˛ takie same oszacować prawdopodobieństwo, że wśród 10 000 000 mieszkańców pewnego miasteczka, b˛edzie przynajmniej 4 000 000 kobiet.
000 000
Rozwiazanie:
˛
Niech (Xk )10
b˛edzie ciagiem
˛
niezależnych zmiennych losowych takich, że
k=1
�
1 ,
jeśli k-ta osoba jest kobieta˛
Xk =
.
0 , jeśli k-ta osoba jest m˛eżczyzna˛
Wtedy S10 000 000 jest zmienna˛ losowa˛ oznaczajac
˛ a˛ liczb˛e kobiet w miasteczku.
Zauważmy, że dla każdego k = 1, . . . , 10 000 000
P (Xk = 1) = p = 0, 5, P (Xk = 0) = 0, 5.
Zatem zmienne losowe Xk maja˛ rozkłady zero-jedynkowe. Z twierdzenia 2 mamy zatem
P (S10 000 000 > 4 000 000) = 1 − P (S10 000 000 � 4 000 000)
�
�
4 000 000 − 10 000 000 · 0, 5
S10 000 000 − 10 000 000 · 0, 5
√
� √
= 1−P
10 000 000 · 0, 5 · 0, 5
10 000 000 · 0, 5 · 0, 5
1 − F(−632, 46) ≈ 1.
1
Download