Funkcje zmiennych losowych

advertisement
L.Kowalski - Uwagi o rozkładzie funkcji zmiennej losowej
UWAGI O ROZKŁADZIE FUNKCJI ZMIENNEJ LOSOWEJ.
X - dana zmienna losowa ciągła o gęstości f.
Y = g(X)
g - borelowska, tzn. g-1(B) ∈B(R) dla B ∈B(R),
Wyznaczyć gęstość g(y) zmiennej losowej Y.
1) Jeśli g - ściśle monotoniczna i różniczkowalna w przedziale (a, b) koncentracji X to:
g ( y ) = f (h( y ) ) h ' ( y )
gdzie h = g-1.
Należy pamiętać o przekształceniu przedziału koncentracji.
Przykład.
 y −b 1
Y = aX + b, wtedy g ( y ) = f 
 ,
 a a
Przykład.
dla x ≤ 0
0
Y = X − 2,
Jeśli X ma rozkład o gęstości f ( x) =  − x
dla x > 0
e
2
wtedy h( y ) = ( y + 2) , h′( y ) = 2( y + 2) , g(0) = -2, g(∞) = ∞,
0
g ( y) = 
2
2( y + 2)e − ( y + 2)
dla x ≤ −2
dla x > −2
,
2) Jeśli g - przedziałami ściśle monotoniczna i różniczkowalna w przedziale
(a, b) koncentracji X to:
k
g ( y) = ∑ f (hi ( y) ) hi ( y )
'
i =1
gdzie hi - funkcje odwrotne do g dla poszczególnych przedziałów,
k - liczba wartości funkcji odwrotnej odpowiadających danemu y.
Przykład.
Y = |X|, wtedy
g ( y ) = f (− y ) + f ( y ) y > 0 ,
Przykład.
Y = X2, wtedy
(
g ( y) = f − y
)2 1 y + f ( y )2 1 y
y > 0,
Jeśli X - skokowa, o funkcji prawdopodobieństwa P(X = xi) = pi, g - dowolna to funkcja
prawdopodobieństwa zmiennej losowej Y = g(X) ma postać:
g(x2)
...
g(xk)
g(x1)
p1
p2
...
pk
Po uporządkowaniu rosnąco wartości g(xi) i zsumowaniu odpowiednich prawdopodobieństw.
Dokładniej
1
L.Kowalski - Uwagi o rozkładzie funkcji zmiennej losowej


P(Y = y ) = P( g ( X ) = y ) = P U ( X = xi ) = ∑ P( X = xi ) = ∑ pi
{i: g ( x i ) = y }
 {i: g ( xi ) = y}
 {i: g ( xi ) = y}
Przykład.
X - zmienna losowa skokowa o funkcji prawdopodobieństwa:
-4
-2
-1
0
1
2
0,4
0,1
0,1
0,1
0,1
0,2
wyznaczymy funkcję prawdopodobieństwa zmiennej losowej Y = sgnX .
sgn(-4) = sgn(-2) = sgn(-1) = -1.
sgn(0) = 0.
sgn(1) = sgn(2) = 1.
Zatem funkcja prawdopodobieństwa zmiennej losowej Y jest następująca
-1
0
1
0,6
0,1
0,3
W niektórych zagadnieniach wyznaczania rozkładu funkcji zmiennej losowej najpierw
wyznaczamy dystrybuantę rozkładu zmiennej losowej Y = g(X), wg schematu
FY ( y ) = P(Y < y ) = P(g ( X ) < y ) = P(X ∈ g −1 ((−∞, y ) ) < y )
następnie jeśli to możliwe, wyznaczamy funkcję prawdopodobieństwa (gdy jest to rozkład
skokowy) lub gęstość (gdy jest to rozkład ciągły).
Przykład.
Jeśli X ma rozkład o gęstości
0 dla x ∉ [0 , 3]

f ( x) =  1
(rozkład jednostajny na [0, 3])
dla
x
∈
[
0
,
3
]
 3
Y = max(2, X ) ,
0

wtedy FY ( y ) = P (Y < y ) = P (max(2, X ) < y ) =  1 y
3
1
dla y ≤ 2
dla 2 < y ≤ 3
dla y > 3
Nie jest to ani rozkład skokowy ani ciągły. Nie można więc wyznaczyć ani funkcji
prawdopodobieństwa ani gęstości.
Jest to rozkład mieszany skokowo - ciągły i zgodnie z twierdzeniem o rozkładzie
dystrybuanty powyższą dystrybuantę można przedstawić w postaci
FY = c1F1 + c2 F2
gdzie
0
c1 = 2/3, F1 ( y ) = 
1
0

c2 = 1/3, F2 ( y ) =  y - 2
1

dla y ≤ 2
,
dla y > 2
dla y ≤ 2
dla 2 < y ≤ 3 ,
dla y > 3
2
L.Kowalski - Uwagi o rozkładzie funkcji zmiennej losowej
Funkcje zmiennych losowych 2 wymiarowych.
(X1, X2) - dana zmienna losowa ciągła o gęstości f.
Y = g(X1, X2)
Dystrybuanta tej zmiennej losowej ma postać
g - borelowska,
∫∫ f ( x , x )dx dx
G( y) =
1
2
1
2
( g ( x1 , x2 )< y )
gęstość g(y) wyznaczamy przez różniczkowanie.
Przykład.
Y = X1⋅X2 ,
G( y) =
0 ∞
∞ y / x1





 f ( x1 , x 2 )dx2 dx1
f
(
x
,
x
)
dx
dx
=
f
(
x
,
x
)
dx
dx
+
1
2
1
2
1
2
2
1
∫∫
∫
∫
∫
 ∫



0  −∞
x1⋅ x2 < y
−∞ y / x1


wtedy
g ( y) =
0
1
∞
y
1
y
∫ x f ( x, x )dx + ∫ x f ( x, x )dx
−∞
0
Przykład.
(X1, X2) - zmienna losowa o rozkładzie jednostajnym w kwadracie (0, 1) x (0, 1). Wyznaczyć
rozkład pola prostokąta o bokach x1, x2 tzn. zmiennej losowej
Y = X1⋅X2 .
1 1

G ( y ) = ∫∫ dx1dx2 = 1 − ∫∫ dx1dx2 = 1 − ∫  ∫ dx2 dx1 = y (1 − ln y )


x1 ⋅ x 2 < y
x1 ⋅ x 2 ≥ y
y  y / x1

dla 0 < y ≤ 1
stąd
dla y ≤ 0
0

G ( y ) =  y (1 − ln y )
dla 0 < y ≤ 1
1
dla
1
<y

dla 0 < y ≤ 1
zatem g(y) = -lny
Przykład.
Y = X2/X1 ,
0 ∞
∞ y ⋅ x1



G ( y ) = ∫  ∫ f ( x1 , x2 )dx2 dx1 + ∫  ∫ f ( x1 , x2 )dx2 dx1




− ∞ y ⋅ x1
0  −∞


wtedy
0
∞
−∞
0
g ( y ) = − ∫ xf ( x, yx) dx + ∫ xf ( x, yx)dx
Przykład.
X1, X2 - niezależne zmienne losowe.
X1 - N(0, σ1),
X2 - N(0, σ2).
Niech X~1 = X 1 , X~ 2 = X 2 (mają rozkład N(0, 1).
σ2
σ1
0
~
−x2 / 2
2
∞
~
2
2
e− yx / 2
e − x / 2 e − yx / 2
1
⋅
dx + ∫ x ⋅
dx =
π 1 + ~y 2
2π
2π
2π
2π
−∞
0
(rozkład Cauchy'ego)
i korzystając funkcji liniowej od zmiennej losowej Y = Y~ σ 1 mamy
e
g~ ( ~
y) = − ∫ x ⋅
⋅
(
σ2
3
)
L.Kowalski - Uwagi o rozkładzie funkcji zmiennej losowej
g ( y) =
1
2


σ2 
2  σ1  
1 + y  
π
σ1 
 σ 2  

Przykład.
Y = X1 + X2 ,
 y − x1

G ( y ) = ∫  ∫ f ( x1 , x2 )dx2 dx1


− ∞ −∞

∞
∞
wtedy
g ( y) =
∫
∞
f ( x, y − x )dx =
−∞
∫ f ( y − x, x)dx
−∞
Uwaga.
Jeśli X1, X2 - niezależne zmienne losowe to gęstość sumy wyraża się splotem gęstości
brzegowych (p. dalej).
Przykład.
Y = X1 - X2 ,
∞
g ( y) =
wtedy
∫
∞
∫ f ( x − y, x)dx
f ( x, x − y )dx =
−∞
−∞
Suma niezależnych zmiennych losowych.
Własności:
1) X, Y niezależne skokowe zmienne losowe o funkcjach prawdopodobieństwa
P(X = xi), P(Y = yj); wtedy funkcja prawdopodobieństwa zmiennej losowej X + Y
wyraża się wzorem:
P(Z = zk) = ∑ P(X = xi)P(Y = zk - xj); (zk = xi + yj)
2) X, Y niezależne ciągłe zmienne losowe o gęstościach f1 i f2 ; wtedy gęstość zmiennej
losowej X + Y wyraża się wzorem:
∞
f ( x) =
∫
∞
f1 (t ) f 2 ( x − t )dt =
−∞
∫ f (x − t) f
1
2
(t )dt
−∞
(splot gęstości składników).
Funkcje zmiennych losowych n - wymiarowych.
Przykład.
System składa się n układów z których każdy ma czas bezawaryjnej pracy określony
rozkładem wykładniczym Xi o parametrze ai niezależnym od pozostałych układów.
Wyznaczyć rozkład bezawaryjnego czasu pracy całego systemu (system działa jeśli pracuje
chociaż jeden układ).
Y = X1 + X2 + X3 + ....+ Xn,
Przez indukcję pokazuje się, że Y ma rozkład o gęstości:
−a y
n
n
dla y > 0
g ( y) =
e
n −1
(− 1) ∏ ai ∑
i =1
j =1
j
n
∏ (a
j
− ak )
k =1
k≠ j
4
L.Kowalski - Uwagi o rozkładzie funkcji zmiennej losowej
wtedy
G( y) =
n
n
(− 1)n−1 ∏ ai ∑
i =1
j =1
1− e
n
∏ (a
j
−aj y
− ak )
k =1
k≠ j
Otrzymany rozkład nazywamy uogólnionym rozkładem Erlanga n - tego rzędu Tn.
 n  n 1
E (Tn ) = E  ∑ Ti  = ∑
 k =1  k =1 a k
 n  n 1
D 2 (Tn ) = D 2  ∑ Ti  = ∑ 2
 k =1  k =1 a k
gdy a1 = a2 = ... = an =λ
g ( y) =
to
λ (λt )
n −1
(n − 1)!
e −λt = λP(n − 1, λt ) t > 0
dla y > 0
gdzie P(n-1, λt) jest rozkładem Poissona.
Przykład.
Y = min(X1 , X2 )
G ( y ) = F1 ( y ) + F2 ( y ) − F ( y , y )
wtedy
g ( y) =
y
y
∫ f ( y, x)dx − ∫ f ( x, y)dx
f1 ( y) + f 2 ( y) −
−∞
−∞
Uwaga.
Jeśli X1, X2 - niezależne zmienne losowe to:
G ( y ) = F1 ( y ) + F2 ( y ) − F1 ( y ) ⋅ F2 ( y )
g ( y ) = f 1 ( y )(1 − F2 ( y )) + f 2 ( y )(1 − F1 ( y ))
Jeśli X1, X2 - niezależne zmienne losowe o takim samym rozkładzie to:
G ( y ) = F ( y )( 2 − F ( y ))
wtedy
Przykład.
g ( y) = 2 f
( y )(1 − F ( y ))
Y = max(X1 , X2 )
G ( y ) = F ( y, y )
wtedy
g ( y) =
y
y
∫ f ( y, x)dx + ∫ f ( x, y)dx
−∞
−∞
Uwaga.
Jeśli X1, X2 - niezależne zmienne losowe o takim samym rozkładzie to:
G( y) = F 2 ( y )
wtedy
g ( y ) = 2 f ( y) F ( y)
Przykład.
Jeśli X1, X2, …, Xn - niezależne zmienne losowe o dystrybuantach F1, F2, …, Fn, wtedy
zmienna losowa
a)
Y = max(X1 , X2,…, Xn)
ma rozkład o dystrybuancie
G ( y ) = P(Y < y ) = P(max( X 1 , X 2 ,..., X n ) < y ) = P ( X 1 < y, X 2 < y,...., X n < y, ) =
= F1 ( y ) ⋅ F2 ( y ) ⋅ ... ⋅ Fn ( y )
5
L.Kowalski - Uwagi o rozkładzie funkcji zmiennej losowej
Np. gdy X1, X2, …, Xn mają niezależne rozkłady jednostajne na przedziale (0, 1), to
dla y ≤ 0
0
 n
G( y) =  y
dla 0 < y ≤ 1
1
dla y > 1

Gęstość tego rozkładu wyraża się wzorem
dla y ≤ 0 oraz y ≥ 1
0
f ( y ) =  n−1
dla 0 < y < 1
ny
b)
Y = min(X1 , X2,…, Xn)
ma rozkład o dystrybuancie
G ( y ) = P(Y < y ) = 1 − P(Y ≥ y ) = 1 − P( X 1 ≥ y, X 2 ≥ y,...., X n ≥ y, ) =
= 1 − [(1 − F1 ( y )) ⋅ (1 − F2 ( y )) ⋅ ... ⋅ (1 − Fn ( y ))]
Np. gdy X1, X2, …, Xn mają niezależne rozkłady jednostajne na przedziale (0, 1), to
dla y ≤ 0
0

n
G ( y ) = 1 − (1 − y )
dla 0 < y ≤ 1
1
dla y > 1

Gęstość tego rozkładu wyraża się wzorem
0
f ( y) = 
n −1
n(1 − y )
dla y ≤ 0 oraz y ≥ 1
dla 0 < y < 1
Rozkłady funkcji od rozkładu normalnego.
(X1 , X2 , X3 ,...., Xn) - rozkład normalny.
Y = g(X1 , X2 , X3 ,...., Xn), należy wyznaczyć rozkład Y.
Przykład.
Y = a1X1 + a2X2 + a3X3 +....+ a3Xn + b
n=2
g ( y) =
gdzie: my = a1m1 + a2m2 + b,
1
σ y 2π
− ( y −m y ) 2
e
2σ 2y
2
y
σ = a12σ 12 + a22σ 22 + 2a1 a2 rσ 1 σ 2 ,
Przez indukcję można pokazać, że dla dowolnego n Y ma rozkład normalny o parametrach:
my = a1m1 + a2m2 + ... +anmn + b,
σ y2 = ∑ ai2σ i2 + 2∑ ai a j rijσ i σ j ,
i< j
Przykład.
X1 , ..., Xn - niezależne, o rozkładzie N(0, 1). Y n = X 12 + .... + X n2 ma rozkład chi kwadrat
n ∈N
EX = n;
 n2 −1 − 2y
y e
x>0
 n
f ( y) =  2  n 
2 Γ 

2
0
x≤0

D2X = 2n
6
L.Kowalski - Uwagi o rozkładzie funkcji zmiennej losowej
Przykład.
X - N(m, σ),
Y = eX
Ma rozkład logarytmiczno-normalny.
Nazwa pochodzi stąd, że X = lnY ma rozkład normalny.
ZADANIA
Zadanie 1
Wyznaczyć rozkład sumy dwóch niezależnych zmiennych losowych o rozkładzie Poissona
z parametrami λ1, λ2.
(odp. Jest to rozkład Poissona z parametrem λ1 + λ2)
Zadanie 2
Wyznaczyć rozkład różnicy
dwóch niezależnych zmiennych losowych o rozkładzie
wykładniczym z parametrem a.
−a y
(odp. Jest to rozkład Laplace'a: g ( y ) = ae
2
)
Zadanie 3
System składa się z 2 układów z których każdy ma czas bezawaryjnej pracy określony
rozkładem wykładniczym Xi o parametrze ai niezależnym od drugiego układu. Wyznaczyć
rozkład bezawaryjnego czasu pracy całego systemu (system działa jeśli oba układy pracują).
Y = min(X1 , X2 )
Odp. Jest to rozkład wykładniczy o parametrze a1 + a2.
Zadanie 4
System składa się z 2 układów, czas włączenia tych układów ma rozkład wykładniczy Xi o
parametrze ai niezależnym od drugiego układu. System zaczyna działać dopiero gdy włączą
się oba układy. Wyznaczyć rozkład
czasu rozpoczęcia pracy całego systemu.
Y = max(X1 , X2 ).
− a1 y
1 − e − a2 y + a 2 e − a2 y 1 − e − a1 y
y>0
(odp. g ( y ) = a1e
(
)
(
)
Nie jest to rozkład wykładniczy)
Zadanie 5
Wyznaczyć gęstość rozkładu logarytmiczno-normalnego.
(odp. g ( y) =
1
σy 2π
−
e
(ln y − m ) 2
2σ 2
y ≥ 0)
Zadanie 6
Wykonujemy niezależnie pomiar oporności R oraz prądu I (znamy błędy względne
DR
DI
δR =
= a, δI =
= b ). Następnie na tej podstawie chcemy ocenić poziom napięcia U = I⋅R,
R
I
oraz wartość mocy P = I2R.
Oblicz D2U, D2P, cov(U, P), ρ(U, P).
7
L.Kowalski - Uwagi o rozkładzie funkcji zmiennej losowej
 ∂U ∂U 
(odp. Y = (U, P) = T(R, I) gdzie T =  ∂R ∂I  =  I2 R  ,
∂P ∂P
2 IR 

 I
 ∂R ∂I 
 (a 2 + b 2 ) I 2 R 2 (a 2 + 2b 2 ) I 3 R 2 
a 2 + 2b 2
,
)
KY =  2
ρ
=

2
3 2
2
2
4 2
a 2 + b 2 a 2 + 4b 2
(a + 2b ) I R (a + 4b ) I R 
Zadanie 7
Przy równoległym łączeniu ogniw prąd w obwodzie określony jest wzorem:
I=
E
W
R+
n
E - siła elektromotoryczna ogniwa, W - jego opór wewnętrzny, n - ilość ogniw,
R - opór zewnętrzny.
Wyznaczyć wartość oczekiwaną i wariancję prądu jeśli E, R, W są niezależne i dane są ich
wartości oczekiwane oraz odchylenia standardowe.
Zadanie 8
X, Y - niezależne zmienne losowe o rozkładzie określonym funkcją prawdopodobieństwa
P(X = 0) = 1/2, P(X = 1) = 3/8, P(X = 2) = 1/8,
Wyznacz funkcję prawdopodobieństwa zmiennej losowej X + Y.
Zadanie 9
a) X, Y - niezależne zmienne losowe o rozkładzie jednostajnym w [0, 1].
Wyznacz gęstość zmiennej losowej X + Y. Wyznacz parametry tej zmiennej losowej.
b) X, Y, Z - niezależne zmienne losowe o rozkładzie jednostajnym w [0, 1].
Wyznacz gęstość zmiennej losowej X + Y + Z. Wyznacz parametry tej zmiennej losowej.
Zadanie wykonaj stosując splot gęstości a wynik sprawdź za pomocą funkcji
charakterystycznych.
Naszkicuj i porównaj wykresy gęstości zmiennych losowych
X,
X + Y,
X + Y + Z.
Zauważ, że gdy rośnie liczba rozpatrywanych składników, wykres gęstości staje się podobny
do krzywej Gaussa.
Zadanie 10
X - zmienna losowa odpowiadająca mierzonej wielkości (zakładamy, że ma
jednostajny w [0, 8]), Y - niezależna od X zmienna losowa opisująca błąd
(zakładamy, że ma rozkład normalny N(0, 1)).
Wyznacz
gęstość
zmiennej
losowej
odpowiadającej
wynikowi
U = X + Y. Wyznacz parametry tej zmiennej losowej.
Zadanie wykonaj stosując splot gęstości a wynik sprawdź za pomocą
charakterystycznych.
Naszkicuj wykres gęstości zmiennej losowej X + Y.
rozkład
pomiaru
pomiaru
funkcji
22.03.2009
8
Download