Prawdopodobienstwo i statystyka

advertisement
Prawdopodobieństwo i statystyka
Wykład VII:
Rozkład i jego charakterystyki
22 listopada 2016
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Uprzednio wprowadzone pojęcia i ich własności
Definicja zmiennej losowej
Zmienna losowa na przestrzeni probabilistycznej (Ω, F, P) to
funkcja X : Ω → R1 posiadająca własność
X −1 ((a, +∞)) = {ω ; X (ω) > a} ∈ F,
a ∈ R1 .
Dowiedzielismy się, że ten fakt pociąga dużo więcej:
X −1 (B) ∈ F, dla każdego B ∈ B 1 ,
gdzie B 1 = σ{(a, +∞) ; a ∈ IR 1 } jest σ-algebrą podzbiorów
borelowskich IR 1 .
Jeśli X jest zmienną lsową, to f (X ) też jest zmienną losową,
o ile f : IR 1 → IR 1 jest funkcją borelowską, tzn.
f −1 ((a, +∞)) = {f > a} ∈ B1 , dla każdego a ∈ IR 1 .
Funkcje monotoniczne, schodkowe i ciągłe są funkcjami
borelowskimi.
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Uprzednio wprowadzone pojęcia i ich własności
Definicja wartości oczekiwanej
Wartość oczekiwana lub wartość średnia nieujemnej
zmiennej losowe X jest określona jako całka
EX :=
Z +∞
P(X > u) du ∈ [0, +∞].
0
Niech f będzie funkcją o wartościach rzeczywistych. Część
dodatnia f + i część ujemna f − funkcji f są określone jako
h+ (f ) h− (f ), gdzie h+ (x) = 0 ∨ x i h− (x) = 0 ∨ (−x).
Niech X będzie zmienna losową. Jeśli EX + < +∞ oraz
EX − < +∞, to mówimy, że wartość oczekiwana X
istnieje i definiujemy ją jako
EX := EX + − EX − ∈ (−∞, +∞).
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Własności wartości oczekiwanej
Twierdzenie
1
Jeśli X ­ 0, to EX ­ 0.
2
Jeśli X ­ 0 i EX = 0, to P(X = 0) = 1.
3
|EX | ¬ E |X |.
4
Jeśli E |X | < +∞ i E |Y | < +∞, to dla dowolnych liczb
α, β ∈ R1 funkcja αX + βY jest całkowalną zmienna
losową i mamy:
E (αX + βY ) = αEX + βEY .
5
Jeśli Y ­ X i wartości oczekiwane istnieją, to EY ­ EX .
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Dystrubuanta zmiennej losowej
Niech X ­ 0. Jak obliczyć EX 2 ?
Odpowiedź:
EX 2 = 2
Z ∞
uP X > u du.
0
W ogólności możemy obliczyć
Ef
(X ) gdy znamy
prawdopodobieństwa P X > u , lub, równoważnie,
1−P X >u =P X ¬u .
Definicja dystrybuanty
Dystrybuantą zmiennej losowej X nazywamy funkcję
FX : R1 → [0, 1] określoną wzorem
FX (u) = P(X ¬ u) ( = PX ((−∞, u]) ) .
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Własności dystrybuanty
Twierdzenie
1
Jeżeli u ¬ v , to FX (u) ¬ FX (v ) (monotoniczność).
2
FX jest funkcją prawostronnie ciągłą.
3
lim FX (u) = 0,
u→−∞
lim FX (u) = 1.
u→+∞
Twierdzenie (O dystrybuantach)
Jeżeli funkcja F : R1 → [0, 1] spełnia warunki 1-3 z
powyższego twierdzenia, to istnieje zmienna losowa X taka, że
F = FX .
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Rozkład zmiennej losowej
Wiemy, że
B 1 = σ{(u, +∞) ; u ∈ IR 1 } = σ{(−∞, u] ; u ∈ IR 1 }.
Mając daną FX (u) możemy określić funkcję PX na
pewnym podzbiorze B 1 , n.p.
PX (−∞, u] = FX (u),
PX (u, +∞) = 1 − FX (u),
PX (u, v ] = FX (v ) − FX (u),
PX (−∞, u) = lim FX (t) =: FX (u−),
t%u
PX (u, v ) = lim FX (t) − FX (u) = FX (v −) − FX (u),
t%v
PX [u, v ] = FX (v ) − lim FX (u) = FX (v ) − FX (u−),
t%u
PX {u} = FX (u) − FX (u−).
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Rozkład zmiennej losowej
Twierdzenie
Niech F będzie dystrybuantą na IR 1 . Istnieje dokładnie jedna
miara probabilistyczna PF na B 1 taka, że
PF (u, v ] = F (v ) − F (u).
Definicja
Rozkładem zmiennej losowej X nazywamy jedyną miarę
probabilistyczną PX na B 1 zadaną na odcinkach wzorem
PX ((u, v ]) := P(u < X ¬ v ) = P ({ω ; X (ω) ∈ (u, v ]}) .
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Rozkład zmiennej losowej
Wniosek
1
Znamy PX dokładnie wtedy, gdy
znamy FX .
R +∞
2
Jeśli X ­ 0, to EX = 0 PX (u, +∞) du i, bardziej
ogólnie, dla f dostatecznie regularnej
Ef (X ) =
Z +∞
0
f 0 (u)PX (u, +∞) du.
Wartość oczekiwana jest więc funkcją rozkładu (albo
dystrubuanty) zmiennej losowej.
Wynika stąd, że miary probabilistyczne na (IR 1 , B 1 )
odgrywaja szczególną rolę.
Nazywamy je „rozkładami” lub „rozkładami
prawdopodobieństwa”.
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Rozkłady dyskretne i absolutnie ciągłe
Rozkłady dyskretne
Zmienna losowa X ma rozkład dyskretny, jeśli istnieją liczby
x1 , x2 , . . . ∈ R1 i prawdopodobieństwa p1 , p2 , . . . ­ 0,
P∞
j=1 pj = 1, takie, że P(X = xj ) = pj , j = 1, 2, . . ..
Rozkłady absolutnie ciągłe
Zmienna losowa X ma rozkład absolutnie ciągły o gęstości
p(x), jeśli dla każdych a < b
P(a < X ¬ b) =
Z b
p(x) dx.
a
(Wtedy p(x) ­ 0 `-prawie wszędzie i p(x) dx = 1). Gęstość
rozkładu absolutnie ciągłego jest wyznaczona jednoznacznie z
dokładnością do równości `-prawie wszędzie (` jest miarą
Lebesgue’a).
R
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Więcej o rozkładach prawdopodobieństwa
Skoki dystrybuanty
PX {x} = P(X = x) > 0 dokładnie wtedy, gdy dystrybuanta
FX ma skok (nieciągłość) has w x i wtedy
FX (x) − FX (x−) = P(X = x).
Pochodna dystrybuanty a gęstość
Każda dystrybuanta F jest `-prawie wszędzie różniczkowalna i
jej pochodna F 0 (określona `-prawie wszędzie) spełnia
następujący warunek.
F (x) ­
Z
F 0 (x) dx.
(−∞,x]
MożeR się zdarzyć, że R1 F 0 (x) dx < 1.
Jeśli R1 F 0 (x) dx = 1, to rozkład odpowiadający F jest
absolutnie ciągły z gęstością p(x) = F 0 (x).
R
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Więcej o rozkładach prawdopodobieństwa
Obliczanie EX dla rozkładów dyskretnych
Jeśli X ma rozkład dyskretny, to dla dowolnej funkcji
f : R1 → R1 mamy
Ef (X ) =
∞
X
f (xi )P(X = xi ) =
i=1
∞
X
f (xi )pi ,
i=1
przy czym Ef (X ) istnieje (jest skończona) dokładnie wtedy,
gdy
∞
X
|f (xi )|pi < +∞.
i=1
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Więcej o rozkładach prawdopodobieństwa
Obliczanie EX dla rozkładów absolutnie ciągłych
Jeśli rozkład X jest absolutnie ciągły z gęstością p(x), to dla
każdej funkcji borelowskiej f : R1 → R1 mamy
Ef (X ) =
Z +∞
f (x)p(x) dx,
−∞
przy
czym Ef (X ) istnieje dokładnie wtedy, gdy
R +∞
−∞ |f (x)|p(x) dx < +∞.
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Najważniejsze rozkłady dyskretne
1
Rozkład zdegenerowany w C („miara Diraca” δC ):
P(X = C ) = 1.
2
Rozkład B(p) („0 − 1” lub Bernoullego):
P(X = 1) = p = 1 − P(X = 0).
3
Rozkład dwumianowy Bi (N, p):
!
N k
P(X = k) =
p (1 − p)N−k ,
k
4
Rozkład Poissona Po(λ):
λk
,
k!
Rozkład geometryczny Ge(p):
P(X = k) = e −λ
5
k = 0, 1, 2, . . . , N.
k = 0, 1, 2, . . . .
P(X = k) = p(1 − p)k−1 ,
Prawdopodobieństwo i statystyka
k = 1, 2, . . . .
Wykład VII: Rozkład i jego charakterystyki
Najważniejsze rozkłady absolutnie ciągłe
1
Rozkład jednostajny U(a, b) na odcinku (a, b):
p(x) =
2
1
I(a,b) (x).
b−a
Rozkład normalny (lub gaussowski) N (m, σ 2 ) z
parametrami m ∈ IR 1 i σ 2 > 0:
p(x) = √
3
(x−m)2
1
e − 2σ2 .
2πσ
Rozkład Cauchy’ego Ca(θ):
θ
.
p(x) = π x 2 + θ2
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Najważniejsze rozkłady absolutnie ciągłe
4
Rozkład wykładniczy Ex (λ) z parametrem λ > 0.
p(x) = λe −λx I(0,+∞) (x).
5
Rozkład gamma G(α, λ) z parametrami α, λ > 0:
p(x) =
6
7
λα α−1 −λx
x e I(0,+∞) (x).
Γ(α)
Rozkład χ-kwadrat z n stopniami swobody (χ2 (n)) jest
rozkładem gamma z α = n/2, λ = 1/2.
Zauważmy również, że Ex (λ) = G(1, λ).
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Słowniczek teorii prawdopodobieństwa
Definicje
Moment absolutny rzędu p > 0 zmiennej losowej X jest
określony wzorem
mp = mp (X ) = E |X |p .
Jeśli X jest całkowalna z kwadratem (tzn. EX 2 < +∞),
wtedy jej wariancja jest określona wzorem
D 2 (X ) = VarX := E (X − EX )2 = EX 2 − (EX )2 .
Odchylenie standardowe całkowalnej z kwadratem
zmiennej losowej X jest dane wzorem
√
D(X ) :=
VarX =
Prawdopodobieństwo i statystyka
q
E (X − EX )2 .
Wykład VII: Rozkład i jego charakterystyki
Słowniczek teorii prawdopodobieństwa
Definicje
Medianą zmiennej losowej X (właściwie: rozkładu
zmiennej losowej) nazywamy taką liczbę x1/2 , że
P(X ¬ x1/2 ) ­ 1/2,
P(X ­ x1/2 ) ­ 1/2.
Kwantylem rzędu p, p ∈ (0, 1), rozkładu zmiennej losowej
X nazywamy taką liczbę xp , że
P(X ¬ xp ) ­ p,
P(X ­ xp ) ­ 1 − p.
Zadanie: Przypuśćmy, że znamy dystrybuantę FX
zmiennej losowej X . Jak znaleźć medianę i kwantyle tej
zmiennej?
Prawdopodobieństwo i statystyka
Wykład VII: Rozkład i jego charakterystyki
Download