Wykład 4 Rozkłady i ich dystrybuanty Dwa typy zmiennych losowych

advertisement
Wykład 4
Rozkłady i ich dystrybuanty
Dwa typy zmiennych losowych
• Jeśli wszystkie wartości, jakie może przyjmować zmienna można wypisać w postaci ciągu {x1 , x2 , ...},
to mówimy, że jest to zmienna dyskretna.
• Jeśli wszystkich wartości zmiennej NIE MOŻNA wypisać w postaci ciągu, to mówimy, że jest to
zmienna ciągła.
• Tak jest zawsze, gdy zbiór wartości zawiera jakiś przedział (a, b).
Rozkład zmiennej losowej dyskretnej
Rozkład takiej zmiennej to opis jej możliwych wartości i prawdopodobieństw, z jakimi te wartości zmienna
przyjmuje.
• X = wynik rzutu symetryczną kostką
• Wartości, jakie może przyjąć X to 1, 2, 3, 4, 5 i 6.
• Prawdopodobieństwo każdej z tych wartości jest równe 61 .
• Wygodnie jest podać ten rozkład w tabelce:
xk
pk
1
2
3
4
5
6
1
6
1
6
1
6
1
6
1
6
1
6
•
Wartość średnia zmiennej losowej
• Jeżeli P (X = xk ) = pk ,
k = 0, 1, 2, 3, ..., to
• wartość średnia (wartość oczekiwana) zmiennej X
E(X) =
X
xk · pk .
k
• Intuicja: na prostej rozmieszczamy masy pi w punktach xi , i = 0, 1, 2....
• Wartość średnia to środek ciężkości tego układu (może nie istnieć!)
• Jaka jest wartość średnia (wartość oczekiwana) liczby oczek w jednym rzucie kostką?
Wariancja zmiennej losowej
• Jeżeli P (X = xk ) = pk ,
k = 0, 1, 2, 3, ..., to
• wariancja zmiennej X
V ar(X) =
X
(xk − E(X))2 · pk .
k
• Wariancję oznacza się też symbolem D2 (X).
• Wariancja mierzy rozrzut wyników — średnie odchylenie od wartości średniej.
• Wariancję można też obliczyć ze wzoru
V ar(X) =
X
k
1
x2k · pk − (E(X))2 .
Rozkłady ciągłe (z gęstością)
• Jeśli dana jest taka funkcja f : R → [0, ∞), że
R∞
−∞ f (x) dx
= 1, to
• f nazywamy gęstością rozkładu zmiennej X i obliczamy
• prawdopodobieństwa
Z b
P (a < X < b) =
f (x) dx.
a
Przykłady gęstości
• Rozkład jednostajny na odcinku [a, b]
•
f (x) =

1

 b−a ,
gdy x ∈ [a, b],

 0,
gdy x ∈
/ [a, b].
Przykłady gęstości
• Rozkład normalny z parametrami m ∈ R i σ > 0
•
f (x) = √
(x−m)2
1
e− 2σ2 ,
2π σ
x∈R
Przykłady gęstości
• Rozkład wykładniczy z parametrem λ > 0
•
f (x) =


 0, gdy x < 0,

 λe−λx , gdy x ­ 0.
Wartość średnia
• Gdy rozkład ma gęstość f (x), to
•
Z ∞
E(X) =
x f (x) dx,
gdy całka jest zbieżna.
−∞
• Gdy całka nie jest zbieżna, to E(X) nie istnieje.
Wariancja
• Gdy rozkład ma gęstość f (x), to
•
D2 (X) =
Z ∞
(x − E(X))2 f (x) dx,
gdy całka zbieżna.
−∞
• Gdy całka nie jest zbieżna, to D2 (X) nie istnieje.
• Wariancję można też liczyć ze wzoru
2
Z ∞
D (X) =
x2 f (x) dx − (E(X))2 .
−∞
Jak opisać cały rozkład jedną funkcją?
2
• Przypuśćmy, że na prostej rozłożyliśmy masę jednostkową.
• Aby znać masę każdego odcinka, wystarczy znać masę każdej półprostej (−∞, t) dla wszystkich t ∈ R,
bo wtedy
• m(a, b) = m(−∞, b) − m(−∞, a].
• Analogicznie: aby znać rozkład zmiennej X, musimy umieć obliczyć P (a < X < b) dla dowolnych
a < b.
• W tym celu wystarczy znać P (−∞ < X < t) dla wszystkich t ∈ R, bo wtedy
• P (a < X < b) = P (−∞ < X < b) − P (−∞ < X ¬ a).
Dystrybuanta rozkładu
Niech X będzie zmienną losową. Funkcję zmiennej t ∈ R określoną wzorem
FX (t) = P (X < t)
nazywamy dystrybuantą rozkładu zmiennej X.
Przykłady dystrybuant
• Jeżeli X jest stała, to znaczy X ≡ c, wtedy
•
(
FX (t) =
0,
1,
gdy t ¬ c,
gdy t > c,
Przykłady dystrybuant
• Jeżeli X ma rozkład dwupunktowy, to znaczy dla pewnych x1 < x2
(
X=
x1
x2
z prawdopodobieństwem p,
z prawdopodobieństwem 1 − p,
• wtedy dystrybuantą jest funkcja
•
FX (t) =


 0,
gdy t ¬ x1 ,
gdy x1 < t ¬ x2 ,
gdy t > x2 ,
p,

 1,
Przykłady dystrybuant
• Jeżeli Sn ma rozkład Bernoulliego z parametrami n oraz p, to
•
FX (t) =

0,





 ...,
...,



....



1,
gdy
gdy
gdy
...
gdy
t ¬ 0,
0 < t ¬ 1,
1 < t ¬ 2,
t > n.
Przykłady dystrybuant
• Jeżeli X ma rozkład jednostajny na odcinku [a, b], to
•
FX (t) =


 0,
t−a
b−a ,

 1,
3
gdy t ¬ a,
gdy a < t ¬ b,
gdy t > b.
Przykłady dystrybuant
• Jeżeli X ma standardowy rozkład normalny, to znaczy z parametrami m = 0 i σ = 1, wówczas
•
Z t
FX (t) =
−∞
1
2
√ e−x /2 dx.
2π
• Ta pierwotna nie jest funkcją elementarną, więc trzeba było:
• nadać jej nazwę (oznaczenie) oraz
• stablicować wartości.
• Nazwano ją Φ(t),
• tablice jej wartości dla t ∈ [0, 3] można znaleźć w większości podręczników do statystyki lub w
internecie, np. http://neyman.im.pwr.wroc.pl/˜szajow/sas/node40.html
Własności dystrybuanty
Każda dystybuanta F : R −→ R ma następujące trzy własności:
• F jest funkcją niemalejącą.
• F jest funkcją lewostronnie ciągłą (bo w definicji przyjęliśmy P (X < t)).
• limt→−∞ F (t) = 0,
limt→∞ F (t) = 1.
Jak rozpoznać dystrybuantę?
Jeśli dana jest funkcja F : R −→ R, która jest
• niemalejąca,
• lewostronnie ciągła i
• ma granice: 0 w −∞ oraz 1 w ∞,
• to jest ona dystrybuantą rozkładu pewnej zmiennej losowej.
Zadanie Dla jakich stałych a oraz b funkcja
F (t) =



dla t ¬ 0,
dla 0 < t ¬ 1,
dla t > 1,
0,
at + b,


1,
jest dystrybuantą?
Rozwiązanie:
• Granice są już takie, jak trzeba.
• Tak określona funkcja jest lewostronnie ciagła.
• Dla jakich a, b jest niemalejąca?
• Oczywiście a ­ 0.
• Nie może maleć w otoczeniu zera, więc b ­ 0.
• Nie może maleć w otoczeniu jedynki, więc a + b ¬ 1.
Kiedy rozkład jest ciągły tzn. ma gęstość?
• Dana jest dystrybuanta F (t). Jak poznać, czy ten rozkład ma gęstość?
• Dystrybuanta rozkładu z gęstością to całka z tej gęstości, więc
4
• gęstość to pochodna dystrybuanty.
• Gdy na przykład F (t) =
1
π
• gęstość jest równa F 0 (t) =
arctg x + 12 , to
1 1
π 1+t2 .
Kiedy rozkład jest ciągły?
• Gdy dystrybuanta FX (t) ma pochodną (poza co najwyżej skończoną liczbą punktów),
• ta pochodna jest nieujemna i
• całka po całej prostej z tej pochodnej jest równa 1,
• to ta pochodna jest gęstością rozkładu.
• Wówczas
Z b
P (a < X < b) =
a
FX0 (t)dt.
Kiedy rozkład jest dyskretny?
• Gdy dystrybuanta jest funkcją stałą na przedziałach, a rośnie tylko w punktach skoków,
• to jest dystrybuantą zmiennej X o rozkładzie dyskretnym.
• Jeśli xi jest punktem skoku dystrybuanty, to
• P (X = xi )= wysokość skoku dystrybuanty w tym punkcie.
Parametry rozkładu normalnego
Przypuśćmy, że zmienna losowa X ma rozkład normalny z parametrami m ∈ R oraz σ > 0, tzn.
• rozkład o gęstości
f (x) = √
−(x−m)2
1
e 2σ2 .
2π σ
• E(X) =?
• V ar(X) =?
• E(X) = m
• V ar(X) = σ 2
Mediana
Przypuśćmy, że dana jest zmienna losowa X.
• Medianą zmiennej X nazywamy każdą taką liczbę m, dla której zachodzą nierówności:
•
1
P (−∞ < X ¬ m) ­ ,
2
1
P (m ¬ X < ∞) ­ .
2
• Mediana m dzieli rozkład „na połowy” tzn.
• na lewo od m jest co najmniej połowa prawdopodobieństwa i
• na prawo od m jest co najmniej połowa prawdopodobieństwa.
• Jak obliczać medianę za pomoca dystrybuanty?
• Dlaczego definicja formalna jest tak skomplikowana?
Kwantyle i kwartyle
Przypuśćmy, że dana jest zmienna losowa X.
5
• Kwantylem rzędu p nazywamy każdą taką liczbę xp , dla której zachodzą nierówności:
•
P (−∞ < X ¬ xp ) ­ p,
P (xp ¬ X < ∞) ­ 1 − p.
• To znaczy na lewo od xp jest co najmniej p, a na prawo co najmniej 1 − p całego prawdopodobieństwa.
• Kwartyle to kwantyle rzędu 14 , 12 ,
3
4
oraz 44 .
• Mediana to kwantyl rzędu 12 .
• Jak liczyć kwartyle (kwantyle) za pomocą dystrybuanty?
6
Download