Wykład 8: Zmienne losowe dyskretne. Rozkłady Bernoulliego

advertisement
Rachunek prawdopodobieństwa MAP1064
Wydział Elektroniki, rok akad. 2008/09, sem. letni
Wykładowca: dr hab. A. Jurlewicz
Wykład 8: Zmienne losowe dyskretne. Rozkłady
Bernoulliego (dwumianowy), Pascala, Poissona. Przybliżenie Poissona rozkładu dwumianowego.
Definicja.
Zmienna losowa dyskretna (in. o rozkładzie dyskretnym)
to taka zmienna losowa, która przyjmuje z dodatnim prawdopodobieństwem jedynie skończoną lub nieskończoną przeliczalną liczbę różnych wartości.
Technika określania rozkładu
dyskretnej zmiennej losowej X:
Pełna informacja o rozkładzie dyskretnej zmiennej losowej X zawarta jest w ciągu par
{(xn , pn ), n ∈ T ⊂ N},
gdzie {xn , n ∈ T} to ciąg wszystkich wartości przyjmowanych przez zmienną losową X z
dodatnim prawdopodobieństwem, natomiast pn = P (X = xn ), n ∈ T.
Z ciągu tego możemy dostać informację o wartości funkcji PX (B) dla dowolnego zbioru
borelowskiego B:
X
pn ,
PX (B) = P (X ∈ B) =
n∈TB
gdzie TB to zbiór tych n, dla których xn ∈ B. W szczególności, dystrybuanta ma postać
F (x) = P (X < x) =
X
pn ,
n∈T(x)
gdzie T(x) to zbiór tych n, dla których xn < x. Inaczej mówiąc, zmienna losowa ma
rozkład dyskretny wtedy i tylko wtedy, gdy jej dystrybuanta jest funkcją schodkową.
Schodki są w punktach x1 , x2 , . . . i mają wysokości odpowiednio p1 , p2 , . . .
1
Ciąg {(xn , pn ), n ∈ T ⊂ N spełnia następujące warunki:
• {xn , n ∈ T} to ciąg różnowartościowy;
• pn ­ 0 dla każdego n ∈ T;
•
P
pn = 1.
n∈T
Jeżeli pewien ciąg {(xn , pn ), n ∈ T ⊂ N spełnia te warunki, to dla pewnej zmiennej
losowej X mamy pn = P (X = xn ). Ciąg ten ma wtedy probabilistyczną interpretację,
reprezentację, może być używany w modelach do definiowania rozkładu dyskretnego.
Przykład: X - zachowanie dziewczyny, gdy jej chłopak spóźnia sie na randkę, opisane liczbowo: X = −1 - gniewa się; X = 0 - nie zauważa; X = 1 - cieszy się, że wreszcie przyszedł:
1.1
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
−0.1
−2
1.1
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
−0.1
−2
p
p
2
1
−1.5
−1
3
p
−0.5
0
0.5
1
1.5
2
F(x)
p
3
p
2
p1
−1.5
−1
−0.5
x
0
Przykłady do zad. 7.1
2
0.5
1
1.5
2
Schemat Bernoulliego
Schemat Bernoulliego modeluje sytuację, w której:
1. Wykonujemy doświadczenie, w którym możliwe są dwa wyniki. Jeden z tych wyników
nazywamy sukcesem, drugi porażką. Szansa na wynik „sukces” wynosi p.
2. Doświadczenie możemy powtarzać bez zmiany warunków, niezależnie.
Plan I: Wykonamy n takich doświadczeń i zliczymy ilość sukcesów. Oznaczmy ilość
sukcesów przez X. Przed realizacją eksperymentu nie wiemy, jaka jest ta liczba. Wiemy
natomiast, że możliwe wartości X to 0, 1, 2, . . . , n oraz że dla k z tego zbioru możliwych
wartości
prawdopodobieństwo, że w n próbach otrzymamy dokładnie k sukcesów wynosi
n k
p
(1
−
p)n−k .
k
Ilość sukcesów w n próbach Bernoulliego X to dyskretna zmienna losowa.
Po wykonaniu planu otrzymamy konkretną liczbę - realizację tej zmiennej losowej.
X ma rozkład dwumianowy (inaczej Bernoulliego)
z parametrami n ∈ N i 0 < p < 1; w skrócie B(n, p)
xk = k, pk = P (X = k) =
n
k
pk (1 − p)n−k dla k = 0, 1, . . . , n.
B(1, p) nazywamy rozkładem zerojedynkowym z parametrem p.
3
Plan II: Będziemy wykonywać kolejne doświadczenia tak długo aż pojawi się wynik
„sukces”. Oznaczmy przez Y ilość wykonanych doświadczeń, czyli czas oczekiwania na
pierwszy sukces. Przed realizacją eksperymentu nie wiemy, jaka jest ta ilość. Wiemy natomiast, że możliwe wartości Y to 1, 2, . . . oraz że dla k z tego zbioru możliwych wartości
prawdopodobieństwo, że pierwszy sukces pojawi się w k-tej próbie wynosi p(1 − p)k−1 .
Y to czas oczekiwania na pierwszy sukces w ciągu prób Bernoulliego. Jest to
dyskretna zmienna losowa. Po wykonaniu planu otrzymamy konkretną liczbę - realizację
tej zmiennej losowej.
Y ma rozkład geometryczny z parametrem 0 < p < 1; w skrócie Geo(p)
xk = k, pk = P (Y = k) = p(1 − p)k−1 dla k = 1, 2, . . .
Plan III: Podobnie okreslimy Z - czas oczekiwania na m-ty sukces w ciągu prób
Bernoulliego z prawdopodobieństwem sukcesu p.
Z ma rozkład ujemny dwumianowy (in. Pascala) z parametrami m ∈ N i 0 < p < 1;
w skrócie N B(m, p)
xk = k, pk =
k−1
m−1
pm (1 − p)k−m dla k = m, m + 1, . . .
N B(1, p) to znany nam już rozkład geometryczny Geo(p).
Wzór na pk można uogólnić na dowolne m > 0. X nie ma wtedy interpretacji czasu oczekiwania na m-ty sukces. Nazwa „rozkład Pascala” odnosi się tylko do m ∈ N.
Przykłady do zad. 7.2
4
Rozkład Poissona
Rozkład Poissona z parametrem λ > 0; w skrócie P(λ), definiujemy ciągiem par:
λk −λ
xk = k, pk = e dla k = 0, 1, . . .
k!
Twierdzenie Poissona
(przybliżenie Poissona rozkładu dwumianowego)
Niech Xn oznacza liczbę sukcesów w n próbach Bernoulliego z prawdopodobieństwem
−→
sukcesu pn . Jeżeli pn −→
n→∞0 tak, że npn n→∞λ > 0, to dla dowolnego ustalonego k ∈ N
n k
λk −λ
P (Xn = k) =
pn (1 − pn )n−k −→
e = P (Yλ = k),
n→∞
k
k!
!
gdzie Yλ ma rozkład Poissona P(λ).
Dowód:
!
n k
1 n(n − 1) . . . (n − k + 1)
npn n
k
pn (1 − pn )n−k =
·
(np
)
(1 − pn )−k =
1
−
n
k
k!
nk
n
1
k−1
1
·1· 1−
... 1 −
=
k!
n
n
λ
1 k
−→
·1 ·
n→∞
k!
1
!k
e−λ =
!
npn
1 − pn
!k 1−
npn
n
n
−→
n→∞
λk −λ
e .
k!
Oszacowanie dokładności przybliżenia
w twierdzeniu Poissona:
Niech Xn oznacza liczbę sukcesów w n próbach Bernoulliego z prawdopodobieństwem
sukcesu p, Y - zmienna losową o rozkładzie Poissona P(λ) z λ = np. Wtedy dla dowolnego
zbioru borelowskiego B
|P (Xn ∈ B) − P (Y ∈ B)| ¬
λ2
= np2 .
n
W praktyce przybliżenie
n k
λk
p (1 − p)n−k ≈ e−λ ,
k
k!
!
gdzie λ = np, stosuje się dla n ­ 50, p ¬ 0, 1, np ¬ 10.
Przykłady do zad. 7.3
5
Download