Rachunek prawdopodobieństwa MAP1064 Wydział Elektroniki, rok akad. 2008/09, sem. letni Wykładowca: dr hab. A. Jurlewicz Wykład 8: Zmienne losowe dyskretne. Rozkłady Bernoulliego (dwumianowy), Pascala, Poissona. Przybliżenie Poissona rozkładu dwumianowego. Definicja. Zmienna losowa dyskretna (in. o rozkładzie dyskretnym) to taka zmienna losowa, która przyjmuje z dodatnim prawdopodobieństwem jedynie skończoną lub nieskończoną przeliczalną liczbę różnych wartości. Technika określania rozkładu dyskretnej zmiennej losowej X: Pełna informacja o rozkładzie dyskretnej zmiennej losowej X zawarta jest w ciągu par {(xn , pn ), n ∈ T ⊂ N}, gdzie {xn , n ∈ T} to ciąg wszystkich wartości przyjmowanych przez zmienną losową X z dodatnim prawdopodobieństwem, natomiast pn = P (X = xn ), n ∈ T. Z ciągu tego możemy dostać informację o wartości funkcji PX (B) dla dowolnego zbioru borelowskiego B: X pn , PX (B) = P (X ∈ B) = n∈TB gdzie TB to zbiór tych n, dla których xn ∈ B. W szczególności, dystrybuanta ma postać F (x) = P (X < x) = X pn , n∈T(x) gdzie T(x) to zbiór tych n, dla których xn < x. Inaczej mówiąc, zmienna losowa ma rozkład dyskretny wtedy i tylko wtedy, gdy jej dystrybuanta jest funkcją schodkową. Schodki są w punktach x1 , x2 , . . . i mają wysokości odpowiednio p1 , p2 , . . . 1 Ciąg {(xn , pn ), n ∈ T ⊂ N spełnia następujące warunki: • {xn , n ∈ T} to ciąg różnowartościowy; • pn ­ 0 dla każdego n ∈ T; • P pn = 1. n∈T Jeżeli pewien ciąg {(xn , pn ), n ∈ T ⊂ N spełnia te warunki, to dla pewnej zmiennej losowej X mamy pn = P (X = xn ). Ciąg ten ma wtedy probabilistyczną interpretację, reprezentację, może być używany w modelach do definiowania rozkładu dyskretnego. Przykład: X - zachowanie dziewczyny, gdy jej chłopak spóźnia sie na randkę, opisane liczbowo: X = −1 - gniewa się; X = 0 - nie zauważa; X = 1 - cieszy się, że wreszcie przyszedł: 1.1 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 −0.1 −2 1.1 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 −0.1 −2 p p 2 1 −1.5 −1 3 p −0.5 0 0.5 1 1.5 2 F(x) p 3 p 2 p1 −1.5 −1 −0.5 x 0 Przykłady do zad. 7.1 2 0.5 1 1.5 2 Schemat Bernoulliego Schemat Bernoulliego modeluje sytuację, w której: 1. Wykonujemy doświadczenie, w którym możliwe są dwa wyniki. Jeden z tych wyników nazywamy sukcesem, drugi porażką. Szansa na wynik „sukces” wynosi p. 2. Doświadczenie możemy powtarzać bez zmiany warunków, niezależnie. Plan I: Wykonamy n takich doświadczeń i zliczymy ilość sukcesów. Oznaczmy ilość sukcesów przez X. Przed realizacją eksperymentu nie wiemy, jaka jest ta liczba. Wiemy natomiast, że możliwe wartości X to 0, 1, 2, . . . , n oraz że dla k z tego zbioru możliwych wartości prawdopodobieństwo, że w n próbach otrzymamy dokładnie k sukcesów wynosi n k p (1 − p)n−k . k Ilość sukcesów w n próbach Bernoulliego X to dyskretna zmienna losowa. Po wykonaniu planu otrzymamy konkretną liczbę - realizację tej zmiennej losowej. X ma rozkład dwumianowy (inaczej Bernoulliego) z parametrami n ∈ N i 0 < p < 1; w skrócie B(n, p) xk = k, pk = P (X = k) = n k pk (1 − p)n−k dla k = 0, 1, . . . , n. B(1, p) nazywamy rozkładem zerojedynkowym z parametrem p. 3 Plan II: Będziemy wykonywać kolejne doświadczenia tak długo aż pojawi się wynik „sukces”. Oznaczmy przez Y ilość wykonanych doświadczeń, czyli czas oczekiwania na pierwszy sukces. Przed realizacją eksperymentu nie wiemy, jaka jest ta ilość. Wiemy natomiast, że możliwe wartości Y to 1, 2, . . . oraz że dla k z tego zbioru możliwych wartości prawdopodobieństwo, że pierwszy sukces pojawi się w k-tej próbie wynosi p(1 − p)k−1 . Y to czas oczekiwania na pierwszy sukces w ciągu prób Bernoulliego. Jest to dyskretna zmienna losowa. Po wykonaniu planu otrzymamy konkretną liczbę - realizację tej zmiennej losowej. Y ma rozkład geometryczny z parametrem 0 < p < 1; w skrócie Geo(p) xk = k, pk = P (Y = k) = p(1 − p)k−1 dla k = 1, 2, . . . Plan III: Podobnie okreslimy Z - czas oczekiwania na m-ty sukces w ciągu prób Bernoulliego z prawdopodobieństwem sukcesu p. Z ma rozkład ujemny dwumianowy (in. Pascala) z parametrami m ∈ N i 0 < p < 1; w skrócie N B(m, p) xk = k, pk = k−1 m−1 pm (1 − p)k−m dla k = m, m + 1, . . . N B(1, p) to znany nam już rozkład geometryczny Geo(p). Wzór na pk można uogólnić na dowolne m > 0. X nie ma wtedy interpretacji czasu oczekiwania na m-ty sukces. Nazwa „rozkład Pascala” odnosi się tylko do m ∈ N. Przykłady do zad. 7.2 4 Rozkład Poissona Rozkład Poissona z parametrem λ > 0; w skrócie P(λ), definiujemy ciągiem par: λk −λ xk = k, pk = e dla k = 0, 1, . . . k! Twierdzenie Poissona (przybliżenie Poissona rozkładu dwumianowego) Niech Xn oznacza liczbę sukcesów w n próbach Bernoulliego z prawdopodobieństwem −→ sukcesu pn . Jeżeli pn −→ n→∞0 tak, że npn n→∞λ > 0, to dla dowolnego ustalonego k ∈ N n k λk −λ P (Xn = k) = pn (1 − pn )n−k −→ e = P (Yλ = k), n→∞ k k! ! gdzie Yλ ma rozkład Poissona P(λ). Dowód: ! n k 1 n(n − 1) . . . (n − k + 1) npn n k pn (1 − pn )n−k = · (np ) (1 − pn )−k = 1 − n k k! nk n 1 k−1 1 ·1· 1− ... 1 − = k! n n λ 1 k −→ ·1 · n→∞ k! 1 !k e−λ = ! npn 1 − pn !k 1− npn n n −→ n→∞ λk −λ e . k! Oszacowanie dokładności przybliżenia w twierdzeniu Poissona: Niech Xn oznacza liczbę sukcesów w n próbach Bernoulliego z prawdopodobieństwem sukcesu p, Y - zmienna losową o rozkładzie Poissona P(λ) z λ = np. Wtedy dla dowolnego zbioru borelowskiego B |P (Xn ∈ B) − P (Y ∈ B)| ¬ λ2 = np2 . n W praktyce przybliżenie n k λk p (1 − p)n−k ≈ e−λ , k k! ! gdzie λ = np, stosuje się dla n ­ 50, p ¬ 0, 1, np ¬ 10. Przykłady do zad. 7.3 5