Rozkład dwumianowy Matematyczne podstawy teorii ryzyka i ich zastosowanie R. Łochowski Rozkład dwumianowy • Niech X1,..., X n będzie ciągiem niezależnych zmiennych losowych o rozkładzie 0-1: P ( X i = 1) = p = 1 − P ( X i = 0 ) . • Zmienną o rozkładzie dwumianowym Bin(n,p) definiujemy jako sumę Sn = X1 + X2 + … + X n. • Rozkład zmiennej Sn dany jest wzorem P (S n n k n−k = k ) = p (1 − p ) . k Momenty rozkładu dwumianowego • Wartość oczekiwana rozkładu dwumianowego n n−k k ESn = ∑ P(Sn = k ) ⋅ k = ∑ ⋅ p ⋅ (1 − p) ⋅ k = ? k k =0 k =0 n n • Prościej - wykorzystujemy tylko liniowość wartości oczekiwanej, E(X +Y ) = EX + EY , nie korzystamy zaś z niezależności zmiennych X 1, … , X n : ESn = E (X1 + … + X n ) = EX1 + … + EX n = np. Momenty rozkładu dwumianowego, c.d. • Wariancja rozkładu dwumianowego n D (Sn ) = ∑ P(Sn = k ) ⋅ (k − ESn ) 2 2 k =0 n n−k 2 k = ∑ ⋅ p ⋅ (1 − p) ⋅ (k − np) = ? k k =0 n • Prościej - korzystamy z niezależności X1, …, X n D2 (Sn ) = D2 (X1 + … + X n ) = D (X1 ) + … + D (X n ) = np (1 − p ). 2 2 Rozkład dwumianowy w praktyce • Ubezpieczyciel posiada w portfelu n = 10000 ubezpieczonych od kradzieży samochodów na terenie miasta X. • Prawdopodobieństwo kradzieży samochodu na terenie X wynosi p = 0.001. • Sn ∼ Bin (10000, 0.001) jest rozkładem liczby skradzionych samochodów. 10000 10000−k k P (Sn ≤ 10) = ∑ = ??? 0.001 ⋅ 0.999 k =0 k 10 Przybliżenie rozkładem Poissona Rozkład dwumianowy Bin(n,p) Rozkład Poissona Poi (λ) • Formuła • Formuła P (Y = k ) = e n k n −k P (Sn = k ) = p q k k 0 1 2 3 4 5 6 7 8 9 10 P(Sn = k) 4,52E-05 0,000452 0,002263 0,007549 0,018886 0,037795 0,063024 0,09007 0,112622 0,12516 0,125173 −λ λ = np P(Y=k) 4,54E-05 0,000454 0,00227 0,007567 0,018917 0,037833 0,063055 0,090079 0,112599 0,12511 0,12511 błąd względny przybliżenia -0,50% -0,40% -0,31% -0,23% -0,16% -0,10% -0,05% -0,01% 0,02% 0,04% 0,05% k λ k! Rozkład Poissona Źródło: Wikipedia Rozkład dwumianowy w praktyce, c. d. • Ubezpieczyciel posiada w portfelu n = 1000 ubezpieczonych od kradzieży rowerów na terenie miasta X. • Prawdopodobieństwo kradzieży roweru na terenie X wynosi p = 0.1. • Sn ∼ Bin (1000, 0.1) jest rozkładem liczby skradzionych rowerów. 1000 1000−k k P (Sn ≤ 100) = ∑ = ??? 0.1 ⋅ 0.9 k =0 k 100 Przybliżenie rozkładem normalnym • Przybliżenie rozkładem Poissona i rozkładem normalnym k 95 96 97 98 99 100 101 102 103 104 105 P(Sn = k) 0,037334 0,039106 0,040494 0,041458 0,04197 0,042017 0,041601 0,04074 0,039465 0,037821 0,03586 P(Y=k) błąd względny przybliżenia 0,036012 3,54% 0,037513 4,07% 0,038673 4,50% 0,039462 4,81% 0,039861 5,03% 0,039861 5,13% 0,039466 5,13% 0,038692 5,03% 0,037566 4,81% 0,036121 4,50% 0,034401 4,07% k 95 96 97 98 99 100 101 102 103 104 105 P(Sn = k) Φ((k-np)/(npq)^.5) błąd względny przybliżenia 0,037334 0,036599077 1,97% 0,039106 0,038475552 1,61% 0,040494 0,040001298 1,22% 0,041458 0,041128022 0,80% 0,04197 0,041819233 0,36% 0,042017 0,042052209 -0,08% 0,041601 0,041819233 -0,53% 0,04074 0,041128022 -0,95% 0,039465 0,040001298 -1,36% 0,037821 0,038475552 -1,73% 0,03586 0,036599077 -2,06% • Lepsze przybliżenie - rozkładem normalnym twierdzenie graniczne de Moivre’a – Laplace’a: (S n − ESn ) / D (Sn ) ∼ N (0,1) Przybliżenie rozkładem normalnym c.d. • Jeżeli chcemy obliczyć P (k1 ≤ Sn ≤ k2 ), to stosujemy przybliżenie: k − np S − np k − np 1 P (k1 ≤ Sn ≤ k2 ) = P ≤ n ≤ 2 npq npq npq k + 0.5 − np k − 0.5 − np 2 1 ≈ Φ − Φ , npq npq • gdzie Φ - dystrybuanta standardowego rozkładu normalnego x 1 −t 2 /2 Φ (x ) = e dt. ∫ 2π −∞ Błąd dla przybliżenia rozkładem Poissona i rozkładem normalnym • Błąd bezwzględny przybliżenia rozkładu dwumianowego rozkładem Poissona można oszacować za pomocą wzoru 2 λ P (Sn ∈ A) − P (Y ∈ A) ≤ . n • Błąd bezwzględny przybliżenia rozkładu dwumianowego rozkładem normalnym można oszacować za pomocą wzoru S − np 2 2 p + q n P ≤ t − Φ (t ) ≤ . npq npq