Statystyka Wydział Zarządzania Uniwersytetu Łódzkiego 2017 Podstawowe rozkłady zmiennych losowych Rozkłady zmiennych skokowych Rozkład zero-jedynkowy Rozpatrujemy doświadczenie, którego rezultatem może być zdarzenie A lub zdarzenie do niego przeciwne Ā. Niech: P(A) = p, P(A) = 1− p. Na zbiorze zdarzeń elementarnych tego doświadczenia definiujemy zmienną losową X w następujący sposób: ⎧⎪ 1, gdy ω ∈A, X(ω ) = ⎨ ⎪⎩ 0, gdy ω ∉A. Rozkład prawdopodobieństwa tej zmiennej dany jest funkcją prawdopodobieństwa: P(X = 1) = p, P(X = 0) = 1− p. Rozkład zero-jedynkowy Wartość oczekiwana tej zmiennej jest równa E(X) = 1⋅ p + 0 ⋅(1− p) = p. Wariancja i odchylenie standardowe są równe: Var(X) = (1− p)2 ⋅ p + (0 − p)2 ⋅(1− p) = p(1− p), SD(X) = p(1− p). Przykład. Agent ubezpieczeniowy wie (z doświadczenia), że prawdopodobieństwo sfinalizowania umowy w czasie umówionego spotkania wynosi 0,2. Agent umawia się na jedno spotkanie dziennie. Liczba zawieranych dziennie umów jest zmienną losową X o rozkładzie zero-jedynkowym z parametrem p = 0,2. Jej rozkład dany jest funkcją prawdopodobieństwa określoną za pomocą tabeli: Liczba umów zawartych w ciągu dnia 0 1 Prawdopodobieństwo 0,8 0,2 E(X) = p = 0,2, SD(X) = 0,2 ⋅(1− 0,2) = 0, 4. Agent zawiera dziennie średnio 0,2 ± 0,4 umowy. Rozkład dwumianowy (Bernoulliego) Rozpatrujemy doświadczenie zwane schematem Bernoulliego. Polega ono, jak wiemy, na n-krotnym powtarzaniu tego samego doświadczenia, kończącego się wyłącznie dwoma wynikami: albo sukcesem, z prawdopodobieństwem p, albo porażką, z prawdopodobieństwem q = 1 - p. Na zbiorze zdarzeń elementarnych tego doświadczenia określamy zmienną losową X jako liczbę uzyskanych sukcesów w n próbach. Zgodnie z tym co powiedzieliśmy o prawdopodobieństwie takiego zdarzenia, rozkład zmiennej losowej X opisuje funkcja prawdopodobieństwa dana wzorem: ⎛ n ⎞ k n−k P(X = k) = ⎜ ⎟ ⋅ p q , ⎝ k⎠ k = 0,1,2,…,n. Rozkład dwumianowy (Bernoulliego) Można łatwo pokazać, że wartość oczekiwana i odchylenie standardowe zmiennej losowej o rozkładzie dwumianowym są dane wzorami: E(X) = np, SD(X) = npq. Zauważmy również, że z formalnego punktu widzenia, zmienną losową X można traktować jako sumę n niezależnych zerojedynkowych: X1, X2, …, Xn o rozkładzie zero-jedynkowym z tym samym parametrem p: X = X1 + X2 +…+ Xn . Przykład. Nasz Agent postanowił umawiać się na 6 spotkań dziennie. Liczba zawieranych dziennie umów jest zmienną losową X o rozkładzie dwumianowym z parametrami p = 0,2 i n = 6. Jej rozkład dany jest funkcją prawdopodobieństwa: ⎛ 6⎞ k 6−k P(X = k) = ⎜ ⎟ ⋅ 0,2 ⋅ 0,8 , ⎝ k⎠ k = 0,1,…,6. Obliczone na podstawie tego wzoru prawdopodobieństwa podajemy w poniższej tabeli: Liczba umów zawartych w ciągu dnia, k Prawdopodobieństwo P(X = k) 0 1 2 3 4 5 6 0,26214 0,39322 0,24576 0,08192 0,01536 0,00154 0,00006 Zgodnie ze wzorem na wartość oczekiwaną i odchylenie standardowe zmiennej losowej o rozkładzie dwumianowym mamy E(X) = np = 6 ⋅ 0,2 = 1,2, SD(X) = 6 ⋅ 0,2 ⋅ 0,8 = 0,98. Agent zawiera dziennie średnio 1,2 ± 0,98 umowy. Wykres funkcji prawdopodobieństwa 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 Rozkłady Bernoulliego w n = 20 próbach z różnymi parametrami p p = 0,2 p = 0,4 p = 0.5 p = 0,9 0,3 0,225 0,15 0,075 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Rozkłady Bernoulliego z parametrem p = 0,5 i w różnych parametrach n n=5 n = 15 n = 50 n = 75 0,4 0,3 0,2 0,1 0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 Rozkład Poissona Jeśli zmienna losowa jest liczbą zajść pewnego zdarzenia losowego w określonym przedziale czasu, np. liczbą awarii urządzenia w ciągu tygodnia, liczbą wypadków samochodowych w ciągu miesiąca, to jej rozkład opisuje funkcja prawdopodobieństwa postaci: µ k ⋅ e− µ P(X = k) = , k = 0,1,2, 3,… k! gdzie 𝛍 jest wartością oczekiwaną rozkładu i jednocześnie jego wariancją: E(X) = µ, Var(X) = µ. Przykład. W pewnym przedsiębiorstwie zaobserwowano, że w ciągu miesiąca zdarzają się średnio 2 wypadki. Oznaczmy przez X zmienną losową, która jest liczbą wypadków w losowo wybranym miesiącu. Zmienna ta (teoretycznie) może przyjmować każdą wartość k = 0, 1, 2, … . Prawdopodobieństwa odpowiadające poszczególnym wartościom k obliczamy, korzystając z funkcji prawdopodobieństwa rozkładu Poissona, przyjmując parametr 𝛍 = 2. Prawdopodobieństwo, że w losowo wybranym miesiącu nie będzie wypadków wynosi: 2 ⋅e P(X = 0) = 0! 0 −2 1 = 2 = 0,135. e Prawdopodobieństwo, że w losowo wybranym miesiącu będą 4 wypadki jest równe: 2 4 ⋅ e−2 2 P(X = 4) = = 2 = 0,09. 4! 3e Rozkład Poissona Rozkład Poissona jest też dobrym przybliżeniem rozkładu dwumianowego, gdy liczba doświadczeń n jest duża (n > 20), a prawdopodobieństwo sukcesu p jest niewielkie (p < 0,05) oraz przy rosnącej liczbie prób iloczyn np jest stały (lub zmierza do stałej). Wówczas przyjmuje się 𝛍 = np. Poniżej oba rozkłady dla parametrów: n = 100, p = 0,01 R. dwumianowy R. Poissona 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Rozkład hipergeometryczny Rozważmy eksperyment polegający na losowaniu ze zwracaniem n elementów z populacji liczącej N elementów. Wiemy, że w populacji frakcja interesujących nas elementów wynosi p = R/N. Jeśli zmienna losowa X zlicza interesujące nas elementy w pobranej próbie, to podlega ona rozkładowi dwumianowemu z parametrami n i p. Odmienną sytuację mamy wtedy, gdy losujemy próbę bez zwracania (p zmienia się, bo nie zwracamy). Opisana zmienna losowa X podlega wówczas rozkładowi hipergeometrycznemu. ⎛ R⎞ ⎛ N − R⎞ ⎜⎝ k ⎟⎠ ⋅ ⎜⎝ n − k ⎟⎠ P(X = k) = , ⎛ N⎞ ⎜⎝ n ⎟⎠ k = 0,1,2,...,min{R,n}. Przykład. W tym roku na rynek kapitałowy w Polsce weszło 10 nowych spółek, ale tylko 3 z nich (jak wiemy z doświadczenia) będą miały zadowalające wyniki. Takie spółki będziemy traktować jako wyróżnione przez inwestorów, a zakup ich akcji jako sukces. Pewna osoba zakupiła cztery akcje różnych spółek. Niech zmienną losową X będzie liczba akcji spółek dobrze prosperujących wśród wszystkich zakupionych akcji. Zmienna X może przyjmować wartości k = 0, 1, 2, 3 (tylko 3 spółki mają dodatni wynik finansowy) z prawdopodobieństwami opisanymi rozkładem hipergeometrycznym (osoba nie kupowała dwa razy akcji tej samej spółki) ⎛ 3⎞ ⎛ 10 − 3⎞ ⎛ 3⎞ ⎛ 10 − 3⎞ ⋅ ⎜⎝ 0 ⎟⎠ ⎜⎝ 4 − 0 ⎟⎠ ⎜⎝ 1⎟⎠ ⋅ ⎜⎝ 4 − 1 ⎟⎠ P(X = 0) = = 0,17, P(X = 1) = = 0,5, ⎛ 10 ⎞ ⎛ 10 ⎞ ⎜⎝ 4 ⎟⎠ ⎜⎝ 4 ⎟⎠ ⎛ 3⎞ ⎛ 10 − 3⎞ ⎛ 3⎞ ⎛ 10 − 3⎞ ⋅ ⎜⎝ 2 ⎟⎠ ⎜⎝ 4 − 2 ⎟⎠ ⎜⎝ 3⎟⎠ ⋅ ⎜⎝ 4 − 3 ⎟⎠ P(X = 2) = = 0, 3, P(X = 3) = = 0,03. 10 10 ⎛ ⎞ ⎛ ⎞ ⎜⎝ 4 ⎟⎠ ⎜⎝ 4 ⎟⎠ Poniżej podana jest tabela rozkładu prawdopodobieństwa zmiennej losowej X: xi 0 1 2 3 pi 0,17 0,5 0,3 0,03 Jakie jest prawdopodobieństwo, że wśród zakupionych akcji czterech spółek znajdą się przynajmniej dwie akcje społek dobrze prosperujących? Prawdopodobieństwo to policzymy następująco P(X ≥ 2) = P(X = 2) + P(X = 3) = 0, 3 + 0,03 = 0, 33. 0,5 0,4 0,3 0,2 0,1 0 0 1 2 3 Rozkład hipergeometryczny Wartość oczekiwana i wariancja hipergeometrycznym dane są wzorami: nR E(X) = np = , N zmiennej o rozkładzie n 1− N. Var(X) = np(1− p)⋅ 1 1− N Jeżeli liczebność populacji N rośnie, to rozkład hipergeometryczny jest zbieżny do rozkładu dwumianowego: ⎛ R⎞ ⎛ N − R⎞ ⎜⎝ k ⎟⎠ ⋅ ⎜⎝ n − k ⎟⎠ ⎛ n ⎞ k n−k P(X = k) = lim = ⎜ ⎟ p (1− p) . N→∞ ⎛ N⎞ ⎝ k⎠ ⎜⎝ n ⎟⎠ Rozkład geometryczny Jeśli w doświadczeniu losowym schematu Bernoulliego zamiast liczbą sukcesów będziemy się interesowali zmienną losową X, będącą liczbą doświadczeń aż do pojawienia się pierwszego sukcesu, to określimy rozkład geometryczny. Funkcja prawdopodobieństwa tego rozkładu to: P(X = k) = pq k−1 , k = 0,1,2,… gdzie p - prawdopodobieństwo sukcesu w pojedynczej próbie, q = 1 - p - prawdopodobieństwo porażki. Rozkład geometryczny Wartość oczekiwana i wariancja zmiennej losowej o rozkładzie geometrycznym wyrażają się wzorami: 1 E(X) = , p q Var(X) = 2 . p 0,5 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Przykład. Najnowsze badania wskazują na 14% procentowy udział Pepsi-Coli w rynku napojów bezalkoholowych i 36% udział Coca-Coli. Firma badająca rynek chce przeprowadzić test smakowy na konsumentach Pepsi. Potencjalnych uczestników badania wybiera się przez losowe odsiewanie konsumentów napojów bezalkoholowych dotąd, aż trafi się na konsumenta Pepsi-Coli. Jakie jest prawdopodobieństwo, że pierwszy losowo wybrany konsument będzie konsumentem Pepsi? Jakie jest prawdopodobieństwo, że trzeba będzie zbadać dwóch, trzech, czterech konsumentów, by trafić na pierwszego konsumenta Pepsi? To, że pierwsza zbadana osoba okaże się konsumentem Pepsi jest sukcesem w naszym doświadczeniu. Jego prawdopodobieństwo wynosi p = 0,14. Korzystając z funkcji prawdopodobieństwa mamy: P(X = 1) = pq1−1 = p = 0,14, P(X = 2) = pq 2−1 = 0,14 ⋅ 0,86 = 0,12, P(X = 3) = pq 3−1 = 0,14 ⋅ 0,86 2 = 0,1 P(X = 4) = pq 4−1 = 0,14 ⋅ 0,86 3 = 0,09. Rozkłady zmiennych ciągłych Rozkład jednostajny w przedziale Zmienna losowa X ma rozkład jednostajny w przedziale [a, b], jeśli jej funkcja gęstości określona jest wzorem: ⎧ 0 ⎪ ⎪ 1 f (x) = ⎨ ⎪ b−a ⎪⎩ 0 dla x<a dla a ≤ x ≤ b dla x>b 1/(b-a) a b Rozkład jednostajny w przedziale Wartość oczekiwana i wariancja tej zmiennej losowej wynoszą: ∞ a+b E(X) = ∫ xf (x)dx = , 2 −∞ ∞ 2 (b − a) 2 Var(X) = ∫ (x − E(X)) f (x)dx = . 12 −∞ Dystrybuanta rozkładu tej zmiennej losowej jest dana wzorem: ⎧ 0 ⎪ ⎪ x−a F(x) = P(X ≤ x) = ⎨ ⎪ b−a ⎪⎩ 1 dla x<a 1 dla a ≤ x ≤ b dla x>b 0 a b Przykład. Czas oczekiwania na to, aby prowadzący ćwiczenia podał ocenę z kolokwium jest zmienną losową o rozkładzie jednostajnym w przedziale [3 dni, 8 dni]. Jaki jest przeciętny czas oczekiwania na ocenę? Zgodnie ze wcześniej podanym wzorem: a + b 3+ 8 E(X) = = = 5,5, 2 2 (b − a)2 5 2 Var(X) = = = 2,08. 12 12 Zatem SD(X) = Var(X) = 1, 44, więc przeciętny czas oczekiwania na ocenę szacujemy na 5 dni 12 godzin z odchyleniem plus minus 1 dzień 10,5 godziny. Rozkład wykładniczy Zmienna losowa X ma rozkład wykładniczy, jeśli jej funkcja gęstości określona jest wzorem: ⎧⎪ 0 f (x) = ⎨ −λx λ e ⎪⎩ dla dla x<0 x≥0 y λ 0 x Rozkład wykładniczy Rozkład wykładniczy ma zmienna losowa X będąca odstępem czasu między zajściem dwóch zdarzeń, które charakteryzuje rozkład Poissona. Na przykład, jeśli liczba samochodów, które przybywają do stacji obsługi w ciągu minuty ma rozkład Poissona, to odcinek czasu między przybyciem dwóch kolejnych samochodów (mierzony na skali ciągłej) ma rozkład wykładniczy. Dystrybuanta rozkładu wykładniczego jest postaci: ⎧⎪ 0 F(x) = ⎨ −λx ⎪⎩ 1− e dla x < 0 dla x ≥ 0 Wartość oczekiwana i wariancja wynoszą: E(X) = 1/λ, Var(X) = 1/λ. Przykład.Czas jaki maszyna działa zanim ulegnie awarii (czyli odstęp między kolejnymi awariami) ma rozkład wykładniczy z parametrem λ = 2 godziny. Jakie jest prawdopodobieństwo bezawaryjnej pracy maszyny przez co najmniej jedną godzinę? jaki jest średni odstęp między awariami? Interesuje nas pole pod wykresem funkcji gęstości na prawo od punktu x = 1. Korzystając z dystrybuanty mamy P(X > 1) = 1− P(X ≤ 1) = 1− F(1) = 1− (1− e−2 ) = 0,1353. Średnim odstępem między awariami jest E(X) = 1/2 godziny. y 2 P(X>1) 0 1 x Rozkład normalny (Gaussa) Zmienna losowa X ma rozkład normalny z parametrami 𝛍 i 𝛔, jeśli jej funkcja gęstości określona jest wzorem: ⎛ (x − µ )2 ⎞ 1 f (x) = exp ⎜ − , 2 ⎟ 2σ ⎠ ⎝ σ 2π f(x) 𝛍 − ∞ < x < +∞. f(x) 1 σ 2π 𝛍-𝛔 𝛍 𝛍+𝛔 Rozkład normalny (Gaussa) ⎛ (x − µ )2 ⎞ 1 f (x) = exp ⎜ − , 2 ⎟ 2σ ⎠ ⎝ σ 2π − ∞ < x < +∞. Wartość oczekiwana i odchylenie standardowe zmiennej X mającej rozkład normalny wynoszą: E(X) = µ, SD(X) = σ . Fakt, że zmienna losowa X ma rozkład normalny z wartością oczekiwaną 𝛍 i odchyleniem standardowym 𝛔 zapisujemy jako: X ~ N( µ, σ ). Rozkład normalny (Gaussa) Dystrybuanta zmiennej losowej o rozkładzie normalnym N(𝛍, 𝛔) jest określona wzorem 1 F(x) = σ 2π ⎛ (t − µ )2 ⎞ ∫−∞ exp ⎜⎝ − 2σ 2 ⎟⎠ dt , x − ∞ < x < +∞. f(x) F(x) = P(X ≤ x) 𝛍 x N(5,1) N(5,2) N(10,2) 0,4 0,3 0,2 0,1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Standaryzowany rozkład normalny Zmienna losowa Z ma rozkład normalny standaryzowany, gdy ma parametry 𝛍 = 0 i 𝛔 = 1, tzn. Z ~ N(0, 1). Wtedy funkcja gęstości jest postaci ⎛ x2 ⎞ 1 f (x) = exp ⎜ − ⎟ , ⎝ 2⎠ 2π f(x) 0 − ∞ < x < +∞. f(x) 0,4 0 -3 -2 -1 0 68,3% 95,4% 99,7% 1 2 3 f(x) 0,4 0 -2,58 -1,96 -1,64 0 90% 95% 99% 1,64 1,96 2,58 Krzywa y = f(x) jest symetryczna względem osi y, ✤ Pole pod całą krzywą jest równe 1, ✤ Pola zaciemnione na rysunku są równe, ✤ Pole pod lewym ogonem jest równe F(-z), a pod prawym ogonem jest równe 1 - F(z). ✤ f(x) 0,4 P(Z > z) = 1 - P(Z ≤ z) P(Z < -z) 0 -z 0 z Niech F będzie dystrybuantą zmiennej losowej Z standardowym rozkładzie normalnym. Wtedy zachodzą wzory: ✤ F(-z) = 1 - F(z), ✤ P( -z < Z < z ) = F(z) - F(-z) = 2F(z) - 1. f(x) 0,4 P(Z > z) = 1 - P(Z ≤ z) P(Z < -z) 0 -z 0 z o Standaryzowany rozkład normalny Wartości dystrybuanty rozkładu normalnego zostały ułożone w tablice postaci: x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 Standaryzowany rozkład normalny Przykład. F(-0,32) = 1 - F(0,32)=1 - 0,62552 = 0,37448; P(-0,5 < Z < 0,5) = 2F(0,5) - 1 =2·0,69146 - 1=0,38292. x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586 0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535 Znajdowanie prawdopodobieństw w tablicach standaryzowanego rozkładu normalnego 0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409 0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173 0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793 0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240 0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490 1. 0,75804 Znajdziemy prawdopodobieństwo, że wartość standary0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524 zowanej normalnej losowej się między a 1,56.0,81327 0,8 0,78814 0,79103 zmiennej 0,79389 0,79673 0,79955 znajdzie 0,80234 0,80511 0,80785 00,81057 0,7 0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891 0,84849 −0,85083 0,85543− 0,85769 0,85993 0,86214 P(00,84134 < Z <0,84375 1,56)0,84614 = F(1,56) F(0) =0,85314 0,94062 0,5 = 0, 44062 1,0 1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298 1,2 x 1,3 0,0 1,4 0,1 1,5 0,2 1,6 0,3 1,7 0,4 1,8 0,5 1,9 0,88493 0,00 0,90320 0,50000 0,91924 0,53983 0,93319 0,57926 0,94520 0,61791 0,95543 0,65542 0,96407 0,69146 0,97128 0,88686 0,01 0,90490 0,50399 0,92073 0,54380 0,93448 0,58317 0,94630 0,62172 0,95637 0,65910 0,96485 0,69497 0,97193 0,88877 0,02 0,90658 0,50798 0,92220 0,54776 0,93574 0,58706 0,94738 0,62552 0,95728 0,66276 0,96562 0,69847 0,97257 0,89065 0,03 0,90824 0,51197 0,92364 0,55172 0,93699 0,59095 0,94845 0,62930 0,95818 0,66640 0,96638 0,70194 0,97320 0,89251 0,04 0,90988 0,51595 0,92507 0,55567 0,93822 0,59483 0,94950 0,63307 0,95907 0,67003 0,96712 0,70540 0,97381 0,89435 0,05 0,91149 0,51994 0,92647 0,55962 0,93943 0,59871 0,95053 0,63683 0,95994 0,67364 0,96784 0,70884 0,97441 0,89617 0,06 0,91309 0,52392 0,92785 0,56356 0,94062 0,60257 0,95154 0,64058 0,96080 0,67724 0,96856 0,71226 0,97500 0,89796 0,07 0,91466 0,52790 0,92922 0,56749 0,94179 0,60642 0,95254 0,64431 0,96164 0,68082 0,96926 0,71566 0,97558 0,89973 0,08 0,91621 0,53188 0,93056 0,57142 0,94295 0,61026 0,95352 0,64803 0,96246 0,68439 0,96995 0,71904 0,97615 0,90147 0,09 0,91774 0,53586 0,93189 0,57535 0,94408 0,61409 0,95449 0,65173 0,96327 0,68793 0,97062 0,72240 0,97670 Tablica wartości dystrybuanty standaryzowanego rozkładu normalnego 1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214 Znajdowanie prawdopodobieństw w tablicach standaryzowanego rozkładu normalnego 1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298 1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147 1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774 1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189 1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408 2.0,94520 Znajdziemy prawdopodobieństwo, że 0,95254 wartość 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95352standary0,95449 1,7 0,95543 0,95637 0,95728 0,95818losowej 0,95907 będzie 0,95994 mniejsza 0,96080 0,96164 0,96246 0,96327 zowanej normalnej zmiennej od -2,47. 1,6 1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062 0,97778 0,97831 0,97882 1− 0,97725 0,99324 = 0,00676 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169 2,1 0,98214 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574 2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899 x 2,3 0,00 0,98928 0,01 0,98956 0,02 0,98983 0,03 0,99010 0,04 0,99036 0,05 0,99061 0,06 0,99086 0,07 0,99111 0,08 0,99134 0,09 0,99158 0,0 2,4 0,50000 0,99180 0,50399 0,99202 0,50798 0,99224 0,51197 0,99245 0,51595 0,99266 0,51994 0,99286 0,52392 0,99305 0,52790 0,99324 0,53188 0,99343 0,53586 0,99361 0,1 2,5 0,53983 0,99379 0,54380 0,99396 0,54776 0,99413 0,55172 0,99430 0,55567 0,99446 0,55962 0,99461 0,56356 0,99477 0,56749 0,99492 0,57142 0,99506 0,57535 0,99520 0,2 2,6 0,57926 0,99534 0,58317 0,99547 0,58706 0,99560 0,59095 0,99573 0,59483 0,99585 0,59871 0,99598 0,60257 0,99609 0,60642 0,99621 0,61026 0,99632 0,61409 0,99643 0,3 2,7 0,61791 0,99653 0,62172 0,99664 0,62552 0,99674 0,62930 0,99683 0,63307 0,99693 0,63683 0,99702 0,64058 0,99711 0,64431 0,99720 0,64803 0,99728 0,65173 0,99736 0,4 2,8 0,65542 0,99744 0,65910 0,99752 0,66276 0,99760 0,66640 0,99767 0,67003 0,99774 0,67364 0,99781 0,67724 0,99788 0,68082 0,99795 0,68439 0,99801 0,68793 0,99807 P(Z0,97128 < −2,0,97193 47) =0,97257 P(Z >0,97320 2, 47)0,97381 = 1−0,97441 P(Z ≤0,97500 2, 47)0,97558 = 1− F(2, = 0,97615 47) 0,97670 1,9 2,0 0,98257 0,98300 0,98341 Tablica wartości dystrybuanty standaryzowanego rozkładu normalnego Znajdowanie wartości z przy danym prawdopodobieństwie 1. Znajdziemy taką wartość standaryzowanej zmiennej losowej normalnej Z, by prawdopodobieństwo, że zmienna Z przyjmie wartość mniejszą od z było równe 0,40. P(Z < z) = 0, 40 Z własności dystrybuanty zmiennej losowej Z wynika, że poszukiwane z < 0. P(Z < z) = P(Z > −z) = 1− P(Z ≤ −z) = 1− F(−z). Stąd należy rozwiązać równanie lub równoważnie 1− F(−z) = 0, 4 F(−z) = 0,6 Znajdowanie wartości z przy danym prawdopodobieństwie Tablica wartości dystrybuanty standaryzowanego rozkładu normalnego x 0,0 x 0,1 0,0 0,2 0,1 0,3 0,2 0,4 0,3 0,5 0,4 0,6 0,5 0,7 0,6 0,8 0,7 0,9 0,8 1,0 0,9 1,1 1,0 F(−z) 0,04= 0,6 0,05 0,00 0,01 0,02 0,03 0,50000 0,00 0,53983 0,50000 0,57926 0,53983 0,61791 0,57926 0,65542 0,61791 0,69146 0,65542 0,72575 0,69146 0,75804 0,72575 0,78814 0,75804 0,81594 0,78814 0,84134 0,81594 0,86433 0,84134 0,50399 0,01 0,54380 0,50399 0,58317 0,54380 0,62172 0,58317 0,65910 0,62172 0,69497 0,65910 0,72907 0,69497 0,76115 0,72907 0,79103 0,76115 0,81859 0,79103 0,84375 0,81859 0,86650 0,84375 0,50798 0,02 0,54776 0,50798 0,58706 0,54776 0,62552 0,58706 0,66276 0,62552 0,69847 0,66276 0,73237 0,69847 0,76424 0,73237 0,79389 0,76424 0,82121 0,79389 0,84614 0,82121 0,86864 0,84614 0,51197 0,03 0,55172 0,51197 0,59095 0,55172 0,62930 0,59095 0,66640 0,62930 0,70194 0,66640 0,73565 0,70194 0,76730 0,73565 0,79673 0,76730 0,82381 0,79673 0,84849 0,82381 0,87076 0,84849 0,06 0,07 0,08 0,09 0,52392 0,06 0,56356 0,52392 0,60257 0,56356 0,64058 0,60257 0,67724 0,64058 0,71226 0,67724 0,74537 0,71226 0,77637 0,74537 0,80511 0,77637 0,83147 0,80511 0,85543 0,83147 0,87698 0,85543 0,52790 0,07 0,56749 0,52790 0,60642 0,56749 0,64431 0,60642 0,68082 0,64431 0,71566 0,68082 0,74857 0,71566 0,77935 0,74857 0,80785 0,77935 0,83398 0,80785 0,85769 0,83398 0,87900 0,85769 0,53188 0,08 0,57142 0,53188 0,61026 0,57142 0,64803 0,61026 0,68439 0,64803 0,71904 0,68439 0,75175 0,71904 0,78230 0,75175 0,81057 0,78230 0,83646 0,81057 0,85993 0,83646 0,88100 0,85993 0,53586 0,09 0,57535 0,53586 0,61409 0,57535 0,65173 0,61409 0,68793 0,65173 0,72240 0,68793 0,75490 0,72240 0,78524 0,75490 0,81327 0,78524 0,83891 0,81327 0,86214 0,83891 0,88298 0,86214 Tablica wartości dystrybuanty standaryzowanego rozkładu normalnego 0,51595 0,04 0,55567 0,51595 0,59483 0,55567 0,63307 0,59483 0,67003 0,63307 0,70540 0,67003 0,73891 0,70540 0,77035 0,73891 0,79955 0,77035 0,82639 0,79955 0,85083 0,82639 0,87286 0,85083 0,51994 0,05 0,55962 0,51994 0,59871 0,55962 0,63683 0,59871 0,67364 0,63683 0,70884 0,67364 0,74215 0,70884 0,77337 0,74215 0,80234 0,77337 0,82894 0,80234 0,85314 0,82894 0,87493 0,85314 Stąd -z = 0,26, a więc poszukiwana wartość z, to z = -0,26. Znajdowanie wartości z przy danym prawdopodobieństwie 2. Znajdziemy przedział położony symetrycznie wokół 0, któremu odpowiada prawdopodobieństwo 0,80 znalezienia wartości standaryzowanej normalnej zmiennej losowej w tym przedziale. Szukamy zatem z takiego, że P(−z < Z < z) = 0,8 Z własności dystrybuanty zmiennej losowej Z wynika, że poszukiwane z < 0. P(−z < Z < z) = 2F(z) − 1 Szukamy więc takiego z, że 2F(z) − 1 = 0,8 x 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 Znajdowanie wartości z przy danym prawdopodobieństwie 0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586 0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535 0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409 0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173 0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793 0,69146 0,69497 Równanie 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240 0,74537 0,74857 0,75175 0,75490 0,5 0,73891 2F(z) − 1 =0,74215 0,8 0,6 0,72575 0,72907 0,73237 0,73565 0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524 0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327 0,9 0,81594 0,81859 0,82121 0,82381 0,83147 0,83398 0,83646 0,83891 1,0 x 1,1 0,0 1,2 0,1 1,3 0,2 1,4 0,84134 0,00 0,86433 0,50000 0,88493 0,53983 0,90320 0,57926 0,91924 0,84375 0,01 0,86650 0,50399 0,88686 0,54380 0,90490 0,58317 0,92073 0,84614 0,02 0,86864 0,50798 0,88877 0,54776 0,90658 0,58706 0,92220 0,84849 0,03 0,87076 0,51197 0,89065 0,55172 0,90824 0,59095 0,92364 0,85083 0,04 0,87286 0,51595 0,89251 0,55567 0,90988 0,59483 0,92507 0,85314 0,05 0,87493 0,51994 0,89435 0,55962 0,91149 0,59871 0,92647 0,85543 0,06 0,87698 0,52392 0,89617 0,56356 0,91309 0,60257 0,92785 0,85769 0,07 0,87900 0,52790 0,89796 0,56749 0,91466 0,60642 0,92922 0,85993 0,08 0,88100 0,53188 0,89973 0,57142 0,91621 0,61026 0,93056 0,86214 0,09 0,88298 0,53586 0,90147 0,57535 0,91774 0,61409 0,93189 0,3 1,5 0,61791 0,93319 0,62172 0,93448 0,62552 0,93574 0,62930 0,93699 0,63307 0,93822 0,63683 0,93943 0,64058 0,94062 0,64431 0,94179 0,64803 0,94295 0,65173 0,94408 0,4 1,6 0,65542 0,94520 0,65910 0,94630 0,66276 0,94738 0,66640 0,94845 0,67003 0,94950 0,67364 0,95053 0,67724 0,95154 0,68439 0,95352 0,68793 0,95449 0,5 1,7 0,69146 0,95543 0,69497 0,95637 P(−1,29 < Z < 1,29) = 0,8 0,69847 0,70194 0,70540 0,70884 0,71226 0,68082 0,95254 0,95728 0,95818 0,95907 0,95994 0,96080 0,71566 0,96164 0,71904 0,96246 0,72240 0,96327 0,6 1,8 0,72575 0,96407 0,72907 0,96485 0,73237 0,96562 0,73565 0,96638 0,73891 0,96712 0,74215 0,96784 0,74537 0,96856 0,74857 0,96926 0,75175 0,96995 0,75490 0,97062 jest równoważne równaniu F(z) = 0,9 0,82639 0,82894 Tablica wartości dystrybuanty standaryzowanego rozkładu normalnego Stąd poszukiwana wartość z, to z = 1,29 czyli Przekształcenia normalnej zmiennej losowej Niech X będzie zmienną losową o rozkładzie normalnym z parametrami 𝛍 i 𝛔, czyli X ~ N(𝛍, 𝛔). Wówczas zmienna losowa Z określona wzorem X−µ Z= σ ma standaryzowany rozkład normalny, czyli Z ~ N(0, 1). Przekształceniem odwrotnym jest X = µ + Zσ . Przy powyższych przekształceniach prawdopodobieństwa się nie zmieniają. To tłumaczy fakt, że tablice skonstruowano tylko dla standaryzowanego rozkładu normalnego. b− µ⎞ ⎛ X − µ b− µ⎞ ⎛ P(X < b) = P ⎜ < = P⎜ Z < ⎟ ⎟ ⎝ σ ⎝ σ ⎠ σ ⎠ a− µ⎞ ⎛ X − µ a− µ⎞ ⎛ P(X > a) = P ⎜ > = P⎜ Z < ⎟ ⎟ ⎝ σ ⎝ σ ⎠ σ ⎠ b− µ⎞ ⎛ a− µ X − µ b− µ⎞ ⎛ a−µ P(a < X < b) = P ⎜ < < = P⎜ <Z< ⎟ ⎟ ⎝ σ ⎝ σ σ σ ⎠ σ ⎠ Korzystanie z przekształcenia rozkładu normalnego Tablica wartości dystrybuanty standaryzowanego rozkładu normalnego x 0,0 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586 1.0,53983 Niech0,54380 X ~0,54776 N(50,0,55172 10). Znajdziemy prawdopodobieństwo, 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535 że wartości zmiennej są większe od 60, 0,59871 czyli P(X > 60). 0,2 0,57926 0,58317 X 0,58706 0,59095 0,59483 0,60257 0,60642 0,61026 0,61409 0,1 0,3 0,61791 0,62172 0,62552 0,62930 0,4 0,65542 0,65910 0,66276 0,66640 0,63307 0,63683 0,64058 0,64431 0,64803 0,5 50 60 − 500,67724 ⎛ X − 0,67003 ⎞ 0,67364 0,68082 0,68439 P(X > 60) = P ⎜ > = P(Z > 1) = ⎟ 0,69146 0,69497 0,69847 0,70194 0,71566 0,71904 ⎝ 100,70540 0,70884 ⎠ 10 0,71226 0,6 0,72575 0,7 0,75804 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 = 1− P(Z ≤ 1) = 1− F(1) = 1− 0,84 = 0,16. 0,65173 0,68793 0,72240 0,75175 0,75490 0,78230 0,78524 0,8 Tablica wartości dystrybuanty rozkładu normalnego 0,78814 0,79103 0,79389 0,79673 standaryzowanego 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327 x 0,9 0,00 0,81594 0,01 0,81859 0,02 0,82121 0,03 0,82381 0,04 0,82639 0,05 0,82894 0,06 0,83147 0,07 0,83398 0,08 0,83646 0,09 0,83891 0,0 1,0 0,50000 0,84134 0,50399 0,84375 0,50798 0,84614 0,51197 0,84849 0,51595 0,85083 0,51994 0,85314 0,52392 0,85543 0,52790 0,85769 0,53188 0,85993 0,53586 0,86214 0,1 1,1 0,53983 0,86433 0,54380 0,86650 0,54776 0,86864 0,55172 0,87076 0,55567 0,87286 0,55962 0,87493 0,56356 0,87698 0,56749 0,87900 0,57142 0,88100 0,57535 0,88298 0,2 1,2 0,57926 0,88493 0,58317 0,88686 0,58706 0,88877 0,59095 0,89065 0,59483 0,89251 0,59871 0,89435 0,60257 0,89617 0,60642 0,89796 0,61026 0,89973 0,61409 0,90147 0,3 1,3 0,61791 0,90320 0,62172 0,90490 0,62552 0,90658 0,62930 0,90824 0,63307 0,90988 0,63683 0,91149 0,64058 0,91309 0,64431 0,91466 0,64803 0,91621 0,65173 0,91774 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 Korzystanie z przekształcenia rozkładu normalnego 2. Przypuśćmy, że wiemy iż pewna zmienna X ~ N(120, 𝛔), czyni nie znamy 𝛔. Wiemy natomiast, że P(X > 125) = 0,05. Ile wynosi 𝛔? 125 − 120 ⎞ 5⎞ 5⎞ ⎛ ⎛ ⎛ P(X > 125) = P ⎜ Z > = P ⎜ Z > ⎟ = 1− P ⎜ Z ≤ ⎟ ⎟ ⎝ ⎠ ⎝ ⎝ σ σ⎠ σ⎠ Otrzymujemy więc równanie ⎛ 5⎞ 0,05 = 1− F ⎜ ⎟ ⎝σ ⎠ równoważne z równaniem ⎛ 5⎞ F ⎜ ⎟ = 0,95. ⎝σ ⎠ 0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490 0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524 0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327 0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891 1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214 1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298 1,2 0,88493 0,88686 0,88877 0,89065 0,89617 0,89796 0,89973 0,90147 1,3 0,90320 0,90490 0,90658 0,91309 0,91466 0,91621 0,91774 Korzystanie z przekształcenia rozkładu normalnego 1,4 x 1,5 0,0 1,6 0,1 1,7 0,2 1,8 0,3 1,9 0,4 2,0 0,5 2,1 0,6 2,2 0,7 2,3 0,8 2,4 0,9 Tablica wartości dystrybuanty standaryzowanego rozkładu normalnego 0,91924 0,00 0,93319 0,50000 0,94520 0,53983 0,95543 0,57926 0,96407 0,61791 0,97128 0,65542 0,97725 0,69146 0,98214 0,72575 0,98610 0,75804 0,98928 0,78814 0,99180 0,81594 0,92073 0,01 0,93448 0,50399 0,94630 0,54380 0,95637 0,58317 0,96485 0,62172 0,97193 0,65910 0,97778 0,69497 0,98257 0,72907 0,98645 0,76115 0,98956 0,79103 0,99202 0,81859 0,92220 0,02 0,93574 0,50798 0,94738 0,54776 0,95728 0,58706 0,96562 0,62552 0,97257 0,66276 0,97831 0,69847 0,98300 0,73237 0,98679 0,76424 0,98983 0,79389 0,99224 0,82121 Stąd odszukujemy, że skąd ⎛ 50,89251 ⎞ 0,89435 F ⎜ ⎟ = 0,95. 0,90824⎝ σ 0,90988 ⎠ 0,91149 0,92364 0,03 0,93699 0,51197 0,94845 0,55172 0,95818 0,59095 0,96638 0,62930 0,97320 0,66640 0,97882 0,70194 0,98341 0,73565 0,98713 0,76730 0,99010 0,79673 0,99245 0,82381 0,92507 0,04 0,93822 0,51595 0,94950 0,55567 0,95907 0,59483 0,96712 0,63307 0,97381 0,67003 0,97932 0,70540 0,98382 0,73891 0,98745 0,77035 0,99036 0,79955 0,99266 0,82639 0,92647 0,05 0,93943 0,51994 0,95053 0,55962 0,95994 0,59871 0,96784 0,63683 0,97441 0,67364 0,97982 0,70884 0,98422 0,74215 0,98778 0,77337 0,99061 0,80234 0,99286 0,82894 5 = 1,64, σ 5 σ= = 3,05. 1,64 0,92785 0,06 0,94062 0,52392 0,95154 0,56356 0,96080 0,60257 0,96856 0,64058 0,97500 0,67724 0,98030 0,71226 0,98461 0,74537 0,98809 0,77637 0,99086 0,80511 0,99305 0,83147 0,92922 0,07 0,94179 0,52790 0,95254 0,56749 0,96164 0,60642 0,96926 0,64431 0,97558 0,68082 0,98077 0,71566 0,98500 0,74857 0,98840 0,77935 0,99111 0,80785 0,99324 0,83398 0,93056 0,08 0,94295 0,53188 0,95352 0,57142 0,96246 0,61026 0,96995 0,64803 0,97615 0,68439 0,98124 0,71904 0,98537 0,75175 0,98870 0,78230 0,99134 0,81057 0,99343 0,83646 0,93189 0,09 0,94408 0,53586 0,95449 0,57535 0,96327 0,61409 0,97062 0,65173 0,97670 0,68793 0,98169 0,72240 0,98574 0,75490 0,98899 0,78524 0,99158 0,81327 0,99361 0,83891 Rozkład chi-kwadrat 2 (𝛘 ) Rozkład chi-kwadrat z k stopniami swobody ma zmienna losowa 𝛘2 postaci χ = X + X +…+ X , 2 2 1 2 2 2 k gdzie Xi są niezależnymi standaryzowanymi zmiennymi losowymi normalnymi. f(x) E( χ ) = k, 0,3 SD( χ ) = 2k . 2 2 0 0 1 2 3 4 5 6 7 8 9 Wykresy funkcji gęstości rozkładu chi-kwadrat dla różnych stopni swobody 0,3 0 0 2 4 6 8 3 stopnie swobody 10 12 14 16 18 5 stopni swobody 20 22 24 26 28 10 stopni swobody 30 Rozkład t Studenta Rozkład t Studenta z k stopniami swobody ma zmienna losowa t postaci t= Z χ 2 k, gdzie Z i 𝛘2 są niezależnymi zmiennymi losowymi: Z ma standaryzowany rozkład normalny, 𝛘2 ma rozkład chi-kwadrat z k stopniami swobody. 0 Rozkład t Studenta Wartość oczekiwana i odchylenie standardowe zmiennej t: E(t) = 0, SD(t) = k/(k - 2). Dla dużych k rozkład t Studenta jest zbliżony standaryzowanego rozkładu normalnego. 0 do Krytyczne wartości tα/2 w rozkładzie t Studenta Stopnie swobody t0,1 t0,05 t0,025 t0,01 t0,005 1 3,078 6,314 12,706 31,821 63,657 2 1,886 2,920 4,303 6,965 9,925 3 1,638 2,353 3,182 4,541 5,841 4 1,533 2,132 2,776 3,747 4,604 5 1,476 2,015 2,571 3,365 4,032 6 1,440 1,943 2,447 3,143 3,707 7 1,415 1,895 2,365 2,998 3,499 8 1,397 1,860 2,306 2,896 3,355 9 1,383 1,833 2,262 2,821 3,250 10 1,372 1,812 2,228 2,764 3,169 11 1,363 1,796 2,201 2,718 3,106 12 1,356 1,782 2,179 2,681 3,055 13 1,350 1,771 14 1,345 1,761 2,145 2,624 2,977 15 1,341 1,753 2,131 2,602 2,947 0 tα/2 P(t2,160 > tα /2 ) = α 2,650/ 2 3,012