Wnioskowanie statystyczne dr Ewa Putek-Szeląg Katedra Ekonometrii i Statystyki e-mail: [email protected] Tel. (91) 444 19 63 Konsultacje: czwartek godz. 1000–1200, pok. 212 Wnioskowanie statystyczne Literatura: 1. Hozer J., Kolanko E., Korol M., Lasota B., Witek M., Statystyka. Część II. Wnioskowanie statystyczne, Wydawnictwo Naukowe Uniwersytetu Szczecińskiego, Szczecin 1994. 2. 3. Jóźwiak J., Podgórski J., Statystyka od podstaw, PWE, Warszawa 2006, Aczel A. D., Statystyka w zarządzaniu, PWN, Warszawa 2000 . 4. 5. Greń J., Statystyka matematyczna, modele i zadania, PWN, Warszawa 1987 Balicki A., Makać W., Metody wnioskowania statystycznego, Wydawnictwo Uniwersytetu Gdańskiego, 6. Gdańsk 2007. Luszniewicz A., Statystyka nie jest trudna. Metody wnioskowania statystycznego, PWE, Warszawa 1999. 7. 8. Domański C.,Testy statystyczne, PWE, Warszawa 1990. Fisz M., Rachunek prawdopodobieństwa i statystyka matematyczna, PWN, Warszawa 1976. 9. Domański C., Pruska K., Nieklasyczne metody statystyczne, PWE, Warszawa 2000. 10. Bąk I., Markowicz I., Mojsiewicz M., Wawrzyniak K., Statystyka w zadaniach. Cz. II, Wydawnictwo Naukowo-Techniczne, Warszawa 2001. 11. Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M., Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach. Część 2. Statystyka matematyczna, Wydawnictwo Naukowe PWN, Warszawa 2002. 12. Bąk I., Markowicz I., Mojsiewicz M., Wawrzyniak K., Wzory i tablice statystyczne, Katedra Ekonometrii i Statystyki US, Stowarzyszenie Pomoc i Rozwój, Szczecin 1997. Wnioskowanie statystyczne Właściwości prawdopodobieństwa: (c) (b) (a) A A AiB A*B B A lub B (A+B) ~A A+(~A)=W (d) A (e) B Zdarzenia rozłączne A, B W Zdarzenie pewne W (suma wszystkich zdarzeń możliwych) Jeśli A, B, .. są zdarzeniami rozłącznymi (wykluczają się wzajemnie) to P(A B …) = P(A) + P(B) + ... (patrz rysunek d) Jeśli W jest zdarzeniem pewnym to P(W) = 1 (patrz rysunek e) Stąd wynika, że dla dowolnego zdarzenia A 0 P(A) 1 P(A’) = 1 - P(A) (patrz rysunek a) Dla dowolnych zdarzeń A i B P(A B) = P(A) + P(B) – P(A B) (patrz rysunki b, c) Wnioskowanie statystyczne Przykład 1. W sklepie znajdują się magnetowidy trzech firm: I, II, III: 3 razy tyle magnetowidów firmy I co magnetowidów firmy II, a 5 razy tyle magnetowidów firmy I co magnetowidów firmy III. Jakie jest prawdopodobieństwo, że wybierając losowo magnetowid, trafimy na magnetowid firmy II? Niech A oznacza zdarzenie polegające na tym, że trafimy na magnetowid firmy II. Oznaczmy ilość magnetowidów firmy II przez x. Wtedy magnetowidów firmy I będzie 3x, a firmy III będzie 3/5x magnetowidów. Stąd szukane prawdopodobieństwo jest równe: P( A) m x x 5 n x 3x 3 x 23 x 23 5 5 2. Rzucamy kostką do gry. Jakie jest prawdopodobieństwo, że wypadnie parzysta liczba oczek? W – {1, 2, 3, 4, 5, 6} A – {2, 4, 6} P(A) m 3 1 n 6 2 Wnioskowanie statystyczne Przykład Żarówki są produkowane w 3 fabrykach. Z fabryki pierwszej pochodzi 25% produkcji, z fabryki drugiej 35% produkcji a z trzeciej 40%. Produkcja wadliwa wynosi odpowiednio: dla fabryki I – 5%, dla fabryki II – 4%, dla fabryki III – 2%. Wybrana żarówka okazała się wadliwa – jakie jest prawdopodobieństwo, ze pochodzi ona z fabryki pierwszej? Zakładamy: B1 – wybrana żarówka pochodzi z fabryki I, B2 – wybrana żarówka pochodzi z fabryki II, B3 – wybrana żarówka pochodzi z fabryki III, A – wybrana żarówka jest wadliwa. Szukamy P(B1A). Mamy: P(B1) = 0,25; P(B2) = 0,35; P(B3) = 0,40; P(AB1) = 0,05; P(AB2) = 0:04; P(AB3) = 0:02 PB1 A 0,25 0,05 0,3623 (0,25 0,05) (0,35 0,04) (0,4 0,02) Wnioskowanie statystyczne Przykład W pudełku jest 10 losów ponumerowanych od 1 do 10. Na los z numerem 1 pada główna wygrana 10 zł, na losy z numerami 2 i 3 wygrana pocieszenia w wysokości 1 zł, a za wyciągnięcie pozostałych płacimy 2 zł. Załóżmy, że wyciągnięcie każdego z losów jest jednakowo prawdopodobne. Doświadczenie polega na wyciągnięciu jednego losu. Przestrzeń zdarzeń elementarnych W = {1, 2, ..., 10} i jest skończona. Określmy funkcję X będzie zmienną losową skokową oznaczającą wygraną, gdzie A = {-2, 1, 10}. Zauważmy, że X(1) = 10, X(2) = X(3) = 1, X(4) = X(5) = ... = X(10) = -2. Rozkład prawdopodobieństwa zmiennej losowej X wartość zmiennej losowej -2 1 10 prawdopodobieństwo 0,7 0,2 0,1 Dystrybuanta zmiennej losowej X x 2 F( x ) P(X x ) p xi x 2 x 1 F( x ) p xi x 1 x 10 F( x ) p xi x x 10 F( x ) 0 i p1 0,7 i p1 p 2 0,9 p xi x i i p1 p 2 p 3 1 0 dla x 2 0,7 dla 2 x 1 F( x ) 0,9 dla 1 x 10 1 dla x 10 Wnioskowanie statystyczne Przykład Dana jest dystrybuanta zmiennej losowej X x (– ∞, 0] (0, 1] (1, 3] (3, 6] (6, +∞) 0 1/3 1/2 5/6 1 F(x) Znaleźć rozkład prawdopodobieństwa zmiennej losowej X. 1 1 p1 PX 0 lim Fx F0 0 x 0 3 3 p 2 PX 1 lim Fx F1 1 1 1 2 3 6 p 3 PX 3 lim Fx F3 5 1 1 6 2 3 x 1 x 3 p 4 PX 6 lim Fx F6 1 x 6 5 1 6 6 xi 0 1 3 6 pi 1/3 1/6 1/3 1/6 Wnioskowanie statystyczne Przykład W loterii wypuszczono 500 losów, w tym jeden los z wygraną 1000 zł, pięć losów z wygraną po 200 zł i dwadzieścia losów – po 50 zł. Określić rozkład zmiennej losowej X, będącej wielkością możliwej wygranej osoby, która kupiła jeden los. Obliczyć wartość oczekiwaną i odchylenie standardowe tak określonej zmiennej losowej. Jeżeli zmienna losowa X jest wielkością wygranej właściciela jednego losu to przyjmie wartości 0, 50, 200 lub 1000. Prawdopodobieństwo przyjęcia przez X wartości 1000 jest równe 1/500, wartości 200 wynosi 5/500, wartości 50 jest równe 20/500 a wartości 0, czyli bez wygranej 474/500. Rozkład zmiennej losowej można przedstawić w tabeli: xi 0 50 200 1000 pi 0,948 0,040 0,010 0,002 E(X) 0 0,948 50 0,040 200 0,010 1000 0,002 0 2 2 2 6 D 2 (X) 0 2 0,948 50 2 0,040 200 2 0,010 1000 2 0,002 36 100 400 2000 36 2464 Wartość oczekiwana oznacza, że średnia wygrana właściciela jednego losu wynosi 6 zł. Odchylenie standardowe równe około 49,6 zł oznacza, że wygrana właściciela jednego losu przeciętnie odchyla się od średniej o prawie 50 zł. Wnioskowanie statystyczne Wybrane rozkłady zmiennej losowej skokowej Typ rozkładu zero – jedynkowy dwumianowy Poissona hipergeometryczny Funkcja rozkładu P( X x i ) Dystrybuanta Parametry E(X), D(X) p p(1 p) P ( X x) P( X 1) p P( X 0) q 1 p P( X k ) nk p k q n k k P( X k ) e k! Mk Nn kM P( X k ) Nn P( X k ) k 1 r0 p q n r r nr k 1 r P( X k ) e r ! r0 P( X k ) r0 Nn k 1 M r np npq np NM nr np Nn N 1 Wnioskowanie statystyczne Prawdopodobieństwa odpowiadające poszczególnym wartościom (realizacjom zmiennej losowej X) są następujące: 5! 1 0,59 1 1 0,59 0,59 0!(5 0)! 5! P(X 1) (15 )(0,1)1 (0,9) 4 0,1 0,66 5 0,1 0,66 0,33 1!(5 1)! 5! P(X 2) ( 52 )(0,1) 2 (0,9) 3 0,01 0,73 10 0,01 0,73 0,073 2!(5 2)! 5! P(X 3) ( 53 )(0,1) 3 (0,9) 2 0,001 0,81 10 0,001 0,81 0,0081 3!(5 3)! 5! P(X 4) ( 54 )(0,1) 4 (0,9)1 0,0001 0,9 5 0,0001 0,9 0,00045 4!(5 4)! 5! P(X 5) ( 55 )( 0,1) 5 (0,9) 0 0,00001 1 1 0,00001 1 0,00001 5!(5 5)! P(X 0) ( 50 )(0,1) 0 (0,9) 5 P(X > 2) = P(X = 3) + P(X = 4) + P(X = 5) = 0,0081 + 0,00045 + 0,00001 = 0,00856 Możliwe jest również wyznaczenie prawdopodobieństwa w oparciu o dystrybuantę P(X > 2) = 1 – P(X 2) = 1 – F(2) Wnioskowanie statystyczne Przykład Obliczyć prawdopodobieństwo wylosowania co najwyżej trzech osób leworęcznych w 200 losowaniach, jeśli wiadomo, że prawdopodobieństwo spotkania osoby leworęcznej w pewnej populacji ludzi wynosi 0,05. Ponieważ spełnione są warunki: p = 0,05 < 0,1 oraz N = 200 > 50, zatem mamy do czynienia z rozkładem Poissona. Wówczas 0,05 200 10 P0 k 3 Pk 0 Pk 1 Pk 2 Pk 3 1 2 3 100 10 10 10 10 10 10 P0 k 3 e e e e 0! 1! 2! 3! 100 10 1000 10 500 10 e 10 10e 10 e e e 10 10e 10 50e 10 e 2 6 3 10 683 10 683 683 683 e 0,011 10 3 3 e 3 20589 61767 Prawdopodobieństwo wylosowania co najwyżej trzech osób leworęcznych wynosi 0,011. Wnioskowanie statystyczne Wybrane rozkłady zmiennej losowej ciągłej Typ rozkładu równomierny Funkcja gęstości f(x) Dystrybuanta F(x) 1 ,a x b f ( x) b a 0, dla pozosta ł ych x 0, xa x a F( x) ,axb b a 1, xb x 1 x F( x) 1 e , x 0 f ( x) e , x 0 wykładniczy 0 , poza tym 0 , dla pozosta ł ych x ( x )2 normalny f ( x) 1 2 e 22 x F( x) 1 2 2 x ( x ) 2 e 2 dx Parametry E(X), D(X) ab 2 (b a)2 12 , , Wnioskowanie statystyczne Rozkład równomierny (prostokątny, jednostajny) jest najprostszym rozkładem zmiennej losowej typu ciągłego. Rozkład ten bywa czasem stosowany w sytuacji, gdy można przypuszczać, że każda wartość zmiennej w pewnym przedziale liczbowym jest jednakowo możliwa. Rozkład wykładniczy jest jedynym rozkładem ciągłym, który ma własność zwaną brakiem pamięci. Własność tę można interpretować następująco: jeżeli zmienna losowa X jest czasem bezawaryjnej pracy pewnego elementu o rozkładzie wykładniczym, to niezależnie od dotychczasowego czasu pracy elementu, dalszy czas pracy nie zależy od „przeszłości” i ma taki sam rozkład, co całkowity czas pracy elementu. Wnioskowanie statystyczne Zmienna losowa X ma rozkład normalny o parametrach oraz , co w skrócie zapisuje się jako X: N(, ), jeżeli jej funkcja gęstości wyraża się wzorem: f unkcja gęstości 1 e 2 ( x ) 2 2 0,4 , gdzie x i 0 0,3 f(x) f (x) 2 0,2 0,1 0 -4 -3 -2 Dystrybuantą zmiennej losowej X mającej rozkład normalny jest funkcją F(x) określona na zbiorze liczb rzeczywistych o postaci: -1 0 1 2 3 4 dystrybuanta rozkładu normalnego 1 0,8 x 1 F( x ) e 2 f(x) 0,6 ( t )2 2 2 0,4 dt 0,2 0 -4 -3 -2 -1 0 1 2 3 4 Wnioskowanie statystyczne Funkcja gęstości w rozkładzie normalnym: – jest symetryczna względem prostej x = (osią symetrii jest prosta pionowa przechodząca przez punkt x = μ), jest rosnąca dla x < μ, a malejąca dla x > μ – w punkcie x = osiąga wartość maksymalną – ramiona funkcji mają punkty przegięcia dla x = - σ oraz x = + σ – kształt funkcji gęstości zależy od wartości parametrów: i σ. Parametr decyduje o przesunięciu krzywej, natomiast parametr σ decyduje o „smukłości” krzywej (im mniejsza jest wariancja/odchylenie standardowe, tym wykres gęstości prawdopodobieństwa jest bardziej wysmukły) 0,5 N(0,1) N(3,1) N(0,2) N(3,2) 0 -4 -3 -2 -1 0 1 2 3 4 Wnioskowanie statystyczne Wartość oczekiwana i wariancja dla rozkładu normalnego wyrażane są następującymi wzorami: E(X) x 1 e 2 D 2 ( X ) ( x ) 2 ( x ) 2 22 dx 1 e 2 ( x ) 2 22 dx 2 Wartość jest to taka wartość zmiennej losowej X, wokół której skupiają się wyniki wielokrotnych realizacji tej zmiennej. Innymi słowy, oczekuje się (ma się nadzieję), że wielokrotne realizacje zmiennej losowej X będą skupiały się wokół liczby . Wnioskowanie statystyczne Reguła trzech sigm Funkcja gęstości rozkładu normalnego ma zastosowanie do reguły „trzech sigma”, którą następnie rozwinięto na regułę „sześć sigma” – stosowaną w kontroli jakości, przede wszystkim w USA (np. General Electric, General Motors Company) Reguła trzech sigma – jeżeli zmienna losowa ma rozkład normalny to: – 68,3 % populacji mieści się w przedziale ( - σ; + σ) – 95,5 % populacji mieści się w przedziale ( - 2σ; + 2σ) – 99,7 % populacji mieści się w przedziale ( - 3σ; + 3σ) Reguła ta ma duże znaczenie w teorii błędów obserwacji, bowiem błędy przypadkowe pomiarów tej samej wielkości fizycznej zwykle tak się rozkładają, że wyniki tych pomiarów mają rozkład normalny. Rozkład ten nie wystąpi, gdy popełniony zostanie tendencyjny błąd systematyczny. Wnioskowanie statystyczne Tablica dystrybuanty rozkładu normalnego N(0, 1) → dla u =1,64 Fu = 1,64) = Fu = 1,64 = 0,949497 u 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3 0 0,500000 0,539828 0,579260 0,617911 0,655422 0,691462 0,725747 0,758036 0,788145 0,815940 0,841345 0,864334 0,884930 0,903199 0,919243 0,933193 0,945201 0,955435 0,964070 0,971284 0,977250 0,982136 0,986097 0,989276 0,991802 0,993790 0,995339 0,996533 0,997445 0,998134 0,998650 0,01 0,503989 0,543795 0,583166 0,621719 0,659097 0,694974 0,729069 0,761148 0,791030 0,818589 0,843752 0,866500 0,886860 0,904902 0,920730 0,934478 0,946301 0,956367 0,964852 0,971933 0,977784 0,982571 0,986447 0,989556 0,992024 0,993963 0,995473 0,996636 0,997523 0,998193 0,998694 0,02 0,507978 0,547758 0,587064 0,625516 0,662757 0,698468 0,732371 0,764238 0,793892 0,821214 0,846136 0,868643 0,888767 0,906582 0,922196 0,935744 0,947384 0,957284 0,965621 0,972571 0,978308 0,982997 0,986791 0,989830 0,992240 0,994132 0,995603 0,996736 0,997599 0,998250 0,998736 0,03 0,511967 0,551717 0,590954 0,629300 0,666402 0,701944 0,735653 0,767305 0,796731 0,823814 0,848495 0,870762 0,890651 0,908241 0,923641 0,936992 0,948449 0,958185 0,966375 0,973197 0,978822 0,983414 0,987126 0,990097 0,992451 0,994297 0,995731 0,996833 0,997673 0,998305 0,998777 0,04 0,515953 0,555670 0,594835 0,633072 0,670031 0,705402 0,738914 0,770350 0,799546 0,826391 0,850830 0,872857 0,892512 0,909877 0,925066 0,938220 0,949497 0,959071 0,967116 0,973810 0,979325 0,983823 0,987455 0,990358 0,992656 0,994457 0,995855 0,996928 0,997744 0,998359 0,998817 0,05 0,519939 0,559618 0,598706 0,636831 0,673645 0,708840 0,742154 0,773373 0,802338 0,828944 0,853141 0,874928 0,894350 0,911492 0,926471 0,939429 0,950529 0,959941 0,967843 0,974412 0,979818 0,984222 0,987776 0,990613 0,992857 0,994614 0,995975 0,997020 0,997814 0,998411 0,998856 0,06 0,523922 0,563559 0,602568 0,640576 0,677242 0,712260 0,745373 0,776373 0,805106 0,831472 0,855428 0,876976 0,896165 0,913085 0,927855 0,940620 0,951543 0,960796 0,968557 0,975002 0,980301 0,984614 0,988089 0,990863 0,993053 0,994766 0,996093 0,997110 0,997882 0,998462 0,998893 0,07 0,527903 0,567495 0,606420 0,644309 0,680822 0,715661 0,748571 0,779350 0,807850 0,833977 0,857690 0,878999 0,897958 0,914656 0,929219 0,941792 0,952540 0,961636 0,969258 0,975581 0,980774 0,984997 0,988396 0,991106 0,993244 0,994915 0,996207 0,997197 0,997948 0,998511 0,998930 0,08 0,531881 0,571424 0,610261 0,648027 0,684386 0,719043 0,751748 0,782305 0,810570 0,836457 0,859929 0,881000 0,899727 0,916207 0,930563 0,942947 0,953521 0,962462 0,969946 0,976148 0,981237 0,985371 0,988696 0,991344 0,993431 0,995060 0,996319 0,997282 0,998012 0,998559 0,998965 0,09 0,535856 0,575345 0,614092 0,651732 0,687933 0,722405 0,754903 0,785236 0,813267 0,838913 0,862143 0,882977 0,901475 0,917736 0,931888 0,944083 0,954486 0,963273 0,970621 0,976705 0,981691 0,985738 0,988989 0,991576 0,993613 0,995201 0,996427 0,997365 0,998074 0,998605 0,998999 Wnioskowanie statystyczne W celu obliczenia prawdopodobieństwa P(a < X b) należy skorzystać ze standaryzacji. Jeśli zmienna losowa X ma rozkład N(, to zmienna standaryzowana u ma rozkład N(0,1), czyli: a X b b a P ( a x b) P F F . b a należy odczytać w tablicach dystrybuanty standaryzowanego Wartości F oraz F rozkładu normalnego. Przykład Dany jest rozkład zmiennej losowej X o parametrach N(15; 5). Obliczyć: a) P(X<12) b) P(X>14) c) P{12 < X < 14} 12 15 Fu 0,6 0,2743 a) P{X < 12} = Fu 5 14 15 1 Fu 0,2 1 0,4207 0,5793 b) P{X > 14} = 1 – P{X < 14}= 1 – Fu 5 14 15 12 15 F F Fu 0,2 Fu 0,6 0,4207 0,2743 0,1464 c) P{12 < X < 14} = u u 5 5 Wnioskowanie statystyczne Przykład Wzrost kobiet w pewnej populacji ma rozkład normalny N(165,15). Oznacza to, iż zmienna losowa jaką jest wzrost kobiet ma rozkład normalny ze średnią równą 165 cm i odchyleniem standardowym równym 15 cm. Jaki jest udział w populacji kobiet o wzroście: a) do 160 cm, b) w przedziale 165-170 cm, c) powyżej 175 cm. 160 165 a ) P(X 160) Fu Fu (0,33) 1 Fu (0,33) 1 0,6293 0,3707 15 170 165 165 165 b) P(165 X 170) Fu Fu Fu (0,33) Fu (0) 0,6293 0,5 0,1293 15 15 175 165 c) P(X 175) 1 P( U 175) 1 Fu 1 Fu 0,67 1 0,748571 0,251429 15 Wnioskowanie statystyczne Przykład Zmienna losowa X ma rozkład N(20; 5). Obliczyć ki, wiedząc, że a) P{X k1} 0,8849 b) P{X k 2 } 0,6554 c) P{X k 4 } 0,0,00511 a) P{X k1} 0,8849 k1 20 k1 20 Fu 1,2 k1 26 0,8849 5 5 b) P{X k 2 } 0,6554 1 P{X k 2 } 0,6554 P{X k 2 } 0,3446 k 2 20 k 2 20 Fu 0,4 k 2 18 0,3446 5 5 c) P{X k 4 } 1 P{X k 4 } 0,0,00511 P{ k 4 X k 4 } 0,99489 k k 20 20 k 20 20 Fu 4 Fu 4 0,99489 2 Fu 3 1 0,99489 5 5 5 k k Fu 3 0,99744 3 2,8 k 3 14 5 5 Wnioskowanie statystyczne poziom istotności l.ss 1 2 3 4 5 0,99 0,975 0,95 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,05 0,025 0,01 0,005 0,000 0,020 0,115 0,297 0,554 0,001 0,051 0,216 0,484 0,831 0,004 0,103 0,352 0,711 1,145 0,016 0,211 0,584 1,064 1,610 0,064 0,446 1,005 1,649 2,343 0,148 0,713 1,424 2,195 3,000 0,275 1,022 1,869 2,753 3,656 0,455 1,386 2,366 3,357 4,351 0,708 1,833 2,946 4,045 5,132 1,074 2,408 3,665 4,878 6,064 1,642 3,219 4,642 5,989 7,289 2,706 4,605 6,251 7,779 9,236 3,841 5,991 7,815 9,488 11,070 5,024 7,378 9,348 11,143 12,832 6,635 9,210 11,345 13,277 15,086 5,024 7,378 9,348 11,143 12,832 6 7 8 9 10 0,872 1,239 1,647 2,088 2,558 1,237 1,690 2,180 2,700 3,247 1,635 2,167 2,733 3,325 3,940 2,204 2,833 3,490 4,168 4,865 3,070 3,822 4,594 5,380 6,179 3,828 4,671 5,527 6,393 7,267 4,570 5,493 6,423 7,357 8,295 5,348 6,346 7,344 8,343 9,342 6,211 7,283 8,351 9,414 10,473 7,231 8,383 9,524 10,656 11,781 8,558 9,803 11,030 12,242 13,442 10,645 12,017 13,362 14,684 15,987 12,592 14,067 15,507 16,919 18,307 14,449 16,013 17,535 19,023 20,483 16,812 18,475 20,090 21,666 23,209 14,449 16,013 17,535 19,023 20,483 11 12 13 14 15 3,053 3,571 4,107 4,660 5,229 3,816 4,404 5,009 5,629 6,262 4,575 5,226 5,892 6,571 7,261 5,578 6,304 7,041 7,790 8,547 6,989 7,807 8,634 9,467 10,307 8,148 9,034 9,926 10,821 11,721 9,237 10,182 11,129 12,078 13,030 10,341 11,340 12,340 13,339 14,339 11,530 12,584 13,636 14,685 15,733 12,899 14,011 15,119 16,222 17,322 14,631 15,812 16,985 18,151 19,311 17,275 18,549 19,812 21,064 22,307 19,675 21,026 22,362 23,685 24,996 21,920 23,337 24,736 26,119 27,488 24,725 26,217 27,688 29,141 30,578 21,920 23,337 24,736 26,119 27,488 16 17 18 19 20 5,812 6,408 7,015 7,633 8,260 6,908 7,564 8,231 8,907 9,591 7,962 8,672 9,390 10,117 10,851 9,312 10,085 10,865 11,651 12,443 11,152 12,002 12,857 13,716 14,578 12,624 13,531 14,440 15,352 16,266 13,983 14,937 15,893 16,850 17,809 15,338 16,338 17,338 18,338 19,337 16,780 17,824 18,868 19,910 20,951 18,418 19,511 20,601 21,689 22,775 20,465 21,615 22,760 23,900 25,038 23,542 24,769 25,989 27,204 28,412 26,296 27,587 28,869 30,144 31,410 28,845 30,191 31,526 32,852 34,170 32,000 33,409 34,805 36,191 37,566 28,845 30,191 31,526 32,852 34,170 Wnioskowanie statystyczne α 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,09 0,08 0,07 0,06 0,05 0,04 0,03 0,02 0,01 0,001 k 1 0 , 1 5 8 0 , 3 2 5 0 , 5 1 0 0 , 7 2 7 1 , 0 0 0 1 , 3 7 6 1 , 9 6 3 3 , 0 7 8 6 , 3 1 4 7 , 0 2 6 7 , 9 1 6 9 , 0 5 8 2 0 , 1 4 2 0 , 2 8 9 0 , 4 4 5 0 , 6 1 7 0 , 8 1 6 1 , 0 6 1 1 , 3 8 6 1 , 8 8 6 2 , 9 2 0 3 , 1 0 4 3 , 3 2 0 3 , 5 7 8 1 3 0 , 8 , 5 9 7 6 9 1 4 2 , 3 , 7 0 0 3 6 1 4 5 , 8 , 8 4 9 9 4 2 5 1 , 6 , 2 4 0 3 5 3 6 1 , 9 , 8 6 2 5 1 6 9 3 , 9 , 6 2 5 5 6 6 3 3 6 3 0 , 1 3 7 0 , 2 7 7 0 , 4 2 4 0 , 5 8 4 0 , 7 6 5 0 , 9 7 8 1 , 2 5 0 1 , 6 3 8 2 , 3 5 3 2 , 4 7 1 2 , 6 0 5 2 , 7 6 3 2 , 9 5 1 3 , 1 8 2 3 , 4 8 2 3 , 8 9 6 4 , 5 4 1 5 , 8 4 1 1 4 0 , 1 3 4 0 , 2 7 1 0 , 4 1 4 0 , 5 6 9 0 , 7 4 1 0 , 9 4 1 1 , 1 9 0 1 , 5 3 3 2 , 1 3 2 2 , 2 2 6 2 , 3 3 3 2 , 4 5 6 2 , 6 0 1 2 , 7 7 6 2 , 9 9 9 3 , 2 9 8 3 , 7 4 7 4 , 6 0 4 8 , 6 1 0 5 0 , 1 3 2 0 , 2 6 7 0 , 4 0 8 0 , 5 5 9 0 , 7 2 7 0 , 9 2 0 1 , 1 5 6 1 , 4 7 6 2 , 0 1 5 2 , 0 9 8 2 , 1 9 1 2 , 2 9 7 2 , 4 2 2 2 , 5 7 1 2 , 7 5 7 3 , 0 0 3 3 , 3 6 5 4 , 0 3 2 6 , 8 6 9 6 0 , 1 3 1 0 , 2 6 5 0 , 4 0 4 0 , 5 5 3 0 , 7 1 8 0 , 9 0 6 1 , 1 3 4 1 , 4 4 0 1 , 9 4 3 2 , 0 1 9 2 , 1 0 4 2 , 2 0 1 2 , 3 1 3 2 , 4 4 7 2 , 6 1 2 2 , 8 2 9 3 , 1 4 3 3 , 7 0 7 5 , 9 5 9 7 0 , 1 3 0 0 , 2 6 3 0 , 4 0 2 0 , 5 4 9 0 , 7 1 1 0 , 8 9 6 1 , 1 1 9 1 , 4 1 5 1 , 8 9 5 1 , 9 6 6 2 , 0 4 6 2 , 1 3 6 2 , 2 4 1 2 , 3 6 5 2 , 5 1 7 2 , 7 1 5 2 , 9 9 8 3 , 4 9 9 5 , 4 0 8 8 0 , 1 3 0 0 , 2 6 2 0 , 3 9 9 0 , 5 4 6 0 , 7 0 6 0 , 8 8 9 1 , 1 0 8 1 , 3 9 7 1 , 8 6 0 1 , 9 2 8 2 , 0 0 4 2 , 0 9 0 2 , 1 8 9 2 , 3 0 6 2 , 4 4 9 2 , 6 3 4 2 , 8 9 6 3 , 3 5 5 5 , 0 4 1 9 0 , 1 2 9 0 , 2 6 1 0 , 3 9 8 0 , 5 4 3 0 , 7 0 3 0 , 8 8 3 1 , 1 0 0 1 , 3 8 3 1 , 8 3 3 1 , 8 9 9 1 , 9 7 3 2 , 0 5 5 2 , 1 5 0 2 , 2 6 2 2 , 3 9 8 2 , 5 7 4 2 , 8 2 1 3 , 2 5 0 4 , 7 8 1 1 2 , , 6 , 9 5 7 0 8 0 2 4 1 0 0 , 1 2 9 0 , 2 6 0 0 , 3 9 7 0 , 5 4 2 0 , 7 0 0 0 , 8 7 9 1 , 0 9 3 1 , 3 7 2 1 , 8 1 2 1 , 8 7 7 1 , 9 4 8 2 , 0 2 8 2 , 1 2 0 2 , 2 2 8 2 , 3 5 9 2 , 5 2 7 2 , 7 6 4 3 , 1 6 9 4 , 5 8 7 1 1 0 , 1 2 9 0 , 2 6 0 0 , 3 9 6 0 , 5 4 0 0 , 6 9 7 0 , 8 7 6 1 , 0 8 8 1 , 3 6 3 1 , 7 9 6 1 , 8 5 9 1 , 9 2 8 2 , 0 0 7 2 , 0 9 6 2 , 2 0 1 2 , 3 2 8 2 , 4 9 1 2 , 7 1 8 3 , 1 0 6 4 , 4 3 7 1 2 0 , 1 2 8 0 , 2 5 9 0 , 3 9 5 0 , 5 3 9 0 , 6 9 5 0 , 8 7 3 1 , 0 8 3 1 , 3 5 6 1 , 7 8 2 1 , 8 4 4 1 , 9 1 2 1 , 9 8 9 2 , 0 7 6 2 , 1 7 9 2 , 3 0 3 2 , 4 6 1 2 , 6 8 1 3 , 0 5 5 4 , 3 1 8 1 3 0 , 1 2 8 0 , 2 5 9 0 , 3 9 4 0 , 5 3 8 0 , 6 9 4 0 , 8 7 0 1 , 0 7 9 1 , 3 5 0 1 , 7 7 1 1 , 8 3 2 1 , 8 9 9 1 , 9 7 4 2 , 0 6 0 2 , 1 6 0 2 , 2 8 2 2 , 4 3 6 2 , 6 5 0 3 , 0 1 2 4 , 2 2 1 1 4 0 , 1 2 8 0 , 2 5 8 0 , 3 9 3 0 , 5 3 7 0 , 6 9 2 0 , 8 6 8 1 , 0 7 6 1 , 3 4 5 1 , 7 6 1 1 , 8 2 1 1 , 8 8 7 1 , 9 6 2 2 , 0 4 6 2 , 1 4 5 2 , 2 6 4 2 , 4 1 5 2 , 6 2 4 2 , 9 7 7 4 , 1 4 0 1 5 0 , 1 2 8 0 , 2 5 8 0 , 3 9 3 0 , 5 3 6 0 , 6 9 1 0 , 8 6 6 1 , 0 7 4 1 , 3 4 1 1 , 7 5 3 1 , 8 1 2 1 , 8 7 8 1 , 9 5 1 2 , 0 3 4 2 , 1 3 1 2 , 2 4 9 2 , 3 9 7 2 , 6 0 2 2 , 9 4 7 4 , 0 7 3 1 6 0 , 1 2 8 0 , 2 5 8 0 , 3 9 2 0 , 5 3 5 0 , 6 9 0 0 , 8 6 5 1 , 0 7 1 1 , 3 3 7 1 , 7 4 6 1 , 8 0 5 1 , 8 6 9 1 , 9 4 2 2 , 0 2 4 2 , 1 2 0 2 , 2 3 5 2 , 3 8 2 2 , 5 8 3 2 , 9 2 1 4 , 0 1 5 1 7 0 , 1 2 8 0 , 2 5 7 0 , 3 9 2 0 , 5 3 4 0 , 6 8 9 0 , 8 6 3 1 , 0 6 9 1 , 3 3 3 1 , 7 4 0 1 , 7 9 8 1 , 8 6 2 1 , 9 3 4 2 , 0 1 5 2 , 1 1 0 2 , 2 2 4 2 , 3 6 8 2 , 5 6 7 2 , 8 9 8 3 , 9 6 5 1 8 0 , 1 2 7 0 , 2 5 7 0 , 3 9 2 0 , 5 3 4 0 , 6 8 8 0 , 8 6 2 1 , 0 6 7 1 , 3 3 0 1 , 7 3 4 1 , 7 9 2 1 , 8 5 5 1 , 9 2 6 2 , 0 0 7 2 , 1 0 1 2 , 2 1 4 2 , 3 5 6 2 , 5 5 2 2 , 8 7 8 3 , 9 2 2 1 9 0 , 1 2 7 0 , 2 5 7 0 , 3 9 1 0 , 5 3 3 0 , 6 8 8 0 , 8 6 1 1 , 0 6 6 1 , 3 2 8 1 , 7 2 9 1 , 7 8 6 1 , 8 5 0 1 , 9 2 0 2 , 0 0 0 2 , 0 9 3 2 , 2 0 5 2 , 3 4 6 2 , 5 3 9 2 , 8 6 1 3 , 8 8 3 2 0 0 , 1 2 7 0 , 2 5 7 0 , 3 9 1 0 , 5 3 3 0 , 6 8 7 0 , 8 6 0 1 , 0 6 4 1 , 3 2 5 1 , 7 2 5 1 , 7 8 2 1 , 8 4 4 1 , 9 1 4 1 , 9 9 4 2 , 0 8 6 2 , 1 9 7 2 , 3 3 6 2 , 5 2 8 2 , 8 4 5 3 , 8 5 0 Wnioskowanie statystyczne Przykłady 1. W grupie studentów przeprowadzono test ze statystyki , gdzie zmienna losowa Xk oznaczała liczbę zdobytych punktów (od 0 do 100, gdzie k – jest liczbą studentów). Rozkład zmiennej Xk jest identyczny dla wszystkich studentów – E(Xk) = 70; D(Xk) = 20. Obliczyć prawdopodobieństwo tego, że: a) suma punktów uzyskanych przez 100 studentów będzie wyższa od 7500 punktów, b) przeciętna liczba zdobytych punktów w 100–osobowej grupie studentów będzie w przedziale 65–70 pkt. Korzystamy z twierdzenia Lindeberga–Levy’ego a) Niech zmienna Z będzie sumą zmiennych X1, X2, …, X100 → Z100 = X1 + X2 +…+ X100, wówczas ma ona rozkład zbliżony do normalnego o parametrach N(n E(X), D(X) n ) N(100 70, 20 100 ) N(7000, 200) 7500 7000 P( Z100 7500) 1 P( Z100 7500) 1 Fu 1 Fu 2,5 1 0,99379 0,00621 200 Prawdopodobieństwo tego, że suma punktów uzyskanych przez 100–osobową grupę studentów będzie wyższa od 7500 p. wynosi 0,621 %. b) Niech zmienna V będzie średnią ze zmiennych X1, X2, …, X100, wówczas ma ona rozkład zbliżony do normalnego o parametrach D(X) 20 N E(X), N(70, 2) N 70, n 100 70 70 65 70 P(65 V100 70) Fu Fu Fu 0 Fu 2,5 0,5 0,00621 0,49379 2 2 Prawdopodobieństwo tego, że średnia liczba punktów uzyskanych przez 100–osobową grupę studentów będzie w przedziale 65–70 p. wynosi 49,379 %. Wnioskowanie statystyczne 2. Pewien towar produkowany jest w 2 gatunkach. 40 % produkcji stanowi gatunek 1, natomiast 60 % – drugi. Jakie jest prawdopodobieństwo, że w niezależnie pobranej partii towaru liczącej 50 sztuk, liczba sztuk 1–go gatunku będzie większa od 24. Jeżeli Yn jest liczbą sukcesów (mamy do czynienia z rozkładem dwumianowym), to jej rozkład dąży do rozkładu normalnego o parametrach N np , npq . p 0,4; q 0,6; Yn N np , npq N 50 0,4; 50 0,4 0,6 N(20; 3,464). 24 20 P(Y50 24) 1 P(Y50 24) 1 Fu 1 Fu 1,15 1 0,8749 0,1251 3,464 3. Prawdopodobieństwo wylosowania wyrobu 1–go gatunku wynosi 0,25. Obliczyć prawdopodobieństwo tego, że częstość wystąpienia sztuk I gatunku wśród 400 wylosowanych wyrobów wyniesie nie więcej niż 30 %. Przy dużej liczbie obserwacji częstość wystąpienia sukcesu w rozkładzie dwumianowym Yn na rozkład normalny o parametrach N p, pq n pq 0,25 0,75 N 0,25; N0,25; 0,02165 p 0,25 Yn N p, n 400 0,3 0,25 P(Y400 0,3) Fu Fu 2,31 0,98956 0,02165