Estymacja parametrów populacji Populacja generalna, populacja próbna, estymacja punktowa i przedziałowa Populacja generalna Zbiór wartości interesującej badacza cechy (lub cech) u wszystkich jednostek populacji fizycznej tworzy tzw. populację generalną. Jeżeli zbiór elementów populacji generalnej jest skończony, to będziemy ją określać jako populację skończoną. Przykładem może być np. zbiór pracowników pewnego zakładu produkcyjnego. W przypadku, gdy zbiór elementów populacji jest nieskończony, to populację określamy jako nieskończoną. Przykładem niech będzie zbiór możliwych relacji złotego do euro (czy innej waluty). 2 Populacja generalna (c.d.) W populacji mogą nas interesować cechy ilościowe, które będziemy nazywać mierzalnymi jak i cechy jakościowe, czyli niemierzalne. Przykładowo koszt produkcji pewnego detalu jest cechą mierzalną, a jego kolor cechą jakościową. Formalnie, populację generalną będziemy traktować jako zbiór niezależnych realizacji pewnej zmiennej losowej jedno lub wielowymiarowej. 3 Badanie statystyczne Celem badania statystycznego będzie najczęściej poznanie rozkładu danej cechy jak i oszacowanie charakterystyk tego rozkładu. Jeżeli zmienna losowa X jest modelem probabilistycznym dla pewnej cechy w populacji generalnej, to rozkład częstości występowania różnych wartości tej cechy jest opisany rozkładem prawdopodobieństwa zmiennej modelowej, a parametry rozkładu tej zmiennej są jednocześnie parametrami populacji. 4 Badanie statystyczne (c.d.) Badanie statystyczne może być badaniem .pełnym - jeżeli obejmuje wszystkie elementy populacji generalnej; częściowym - jeżeli ograniczone jest do pewnej części populacji generalnej. Tę część populacji generalnej, na której wykonywane jest badanie statystyczne nazywamy populacją próbną lub krótko próbą. Statystyka matematyczna zajmuje się tylko badaniami częściowymi, przy czym muszą być jeszcze spełnione określone warunki doboru próby. 5 Losowy dobór próby Podstawowym warunkiem, jaki musi być spełniony w badaniach częściowych jest losowy dobór próby. Tak otrzymaną próbę nazywamy próbą losową. Jeżeli elementy próby zostały pobrane w taki sposób, aby: każdy element populacji generalnej miał tę samą szansę znalezienia się w próbie; losowanie elementów próby było niezależne; to możemy oczekiwać, że prawidłowości występujące w populacji znajdą swoje odbicie w próbie. 6 Rozkład empiryczny cechy Podstawą analizy statystycznej dowolnej cechy jest określenie jej empirycznego rozkładu. Badając czas obsługi przy kasie sklepowej 100 losowo wybranych klientów uzyskano następujące wyniki (w sekundach): ( x1 j x2 j nj < 20 20 – 40 40 – 60 60 – 80 80 – 100 100 – 120 > 120 5 9 18 31 21 13 3 100 wj nj n 0.05 0.09 0.18 0.31 0.21 0.13 0.03 1 7 Rozkład empiryczny cechy (c.d.) Dane empiryczne w naszym przykładzie zostały zestawione w szereg rozdzielczy. Analizowana cecha (czas obsługi klienta przy kasie) jest cechą ciągłą, stąd częstości (prawdopodobieństwa empiryczne) zostały przyporządkowane odpowiednim przedziałom wartości cechy. Przedziały te nazywamy przedziałami klasowymi, a różnicę między krańcami przedziału nazywamy rozpiętością przedziału. 8 Graficzna prezentacja rozkładu Histogram for Czas 35 frequency 30 25 20 15 10 5 0 0 20 40 60 80 100 120 140 Czas 9 Rozkład z próby Jak wcześniej powiedzieliśmy, próba ma dostarczyć informacji o analizowanej zmiennej w populacji, między innymi na podstawie elementów próby będziemy szacować (oceniać, estymować) nieznane parametry populacji. Estymatorem (statystyką) będziemy nazywać określoną funkcję wyników próby. Przykładowo estymatorem średniej z próby jest funkcja: 1 n x xi n i 1 Estymator (statystyka) dla konkretnych prób będzie przyjmował na ogół różne wartości, ponieważ jako funkcja zmiennych losowych sam jest zmienną losową. Tym samym ma pewien rozkład, który będziemy nazywać rozkładem z próby. 10 Rozkład z próby, estymator nieobciążony W zastosowaniach praktycznych najczęściej korzystamy z estymatorów nieobciążonych. Rozważmy w populacji generalnej pewną zmienną losową X charakteryzowaną parametrem . Niech statystyka: f ( x , ..., x ) 1 n będzie oceną nieznanego parametru . Jeżeli estymator ten spełnia warunek: E to nazywamy go estymatorem nieobciążonym. 11 Estymatory punktowe X ~ N (m, ) oraz niech Niech X ma rozkład normalny xi (i = 1, 2, ..., n) oznacza n-elementową próbę losową. Ocenami niebciążonymi średniej i wariancji w populacji generalnej są odpowiednio: n 1 n m x xi 2 s2 n i 1 2 ( x x ) i i 1 n 1 Estymatorem odchylenia standardowego w populacji jest odchylenie standardowe w próbie: 2 s s 12 Rozkład średniej arytmetycznej Niech zmienna losowa X ~ N (m, ) oraz niech mˆ x 1 n x i i będzie oceną nieobciążoną średniej w populacji. Średnia arytmetyczna jest oczywiście także zmienną losową normalną o parametrach: X ~ N (m, ) n Oznacza to, że wartość oczekiwana średniej jest taka sama jak cechy X w populacji, a wariancja jest n-krotnie mniejsza. 13 Rozkład średniej arytmetycznej (c.d) Oszacowaniem odchylenia standardowego średniej jest wyrażenie: x sx s2 n które będziemy nazywać błędem średniej arytmetycznej. Parametr ten można zinterpretować następująco: przyjmując za ocenę nieznanej średniej generalnej m jej ocenę nieobciążoną z próby popełniamy błąd rzędu S x 14 Przykład estymacji punktowej danych z przykładu o czasie obsługi klientów (dane z szeregu) Summary Statistics for Czas Liczebność Count = 100 średnia Average = 71.39 Wariancja w próbie Variance = 812.18 Standard deviation = 28.4988 Odchylenie standardowe Minimum = 7.0 Maximum = 132.0 Dwie miary Stnd. skewness = -0.830001 Stnd. kurtosis = -0.86128asymetrii Sum = 7139.0 The StatAdvisor --------------- 15 Wykres typu “pudełko z wąsami” dla danych dotyczących czasu obsługi Box-and-Whisker Plot 0 30 60 90 120 150 Czas 16 Wpływ wielkości próby na dokładność oceny m Dla zademonstrowania znaczenia wielkości próby można zrealizować mały eksperyment symulacyjny. Ze sztucznie utworzonej normalnej populacji generalnej o zadanych parametrach (m=28,45 i =8) będziemy kolejno pobierać serie 100 prób losowych o liczebnościach kolejno n=10, n=20 i n=100. Dla każdej z serii wyznaczymy estymatory nieobciążone średniej generalnej m. Uzyskane wyniki przedstawimy graficznie na kolejnych wykresach. 17 Symulacja, n=10 I seria, n=10, 29,2 29,0 28,8 28,6 28,4 28,2 0 20 40 60 80 100 120 28,0 27,8 18 Symulacja, n=20 II seria, n=20 29,2 29,0 28,8 28,6 28,4 28,2 0 20 40 60 80 100 120 28,0 27,8 19 Symulacja, n=100 III seria, n=100 29,2 29,0 28,8 28,6 28,4 28,2 0 20 40 60 80 100 120 28,0 27,8 20 Symulacja, n=10 i n=100 29,2 29,0 28,8 28,6 28,4 28,2 0 20 40 60 80 100 120 0 20 40 60 80 100 120 28,0 27,8 29,2 29,0 28,8 28,6 28,4 28,2 28,0 27,8 21 Estymacja przedziałowa parametrów populacji Prawdopodobieństwo tego, że estymator punktowy przyjmie wartość szacowanego parametru, jest zawsze równe zero (dla populacji ciągłych). Oznacza to, że przy estymacji punktowej zawsze popełniamy błąd. Jest to jeden z powodów, dla którego wprowadza się tzw. estymację przedziałową. Pojęcie przedziału ufności zostało wprowadzone do statystyki przez Jerzego Spławę-Neymana. 22 Przedział ufności Niech cecha X ma w populacji rozkład określony nieznanym parametrem . Jeżeli dla ustalonego z góry prawdopodobieństwa 1- wyznaczymy takie dwie funkcje wyników próby a = f(x1, x2, ..., xn) i b = f(x1, x2, ..., xn), że spełniony będzie warunek: P(a < < b) = 1 - to uzyskany przedział (a,b) będziemy nazywać przedziałem ufności parametru . Ustalone z góry prawdopodobieństwo 1-, z jakim wyznaczony przedział pokrywa nieznany parametr nazywamy poziomem ufności. 23 Przedział ufności (c.d.) Granice przedziału ufności są losowe, a więc dla konkretnych prób będziemy uzyskiwać różne wartości. Uzyskany konkretny przedział będziemy interpretować następująco: w 1- procentach przypadków przedział (a, b) pokrywa nieznaną wartość parametru . Oznacza to jednocześnie, że średnio w procentach przypadków wyznaczony przedział nie pokrywa szacowanego parametru. Prawdopodobieństwo jest ryzykiem takiego błędu, najczęściej prawdopodobieństwo to będziemy nazywać poziomem istotności. 24 Przedział ufności (c.d.) Dokładność estymacji parametru określa rozpiętość przedziału ufności będąca różnicą między jego górną i dolną granicą: d = b - a. Rozpiętość przedziału ufności zależy między innymi od przyjętego poziomu ufności 1-: im to prawdopodobieństwo jest bliższe jedności, tym rozpiętość przedziału jest większa (a precyzja oceny mniejsza). W zastosowaniach praktycznych najczęściej stosujemy poziomy ufności rzędu 0.90, 0.95 czy 0.99 ( odpowiednio 0.10, 0.05 czy 0.01) 25 Przedział ufności dla średniej m Niech zmienna losowa X ~ N (m, ) oraz niech xi (i = 1, 2, ..., n) oznacza n-elementową próbę losową. Statystyka: x m x m t n s sx ma rozkład t-Studenta z liczbą stopni swobody v = n - 1. 26 Przedział ufności dla średniej m (cd) Dla ustalonego znajdziemy zawsze taką wartość t,v dla której spełniona będzie równość: P( |t| < t,v) = 1- Po niezbędnych przekształceniach otrzymujemy przedział ufności dla średniej generalnej m: P( x t ,v sx m x t ,v sx ) 1 27 Wpływ wielkości próby na rozpiętość przedziału ufności dla średniej generalnej m Dla zademonstrowania znaczenia wielkości próby można zrealizować mały eksperyment symulacyjny. Ze sztucznie utworzonej normalnej populacji generalnej o zadanych parametrach (m=28,45 i =8) będziemy kolejno pobierać serie 100 prób losowych o liczebnościach n=10, n=20 i n=100. Dla każdej z serii zbudujemy 95% przedziały ufności dla każdej ze 100 prób losowych. Uzyskane wyniki przedstawimy graficznie na kolejnych wykresach. 28 Symulacja, n=10, =0,05 91 81 71 61 51 41 31 21 11 1 27,0 27,5 28,0 28,5 29,0 29,5 30,0 29 Symulacja, n=20, =0,05 91 81 71 61 51 41 31 21 11 1 27,0 27,5 28,0 28,5 29,0 29,5 30,0 30 Symulacja, n=100, =0,05 91 81 71 61 51 41 31 21 11 1 27,0 27,5 28,0 28,5 29,0 29,5 30,0 31 Symulacja, n=10 i n=100, =0,05 91 91 81 81 71 71 61 61 51 51 41 41 31 31 21 21 11 11 1 27,0 27,5 28,0 28,5 N=10 29,0 29,5 30,0 1 27,0 27,5 28,0 28,5 29,0 29,5 30,0 N=100 32 Przedział ufności dla wariancji 2 w populacji normalnej Niech zmienna losowa X ~ N (m, ) oraz niech xi (i = 1, 2, ..., n) oznacza n-elementową próbę losową. Statystyka 2 (n 1) s2 2 ma rozkład 2 z liczbą stopni swobody v = n - 1. Dla ustalonego można można określić takie dwie wartości 2 ,n1 i 12 ,n 1 , dla których spełnione są równości: 2 2 P( ,n 1 ) 2 2 2 2 P ( 2 12 ,n 1 ) 1 2 2 33 Przedział ufności dla wariancji 2 w populacji normalnej (c.d.) Z obu wzorów wynika, że P( 12 ,n 1 2 2 ,n 1 ) 1 2 2 Po odpowiednich przekształceniach otrzymujemy przedział ufności dla wariancji: P( (n 1) s ,n 1 2 2 2 2 (n 1) s 2 2 1 2 ,n 1 ) 1 34 Przedział ufności dla odchylenia standardowego w populacji normalnej. Pierwiastkując krańce przedziału ufności dla wariancji otrzymujemy poszukiwany przedział dla odchylenia standardowego: P( (n 1) s ,n 1 2 2 2 (n 1) s 2 2 1 2 ,n 1 ) 1 35 Przedział ufności dla parametru p w rozkładzie dwumianowym. Niech zmienna losowa X ma rozkład dwumianowy z nieznanym parametrem p. Estymatorem tego parametru jest częstość sukcesów obserwowana w n-elementowej próbie określona wzorem: p k n W przypadku dużej próby można przyjąć, że statystyka ta ma w przybliżeniu rozkład normalny o parametrach: p(1 p) N p, n rozkład N(0, 1). , a statystyka z p p p(1 p) n 36 Przedział ufności dla parametru p w rozkładzie dwumianowym (c.d.) Tym samym dla ustalonego mamy: P ( z p p z ) 1 p (1 p ) n i dalej po odpowiednich przekształceniach: P( p z p (1 p ) p p z n p (1 p ) ) 1 n 37 Minimalna wielkość próby Rozpiętość przedziału ufności dla średniej populacji wynosi odpowiednio: 2t ,v sx 2t ,v s2 n Widzimy więc, że rozpiętość przedziału ufności dla średniej generalnej m zależy od: poziomu istotności liczebności próby n od rozproszenia cechy w populacji 38 Minimalna wielkość próby (c.d.) Przez maksymalny błąd szacunku rozumiemy połowę rozpiętości przedziału. Możemy więc tak dobrać liczebność próby, aby wielkość ta nie przekroczyła pewnej, ustalonej przez eksperymentatora, dokładności d. Mamy odpowiednio: 2 2 t s s ,v d n 2 n d 2 t , v 39 Rozkład różnicy średnich z prób dla dwóch populacji Załóżmy, że obserwujemy dwie zmienne normalne o tej samej wariancji: X1 ~ N (m1; ) 2 X 2 ~ N (m2 ; 2 ) Można wykazać, że statystyka: ( x1 x2 ) (m1 m2 ) ( x1 x2 ) (m1 m2 ) t sr 1 2 1 se n1 n2 ma rozkład t-Studenta z liczbą stopni swobody: v n1 n2 2 40 Rozkład różnicy średnich z prób dla dwóch populacji (c.d.) Wyrażenie 1 1 sr s n1 n2 2 e nazywamy błędem różnicy średnich, a wariancją dla obu prób: se2 jest wspólną (n1 1) s (n2 1) s s n1 n2 2 2 e 2 1 2 2 41 Przedziały ufności dla różnicy średnich Korzystamy z faktu, że statystyka ( x1 x2 ) ( m1 m2 ) t sr ma rozkład t-Studenta z liczbą stopni swobody v n1 .n2 2 Dla ustalonego istnieje taka wartość t ,v , dla której spełniona jest równość: P ( t t , v ) Po odpowiednich przekształceniach otrzymujemy: P( x1 x2 ) t ,v sr m1 m2 ( x1 x2 ) t ,v sr 1 42