ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ Ćwiczenie 2 Analiza normalności rozkładu zmiennej Zadanie 1 Analiza skośności i kurtozy Otwórz plik „ASWB Cw 2 dane.xls”. Znajdują się w nim dane dotyczące wyników pomiarów spożycia mięsa, ryb, ziemniaków, serów i jaj w 40 okresach badawczych. 1. Oblicz kurtozę i skośność dla każdej zmiennej. W komórce odpowiadającej wartości kurtozy wpisz formułę „=kurtoza(zaznacz zakres zmiennej)”. Przeciągnij formułę w prawo na wszystkie zmienne W komórce odpowiadającej wartości skośności wpisz formułę „=skośność(zaznacz zakres zmiennej)”. Przeciągnij formułę w prawo na wszystkie zmienne 2. Oblicz kurtozę i skośność w programie WebSTATISTICA. Otwórz przeglądarkę W adresie strony wpisz: http://212.14.35.3/webstatistica Username: ryb + numer komputera (np. ryb01) Password: pracownia01 File -> Open Data Spreadsheet-> W okienku „Select Data Source” wybierz: katalog Shared i plik „ASWB Cw 2 dane.sta” -> OK Statistics -> Basic statistics/tables → Descriptive statistics (statystyki opisowe) W okienku „Select variables” (wybierz zmienne) w kolumnie „Continuous variables”(zmienne ciągłe) zaznacz wszystkie zmienne oprócz „Nr okresu” „Categorical variables”(zmienne skategoryzowane) nie zaznaczaj nic W okienku „Descriptive statistics” zaznacz Detail of computed results reported: All results (wszytskie rezultaty) Creates medians: False (utwórz mediany- nie) Creates quartiles: False (utwórz kwartyle- nie) Type of categorization: Integer auto (typ kategoryzacji: automatyczny całkowy) Number of intervals: 10 (liczba przedziałów) Creates summary graphs: False (utwórz wykresy podsumowujące- nie) → OK Znajdź w tabeli pierwszej wartości skośności i kurtozy i porównaj z wynikami otrzymanymi w pliku ‘ASWB Cw 2 dane.xls.’ Na podstawie otrzymanych wartości skośności i kurtozy uzupełnij poniższe zdania: Największe spłaszczenie rozkładu uzyskała zmienna: .......... Największe wydłużenie rozkładu uzyskała zmienna: .............. Najwyższą asymetrię rozkładu uzyskała zmienna: ............ Najmniejsze odchylenia od normalności rozkładu uzyskała zmienna: ................ Do Tabeli podsumowującej na końcu Zadania 4 wpisz TAK jeśli na podstawie wartości skośności i kurtozy szacujesz że rozkład danej zmiennej JEST NORMALNY lub NIE, jeśli oszacujesz że NIE JEST NORMALNY. Zadanie 2 Analiza histogramów w programie WebSTATISTICA Przeprowadź w programie WebSTATISTICA analizy na tych samych danych co w poprzednim zadaniu. 1. Tworzenie histogramów Graphs -> histograms (histogramy) W okienku „Select variables” (wybierz zmienne) w kolumnie „Continuous variables”(zmienne ciągłe) zaznacz wszystkie zmienne oprócz Nr okresu „Categorical variables”(zmienne skategoryzowane) nie zaznaczaj nic W okienku „2D histograms” zaznacz Graph type: regular histogram (zwykły histogram) Fit type: normal (dopasowuje rozkład normalny) Type of categorization: Integer auto (typ kategoryzacji: automatyczny całkowy) Number of intervals: 10 (liczba przedziałów) Break between columns: False (odstępy pomiędzy kolumnami: nie) Show percentages: False (pokaż procenty: nie) Detail of computed results reported: Minimal (szczegółowość raportu: minimalna) → OK Przeanalizuj wykresy i uzupełnij poniższe zdania. Histogram najbardziej zbliżony do rozkładu normalnego otrzymano dla zmiennej: ......... Histogram najbardziej odbiegający od rozkładu normalnego otrzymano dla zmiennej: ....... Do Tabeli podsumowującej na końcu Zadania 4 wpisz TAK jeśli na podstawie histogramu szacujesz że rozkład danej zmiennej JEST NORMALNY lub NIE, jeśli oszacujesz że NIE JEST NORMALNY. Zadanie 3 Tworzenie wykresów prawdopodobieństwo-prawdopodobieństwo w programie WebSTATISTICA Przeprowadź w programie WebSTATISTICA analizy na tych samych danych co w poprzednim zadaniu. 1. Tworzenie wykresów prawdopodobieństwo - prawdopodobieństwo. Graphs -> 2D graphs → Probability-probability plots (wykresy prawdopodobieństwoprawdopodobieńswo) W okienku „Select variables” (wybierz zmienne) zaznacz wszystkie zmienne oprócz „Nr okresu” W okienku „2D Probability-probability plots” zaznacz Distribution: normal (rozkład normalny) Creates from data: True (oblicz parametry rozkładu z danych: tak) Pozostałe parametry pozostaw bez zmian → OK Po analizie kształtu wykresów uzupełnij poniższe zdania: Największe odchylenia od rozkładu normalnego na wykresach prawdopodobieństwoprawdopodobieństwo uzyskano dla zmiennej: ........................... Najmniejsze odchylenia od rozkładu normalnego na wykresach prawdopodobieństwoprawdopodobieństwo uzyskano dla zmiennej: ........................... Do Tabeli podsumowującej na końcu Zadania 4 wpisz TAK jeśli na podstawie wykresu P-P szacujesz że rozkład danej zmiennej JEST NORMALNY lub NIE, jeśli oszacujesz że NIE JEST NORMALNY. Zadanie 4 Przeprowadzenie testów normalnościw programie WebSTATISTICA Przeprowadź w programie WebSTATISTICA analizy na tych samych danych co w poprzednim zadaniu. 1. Analiza dopasowania rozkładów. Statistics -> Distribution fitting (dopasowanie rozkładów) W okienku „Select variables” (wybierz zmienne) w kolumnie „Continuous variables”(zmienne ciągłe) zaznacz wszystkie zmienne oprócz nr okresu „Categorical variables”(zmienne skategoryzowane) nie zaznaczaj nic W okienku „Distribution fitting” zaznacz Detail of comupted results reported: minimal (szczegółowość wyników: minimalna) Continuous distribution type: normal (typ rozkładu ciągłego: normalny) Descrete distribution type: Binomial (typ rozkładu nieciągłego- dwumianowy) Kolmogorov-Smirnov test: TRUE (test kołmogorowa-Smirnowa: tak) → OK Przeanalizuj wyniki i uzupełnij wnioski poniżej: Spozycie mięsa: Test Kolmogorowa-Smirnowa: p=............ Test Lillieforsa: p=................. Test chi-kwadrat: p=.......... wniosek: rozkład jest/nie jest normalny Spożycie ryb: Test Kolmogorowa-Smirnowa: p=............ Test Lillieforsa: p=................. Test chi-kwadrat: p=.......... wniosek: rozkład jest/nie jest normalny Spożycie ziemniaków: Test Kolmogorowa-Smirnowa: p=............ Test Lillieforsa: p=................. Test chi-kwadrat: p=.......... wniosek: rozkład jest/nie jest normalny Spożycie serów: Test Kolmogorowa-Smirnowa: p=............ Test Lillieforsa: p=................. Test chi-kwadrat: p=.......... wniosek: rozkład jest/nie jest normalny Spożycie jaj: Test Kolmogorowa-Smirnowa: p=............ Test Lillieforsa: p=................. Test chi-kwadrat: p=.......... wniosek: rozkład jest/nie jest normalny Do Tabeli podsumowującej wpisz TAK jeśli na podstawie wartości testów normalności stwierdzisz, że rozkład danej zmiennej JEST NORMALNY lub NIE, jeśli oszacujesz że NIE JEST NORMALNY. Tabela podsumowująca: rozkład normalny TAK/NIE Zmienna Skośność i kurtoza Analiza histogramu Spożycie mięsa Spożycie ryb Spożycie ziemniaków Spożycie serów Spożycie jaj Uzupełnij poniższe zdania: Zmienne, które spełniają rozkład normalny: ……. Zmienne, które nie spełniają rozkładu normalnego: ……. Analiza wykresów P-P Testy normalności