ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ

advertisement
ANALIZA STATYSTYCZNA WYNIKÓW BADAŃ
Ćwiczenie 2
Analiza normalności rozkładu zmiennej
Zadanie 1 Analiza skośności i kurtozy
Otwórz plik „ASWB Cw 2 dane.xls”. Znajdują się w nim dane dotyczące wyników pomiarów
spożycia mięsa, ryb, ziemniaków, serów i jaj w 40 okresach badawczych.
1. Oblicz kurtozę i skośność dla każdej zmiennej.
W komórce odpowiadającej wartości kurtozy wpisz formułę „=kurtoza(zaznacz zakres zmiennej)”.
Przeciągnij formułę w prawo na wszystkie zmienne
W komórce odpowiadającej wartości skośności wpisz formułę „=skośność(zaznacz zakres
zmiennej)”. Przeciągnij formułę w prawo na wszystkie zmienne
2. Oblicz kurtozę i skośność w programie WebSTATISTICA.
Otwórz przeglądarkę
W adresie strony wpisz: http://212.14.35.3/webstatistica
Username: ryb + numer komputera (np. ryb01)
Password: pracownia01
File -> Open Data Spreadsheet->
W okienku „Select Data Source” wybierz:
katalog Shared i plik „ASWB Cw 2 dane.sta” -> OK
Statistics -> Basic statistics/tables → Descriptive statistics (statystyki opisowe)
W okienku „Select variables” (wybierz zmienne) w kolumnie
„Continuous variables”(zmienne ciągłe) zaznacz wszystkie zmienne oprócz „Nr okresu”
„Categorical variables”(zmienne skategoryzowane) nie zaznaczaj nic
W okienku „Descriptive statistics” zaznacz
Detail of computed results reported: All results (wszytskie rezultaty)
Creates medians: False (utwórz mediany- nie)
Creates quartiles: False (utwórz kwartyle- nie)
Type of categorization: Integer auto (typ kategoryzacji: automatyczny całkowy)
Number of intervals: 10 (liczba przedziałów)
Creates summary graphs: False (utwórz wykresy podsumowujące- nie)
→ OK
Znajdź w tabeli pierwszej wartości skośności i kurtozy i porównaj z wynikami otrzymanymi
w pliku ‘ASWB Cw 2 dane.xls.’
Na podstawie otrzymanych wartości skośności i kurtozy uzupełnij poniższe zdania:
Największe spłaszczenie rozkładu uzyskała zmienna: ..........
Największe wydłużenie rozkładu uzyskała zmienna: ..............
Najwyższą asymetrię rozkładu uzyskała zmienna: ............
Najmniejsze odchylenia od normalności rozkładu uzyskała zmienna: ................
Do Tabeli podsumowującej na końcu Zadania 4 wpisz TAK jeśli na podstawie wartości
skośności i kurtozy szacujesz że rozkład danej zmiennej JEST NORMALNY lub NIE, jeśli
oszacujesz że NIE JEST NORMALNY.
Zadanie 2 Analiza histogramów w programie WebSTATISTICA
Przeprowadź w programie WebSTATISTICA analizy na tych samych danych co w
poprzednim zadaniu.
1. Tworzenie histogramów
Graphs -> histograms (histogramy)
W okienku „Select variables” (wybierz zmienne) w kolumnie
„Continuous variables”(zmienne ciągłe) zaznacz wszystkie zmienne oprócz Nr okresu
„Categorical variables”(zmienne skategoryzowane) nie zaznaczaj nic
W okienku „2D histograms” zaznacz
Graph type: regular histogram (zwykły histogram)
Fit type: normal (dopasowuje rozkład normalny)
Type of categorization: Integer auto (typ kategoryzacji: automatyczny całkowy)
Number of intervals: 10 (liczba przedziałów)
Break between columns: False (odstępy pomiędzy kolumnami: nie)
Show percentages: False (pokaż procenty: nie)
Detail of computed results reported: Minimal (szczegółowość raportu: minimalna)
→ OK
Przeanalizuj wykresy i uzupełnij poniższe zdania.
Histogram najbardziej zbliżony do rozkładu normalnego otrzymano dla zmiennej: .........
Histogram najbardziej odbiegający od rozkładu normalnego otrzymano dla zmiennej: .......
Do Tabeli podsumowującej na końcu Zadania 4 wpisz TAK jeśli na podstawie histogramu
szacujesz że rozkład danej zmiennej JEST NORMALNY lub NIE, jeśli oszacujesz że NIE
JEST NORMALNY.
Zadanie 3 Tworzenie wykresów prawdopodobieństwo-prawdopodobieństwo w programie
WebSTATISTICA
Przeprowadź w programie WebSTATISTICA analizy na tych samych danych co w
poprzednim zadaniu.
1. Tworzenie wykresów prawdopodobieństwo - prawdopodobieństwo.
Graphs -> 2D graphs → Probability-probability plots (wykresy prawdopodobieństwoprawdopodobieńswo)
W okienku „Select variables” (wybierz zmienne) zaznacz wszystkie zmienne oprócz „Nr okresu”
W okienku „2D Probability-probability plots” zaznacz
Distribution: normal (rozkład normalny)
Creates from data: True (oblicz parametry rozkładu z danych: tak)
Pozostałe parametry pozostaw bez zmian
→ OK
Po analizie kształtu wykresów uzupełnij poniższe zdania:
Największe odchylenia od rozkładu normalnego na wykresach prawdopodobieństwoprawdopodobieństwo uzyskano dla zmiennej: ...........................
Najmniejsze odchylenia od rozkładu normalnego na wykresach prawdopodobieństwoprawdopodobieństwo uzyskano dla zmiennej: ...........................
Do Tabeli podsumowującej na końcu Zadania 4 wpisz TAK jeśli na podstawie wykresu P-P
szacujesz że rozkład danej zmiennej JEST NORMALNY lub NIE, jeśli oszacujesz że NIE
JEST NORMALNY.
Zadanie 4 Przeprowadzenie testów normalnościw programie WebSTATISTICA
Przeprowadź w programie WebSTATISTICA analizy na tych samych danych co w
poprzednim zadaniu.
1. Analiza dopasowania rozkładów.
Statistics -> Distribution fitting (dopasowanie rozkładów)
W okienku „Select variables” (wybierz zmienne) w kolumnie
„Continuous variables”(zmienne ciągłe) zaznacz wszystkie zmienne oprócz nr okresu
„Categorical variables”(zmienne skategoryzowane) nie zaznaczaj nic
W okienku „Distribution fitting” zaznacz
Detail of comupted results reported: minimal (szczegółowość wyników: minimalna)
Continuous distribution type: normal (typ rozkładu ciągłego: normalny)
Descrete distribution type: Binomial (typ rozkładu nieciągłego- dwumianowy)
Kolmogorov-Smirnov test: TRUE (test kołmogorowa-Smirnowa: tak)
→ OK
Przeanalizuj wyniki i uzupełnij wnioski poniżej:
Spozycie mięsa:
Test Kolmogorowa-Smirnowa: p=............
Test Lillieforsa: p=.................
Test chi-kwadrat: p=..........
wniosek: rozkład jest/nie jest normalny
Spożycie ryb:
Test Kolmogorowa-Smirnowa: p=............
Test Lillieforsa: p=.................
Test chi-kwadrat: p=..........
wniosek: rozkład jest/nie jest normalny
Spożycie ziemniaków:
Test Kolmogorowa-Smirnowa: p=............
Test Lillieforsa: p=.................
Test chi-kwadrat: p=..........
wniosek: rozkład jest/nie jest normalny
Spożycie serów:
Test Kolmogorowa-Smirnowa: p=............
Test Lillieforsa: p=.................
Test chi-kwadrat: p=..........
wniosek: rozkład jest/nie jest normalny
Spożycie jaj:
Test Kolmogorowa-Smirnowa: p=............
Test Lillieforsa: p=.................
Test chi-kwadrat: p=..........
wniosek: rozkład jest/nie jest normalny
Do Tabeli podsumowującej wpisz TAK jeśli na podstawie wartości testów normalności
stwierdzisz, że rozkład danej zmiennej JEST NORMALNY lub NIE, jeśli oszacujesz że NIE
JEST NORMALNY.
Tabela podsumowująca: rozkład normalny TAK/NIE
Zmienna
Skośność i
kurtoza
Analiza
histogramu
Spożycie mięsa
Spożycie ryb
Spożycie
ziemniaków
Spożycie serów
Spożycie jaj
Uzupełnij poniższe zdania:
Zmienne, które spełniają rozkład normalny: …….
Zmienne, które nie spełniają rozkładu normalnego: …….
Analiza
wykresów P-P
Testy
normalności
Download