ĆWICZENIA nr 15 Cel zajęd: Zapoznanie z modelem dwuczynnikowej analizy wariancji (analizy wariancji z klasyfikacją podwójną). Wykonanie przykładowych obliczeo dotyczących modelu dwuczynnikowej analizy wariancji bez powtórzeo oraz z powtórzeniami. Wprowadzenie teoretyczne Analiza wariancji jest rodzajem wnioskowania statystycznego, wykorzystującym testy oparte na ilorazach wariancji dla określenia czy istnieją statystycznie istotne różnice między średnimi wielu grup obserwacji pochodzących z populacji o rozkładach normalnych oraz jednakowych wariancjach. Jeżeli badany jest wpływ dwóch czynników na badaną zmienną, to mamy do czynienia z dwuczynnikową analizą wariancji (analizą wariancji z klasyfikacją podwójną). Jeżeli ponadto, dla każdej pary czynników mamy po jednej obserwacji badanej zmiennej, to mamy do czynienia z dwuczynnikową analizą wariancji bez powtórzeo (bez interakcji). Wówczas model analizy wariancji jest postaci: , gdzie jest obserwacją k-tego elementu w i-tej grupie ze względu na pierwszy czynnik i w j-tej grupie ze względu na drugi czynnik, jest średnią wartością cechy w populacji, jest efektem i-tej grupy, jest efektem j-tej grupy oraz jest wpływem czynników specyficznych dla k-tego elementu z i-tej grupy względu na pierwszy czynnik i z j-tej grupy ze względu na drugi czynnik. Testowana jest następująca hipoteza: Aby zweryfikowad tak postawione hipotezy, należy wypełnid tabelę analizy wariancji: źródło zmienności DF liczba stopni swobody SS suma kwadratów MS średnia suma kwadratów wartośd statystyki F czynnik I czynnik II błąd Statystyka , przy prawdziwości hipotezy , ma rozkład F-Snedecora Przy zadanym poziomie istotności , obszarem odrzucenia jest . , gdzie jest kwantylem rzędu rozkładu . Statystyka , przy prawdziwości hipotezy , ma rozkład F-Snedecora Przy zadanym poziomie istotności , obszarem odrzucenia jest . , gdzie jest kwantylem rzędu rozkładu . Jeżeli badany jest wpływ dwóch czynników na badaną zmienną oraz dla każdej pary czynników mamy r obserwacji badanej zmiennej, mamy do czynienia z dwuczynnikową analizą wariancji z powtórzeniami (z interakcją). Wówczas model analizy wariancji jest postaci: , gdzie jest obserwacją k-tego elementu w i-tej grupie ze względu na pierwszy czynnik i w j-tej grupie ze względu na drugi czynnik, jest średnią wartością cechy w populacji, jest efektem i-tej grupy, jest efektem j-tej grupy, jest efektem interakcji pomiędzy czynnikiem pierwszym na i-tym poziomie i czynnika drugiego na j-tym poziomie oraz jest wpływem czynników specyficznych dla k-tego elementu z i-tej grupy względu na pierwszy czynnik i z j-tej grupy ze względu na drugi czynnik. Testowana jest następująca hipoteza: Aby zweryfikowad tak postawione hipotezy, należy wypełnid tabelę analizy wariancji: źródło zmienności DF liczba stopni swobody SS suma kwadratów MS średnia suma kwadratów wartośd statystyki F czynnik I czynnik II interakcja błąd Statystyka , przy prawdziwości hipotezy , ma rozkład F-Snedecora zadanym poziomie istotności , obszarem odrzucenia jest . Przy , gdzie jest kwantylem rzędu rozkładu . Statystyka , przy prawdziwości hipotezy , ma rozkład F-Snedecora zadanym poziomie istotności , obszarem odrzucenia jest . Przy , gdzie jest kwantylem rzędu Statystyka , przy rozkładu . prawdziwości hipotezy , ma rozkład F-Snedecora . Przy zadanym poziomie istotności , obszarem odrzucenia jest , gdzie jest kwantylem rzędu rozkładu . Zadania do rozwiązania 1. Zadania nr 1 i 2 z dwiczenia nr 14 rozwiązad przy pomocy pakietu Excel. 2. Z trzech wydziałów pewnej uczelni wylosowano po jednym studencie z każdego roku studiów i obliczono średnią ocen uzyskaną przez niego w ostatnim semestrze. Uzyskane rezultaty zawiera arkusz dane1 w skoroszycie dane_ANOVA. Zakładając, że średnie uzyskanych ocen mają rozkłady normalne o tej samej wariancji, na poziomie α = 0.05 zweryfikowad następujące hipotezy: a) wartości przeciętne średnich ocen dla studentów różnych wydziałów są jednakowe, b) wartości przeciętne średnich ocen studentów dla różnych lat studiów są jednakowe, c) wartości przeciętne ocen średnich studentów z pierwszego oraz piątego roku studiów są jednakowe. 3. Z trzech wydziałów pewnej uczelni wylosowano po pięciu studentów z każdego roku studiów i obliczono średnią ocen uzyskaną przez niego w ostatnim semestrze. Uzyskane rezultaty zawiera arkusz dane2 w skoroszycie dane_ANOVA. Zakładając, że średnie uzyskanych ocen mają rozkłady normalne o tej samej wariancji, na poziomie α = 0.05 zweryfikowad następujące hipotezy: a) wartości przeciętne średnich ocen dla studentów różnych wydziałów są jednakowe, b) wartości przeciętne średnich ocen studentów dla różnych lat studiów są jednakowe, c) wartości przeciętne ocen średnich studentów z pierwszego oraz piątego roku studiów są jednakowe. Źródła: Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M. „Rachunek prawdopodobieostwa i statystyka matematyczna w zadaniach – częśd II: Statystyka matematyczna”, PWN, Warszawa 2004 Magiera R. „Modele i metody statystyki matematycznej”, Oficyna Wydawnicza GiS, Wrocław 2002 Żuk B. „Biometria stosowana”, PWN, Warszawa 1989