Wykład 11 Analiza wariancji (ANOVA) • Sposób analizy danych gdy mamy więcej niż dwa zabiegi lub populacje. • Omówimy ANOV-ę w najprostszej postaci. • Te same podstawowe założenia/ograniczenia co przy teście Studenta W każdej populacji badana cecha ma rozkład normalny Obserwacje są niezależne i losowe Będziemy testowali hipotezy o średnich w populacjach i Założenie – standardowe odchylenia badanej cechy w każdej populacji są sobie równe (podobne) więc możemy użyć uśrednionego SE • Uwaga: ANOVA może być stosowana także gdy próby nie są niezależne • Np. W układzie zrandomizowanym blokowym • (zasada podobna do testu Studenta dla powiązanych par) • Nie będziemy tego omawiać. Omówimy tylko układy zupełne zrandomizowane. • Cel: • Testujemy hipotezy postaci: • H 0: 1 = 2 = 3 = … = k • HA: nie wszystkie średnie są równe Dlaczego nie stosujemy wielu testów Studenta? • Wielokrotne porównania – P-stwo błędu pierwszego rodzaju (p - stwo odrzucenia prawdziwej hipotezy) jest trudne do kontrolowania) Korekta Bonferoniego – Prosta ale na ogół konserwatywna (p-stwo błędu pierwszego rodzaju mniejsze niż założone – strata mocy). • Estymacja błędu standardowego – ANOVA wykorzystuje informację zawartą we wszystkich obserwacjach: zwykle daje większą precyzję Notacja: k = 3 zabiegi (próby, grupy) Zabieg 1 Zabieg 2 Zabieg 3 1 48 40 39 2 39 48 30 3 42 44 32 4 43 średnia 43 44 34 SS 42 32 46 35 • Trzy rodzaje rachunków: • Wewnątrz grup, pomiędzy grupami, całkowite. • Liczymy trzy wartości: SS, df, MS SS Between Within Total df MS Notacja: k = # grup (prób, zabiegów) k= n1, n2, n3, …, nk = rozmiary grup n1 = , n2 = , n3 = (# obserwacji) y1 , y2, … yk = średnie w grupach y = całkowita średnia y1= ,y2 = y3= , 440 y 40 11 n* = całkowita liczba obserwacji n* = • Dwa podstawowe typy rachunków: (gdzie konieczne, będziemy używali i do indeksowania grup a j do indeksowania obserwacji w każdej grupie : yij ) • Wewnątrz każdej grupy oznacza sumę ``wewnątrz grupy’’ y1 y 1j n1 y1 48 39 42 43 4 • Uwzględniające wszystkie grupy np. k oznacza sumę we wszystkich grupach i1 n ni n* = i y y ij n y 172 132 136 11 40 • UWAGA: Gdy rozmiary prób nie są równe nie jest średnią z k średnich!!! Ale można ją obliczyć jako y • y = (n1y1 + n2y2 + …+n3y3) / n* Wewnątrz grup (wypełniamy drugi rząd w tabeli) Suma kwadratów wewnątrz grup (SSW) • Liczymy SS wewnątrz każdej grupy SS1 y1 j y1 (itd. - SS2, SS3 , …) 2 SS1 = SS2 = … = 32, SS3 = … = 46 • SSW = SS1+SS2+…+SSk= SS y i ij yi 2 • SSW = • Stopnie swobody wewnątrz grup: dfw = n* - k dfw = • Średnia suma kwadratów wewnątrz grup MSW = SSW / dfw MSW = To samo co uśredniona wariancja SS1 SS2 Dla przypomnienia s dla dwóch n1 n2 2 prób 2 c • Uśrednione standardowe odchylenie sc = MSW • Pomiędzy grupami (wypełniamy pierwszy rząd tabeli) Porównujemy średnie grupowe do średniej całkowitej Ważone przez rozmiar grupy • Suma kwadratów pomiędzy grupami (SSB) • SSB = n y y 2 SSB = i i • Stopnie swobody pomiędzy grupami (dfb) dfb = k – 1 dfb = • Średnia suma kwadratów pomiędzy grupami (MSB) MSB = SSB/dfb MSB = • Całkowite • Całkowita suma kwadratów (SST) y y 2 • SST= SST=82+12+22+…+82+52=348 ij • Uwaga: SST = SSW+SSB 348 = 120 + 228 Zwykle nie trzeba liczyć SST z definicji Całkowita liczba stopni swobody (dft) dft = n* – 1 dft = Uwaga: dft = dfb+dfw 10 = 2 + 8 Tablica ANOV-y SS Between Within Total df MS Ta tabela będzie dostępna na kolokwium i egzaminie: Pomiędzy SS df MS SSB= dfb = k – 1 SSB/dfb dfw = n* – k SSW/dfw n y i Wewnątrz i y 2 SSW= SS y i Całkowite ij yi dft = n* – 1 SST= y ij y 2 2 Test F • Dane dla k 2 populacji lub zabiegów są niezależne • Dane w każdej populacji mają rozkład normalny ze średnią i dla populacji i, i tym samym odchyleniem standardowym • • • • • Testujemy H0: 1 = 2 = 3 = … = k (wszystkie średnie są sobie równe) vs. HA: nie wszystkie średnie są sobie równe (HA jest niekierunkowa ale obszar odrzuceń będzie jednostronny) Kroki: Obliczenie tabeli ANOV-y Testowanie Jak opisać F test Zdefinować wszystkie H0 podać za pomocą wzoru i słownie HA tylko słownie Statystyka testowa Fs = MSB/MSW przy H0, Fs ma rozkład Snedecora z dfb, dfw stopniami swobody • Na kolejnych slajdach podane są wartości krytyczne z książki D.S. Moore i G. P. McCabe ``Introduction to the Practice of Statistics’’ • "numerator df" = dfb i "denominator df" = dfw. • • • • • • Odrzucamy H0 gdy zaobserwowane Fs > Fkrytyczne • Przykładowy wniosek - Na poziomie istotności α (nie) mamy przesłanki aby twierdzić, że grupy różnią się poziomem badanej cechy. • Przykład: Losową próbę 15 zdrowych mężczyzn podzielono losowo na 3 grupy składające się z 5 mężczyzn. Przez tydzień otrzymywali oni lekarstwo Paxil w dawkach 0, 20 i 40 mg dziennie. Po tym czasie zmierzono im poziom serotoniny. • Czy Paxil wpływa na poziom serotoniny u zdrowych, młodych mężczyzn ? Niech 1 będzie średnim poziomem serotoniny u mężczyzn przyjmujących 0 mg Paxilu. Niech 2 będzie średnim poziomem serotoniny u mężczyzn przyjmujących 20 mg Paxilu. Niech 3 będzie średnim poziomem serotoniny u mężczyzn przyjmujących 40 mg Paxilu. • H0: 1 = 2 = 3 ; średni poziom serotoniny nie zależy od dawki Paxilu • HA: średni poziom serotoniny nie jest ten sam we wszystkich grupach (albo średni poziom serotoniny zależy od dawki Paxilu). • Zastosujemy F-Test Dawka 0mg 20mg 40mg 48,62 58,60 68,59 49,85 72,52 78,28 64,22 62,81 66,72 80,12 82,77 76,53 62,51 68,44 72,33 suma 5 5 5 15 srednia SS(w) 57,60 235,87 69,28 249,31 75,70 119,29 67,53 604,47 SS(b) 492,64 15,36 334,03 842,02 n Tablica ANOV-y Between Within Total SS df MS • Fs = MSB / MSW przy H0 ma rozkład • Testujemy na poziomie istotności = 0.05. Wartość krytyczna F.05 = . • Obserwujemy Fs = • Wniosek: Na jakiej zasadzie to działa ? • Dla przypomnienia: • Test Studenta patrzy na różnicę między średnimi (y1-y2) • Dzieli ją przez miarę rozrzutu tej różnicy (SEy1-y2 ) • Jeżeli (y1-y2) jest duże w porównaniu do błędu standardowego to statystyka testu Studenta jest duża i odrzucamy H0. • Dla testu F, Liczymy ``uśredniony kwadrat różnicy między średnimi’’ (MSB) Dzielimy go przez oszacowanie zróżnicowania w próbie (MSW) Jeżeli MSB jest duże w porównaniu do MSW wówczas statystyka testu F jest duża i odrzucamy H0. Test F jest analogiczny do testu Studenta ale umożliwia jednoczesne porównanie kilku średnich. • Test F można stosować również gdy mamy tylko dwie próby Statystyka testu F dla dwóch prób jest równa kwadratowi statystyki testu Studenta Decyzje i p-wartości są dokładnie takie same dla obu testów.