Statystyka medyczna Piotr Kozłowski e-mail: [email protected] www: www.amu.edu.pl/~kozl 1 Zaliczenie: • obecność na ćwiczeniach • praktyczne kolokwium 2 Zakres materiału: • Wstęp do statystyki • Statystyka opisowa • Rozkład prawdopodobieństwa, przedział ufności, Centralne Twierdzenie graniczne • Testy dla jednej próbki • Testy na porównanie dwóch próbek (t-Studenta, Wilcoxona, UManna-Whitneya • Współczynniki korelacji (Pearsona i Spearmana) i regresja. 3 Statystyka Opis Statystyka opisowa: metody gromadzenia, opisu i prezentacji danych Estymacja Statystyka matematyczna (indukcyjna): - teoria estymacji - weryfikacja hipotez 4 Populacja Próbka reprezentatywna 5 Estymator – wielkość obliczona dla próby, która stanowi oszacowanie wielkości obliczonej dla populacji. Np. średnia z próbki jest dobrym estymatorem średniej z populacji. Cechy optymalnego estymatora: • Nieobciążony E(v’)=v • Zgodny (limN→∞ P(|v'-v|>ε)=0) • Efektywny – minimalna wariancja Estymator nieobciążony Wartość dla populacji Estymator obciążony 6 Skale pomiarowe • nominalna - wynikiem pomiaru jest rozłączna kategoria, np.: kolor oczu, płeć, grupa krwi, • porządkowa - podobnie jak nominalna, tylko że wyniki można jednoznacznie uporządkować, np.: stopień znajomości języka: podstawowy, średnio zaawansowany, zaawansowany, biegły, lub masa ciała: niedowaga, norma, nadwaga, otyłość. Skala ta może być wyrażana pry pomocy cyfr, np. tak i nie to 1 i 0, lub skala Apgar (0-10) • przedziałowa (interwałowa, równomierna) - tak jak porządkowa, tylko że można obliczyć odległość między wynikami, większość pomiarów należy do tej skali, np.: ciśnienie krwi, masa ciała, temperatura • ilorazowa - to samo co skala przedziałowa z tym że iloraz ma sens (istnieje bezwzględne zero), np. wiek, 7 Sposoby przedstawiania surowych danych • Histogram (skala ilorazowa i przedziałowa – zmienne ciągłe) 8 • wykresy słupkowe - zmienne dyskretne 9 • wykresy kołowe - wszystkie skale porządkowa nominalna ilorazowa 10 • Diagram łodyga liście 11 • Wykres rozrzutu 12 Statystyka opisowa Miary położenia • Średnia arytmetyczna 1 n x xi n i 1 • Mediana – wartość środkowa • Moda – wartość najczęściej występująca • Kwartyle (Q3 – dolny i Q4 - górny, percentyle (centyle) 13 Miary rozrzutu • Wariancja 1 n 2 S x xi n i 1 2 • Odchylenie standardowe • Odchylenie ćwiartkowe • Współczynnik zmienności S S2 Q 1 Q3 Q1 2 S V x Q V Me 14 Miary symetrii kurtoza K>0 - bardziej smukła niż normalny (rozkład leptokurtyczny), K<0 mniej smukła niż normalny (rozkład platokurtyczny) 15 skośność (współczynnik symetrii) As>0 - mediana i moda na lewo od średniej (symetria prawostronna - Mo<Me<średnia ), As<0 symetria lewostronna - Mo>Me> średnia n As n (x1 x )3 i 1 (n 1)(n 2)S 3 (Q3 Me) (Me Q1 ) Aq (Q3 Me) (Me Q1) 16 Graficzna prezentacja statystyk – wykres ramka-wąsy 17