dr inż. Jacek Lewandowski Przedział ufności - wprowadzenie Przedział ufności na poziomie ufności 1−α dla parametru t to przedział, w którym na (1−α)⋅100% leży wartość parametru t, tzn. P(L < t < P) = 1 − α gdzie L i P to wartości krytyczne (czyli krańcowe) dla przedziału ufności. Poziom istotności α Poziom istotności α jest to maksymalne prawdopodobieństwo, że popełnimy błąd pierwszego rodzaju, tzn. prawdopodobieństwo odrzucenia hipotezy zerowej, mimo że była ona prawdziwa. Mówiąc prościej jest to prawdopodobieństwo, że stwierdzimy, że nasz przedział ufności nie zawiera szukanego parametru mimo że w go zawierał. Co to jest poziom ufności? Poziom ufności to procent, który mówi nam jak bardzo dokładny jest przedział ufności, czyli jak często mamy rację. Im większy poziom ufności (bliższy 100%) tym częściej mamy rację co do oszacowania parametru. Poziom istotności a poziom ufności: Relacja między tymi pojęciami jest prosta. poziom istotności: α poziom ufności: 1−α Typowe poziomy ufności: Najczęściej spotykanymi poziomami ufności są 99%, 98%, 95% oraz 90%. Im większy poziom ufności tym szerszy przedział - skoro chcemy mieć większą pewność, że wartość parametru leży w naszym przedziale to musimy go zwiększyć. Po co nam przedział ufności? Przedział ufności informuje nas na ile możemy ufać naszym wyliczeniom, np. dotyczącymi średniej. Załóżmy, że chcemy wyliczyć średnią wagę studentów w Polsce. Jeżeli chcielibyśmy wyliczyć dokładną wartość musielibyśmy przebadać wszystkich studentów w Polsce. Oczywiście dałoby się to zrobić ale badania byłyby kosztowne i czasochłonne. Dlatego chcemy wybrać reprezentatywną grupę studentów i estymować (oszacować) wartość średniej. Jednak wybierając grupę, może się zdarzyć, że trafiliśmy lepiej lub gorzej. Z tego powodu zamiast podawać dokładną wartość możemy podać przedział i powiedzieć, że na 99% średnia jest w tym przedziale a to już daje nam obraz wagi całej populacji studentów Bezpieczeństwo Żywności, sem. 2 1/2 dr inż. Jacek Lewandowski Przedział ufności dla średniej Przedział ufności dla średniej pozwala nam oszacować prawdopodobny przedział, w którym znajduje się średnia danego rozkładu normalnego, przy czy wariancja rozkładu (σ2) może być znana lub nie znana. Warto zapamiętać jedną rzecz wyliczając przedział ufności dla średniej: w większości przypadków wyliczając wartość dystrybuanty korzystamy z rozkładu normalnego. Jedynym wyjątkiem jest sytuacja gdy ilość obserwacji n < 30 oraz wariancja populacji σ2 jest nieznana. Kiedy wariancja populacji jest nieznana? Kiedy musimy ją wyliczyć sami lub została ona wyliczona na podstawie danych. Jeżeli w zadaniu jest napisane, że wariancja została oszacowana/wyestymowana na podstawie danych to wariancja dotyczy konkretnej próbki, a nie całej populacji. Jeżeli w zadaniu jest mowa o wariancji populacji to najczęściej jest to napisane, że dane pochodzą z rozkładu normalnego o wariancji σ2. Często gdy wariancja jest wyliczona na podstawie danych zamiast pisać σ2 używa się s2. Przedział ufności - wzory Gdy dane pochodzą z rozkładu normalnego to przedział ufności dla średniej wyliczamy, w zależności od ilość obserwacji oraz wariancja populacji, z następujących wzorów: n < 30 n≥30 σ2 nieznane T-STUDENT NORMALNY σ2 znane NORMALNY NORMALNY Nieznane σ2 i n<30: W pozostałych przypadkach, tzn. σ2 znane albo nieznane ale n≥30: Gdzie: - średnia - wariancja populacji lub wariancji wyliczona na podstawie danych - liczebność próby - dystrybuanta rozkładu normalnego dla α2 - dystrybuanta rozkładu t-studenta dla α2 i n-1 stopni swobody - poziom istotności Bezpieczeństwo Żywności, sem. 2 2/2