Przedział ufności

advertisement
dr inż. Jacek Lewandowski
Przedział ufności - wprowadzenie
Przedział ufności na poziomie ufności 1−α dla parametru t to przedział, w którym na (1−α)⋅100% leży
wartość parametru t, tzn.
P(L < t < P) = 1 − α
gdzie L i P to wartości krytyczne (czyli krańcowe) dla przedziału ufności.
Poziom istotności α
Poziom istotności α jest to maksymalne prawdopodobieństwo, że popełnimy błąd pierwszego
rodzaju, tzn. prawdopodobieństwo odrzucenia hipotezy zerowej, mimo że była ona prawdziwa.
Mówiąc prościej jest to prawdopodobieństwo, że stwierdzimy, że nasz przedział ufności nie zawiera
szukanego parametru mimo że w go zawierał.
Co to jest poziom ufności?
Poziom ufności to procent, który mówi nam jak bardzo dokładny jest przedział ufności, czyli jak
często mamy rację. Im większy poziom ufności (bliższy 100%) tym częściej mamy rację co do
oszacowania parametru.
Poziom istotności a poziom ufności:
Relacja między tymi pojęciami jest prosta.
poziom istotności: α
poziom ufności: 1−α
Typowe poziomy ufności:
Najczęściej spotykanymi poziomami ufności są 99%, 98%, 95% oraz 90%. Im większy poziom ufności
tym szerszy przedział - skoro chcemy mieć większą pewność, że wartość parametru leży w naszym
przedziale to musimy go zwiększyć.
Po co nam przedział ufności?
Przedział ufności informuje nas na ile możemy ufać naszym wyliczeniom, np. dotyczącymi średniej.
Załóżmy, że chcemy wyliczyć średnią wagę studentów w Polsce. Jeżeli chcielibyśmy wyliczyć dokładną
wartość musielibyśmy przebadać wszystkich studentów w Polsce. Oczywiście dałoby się to zrobić ale
badania byłyby kosztowne i czasochłonne. Dlatego chcemy wybrać reprezentatywną grupę
studentów i estymować (oszacować) wartość średniej. Jednak wybierając grupę, może się zdarzyć, że
trafiliśmy lepiej lub gorzej. Z tego powodu zamiast podawać dokładną wartość możemy podać
przedział i powiedzieć, że na 99% średnia jest w tym przedziale a to już daje nam obraz wagi całej
populacji studentów
Bezpieczeństwo Żywności, sem. 2
1/2
dr inż. Jacek Lewandowski
Przedział ufności dla średniej
Przedział ufności dla średniej pozwala nam oszacować prawdopodobny przedział, w którym znajduje
się średnia danego rozkładu normalnego, przy czy wariancja rozkładu (σ2) może być znana lub nie
znana.
Warto zapamiętać jedną rzecz wyliczając przedział ufności dla średniej: w większości przypadków
wyliczając wartość dystrybuanty korzystamy z rozkładu normalnego. Jedynym wyjątkiem jest
sytuacja gdy ilość obserwacji n < 30 oraz wariancja populacji σ2 jest nieznana.
Kiedy wariancja populacji jest nieznana?
Kiedy musimy ją wyliczyć sami lub została ona wyliczona na podstawie danych. Jeżeli w zadaniu jest
napisane, że wariancja została oszacowana/wyestymowana na podstawie danych to wariancja
dotyczy konkretnej próbki, a nie całej populacji. Jeżeli w zadaniu jest mowa o wariancji populacji to
najczęściej jest to napisane, że dane pochodzą z rozkładu normalnego o wariancji σ2. Często gdy
wariancja jest wyliczona na podstawie danych zamiast pisać σ2 używa się s2.
Przedział ufności - wzory
Gdy dane pochodzą z rozkładu normalnego to przedział ufności dla średniej wyliczamy, w zależności
od ilość obserwacji oraz wariancja populacji, z następujących wzorów:
n < 30
n≥30
σ2 nieznane
T-STUDENT
NORMALNY
σ2 znane
NORMALNY
NORMALNY
Nieznane σ2 i n<30:
W pozostałych przypadkach, tzn. σ2 znane albo nieznane ale n≥30:
Gdzie:
- średnia
- wariancja populacji lub wariancji wyliczona na podstawie danych
- liczebność próby
- dystrybuanta rozkładu normalnego dla α2
- dystrybuanta rozkładu t-studenta dla α2 i n-1 stopni swobody
- poziom istotności
Bezpieczeństwo Żywności, sem. 2
2/2
Download