Statystyka Teoria i Przykłady

advertisement
Statystyka Teoria i Przykłady
STATYSTYKA
Wnioskowanie statystyczne to proces myślowy polegający na formułowaniu sądów o
całości przy dysponowaniu o niej ograniczoną liczbą informacji.
Zmienna losowa skokowa i jej rozkład
Zmienną losową X jest wielkość, która przy zajściu każdego zdarzenia losowego ω
przyjmuje konkretną wartość x ( ) , co można zapisać w sposób następujący:
 :   x ( )  R
Innymi słowy zmienna losowa X jest liczbową prezentacją wyniku doświadczenia
losowego, a więc jej wartość zależna jest od przypadku.
Jeśli doświadczenie polega na kontroli jakości 20 komputerów wyprodukowanych
przez producenta tych wyrobów, to zmienną losową X będzie liczba wadliwych
komputerów, która może przyjąć wartości: od 0 do 20.
Jeśli poszczególnym wartościom xi przyporządkujemy prawdopodobieństwa
realizacji tej zmiennej losowej oznaczonej przez
f ( xi ) , wówczas otrzymamy rozkład
prawdopodobieństwa zmiennej losowej skokowej, przy czym:
0  f ( xi )  1
dla i  1, ..., k
k
oraz  f ( xi )  1
i 1
Znać rozkład zmiennej losowej skokowej X to znać realizacje tej zmiennej, czyli xi ,
oraz odpowiadające im prawdopodobieństwa
f ( xi ) .
Rozkład zmiennej losowej skokowej można przedstawić za pomocą funkcji
prawdopodobieństwa zmiennej losowej skokowej lub tablicy.
Przykładem zmiennej losowej skokowej jest wielkość popytu na określone dobro.
Popyt zależy bowiem od wielu czynników, takich jak: ceny dobra, ceny innych dóbr
(substytucyjnych), dochód do dyspozycji gospodarstwa domowego zgłaszającego popyt
na to dobro itp. Jest zatem, przynajmniej częściowo, zależny od przypadku.
Przykład 1
Rozkład prawdopodobieństwa liczby oczek przy rzucie kostką do gry.
xi
1
2
3
4
5
6
f ( xi ) lub
1
1
1
1
1
1
pi
6
6
6
6
6
6
www.wkuwanko.pl
1
Statystyka Teoria i Przykłady
To jest rozkład jednostajny (prawdopodobieństwa są równe).
Wartość oczekiwana (nadzieja matematyczna) zmiennej losowej skokowej
k
E( X )     xi pi ,
i  1, 2, ..., k
dla
i 1
Wartość oczekiwana jest zatem średnią arytmetyczną ważoną realizacji ( xi ) zmiennej
losowej X, a wagami są odpowiadające im prawdopodobieństwa
pi .
Wariancja zmiennej losowej skokowej
k
D2 ( X )   xi   2 pi
i 1
Odchylenie standardowej zmiennej losowej skokowej
D( X ) 
k
[ xi   ]2 pi ,
i 1
i  1, 2, ..., k
dla
Przykład 2
Rozkład zmiennej losowej
Nieobecność studentów na zajęciach ze statystyki. Grupa liczyła 10 osób
Liczba
Prawdopodobieństwo
xi pi lub
pi lub f ( xi )
pi xi
1
2
0
nieobecnych
xi  E (X )
[ xi  E( X )]2
pi [ xi  E( X )]2
3
4
5
6
0,1
0,0
-2,2
4,84
0,484
1
0,2
0,2
-1,2
1,44
0,288
2
0,4
0,3
-0,2
0,04
0,016
osób xi
www.wkuwanko.pl
2
Statystyka Teoria i Przykłady
3
0,1
0,3
0,8
0,64
0,064
4
0,1
0,4
1,8
3,24
0,324
5
0,1
0,5
2,8
7,84
0,784
6
0,0
0,0
3,8
.
0,0
7
0,0
0,0
4,8
.
0,0
8
0,0
0,0
5,8
.
0,0
9
0,0
0,0
6,8
.
0,0
10
0,0
0,0
7,8
.
0,0
X
1,0
2,2
X
X
1,960
Obliczenia:
Wartość oczekiwana:
k
E ( X )     xi pi  2,2
i 1
Wariancja dla zmiennych losowych skokowych:
Odchylenie standardowe:
D( X ) 
k
D2 ( X )  [ xi   ]2 pi  1,960
i 1
k
[ xi   ]2 pi  1,96  1,4
i 1
Dystrybuanta zmiennej losowej F (x ) nazywa się prawdopodobieństwem tego, że
zmienna losowa przyjmie wartości mniejsze lub równe określonej wartości xi (czyli jest
równa sumie prawdopodobieństw realizacji wartości zmiennej, mniejszych bądź równych
xi ).
Jest to funkcja określana wzorem:
F ( x)  P( X  x), czyli P(  X  x)
Dystrybuanta zmiennej losowej skokowej (dyskretnej)
F ( x)   f ( xi )
xi x
www.wkuwanko.pl
3
Statystyka Teoria i Przykłady
W naszym przykładzie:
F ( x  2)  P( x  0)  P( x  1)  P( x  2)  0,1  0,2  0,4  0,7
Odp.: Prawdopodobieństwo, że na zajęciach nie będą obecne najwyżej 2 osoby wynosi
0,7.
Ważniejsze teoretyczne rozkłady zmiennej losowej skokowej
Zmienna losowa X ma rozkład zero-jedynkowy, jeżeli jej funkcja prawdopodobieństwa
(rozkład) jest następująca:
P( X  1)  p
P( X  0)  1  p  q
Wartość oczekiwana i wariancja w tym rozkładzie wynoszą:
E( X )  p,
D2 ( X )  p(1  p)  p  q
Przykład 3
Klientami sklepu spożywczego są kobiety i mężczyźni. Na podstawie wcześniejszych
badań stwierdzono, że prawdopodobieństwo zakupu żywności przez kobietę w tym
sklepie wynosi 0,6.
a) Co jest zmienną losową w powyższym przykładzie?
b) Wyznacz wartość oczekiwaną i wariancję badanej zmiennej losowej.
Odpowiedzi:
a) Zmienną losową jest płeć klienta. Przyjmuje ona wartość 1 w powyższym przypadku
kobiety (sukces) oraz 0, gdy do sklepu wchodzi mężczyzna. Jest to przykład
zmiennej zero-jedynkowej.
b)
E ( X )    p  0,6
oraz
www.wkuwanko.pl
4
Statystyka Teoria i Przykłady
D2 ( X )  p(1  p)  0,6  (1  0,6)  0,6  0,4  0,24
Zmienna losowa X ma rozkład dwumianowy (Bernoulliego) X : B(n, p ) , jeśli jej
funkcja prawdopodobieństwa określona jest wzorem:
P( X  k )  f (k ) 
n!
pk (1  p)nk ,
k!(n  k )!
gdzie:
n - liczba wariantów zmiennej losowej,
k - liczba realizacji zdarzenia k ,
p - prawdopodobieństwo realizacji zdarzeń k w każdej z niezależnych realizacji.
Wartość oczekiwana w tym rozkładzie wynosi:
E( X )    np
a wariancja:
D2 ( X )  np(1  p)  npq,
gdzie q  1  p
Schemat Bernoulliego:
Z takim rozkładem mamy do czynienia w przypadku wyznaczania prawdopodobieństwa
kolejnych wartości
k w n doświadczeniach. Aby rozkład dwumianowy mógł znaleźć
zastosowanie, muszą być spełnione następujące warunki:
●
przeprowadza się
n jednakowych doświadczeń,
●
dla każdego doświadczenia możliwe są dwa wyniki: jeden – zwany sukcesem, a
drugi porażką,
●
prawdopodobieństwo
sukcesu
( p)
czy
porażki
(1  p)  q
w
kolejnych
doświadczeniach jest stałe,
●
doświadczenia są od siebie niezależne.
Przykład 4
Sprzedawca pewnego dobra trwałego użytku kontaktuje się z 8 potencjalnymi klientami
dziennie. Z wcześniejszych doświadczeń wiadomo, że prawdopodobieństwo zakupu tego
dobra przez potencjalnego klienta wynosi 0,10.
www.wkuwanko.pl
5
Statystyka Teoria i Przykłady
a)
Jakie jest prawdopodobieństwo tego, że sprzedawca przeprowadzi dokładniej 2
transakcje dziennie
b)
Jakie jest prawdopodobieństwo tego, że sprzedawca przeprowadzi co najmniej 2
transakcje dziennie
c)
Jaki odsetek stanowić będą dni, w których sprzedawca nie dokona żadnej
transakcji sprzedaży?
d)
Jakiej średniej liczby sprzedanych dóbr trwałego użytku dziennie może się
spodziewać sprzedawca?
Odpowiedzi:
a)
Korzystając ze wzoru na prawdopodobieństwo w rozkładzie dwumianowym,
otrzymujemy:
P( X  2) 
8!
 (0,1) 2  (0,9)8 2
2!(8  2)!
Zamiast przeprowadzania dość skomplikowanych obliczeń można również skorzystać z
tablic rozkładu dwumianowego odczytując P ( X  k ) dla n  8, k  2 oraz p  0,1. (por.
tablica 1 na końcu książki).
P( X  2)  P( X  3)  Q(2)  Q(3)  0,18690  0,03809  0,14881  0,1488
Odp.:
Prawdopodobieństwo,
że
sprzedawca
przeprowadzi
dokładnie
2
transakcje
sprzedaży dziennie wynosi 0,1488.
b) P( X )  P( X  2)  P( X  3)  ...  P( X  8)
Zamiast przeprowadzania dość skomplikowanych obliczeń to samo można odczytać z
tablic rozkładu dwumianowego:
Q( X  k )
dla n  8, k  2, p  0,1
czyli
Q( X  2)  0,1869  0,19
Odp.: Prawdopodobieństwo, że sprzedawca przeprowadzi co najmniej 2 transakcje
sprzedaży dziennie wynosi 0,19.
www.wkuwanko.pl
6
Statystyka Teoria i Przykłady
c) P( X  0) 
8!
 (0,1)0  (0,9)80  0,43
0!(8  0)!
Uwaga: przyjmuje się, że 0! = 1.
Odp.: 43% ogółu dni roboczych stanowią takie dni, kiedy nie zostanie dokonana żadna
transakcja sprzedaży.
d) E ( X ) 
  n  p  8  0,1  0,8
Odp.: Sprzedawca może spodziewać się, że sprzeda dziennie 0,8 dóbr trwałego użytku.
Rozkład Poissona (rozkład rzadkich zdarzeń) dotyczy zmiennej losowej skokowej.
Znajduje on zastosowanie w sytuacjach, gdy próba jest liczna (n  30)
oraz gdy
prawdopodobieństwo zajścia sukcesu jest małe (co najwyżej kilkuprocentowe). Jego
przydatność jest duża, np. w ustalaniu prawdopodobieństwa wadliwości produkcji czy
awaryjności maszyn.
Prawdopodobieństwo w rozkładzie Poissona
P( X  k ) 
 k  e 
k!
gdzie:
 - średnia liczba zdarzeń,
e  2,71828
Rozkładem
Poissona
można
przybliżyć
rozkład
dwumianowy,
gdy
spełnione
są
następujące warunki:
●
duża liczba doświadczeń (n  20),
●
stały iloczyn
n  p  ,
www.wkuwanko.pl
7
Statystyka Teoria i Przykłady
●
prawdopodobieństwo p  0,2.
Przykład 5
Wadliwość produkcji pewnego przedsiębiorstwa wynosi 3%. Z gotowych wyrobów
znajdujących się w magazynie sprzedano 40 sztuk.
a) Jakiej średniej liczby braków można się spodziewać w sprzedanej partii towarów?
b) Jakie jest prawdopodobieństwo, że dokładnie 5 sztuk wadliwych znajdzie się w
sprzedanej partii towarów?
c) Jakie jest prawdopodobieństwo, że w sprzedanej partii towarów znajdą się więcej
niż 3 braki?
d) Jakie jest prawdopodobieństwo, że w tej partii towarów znajdują się mniej niż 4
braki?
Odpowiedzi:
a) E ( X ) 
  n  p  40  0,03  1,2
(1,2)5  e 1,2
 0,00625  0,006 (por. tablicę prawdopodobieństwa w
b) P ( X  5)  f (5) 
5!
rozkładzie Poissona, czyli tablicę 2 na końcu książki, dla
  1, 2; k  5 ).
Inne podejście opiera się na rachunku dystrybuant. Korzystamy z tablic dystrybuanty w
tym rozkładzie (por. tablicę 3 na końcu książki).
P( X  5)  P( X  5)  P( X  4)  F (5)  F (4)  0,998  0,992  0,0006
c) P( X  3)  P( X  4)  P( X  5)  ...  P( x  40)
Wyznaczenie tego prawdopodobieństwa jest rachunkowo dość skomplikowane. Warto
więc skorzystać z tablic dystrybuanty rozkładu Poissona.
P( X  3)  1  P( X )  1  F (3)  1  0,966  0,034
lub z tablic prawdopodobieństwa w tym rozkładzie (por. tablicę 2 na końcu książki):
P( X  3)  1  [ P( X  0)  P( X  1)  P( X  2)  P( X  3)] 
 1  (0,301  0,361  0,217  0,087)  1  0,966  0,034
www.wkuwanko.pl
8
Statystyka Teoria i Przykłady
d)
P( X  4)  P( X  3)  F (3)  0,966
P( X  4)  P( X  0)  P( X  1)  P( X  2)  P( X  3)  0,966
Rozkład normalny i inne rozkłady zmiennej losowej ciągłej
Zmienna losowa ciągła jest to taka zmienna, która przyjmuje wszystkie wartości z
pewnego określonego przedziału liczbowego.
Zmienną losową ciągłą jest czas pracy przeznaczony na wyprodukowanie sztuki wyrobu
przez pracowników pewnej fabryki, waha się on np. w przedziale od 3 do 5 godzin. Może
zatem przyjąć dowolne wartości z tego przedziału, np. 3, 1; 4,23 itp.
Rozkład normalny to najważniejszy rozkład zmiennej losowej ciągłej. Odgrywa on w
zastosowaniach statystyki ogromną rolę.
Zmienna losowa standaryzowana
Z
X 

Przykład 6
Zbadano wzrost 100 wylosowanych do próby studentów jednej ze szkół wyższych w
Polsce i stwierdzono, że średni wzrost wynosi 183 cm, a odchylenie standardowe wzrostu
wynosi 7 cm. Znajdź prawdopodobieństwo, że losowo wybrany student:
a) Będzie niższy niż 169 cm,
b) Będzie miał wzrost z przedziału pomiędzy 176 a 190 cm,
c) Będzie wyższy niż 200,5cm.
Zakładamy, że rozkład wzrostu studentów jest rozkładem normalnym z wartością
oczekiwaną E ( X )  x i odchyleniem standardowym
www.wkuwanko.pl
  S ( x) ( x ; S ( x)) .
9
Statystyka Teoria i Przykłady
Należy znaleźć prawdopodobieństwo, że:
a)
P( x  169)  F ( xi  169)
F ( xi  169)  F ( i 
169  183
)  F ( i  2)  0,027 (z tablicy na końcu książki)
7
F (   0)  0,50000
F (   1)  0,84130
F (   1)  1  0,84130  0,15870
F (   2)  0,97725
F (   2)  1  0,97725  0,02275
F (   3)  0,99865
F (   3)  1  0,99865  0,00135
Odp.: Prawdopodobieństwo, że losowo wybrany student będzie niższy niż 169 cm wynosi
0,027.
b)
P( x1  x  x2 )  F ( x2 )  F ( x1)
P(176  x  190)  F ( x2  190)  F ( x1  176)  F ( 2 
190  183
176  183
)  F ( 1 
)
7
7
 F ( 2  1)  F ( 1  1)  0,8413  0,1587  0,6826
Odp.: Prawdopodobieństwo, że losowo wybrany student będzie miał wzrost pomiędzy
176 a 190 cm wynosi 0,6826.
c)
P( x  200,5)  1  P( x  200,5)  1  F ( i 
200,5  183
)  1  F ( i  2,5) 
7
 1  0,99379  0,00621
Odp.: Prawdopodobieństwo spotkania studentów niższych od 200,5 cm wynosi 0,00621.
Przykład 7
W pewnym teście psychologicznym przeprowadzonym na 50 wybranych uczniach szkoły
podstawowej stwierdzono, że średnia liczba zapamiętanych przez dzieci elementów
www.wkuwanko.pl
10
Statystyka Teoria i Przykłady
wyniosła
25
z
odchyleniem
standardowym
równym
5.
chcemy
znaleźć
prawdopodobieństwo, że losowo wybrany uczeń zapamięta:
a) mniej niż 15 z zadanych elementów,
b) od 25 do 30 z zadanych elementów
Zakładamy jednocześnie, że rozkład liczby zapamiętanych elementów jest rozkładem
normalnym.
Odpowiedzi
a)
P ( x  15)  F ( x  15)
15  25
 2
5
F (   2)  0,00227

b)
P(25  x  30)  F ( x  30)  F ( x  25)
30  25
1
5
F (   1)  0,8413
2 
1 
25  25
0
5
F (   0)  0,5000
0,8413  0,5000  0,3413
Rozkład chi-kwadrat
Zakładając,
że
( 2 )
X1, X 2 , ..., X k są niezależnymi zmiennymi losowymi o rozkładzie
normalnym o parametrach
  0 i   1,
zmienna losowa
2
określona jest w sposób
następujący:
k
 2   X i2
i 1
www.wkuwanko.pl
11
Statystyka Teoria i Przykłady
ma rozkład
2
z
k „liczbą stopni swobody”.
Zmienna losowa o rozkładzie chi-kwadrat przyjmuje wartości dodatnie, a jej rozkład
zależy od liczby stopni swobody
k . Dla małych wartości k jest to rozkład silnie
asymetryczny, w miarę wzrostu
k asymetria jest coraz mniejsza: k wyznaczamy
najczęściej jako:
k  n  1 lub k  n  p  1
gdzie:
n - liczebność próby,
p - liczba szacowanych parametrów z próby.
Wartość oczekiwana w rozkładzie
( 2 )
E( 2 )  k
Wariancja w rozkładzie ( 
2
)
D2 (  2 )  2k
Odchylenie standardowe w rozkładzie
( 2 )
D2 (  2 )  2k
Przykład 8
Zmienna
2
ma rozkład o
k  25 stopni swobody. Wyznaczyć 12 wiedząc, że
F ( 12 )  0,95
Korzystamy z tablicy dystrybuanty rozkładu
2
(por. tablicę 6 na końcu książki)
F ( 12 )  0,95 , dla k  25 oraz P(  2  12 )  0,05
1  0,95  0,05
www.wkuwanko.pl
12
Statystyka Teoria i Przykłady
Otrzymujemy wartość dla 0,05
12  37,65
Wykres graficzny:
f ( 2 )
0,95
0
37,65
2
Rozkład t-Studenta
Wartość oczekiwana w rozkładzie t-Studenta
E(T )  0 dla k2  2
Wariancja w rozkładzie t-Studenta
D2 (T ) 
k
dla k  3
k 2
Odchylenie standardowe w rozkładzie t-Studenta
www.wkuwanko.pl
13
Statystyka Teoria i Przykłady
D(T ) 
k
dla k  3
k 2
Przykład 9
Zmienna losowa T ma rozkład t-Studenta z
k  12 stopniami swobody. Wyznaczyć t1
wiedząc, że:
P(t  T  t1)  0,9
Odpowiedź:
1  0,9  0,1
t1  1,782 (por. tablicę 5 na końcu książki dla wartości 0,1)
www.wkuwanko.pl
14
Download