Zmienne losowe

advertisement
Zmienne losowe
1. Pojęcie zmiennej losowej
Podstawowymi pojęciami związanymi z zagadnieniem zmiennej losowej i zarazem
będącymi jego podstawą są podstawowe pojęcia rachunku podobieństwa: zdarzenie
elementarne, zdarzenie losowe, prawdopodobieństwo, zbiór zdarzeń elementarnych.
Najprostszy wynik doświadczenia losowego, jaki może zajść przy danym doświadczeniu
losowym nazywamy zdarzeniem elementarnym, natomiast ich zbiór zbiorem zdarzeń
elementarnych.
Zmienną losową X jest funkcja, która przy zajściu każdego zdarzenia losowego ω przyjmuje
konkretną wartość x(ω), co można zapisać formalnie w sposób następujący:
X: ω → x(ω) ε R
Tzn. zmienna losowa X jest liczbową prezentacją wyniku doświadczenia losowego. A więc
jej wartość zależna jest od przypadku.
Np. jeśli doświadczenie polega na kontroli jakości 20 komputerów wyprodukowanych przez
producenta tych wyrobów, to zmienną losową będzie liczba wadliwych komputerów, która
może przyjąć wartość: od 0 do 20.
2. Zmienne losowe typu skokowego
Zmienna losowa jest typu skokowego (dyskretnego), jeżeli istnieje skończony albo
przeliczalny zbiór Wx = {x1, x2, …, xn} jej wartości taki, że
P(X = xi) = pi, i  N
∑i=1 pi=1
gdzie górna granica sumowania wynosi n (zbiór skończony) lub ∞ (zbiór przeliczalny).
Wartościom zmiennej losowej odpowiadają prawdopodobieństwa (i = 1, 2, ..., n lub i =
1,2,...), które można zdefiniować w sposób następujący:
Pi = P (X = xi), przy czym: ∑pi = 1 (i = 1, 2, ..., n lub i = 1, 2, ...).
Przykładem zmiennej losowej skokowej jest wielkość popytu na określone dobro. Popyt
zależy bowiem od wielu czynników, takich jak: cena dobra, ceny innych dóbr
(substytucyjnych), dochód do dyspozycji gospodarstwa domowego zgłaszającego popyt na to
dobro itp. Jest zatem, przynajmniej częściowo, zależny od przypadku.
Innym przykładem zmiennej losowej typu skokowego jest zmienna "liczba autobusów
komunikacji miejskiej stolic Europy " - trudno przyjąć, by mogła ona przyjąć wartość 103,3.
Funkcje opisujące rozkład zmiennej losowej skokowej (dyskretnej):

Funkcję prawdopodobieństwa, przypisując każdej przyjmowanej przez zmienną
losową X wartości xi określone prawdopodobieństwo wystąpienia pi, nazywamy
funkcją rozkładu prawdopodobieństwa zmiennej losowe skokowej X:
P( X = xi ) = pi ≥0, i =1,2,…,n
∑pi = 1
gdzie:
xi – wartości, które przyjmuje zmienna X
pi - prawdopodobieństwa, z jakimi te mogą być przyjmowane
lub
xi x1 x2 … xn …
pi p1 p2 … pn …
f(xi)
xi
Rysunek 1: Graficzna prezentacja rozkładu zmiennej losowej
Przykład liczbowy:
Źródło: opracowanie własne
i
1
2
3
4
5
6
suma
xi
-7,5
-6,5
-5,5
-4,5
-3,5
-2,5
pi
0,1
0,4
0,15
0,15
0,14
0,06
1
2
0,5
0,4
0,3
0,2
0,1
0
-8
-6
-4
-2
0
Rysunek 2: Wykres funkcji rozkładu prawdopodobieństwa zmiennej losowej skokowej

Dystrybuanta zmiennej losowej X – funkcja określona na całym zbiorze liczb
rzeczywistych:
F(x) = P(X < x), x  R
Przykład:
Dystrybuanta zmiennej losowej skokowej :
0 dla x< 0,5
0,1 dla 0,5 ≤ x < 2
0,4 dla 2 ≤ x < 3,5
0,5 dla 3,5 ≤ x < 5
0,7 dla 5 ≤ x < 6,5
1 dla 6,5 ≤ x < 8
i
1
2
3
4
5
6
suma
xi
0,5
2
3,5
5
6,5
8
pi
0,1
0,1
0,3
0,1
0,2
0,2
1
F(x)
0
0,1
0,4
0,5
0,7
1
3
Rysunek 3: Wykres dystrybuanty zmiennej losowej skokowej
3. Zmienne losowe typu ciągłego
Zmienna losowa X przyjmująca wartości z pewnego przedziału (lub przedziałów), dla której
istnieje nieujemna funkcja f taka, że dystrybuantę F zmiennej losowej X można przedstawić
w postaci:
x
F(X ) 
 f (t )dt
dla x  R

nazywamy zmienna losową ciągła, a funkcje f jej gęstością.
Własności funkcji gęstości:
o Jeżeli x jest punktem ciągłości f, to F'(x) = f(x)

o
 f ( x)dx  1

b
o
P(a < X < b ) =
 f ( x)dx
a
o
P(a < X < b)  F (b)  F (a)
Przykład:
Na pewnym przystanku co 10 minut podjeżdża autobus. Zmienną losową ciągłą jest czas
oczekiwania na autobus. Waha się on w przedziale <0,10>, zmienna losowa może wiec
przyjąć każdą wartość z tego przedziału.
Prawdopodobieństwo w przedziale <0,10>, jest funkcja stałą, ponieważ wszystkie wartości
zmiennej losowej są tak samo prawdopodobne.
4
Możemy zatem zapisać:
0 dla x< 0
f(x)=
a dla 0≤ x ≤ 10
0 dla x> 10
Wyznaczamy wartość stałej:

 f ( x)dx  P( < X  )  1


0
10


0
8
f ( x)dx   0dx   adx   0dx  0  ax (od 0 do 10) +0 = 10a
10a =1
1
a=
10
0 dla x < 0
f(x) =
1
dla 0 ≤ x ≤ 10
10
0 dla x > 10
Rysunek 4: Wykres funkcji gęstości
5
Rozkład zmiennej losowej możemy również zapisać w postaci dystrybuanty:
0 dla x < 0
1
dla 0 ≤ x ≤ 8
10
f(x) =
0 dla x > 8
Korzystając ze wzoru:
x
f(x) =
 f (t )dt

Otrzymujemy:
x
f(x) =
 0dt  0
dla x < 0

0
f(x) =

0
f(x) =
x
1
1
1
x
dt  0  t (od 0 do x) =
10
10
10
0
 0dt  
10

x
1
dt   0dt  0  1  0  1
10
0
10
 0dt  
dla x ≥ 10
0 dla x < 0
f(x) =
dla 0 ≤ x ≤ 1=
1
x dla 0 ≤ x ≤ 10
10
1 dla x > 10
6
Rysunek 5: Wykres dystrybuanty
4. Charakterystyki liczbowe zmiennych losowych typu skokowego
 Moment zwykły: ar =
x
r
i
 pi
i
i
xi
pi
xi*pi
xi2*pi
1
2
3
4
5
6
Suma
0,5
2
3,5
5
6,5
8
0,1
0,1
0,3
0,1
0,2
0,2
0,05
0,2
1,05
0,5
1,3
1,6
4,7
0,025
0,4
3,675
2,5
8,45
12,8
27,85
7
xi3*pi
0,0125
0,8
12,8625
12,5
54,925
102,4
183,5
xi4*pi
0,00625
1,6
45,01875
62,5
357,0125
819,2
1285,338
 moment centralny:  r   ( xi  a1 ) r  pi
i
i
xi
pi
1
2
3
4
5
6
0,5
2
3,5
5
6,5
8
Suma
0,1
0,1
0,3
0,1
0,2
0,2
(xi-a1)*pi (xi-a1)2*pi (xi-a1)3*pi
-0,375
-0,225
-0,225
0,075
0,45
0,75
0,45
Odchylenie standardowe:
Współczynnik skośności:
Współczynnik spłaszczenia:
1,40625
0,50625
0,16875
0,05625
1,0125
2,8125
5,9625
-5,273438
-1,139063
-0,126563
0,0421875
2,278125
10,546875
6,328125
(xi-a1)4*pi
19,7753906
2,56289063
0,09492188
0,03164063
5,12578125
39,5507813
67,1414063
2,441823
0,07244
0,314762
Wariancja: 5,9
Średni kwadrat odchyleń wartości od ich wartości średniej wynosi 5,9
Odchylenie standardowe: 2,44
Odchylenie standardowe wartości podanych w szeregu odbiegają średnio (w dół lub górę) od
średniej o 2,44
Współczynnik skośności: 0,072
Istnieją w szeregu , aczkolwiek nieliczne wartości, które silnie odbiegają od pozostałych ku
mniejszym wielkościom, pociągając za sobą średnią. W takim przypadku więcej jest wartości
większych względem średniej. Średnia jest sztucznie zaniżona.
Współczynnik spłaszczenia: 0,31
5. Rozkład normalny zmiennej losowej ciągłej
Rozkład normalny to najważniejszy rozkład zmiennej losowej ciągłej.
Mówimy, że zmienna losowa X ma rozkład normalny z parametrami µ i σ > 0, co zapisujemy
X: N (µ, σ) lub X~ N(µ, σ), jeśli jej funkcja gęstości jest określona wzorem
f ( x) 
2
2
1
e ( x ) / 2 ,
 2
dla x  (;)
8
Wykresem jest krzywa Gaussa-Laplace’a.
Wykres gęstości dla µ=0, σ=1
1
 x2
exp(
)
2
2
Dana funkcja w całej swej dziedzinie przyjmuje wartości dodatnie,
przy x=µ osiąga maksimum.
Ramiona f(x) maja punkty przegięcia dla x= µ-σ oraz x= µ+σ
Kształt funkcji gęstości zależy od dwóch parametrów µ i σ
f ( x) 




Przykład liczbowy:
Źródło: opracowanie własne
Wartości funkcji gęstości prawdopodobieństwa rozkładu normalnego o średniej zero i
odchyleniu standardowym 1:
xi
-1,8
-1,7
-1,6
-1,5
-1,4
-1,3
-1,2
-1,1
-1
-0,9
-0,8
-0,7
-0,6
-0,5
-0,4
-0,3
-0,2
-0,1
-5,33E-14
0,1
0,2
3,00E-01
0,4
0,5
0,6
0,7
0,8
0,9
1
f(x)
0,07895
0,094049
0,110921
0,129518
0,149727
0,171369
0,194186
0,217852
0,241971
0,266085
0,289692
0,312254
0,333225
0,352065
0,36827
0,381388
0,391043
0,396953
0,398942
0,396953
0,391043
0,381388
0,36827
0,352065
0,333225
0,312254
0,289692
0,266085
0,241971
9
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
0,217852
0,194186
0,171369
0,149727
0,129518
0,110921
0,094049
0,07895
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
-2
-1,5
-1
-0,5
0
0,5
1
1,5
Rysunek 6: Wykres funkcji gęstości
Dystrybuanta zmiennej rozkładu normalnego:
1
f ( x) 
 2
z
1 x
 exp[  2 (


)2
xi
f(x)
Skumulowane
wartości
skum.* 0,1
-1,8
-1,7
-1,6
-1,5
-1,4
-1,3
-1,2
-1,1
-1
-0,9
-0,8
-0,7
-0,6
-0,5
0,07895
0,094049
0,110921
0,129518
0,149727
0,171369
0,194186
0,217852
0,241971
0,266085
0,289692
0,312254
0,333225
0,352065
0,078950158
0,172999236
0,28392007
0,413437666
0,563165132
0,734533724
0,928719779
1,146571956
1,38854268
1,65462793
1,944319483
2,256573416
2,589798019
2,941863346
0,00789502
0,01729992
0,02839201
0,04134377
0,05631651
0,07345337
0,09287198
0,1146572
0,13885427
0,16546279
0,19443195
0,22565734
0,2589798
0,29418633
10
2
-0,4
-0,3
-0,2
-0,1
-5,33E-14
0,1
0,2
3,00E-01
0,4
0,5
0,6
0,7
0,8
0,9
1
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
0,36827
0,381388
0,391043
0,396953
0,398942
0,396953
0,391043
0,381388
0,36827
0,352065
0,333225
0,312254
0,289692
0,266085
0,241971
0,217852
0,194186
0,171369
0,149727
0,129518
0,110921
0,094049
0,07895
3,310133486
3,691521302
4,082563996
4,479516543
4,878458824
5,275411371
5,666454065
6,04784188
6,416112021
6,768177348
7,10140195
7,413655884
7,703347437
7,969432686
8,211403411
8,429255588
8,623441643
8,794810235
8,944537701
9,074055296
9,184976131
9,279025208
9,357975367
0,33101335
0,36915213
0,4082564
0,44795165
0,48784588
0,52754114
0,56664541
0,60478419
0,6416112
0,67681773
0,7101402
0,74136559
0,77033474
0,79694327
0,82114034
0,84292556
0,86234416
0,87948102
0,89445377
0,90740553
0,91849761
0,92790252
0,93579754
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-2
-1,5
-1
-0,5
0
0,5
1
Rysunek 7: Wykres dystrybuanty
11
1,5
2
6. Rozkład dwupunktowy
Z rozkładem dwupunktowym mamy do czynienia wówczas, gdy w wyniku doświadczenia
możemy uzyskać tylko jedną z dwóch wartości zmiennej losowej x1 lub x2 z
prawdopodobieństwami odpowiednio p oraz 1-p (q). w szczególnym przypadku, gdy x1=0
oraz x2=1 rozkład ten nazywany jest rozkładem zero-jedynkowym.
Funkcja prawdopodobieństwa w tym rozkładzie ma postać:
xi 0
1
pi 1-p p
Dystrybuanta rozkładu zero-jedynkowego ma postać:
0 dla x < 0
F(x) =
1-p dla 0 ≤ x < 1
1 dla x ≥ 1
Wartość oczekiwana zmiennej w rozkładzie zero-jedynkowym wynosi:
E(X)= 0* (1-p)+1*p=p
Natomiast wariancja:
D2(X)= (0-p)2 * (1-p)+ (1-p)2*p= p(1-p)
Przykład:
Źródło: opracowanie własne
Prawdopodobieństwo, że losowo wybrany student odda projekt wynosi 75%.
1 jeżeli student odda projekt
X=
0 jeżeli student nie odda projektu
Otrzymujemy:
P = 0,75
Q = 0,25
Rozkład prawdopodobieństwa zmiennej losowej X:
P(X=1) = 0,75
P(X=0) = 0,35
wartość zmiennej losowej prawdopodobieństwo
0
0,25
1
0,75
12
Wartość oczekiwana: 0,75
Wariacja: 0,1875
Odchylenie standardowe: 0,433
Dystrybuanta:
0 dla x < 0
F(x) =
0,25 dla 0 ≤ x < 1
1 dla x ≥ 1
7. Rozkład dwumianowy (Bernoulliego)
Rozkład dwumianowy występuje wówczas, gdy przeprowadza się n jednakowych
doświadczeń, z których każde może zakończyć się jednym z dwóch wyników: „sukcesem” z
prawdopodobieństwem p lub „porażką” z prawdopodobieństwem 1-p. zmienną losową X w
tym eksperymencie jest liczba sukcesów w n próbach. Może ona przyjmować wartości z
przedziału  0, n .
Rozkład prawdopodobieństwa w rozkładzie Bernoulliego jest określony wzorem:
P( X  k ) 
n!
p k (1  p) nk
k!(n  k )!
dla k= 0,1,2…, n
Przyjmę za p=0,1 prawdopodobieństow pojedyńczego sukcesu zdarzenia elementarnego a
n=10 liczbę prób w doświadczeniach Bernouliego:
p
0,1
n
10
q
0,9
Obliczę prawdopodobieństwa k- liczby sukcesów w 10 ciu doświadczeniach Bernouliego
(np rzut dziesięciościanem o ponumerowanych ścianach żądając, aby k razy pojawiła się
liczba 3 ).
k
1
2
3
4
5
6
7
8
9
10
n po k
10
45
120
210
252
210
120
45
10
1
p^k
0,1
0,01
0,001
0,0001
0,00001
0,000001
0,0000001
0,00000001
0,000000001
1E-10
q^n-k
0,387420489
0,43046721
0,4782969
0,531441
0,59049
0,6561
0,729
0,81
0,9
1
13
iloczyn
0,38742049
0,19371024
0,05739563
0,01116026
0,00148803
0,00013778
8,748E-06
3,645E-07
9E-09
1E-10
8. Rozkład jednostajny
Jest to najprostszy z rozkładów zmiennej losowej ciągłej. Mamy z nim do czynienia wtedy,
gdy prawdopodobieństwo zajścia zdarzenia jest stałe w pewnym przedziale  a, b .
Funkcja gęstości tego rozkładu jest dana wzorem:
f(x)=
0 dla x < a
1
dla a≤ x ≤ b
ba
0 dla x > b
Przyjmę następujące parametry rozkładu jednostajnego:
a
b
5
8
x
f(x)
3
0
3,5
0
4
0
4,5
0
5
5,5
6
6,5
7
7,5
8
8,5
9
9,5
10
10,5
11
11,5
12
12,5
0,333
0,333
0,333
0,333
0,333
0,333
0,333
0
0
0
0
0
0
0
0
0
14
Dystrybuanta:
0 dla x ≤ a
f(x) =
xa
dla x  (a, b)
ba
1 dla x ≥ b
15
x
f(x)
3
0
3,5
0
4
0
4,5
0
5
5,5
6
6,5
7
7,5
8
8,5
9
9,5
10
10,5
11
11,5
12
12,5
0,333
0,333
0,333
0,333
0,333
0,333
0,333
0
0
0
0
0
0
0
0
0
F(x)
0
0
0
0
0
0,166666667
0,333333333
0,5
0,666666667
0,833333333
1
1
1
1
1
1
1
1
1
1
Rysunek 8: Wykres dystrybuanty
16
Download