zmienna losowa - E-SGH

advertisement
JEDNOWYMIAROWA ZMIENNA LOSOWA
Niech E będzie zbiorem zdarzeń elementarnych danego doświadczenia. Funkcję X(e)
przyporządkowującą każdemu zdarzeniu elementarnemu e∈E jedną i tylko jedną liczbę
X(e)=x nazywamy ZMIENNĄ LOSOWĄ.
Przykład:
Rozpatrujemy doświadczenie polegające na rzucie symetryczną monetą. Wynikiem tego
doświadczenia mogą być zdarzenia "pojawienie się orła" albo "pojawienie się reszki"
tworzące zbiór zdarzeń elementarnych. Na zbiorze zdarzeń elementarnych określamy
zmienną losową X w sposób następujący:
X (orzeł) = 1;
X (reszka) = 0
Zmienna losowa X przyjmuje wartość ze zbioru {0,1}. Zdarzenia "pojawienie się orła" i
"pojawienie się reszki" realizują się z prawdopodobieństwami równymi 1/2, zatem:
P(X=1) = P{orzeł} = 1/2,
P(X=0) = P{reszka} = 1/2.
Typy zmiennej losowej:
− Skokowa (przyjmuje skończoną lub nieskończoną, ale przeliczalną liczbę wartości),
− Ciągła (jej wartości należą do przedziału ze zbioru liczb rzeczywistych).
ZMIENNA LOSOWA SKOKOWA
przyjmuje wartość x1, x2,... z prawdopodobieństwami, odpowiednio p1, p2,... , takimi że:
n
∑p
= 1, gdy X przyjmuje skończoną liczbę n wielkosci, lub
(1)
∑p
= 1, gdy X przyjmuje nieskończoną liczbę wartosci
(2)
i =1
∞
i =1
i
i
Zbiór prawdopodobieństw postaci pi spełniających równość (1) lub (2) określamy mianem
funkcji prawdopodobieństwa zmiennej losowej X typu skokowego.
Wykres funkcji prawdopodobieństwa x
pi
p3
p2
.
.
p1
0
.
x1
x2
x3
xi
Dystrybuanta zmiennej losowej skokowej przyjmuje postać:
F ( x) = ∑ pi (−∞ < x < ∞)
xi ≤ x
Informacje na temat własności dystrybuanty oraz wykres dystrybuanty znajdują się w
materiałach z poprzednich zajęć.
ZMIENNA LOSOWA CIĄGŁA
Przyjmuje nieprzeliczalną liczbę wartości. Zatem jej rozkładu nie można opisać za pomocą
funkcji prawdopodobieństwa jak w przypadku zmiennej losowej skokowej. Funkcją, która
opisuje rozkład zmiennej losowej ciągłej, jest funkcja gęstości. Jest to funkcja określona na
zbiorze liczb rzeczywistych o następujących własnościach:
•
f ( x ) ≥ 0,
b
•
∫ f ( x ) dx = P ( a < X ≤ b )
dla a < b
a
•
+∞
∫ f (x )dx = P(− ∞ < X ≤ +∞ ) = 1
−∞
Należy zauważyć, że prawdopobieństwo postaci P(X=a) jest równe zeru:
a
P( X = a ) = ∫ f ( x ) dx = 0
a
Przykładowy wykres funkcji gęstości prawdopodobieństwa i graficzna interpretacja
P(a < X ≤ b )
f(x)
b
P(a < X ≤ b ) = ∫ f ( x )dx
a
a
b
Dystrybuantę zmiennej losowej ciągłej określa się następująco:
F (x ) =
x
∫ f (t )d (t ),
−∞
gdzie f(t) jest funkcją gęstości zmiennej losowej X
x
PARAMETRY ROZKŁADU ZMIENNEJ LOSOWEJ:
Wartość oczekiwana:
dla zmiennej losowej skokowej
 ∑ xi pi
 i
E(X ) =  ∞
dla zmiennej losowej ciąglej
 ∫ xf ( x )dx
− ∞
Własności wartości oczekiwanej:
−
E (a) = a , gdzie a – stała,
−
E[(aX )k ] = a k E ( X k )
−
E (aX + b) = aE ( X ) + b
Wariancja:
2

 xi − E ( X )  pi dla zmiennej losowej skokowej
∑
 i
2
D 2 ( X ) = E  X − E ( X )  =  ∞
2
  x − E ( X )  f ( x ) dx dla zmiennej losowej ciąglej
∫
 −∞
Własności wariancji:
−
D 2 ( a) = 0
−
D 2 ( X + a) = D 2 ( X )
−
D2 (aX ) = a 2 D2 ( X )
−
D2 (aX + b) = a 2 D2 ( X )
Moment zwykły rzędu k:
( )
mk = E X k
∑ xik pi
dla zmiennej losowej skokowej
 i
= ∞
k
 ∫ x f ( x )dx dla zmiennej losowej ciąglej
 − ∞
Moment centralny rzędu k:
uk = E [ X − E ( X )]k
∑ [xi − E ( x )]kpi
dla zmiennej losowej skokowej
 i
=∞
k
 ∫ [x − E ( x )] f ( x )dx dla zmiennej losowej ciąglej
 − ∞
ROZKŁADY ZMIENNEJ LOSOWEJ
Rozkład zerojedynkowy
Zmienna losowa X ma rozkład zero-jedynkowy, jeśli przyjmuje wartość
prawdopodobieństwem 0<p<1 oraz wartość 0 z prawdopodobieństwem q=1-p.
1
z
Funkcja prawdopodobieństwa rozkładu zero-jedynkowego:
xi
0
1
pi
1-p
p
Dystrybuanta zmiennej losowej zero-jedynkowej:
dla
x<0
 0,

F ( x ) = 1 − p, dla 0 ≤ x < 1
 1,
dla
x ≥1

Wartość oczekiwana i wariancja zmiennej losowej zero-jedynkowej:
E ( X ) = 0 ⋅ (1 − p ) + 1 ⋅ p = p,
D 2 ( X ) = (0 − p )2 (1 − p ) + (1 − p )2 p = p(1 − p ).
Rozkład dwumianowy
Zmienna losowa X ma rozkład dwumianowy, jeśli przyjmuje wartości k=0,1,2,...,n z
prawdopodobieństwami określonymi wzorem:
n
P( X = k ) =   p k (1 − p )n − k
k 
Liczbę doświadczeń n oraz prawdopodobieństwo sukcesu p nazywamy parametrami tego
rozkładu.
Dystrybuanta zmiennej losowej X o rozkładzie dwumianowym:
F ( x ) = P( X ≤ x ) =
n
∑  k  p k (1 − p )n − k
k ≤ x

Wartość oczekiwana i wariancja zmiennej losowej X o rozkładzie dwumianowym:
 n
 n
E ( X ) = E  ∑ X i  = ∑ E ( X i ) = np,
 i =1  i =1
 n
 n
D 2 ( X ) = D 2  ∑ X i  = ∑ D 2 ( X i ) = np(1 − p ).
 i =1  i =1
Schemat Bernoulliego:
− wykonujemy
doświadczenie,
którego
rezultatem
może
być
sukces
z
prawdopodobieństwem p lub porażka z prawdopodobieństwem q=1-p,
− doświadczenie powtarzamy n-krotnie w sposób niezależny co oznacza, że
prawdopodobieństwo sukcesu pozostaje w pojedynczych próbach stałe i równe p,
− liczba sukcesów jaką zaobserwujemy w wyniku n-krotnego powtórzenia doświadczenia,
może być równa k=0,1,2,...,n.
Rozkład normalny
Wiele zjawisk świata fizycznego cechuje rozkład normalny, np. waga i wzrost ludzi. Dlatego
rozkład ten m bardzo duże znaczenie w statystyce. Do rozkładu tego prowadzi taki proces
kształtowania zjawiska, w ramach którego na dane zjawisko oddziałuje duża liczba
niezależnych czynników, których wpływ, traktowany odrębnie, jest mało znaczący.
Zmienna losowa X ma rozkład normalny o parametrach m oraz σ, co w skrócie zapisuje się
jako X : N (m, σ ) , jeżeli jej funkcja gęstości wyraża się wzorem:
−
1
f (x) =
e
σ 2π
( x − m )2
2σ 2
,
− ∞ < x < +∞
, przy czym σ > 0 .
Funkcja gęstości rozkładu normalnego o parametrach m i σ:
Własności krzywej gęstości rozkładu normalnego:
a) jest symetryczna względem prostej x = m ,
b) osiąga maksimum równe 1 dla x = m ,
σ 2π
c) jej ramiona mają punkty przegięcia dla x = m − σ oraz x = m + σ .
Dystrybuantą zmiennej losowej X mającej rozkład normalny jest funkcja F(x) określona na
zbiorze liczb rzeczywistych o postaci: F ( x ) = 1
σ 2π
Ze względu na symetryczność rozkładu F(-x)=1-F(x)
x − (t − m )
2
e 2σ
∫
−∞
2
dt
Rozkład normalny ze średnią m=0 oraz odchyleniem standardowym σ=1 nazywamy
standardowym rozkładem normalnym i oznaczamy N(0,1). Wartości funkcji gęstości i
dystrybuanty rozkładu normalnego wystandaryzowanego są tablicowane.
Standaryzacja zmiennej losowej X o rozkładzie normalnym z parametrami m i σ:
X −m
U=
, gdzie U ~ N (0,1) .
σ
Zatem:
b−m
 a− X −m b−m
a−m
b−m
 a−m
P ( a < X ≤ b) = P 
<
≤
<U ≤
 = P
= F
−F

σ
σ 
σ 
 σ
 σ
 σ 
 σ 
Reguła trzech sigm
P (| X − m |≤ σ ) = 0, 68269
P (| X − m |≤ 2σ ) = 0, 9545
P (| X − m |≤ 3σ ) = 0, 9973
Addytywność rozkładu normalnego
Jeśli X 1 ~ N ( m1 , σ 1 ) a X 2 ~ N ( m2 , σ 2 ) oraz X1 i X2 są niezależne to
X 1 + X 2 ~ N ( m1 + m2 , σ 12 + σ 22 )
Zaletą rozkładu normalnego jest to, że wiele rozkładów jest zbieżnych do rozkładu
normalnego przy wzroście liczebności zbiorowości (zob. tw. graniczne).
INNE ROZKŁADY:
Rozkład t-Studenta
o liczbie stopni swobody υ to rozkład zmiennej losowej określony funkcją gęstości o postaci:
υ + 1
 υ +1 
Γ
 
2  −  2 
t
2  
f (t ) = 
1+ 
,
 υ   υ 
nπ Γ 
2
(− ∞ < t < +∞ )
gdzie υ=n-1 zaś Γ(x) jest funkcją gamma.
Parametry:
E ( t ) = 0,
D (t ) =
υ
υ −2
n −1
n−3
=
Przy n→ ∞ rozkład t-Studenta zbiega do rozkładu normalnego N(0,1).
Rozkład χ2 (Chi- kwadrat)
o liczbie stopni swobody υ to rozkład zmiennej losowej określony funkcją gęstości o postaci:
( )
f χ2
υ

1
   2
2
υ −χ
 2 
2 2
2 dla
 υ  χ e
=  Γ 
 2


dla
0
( )
χ2 > 0
χ2 ≤ 0
gdzie υ=n-1.
Rozkład χ2 (chi- kwadrat) o liczbie stopni swobody υ ma statystyka:
 X −m
χ = ∑ i

σ 
i =1 
2
n
2
gdzie:
Xi – niezależne zmienne losowe mające jednakowy rozkład N(m,σ), υ=n.
Parametry:
( )
D (χ ) = 2υ
E χ 2 = υ;
2
2
Przy υ → ∞ rozkład statystyki
2 χ 2 zdąża do rozkładu N
(
)
2υ − 1;1 .
Rozkład F-Snedecora
o liczbie stopni swobody licznika υ1 i liczbie stopni swobody mianownika
określony funkcją gęstości o postaci:
 υ1 υ1  υ + υ 
1
−1
υ12 υ 2 Γ 1 2 
2
F
2

⋅

1

υ
υ




f ( F ) =  Γ  1  Γ 2 
(υ1F + υ 2 )2 (υ1 +υ 2 )
2  2

0 dla F ≤ 0


Parametry:
E(F ) =
υ2 − 2
D (F ) =
2
υ2
2υ22 (υ1 + υ2 − 2 )
υ1 (υ2 − 2 ) (υ2 − 4 )
2
dla
F >0
υ2
to rozkład
Download