Zmienna losowa skokowa

advertisement
Zmienna losowa jest to taka zmienna, która przybiera różne wartości liczbowe z określonymi
prawdopodobieństwami (inaczej jest to funkcja rzeczywista, jednoznacznie określona na
zbiorze zdarzeń elementarnych).
Zmienne losowe oznaczamy zazwyczaj dużymi literami np. X, Y, Z. Wartości przyjmowane
przez zmienne (zwane realizacjami zmiennych) oznaczane są odpowiednimi małymi literami
xi, yi, zi.
Zmienna losowa jest odpowiednikiem pojęcia cechy statystycznej, ale zmienna jest
zdefiniowana nie tylko przez zbiór możliwych realizacji, ale również przez odpowiednią
funkcję rozkładu prawdopodobieństwa.
Wyróżniamy zmienną losową skokową (dyskretną) i ciągłą. Zmienną losową nazywamy
skokową, jeżeli zbiór wartości, które może przyjmować zmienna jest skończony lub
przeliczalny. Zmienną losową nazywamy ciągłą, jeżeli zbiór wartości, które może
przyjmować zmienna jest nieprzeliczalny.
Zmienna losowa skokowa
Najważniejsze pojęcia to funkcja rozkładu prawdopodobieństwa i dystrybuanta.
Funkcja rozkładu prawdopodobieństwa (rozkład prawdopodobieństwa) jest to funkcja
przyporządkowująca dopuszczalnym wartościom xi prawdopodobieństwa pi. tzn:
P (X = xi) = pi
Dystrybuanta
F (xi) = P (X  xi)
Jest to funkcja określająca prawdopodobieństwo tego, że wartość zmiennej X będzie mniejsza
lub równa xi.
Podobnie jak dla cechy tak samo dla zmiennej losowej można obliczyć parametry opisujące
rozkład np.: wartość oczekiwaną, wariancję, miary asymetrii i koncentracji.
Wartość oczekiwana: E ( X ) 
Wariancja:
n
xi  pi

i 1
D2 ( X )  E[ X  E ( X )]2 
n
[ x  E( X )]
2
i
 pi
i 1
Najczęściej stosowane w statystyce rozkłady zmiennej losowej skokowej to: rozkład zerojedynkowy, dwumianowy i Poissona.
Rozkład zero-jedynkowy - jest rezultatem doświadczenia, w wyniku którego określone
zdarzenie A wystąpi lub nie wystąpi. Zdarzeniom elementarnym realizującym zdarzenie A
przyporządkowana jest liczba 1, a zdarzeniom elementarnym nie realizującym zdarzenie A
liczba 0.
Jeżeli P(A) = p to P( A ) = 1-p = q
P(X = 1) = p P(X = 0) = q
gdzie: A oznacza zdarzenie przeciwne
Rozkład dwumianowy (Bernouliego)
Jeżeli chcemy określić prawdopodobieństwo wystąpienia k razy określonego zdarzenia w n
niezależnych doświadczeniach, przy danym prawdopodobieństwie p wystąpienia tegoż
zdarzenia w pojedynczym doświadczeniu korzystamy z rozkładu dwumianowego:
n
P (X  k)     p k  q n - k ,
k
gdzie: n - ilość niezależnych doświadczeń ogółem,
p - prawdopodobieństwo wystąpienia zdarzenia w pojedynczym doświadczeniu,
q - prawdopodobieństwo niewystąpienia zdarzenia w pojedynczym doświadczeniu,
k - ilość doświadczeń w których ma wystąpić dane zdarzenie.
Jeżeli: p = q to rozkład jest symetryczny
p < q to rozkład jest prawostronnie asymetryczny
p > q to rozkład jest lewostronnie asymetryczny
Dla rozkładu dwumianowego zachodzi:
E(X) = n  p
D2 ( X )  n  p  q
Rozkład Poissona
Rozkład ten jest szczególnym przypadkiem rozkładu dwumianowego, gdy iloczyn n i p jest
liczbą stałą: n  p  
Zmienna losowa X ma rozkład Poissona, jeżeli jej rozkład prawdopodobieństwa jest
k  
e
określony wzorem: P( X  k ) 
gdzie e  2,7182
k!
Zakłada się, że dla n > 20 i p < 0,2 rozkład dwumianowy można zastąpić rozkładem Poissona.
Rozkład Poissona jest rozkładem prawostronnie asymetrycznym.
Dla rozkładu Poissona zachodzi:
E( X )  D2 ( X )  
Zmienna losowa ciągła
Dla zmiennej losowej ciągłej niemożliwe jest przypisanie konkretnym wartościom
określonych prawdopodobieństw, ponieważ:
P(X = a) = 0 (wynika to z matematycznej definicji zmiennej losowej ciągłej)
Nie oznacza to, że zdarzenie jest niemożliwe, ale jest mało prawdopodobne. Możliwe jest
jednak przyporządkowanie prawdopodobieństw przedziałom liczbowym.
b
P ( a  X  b) 
 f ( x)dx .
a
Podstawowym rozkładem zmiennej losowej ciągłej jest rozkład normalny. Zmienna losowa X
ma rozkład normalny, jeśli jej funkcja gęstości prawdopodobieństwa wyraża się wzorem:
[ X  m ]2

2
1
gdzie: m = E(X),  ( X )  D( X )
f ( x) 
 e 2 ( X )
 ( X )  2
Jeżeli zmienna losowa ma rozkład normalny, to zapisujemy to w skrócie w następujący
sposób: X ~ N [m, ( X )] . Rozkład normalny charakteryzują zatem dwa parametry: wartość
oczekiwana i odchylenie standardowe.
Z rozkładem normalnym mamy do czynienia gdy na dane zjawisko oddziałuje duża
liczba niezależnych czynników, których wpływ traktowany odrębnie jest mało znaczący. Na
przykład rozkład normalny lub bardzo zbliżony do normalnego mają takie zmienne jak:
1. waga i wzrost osobników jednorodnych populacji ludzkich lub zwierzęcych,
2. losowe błędy pomiarów,
3. dochody jednorodnych grup pracowników (np. rzemieślników, rolników, itd.),
4. wykonanie norm pracy przez robotników w jednorodnych warunkach pracy przez
jednorodną grupę wykonawców.
Download