Zmienna losowa dyskretna i ciągła

advertisement
Zmienna losowa dyskretna i ciągła
Niech Ω będzie zbiorem zdarzeń elementarnych pewnego
doświadczenia losowego.
Definicja
Zmienną losową nazywamy dowolną funkcję X , taką że:
X :Ω→R
tzn. przyporządkowuje ona każdemu elementowi zbioru zdarzeń
elementarnych pewną liczbę rzeczywistą.
Dystrybuanta zmiennej losowej
Rozkład prawdopodobieństwa zmiennej losowej przyjmującej
wartości rzeczywiste można jednoznacznie opisać przy pomocy
funkcji rozkładu pradwopodobieństwa. Innym jednoznacznym
sposobem opisu rozkładu prawdopodobieństwa zmiennej losowej
jest użycie pewnej funkcji zwanej dystrybuantą.
Definicja
Dystrybuantą zmiennej losowej X : Ω → R nazywamy funkcję
FX : R → [0, 1] określoną w następujący sposób:
FX (t) = P(X < t).
Wśród zmiennych losowych można wyróżnić:
• zmienną losową dyskretną (skokową)
• zmienną losową ciągłą.
Własności dystrybuanty opisuje następujące twierdzenie:
Rozkłady zmiennej losowej dyskretnej
Twierdzenie
Rozkład dwupunktowy
Dystrybuanta zmiennej losowej X ma następujące własności:
1. jest funkcją niemalejącą,
Definicja
3. limt→−∞ FX (t) = 0;
Mówimy, że zmienna losowa X ma rozkład dwupunktowy, jeżeli z
dodatnimi prawdopodobieństwami przyjmuje jedynie dwie wartości
t1 , t2 .
4. limt→∞ FX (t) = 1.
Funkcja prawdopodobieństwa jest określona następująco:
2. jest funcją lewostronnie ciągłą,
Zmienne losowe typu dyskretnego
Definicja
Zmienną losową X nazywamy skokową jeżeli istnieje skończony lub
przeliczalny zbiór jej wartości WX = {t1 , t2 , . . . , tn }, taki, że:
1. P(X = tk ) = pk , k = 1, 2 . . . n
2.
P
k=1 pk = 1, gdzie górna granica sumowania równa jest n
gdy zbiór jest skończony lub ∞ gdy zbiór jest przeliczalny.
P(X = t1 ) = p, P(X = t2 ) = 1 − p = q, 0 < p < 1.
Często dla wygody przyjmuje się, że t1 = 0, t2 = 1, wówczas
rozkład pradopodobieństwa jest postaci:
ti
pi
0
p
1
q
Ten ostatni nazywamy rozkładem zero-jedynkowym.
Rozkład Pascala (ujemny rozkład dwumianowy).
Rozkład Bernoullie’go (dwumianowy, binominalny).
Definicja
Definicja
Mówimy, że zmienna losowa Xk ma rozkład Pascala, jeśli jej
funkcja prawdopodobieństwa dana jest wzorem
Mówimy, że zmienna losowa X ma rozkład Bernoullie’go, jeżeli jej
funkcja prawdopodobieństwa dana jest wzorem
!
P[Xk = n] =
!
P[X = k] =
n k n−k
p q
, q = 1 − p k = 0, 1, . . . , n,
k
Interpretacja: Prawdopodobieństwo k sukcesów w n próbach.
n − 1 k n−k
p q
, q = 1 − p,
k −1
gdzie k jest dowolną ustaloną liczbą naturalną, natomiast
n = k, k + 1, . . . .
Interpretacja: Prawdopodobieństwo,że k-ty sukces wystąpi w
n-tej próbie.
W przypadku, gdy k = 1 otrzymujemy tzw. rozkład
geometryczny.
Rozkład Poissona
Definicja
Mówimy, że zmienna losowa X ma rozkład Poissona, jeśli jej
funkcja prawdopodobieństwa dana jest wzorem
P[Xn = k] = e −λ
λk
, k = 0, 1, . . . , λ = np.
k!
Rozkład Poissona jest przybliżeniem rozkładu Bernoulliego dla
dużych prób, tzn:
Podstawowe charakterystyki zmiennej
losowej
Wartość oczekiwana
Definicja
Jeżeli zmienna losowa X jest zmienna losową dyskretną,
przyjmującą wartości x1 , x2 , . . . , xn to jej wartością oczekiwaną
nazywamy liczbę:
EX =
!
lim
n→∞
n k n−k
λk
p q
= e −λ
k
k!
W praktyce wykorzystujemy go, gdy n ­ 50,
n
X
i=1
gdzie pi = P[X = xi ].
xi pi ,
Własności EX
Można wykazać, że dla wariancji zachodzi równość:
1. E (a) = a;
2. E (aX ) = aE (X );
D 2 X = E (X − EX )2 = EX 2 − (EX )2 ,
3. E (X + b) = E (X ) + b;
4. E (X − EX ) = 0;
5. E (X + Y ) = E (X ) + E (Y );
6. E (XY ) = E (X )E (Y ), gdy zmienne losowe X i Y są
niezależne.
Wariancja i odchylenie standardowe
Definicja
Wariancją zmiennej losowej X (definicja jest taka sama dla
zmiennych losowych ciągłych i dyskretnych) nazywamy liczbę
oznaczaną przez D 2 X będącą wartością oczekiwaną zmiennej
losowej (X − EX )2 ,tzn.
D 2 X = E (X − EX )2 .
Momenty zwykły i centralne
Zatem mamy D 2 X =
Własności wariancji
Pn
i=1 pi (xi
− EX )2 .
1. D 2 (a) = 0;
2. D 2 (aX ) = a2 D 2 (X );
3. D 2 (X + b) = D 2 (X );
4. D 2 (X ± Y ) = D 2 (X ) + D 2 (Y ), jeżeli zmienne X i Y są
niezależne.
Mediana
Definicja
Momentem zwykłym rzędu k (gdzie k = 1, 2, ...) dyskretnej
zmiennej losowej X nazywamy wartość oczekiwaną k-tej potęgi tej
zmiennej, tzn.
mk = E (X k ) =
która jest znacznie wygodniejsza do praktycznego zastosowania.
Odchyleniem standardowym zmiennej losowej X nazywamy liczbę:
√
DX = D 2 X .
n
X
xi k pi
k=1
Definicja
Medianą Me zmiennej losowej X nazywamy liczbę x spełniającą
związki
P[X ¬ x] ­ 12 , P[X ­ x] ­ 12 .
Kwantyle
Definicja
Definicja
Momentem centralnym rzędu k (k = 1, 2, . . . , n) dyskretnej
zmiennej losowej X nazywamy wartość oczekiwaną funkcji
[X − EX ]k , tzn.
µk = E (X − EX )k =
n
X
k=1
(xi − EX )k pi ;
Kwantylem rzędu p, gdzie 0 ¬ p ¬ 1 zmiennej losowej X
nazywamy liczbę x spełniającą związki:
P[X ¬ x] ­ p, [P[X ­ x] ­ 1 − p.
Jak łatwo widać wspomniana powyżej mediana jest kwantylem
rzędu 12 . W praktyce do badań używa się również:
Współczynnik asymetrii i skupienia
1 3
4, 4
• kwantyle rzędu
nazywane odpowiednio kwartylem
dolnym (pierwszym)-oznaczanym Q1 oraz kwartylem górnym
(trzecim) - oznaczanym Q3 ;
• kwantyle rzędu 15 , 25 , 35 ,
• kwantyle rzędu
• kwantyle rzędu
4
5 nazywane kwintylami;
1
2
9 9
10 , 10 ,. . . , 10 10 nazywane decylami;
1
2
99
100 , 100 ,. . . , 100 nazywane percentylami.
Moda (dominanta, wartość modalna)
Definicja
Dominantą zmiennej losowej X mającej rozkład dyskretny
nazywamy wartość x, największym prawdopodobieństwie
wystąpienia, lub wartość najczęściej występująca w próbie.
Definicja
Współczynnik skupienia (koncentracji) (kurtoza) K - jest miarą
skupienia poszczególnych obserwacji wokół średniej. Im wyższa
wartość współczynnika tym bardziej wysmukła krzywa liczebności,
większa koncentracja wartości cech wokół średniej.
Kurtozę wyznaczamy korzystając ze wzoru:
K=
µ4
.
(DX )4
Definicja
Współczynnikiem asymetrii nazywamy iloraz trzeciego momentu
centralnego przez trzecią potęgę odchylenia standardowego:
A=
µ3
.
(DX )3
Podobnie jak trzeci moment centralny, współczynnik asymetrii
przyjmuje wartość zero dla rozkładu symetrycznego, wartości
ujemne dla rozkładów o lewostronnej asymetrii (wydłużone lewe
ramię rozkładu) i wartości dodatnie dla rozkładów o
prawostronnej asymetrii (wydłużone prawe ramię rozkładu).
Współczynnik asymetrii ma tę przewagę nad trzecim
momentem centralnym, że można porównywać jego
bezwzględne wartości z różnych rozkładów.
Download