Zmienna losowa dyskretna i ciągła Niech Ω będzie zbiorem zdarzeń elementarnych pewnego doświadczenia losowego. Definicja Zmienną losową nazywamy dowolną funkcję X , taką że: X :Ω→R tzn. przyporządkowuje ona każdemu elementowi zbioru zdarzeń elementarnych pewną liczbę rzeczywistą. Dystrybuanta zmiennej losowej Rozkład prawdopodobieństwa zmiennej losowej przyjmującej wartości rzeczywiste można jednoznacznie opisać przy pomocy funkcji rozkładu pradwopodobieństwa. Innym jednoznacznym sposobem opisu rozkładu prawdopodobieństwa zmiennej losowej jest użycie pewnej funkcji zwanej dystrybuantą. Definicja Dystrybuantą zmiennej losowej X : Ω → R nazywamy funkcję FX : R → [0, 1] określoną w następujący sposób: FX (t) = P(X < t). Wśród zmiennych losowych można wyróżnić: • zmienną losową dyskretną (skokową) • zmienną losową ciągłą. Własności dystrybuanty opisuje następujące twierdzenie: Rozkłady zmiennej losowej dyskretnej Twierdzenie Rozkład dwupunktowy Dystrybuanta zmiennej losowej X ma następujące własności: 1. jest funkcją niemalejącą, Definicja 3. limt→−∞ FX (t) = 0; Mówimy, że zmienna losowa X ma rozkład dwupunktowy, jeżeli z dodatnimi prawdopodobieństwami przyjmuje jedynie dwie wartości t1 , t2 . 4. limt→∞ FX (t) = 1. Funkcja prawdopodobieństwa jest określona następująco: 2. jest funcją lewostronnie ciągłą, Zmienne losowe typu dyskretnego Definicja Zmienną losową X nazywamy skokową jeżeli istnieje skończony lub przeliczalny zbiór jej wartości WX = {t1 , t2 , . . . , tn }, taki, że: 1. P(X = tk ) = pk , k = 1, 2 . . . n 2. P k=1 pk = 1, gdzie górna granica sumowania równa jest n gdy zbiór jest skończony lub ∞ gdy zbiór jest przeliczalny. P(X = t1 ) = p, P(X = t2 ) = 1 − p = q, 0 < p < 1. Często dla wygody przyjmuje się, że t1 = 0, t2 = 1, wówczas rozkład pradopodobieństwa jest postaci: ti pi 0 p 1 q Ten ostatni nazywamy rozkładem zero-jedynkowym. Rozkład Pascala (ujemny rozkład dwumianowy). Rozkład Bernoullie’go (dwumianowy, binominalny). Definicja Definicja Mówimy, że zmienna losowa Xk ma rozkład Pascala, jeśli jej funkcja prawdopodobieństwa dana jest wzorem Mówimy, że zmienna losowa X ma rozkład Bernoullie’go, jeżeli jej funkcja prawdopodobieństwa dana jest wzorem ! P[Xk = n] = ! P[X = k] = n k n−k p q , q = 1 − p k = 0, 1, . . . , n, k Interpretacja: Prawdopodobieństwo k sukcesów w n próbach. n − 1 k n−k p q , q = 1 − p, k −1 gdzie k jest dowolną ustaloną liczbą naturalną, natomiast n = k, k + 1, . . . . Interpretacja: Prawdopodobieństwo,że k-ty sukces wystąpi w n-tej próbie. W przypadku, gdy k = 1 otrzymujemy tzw. rozkład geometryczny. Rozkład Poissona Definicja Mówimy, że zmienna losowa X ma rozkład Poissona, jeśli jej funkcja prawdopodobieństwa dana jest wzorem P[Xn = k] = e −λ λk , k = 0, 1, . . . , λ = np. k! Rozkład Poissona jest przybliżeniem rozkładu Bernoulliego dla dużych prób, tzn: Podstawowe charakterystyki zmiennej losowej Wartość oczekiwana Definicja Jeżeli zmienna losowa X jest zmienna losową dyskretną, przyjmującą wartości x1 , x2 , . . . , xn to jej wartością oczekiwaną nazywamy liczbę: EX = ! lim n→∞ n k n−k λk p q = e −λ k k! W praktyce wykorzystujemy go, gdy n ­ 50, n X i=1 gdzie pi = P[X = xi ]. xi pi , Własności EX Można wykazać, że dla wariancji zachodzi równość: 1. E (a) = a; 2. E (aX ) = aE (X ); D 2 X = E (X − EX )2 = EX 2 − (EX )2 , 3. E (X + b) = E (X ) + b; 4. E (X − EX ) = 0; 5. E (X + Y ) = E (X ) + E (Y ); 6. E (XY ) = E (X )E (Y ), gdy zmienne losowe X i Y są niezależne. Wariancja i odchylenie standardowe Definicja Wariancją zmiennej losowej X (definicja jest taka sama dla zmiennych losowych ciągłych i dyskretnych) nazywamy liczbę oznaczaną przez D 2 X będącą wartością oczekiwaną zmiennej losowej (X − EX )2 ,tzn. D 2 X = E (X − EX )2 . Momenty zwykły i centralne Zatem mamy D 2 X = Własności wariancji Pn i=1 pi (xi − EX )2 . 1. D 2 (a) = 0; 2. D 2 (aX ) = a2 D 2 (X ); 3. D 2 (X + b) = D 2 (X ); 4. D 2 (X ± Y ) = D 2 (X ) + D 2 (Y ), jeżeli zmienne X i Y są niezależne. Mediana Definicja Momentem zwykłym rzędu k (gdzie k = 1, 2, ...) dyskretnej zmiennej losowej X nazywamy wartość oczekiwaną k-tej potęgi tej zmiennej, tzn. mk = E (X k ) = która jest znacznie wygodniejsza do praktycznego zastosowania. Odchyleniem standardowym zmiennej losowej X nazywamy liczbę: √ DX = D 2 X . n X xi k pi k=1 Definicja Medianą Me zmiennej losowej X nazywamy liczbę x spełniającą związki P[X ¬ x] ­ 12 , P[X ­ x] ­ 12 . Kwantyle Definicja Definicja Momentem centralnym rzędu k (k = 1, 2, . . . , n) dyskretnej zmiennej losowej X nazywamy wartość oczekiwaną funkcji [X − EX ]k , tzn. µk = E (X − EX )k = n X k=1 (xi − EX )k pi ; Kwantylem rzędu p, gdzie 0 ¬ p ¬ 1 zmiennej losowej X nazywamy liczbę x spełniającą związki: P[X ¬ x] ­ p, [P[X ­ x] ­ 1 − p. Jak łatwo widać wspomniana powyżej mediana jest kwantylem rzędu 12 . W praktyce do badań używa się również: Współczynnik asymetrii i skupienia 1 3 4, 4 • kwantyle rzędu nazywane odpowiednio kwartylem dolnym (pierwszym)-oznaczanym Q1 oraz kwartylem górnym (trzecim) - oznaczanym Q3 ; • kwantyle rzędu 15 , 25 , 35 , • kwantyle rzędu • kwantyle rzędu 4 5 nazywane kwintylami; 1 2 9 9 10 , 10 ,. . . , 10 10 nazywane decylami; 1 2 99 100 , 100 ,. . . , 100 nazywane percentylami. Moda (dominanta, wartość modalna) Definicja Dominantą zmiennej losowej X mającej rozkład dyskretny nazywamy wartość x, największym prawdopodobieństwie wystąpienia, lub wartość najczęściej występująca w próbie. Definicja Współczynnik skupienia (koncentracji) (kurtoza) K - jest miarą skupienia poszczególnych obserwacji wokół średniej. Im wyższa wartość współczynnika tym bardziej wysmukła krzywa liczebności, większa koncentracja wartości cech wokół średniej. Kurtozę wyznaczamy korzystając ze wzoru: K= µ4 . (DX )4 Definicja Współczynnikiem asymetrii nazywamy iloraz trzeciego momentu centralnego przez trzecią potęgę odchylenia standardowego: A= µ3 . (DX )3 Podobnie jak trzeci moment centralny, współczynnik asymetrii przyjmuje wartość zero dla rozkładu symetrycznego, wartości ujemne dla rozkładów o lewostronnej asymetrii (wydłużone lewe ramię rozkładu) i wartości dodatnie dla rozkładów o prawostronnej asymetrii (wydłużone prawe ramię rozkładu). Współczynnik asymetrii ma tę przewagę nad trzecim momentem centralnym, że można porównywać jego bezwzględne wartości z różnych rozkładów.