JEDNOWYMIAROWA ZMIENNA LOSOWA Niech E będzie zbiorem zdarzeń elementarnych danego doświadczenia. Funkcję X(e) przyporządkowującą każdemu zdarzeniu elementarnemu e∈E jedną i tylko jedną liczbę X(e)=x nazywamy ZMIENNĄ LOSOWĄ. Przykład: Rozpatrujemy doświadczenie polegające na rzucie symetryczną monetą. Wynikiem tego doświadczenia mogą być zdarzenia "pojawienie się orła" albo "pojawienie się reszki" tworzące zbiór zdarzeń elementarnych. Na zbiorze zdarzeń elementarnych określamy zmienną losową X w sposób następujący: X (orzeł) = 1; X (reszka) = 0 Zmienna losowa X przyjmuje wartość ze zbioru {0,1}. Zdarzenia "pojawienie się orła" i "pojawienie się reszki" realizują się z prawdopodobieństwami równymi 1/2, zatem: P(X=1) = P{orzeł} = 1/2, P(X=0) = P{reszka} = 1/2. Typy zmiennej losowej: − Skokowa (przyjmuje skończoną lub nieskończoną, ale przeliczalną liczbę wartości), − Ciągła (jej wartości należą do przedziału ze zbioru liczb rzeczywistych). ZMIENNA LOSOWA SKOKOWA przyjmuje wartość x1, x2,... z prawdopodobieństwami, odpowiednio p1, p2,... , takimi że: n ∑p = 1, gdy X przyjmuje skończoną liczbę n wielkosci, lub (1) ∑p = 1, gdy X przyjmuje nieskończoną liczbę wartosci (2) i =1 ∞ i =1 i i Zbiór prawdopodobieństw postaci pi spełniających równość (1) lub (2) określamy mianem funkcji prawdopodobieństwa zmiennej losowej X typu skokowego. Wykres funkcji prawdopodobieństwa x pi p3 p2 . . p1 0 . x1 x2 x3 xi Dystrybuanta zmiennej losowej skokowej przyjmuje postać: F ( x) = ∑ pi (−∞ < x < ∞) xi ≤ x Informacje na temat własności dystrybuanty oraz wykres dystrybuanty znajdują się w materiałach z poprzednich zajęć. ZMIENNA LOSOWA CIĄGŁA Przyjmuje nieprzeliczalną liczbę wartości. Zatem jej rozkładu nie można opisać za pomocą funkcji prawdopodobieństwa jak w przypadku zmiennej losowej skokowej. Funkcją, która opisuje rozkład zmiennej losowej ciągłej, jest funkcja gęstości. Jest to funkcja określona na zbiorze liczb rzeczywistych o następujących własnościach: • f ( x ) ≥ 0, b • ∫ f ( x ) dx = P ( a < X ≤ b ) dla a < b a • +∞ ∫ f (x )dx = P(− ∞ < X ≤ +∞ ) = 1 −∞ Należy zauważyć, że prawdopobieństwo postaci P(X=a) jest równe zeru: a P( X = a ) = ∫ f ( x ) dx = 0 a Przykładowy wykres funkcji gęstości prawdopodobieństwa i graficzna interpretacja P(a < X ≤ b ) f(x) b P(a < X ≤ b ) = ∫ f ( x )dx a a b Dystrybuantę zmiennej losowej ciągłej określa się następująco: F (x ) = x ∫ f (t )d (t ), −∞ gdzie f(t) jest funkcją gęstości zmiennej losowej X x PARAMETRY ROZKŁADU ZMIENNEJ LOSOWEJ: Wartość oczekiwana: dla zmiennej losowej skokowej ∑ xi pi i E(X ) = ∞ dla zmiennej losowej ciąglej ∫ xf ( x )dx − ∞ Własności wartości oczekiwanej: − E (a) = a , gdzie a – stała, − E[(aX )k ] = a k E ( X k ) − E (aX + b) = aE ( X ) + b Wariancja: 2 xi − E ( X ) pi dla zmiennej losowej skokowej ∑ i 2 D 2 ( X ) = E X − E ( X ) = ∞ 2 x − E ( X ) f ( x ) dx dla zmiennej losowej ciąglej ∫ −∞ Własności wariancji: − D 2 ( a) = 0 − D 2 ( X + a) = D 2 ( X ) − D2 (aX ) = a 2 D2 ( X ) − D2 (aX + b) = a 2 D2 ( X ) Moment zwykły rzędu k: ( ) mk = E X k ∑ xik pi dla zmiennej losowej skokowej i = ∞ k ∫ x f ( x )dx dla zmiennej losowej ciąglej − ∞ Moment centralny rzędu k: uk = E [ X − E ( X )]k ∑ [xi − E ( x )]kpi dla zmiennej losowej skokowej i =∞ k ∫ [x − E ( x )] f ( x )dx dla zmiennej losowej ciąglej − ∞ ROZKŁADY ZMIENNEJ LOSOWEJ Rozkład zerojedynkowy Zmienna losowa X ma rozkład zero-jedynkowy, jeśli przyjmuje wartość prawdopodobieństwem 0<p<1 oraz wartość 0 z prawdopodobieństwem q=1-p. 1 z Funkcja prawdopodobieństwa rozkładu zero-jedynkowego: xi 0 1 pi 1-p p Dystrybuanta zmiennej losowej zero-jedynkowej: dla x<0 0, F ( x ) = 1 − p, dla 0 ≤ x < 1 1, dla x ≥1 Wartość oczekiwana i wariancja zmiennej losowej zero-jedynkowej: E ( X ) = 0 ⋅ (1 − p ) + 1 ⋅ p = p, D 2 ( X ) = (0 − p )2 (1 − p ) + (1 − p )2 p = p(1 − p ). Rozkład dwumianowy Zmienna losowa X ma rozkład dwumianowy, jeśli przyjmuje wartości k=0,1,2,...,n z prawdopodobieństwami określonymi wzorem: n P( X = k ) = p k (1 − p )n − k k Liczbę doświadczeń n oraz prawdopodobieństwo sukcesu p nazywamy parametrami tego rozkładu. Dystrybuanta zmiennej losowej X o rozkładzie dwumianowym: F ( x ) = P( X ≤ x ) = n ∑ k p k (1 − p )n − k k ≤ x Wartość oczekiwana i wariancja zmiennej losowej X o rozkładzie dwumianowym: n n E ( X ) = E ∑ X i = ∑ E ( X i ) = np, i =1 i =1 n n D 2 ( X ) = D 2 ∑ X i = ∑ D 2 ( X i ) = np(1 − p ). i =1 i =1 Schemat Bernoulliego: − wykonujemy doświadczenie, którego rezultatem może być sukces z prawdopodobieństwem p lub porażka z prawdopodobieństwem q=1-p, − doświadczenie powtarzamy n-krotnie w sposób niezależny co oznacza, że prawdopodobieństwo sukcesu pozostaje w pojedynczych próbach stałe i równe p, − liczba sukcesów jaką zaobserwujemy w wyniku n-krotnego powtórzenia doświadczenia, może być równa k=0,1,2,...,n. Rozkład normalny Wiele zjawisk świata fizycznego cechuje rozkład normalny, np. waga i wzrost ludzi. Dlatego rozkład ten m bardzo duże znaczenie w statystyce. Do rozkładu tego prowadzi taki proces kształtowania zjawiska, w ramach którego na dane zjawisko oddziałuje duża liczba niezależnych czynników, których wpływ, traktowany odrębnie, jest mało znaczący. Zmienna losowa X ma rozkład normalny o parametrach m oraz σ, co w skrócie zapisuje się jako X : N (m, σ ) , jeżeli jej funkcja gęstości wyraża się wzorem: − 1 f (x) = e σ 2π ( x − m )2 2σ 2 , − ∞ < x < +∞ , przy czym σ > 0 . Funkcja gęstości rozkładu normalnego o parametrach m i σ: Własności krzywej gęstości rozkładu normalnego: a) jest symetryczna względem prostej x = m , b) osiąga maksimum równe 1 dla x = m , σ 2π c) jej ramiona mają punkty przegięcia dla x = m − σ oraz x = m + σ . Dystrybuantą zmiennej losowej X mającej rozkład normalny jest funkcja F(x) określona na zbiorze liczb rzeczywistych o postaci: F ( x ) = 1 σ 2π Ze względu na symetryczność rozkładu F(-x)=1-F(x) x − (t − m ) 2 e 2σ ∫ −∞ 2 dt Rozkład normalny ze średnią m=0 oraz odchyleniem standardowym σ=1 nazywamy standardowym rozkładem normalnym i oznaczamy N(0,1). Wartości funkcji gęstości i dystrybuanty rozkładu normalnego wystandaryzowanego są tablicowane. Standaryzacja zmiennej losowej X o rozkładzie normalnym z parametrami m i σ: X −m U= , gdzie U ~ N (0,1) . σ Zatem: b−m a− X −m b−m a−m b−m a−m P ( a < X ≤ b) = P < ≤ <U ≤ = P = F −F σ σ σ σ σ σ σ Reguła trzech sigm P (| X − m |≤ σ ) = 0, 68269 P (| X − m |≤ 2σ ) = 0, 9545 P (| X − m |≤ 3σ ) = 0, 9973 Addytywność rozkładu normalnego Jeśli X 1 ~ N ( m1 , σ 1 ) a X 2 ~ N ( m2 , σ 2 ) oraz X1 i X2 są niezależne to X 1 + X 2 ~ N ( m1 + m2 , σ 12 + σ 22 ) Zaletą rozkładu normalnego jest to, że wiele rozkładów jest zbieżnych do rozkładu normalnego przy wzroście liczebności zbiorowości (zob. tw. graniczne). INNE ROZKŁADY: Rozkład t-Studenta o liczbie stopni swobody υ to rozkład zmiennej losowej określony funkcją gęstości o postaci: υ + 1 υ +1 Γ 2 − 2 t 2 f (t ) = 1+ , υ υ nπ Γ 2 (− ∞ < t < +∞ ) gdzie υ=n-1 zaś Γ(x) jest funkcją gamma. Parametry: E ( t ) = 0, D (t ) = υ υ −2 n −1 n−3 = Przy n→ ∞ rozkład t-Studenta zbiega do rozkładu normalnego N(0,1). Rozkład χ2 (Chi- kwadrat) o liczbie stopni swobody υ to rozkład zmiennej losowej określony funkcją gęstości o postaci: ( ) f χ2 υ 1 2 2 υ −χ 2 2 2 2 dla υ χ e = Γ 2 dla 0 ( ) χ2 > 0 χ2 ≤ 0 gdzie υ=n-1. Rozkład χ2 (chi- kwadrat) o liczbie stopni swobody υ ma statystyka: X −m χ = ∑ i σ i =1 2 n 2 gdzie: Xi – niezależne zmienne losowe mające jednakowy rozkład N(m,σ), υ=n. Parametry: ( ) D (χ ) = 2υ E χ 2 = υ; 2 2 Przy υ → ∞ rozkład statystyki 2 χ 2 zdąża do rozkładu N ( ) 2υ − 1;1 . Rozkład F-Snedecora o liczbie stopni swobody licznika υ1 i liczbie stopni swobody mianownika określony funkcją gęstości o postaci: υ1 υ1 υ + υ 1 −1 υ12 υ 2 Γ 1 2 2 F 2 ⋅ 1 υ υ f ( F ) = Γ 1 Γ 2 (υ1F + υ 2 )2 (υ1 +υ 2 ) 2 2 0 dla F ≤ 0 Parametry: E(F ) = υ2 − 2 D (F ) = 2 υ2 2υ22 (υ1 + υ2 − 2 ) υ1 (υ2 − 2 ) (υ2 − 4 ) 2 dla F >0 υ2 to rozkład