Metody probabilistyczne i statystyka Wykład Funkcje i charakterystyki zmiennych losowych Dr Joanna Banaś Zakład Badań Systemowych Instytut Sztucznej Inteligencji i Metod Matematycznych Wydział Informatyki Politechniki Szczecińskiej 2 Metody probabilistyczne i statystyka Wykład 2 5. Funkcje zmiennych losowych Funkcja g : → jest odwzorowaniem borelowskim, jeśli ∀ B∈B ( ) {x ∈ : g ( x) ∈ B} ∈ B () (5.1) X :Ω → (5.2) Uwagi a) Warunkowi (5.1) równoważny jest warunek Y ∀ y∈ {x ∈ : g ( x) < y} ∈ B () b) g Każda funkcja ciągła jest odwzorowaniem borelowskim (5.3) Twierdzenie X − zmienna losowa, określona na przestrzeni probabilistycznej (Ω, Z , P), g − dowolna funkcja borelowska Funkcja Y : Ω → , określona wzorem Y = g ( X ), tzn. Y (ω) = g ( X (ω) ) dla ω∈Ω, jest zmienną losową. Y = g ( X ) − funkcja zmiennej losowej X Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Funkcje zmiennych losowych typu skokowego (5.4) Twierdzenie Jeśli X jest zmienną losową typu skokowego o zbiorze atomów S X = {x1 , x 2 ,...} i rozkładzie P( X = xi ) = pi , i = 1,2,..., to Y = g ( X ) jest również typu skokowego o zbiorze atomów SY = {g ( x1 ), g ( x2 ),...} i rozkładzie P (Y = g ( xi )) = ∑ {k :g ( x ) = g ( x )} p k , i = 1, 2,... k i (5.5) Przykład X jest zmienną losową typu skokowego o zbiorze atomów S X = {−1,0,1} i rozkładzie xi −1 0 1 1 1 1 pi 4 2 4 Wyznaczyć rozkład zmiennej a) b) Y = 2X +1 Y = 2X 2 +1 Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Funkcje zmiennych losowych typu ciągłego (5.6) Twierdzenie Jeśli X jest zmienną losową typu ciągłego o gęstości fX i Y = aX + b ( a ≠ 0) , to zmienna losowa Y także jest typu ciągłego i jej gęstość określona jest wzorem 1 y −b fY ( y) = fX |a| a (5.5) Przykład X ma rozkład jednostajny na przedziale 〈0,1〉, tzn. funkcja gęstości określona jest wzorem 1 dla x ∈ 〈 0,1〉 f X ( x) = 0 dla x ∉ 〈 0,1〉 f ( x) Wyznaczyć rozkład zmiennej 0 1 b) Y = g ( X ), gdzie g ( x ) = 2 3 a) Y = 2 X + 1 dla x<0 dla 0 ≤ x < 12 dla 12 ≤ x < 1 dla x ≥1 1 0 1 2 Rys.5.1. Gęstość zmiennej losowej X Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 6. Charakterystyki liczbowe zmiennej losowej Wartość oczekiwana (przeciętna) zmiennej losowej X, określonej na przestrzeni probabilistycznej (Ω, Z , P), to wielkość (6.1) , o ile całka istnieje EX ∫ X (ω)dP Ω (6.2) Własności (wartości oczekiwanej) a) b) Ec = c, c ∈ EX < ∞, EY < ∞, a, b ∈ ⇒ i E ( aX + bY ) = aEX + bEY c) X ≥ 0 i EX = 0 ⇒ E ( aX + bY ) < ∞ P ( X = 0) = 1 (X = 0 prawie wszędzie) Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Wartość oczekiwana funkcji zmiennej losowej typu skokowego (6.3) Twierdzenie Niech X będzie zmienną losową typu skokowego o rozkładzie P( X = xi ) = pi dla i = 1, 2,... Jeśli g jest funkcją borelowską na taką, że ∑ i | g ( xi ) | pi < ∞ , to Eg ( X ) istnieje oraz Eg ( X ) = ∑ i g ( xi ) pi (6.4) Wnioski a) b) g ( x) = x ⇒ EX = ∑ i xi pi g ( x) = x 2 ⇒ EX = ∑ i xi2 pi Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Wartość oczekiwana funkcji zmiennej losowej typu ciągłego (6.5) Twierdzenie Niech X będzie zmienną losową typu ciągłego o gęstości f. Jeśli g jest funkcją borelowską na taką, że ∫ ∞ | g ( x) | ⋅ f ( x)dx < ∞ , to Eg ( X ) istnieje oraz −∞ ∞ Eg ( X ) = ∫ g ( x) ⋅ f ( x)dx −∞ (6.6) Wnioski ∞ a) g ( x) = x ⇒ EX = ∫ x ⋅ f ( x )dx b) g ( x) = x 2 ⇒ EX = ∫ x 2 ⋅ f ( x)dx −∞ ∞ −∞ Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Wariancja Wariancja zmiennej losowej X to liczba D 2 X E ( X − EX ) 2 (6.7) (6.8) Wnioski a) X − zmienna losowa typu skokowego o rozkładzie P( X = xi ) = pi dla i = 1, 2,... ⇒ D 2 X = ∑ i ( xi − EX ) 2 pi b) X − zmienna losowa typu ciągłego o gęstości f ⇒ ∞ D X = ∫ ( x − EX ) 2 ⋅ f ( x)dx 2 −∞ Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Własności wariancji (6.9) Własności a) D 2 X = EX 2 − ( EX ) 2 b) D2X ≥ 0 c) D 2 X = 0 ⇔ P( X = EX ) = 1 d) D 2 (aX ) = a 2 D 2 X , a ∈ e) D 2 ( X + b) = D 2 X , b ∈ (6.10) Przykład Obliczyć wartość oczekiwaną i wariancję zmiennej losowej X a) b) o rozkładzie xi pi o funkcji gęstości 0 1 1 4 3 4 x − 1 dla x ∈ 〈1, 2) f ( x) = 3 − x dla x ∈ (2,3〉 0 dla x ∉ 〈1,3〉 Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Inne charakterystyki zmiennej losowej Odchylenie standardowe zmiennej losowej X to liczba σ D2X (6.11) Wartości oczekiwane mk EX k , E | X | k , µ k E ( X − EX ) k to odpowiednio: a) b) c) k-ty moment zwykły k-ty moment absolutny k-ty moment centralny zmiennej losowej X ( EX = m, D 2 X = µ 2 ) Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Inne charakterystyki zmiennej losowej Kwantyl rzędu p − każda liczba x p , p ∈ (0,1) taka, że F ( x p ) ≤ p ≤ lim+ F ( x) tzn. ∑ i F (x p ) = p xi < x p pi ≤ p ≤ ∑ x ≤ x pi i p x→ x p dla zmiennej typu skokowego dla zmiennej typu ciągłego 1 Mediana − kwantyl rzędu 2 Odchylenie przeciętne od wartości oczekiwanej d = E | X − EX | Współczynnik zmienności σ ν= , m≠0 m Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Inne charakterystyki zmiennej losowej Współczynnik skośności (asymetrii) µ 3 E ( X − EX ) 3 γ= 3 = σ σ3 a) f ( x) b) f ( x) γ>0 0 γ<0 x 0 x Rys.6.1. Asymetria prawostronna (a) i lewostronna (b) Dominanta (moda) typ skokowy − wartość xk ∉{min xi ,max xi } , dla której pk jest maksimum absolutnym, typ ciągły − odcięta maksimum absolutnego funkcji gęstości, o ile jest punktem ciągłości Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Inne charakterystyki zmiennej losowej Współczynnik skupienia (kurtoza) µ 4 E ( X − EX ) 4 κ= 4 = σ σ4 f ( x) 1 EX 1 = EX 2 = 0 2 2 f1 D X 1 = D X 2 κ1 < κ 2 1 2 f2 −1 − 1 2 0 1 2 1 x Rys.6.2. Porównanie skupienia dwóch rozkładów Współczynnik spłaszczenia (eksces) γ2 = κ − 3 Rozkład normalny κ=3 γ2 = 0 Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 7. Wybrane zmienne typu skokowego (7.1) Rozkład jednopunktowy xi pi P ( X = a ) = 1, dla ustalonego a ∈ lub Dystrybuanta 0 dla x ≤ a F ( x) = 1 dla x > a Parametry EX = a ⋅1 = a EX 2 = a 2 ⋅1 = a 2 D2 X = a2 − a2 = 0 a 1 F ( x) 1 0 a x Rys.7.1. Wykres dystrybuanty zmiennej losowej X Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Rozkład 0-1 (7.2) Rozkład 0−1 z parametrem p∈(0,1) xi pi P ( X = 1) = p, P ( X = 1) = q, q = 1 − p lub 0 q 1 p Dystrybuanta 0 dla x ≤ 0 F ( x) = q dla 0 < x ≤ 1 1 dla x > 1 Parametry F ( x) 1 p q q EX = 0 ⋅ q + 1 ⋅ p = p 2 2 2 EX = 0 ⋅ q + 1 ⋅ p = p D 2 X = p − p 2 = p (1 − p ) = p ⋅ q 0 1 x Rys.7.2. Wykres dystrybuanty zmiennej losowej X Realizacja sukces 1 zmienna losowa X n = gdy w n-tym doświadczeniu wystąpi porażka 0 ma rozkład 0−1 dla każdego n = 1,2,… Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Rozkład dwumianowy (7.3) Rozkład dwumianowy z parametrami n = 1,2,…, p∈(0,1) P ( X = k ) = n p k q n − k , k = 0,1, 2,..., n, q = 1 − p k () Rozkład jest dobrze określony n ∑ k =0 kn p k q n−k = ( p + q) n = 1 Parametry () EX = n ⋅ p D2 X = n ⋅ p ⋅ q Własności (n+1)p − liczba całkowita ⇒ najbardziej prawdopodobnymi wartościami zmiennej są liczby (n+1)p−1 oraz (n+1)p (n+1)p − liczba niecałkowita ⇒ najbardziej prawdopodobną wartością zmiennej jest liczba [(n+1)p] ([x] − całość z x) Realizacja liczba możliwych sukcesów w schemacie Bernoulli’ego Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Rozkład geometryczny (7.4) Rozkład geometryczny z parametrem p∈(0,1) P ( X = k ) = q k −1 p, k = 1, 2,..., q = 1 − p Rozkład jest dobrze określony n n 1 1 k −1 k −1 q p = p ⋅ q = p ⋅ = p ⋅ =1 ∑ k =1 ∑ k =1 1− q p Parametry 1 p q 2 D X= 2 p EX = Realizacja liczba doświadczeń do momentu pierwszego sukcesu Opracowała Joanna Banaś Metody probabilistyczne i statystyka Wykład 2 Rozkład Poissona (7.5) Rozkład Poissona z parametrem λ > 0 λ k −λ P( X = k ) = e , k = 0,1, 2,... k! Rozkład jest dobrze określony k (M) ∞ λ λ k −λ −λ ∑ k =0 k ! e = e ∑ k =0 k ! = e −λ ⋅ e λ = e 0 = 1 z rozwinięcia funkcji w szereg Maclaurina mamy (k ) ∞ ∞ f (0) k 1 (M) f ( x ) = ∑ k =0 x i stąd e x = ∑ k =0 x k k! k! Parametry EX = λ D2 X = λ ∞ Opracowała Joanna Banaś Przybliżenie rozkładem Poissona Twierdzenie Ciąg rozkładów dwumianowych jest zbieżny do rozkładu Poissona z parametrem λ Uwaga Jeśli n ≥ 50, p ≤ 0.1 i n ⋅ p ≤ 10 , to do celów praktycznych można przybliżać n p k q n−k ≈ λ k e −λ , λ = n ⋅ p k k! Realizacja () ze względu na wcześniejszą uwagę liczba możliwych sukcesów w schemacie Bernoulli’ego, przy dużej liczbie doświadczeń i małym prawdopodobieństwie sukcesu (kontrola jakości) Metody probabilistyczne i statystyka Wykład 1 Dziękuję za uwagę Opracowała Joanna Banaś