Przestrzeń probabilistyczna (Ω, Σ, P) Ω pewien niepusty zbiór Σ rodzina podzbiorów tego zbioru P funkcja określona na Σ, zwana prawdopodobieństwem. Rachunek prawdopodobieństwa Przestrzeń probabilistyczna (Ω, Σ, P) Ω pewien niepusty zbiór Σ rodzina podzbiorów tego zbioru P funkcja określona na Σ, zwana prawdopodobieństwem. Σ spełnia nastepuj ˛ ace ˛ warunki: ∅, Ω ∈ Σ, A1 , A2 , . . . ∈ Σ ⇒ A1 ∪ A2 ∪ . . . ∈ Σ, A1 , A2 , . . . ∈ Σ ⇒ A1 ∩ A2 ∩ . . . ∈ Σ, A ∈ Σ ⇒ Ω \ A ∈ Σ (Oznaczenie A0 := Ω \ A, A0 - zdarzenie przeciwne), A, B ∈ Σ ⇒ A \ B ∈ Σ. Elementy Σ nazywamy zdarzeniami losowymi. Rachunek prawdopodobieństwa Przestrzeń probabilistyczna (Ω, Σ, P) Ω pewien niepusty zbiór Σ rodzina podzbiorów tego zbioru P funkcja określona na Σ, zwana prawdopodobieństwem. P spełnia natepuj ˛ ace ˛ warunki: P(∅) = 0, P(Ω) = 1, P(A) ∈ [0, 1] dla A ∈ Σ, P(A ∪ B) = P(A) + P(B), dla A, B ∈ Σ, A ∩ B = ∅, Jeśli A1 , A2 , . . . ∈ Σ, Ai ∩ Aj = ∅ dla i 6= j, to P(A1 ∪ A2 ∪ . . .) = P(A1 ) + P(A2 ) + . . .. Rachunek prawdopodobieństwa Przykłady Rzut kostka. ˛ Ω = {1, 2, 3, 4, 5, 6} Σ = P(Ω) P({i}) = 1/6, dla i = 1, 2, 3, 4, 5, 6. Na przykład A = {2, 4, 6} jest zdarzeniem losowym polegajacym ˛ na wylosowaniu parzystej liczby oczek. P(A) = P({2, 4, 6}) = P({2}) + P({4}) + P({6}) = 1/6 + 1/6 + 1/6 = 1/2 Rachunek prawdopodobieństwa Przykłady Rzut dwiema kostkami do gry. Ω= {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (2, 1), . . . , (6, 5), (6, 6)} Σ = P(Ω) P(ω) = 1/36, dla ω ∈ Ω. Na przykład A = {(5, 5), (6, 5), (6, 6), (5, 6)} jest zdarzeniem losowym polegajacym ˛ na wylosowaniu liczby oczek nie mniejszej niż 11. P(A) = P({(5, 5), (6, 5), (6, 6), (5, 6)}) = P({(5, 5)}) + P({(5, 6)}) + P({(6, 5)}) + P({(6, 6)})) = 1/36 + 1/36 + 1/36 + 1/36 = 4/36 Rachunek prawdopodobieństwa Prawodopodobieństwo klasyczne Ω-zbiór skończony n-elementowy. Σ = P(Ω) P({ω}) = 1/n dla ω ∈ Ω. Wtedy P(A) = card A/ card Ω = card A/n. Rachunek prawdopodobieństwa Inne przykłady Ω=N P({n}) = 1/2n A-zdarzenie losowe polegajace ˛ na wylosowaniu liczby parzystej. 1/4 P(A) = P({2}) + P({4}) + . . . = 1/4 + 1/16 + . . . = 1−1/4 = 1/3. Rachunek prawdopodobieństwa Prawdopodobieństwo geometryczne Ω- pewien mierzalny podzbiór R n P(A) = pole A/pole Ω. Przykład: Jakie jest prawdopodobieństwo, że rzucajac ˛ do tarczy trafimy w "środek" . Dane: tarcza okragła o promieniu 20cm, środek- koło o promieniu 5cm. π52 P(A) = π20 2 Rachunek prawdopodobieństwa Prawdopodobieństwo warunkowe Niech (Ω, Σ, P) bedzie ˛ przestrzenia˛ probabilistyczna, ˛ A, B ∈ Σ, P(B) > 0. Prawdopodobieństwem warunowym zdarzenia A pod warunkiem zdarzenia B nazywamy P(A|B) := P(A ∩ B) . P(B) Oznaczenie: P B (A) := P(A|B). Fakt: (Ω, Σ, P B ) jest przestrzenia˛ probabilistyczna. ˛ Ze wzoru (1) mamy P(A ∩ B)P(A|B) · P(B) = B(B|A) · P(A). Rachunek prawdopodobieństwa (1) Przykład W ciemnym pokoju sa˛ dwa pudełka: duże, do którego trafiamy z prawdopodobieństwem 3/4, i małe, do którego trafiamy z prawdopodobieństwem 1/4. W dużym pudełku sa˛ dwie kule białe i jedna czarna, a w małym 2 czarne i jedna biała. Niech A bedzie ˛ zdarzeniem losowym polegajacym ˛ na trafieniu do dużej urny, a B zdarzeniem losowym polegajacym ˛ na wyciagi ˛ eciu ˛ kuli białej. Jakie jest prawdopodobieństwo, że losowano z dużego pudła, jeśli wiadomo, że wylosowano kule˛ biała. ˛ Rachunek prawdopodobieństwa c.d. Rozwiazanie. ˛ Dane: P(A) = 3/4, P(A0 ) = 1/4, P(B|A) = 2/3, P(B|A0 ) = 1/3. Należy obliczyć P(A|B). Korzystamy ze wzoru P(A|B) = P(A∩B) P(B) . Obliczamy P(A ∩ B) = P(B|A)P(A) = 2 3 · . 3 4 P(B) = P(B ∩ A) + P(B ∩ A0 ) = = P(B|A) · P(A) + P(B|A0 ) · P(A0 ) = 2/3 · 3/4 + 1/3 · 1/4 = 7/12. A wiec ˛ P(A|B) = 1/2 = 6/7. 7/12 Rachunek prawdopodobieństwa Wzór na prawdopodobieństwo całkowite Niech (Ω, Σ, P) bedzie ˛ przestrzenia˛ probabilistyczna. ˛ Niech A1 , A2 , . . . bed ˛ a˛ zdarzeniami losowymi parami rozłacznymi ˛ i takimi, że P(A1 ) + P(A2 ) + . . . = 1. Wtedy, dla dowolnego B ∈ Σ zachodzi wzór P(B) = P(B|A1 ) · P(A1 ) + P(B|A2 ) · P(A2 ) + . . . Rachunek prawdopodobieństwa Wzór Bayesa Niech (Ω, Σ, P) bedzie ˛ przestrzenia˛ probabilistyczna. ˛ Niech A1 , A2 , . . . bed ˛ a˛ zdarzeniami losowymi parami rozłacznymi ˛ i takimi, że P(A1 ) + P(A2 ) + . . . = 1. Wtedy, dla dowolnego B ∈ Σ zachodzi wzór P(Ai |B) = P(B|Ai ) · P(Ai ) P(B|A1 ) · P(A1 ) + P(B|A2 ) · P(A2 ) + . . . Rachunek prawdopodobieństwa Przykład Twierdzenia Bayesa można użyć do interpretacji rezultatów badania przy użyciu testów wykrywajacych ˛ narkotyki. Załóżmy, że przy badaniu narkomana test wypada pozytywnie w 99% przypadków, zaś przy badaniu osoby nie zażywajacej ˛ narkotyków wypada negatywnie w 99% przypadków. Pewna firma postanowiła przebadać swoich pracowników takim testem wiedzac, ˛ że 0,5% z nich to narkomani. Chcemy obliczyć prawdopodobieństwo, że osoba u której test wypadł pozytywnie rzeczywiście zażywa narkotyki. Rachunek prawdopodobieństwa c.d Oznaczmy nastepuj ˛ ace ˛ zdarzenia: T - dana osoba jest narkomanem N - dana osoba nie jest narkomanem + - u danej osoby test dał wynik pozytywny - - u danej osoby test dał wynik negatywny Wiemy, że: P(T ) = 0, 005, gdyż 0,5% pracowników to narkomani P(N) = 1 − P(D) = 0, 995 P(+|T ) = 0, 99, gdyż taka˛ skuteczność ma test przy badaniu narkomana P(−|N) = 0, 99, gdyż taka˛ skuteczność ma test przy badaniu osoby nie bedacej ˛ narkomanem P(+|N) = 1 − P(−|N) = 0, 01 Majac ˛ te dane chcemy obliczyć prawdopodobieństwo, że osoba, u której test wypadł pozytywnie, rzeczywiście jest narkomanem. Tak wiec: ˛ Rachunek prawdopodobieństwa c.d P(T |+) = = P(+|T ) · P(T ) = P(+|T ) · P(T ) + P(+|N) · P(N) 0, 99 · 0, 005 ≈ 0, 33. 0, 99 · 0, 005 + 0, 01 · 0, 995 Rachunek prawdopodobieństwa c.d Mimo potencjalnie wysokiej skuteczności testu, prawdopodobieństwo, że narkomanem jest badany pracownik, u którego test dał wynik pozytywny, jest równe około 33%, wiec ˛ jest nawet bardziej prawdopodobnym, ze taka osoba nie zażywa narkotyków. Ten przykład pokazuje, dlaczego ważne jest, aby nie polegać na wynikach tylko pojedynczego testu. Innymi słowy, pozorny paradoks polegajacy ˛ na dużej dokładności testu (99% wykrywalności narkomanów wśród narkomanów i nieuzależnionych wśród nieuzależnionych) i niskiej dokładności badania bierze sie˛ stad, ˛ że w badanej próbie tylko niewielka cz˛eść osób to narkomani. Przykładowo jeśli badamy 1000 osób, 0,5% z nich czyli 5 to narkomani, a 995 nie. Natomiast test wskaże jako narkomanów 1% nieuzależnionych (995 · 1% ≈ 10), oraz 99% uzależnionych (5 · 99% ≈ 5). Ostatecznie test wypadł pozytywnie dla 15 osób, jednak tylko 5 z nich to narkomani. Rachunek prawdopodobieństwa Niezależność zdarzeń Zdarzenia A i B nazywamy niezależnymi, gdy P(A ∩ B) = P(A) · P(B). A wiec, ˛ zdarzenia A i B sa niezależne, gdy przynajmniej jedno z nich ma prawdopodobieństwo równe 0, lub oba maja˛ dodatnie prawdopodobieństwa i P(A|B) = P(A), P(B|A) = P(B). Rachunek prawdopodobieństwa Niezależność wiekszej ˛ ilości zdarzeń Zdarzenia A, B i C sa˛ niezależne, gdy P(A ∩ B ∩ C) = P(A) · P(B) · P(C), P(A ∩ B) = P(A) · P(B), P(A ∩ C) = P(A) · P(C), P(B ∩ C) = P(B) · P(C). ... Rachunek prawdopodobieństwa Zmienne losowe Niech (Ω, Σ, P) bedzie ˛ przestrzenia˛ probabilistyczna. ˛ Zmienna˛ losowa˛ nazywamy każda˛ funkcje˛ ξ określona˛ na Ω i przyjmujac ˛ a˛ wartości rzeczywiste, taka, ˛ że zdarzeniami sa˛ nastepuj ˛ ace ˛ zbiory: {ω : ξ(ω) < x}, {ω : ξ(ω) ≤ x}, {ω : ξ(ω) > x}, {ω : ξ(ω) ≥ x}, {ω : ξ(ω) ∈ (a, b)}, {ω : ξ(ω) ∈ [a, b]}, {ω : ξ(ω) ∈ [a, b)}, {ω : ξ(ω) ∈ (a, b]}, dla dowolnych x, a, b ∈ R. Rachunek prawdopodobieństwa Niezależność zmiennych losowych Zmienne losowe X1 , X2 , . . . , Xn sa˛ niezależne, gdy dla każdych x1 , x2 , . . . , xn ∈ R zachodzi P(X1 < x1 , X2 < x2 , . . . , Xn < xn ) = = P(X1 < x1 ) · P(X2 < x2 ) · . . . · P(Xn < xn ). Rachunek prawdopodobieństwa Dystrybuanta zmiennej losowej Dystrybuanta˛ zmiennej losowej X nazywamy funkcje˛ F : R → R określona˛ wzorem F (x) = P(X < x) = P({ω : X (ω) < x}). Własności dystrybuant: F jest niemalejaca, ˛ lewostronnie ciagła, ˛ F (x) ∈ [0, 1], limx→∞ F (x) = 1, limx→−∞ F (x) = 0. Rachunek prawdopodobieństwa Typy zmiennych losowych – zmienne losowe dyskretne (typu skokowego), – zmienne losowe ciagłe, ˛ – inne. Rachunek prawdopodobieństwa Zmienne losowe dyskretne To zmienne, które przyjmuja˛ (z prawdopodobieństwem 1) wartości ze zbioru {x1 , x2 , . . .}. Dystrybuanta takich zmiennych losowych jest przedziałami stała, a w punktach x1 , x2 , . . . ma "skoki" wysokości P(X = xi ) odpowiednio. Rachunek prawdopodobieństwa Przykłady zmiennych losowych o rozkładach dyskretnych - rozkład dwupunktowy – rozkład zero-jedynkowy - rozkład dwumianowy - rozkład Poissona -inne Rachunek prawdopodobieństwa Rozkład dwupunktowy Zmienna losowa X ma rozkład dwupunktowy, gdy przyjmuje dwie wartości (z prawdopodobieństwem 1): P(X = x1 ) = p, P(X = x2 ) = q = 1 − p. Szczególnym przypadkiem rozkładu dwupunktowego jest rozkład zero-jedynkowy, gdy x1 = 1, x2 = 0. Rachunek prawdopodobieństwa Dystrybuanta rozkładu zero-jedynkowego Rachunek prawdopodobieństwa Rozkład dwumianowy Niech X1 , X2 , . . . , Xn bedzie ˛ ciagiem ˛ niezależnych zmiennych losowych o tym samym rozkładzie zero-jedynkowym. Oznaczmy przez X sume˛ tych zmiennch, tzn. X = X1 + X2 + . . . + Xn . Mówimy, że zmienna losowa X ma rozkład dwumianowy. n k n−k P(X = k ) = p q , k = 0, 1, . . . , n. k Oznaczenie b(n, k , p) = kn pk q n−k - prawdopodobieństwo k sukcesów w n próbach Bernoulliego, w których prawdopodobieństwo sukcesu jest równe p. Rachunek prawdopodobieństwa Rozkład Poissona Zmienna losowa X ma rozkład Poissona z parametrem λ, gdy przyjmuje tylko wartości całkowite nieujemne, oraz P(X = k ) = e−λ · λk . k! k Oznaczenie p(λ, k ) = e−λ · λk ! . Uwaga. Gdy n jest duże (n ≥ 100), p małe (p ≤ 0, 1), a np ∈ [0.1, 10], to dokonuje sie˛ przybliżenia b(n, k , p) ≈ p(λ, k ), gdzie λ ≈ np. Rachunek prawdopodobieństwa Rozkład Poissona Rachunek prawdopodobieństwa Rozkłady ciagłe ˛ Mówimy, że zmienna losowa ma rozkład ciagły, ˛ gdy istnieje funkcja f : R → R, nieujemna, taka, że Z f (x) dx = 1, R oraz Z P(X ∈ A) = f (x) dx. A T˛e funkcje˛ f nazywamy gestości ˛ a˛ rozkładu zmiennej X . Dystrybuante˛ obliczamy ze wzoru Z x F (x) = f (t) dt. −∞ Rachunek prawdopodobieństwa Przykłady zmiennych losowych o rozładzie ciagłym ˛ -rozkład jednostajny -rozkład wykładniczy -rozkład normalny -rozkład chi-kwadrat -rozkład t-Studenta -inne Rachunek prawdopodobieństwa Rozkład jednostajny Rozkład jednostajny na odcinku [a, b] ma gestość ˛ 1 b−a , dla x ∈ [a, b]; f (x) = 0, dla x ∈ / [a, b]. Dystrybuanata: F (x) = x−a b−a , 0, 1, dla x ∈ [a, b]; dla x < a; dla x > b. Rachunek prawdopodobieństwa Rozkład jednostajny Rachunek prawdopodobieństwa Rozkład wykładniczy Rozkład wykładniczy z parametrem λ ma gestość ˛ λ · e−λx , dla x ≥ 0; f (x) = 0, dla x < 0. Dystrybuanata: F (x) = 1 − e−λx , 0, dla x ≥ 0; dla x < 0. Rachunek prawdopodobieństwa Rozkład wykładniczy Rachunek prawdopodobieństwa Rozkład normalny Rozkład normalny z parametrami m i σ, N(m, σ) ma gestość ˛ (x−m)2 1 − f (x) = √ · e 2σ2 . σ 2π W szczególności rozkład normalny N(0, 1) ma gestość x2 1 f (x) = √ · e− 2 . 2π Jeśli X ∼ N(m, σ), to losowej X ) X −m σ ∼ N(0, 1). (standaryzacja zmiennej Rachunek prawdopodobieństwa Rozkład normalny Rachunek prawdopodobieństwa Tablica dystrybuanty rozkładu normalnego Rachunek prawdopodobieństwa Reguła trzech sigm Jeżeli zmienna losowa ma rozkład normalny N(m, σ) to P(|X − m| > 3σ) < 0, 01. Rachunek prawdopodobieństwa Rozkład chi-kwadrat Mówimy, że zmienna losowa χ2 ma rozkład chi-kwadrat Pearsona z n stopniami swobody, gdy jest postaci χ2 = X12 + X22 + . . . + Xn2 gdzie X1 , X2 , . . . , Xn sa˛ niezależnymi zmiennymi losowymi o rozkładzie normalnym N(0, 1). Rachunek prawdopodobieństwa Rozkład t-Studenta Mówimy, że zmienna losowa t ma rozkład t-Studenta o n stopniach swobody, gdy jest postaci X t=p χ2 /n gdzie X , χ2 sa˛ niezależnymi zmiennymi losowymi X o rozkładzie normalnym N(0, 1) a χ2 ma rozkład chi-kwadrat o n stopniach swobody. Rachunek prawdopodobieństwa Wartość oczekiwana zmiennej losowej Wartośc oczekiwana zmiennej losowej X , to "wartość średnia", oznaczamy ja˛ EX lub E(X ), lub m, lub m1 . Dla zmiennych o rozkładzie dyskretnym P(X = xk ) = pk dla k = 1, 2, . . .: EX = x1 · p1 + x2 · p2 + . . . . Dla zmiennych o rozkładzie ciagłym ˛ o gestości ˛ f: Z ∞ EX = xf (x) dx. −∞ Własności: E(aX + bY ) = aEX + bEY , E(XY ) = E(X )E(Y ), dla zmiennych X , Y niezależnych. Rachunek prawdopodobieństwa Gra polega na rzucie kostka. ˛ Za przystapienie ˛ do gry wpłacamy 10 zł. Za wyrzucenie 1,2 lub 3 nie wygrywamy nic. Za wyrzucenie 4 wygrywmy 5 zł,a za wyrzucenie 5- 10 zł. Za wyrzucenie 6 otrzymujemy 30 zł. Zmienna losowa X oznacza zysk w tej grze. Jaki jest jej rozkład, dystrybuanta i wartość oczekiwana. Rozkład: P(X = −10) = P({1, 2, 3}) = 1/6 + 1/6 + 1/6 = 1/2, P(X = −5) = P({4}) = 1/6, P(X = 0) = P({5}) = 1/6, P(X = 20) = P({6}) = 1/6. Dystrybuanta: 0, x ≤ −10; 1/2, x ∈ (−10, −5]; 2/3, x ∈ (−5, 0]; F (x) = 5/6, x ∈ (0, 20]; 1, x ∈ (20, ∞). E(X ) = −10 · 1/2 + (−5) · 1/6 + 0 · 1/6 + 20 · 1/6 = −2.5 Rachunek prawdopodobieństwa Wariancja i odchylenie standardowe Wariancja˛ zmiennej losowej X (oznaczenie D 2 X lub Var X ) nazywamy D 2 X = E(X − EX )2 = E(X − m)2 . Odchylenie standardowe (oznaczenie σ), to √ σ = D2X . Własności: D 2 (aX ) = a2 D 2 X , D 2 (X + Y ) = D 2 X + D 2 Y , dla zmiennych losowych X , Y niezależnych, D 2 X = E(X 2 ) − (EX )2 . Dla zmiennych o rozkładzie dyskretnym: P(X = xk ) = pk , k ∈ N: D 2 X = (x1 −m)2 ·p1 +(x2 −m)2 ·p2 +. . . = [x12 ·p1 +x22 ·p2 +. . .]−(EX )2 . Dla zmiennych o rozkładzie ciagłym ˛ o gestości ˛ f: Z ∞ EX = x 2 f (x) dx − (EX )2 . −∞ Rachunek prawdopodobieństwa Wariancja z wcześniejszego przykładu D2X = = (−10−(−2, 5))2 ·1/2+(−5−(−2, 5))2 ·1/6+(0−(−2, 5))2 ·1/6+(20−( = 114, 58(3) drugim sposobem: D 2 X = (−10)2 ·1/2+(−5)2 ·1/6+(0))2 ·1/6+(20))2 ·1/6−(−2, 5)2 = = 114, 58(3) Rachunek prawdopodobieństwa Nierówność Czebyszewa Jeśli EX = m oraz D 2 X = σ 2 ∈ (0, ∞), to dla t > 0 mamy P(|X − m| ≥ t) ≤ σ2 . t2 Rachunek prawdopodobieństwa Słabe prawo wielkich liczb Niech X1 , X2 , . . . bedzie ˛ ciagiem ˛ niezależnych zmiennych losowych o tym samym rozkładzie, o wartości oczekiwanej m i odchyleniu standardowym σ. Wtedy dla każdego ε > 0 mamy lim P(| n→∞ X1 + X2 + . . . + Xn − m| < ε) = 1. n Rachunek prawdopodobieństwa Centralne Twierdzenie Graniczne Niech X1 , X2 , . . . bedzie ˛ ciagiem ˛ niezależnych zmiennych losowych o tym samym rozkładzie, o wartości oczekiwanej m i odchyleniu standardowym σ. Wtedy lim P( n→∞ X1 + X2 + . . . + Xn − nm √ < x) = Φ(x), σ n gdzie Φ oznacza dystrybuante˛ rozkładu normalnego N(0, 1). Rachunek prawdopodobieństwa Wartości wartości oczekiwanej i wariancji dla wybranych rozkładów rozkład zero-jedynkowy z prawdopodobieństwem p: EX = p, D 2 X = pq rozkład dwumianowy (p): EX = np D 2 X = npq rozkład Poissona z parametrem λ: EX = λ, D 2 X = λ rozkład jednostajny na [a, b]: EX = (a + b)/2, D 2 X = (b − a)2 /12 rozkład wykładniczy z parametrem λ: EX = 1/λ, D 2 X = 1/λ2 rozkład normalny N(m, σ): EX = m, D 2 X = σ 2 rozkład chi-kwadrat z n stopniami swobody: EX = n D 2 X = 2n Rachunek prawdopodobieństwa