Rachunek Prawdopodobieństwa Tomasz Bielaczyc Tomasz Bielaczyc Rachunek Prawdopodobieństwa P. Billingsley, Miara i prawdopodobieństwo, PWN, Warszawa 1997, T. Czechowski, Elementarny wykład rachunku prawdopodobieństwa, PWN, Warszawa 1979, J. Jakubowski, R. Sztencel, Rachunek prawdopodobieństwa dla prawie każdego, Script, Warszawa 2006, J. Jakubowski, R. Sztencel, Wstęp do teorii prawdopodobieństwa, Script, Warszawa 2010, L. Kubik, Rachunek prawdopodobieństwa, PWN, Warszawa 1980, A. Plucińska, E. Pluciński, Probabilistyka, Wyd. Naukowo-Techniczne, Warszawa 2000. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Definicja prawdopodobieństwa Definicja Doświadczenie, którego wyniku nie da się z góry przewidzieć i które daje się powtarzać w tych samych warunkach nazywamy doświadczeniem losowym. Zbiór zawierający wszystkie możliwe wyniki danego doświadczenia nazywamy zbiorem zdarzeń elementarnych. Zbiór zdarzeń elementarnych oznaczać będziemy symbolem Ω. Definicja Zdarzeniami są elementy pewnej rodziny F podzbiorów zbioru Ω będącej σ -ciałem, tzn. spełniającej warunki: (i) F 6= 0, / (ii) A ∈ F =⇒ A0 ∈ F , (iii) ∀n∈IN An ∈ F =⇒ S n∈IN An ∈ F . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Za doświadczenie losowe można uznać rzut (symetryczną) monetą. Możliwymi wynikami (zdarzeniami elementarnymi) będą wypadnięcie orła (O) lub reszki (R). Przestrzeń zdarzeń będzie postaci F = {{O, R}, {O}, {R}, 0}. / Jeśli jako doświadczenie rozważymy rzucanie monetą do momentu wypadnięcia orła, to za zdarzenia elementarne możemy uznać wszystkie możliwe ilości rzutów (czyli zbiór liczb naturalnych). Zdarzeniami będą wszystkie jego podzbiory. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Zdarzenie elementarne ω ∈ Ω może być traktowane jako zdarzenie, jeśli zbiór {ω} należy do F . Zbiór pusty reprezentuje zdarzenie niemożliwe, a zbiór Ω - zdarzenie pewne. Zdarzenie A0 = Ω \ A nazywamy zdarzeniem przeciwnym do zdarzenia A. Jeśli A ∩ B = 0, / to mówimy, że zdarzenia A i B się wykluczają. Jeśli A ⊆ B, to zdarzenie A pociąga zdarzenie B. Symbole A ∩ B oraz A ∩ B oznaczają, odpowiednio, koniunkcję i alternatywę zdarzeń. Przykładowo A ∩ B 0 oznacza, że zaszło A i nie zaszło B. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Definicja Funkcję IP : F → [0, 1] taką, że (i) IP(Ω) = 1, (ii) (An ∈ F dla n ∈ IN, Ai ∩ Aj = 0/ dla i 6= j) S ∞ =⇒ IP( ∞ n=1 An ) = ∑n=1 IP(An ). nazywamy prawdopodobieństwem. Definicja Trójkę (Ω, F , IP) nazywamy przestrzenią probabilistyczną, gdy F jest σ −ciałem oraz IP jest miarą probabilistyczną. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Rozważmy rzut monetą. Wówczas Ω = {O, R}, F = 2Ω oraz prawdopodobieństwo IP jest zadane: IP(Ω) = 1 , IP({O}) = 1 , 2 Tomasz Bielaczyc IP({R}) = 1 , 2 IP(0) / = 0. Rachunek Prawdopodobieństwa Twierdzenie Jeśli (Ω, F , IP) jest przestrzenią probabilistyczną oraz A, B ∈ F , to: I IP(A0 ) = IP(X ) − IP(A), I jeśli A ⊆ B, to IP(B \ A) = IP(B) − IP(A), I jeśli A ⊆ B, to IP(A) 6 IP(B), Twierdzenie Jeśli (Ω, F , IP) jest przestrzenią probabilistyczną oraz A1 , A2 , . . . ∈ F , to IP( ∞ [ ∞ An ) 6 n=1 ∑ IP(An ). n=1 Twierdzenie (Twierdzenie o ciągłości miary) Jeśli (Ω, F , IP) jest przestrzenią probabilistyczną oraz A1 , A2 , . . . ∈ F , to: I I S∞ = limn→∞ IP(An ), T∞ = limn→∞ IP(An ). jeśli An ⊆ An+1 dla n ∈ IN, to IP( jeśli An ⊇ An+1 dla n ∈ IN, to IP( Tomasz Bielaczyc n=1 An ) n=1 An ) Rachunek Prawdopodobieństwa Kombinatoryka Definicja Permutacją (bez powtórzeń) n-elementowego zbioru X nazywamy dowolny n-wyrazowy różnowartościowy ciąg o wyrazach z X . Zauważmy, że ilość permutacji zbioru n-elementowego wynosi Pn = n!. Przykład Ilość możliwych ustawień w kolejce 20 osób wynosi 20!. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Definicja Permutacją z powtórzeniami typu (n1 , . . . , nk ) zbioru złożonego z n elementów, gdzie n = n1 + . . . + nk , nazywamy każdy n-wyrazowy ciąg utworzony z elementów tego zbioru, w którym pewne elementy powtarzają się odpowiednio n1 , . . . , nk razy. Zauważmy, że ilość permutacji z powtórzeniami wynosi n ,...,n n! Pn 1 k = n1 !·...· n !. k Przykład Ilość możliwych ustawień liter aaabbbcccc wynosi Tomasz Bielaczyc 10! 3!·3!·4! . Rachunek Prawdopodobieństwa Definicja k-wyrazową wariacją (z powtórzeniami) n-elementowego zbioru X nazywamy dowolny k-wyrazowy ciąg o wyrazach z X . Zauważmy, że ilość k-wyrazowych wariacji ze zbioru n-elementowego wynosi Akn = nk . Przykład Ilość możliwych wyników dla 20-krotnego rzutu kostką wynosi 620 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Definicja k-wyrazową wariacją bez powtórzeń n-elementowego zbioru X nazywamy dowolny różnowartościowy k-wyrazowy ciąg o wyrazach z X . Zauważmy, że ilość k-wyrazowych wariacji bez powtórzeń ze zbioru n-elementowego wynosi Vnk = n · (n − 1) · . . . · (n − (k − 1)) = n! . (n − k)! Przykład Ilość możliwych przydziałów 1-go, 2-go i 3-go miejsca w 10-osobowej grupie zawodników wynosi (1010! −3)! . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Definicja k-wyrazową kombinacją (bez powtórzeń) z n-elementowego zbioru X nazywamy dowolny k-elementowy podzbiór X . Zauważmy, że ilość k-wyrazowych kombinacji ze zbioru n-elementowego wynosi n! n! n (n−k)! k = = . Cn = k! (n − k)!k! k Przykład Ilość możliwych wylosowań 3 osób z 10-osobowej grupy wynosi Tomasz Bielaczyc Rachunek Prawdopodobieństwa 10 3 . Definicja k-wyrazową kombinacją z powtórzeniami z n-elementowego zbioru X nazywamy dowolny wybór k elementów (niekoniecznie różnych) ze zbioru X. Na kombinację z powtórzeniami możemy patrzeć jak na rozmieszczanie k nierozróżnialnych elementów w n rozróżnialnych szufladach. Aby obliczyć ilość możliwych kombinacji z powtórzeniami możemy założyć, iż mamy k + (n − 1) elementów i n − 1 z nich zmieniamy w przegródki szuflad −1 możemy to zrobić na k+n sposobów. Zatem ilość kombinacji z n−1 powtórzeniami wynosi k +n−1 k Cn = . k Przykład Ilość możliwych podziałów 3 monet o jednakowym nominale pomiędzy 5 −1 osób wynosi 5+3 = 74 = 73 = 35. 5−1 Tomasz Bielaczyc Rachunek Prawdopodobieństwa Załóżmy, że Ω jest zbiorem skończonym, a wszystkie zdarzenia elementarne są jednakowo prawdopodobne. Zauważmy, że wówczas IP(A) = ∑ {i : ωI ∈A} IP({ωi }) = #A . #Ω W tak skonstruowanym klasycznym modelu zastosowanie mogą znaleźć wszystkie powyższe schematy kombinatoryczne. Przykład Obliczmy prawdopodobieństwo, że przy podziale 3 jednogroszówek pomiędzy 5 osób trafią one do trzech różnych osób. Ponieważ 2 #A = 53 = 10 oraz #Ω = 74 = 35, więc IP(A) = 10 35 = 7 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Można rozważyć ogólniejszy model dla skończonej ilości zdarzeń, w którym prawdopodobieństwo danego zdarzenia wynosi pi oraz ∑ pi = 1 (prawdopodobieństwa niekoniecznie są równo rozłożone). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Na zbiorze przeliczalnym możemy stworzyć model podobnie jak w modelu skończonym. Jeśli Ω = {ω1 , ω2 , . . .} oraz wszystkie ωi są zdarzeniami, to zbiory postaci A = {ωk1 , ωk2 , . . .} są zdarzeniami oraz IP(A) = ∑∞ i=1 pki . Zauważmy, że prawdopodobieństwa nie mogą być rozłożone równo. Przykład Rzucamy monetą do momentu wyrzucenia orła. Obliczmy prawdopodobieństwo, ze rzucimy mniej niż 5 razy. Niech ωn oznacza orła w n-tym rzucie (poprzedzonego n − 1 reszkami). Wówczas IP({ωn }) = 21n . Zatem dla A = {ω1 , . . . ω4 } mamy 4 IP(A) = 1 15 ∑ 2n = 16 . n=1 Tomasz Bielaczyc Rachunek Prawdopodobieństwa Prawdopodobieństwo geometryczne Definicja Niech Ω będzie podzbiorem IR, na którym określona jest miara µ (np. miara Lebesgue’a - miara przedziału równa się długości przedziału) oraz µ(Ω) < +∞. Wówczas wzór IP(A) = µ(A) µ(Ω) definiuje prawdopodobieństwo geometryczne. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Niech Ω = [0, 2]. Prawdopodobieństwo, że wylosowana z niego liczba 1 1 będzie pomiędzy 25 a 35 wynosi 25 = 10 . Zauważmy, że dla dowolnego “pojedynczego” punktu prawdopodobieństwo jego wylosowania wynosi 0. Przykład Niech Ω będzie kwadratem [0, 2] × [0, 2]. Prawdopodobieństwo, że wylosowany z niego punkt (x, y ) będzie taki, że x < y wynosi R2Ry 0 0 dxdy 4 = 2 4 = 1 2 (co jest zgodne z intuicją). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład (Zadanie Buffona) Igłę (odcinek) o długości l rzucamy na płaszczyznę pomiędzy proste równoległe oddalone o d > l . Obliczmy prawdopodobieństwo, że igła przetnie jedną z tych prostych. Niech x oznacza odległość środka igły od bliższej prostej (długość odcinka OP), a α - kąt, jaki tworzy igła z odcinkiem OP. Położenie igły względem prostej jest jednoznacznie określone przez parę liczb (x, α), gdzie 0 6 x 6 d2 , 0 6 α 6 π2 . Igła przetnie prostą, gdy x < 12 l cos α, a zatem szukane prawdopodobieństwo wynosi R π 2 0 R 1 2 l cos α 0 1 4 πd dxd α = Tomasz Bielaczyc π 2 1 0 2 l cos αd α 1 4 πd R = 2l . πd Rachunek Prawdopodobieństwa Przykład (Paradoks Bertranda) Spróbujmy obliczyć prawdopodobieństwo, że losowo wybrana cięciwa okręgu jest dłuższa niż bok trójkąta równobocznego wpisanego w ten okrąg. 1. Jeśli jeden koniec cięciwy umieszczony jest w jednym z wierzchołków trójkąta, to kąt który tworzy z wysokością trójkąta jest w przedziale (− π2 , π2 ). Cięciwa przetnie przeciwległy bok, gdy kąt ten będzie w przedziale (− π6 , π6 ). Zatem prawdopodobieństwo wynosi 13 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład (Paradoks Bertranda) Spróbujmy obliczyć prawdopodobieństwo, że losowo wybrana cięciwa okręgu jest dłuższa niż bok trójkąta równobocznego wpisanego w ten okrąg. 1. Jeśli jeden koniec cięciwy umieszczony jest w jednym z wierzchołków trójkąta, to kąt który tworzy z wysokością trójkąta jest w przedziale (− π2 , π2 ). Cięciwa przetnie przeciwległy bok, gdy kąt ten będzie w przedziale (− π6 , π6 ). Zatem prawdopodobieństwo wynosi 13 . 2. Jeśli cięciwa jest równoległa do któregoś boku trójkąta, to jest ona dłuższa od tego boku, gdy znajduje się między tym bokiem, a środkiem okręgu lub - symetrycznie - po drugiej stronie środka okręgu. Ponieważ odległość środka okręgu od boku wynosi połowę długości promienia okręgu, więc szukane prawdopodobieństwo wynosi 12 . Przykład ten pokazuje jak ważny (i czasem nieoczywisty) jest wybór modelu doświadczenia, czyli przestrzeni probabilistycznej. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Prawdopodobieństwo warunkowe Definicja Prawdopodobieństwo warunkowe zajścia zdarzenia A pod warunkiem zajścia zdarzenia B, gdzie IP(B) > 0, definiujemy wzorem IP(A|B) = IP(A ∩ B) IP(B). Łatwo sprawdzić, że przy ustalonym B, gdzie IP(B) > 0, powyższy wzór określa prawdopodobieństwo. Przykład Wiemy, że w trzykrotnym rzucie monetą wypadła nieparzysta liczba orłów (zdarzenie B). Obliczmy prawdopodobieństwo, iż trzy razy wypadł orzeł (zdarzenie A). Ponieważ IP(B) = 12 oraz IP(A ∩ B) = IP(A) = 81 , więc IP(A|B) = 1 8 1 2 = 14 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Ze wzoru na prawdopodobieństwo warunkowe otrzymujemy natychmiast wzór na prawdopodobieństwo iloczynu zdarzeń: IP(A ∩ B) = IP(A|B) · IP(B). Metodą indukcji matematycznej łatwo wykazać, że jeśli IP(A1 ∩ . . . ∩ An−1 ) > 0, to IP(A1 ∩ . . . ∩ An ) = IP(An |A1 ∩ . . . ∩ An−1 ) · . . . · IP(A2 |A1 ) · IP(A1 ). Przykład Z urny zawierającej 10 kul białych i 20 czarnych losujemy kolejno (bez zwracania) 3 kule. Obliczmy prawdopodobieństwo, że wylosowaliśmy 3 białe kule. Niech Ai będzie zdarzeniem polegającym na wylosowaniu 9 białej kuli w i-tym rzucie. Wówczas IP(A1 ) = 13 , IP(A2 |A1 ) = 29 oraz 8 IP(A3 |A1 ∩ A2 ) = 28 . Otrzymujemy IP(A1 ∩ A2 ∩ A3 ) = IP(A1 ) · IP(A2 |A1 ) · IP(A3 |A1 ∩ A2 ) = Tomasz Bielaczyc Rachunek Prawdopodobieństwa 1 9 8 · · . 3 29 28 Przykład (dylemat więźnia) Spośród trzech więźniów A, B, C skazanych na śmierć któryś ma zostać ułaskawiony. Więzień A zapytawszy strażnika który z pozostałych więźniów nie zostanie ułaskawiony otrzymał odpowiedź, że więzień C . Z faktu, iż ułaskawiony zostanie więzień A lub B wyciągnął wniosek, iż jego szanse na ułaskawienie wynoszą teraz 21 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład (dylemat więźnia) Spośród trzech więźniów A, B, C skazanych na śmierć któryś ma zostać ułaskawiony. Więzień A zapytawszy strażnika który z pozostałych więźniów nie zostanie ułaskawiony otrzymał odpowiedź, że więzień C . Z faktu, iż ułaskawiony zostanie więzień A lub B wyciągnął wniosek, iż jego szanse na ułaskawienie wynoszą teraz 21 . Sprawdźmy, czy miał rację. Zauważmy, że prawdopodobieństwo braku ułaskawienia więźnia A oraz wskazania przez strażnika więźnia C wynosi b ) = 1 · 1 + 1 · 0 = 1 , gdyż szansa wskazania więźnia C , gdy A ma IP(A0 ∩ C 3 3 3 być stracony wynosi albo 1, gdy obaj mają być straceni, albo 0, gdy A i B mają być straceni. Prawdopodobieństwo braku ułaskawienia więźnia A pod warunkiem, iż strażnik wskazał więźnia C wynosi zatem 0 b b ) = IP(A ∩ C ) = IP(A0 |C b) IP(C 1 3 1 2 2 = , 3 czyli zgodnie z intuicją - nie zmienia się po odpowiedzi strażnika. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Prawdopodobieństwo całkowite, wzór Bayesa Definicja Rodzinę zdarzeń wzajemnie wykluczających się, których suma jest zdarzeniem pewnym nazywamy rozbiciem przestrzeni Ω. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Do obliczania prawdopodobieństwa zdarzeń, które mogą zajść w wyniku realizacji innych zdarzeń stosujemy następujące: Twierdzenie (Wzór na prawdopodobieństwo całkowite) Jeśli {H1 , H2 , . . .} jest przeliczalnym rozbiciem Ω na zdarzenia o dodatnim prawdopodobieństwie, to dla dowolnego zdarzenia A zachodzi ∞ IP(A) = ∑ IP(A|Hn ) · IP(Hn ). n=1 Dowód. Ponieważ zbiory H1 , H2 , . . . są parami rozłączne, więc ∞ ∞ ∞ S IP(A) = IP (A ∩ Hn ) = ∑ IP(A ∩ Hn ) = ∑ IP(A|Hn ) · IP(Hn ). n=1 n=1 Tomasz Bielaczyc n=1 Rachunek Prawdopodobieństwa Przykład Jedna urna zawiera 4 białe i 2 czarne kule, druga 4 czarne i 2 białe. Szansa wybrania pierwszej urny (zdarzenie H1 ) jest dwa razy większa niż drugiej (zdarzenie H2 ). Z losowej urny losujemy kulę. Obliczmy prawdopodobieństwo wylosowania białej kuli (zdarzenie A). IP(A) = IP(A|H1 ) · IP(H1 ) + IP(A|H2 ) · IP(H2 ) = 2 2 1 1 5 · + · = . 3 3 3 3 9 Przykład Szansa wygranej w loterii (zdarzenie H1 ) wynosi p, szansa przegranej (zdarzenie H2 ) - q, a szansa na kolejną grę (zdarzenie H3 ) r = 1 − p − q. Obliczmy prawdopodobieństwo zdarzenia A - wygranej. IP(A) = IP(A|H1 ) · IP(H1 ) + IP(A|H2 ) · IP(H2 ) + IP(A|H3 ) · IP(H3 ) = p p = 1 · p + 0 · q + IP(A) · r , czyli IP(A) = = . 1−r p+q Tomasz Bielaczyc Rachunek Prawdopodobieństwa Znając ostateczny wynik doświadczenia możemy obliczyć prawdopodobieństwo dotyczące danego etapu stosując: Twierdzenie (Wzór Bayesa) Jeśli {H1 , H2 , . . .} jest przeliczalnym rozbiciem Ω na zdarzenia o dodatnim prawdopodobieństwie, to dla dowolnego zdarzenia A o dodatnim prawdopodobieństwie oraz dowolnego n ∈ IN zachodzi IP(Hn |A) = IP(A|Hn ) · IP(Hn ) . ∑∞ i=1 IP(A|Hi ) · IP(Hi ) Dowód. Korzystając ze wzorów na prawdopodobieństwo warunkowe, prawdopodobieństwo iloczynu zdarzeń oraz prawdopodobieństwo całkowite otrzymujemy IP(Hn |A) = IP(A ∩ Hn ) IP(A|Hn ) · IP(Hn ) = ∞ . IP(A) ∑i=1 IP(A|Hi ) · IP(Hi ) Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Jedna urna zawiera 4 białe i 2 czarne kule, druga 4 czarne i 2 białe. Szansa wybrania pierwszej urny jest dwa razy większa niż drugiej. Obliczmy prawdopodobieństwo, że losowano z drugiej urny wiedząc, że wylosowano białą kulę. IP(H2 |A) = IP(A|H2 ) · IP(H2 ) = IP(A|H1 ) · IP(H1 ) + IP(A|H2 ) · IP(H2 ) Tomasz Bielaczyc 2 3 · Rachunek Prawdopodobieństwa 1 1 3·3 2 1 3+3 · 13 1 = . 5 Przykład Pewien wirus występuje w jednym na tysiąc komputerów. Wykonujemy test, który poprawnie wykrywa wirusa w 99 ze 100 zainfekowanych komputerów (w 1 nie wykrywa) oraz błędnie wykrywa wirusa w 1 na 100 “zdrowych” komputerów. Test wykonany na losowym komputerze wypada pozytywnie. Jakie jest prawdopodobieństwo, że komputer ten faktycznie jest zawirusowany? Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Pewien wirus występuje w jednym na tysiąc komputerów. Wykonujemy test, który poprawnie wykrywa wirusa w 99 ze 100 zainfekowanych komputerów (w 1 nie wykrywa) oraz błędnie wykrywa wirusa w 1 na 100 “zdrowych” komputerów. Test wykonany na losowym komputerze wypada pozytywnie. Jakie jest prawdopodobieństwo, że komputer ten faktycznie jest zawirusowany? Niech A oznacza wystąpienie wirusa na badanym komputerze i niech B oznacza pozytywny wynik testu (wykrycie wirusa). Mamy IP(A) · IP(B|A) 0, 001 · 0, 99 = = IP(A) · IP(B|A) + IP(A0 ) · IP(B|A0 ) 0, 001 · 0, 99 + 0, 999 · 0, 01 0, 00099 0, 00099 = = ≈ 0, 09 0, 00099 + 0, 00999 0, 01098 IP(A|B) = Tomasz Bielaczyc Rachunek Prawdopodobieństwa Zdarzenia niezależne Definicja Zdarzenia A i B nazywamy niezależnymi, gdy IP(A ∩ B) = IP(A) · IP(B). Zauważmy, że I własność niezależności jest symetryczna, I zdarzenia rozłączne o dodatnich prawdopodobieństwach nigdy nie są niezależne, I jeśli zdarzenie ma zerowe prawdopodobieństwo, to jest niezależne z każdym innym zdarzeniem. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Z talii 52 kart losujemy jedną. Wylosowanie pika (zdarzenie A) jest niezależne od wylosowania asa (zdarzenie B), natomiast jest zależne od wylosowania czarnej karty (zdarzenie C ). Istotnie 1 1 1 1 1 oraz IP(A∩B) = , IP(A∩C ) = . IP(A) = , IP(B) = , IP(C ) = 4 13 2 52 2 Tomasz Bielaczyc Rachunek Prawdopodobieństwa Twierdzenie Jeśli IP(B) > 0, to zdarzenia A i B są niezależne, wtedy i tylko wtedy, gdy IP(A|B) = IP(A). Dowód. Wystarczy skorzystać z równości IP(A|B) = IP(A ∩ B) IP(B) oraz IP(A) · IP(B) = IP(A). IP(B) Przykład Losujemy jedną z 52 kart. Wylosowanie pika wynosi 14 , czyli tyle samo co wylosowanie pika pod warunkiem wylosowania asa (Podobnie 1 Wylosowanie asa wynosi 13 - tak samo jak asa pod warunkiem wylosowania pika). Zdarzenia te są zatem niezależne. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Definicja Zdarzenia A1 , . . . , An nazywamy niezależnymi, gdy IP(Ai1 ∩ . . . ∩ Aik ) = IP(Ai1 ) · . . . · IP(Aik ), gdzie 1 6 i1 < . . . < ik 6 n jest dowolnym ciągiem wskaźników. Przykład Rzucamy n razy kostką. Łatwo zauważyć, że zdarzenia polegające na wyrzuceniu szóstki w i-tym rzucie są niezależne dla różnych i. Przykład Niech A = B = {(x, y ) ∈ [0, 1]2 : x < y } oraz C = {(x, y ) ∈ [0, 1]2 : x < 12 }. Mamy IP(A ∩ B ∩ C ) = ale np. IP(A ∩ C ) = 1 8 6= 1 4 1 1 1 1 = · · = IP(A) · IP(B) · IP(C ), 8 2 2 2 = IP(A) · IP(C ) - A, B, C nie są niezależne. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Twierdzenie Jeśli zdarzenia A1 , . . . , An są niezależne, to zdarzenia B1 , . . . , Bn , gdzie Bi = Ai lub Bi = A0i , także są niezależne. Dowód. Załóżmy, że Bm = A0m dla pewnego m oraz Bi = Ai dla i 6= m. Niech C = Ai1 ∩ . . . ∩ Aik , gdzie 1 6 i1 < . . . < ik 6 n jest dowolnym ciągiem wskaźników różnych od m. Mamy IP(Ai1 ∩ . . . ∩ Aik ∩ A0m ) = IP(C ∩ A0m ) = IP(C \ (C ∩ Am )) = IP(C ) − IP(C ∩ Am ) = = IP(C ) · (1 − IP(Am )) = IP(C ) · IP(A0m ) = = IP(Ai1 ) · . . . · IP(Aik ) · IP(A0m ). Rozumowanie to możemy powtórzyć dla dowolnej ilości zbiorów Bi postaci A0i . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Rzucamy 2 razy kostką. Zdarzenia polegające na wyrzuceniu szóstki w 1-ym rzucie oraz wyrzuceniu od jeden do pięciu oczek w 2-im są niezależne. Definicja Zdarzenia A1 , A2 , . . . nazywamy niezależnymi, gdy dla każdego n ∈ IN zdarzenia A1 , . . . , An są niezależne. Przykład Rzucamy nieskończenie wiele razy kostką. Zdarzenia polegające na wyrzuceniu szóstki w i-tym rzucie są niezależne dla różnych i. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Schemat Bernoulliego Definicja Skończony ciąg niezależnych powtórzeń tego samego doświadczenia o dwu możliwych wynikach nazywamy schematem Bernoulliego. Możliwe wyniki pojedynczego zdarzenia oznaczymy jako 1 (sukces) oraz 0 (porażka). Niech prawdopodobieństwo sukcesu wynosi p (wówczas prawdopodobieństwo porażki wynosi 1 − p). Przestrzeń dla n powtórzeń jest postaci Ω = {(e1 , . . . , en ) : ei ∈ {0, 1}}. Zdarzeniami są wszystkie podzbiory Ω, czyli F = 2Ω . Prawdopodobieństwo otrzymania ustalonego ciągu k sukcesów i n − k porażek wynosi IP({e1 , . . . en }) = IP({e1 }) · . . . · IP({en }) = p k (1 − p)n−k , gdzie k = ∑ni=1 ei . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Twierdzenie Prawdopodobieństwo pojawienia się dokładnie k sukcesów w schemacie n prób Bernoulliego wynosi n k p (1 − p)n−k , k gdzie p oznacza prawdopodobieństwo sukcesu w pojedynczej próbie. Dowód. Wystarczy zauważyć, że na spośród n prób. n k sposobów można wybrać k sukcesów Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przestrzeń probabilistyczną, o której mowa w powyższym twierdzeniu można opisać w następujący sposób: ΩB = {0, . . . , n}, FB = 2ΩB oraz µB ({k}) = kn p k (1 − p)n−k . Przykład Rzucamy 10 razy kostką. Obliczmy prawdopodobieństwo, że co najmniej 8 razy wypadnie szóstka. Mamy ΩB = {0, . . . , 10} oraz 10 1 8 5 2 1 9 5 1 10 · + 10 · · + . µB ({8, 9, 10}) = · 8 6 6 6 6 6 Tomasz Bielaczyc Rachunek Prawdopodobieństwa Jeśli doświadczeń w schemacie Bernoulliego jest dużo, wygodnie jest, do podania przybliżonej wartości prawdopodobieństwa, użyć twierdzenia Poissona. Twierdzenie (Poissona) Jeśli n % ∞, pn & 0 oraz npn → λ , to k n k n→∞ λ pn (1 − pn )n−k −→ e −λ . k k! Dowód. Oznaczmy λn = npn . Mamy n k n! λk λn n λn −k pn (1 − pn )n−k = · nk · 1 − · 1− = k k!(n − k)! n n n λk n n−1 n−k +1 λn n λn −k = n · · · 1− ·...· · 1− k! n n n n n n →∞ n Ponieważ 1 − λnn −→ e −λ , więc teza twierdzenia zachodzi. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Pączki z danej firmy zawierają średnio po dwa rodzynki. Obliczmy szansę, że nasz pączek zawiera co najmniej jeden rodzynek. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Pączki z danej firmy zawierają średnio po dwa rodzynki. Obliczmy szansę, że nasz pączek zawiera co najmniej jeden rodzynek. Niech n oznacza ilość rodzynków. Wówczas ilość ciastek to n/2, a zatem dla każdego rodzynka prawdopodobieństwo, że znajduje się on na naszym ciastku wynosi p = 2/n. Stąd λ := np = 2. Zatem z twierdzenia Poissona IP(k > 1) = 1 − IP(k = 0) = 1 − e −2 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Lemat Borela-Cantellego Niech A1 , A2 , . . . będzie ciągiem zdarzeń. Zauważmy, że zdarzenie T S∞ A := ∞ n=1 k=n Ak oznacza, że zaszło nieskończenie wiele zdarzeń Ak . Oznaczmy S = ∑∞ k=1 IP(Ak ). Twierdzenie (Lemat Borela-Cantellego) 1. Jeśli S < ∞, to IP(A) = 0. 2. Jeśli S = ∞ oraz A1 , A2 , . . . są niezależne, to IP(A) = 1. Dowód. (1) Na podstawie twierdzenia o ciągłości miary mamy IP(A) = lim IP( n→∞ ∞ [ ∞ Ak ) 6 lim k=n Tomasz Bielaczyc ∑ IP(Ak ) = 0. n→∞ k=n Rachunek Prawdopodobieństwa Dowód. (2) Wystarczy pokazać, że IP(A0 ) = 0, czyli że IP( ∞ T ∞ S n=1 k=n W tym celu pokażemy, że IP( m T n ∈ IN. Niech Bm = k=n IP( ∞ \ ∞ T k=n A0k ) = 0. A0k ) = 0 dla każdego n ∈ IN. Ustalmy A0k dla m > n. Z twierdzenia o ciągłości miary, A0k ) = IP( ∞ \ k=n k=n Bk ) = lim IP(Bm ) = lim IP( m→∞ m→∞ m \ A0k ). k=n Z niezależności zdarzeń A1 , A2 , . . .wynika, że IP( ∞ T k=n IP( ∞ \ k=n m A0k ) = lim ∏ IP(A0k ). Z nierówności 1 − x 6 e −x wynika zatem, że m→∞ k=n A0k ) = lim m m exp ∏ (1−IP(Ak )) 6 mlim ∏ exp(−IP(Ak )) = mlim m→∞ →∞ →∞ k=n k=n ∞ ∞ T k=1 k=n Wobec założenia, iż ∑ IP(Ak ) = ∞, oznacza to, że IP( Tomasz Bielaczyc Rachunek Prawdopodobieństwa A0 k) = 0. m − ∑ IP(Ak ) k=n Przykład W urnie znajduje się biała i czarna kula. W k-tym ruchu losujemy jedną kulkę, zwracamy i dodajemy do urny 2k czarnych kulek. Ponieważ ∞ ∞ k=1 k=1 ∑ IP(B) = ∑ ( 21 )k = 1, więc z lematu Borela-Cantelliego (1) wynika, że prawdopodobieństwo wylosowania białej kuli nieskończenie wiele razy wynosi 0. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Rzucamy nieskończenie wiele razy kostką. Obliczmy prawdopodobieństwa, że szóstka wypadnie nieskończenie wiele razy. Ponieważ każdy rzut jest niezależny oraz prawdopodobieństwo szóstki w każdej próbie wynosi 1/6, więc ∑ IP({6}) = ∞. Zatem z lematu Borela-Cantelliego (2) wynika, że szóstka wypadnie nieskończenie wiele razy z prawdopodobieństwem 1. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Rzucamy nieskończenie wiele razy kostką. Obliczmy prawdopodobieństwa, że szóstka wypadnie nieskończenie wiele razy. Ponieważ każdy rzut jest niezależny oraz prawdopodobieństwo szóstki w każdej próbie wynosi 1/6, więc ∑ IP({6}) = ∞. Zatem z lematu Borela-Cantelliego (2) wynika, że szóstka wypadnie nieskończenie wiele razy z prawdopodobieństwem 1. Obliczmy prawdopodobieństwa, że ciąg 12345 pojawi się nieskończenie wiele razy. Ciągi pięciu losowań nie są parami niezależne. Możemy natomiast rozważyć jako zdarzenia rozłączne ciągi pięciu losowań. Wówczas ∑ IP({12345}) = ∑( 16 )5 = ∞, a zatem z lematu Borela-Cantelliego (2) wynika, że ciąg taki z prawdopodobieństwem 1 wypadnie nieskończenie wiele razy. Ciąg 12345 wśród wszystkich rzutów pojawi się co najmniej tyle samo razy. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Zmienne losowe Definicja Zmienną losową nazywamy funkcję mierzalną ξ : Ω → IR. Przykład Rozważmy rzut monetą. Wówczas Ω = {O, R}, F = 2Ω . Jeśli przez ξ oznaczymy ilość wyrzuconych reszek, to ξ (O) = 0, ξ (R) = 1. Zauważmy, że ξ jest F -mierzalna. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Definicja Rozkładem prawdopodobieństwa nazywamy każdą miarę probabilistyczną określoną na B(IR). Rozkładem prawdopodobieństwa zmiennej losowej ξ nazywamy miarę probabilistyczną µξ określoną na B(IR) taką, że µξ (B) = IP(ξ −1 (B)). Z definicji funkcji mierzalnej oraz własności przeciwobrazów wynika, że µξ jest poprawnie zdefiniowaną miarą probabilistyczną. Odwzorowanie ξ umożliwiło zatem transport prawdopodobieństwa z σ -ciała F na σ -ciało zbiorów borelowskich. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przyjmiemy oznaczenie IP(ξ ∈ B) = IP({ω ∈ Ω : ξ (ω) ∈ B}) = IP(ξ −1 (B)). Zauważmy, że dla zmiennych losowych równych p.n. (prawie na pewno, czyli z prawdopodobieństwem 1) rozkłady są nierozróżnialne. Przykład Dla rzutu monetą i zmiennej losowej ξ z poprzedniego przykładu mamy IP(ξ = 0) = 12 oraz IP(ξ = 1) = 12 . Czyli ogólnie µξ (B) = 1 1 · 1lB (0) + · 1lB (1) dla B ∈ B(IR). 2 2 Zauważmy, że możemy zdefiniować inną zmienną, np. oznaczającej ilość orłów, dla której rozkład będze taki sam. Zatem rozkład nie wyznacza jednoznacznie zmiennej losowej. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Definicja Mówimy, że zmienna losowa ξ ma rozkład dyskretny, gdy istnieje przeliczalny zbiór C ⊂ IR taki, że µξ (C ) = 1. Przykład Jeśli IP(ξ = a) = 1 dla pewnego a ∈ IR, czyli C = {a}, to zmienna losowa ξ ma rozkład jednopunktowy. Oznaczamy go symbolem δa . czyli δa (B) = 1lB (a) dla B ∈ B(IR) Przykład Jeśli C = {a, b} oraz IP(ξ = a) = p, IP(ξ = b) = 1 − p dla pewnego p ∈ (0, 1) to zmienna losowa ξ ma rozkład dwupunktowy. Przykładem rozkładu dwupunktowego jest rozkład dla rzutu monetą. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Rozkład łącznej liczby sukcesów w n doświadczeniach Bernoulliego nazywamy rozkładem dwumianowym (Bernoulliego) i oznaczamy B(n, p) przy ustalonym n ∈ IN, p ∈ [0, 1]. Mamy n k B(k, n, p) = IP(ξ = k) = p (1 − p)n−k dla k = 0, . . . , n. k Przykład Rozkład graniczny ciągu rozkładów B(n, pn ), gdzie n → ∞, npn → λ > 0, nazywamy rozkładem Poissona. Jest on przydatny przy szacowaniu zdarzeń rzadkich (np. wypadki drogowe, wygrane na loterii). Z twierdzenia Poissona, IP(ξ = k) = λ k −λ e k! Tomasz Bielaczyc dla k = 0, . . . , n. Rachunek Prawdopodobieństwa Zauważmy, że n n ∑ k pk (1 − p)n−k = (p + 1 − p)n = 1 k=0 λ k −λ e = e λ e −λ = 1, k! k=0 ∞ oraz ∑ czyli powyższe dwa przykłady faktycznie opisują rozkłady. Łatwo zauważyć, że rozkładem jest też: Przykład Rozkład czasu oczekiwania na pierwszy sukces w ciągu doświadczeń Bernoulliego nazywamy rozkładem geometrycznym. Dla p ∈ (0, 1) mamy IP(ξ = k) = (1 − p)k −1 p Tomasz Bielaczyc dla k = 1, 2, . . . . Rachunek Prawdopodobieństwa Gęstość Symbolem l 1 oznaczamy jednowymiarową miarę Lebesgue’a. Całkę Lebesgue’a względem miary Lebesgue’a z funkcji f po zbiorze A oznaczać będziemy Z f (x) dx. A Definicja Mówimy, że zmienna losowa ξ ma rozkład ciągły, gdy istnieje funkcja f : IR → IR taka, że Z µξ (A) = f (x) dx A dla A ∈ B(IR). Taką funkcję f nazywamy gęstością rozkładu µξ . Tomasz Bielaczyc Rachunek Prawdopodobieństwa (1) Twierdzenie Gęstość jest wyznaczona przez rozkład jednoznacznie z dokładnością do zbiorów miary Lebesgue’a zero. Dowód. Niech f1 , f2 będą gęstościami tego samego rozkładu µ. Oznaczmy B = {x ∈ IR : f1 (x) − f2 (x) > 0} oraz Bk = {x ∈ IR : f1 (x) − f2 (x) > 1 }. k Dla k ∈ IN mamy 0 = µ(Bk )− µ(Bk ) = Z f1 (x) dx − Bk Z f2 (x) dx = Z Bk Stąd l 1 (Bk ) = 0, a zatem l 1 (B) = l 1 ( Bk ∞ S 1 (f1 (x) − f2 (x)) dx > l 1 (Bk ). k Bk ) = 0. k=1 Tomasz Bielaczyc Rachunek Prawdopodobieństwa Jeśli f jest gęstością rozkładu µ, to 1 f (x) dx 6 − l 1 (Ak ), k Ak gdzie Ak = x ∈ IR : f (x) < − k1 . Stąd ! 0 6 µ(Ak ) = Z l 1 ({x ∈ IR : f (x) < 0}) = l 1 ∞ [ Ak = 0, k=1 a zatem jest ona nieujemna p.w. (wzgl. miary Lebesgue’a). Ponadto oczywiście Z ∞ f (x) dx = 1. −∞ Odwrotnie, jeśli funkcja f jest nieujemna p.w. i całka po IR wynosi 1, to z własności całki Lebesgue’a wynika, że jest ona gęstością rozkładu zdefiniowanego wzorem (1). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Gdy gęstość f jest stała w przedziale [a, b], czyli 1 x ∈ [a, b], b −a , f (x) = 0, x ∈ / [a, b], to mówimy, że zmienna ma rozkład jednostajny (prostokątny) na przedziale [a, b]. Zauważmy, że dla [c, d ] ⊆ [a, b] mamy IP(ξ ∈ [c, d ]) = Z c d 1 d −c dx = , b−a b−a czyli µξ jest prawdopodobieństwem geometrycznym na [a, b]. Jeśli powyższą funkcję zmodyfikujemy kładąc np. f (c) = 1 dla pewnego c ∈ IR, nadal będzie ona gęstością rozkładu jednostajnego na [a, b]. Wygodnie jednak jako rozpatrywane gęstości brać funkje w możliwie najprostszej postaci. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Gdy f jest postaci f (x) = λ e −λ x · 1l(0,∞) (x) dla pewnego λ > 0, to mówimy, że zmienna ma rozkład wykładniczy z parametrem λ . Zauważmy, że f > 0 oraz Z +∞ −∞ ∞ f (x) dx = −e −λ x = 1, 0 czyli f faktycznie jest gęstością. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Dystrybuanta Definicja Funkcję Fξ : IR → IR daną wzorem Fξ (t) = IP(ξ 6 t) nazywamy dystrybuantą zmiennej losowej ξ . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Jeśli ξ oznaczymy ilość orłów wyrzuconych w pojedynczym rzucie monetą, to dystrybuanta ma postać 0, t < 0 Fξ (t) = 1 2, 0 6 t < 1 1, 1 6 t. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Dystrybuanta rozkładu Poissona jest postaci t <0 0 F (t) = [t] k ∑ λk! e −λ , 0 6 t. k=0 Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Ponieważ dla gęstości f rozkładu jednostajnego zachodzi Z t −∞ f (x) dx = Z a t 1 t −a dx = b−a b−a dla t ∈ (a, b), więc dystrybuanta jest postaci F (t) = 0, t −a b −a 1, Tomasz Bielaczyc t <a , a6t <b b 6 t. Rachunek Prawdopodobieństwa Przykład Jeśli ξ ma rozkład wykładniczy z parametrem λ , to dystrybuanta jest postaci 0, t <0 Fξ (t) = 1 − e −λ t , 0 6 t. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Twierdzenie Jeśli F jest dystrybuantą pewnej zmiennej losowej, to spełnia następujące warunki: 1. F jest niemalejąca, 2. lim F (t) = 0 oraz lim F (t) = 1, t →−∞ t →∞ 3. F jest prawostronnie ciągła. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Dowód. Warunek (1) wynika wprost z definicji dystrybuanty. Niech tn będzie dowolnym ciągiem liczbowym malejącym do −∞. Wówczas ciąg przedziałów (−∞, tn ] jest zstępujący, a ich przekrój jest zbiorem pustym. Z twierdzenia o ciągłości miary otrzymujemy lim F (tn ) = lim IP(ξ −1 ((−∞, tn ])) = lim µξ ((−∞, tn ])) = µξ (0) / = 0. tn →−∞ tn →−∞ tn →−∞ Podobnie można pokazać drugą równość warunku (2). Dla tn & t, z twierdzenia o ciągłości miary mamy lim F (tn ) = F (t), tn → t więc warunek (3) także jest spełniony. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Z definicji dystrybuanty wynika, że rozkład jednoznacznie określa dystrybuantę. Można wykazać, że funkcja spełniająca warunki (1)-(3) jest dystrybuantą związaną z pewnym rozkładem oraz, że rozkład ten jest zadany przez tę funkcję w sposób jednoznaczny. Zatem mając daną dystrybuantę możemy obliczyć prawdopodobieństwo. Przykładowo wprost z definicji dystrybuanty wynika, że IP(ξ ∈ (a, b]) = Fξ (b) − Fξ (a). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Ponieważ ! 1 1 1 IP(ξ < t)=IP ξ ∈ −∞, t − = lim IP ξ ∈ −∞, t − = lim Fξ t − n→∞ n→∞ n n n n=1 ∞ [ więc 1 . IP(ξ = t) = IP(ξ 6 t) − IP(ξ < t) = Fξ (t) − lim Fξ t − n→∞ n Wynika stąd, że jeśli dystrybuanta Fξ jest ciągła w punkcie t ∈ IR, to IP(ξ = t) = 0. Jeśli natomiast ma ona w punkcie t ∈ IR skok o wielkości d , to IP(ξ = t) = d . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Prom kursuje ze stałą prędkością pomiędzy portami A i B oddalonymi od siebie o 5 kilometrów. W porcie A spędza 0, 1 czasu każdej podróży oraz 0, 2 w porcie B. Niech ξ oznacza odległość promu od A. Wyznaczmy dystrybuantę zmiennej losowej ξ . 2 1 , IP(ξ = 5) = 10 oraz IP(ξ = a) = 0 dla Zauważmy, że IP(ξ = 0) = 10 a ∈ (0, 1). Mamy F (t) = 0, t <0 0, 1 + 0k,7 t, 0 6 t < k 1, k 6 t. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Z definicji gęstości i dystrybuanty wynika natychmiast, że dla danej gęstości f dystrybuanta jest postaci F (t) = Z t f (x) dx. −∞ Z ciągłości miary wynika, że gdy dystrybuanta nie jest ciągła, to gęstość nie istnieje. Można wykazać, że jeśli F jest dystrybuantą, F 0 istnieje p.w. oraz Z ∞ F 0 (t) dt = 1, −∞ to F 0 jest gęstością rozkładu o dystrybuancie F . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Znajdźmy gęstość dla dystrybuanty danej wzorem 0, t < 0 F (t) = t, 0 6 t < 1 1, 1 6 t. Zauważmy, że F jest ciągłą dystrybuantą. Poza punktami 0 i 1 pochodna istnieje i wynosi F 0 (t) = 1 dla t ∈ (0, 1), F 0 (t) = 0 dla t ∈ IR \ [0, 1]. R∞ Gęstość jest więc postaci f (x) = 1l(0,1) (x) oraz −∞ f (x) = 1. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Funkcje zmiennych losowych Łatwo zauważyć, że jeśli ξ : Ω → IR jest zmienną losową o rozkładzie dyskretnym oraz ϕ : IR → IR jest funkcją mierzalną, to ζ = ϕ(ξ ) jest zmienną losową o rozkładzie dyskretnym. Przykład Niech ξ będzie zmienną losową przyjmującą każdą z wartości −2, −1, 0, 1, 2, 3 z prawdopodobieństwem 16 . Zmienna losowa ξ 2 przyjmuje wartości 0 i 9 z prawdopodobieństwem 16 oraz wartości 1 i 4 z prawdopodobieństwem 13 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Niech ξ będzie zmienną losową o rozkładzie IP(ξ = 0) = 15 , IP(ξ = 1) = 54 . Wyznaczmy rozkład zmiennej losowej 1 ζ = 4ξ + 1. Ponieważ ξ = ζ − 4 , więc 1 ζ −1 = IP(ξ = 0) = IP = 0 = IP(ζ = 1), 5 4 ζ −1 4 = IP(ξ = 1) = IP = 1 = IP(ζ = 5) 5 4 Tomasz Bielaczyc Rachunek Prawdopodobieństwa Jeśli ξ jest zmienną o rozkładzie ciągłym, to ϕ(ξ ) nie musi być ciągła. Przykład Niech ξ będzie zmienną losową o rozkładzie jednostajnym na przedziale [0, 2] i niech ϕ = 1l[0,1] . Zmienna losowa ϕ(ξ ) przyjmuje wartości 0 i 1 z prawdopodobieństwem 12 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Twierdzenie Niech ξ będzie zmienną losową o gęstości fξ i niech ϕ : IR → IR będzie funkcją silnie monotoniczną klasy C 1 . Zmienna losowa η = ϕ(ξ ) ma gęstość postaci fη (x) = fξ (ϕ −1 (x)) · |(ϕ −1 )0 (x)|. Dowód. Stosując zamianę zmiennych otrzymamy Fη (t) = IP(ϕ(ξ ) 6 t) = IP(ξ ∈ ϕ Z t = −∞ −1 (−∞, t]) = Z ϕ −1 ((−∞,t]) fξ (ϕ −1 (x)) · |(ϕ −1 )0 (x)| dx. Zatem gęstość zmiennej η jest postaci fη (x) = fξ (ϕ −1 (x)) · |(ϕ −1 )0 (x)|. Tomasz Bielaczyc Rachunek Prawdopodobieństwa fξ (x) dx = Niech ξ będzie zmienną losową typu ciągłego o gęstości fξ i dystrybuancie Fξ . Znajdźmy gęstość i dystrybuantę zmiennej losowej ζ = aξ + b. Mamy t −b t −b = Fξ dla a > 0, Fζ (t) = IP(aξ + b 6 t) = IP ξ 6 a a t −b t −b Fζ (t) = IP(aξ + b 6 t) = IP ξ > = 1 − Fξ dla a < 0. a a W ostatniej równości skorzystaliśmy z ciągłości Fξ . W każdym punkcie ciągłości funkcji fξ funkcja Fξ jest różniczkowalna. Zatem Fζ także jest różniczkowalna w tych punktach i mamy d x −b 1 x −b fζ (x) = Fζ0 (x) = Fξ = fξ dla a > 0, dx a a a d 1 x −b x −b fζ (x) = Fζ0 (x) = − Fξ = fξ dla a < 0, dx a −a a czyli ogólnie fζ (x) = 1 f |a| ξ x −b a Tomasz Bielaczyc dla a 6= 0. Rachunek Prawdopodobieństwa Wartość oczekiwana Niech (Ω, F , IP) będzie przestrzenią probabilistyczną, a ξ : Ω → IR zmienną losową. Definicja Wartością oczekiwaną (wartością średnią) zmiennej losowej ξ nazywamy liczbę Z Eξ = ξ (ω)IP(d ω), Ω o ile całka ta jest bezwzględnie zbieżna. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Zauważmy, że E 1lA = IP(A). Z własności całki wynika natychmiast, że jeśli E ξ oraz E ζ istnieją, to dla a, b ∈ IR istnieje E (aξ + bζ ) oraz E (aξ + bζ ) = aE ξ + bE ζ . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Zauważmy, że jeśli zmienna losowa ξ ma rozkład dyskretny skupiony w punktach {x1 , x2 , . . .}, to wartość oczekiwana jest postaci ∞ Eξ = ∑ xn p n , n=1 gdzie pn := IP(ξ = xn ). Przykład Obliczmy wartość oczekiwaną sumy oczek wyrzuconych w dwukrotnym rzucie kostką. Mamy ! 6 42 1 E (ξ + ζ ) = E ξ + E ζ = 2 · ∑ k · = = 7. 6 6 k=1 Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Obliczmy wartość oczekiwaną zmiennej losowej o rozkładzie Bernoulliego n k B(k, n, p) = IP(ξ = k) = p (1 − p)n−k dla k = 0, . . . , n. k Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Obliczmy wartość oczekiwaną zmiennej losowej o rozkładzie Bernoulliego n k B(k, n, p) = IP(ξ = k) = p (1 − p)n−k dla k = 0, . . . , n. k Niech q = 1 − p. Mamy n n k n−k n k n−k n−1 n = ∑k = ∑ (k + 1) p q p q p k+1 q n−k −1 = k k k + 1 k=0 k=1 k=0 n−1 n−1 (k + 1)n! n − 1 k n−1−k = ∑ p k+1 q n−k −1 = np ∑ p q = k k=0 (k + 1)!(n − k − 1)! k=0 n Eξ = ∑k = np(p + q)n−1 = np. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Obliczmy wartość oczekiwaną zmiennej losowej o rozkładzie Poissona IP(ξ = k) = λ k −λ e k! Tomasz Bielaczyc dla k = 0, 1, . . . . Rachunek Prawdopodobieństwa Przykład Obliczmy wartość oczekiwaną zmiennej losowej o rozkładzie Poissona IP(ξ = k) = λ k −λ e k! dla k = 0, 1, . . . . Mamy ∞ Eξ = λk ∞ λ k −1 λk = e −λ λ e λ = λ . k=0 k! ∞ ∑ k k! e −λ = e −λ λ ∑ (k − 1)! = e −λ λ ∑ k=0 k=1 Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Obliczmy wartość oczekiwaną zmiennej losowej o rozkładzie geometrycznym. IP(ξ = k) = (1 − p)k −1 p dla k = 1, 2, . . . . Mamy ∞ Eξ = p ∑ k(1 − p)k −1 p = p + k=1 (1 − p)p (1 − p)2 p 1 1 + +... = = . p p 1 − (1 − p) p Tomasz Bielaczyc Rachunek Prawdopodobieństwa Zauważmy, że jeśli ξ ma rozkład dyskretny oraz ϕ : IR → IR jest funkcją mierzalną, to ∞ E ϕ(ξ ) = ∑ ϕ(xn )pn . n=1 Przykład Obliczmy wartość oczekiwaną kwadratów liczby oczek wyrzuconych w pojedynczym rzucie kostką. Mamy 6 Eζ = 1 ∑ k2 · 6 = k=1 Tomasz Bielaczyc 91 . 6 Rachunek Prawdopodobieństwa Podobnie, dla zmiennych losowych ciągłych można wykazać następujący fakt: Jeśli zmienna losowa ξ ma rozkład ciągły o gęstości f , a ϕ : IR → IR jest funkcją borelowską, to E ϕ(ξ ) = Z ϕ(x)f (x)dx. IR Z powyższego wynika w szczególności, że jeśli zmienna losowa ξ ma gęstość f , to Z Eξ = xf (x)dx. IR Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Obliczmy wartość oczekiwaną zmiennej losowej o rozkładzie jednostajnym na przedziale [a, b], czyli 1 x ∈ [a, b], b −a , f (x) = 0, x ∈ / [a, b], Mamy Eξ = x b 2 − a2 (b − a)(b + a) b + a dx = = = . 2(b − a) 2(b − a) 2 [a,b] b − a Z Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Obliczmy wartość oczekiwaną zmiennej losowej o rozkładzie wykładniczym z parametrem λ tzn. f (x) = λ e −λ x · 1l(0,∞) (x) Mamy Z Z ∞ xλ e −λ x dx xλ e · 1l(0,∞) (x) dx = 0 Z ∞ x −λ x ∞ 1 −λ x =λ e e dx − −λ 0 0 −λ Z ∞ −λ e x ∞ 1 = e −λ x dx = = −λ 0 λ 0 Eξ = −λ x IR Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład 1 Funkcja f (x) = π1 1+x 2 jest gęstością zmiennej losowej o rozkładzie Cauchy’ego. Ponieważ x = 2 −∞ 1 + x Z ∞ Z ∞ −∞ 1 2 dt t = ∞ 1 ln |t| = ∞ − ∞, 2 −∞ więc wartość oczekiwana tej zmiennej losowej nie istnieje. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Wariancja Niech m = E ξ . Wówczas E (ξ −m) = Z Z Z ξ (ω)IP(d ω)− (ξ (ω)−m)IP(d ω) = Ω Ω mIP(d ω) = E ξ −m = 0 Ω oraz E (ξ − m)2 = E ξ 2 − 2mξ + m2 = E ξ 2 − 2mE ξ + Em2 = E ξ 2 − m2 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Wariancja Niech m = E ξ . Wówczas E (ξ −m) = Z Z Z ξ (ω)IP(d ω)− (ξ (ω)−m)IP(d ω) = mIP(d ω) = E ξ −m = 0 Ω Ω Ω oraz E (ξ − m)2 = E ξ 2 − 2mξ + m2 = E ξ 2 − 2mE ξ + Em2 = E ξ 2 − m2 . Definicja Załóżmy, że istnieje wartość oczekiwana m zmiennej losowej ξ . Wariancją nazywamy wartość D 2 ξ = E (ξ − m)2 = E ξ 2 − m2 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Jeśli zmienna losowa ma gęstość f , to zachodzi równość D 2ξ = Z (x − m)2 f (x)dx. IR Jeśli natomiast zmienna losowa ξ ma rozkład dyskretny skoncentrowany na zbiorze punktów {x1 , x2 , . . .} i wartość oczekiwaną m, to wariancja jest postaci D 2ξ = ∞ ∑ (xn − m)2 pn , n=1 gdzie pn := IP(ξ = xn ). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Dla dowolnej stałej c, I D 2 c = c 2 − c 2 = 0, I D 2 (cξ ) = E (c 2 ξ 2 ) − (E (cξ ))2 = c 2 E (ξ 2 ) − c 2 (E ξ )2 = c 2 (E (ξ 2 ) − (E ξ )2 ) = c 2 D 2 ξ , I D 2 (ξ + c) = E (ξ + c)2 − (E ξ + c)2 = E ξ 2 + 2E (cξ ) + c 2 − (E ξ )2 − 2cE ξ − c 2 = E ξ 2 − (E ξ )2 = D 2 ξ . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Rzucamy monetą. Niech ξ oznacza wygraną 1 złotego w przypadku wypadnięcia orła lub straty 1 złotego, gdy wypadnie reszka. Wówczas D 2 ξ = E ξ 2 − m2 = 1 − 0 = 1. Niech ζ oznacza wygraną 20 złotych, gdy wypadnie orzeł i przegraną 20 złotych, gdy wypadnie reszka. Wówczas D 2 ζ = 202 · D 2 ξ = 400. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Załóżmy, że ξ ma rozkład jednopunktowy, czyli IP(ξ = a) = 1. Wówczas D 2 ξ = a2 − a2 = 0. Zachodzi także implikacja odwrotna. Załóżmy, że D 2 ξ = 0 i oznaczmy A = {ω ∈ Ω : ξ (ω) = m}. Wówczas 0 = D 2 (ξ ) = Z (ξ (ω) − m)2 IP(d ω) = Ω Z Ω\A (ξ (ω) − m)2 IP(d ω). Zatem IP(Ω \ A) = 0 oraz IP(A) = 1. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Jeśli ξ ma rozkład dwupunktowy, IP(ξ = 1) = p, IP(ξ = 0) = q, to wariancja wynosi D 2 ξ = p − p 2 = p(1 − p) = pq. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Czasem licząc wariancję wygodnie jest skorzystać z tożsamości E ξ 2 − m2 = E (ξ (ξ − 1)) − m(m − 1). Przykład Obliczmy wariancję zmiennej losowej o rozkładzie Bernoulliego. Mamy n n n! n k n−k p q = ∑ k(k − 1) p k q n−k = E (ξ (ξ − 1)) = ∑ k(k − 1) k k!(n − k)! k=2 k=0 n = n(n − 1)p 2 (n − 2)! ∑ (k − 2)!(n − k)! pk −2 q(n−2)−(k −2) = k=2 = n(n − 1)p 2 n−2 ∑ k=0 n − 2 k n−2−k p q = n(n − 1)p 2 . k Stąd i z równości m = np otrzymujemy D 2 ξ = n(n − 1)p 2 − np(np − 1) = np − np 2 = npq. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Obliczmy wariancję zmiennej losowej o rozkładzie Poissona. Mamy λk ∞ E (ξ (ξ − 1)) = ∞ λ k −2 ∑ k(k − 1) k! e −λ = e −λ λ 2 ∑ (k − 2)! k=0 k=2 λk = e −λ λ 2 e λ = λ 2 . = e −λ λ 2 ∑ k=0 k! ∞ Stąd i z równości m = λ otrzymujemy D 2 ξ = λ 2 − λ (λ − 1) = λ . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Obliczmy wariancję zmiennej losowej o rozkładzie jednostajnym na przedziale [a, b]. Mamy m = b+a 2 oraz Eξ2 = x2 b 3 − a3 (b − a)(b 2 + ab + a2 ) b 2 + ab + a2 dx = = = . 3(b − a) 3(b − a) 3 [a,b] b − a Z Zatem D 2 ξ = E ξ 2 − m2 = 4(b 2 + ab + a2 ) − 3(b 2 + 2ab + a2 ) (a − b)2 = . 12 12 Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Obliczmy wariancję zmiennej losowej o rozkładzie wykładniczym z parametrem λ , czyli o gęstości f (x) = λ e −λ x · 1l(0,∞) (x) Mamy m = Eξ = Z ∞ 0 xλ e −λ x dx = 1 λ oraz Eξ2 = Z ∞ 0 Zatem D 2 ξ = ∞ Z 2 ∞ 2 x 2 λ e −λ x dx = −x 2 e −λ x + λ xe −λ x dx = 2 . λ 0 λ 0 1 λ2 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Momenty, nierówność Czebyszewa Definicja Dla k ∈ {0, 1, . . .} wartość oczekiwaną zmiennej losowej ξ k nazywamy k-tym momentem zmiennej losowej ξ . Momentem centralnym nazywamy wartość oczekiwaną zmiennej losowej (ξ − m)k , a momentem bezwzględnym - wartość oczekiwaną zmiennej losowej |ξ |k . Zauważmy, że wartość oczekiwana jest pierwszym momentem, a wariancja jest drugim momentem centralnym Tomasz Bielaczyc Rachunek Prawdopodobieństwa Twierdzenie (Nierówność Czebyszewa) Załóżmy, że zmienna losowa ξ jest nieujemna. Dla ε > 0, k ∈ IN zachodzi IP(ξ > ε) 6 Eξk . εk Dowód. Wystarczy zauważyć, że Z Ω ξ k IP(d ω) > Z {ω : ξ >ε} ε k IP(d ω) = ε k · IP({ω : ξ (ω) > ε}). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Wniosek Jeśli ξ ma skończoną wartość oczekiwaną, to dla dowolnego ε > 0 zachodzi D 2ξ IP(|ξ − m| > ε) 6 2 . ε Definicja Liczbę σ = losowej ξ . p D 2 ξ nazywamy odchyleniem standardowym zmiennej Wniosek Załóżmy, że m jest skończone oraz σ ∈ (0, ∞). Dla dowolnego c > 0 zachodzi 1 IP(|ξ − m| > cσ ) 6 2 . c Tomasz Bielaczyc Rachunek Prawdopodobieństwa Z powyższego wniosku wynika, że dla dowolnej zmiennej losowej ξ o skończonej wartości oczekiwanej i wariancji zachodzi na przykład 8 IP(ξ ∈ (m − 3σ , m + 3σ )) > , 9 24 . 25 Powyższe twierdzenie sformułowane jest dla zmiennej losowej o dowolnym rozkładzie, czyli bardzo ogólnie, jednak oszacowanie jest dosyć grube. IP(ξ ∈ (m − 5σ , m + 5σ )) > Tomasz Bielaczyc Rachunek Prawdopodobieństwa Zmienne losowe wielowymiarowe Rozważmy zmienne losowe ξ1 , ξ2 : Ω → IR. Definicja Odwzorowanie ξ = (ξ1 , ξ2 ) : Ω → IR 2 nazywamy wektorem losowym. Rozkładem prawdopodobieństwa wektora losowego ξ o wartościach w IR 2 nazywamy rozkład prawdopodobieństwa µξ taki, że µξ (B) = IP(ξ −1 (B)) dla B ∈ B(IR 2 ). Rozkład ten mówi w szczególności o prawdopodobieństwie zajścia zdarzenia {ξ1 ∈ B1 , ξ2 ∈ B2 }. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Definicja Mówimy, że wektor losowy ξ = (ξ1 , ξ2 ) ma rozkład dyskretny, gdy istnieje przeliczalny zbiór C ⊂ IR 2 taki, że µξ (C ) = 1. Mówimy, że wektor losowy ξ ma rozkład ciągły, gdy istnieje funkcja f : IR 2 → IR taka, że Z µξ (A) = f (x, y ) dxdy A dla A ∈ B(IR 2 ). Taką funkcję f nazywamy gęstością rozkładu µξ . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Podobnie, jak w przypadku jednowymiarowym, gęstość jest wyznaczona jednoznacznie z dokładnością do zbiorów miary zero. Funkcja f : IR 2 → IR jest gęstością wtedy i tylko wtedy, gdy jest nieujemna p.w. oraz Z IR 2 f (x, y ) dxdy = 1. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Definicja Funkcję Fξ : IR 2 → IR daną wzorem Fξ (t, s) = IP(ξ1 6 t, ξ2 6 s) nazywamy dystrybuantą wektora losowego ξ = (ξ1 , ξ2 ). Podobnie, jak w przypadku jednowymiarowym, dystrybuanta F spełnia własności: 1. F jest niemalejąca ze względu na każdą ze zmiennych (przy ustalonej wartości drugiej zmiennej), 2. F (t, s) → 0, gdy t lub s zmierza do − ∞, F (t, s) → 1, gdy t oraz s zmierza do ∞. 3. F jest prawostronnie ciągła. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Ponadto można pokazać, że zachodzi: 4. t1 6 t2 , s1 6 s2 =⇒ F (t2 , s2 ) − F (t2 , s1 ) − F (t1 , s2 ) + F (t1 , s1 ) > 0. Z definicji dystrybuanty wynika, że rozkład określa dystrybuantę. Funkcja F spełniająca warunki (1)−(4) jest dystrybuantą pewnego rozkładu na IR 2 . Podobnie, jak w przypadku jednowymiarowym, rozkład ten jest zadany przez dystrybuantę w sposób jednoznaczny. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Produkt miar Definicja Niech (X , F ), (Y , G ) będą przestrzeniami mierzalnymi. Rodzinę zbiorów {A × B : A ∈ F , B ∈ G } nazywamy rodziną prostokątów mierzalnych. Symbolem F ⊗ G oznaczamy najmniejsze σ -ciało w X × Y zawierające wszystkie prostokąty mierzalne. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Definicja Dla danego zbioru E ⊆ X × Y oraz punktu x ∈ X cięciem zbioru E wzdłuż punktu x nazywamy zbiór Ex = {y ∈ Y : (x, y ) ∈ E }. Przykład Gdy E = A × B, to Ex = B dla x ∈ A oraz Ex = 0/ dla x ∈ A0 Przykład √ √ Gdy E = {(x, y ) ∈ IR 2 : x 2 + y 2 < 4}, to Ex = (− 4 − x 2 , 4 − x 2 ) dla |x| < 2. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Lemat Jeżeli E ∈ F ⊗ G , x ∈ X , to Ex ∈ G . Dowód. Rodzina S takich zbiorów E z rodziny F ⊗ G , dla których Ex ∈ G dla x ∈ X , jest σ -ciałem. Istotnie, zauważmy, że Ex0 = (Ex )0 oraz [ n∈IN En x = [ Exn . n∈IN Jeżeli E = A × B, to Ex = B dla x ∈ A oraz Ex = 0/ dla x ∈ A0 . Wynika stąd, że S zawiera wszystkie prostokąty mierzalne, a zatem S = F ⊗G Tomasz Bielaczyc Rachunek Prawdopodobieństwa Dla danej funkcji f : X × Y → IR oraz punktu x ∈ X symbolem fx oznaczamy funkcję na Y daną wzorem fx (y ) = f (x, y ) dla y ∈ Y . Wniosek Jeżeli f jest funkcją F ⊗ G -mierzalną, to fx jest G -mierzalna. Dowód. Wystarczy zauważyć, że fx−1 (D) = {y ∈ Y : f (x, y ) ∈ D} = {y ∈ Y : (x, y ) ∈ f −1 (D)} = (f −1 (D))y dla D ∈ B(IR). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Twierdzenie (o produkcie miar) Niech (X , F1 , µ1 ) oraz (Y , F2 , µ2 ) będą przestrzeniami probabilistycznymi. Istnieje dokładnie jedna miara probabilistyczna µ : F1 ⊗ F2 → IR+ taka, że µ(A × B) = µ1 (A) · µ2 (B) dla A ∈ F1 , B ∈ F2 . Miarę zdefiniowaną w powyższym twierdzeniu nazywamy miarą produktową i oznaczamy µ = µ1 ⊗ µ2 . Twierdzenie Zachodzi równość (IR 2 , B(IR 2 ), b2 ) = (IR × IR, B(IR) ⊗ B(IR), b1 ⊗ b1 ). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Twierdzenie (Fubiniego) Niech (X , F1 , µ1 ), (Y , F2 , µ2 ) będą przestrzeniami z miarami probabilistycznymi. Jeśli f : X × Y → IR+ jest funkcją F1 ⊗ F2 -mierzalną, to funkcja Z fx (y )µ2 (dy ) ϕ(x) := Y jest F1 -mierzalna oraz Z f (x, y )µ(dx, dy ) = Z Z X ×Y X fx (y )µ2 (dy ) µ1 (dx), (2) Y gdzie µ = µ1 ⊗ µ2 . Jeśli f : X × Y → IR jest funkcją całkowalną, to ϕ jest określona prawie wszędzie, całkowalna w X względem miary µ1 oraz zachodzi (2). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Rozkłady łączne i brzegowe Rozważmy zmienna losową ξ = (ξ1 , ξ2 ). Definicja Rozkłady postaci IP(ξ1 ∈ A) = IP(ξ1 ∈ A, ξ2 ∈ IR), IP(ξ2 ∈ B) = IP(ξ1 ∈ IR, ξ2 ∈ B) nazywamy rozkładami brzegowymi. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Rzucamy dwa razy monetą. Niech zmienna losowa ξ1 oznacza ilość orłów w pierwszym rzucie, a zmienna ξ2 - ilość orłów w dwóch rzutach. Mamy 1 A = {0, 0} lub A = {0, 1} lub A = {1, 1} lub A = {1, 2} . µ(ξ1 ,ξ2 ) (A) = 4 0 w pozostałych przypadkach Rozkłady brzegowe możemy znaleźć sumując odpowiednie wyniki dla rozkładów łącznych. Np. µξ1 (0) = 14 + 41 = 12 , µξ2 (0) = 14 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład ( c.d.) ξ1 = 0 ξ1 = 1 ξ2 = 0 ξ2 = 1 1 4 1 4 1 4 1 2 0 1 4 ξ2 = 2 0 1 4 1 4 1 2 1 2 W przypadku dyskretnym łatwo jest wyznaczać rozkłady sumy zmiennych losowych. Przykładowo IP(ξ1 + ξ2 = 1) = IP(ξ1 = 0, ξ2 = 1) + IP(ξ1 = 1, ξ2 = 0) = Tomasz Bielaczyc Rachunek Prawdopodobieństwa 1 1 +0 = . 4 4 Powyższy przykład demonstruje, że jeśli rozkład wektora losowego (ξ1 , ξ2 ) jest dyskretny, to rozkłady brzegowe także są dyskretne. Jeśli natomiast (ξ1 , ξ2 ) ma gęstość f , to z twierdzenia Fubiniego, Z Z Z f (x, y ) dy dx, f (x, y ) dxdy = IP(ξ1 ∈ A1 ) = IP(ξ1 ∈ A1 , ξ2 ∈ IR) = A1 ×IR czyli R IR fx (y ) dy jest gęstością zmiennej losowej ξ1 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa A1 IR Przykład Niech gęstość wektora losowego (ξ , ζ ) dana będzie wzorem 2, x, y ∈ A, f (x, y ) = 0, x, y ∈ / A, gdzie A = {(x, y ) ∈ IR 2 : x, y > 0, 0 6 x + y 6 1}. Znajdźmy rozkład zmiennej losowej ξ . Mamy fξ1 (x) = Z f (x, y )dy = IR Z 2dy = Ax Z 1−x 2 dy = 2(1 − x) dla x ∈ (0, 1) 0 oraz dla 0 6 t 6 1, Fξ (t) = Z t 2(1 − x) dx = 2t − t 2 . 0 Tomasz Bielaczyc Rachunek Prawdopodobieństwa Mając dane rozkłady zmiennych ξ1 , ξ2 nie zawsze możliwe jest określenie rozkładu wektora (ξ1 , ξ2 ). Przykład Niech rozkład wektora losowego (ξ , ζ ) dany będzie tabelką ζ =0 ζ =1 ζ =2 3 1 ξ = 0 18 + ε 0 8 −ε 2 1 1 1 ξ = 1 4 −ε ε 4 2 3 8 1 4 3 8 gdzie ε ∈ [0, 14 ]. Zauważmy, że rozkład łączny zależy od ε, a rozkłady brzegowe nie. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Zmienne losowe niezależne Definicja Zmienne losowe ξ1 , . . . , ξn nazywamy niezależnymi, gdy dla każdego ciągu zbiorów B1 , . . . , Bn ∈ B(IR) zachodzi równość IP(ξ1 ∈ B1 , . . . , ξn ∈ Bn ) = IP(ξ1 ∈ B1 ) · . . . · IP(ξn ∈ Bn ). Zmienne losowe ξ1 , ξ2 , . . . nazwiemy niezależnymi, gdy dla każdego n ∈ IN zmienne ξ1 , . . . , ξn są niezależne. Przykład Rzucamy dwa razy kostką. Zmienne losowe będące wynikami kolejnych rzutów są niezależne. Z definicji wynika natychmiast, że rozkład łączny niezależnych zmiennych losowych jest wyznaczony przez rozkłady brzegowe. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Twierdzenie Niech ξ1 , ξ2 będą zmiennymi losowymi. Wówczas ξ1 , ξ2 są niezależne ⇐⇒ µ(ξ1 ,ξ2 ) = µξ1 ⊗ µξ2 . Dowód. (=⇒) Z niezależności wynika, że dla A, B ∈ B(IR), µ(ξ1 ,ξ2 ) (A×B) = IP((ξ1 , ξ2 ) ∈ A×B) = IP(ξ1 ∈ A)·IP(ξ2 ∈ B) = µξ1 (A)· µξ2 (B). Zatem, na mocy twierdzenia o produkcie miar, µ(ξ1 ,ξ2 ) = µξ1 ⊗ µξ2 . (⇐=) Podobnie, dla A, B ∈ B(IR) mamy IP(ξ1 ∈ A, ξ2 ∈ B) = IP((ξ1 , ξ2 ) ∈ A × B) = µ(ξ1 ,ξ2 ) (A × B) = = µξ1 (A) · µξ2 (B) = IP(ξ1 ∈ A) · IP(ξ2 ∈ B). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Lemat Jeśli µ1 oraz µ2 są ciągłymi rozkładami na IR o gęstościach f1 , f2 , to µ1 ⊗ µ2 jest ciągły i ma gęstość postaci f (x, y ) = f1 (x) · f2 (y ). Dowód. Zdefiniujmy miarę Z ν(A) = f1 (x)f2 (y )dxdy . A Z twierdzenia Fubiniego ν(A1 × A2 ) = Z f1 (x)dx A1 Z f2 (y )dy = µ1 (A1 )µ2 (A2 ), A2 czyli miara ν jest probabilistyczna oraz, na mocy twierdzenia o produkcie miar, ν = µ1 ⊗ µ2 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Z powyższego twierdzenia i lematu wynika: Wniosek Jeśli ξ1 , ξ2 są niezależnymi zmiennymi losowymi o gęstościach f1 , f2 , to wektor losowy (ξ1 , ξ2 ) ma gęstość f (x, y ) = f1 (x) · f2 (y ). Przykład Losujemy punkt x odcinka [0, 1] z funkcją gęstości f1 oraz punkt y odcinka [0, 1] z gęstością f2 . gęstość wektora losowego opisującego losowanie punktu (x, y ) z kwadratu jednostkowego ma gęstość f1 · f2 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Wprost z definicji niezależności zmiennych losowych wynika następujący: Lemat Jeśli zmienne losowe ξ1 , ξ2 są niezależne oraz ϕ1 , ϕ2 : IR → IR są mierzalne, to zmienne losowe ϕ1 (ξ1 ), ϕ2 (ξ2 ) także są niezależne. Lemat Jeśli E |ξ | < ∞, to Eξ = Z IR Tomasz Bielaczyc x µξ (dx). Rachunek Prawdopodobieństwa Twierdzenie (?) Jeśli ξ1 , ξ2 są niezależnymi zmiennymi losowymi takimi, że E |ξ1 |, E |ξ2 | < ∞, to E (ξ1 ξ2 ) = E ξ1 E ξ2 . Jeśli ponadto D 2 ξ1 , D 2 ξ2 < ∞, to D 2 (ξ1 + ξ2 ) = D 2 ξ1 + D 2 ξ2 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Dowód. Z definicji wartości oczekiwanej mamy E (ξ1 ξ2 ) = Z Z ξ1 (ω)ξ2 (ω)IP(d ω) = Ω IR 2 xy µ(ξ1 ,ξ2 ) (dx, dy ). Stąd, na mocy twierdzenia Fubiniego i poprzedniego twierdzenia, otrzymujemy E (ξ1 ξ2 ) = Z IR 2 xy µξ1 ⊗µξ2 (dx, dy ) = Z IR x µξ1 (dx) Z IR = E ξ1 E ξ2 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa y µξ2 (dy ) = Dowód - c.d. Zauważmy, że 2 2 D 2 (ξ1 + ξ2 ) = E (ξ1 + ξ2 ) − E (ξ1 + ξ2 ) = E (ξ1 − E ξ1 ) + (ξ2 − E ξ2 ) = = D 2 ξ1 + D 2 ξ2 + 2E ((ξ1 − E ξ1 )(ξ2 − E ξ2 )). Ponieważ zmienne losowe ξ1 − E ξ1 oraz ξ2 − E ξ2 są niezależne, więc D 2 (ξ1 + ξ2 ) = D 2 ξ1 + D 2 ξ2 + 2E (ξ1 − E ξ1 )E (ξ2 − E ξ2 ) = D 2 ξ1 + D 2 ξ2 . Tomasz Bielaczyc Rachunek Prawdopodobieństwa Definicja Funkcję f1 ∗ f2 daną wzorem (f1 ∗ f2 )(x) = Z f1 (x − y )f2 (y )dy IR nazywamy splotem funkcji f1 i f2 . Jeśli f1 , f2 są gęstościami niezależnych zmiennych losowych ξ1 , ξ2 , to Z Z µξ1 +ξ2 (B) = B f1 (x − y )f2 (y )dydx, IR czyli dla niezależnych zmiennych losowych o rozkładzie ciągłym, splot gęstości jest gęstością sumy. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Prawo wielkich liczb Niech (ξn )n∈IN będzie ciągiem zmiennych losowych. Definicja Mówimy, że ciąg (ξn )n∈IN jest zbieżny według prawdopodobieństwa (stochastycznie) do zmiennej losowej ξ , gdy dla każdego ε > 0, lim IP(|ξn − ξ | > ε) = 0. n→∞ Przypomnienie: lim ξn = ξ p.n. ⇐⇒ IP(ω : lim ξn (ω) = ξ (ω)) = 1 n→∞ n→∞ Pomiędzy zbieżnością według prawdopodobieństwa, a zbieżnością prawie na pewno (p.n.) zachodzi zależność: Jeśli lim ξn = ξ p.n., to lim ξn = ξ wg prawdopodobieństwa. n→∞ n→∞ Tomasz Bielaczyc Rachunek Prawdopodobieństwa Oznaczmy Sn = ξ1 + . . . + ξn . Twierdzenie (Słabe Prawo Wielkich Liczb) Jeśli niezależne zmienne losowe ξ1 , ξ2 , . . . mają skończone wartości oczekiwane i wspólnie ograniczone wariancje, to lim n→∞ Sn − ESn = 0 wg prawdopodobieństwa. n Tomasz Bielaczyc Rachunek Prawdopodobieństwa Dowód. Niech M > 0 będzie takie, że D 2 ξn 6 M dla n ∈ IN. Z niezależności zmiennych losowych wynika, że D 2 Sn = D 2 ξ1 + . . . D 2 ξn 6 nM. Weźmy dowolne ε > 0. Na mocy nierówności Czebyszewa mamy IP |S − ES | D 2S M n n n >ε 6 6 2. n (nε)2 nε Tomasz Bielaczyc Rachunek Prawdopodobieństwa Szczególnym przypadkiem powyższego twierdzenia jest: Wniosek (Słabe Prawo Wielkich Liczb Bernoulliego) Jeśli Sn oznacza liczbę sukcesów w schemacie n prób Bernoulliego (z prawdopodobieństwem sukcesu w pojedynczej próbie równym p), to dla każdego ε > 0 lim IP(| n→∞ Sn − p| 6 ε) = 1. n Rzucając kostką, orła otrzymamy z prawdopodobieństwem 16 . Powyższe twierdzenia mówią, że rzucając sześć tysiące razy mamy duże szanse trafić szóstkę około tysiąca razy. Możemy zatem szacować prawdopodobieństwo danego zdarzenia wykonując odpowiednio dużo prób. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Rozkład normalny Definicja Jeśli dla pewnych m ∈ IR, σ > 0 funkcja (x−m)2 1 − e 2σ 2 f (x) = √ 2πσ jest gęstością, to wyznaczony przez nią rozkład nazywamy rozkładem normalnym i oznaczamy N(m, σ ). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Zauważmy, że Z IR e− x2 2 dx Z e− x2 2 dy = IR Z e− x 2 +y 2 2 dxdy = IR ×IR Z 2π Z ∞ 0 0 (podstawiając x = r cos ϕ, y = r sin ϕ) Zatem dla m = 0, σ = 1, Z f (x)dx = 1, IR czyli f jest gęstością. Tomasz Bielaczyc r2 re − 2 drd φ = 2π. Rachunek Prawdopodobieństwa Dystrybuanta rozkładu normalnego N(0, 1) jest postaci 1 Φ(t) = √ 2π Z t x2 2 dx, Z t−m σ e− −∞ natomiast dla rozkładu N(m, σ ), (x−m)2 1 1 − √ e 2σ 2 dx = √ −∞ 2πσ 2π Z Φm,σ (t) = t e− z2 2 dz = Φ −∞ t −m . σ Wynika stąd, że jeśli ξ ma rozkład N(0, 1), to σ ξ + m ma rozkład N(m, σ ). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Obliczmy wartość oczekiwaną i wariancję zmiennej losowej ξ o rozkładzie N(m, σ ). Mamy 1 Eξ = √ 2πσ (całka R IR zσ e − z2 2 Z IR xe − (x−m)2 2σ 2 1 dx = √ 2π Z (zσ + m)e − z2 2 dz = m. IR dz = 0 bo funkcja podcałkowa jest nieparzysta) Tomasz Bielaczyc Rachunek Prawdopodobieństwa oraz (x−m)2 z2 σ2 1 − (x − m)2 e 2σ 2 dx = √ z 2 e − 2 dz = D 2ξ = √ 2πσ IR 2π IR Z 2 2 2 ∞ z z σ =√ −ze − 2 + e − 2 dz = σ 2 . −∞ IR 2π Z Z Gęstość osiąga największą wartość w punkcie m, a jej wykres jest symetryczny względem tego punktu. Reguła trzech sigm mówi, że prawdopodobieństwo, że ξ nie należy do przedziału (m − 3σ , m + 3σ ) jest mniejsze niż 0, 003. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Centralne twierdzenie graniczne Definicja Ciąg (ξn )n∈IN nazywamy zbieżnym według dystrybuant (słabo) do ξ , gdy ciąg dystrybuant Fξn jest zbieżny do Fξ w każdym punkcie ciągłości dystrybuanty Fξ . Twierdzenie Jeśli ciąg (ξn )n∈IN jest zbieżny do ξ według prawdopodobieństwa, to jest też zbieżny według dystrybuant. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Podobnie, jak wcześniej oznaczamy Sn = ξ1 + . . . + ξn . Zdefiniujmy Sn − E (Sn ) Sn − mn √ . = ζn = p σ n D 2 (Sn ) Twierdzenie (Lindenberga-Levy’ego) Jeśli (ξn )n∈IN jest ciągiem niezależnych zmiennych losowych o jednakowych rozkładach, mających skończoną wartość oczekiwaną m oraz skończoną, nieujemną wariancję σ 2 , to ciąg zmiennych losowych ζn jest zbieżny według dystrybuant do zmiennej losowej o rozkładzie N(0, 1). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Powyższy fakt wersją Centralnego Twierdzenia Granicznego. Ponieważ dystrybuanta rozkładu normalnego jest ciągła, więc tezę można zapisać: 1 lim IP(ζn 6 t) = Φ(t) = √ n→∞ 2π Z t e− x2 2 dx dla t ∈ IR. −∞ Można wykazać, że zbieżność jest jednostajna ze względu na t. Zauważmy, że założenie o nieujemnych wariancjach mówi, że zmienne losowe nie są stałymi Można też wykazać ogólniejszą wersję CTG - dla zmiennych losowych o niekoniecznie tych samych rozkładach. Tomasz Bielaczyc Rachunek Prawdopodobieństwa Wniosek (Twierdzenie de Moivre’a - Laplace’a) Jeśli ξ, ξ2 . . . jest ciągiem niezależnych prób Bernoulliego z prawdopodobieństwem sukcesu p, to lim IP n→∞ Z t S − np x2 1 n e − 2 dx 6t = √ √ npq 2π −∞ Tomasz Bielaczyc dla t ∈ IR. Rachunek Prawdopodobieństwa Przykład Obliczmy prawdopodobieństwo, że przy 1000 rzutach monetą różnica między ilością reszek i orłów będzie większa niż 100. Oznaczmy przez Sn ilość orłów, n = 1000, p = 12 . Zamiast liczyć n IP(|Sn − (n − Sn )| > 100) = IP(|Sn − | > 50) 2 obliczymy przybliżenie prawdopodobieństwa zdarzenia przeciwnego, IP S − np S − np 50 −50 n n 6√ − IP √ 6√ ≈ √ npq npq npq npq √ √ √ ≈ Φ( 10) − Φ(− 10) = 2Φ( 10) − 1 ≈ 0, 998, gdzie Φ oznacza dystrybuantę rozkładu N(0, 1). Tomasz Bielaczyc Rachunek Prawdopodobieństwa Przykład Chcemy sprawdzić ilu wyborców popiera partię Y. Jak duża powinna być liczebność n próbki, aby uzyskany wynik różnił się od prawdziwego o nie więcej niż b% z prawdopodobieństwem nie mniejszym niż 1 − α. Niech p będzie faktycznym poparciem partii Y. Jeśli Sn jest ilością osób popierających Y w n-elementowej próbce, to na podstawie próbki otrzymaliśmy poparcie Snn . Możemy założyć, że Sn jest sumą niezależnych zmiennych losowych o rozkładzie dwupunktowym IP(ξi = 1) = p, IP(ξi = 0) = q = 1 − p. Szukamy takiego n, aby S n IP − p 6 b > 1 − α. n Tomasz Bielaczyc Rachunek Prawdopodobieństwa Mamy S S S n n n − p 6 b − IP − p 6 −b 1 − α 6 IP − p 6 b ≈ IP n n √ √n S − np S − np b b n n n n 6√ − IP √ 6 −√ ≈ = IP √ npq pq npq pq b √n b √n b √n ≈Φ √ −Φ − √ = 2·Φ √ − 1, pq pq pq czyli b √n α Φ √ > 1− . pq 2 Możemy tę nierówność zapisać w postaci √ b n α pq α 2 √ > Φ−1 (1 − ), czyli n > 2 Φ−1 (1 − ) . pq 2 b 2 W oszacowaniu występuje stała p, której nie znamy, ale łatwo zauważyć, że pq 6 14 . Przykładowo dla b = 0, 03 oraz a = 0, 05 otrzymujemy n > 1067. Tomasz Bielaczyc Rachunek Prawdopodobieństwa