Zdarzenia losowe i prawdopodobieństwo Rachunek prawdopodobieństwa zajmuje się badaniem praw rządzącymi zdarzeniami losowymi. Pojęciami pierwotnymi są: zdarzenie elementarne i przestrzeń zdarzeń elementarnych związane z doświadczeniem losowym D polegającym na realizacji określonego zespołu warunków, Poszczególne wyniki doświadczenia losowego traktujemy jako zdarzenia elementarne i zbiór wszystkich zdarzeń elementarnych jako przestrzeń zdarzeń elementarnych . Przykład I. Rzucamy kostką do gry - doświadczenie losowe D. Zdarzenie elementarne liczba wyrzuconych oczek. = { 1 , 2 , 3 , 4 , 5 , 6 } Przykład II. Losujemy element z populacji generalnej Z tak aby każdy element miał jednakowe szansę wylosowania - doświadczenie losowe D. Zdarzenie elementarne wylosowany element z populacji generalnej. - zbiór wszystkich możliwych elementów populacji generalnej tzn. =Z. Tak będziemy traktować populację generalną za pomocą rachunku prawdopodobieństwa. Praktycznie interesują nas nie pojedyncze zdarzenia elementarne doświadczenia D lecz podzbiory przestrzeni . W przypadku gdy przestrzeń jest skończona lub przeliczalna to każdy podzbiór przestrzeni nazywamy zdarzeniem losowym. W przypadku gdy przestrzeń jest nieprzeliczalna to nie każdy podzbiór jest zdarzeniem losowym. -ciałem zdarzeń losowych przestrzeni nazywamy rodzinę podzbiorów przestrzeni spełniających warunki (aksjomaty): 1o 2o Jeżeli A to A’ gdzie A’ = - A dopełnieniem (przeciwne) zdarzenia A. 3o Suma przeliczalnej lub skończonej liczby zbiorów z rodziny należy do rodziny , tzn. jeżeli A1 ,………, An ,….. to (A1…. An…… ) . Każdy zbiór A należący do -ciała zdarzeń losowych (A ) będziemy nazywać zdarzeniem losowym. W przypadku przestrzeni skończonej lub przeliczalnej =2 = { A ; A podzbiór } Czyli każdy podzbiór przestrzeni jest zdarzeniem losowym należącym do rodziny . Aksjomatyczna definicja prawdopodobieństwa Funkcje P : R przyporządkowującą każdemu zdarzeniu losowemu A liczbę P(A) R nazywamy prawdopodobieństwem jeżeli są spełnione warunki (aksjomaty): P1: P(A)≥0 dla dowolnego zdarzenia losowego A P2: P()=1 P3: Jeżeli A1 ,………, An ,….. jest ciągiem parami rozłącznych zdarzeń losowych to P(A1…. An…… )= P(A1)+….+P( An)+..… Uwaga Zdarzenia A1 ,………, An ,….. są parami rozłączne jeżeli część wspólna dowolnej pary zdarzeń jest pusta tzn. AiAj= dla i j i zbiór pusty. Z definicji prawdopodobieństwa wynikają następujące własności prawdopodobieństwa. 1o P( )=0 2o Jeżeli zdarzenie losowe A pociąga zdarzenie B (A B ) to P(A) P(B ). 3o P(A) 1 dla dowolnego zdarzenia losowego A 4o Jeżeli zdarzenie losowe A pociąga zdarzenie B (A B ) to P(B - A) =P(B ) - P(A). A1 ,………, An są parami rozłącznymi zdarzeniami losowymi to P(A1…. An)= P(A1)+….+P( An) 6o P(A)+P( A’) =1 a stąd P(A)=1 - P( A’) i P(A’)=1 - P( A) 5o Jeżeli 7o P(A B) P(A)+P(B)-P(AB) dla dowolnych zdarzeń losowych A ,B . 8o Jeżeli przestrzeń zdarzeń elementarnych jest skończona lub przeliczalna. Wtedy prawdopodobieństwa pi = P({i}) 0 dla i i P1+….+ pn=1 gdy przestrzeń jest skończona n – elementowa P1+….+ pn+…..=1 gdy przestrzeń jest przeliczalna 9o a) Jeżeli przestrzeń zdarzeń elementarnych jest n – elementowa tzn. n b) zdarzenia elementarne {i} są jednakowo prawdopodobne tzn. 1 P({1})= P({2})=…….= P({n})= n to prawdopodobieństwo zdarzenia losowego A składającego się z k zdarzeń elementarnych tzn. A k wyraża się wzorem A k liczba zdarzen elementarnych sprzyjajacych zdarzeniu A P(A)= = = n liczba wszystkich zdarzen elementarnych przestrzen i Jest to klasyczna definicja prawdopodobieństwa. Tak określoną trójkę ( , , P ) nazywamy przestrzenią probabilistyczną. Prawdopodobieństwo warunkowe. Niech B i P(B)>0. Definicja. Prawdopodobieństwem warunkowym pod warunkiem zdarzenia B dowolnego zdarzenia A nazywamy liczbę P( A B) określoną wzorem: p( AB) A, B P( B) 0 . Stąd P( B) ; P( AB) P( B) P( A B) P( B) 0 P( AB) P( A) P( B A) P( A B) Definicja. Zdarzenia P( AB) P( A) P( B) . A, B są niezależne P( A B) P( A) P( A) 0 Definicja. Zdarzenia A1 , A2 ,....., An są niezależne każdego mn i rosnącego ciągu liczb naturalnych 1 i1 i2 ..... im n P( Ai1 Ai2 ... Aim ) P( Ai1 ) P( Ai2 )...P( Aim ) . Twierdzenie o prawdopodobieństwie zupełnym. Jeżeli B jest dowolnym zdarzeniem i A1 , A2 ,..., An są zdarzeniami spełniającymi warunki: i j a). Parami rozłączne tzn. Ai A j b). Pokrywają zdarzenie B tzn. B A1 A2 ... An i P( Ai ) 0 i 1,2,...., n to P( B) P( A1 ) P( B A1 ) P( A2 ) P( B A2 ) .... P( An ) P( B An ) Twierdzenie Bayesa. Jeżeli zdarzenia B, A1 , A2 ,..., An spełniają założenia twierdzenia o prawdopodobieństwie zupełnym i P( B) 0 to prawdopodobieństwo warunkowe P( Ak B) zdarzenia Ak pod warunkiem zdarzenia B wyraża się wzorem P( Ak B) P( Ak ) P( B Ak ) P ( B) k 1,2,......, n Wariancje i kombinacja Jeżeli A {a1 , a2 ,..., an } jest zbiorem różnych elementów. Wariancją bez powtórzeń nazywamy każdy k – wyrazowy ciąg k różnych elementów zbioru A. Taki k – wyrazowy ciąg k różnych elementów zbioru A powstaje ciągnąc k razy z zbioru A bez zwracania elementów. Liczba wszystkich k – wyrazowych wariancji bez powtórzeń n – elementowego zbioru A wynosi Vnk n(n 1)( n 2).......( n k 1) k n . Wariancją z powtórzeniami nazywamy każdy k – wyrazowy ciąg k elementów zbioru A. Taki k – wyrazowy ciąg k elementów zbioru A powstaje ciągnąc k razy z zbioru A z zwracaniem wylosowanych elementów do zbioru A. Liczba wszystkich k – wyrazowych Vn k n k . wariancji z powtórzeniami n – elementowego zbioru A wynosi Kombinacja bez powtórzeń nazywamy każdy k – wyrazowy ciąg k różnych elementów zbioru A w którym kolejność występowania wyrazów jest nie istotna czyli każdy k elementowy podzbiór zbioru A. Liczba wszystkich k – wyrazowych kombinacji bez powtórzeń n – elementowego zbioru A wynosi n n(n 1)( n 2).......( n k 1) n! Cnk k n. k! k!(n k )! k Kombinacja z powtórzeniami nazywamy każdy k – wyrazowy ciąg k elementów zbioru A w którym kolejność występowania wyrazów jest nie istotna . Liczba wszystkich k – wyrazowych kombinacji z powtórzeniami n – elementowego zbioru A wynosi nk Cnk . k! Zmienne losowe jednowymiarowe Niech ( , , P ) będzie dowolną przestrzenią probabilistyczną Definicja. Zmienną losową nazywamy dowolną funkcję X : R określoną na przestrzeni zdarzeń elementarnych o wartościach ze zbioru liczb rzeczywistych R jeżeli dla dowolnej liczby rzeczywistej x zbiór zdarzeń elementarnych X ( ) x jest zdarzeniem losowym tzn. { : X ( ) x} dla każdego x R . Gdy przestrzeń jest skończona lub przeliczalna to każda funkcja X : R jest zmienną losową. Zmienne losowe będziemy oznaczać dużymi literami np. X , Y, S, T, Z…… a odpowiadające im wartości odpowiednio małymi literami x , y, s, t, z…… Prawdopodobieństwo przyjęcia przez zmienną losową wartości ze zbioru A podzbioru liczb rzeczywistych R. Gdy X jest zmienną losową to zdarzeniami losowymi są zbiory zdarzeń elementarnych { : X ( ) A} gdy np. A {x0 } , A a, b , A a, b) , A (a, b , A (a, b) , A (, b) , A a,) , A (a,) , A N itd. Również w przypadku gdy A gdzie jest najmniejszym -ciałem zdarzeń losowych przestrzeni =R zawierających różnego rodzaju przedziały liczbowe / zbiory Borelowskie / zbiory { : X ( ) A} są zdarzeniami losowymi . Wtedy określone są prawdopodobieństwa P ( X A) przyjęcia przez zmienną losową X wartości ze zbioru A, określone w następujący sposób: P( X A) P({ : X ( ) A}) . A więc np. gdy A a, b) . Wtedy P( X a, b)) P(a X b) P({ : a X ( ) b}) Tak określone prawdopodobieństwa określają rozkład prawdopodobieństwa zmiennej losowej X . Definicja. Dystrybuantą zmiennej losowej X nazywamy funkcję F : R R określoną na zbiorze liczb rzeczywistych R taką , że F ( x) P( X x) dla każdego x R . Dystrybuanty rozkładów prawdopodobieństwa pewnych zmiennych losowych są stablicowane i z tablic możemy znaleźć najważniejsze prawdopodobieństwa zmiennej losowej X . Np. P(a X b) F (b) F (a) ; P( X a) 1 F (a) . W badaniu statystycznym populacji generalnej ze względu na jedną cechę zmiennymi losowymi będą funkcje X : Z R przyjmujące wartości – wartość cechy elementu populacji. Zmienne losowe określone na tym samym zbiorze zdarzeń elementarnych można dodawać(mnożyć) – dodając(mnożąc) ich wartości dla zdarzenia elementarnego. Zmiennymi losowymi są funkcje stałe tzn. przyjmujące tylko ustaloną określoną wartość dlatego też zmienne losowe można mnożyć i dzielić przez liczbę i dodawać lub odejmować liczbę do zmiennej. Zmienne losowe typu skokowego Zmienna losowa X jest typu skokowego (dyskretnego) jeżeli istnieje skończony zbiór WX {x1, x2 ,........, xn } lub przeliczalny WX {x1 , x2 ,........, xn ,.......} jej wartości taki, że: P( X xi ) pi 0 i 1,2,...., n i n p1 p2 ... pn pi 1 w przypadku skończonym i 1 P( X xi ) pi 0 i N i p1 p2 ... pn .... pi 1 w przypadku przeliczalnym i 1 Zmienną losową X typu skokowego i jej rozkład prawdopodobieństwa można zapisać za pomocą tabelki: X xi x1 x 2 ........ x n . w przypadku skończonym P( X xi ) pi p1 p 2 ....... p n . X xi x1 x 2 ........ xn . ....... w przypadku przeliczalnym P( X xi ) pi p1 p 2 ....... p n . ........ Wtedy: P( X A) pi i dystrybuanta xiA F ( x) pi xi x Wartość oczekiwana m E ( X ) określa się wzorem n m E ( X ) x1 p1 x2 p 2 ... xn pn xi pi w przypadku skończonym i 1 m E ( X ) x1 p1 x2 p 2 ... xn pn .... xi pi w przypadku przeliczalnym i 1 Wariancja 2 D 2 ( X ) określa się wzorem n 2 D 2 ( X ) ( x1 m) 2 p1 ( x2 m) 2 p 2 ... ( xn m) 2 p n ( xi m) 2 pi w przypadku skończonym i 1 2 D 2 ( X ) ( x1 m) 2 p1 ( x2 m) 2 p 2 ... ( xn m) 2 p n .. ( xi m) 2 pi w przypadku przeliczalnym i 1 Twierdzenie n 2 D 2 ( X ) x12 p1 x2 p 2 ... xn p n m 2 xi pi m 2 w przypadku skończonym 2 2 2 i 1 D ( X ) ( x p x2 p 2 ... xn p n ....) m xi pi m 2 w przypadku przeliczalnym 2 2 2 1 1 2 2 2 2 i 1 Odchylenie standardowe D(X ) określa się wzorem D( X ) 2 Przykład wykorzystania i interpretacja obliczonych parametrów patrz plik „ Wartość oczekiwana w multi lotku” na mojej stronie internetowej. Przykład Rzucamy kostką do gry tak długo aż wypadnie szóstka. Wyznaczyć zmienną losową X przyjmującą wartości - liczbę rzutów kostką do momentu wyrzucenia szóstki oraz rozkład prawdopodobieństwa tej zmiennej losowej. Ponadto wyznaczyć wartość oczekiwaną m tej zmiennej losowej i prawdopodobieństwo, że liczba rzutów będzie większa niż 4. Niech zdarzenie losowe Ai oznacza zdarzenie losowe, że w i – tym rzucie wypadnie 5 1 szóstka iN. P(Ai)= i P(Bi)= gdzie Bi zdarzenie losowe przeciwne zdarzenia Ai a 6 6 więc zdarzenie, że w i – tym rzucie wypadnie inna liczba oczek niż 6. Ciąg zdarzeń Z1 , Z2 , …… , Zk Z=A lub Z =B dla dowolnego kN jest niezależny. Do momentu wyrzucenia szóstki w k – tym rzucie w poprzednich rzutach zachodzi zdarzenie Bi i=1,2,3,….,k-1 a w k – tym rzucie wystąpi zdarzenie Ak. A więc zdarzenie, że zmienna losowa X przyjmie wartość k, tzn. {X=k}=B1B2…..Bk-1Ak . Z niezależności ciągu zdarzeń mamy 5k 1 1 5k 1 pk=P(X=k)=P(B1B2…..Bk-1Ak)= P(B1)P(B2)…..P(Bk-1)P(Ak)= k 1 k . Stąd tabelka zmiennej 6 6 6 losowej X typu skokowego przeliczalnego ma postać: X xi 1 2 ........ k . ....... 1 5 5 k 1 ....... k . ........ 2 6 6 6 P ( X xi ) p i Uwaga pk P( X k ) q k 1 p k 1,2,3,.... 0 p 1 q 1 p 5 z parametrem 0 p 1 . W naszym przypadku P( X k ) 6 k 1 - rozkład geometryczny 1 6 k 1,2,3,....; p 1 . 6 1 1 1 n stąd x nx n1 dla x 1 jako suma wyrazów 2 1 x n 0 1 x (1 x) n 1 postępu geometrycznego dla q x i a1 1 oraz można różniczkować obie strony Ponieważ równości a prawą stronę wszystkie wyrazy szeregu potęgowego w obszarze zbieżności. A więc 5 pk k 1 k 1 6 k 1 1 1 5 6 6 k 1 6 k 1 k 1 5 1 1 1 6 k 0 6 6 1 5 6 Wartość oczekiwana m E ( X ) x1 p1 x2 p 2 ... xn pn .... xi pi i 1 m E( X ) k k 1 5k 1 1 5 k 6k 6 k 1 6 k 1 1 1 6 6 5 2 1 6 Prawdopodobieństwo, że liczba rzutów będzie większa niż 4. P(X>4)=1-P(X4)=1-P({X=1}{X=2}{X=3}{X=4})=1-(P(X=1)+P(X=2)+P(X=3)+P(X=4)) 1 5 52 53 63 5 6 2 52 6 53 671 P( X 4) 1 ( 2 3 4 ) 1 1 1 0,5177 0,4823 4 6 6 6 6 6 1296 1 1 Analogicznie P(X>5)=0,4119 ; P(X>6)=0,3349 ; P(X>90)= ; P(X>91)= 13375568 16050678 Stąd prawdopodobieństwo zdarzenia losowego, że rzucimy co najmniej 90 razy kostką do gry i nie pojawi się szóstka jest takie same a nico większe co prawdopodobieństwo trafienia szóstki w dużym lotku , które wynosi 1 . 13983816 Niektóre rozkłady skokowe. Rozkład zero-jedynkowy. Zmienna losowa X typu skokowego ma rozkład zero-jedynkowy z parametrem p , p(0,1) jeżeli jej funkcja prawdopodobieństwa ma postać: xi 0 1 . pi q q 1 p p . m E ( X ) 0 (1 p) 1 p p 2 D 2 ( X ) pq Rozkład dwumianowy (Bernoulliego ) Zmienna losowa X typu skokowego ma rozkład dwumianowy z parametrami p , p (0,1) i n N , jeżeli jej funkcja prawdopodobieństwa ma postać: n Wartościami zmiennej są liczby k 0 ,1 , 2 ,......, n i pk P( X k ) p k q nk k 0,1,2,...., n k gdzie q 1 p m E ( X ) np Wtedy 2 D 2 ( X ) npq Zmienna losowa X o rozkładzie dwumianowym jest związana z schematem Bernoulliego z n niezależnymi doświadczeniami D1 , D2, …..,Dn w których prawdopodobieństwo wystąpienia sukcesu A wynosi p . Wartościami zmiennej losowej X jest liczba sukcesów w n doświadczeniach. Rozkład Poissona Zmienna losowa X typu skokowego ma rozkład Poissona z parametrami >0 jeżeli jej funkcja prawdopodobieństwa ma postać: Wartościami zmiennej są liczby k =0,1,2,……,n,…N0 i k e2,72 p k P ( X k ) e k N 0 k! m E( X ) 2 D2 ( X ) Zmienna losowa X rozkładu Poissona zastępuje z dużą dokładnością rozkład dwumianowy dla dużej liczby doświadczeń n i małym prawdopodobieństwem sukcesu p. W rozkładzie Poissona =np. . Zmienne losowe typu ciągłego. Zmienne losowe X jest typu ciągłego jeżeli istnieje funkcja y f ( x) f : R R taka, że: 10 Przyjmuje wartości nieujemne tzn. f ( x) 0 x R 20 Pole zawarte między wykresem funkcji y f (x) a osią OX jest równe 1 . 30 Prawdopodobieństwa P(a X b) a b a, b R , jest równe polu zawartemu między wykresem funkcji y f (x) , prostymi x a , x b i osią OX. Funkcja y f ( x) f : R R spełniająca powyższe własności nazywa się funkcją gęstości rozkładu prawdopodobieństwa zmiennej losowej X . Dla zmiennej losowej typu ciągłego P( X x0 ) 0 dla dowolnej ustalonej wartości x0 . Stąd w prawdopodobieństwach P ( a X b) P ( a X b) P ( a X b) P ( a X b) . Dla zmiennej losowej typu skokowego rodzaj nierówności ma znaczenie. Dla tych co nie znają teorii całek podstawowe parametry nie można zdefiniować i poszczególne parametry będą podawane dla poszczególnych rozkładów którymi będziemy posługiwać się i które są stablicowane. Dla tych co znają całki poszczególne wzory są następujące: Własność 20 w definicji funkcji gęstości ma postać f ( x)dx 1 b Własność 3 w definicji funkcji gęstości ma postać P(a X b) 0 f ( x)dx a m E( X ) xf ( x)dx 2 D 2 ( X ) ( x m) 2 f ( x)dx x Dystrybuanta F ( x) P( X x) f ( )d . Niektóre rozkłady typu ciągłego. Rozkład równomierny (jednostajny , prostokątny). Zmienna losowa X typu ciągłego ma rozkład równomierny skoncentrowany na przedziale < a , b > jeżeli funkcja gęstości tego rozkładu jest określona wzorem: 1 f ( x) b a 0 m E( X ) dla a xb dla pozostalyc h ab 2 Wtedy x 2 D2 (X ) 0 x a F ( x) b a 1 dla dla dla xa a xb xb (b a) 2 12 Rozkład normalny. Zmienna losowa X typu ciągłego ma rozkład normalny (gaussowski) jeżeli funkcja gęstości tego rozkładu jest określona wzorem: ( x m )2 1 2 1 f ( x) e 2 x dla gdzie e lim (1 ) n 2,72 n n 2 Parametrami rozkładu są liczby m , R i 0 Zmienna losowa X typu ciągłego mająca rozkład normalny oznaczać będziemy symbolem N (m, ) . Zapis X ~ N (m, ) oznacza, że zmienna losowa X ma rozkład normalny z parametrami m , R i 0 . Wtedy : wartość oczekiwana wariancja odchylenie standardowe m E( X ) m ; współczynnik asymetrii (skośności) 2 D2 (X ) 2 ; ; g3 0 ; współczynnik spłaszczenia (eksces) g 4 0 ; Współczynnik spłaszczenia dla dowolnej zmiennej losowej porównuje skupienie rozkładu wokół jego wartości oczekiwanej m z rozkładem skupienia rozkładu N ( m, ) . Jeżeli g 4 0 to rozkład jest bardziej skupiony (stromy) niż odpowiedni rozkład normalny. Jeżeli g 4 0 to jest przeciwne. Jest to najważniejszy i najczęściej występujący w zastosowaniach i w przyrodzie rozkład typu ciągłego. Twierdzenie Jeżeli zmienna losowa X ma rozkład normalny ( X ~ N (m, ) ) to zmienna losowa X m U ma rozkład normalny standaryzowany N (0,1) ( U ~ N (0,1) ). Twierdzenie to pozwala na sprowadzenie obliczania zagadnień związanych z zmienną losową X ~ N (m, ) do obliczania tych zagadnień związanych z zmienną losową U ~ N (0,1) który jest stablicowany. Np. jeżeli X ~ N (m, ) to am X m bm am bm bm am P ( a X b) P ( ) P( U ) ( ) ( ) bm am ), ( ) są wartościami dystrybuanty rozkładu normalnego Gdzie wartości ( standaryzowanego U ~ N (0,1) który jest stablicowany. Twierdzenie P( X m 3 ) P(m 3 X m 3 ) 0,9973 99,73% P( X m 2 ) P(m 2 X m 2 ) 0,9545 95,45% P( X m ) P(m X m ) 0,6827 68,27% Oznacza to np. że wszystkich wartości jakie przyjmie zmienna losowa X ~ N (m, ) z przedziału m 3 , m 3 będzie w przybliżeniu 99,73% Ponieważ np. P(m 3 X m 3 ) P(3 X m 3) P(3 U 3) (3) (3) 0,99965 0,00135 0,9973 Inne rozkłady które będziemy wykorzystywać i które są stablicowane: Rozkład chi-kwadrat Jest to rozkład zmiennej losowej 2 n2 X 12 X 22 ..... X n2 i 1,2,...., n są zmiennymi niezależnymi. losowe X i ~ N (0,1) m E( ) n 2 gdzie zmienne D 2 ( X ) 2n 2 Rozkład ten ma stopień swobody n. Rozkład t Studenta . Jest to rozkład zmiennej losowej t t n X /n 2 n gdzie X ~ N (0,1) i n2 ma rozkład chi-kwadrat o n stopniach swobody. n . Rozkład t Studenta ma n stopień swobody. m E (t ) 0 2 D 2 (t ) n2 Dla n>30 rozkład ten ma rozkład asymptotycznie normalny N (0,1) . N (0,1) tzn. w przybliżeniu Jeszcze będzie wykorzystywany rozkład stablicowany Snedecora F (r1 , r2 ) mający dwa stopnie swobody r1 , r2 . x 1