Pojęcie przestrzeni probabilistycznej Definicja 1 (przestrzeni probabilistycznej) Uporządkowany układ < Ω, S, P> nazywamy przestrzenią probabilistyczną jeśli (Ω ) Ω jest niepustym zbiorem zwanym przestrzenia zdarzeń elementarnych, (S) rodzina zbiorów S⊆P(Ω) (P(X) jest rodziną wszystkich podzbiorów zbioru X) spełnia warunki S1. Ω∈S, S2. dla dowolnego ciągu A1, A2,...,An,... zbiorów naleŜących do S A1 ∪ A2 ∪ ...∪ An ∪... ∈ S, S3. dla dowolnych zbiorów A, B ∈ S, A – B ∈ S, (P) P:S → <0,1> jest funkcją zwaną rozkładem prawdopodobieństwa, przyporządkowującą zbiory z rodziny S liczbom rzeczywistym, spełniającą warunki; P1. dla kaŜdego A∈Ω Ω, P(A)≥0, P2. P(Ω) = 1, P3. dla dowolnego ciągu A1, A2,...,An,... zbiorów parami rozłącznych naleŜących do S P(A1 ∪ A2 ∪ ...∪ An ∪...) = P(A1 ) ∪ P(A2 ) ∪ ...∪ P(An ) ∪... . Wtedy rodzinę S nazywamy ciałem przeliczalnie addytywnym zdarzeń lub σ-ciałem (czyt.: sigma ciałem), elementy S nazywamy zdarzeniami losowymi, a wartość rozkładu prawdopodobieństwa dla danego zdarzenia – prawdopodobieństwem tego zdarzenia. Zdarzenia Ω, ∅, nazywamy odpowiednio: pewnym, niemoŜliwym. JeŜeli A jest zdarzeniem losowym, to A’=Ω−A jest zdarzeniem losowym, nazywamy je zdarzeniem przeciwnym do zdarzenia A. Eksperyment (obserwację) nazywamy losowym (losową) jeśli moŜemy opisać go (ją) jako przestrzeń probabilistyczną, w której elementy przestrzeni zdarzeń elementarnych interpretujemy jako rozłączne wyniki eksperymentu (obserwacji), nazywając je zdarzeniami elementarnymi, a badane podczas eksperymentu (obserwacji) dobrze określone zbiory wyników są interpretacją zdarzeń losowych i dlatego nazywane są zdarzeniami losowymi lub przypadkowymi. Twierdzenie 1 W dowolnej przestrzeni probabilistycznej < Ω, S, P>, dla dowolnych zdarzeń losowych A, B : 1) P(∅) = 0, 2) P(A’) = 1 − P(A), 3) JeŜeli A ⊆ B, to P(B) ≥ P(A), 4) P(A ∪ B) = P(A) + P(B) − P(A ∩ B), 5) P(A) + P(B) ≥ P(A ∪ B), 6) JeŜeli A ⊆ B, to P(A −B) = P(B) − P(A). Twierdzenie 2 W dowolnej przestrzeni probabilistycznej < Ω, S, P>, dla dowolnego stępującego ciągu zdarzeń losowych {Bn} (tj. Bn+1 ⊂ Bn), takiego Ŝe ∞ I Bn = B ∈ S, n =1 zachodzi równość P3* lim P(Bn) = P(B), n →∞ ponadto warunki P3 i P3* są równowaŜne. Dyskretne modele przestrzeni probabilistycznych Definicja 2 Klasyczne prawdopodobieństwo Niech Ω = {ω1, ω2, … , ωn}, S = P (Ω).Określmy funkcję P:S → <0,1> następująco: dla dowolnego zbioru A∈ P (Ω) P(A) = |A|/n, gdzie |A| jest liczbą elementów w zbiorze A. Zachodzi wtedy Twierdzenie 3 Układ <Ω, S, P> jest przestrzenią probabilistyczną. Wartość P(A) = |A|/n nazywamy prawdopodobieństwem klasycznym zdarzenia losowego A, mówimy, Ŝe: prawdopodobieństwo zdarzenia losowego A jest ilorazem liczby zdarzeń elementarnych sprzyjających zajściu zdarzenia A i liczby wszystkich zdarzeń. Opisaną w twierdzeniu przestrzeń probabilistyczną nazywa się schematem klasycznym losowania lub klasycznym schematem probabilistycznym, a przestrzeń probabilistyczną < Ω, S, P> - klasyczną przestrzenią probabilistyczną Definicja 3 Schemat losowania bez zwracania i ze zwracaniem Niech będzie dany n-elementowy zbiór {a1, a2, … , an}, który nazywać będziemy populacją generalną. Dowolny k-elemntowy ciąg elementów populacji generalnej nazywać będziemy próbką o liczebności k. JeŜeli ten ciąg (próbkę) tworzymy w ten sposób, Ŝe kaŜdy element ciągu wybieramy ze zbioru powstałego z populacji generalnej przez usunięcie juŜ wcześniej wybranych elementów ciągu, to nazywamy go próbką bez zwracania. Jest ona po prostu róŜnowartościowym ciągiem. Liczba wszystkich k-wyrazowych próbek bez zwracania, zwana jest w kombinatoryce liczbą k-wyrazowych wariacji bez powtórzeń (Vnk), wynosi Vnk = n(n-1)(n-2)…(n-k+1). Dla k=n, Vnn = 1*2*...*n = n!. JeŜeli próbka powstaje w ten sposób, Ŝe kaŜdy element ciągu po wybraniu z populacji generalnej zostaje zapamiętany i „zwrócony z powrotem”, co oznacza, Ŝe następny element ciągu wybieramy z tego samego zbioru co poprzedni element, to taką próbkę nazywamy próbka ze zwracaniem. Liczba wszystkich k-wyrazowych próbek ze zwracaniem, zwana jest w kombinatoryce liczbą k-wyrazowych wariacji z powtórzeniami (Wnk), wynosi Wnk =nk. Schemat klasyczny losowania dla Ω ={wszystkie próbki bez zwracania} nazywamy schematem losowania bez zwracania. Schemat klasyczny losowania dla Ω ={wszystkie próbki ze zwracaniem} nazywamy schematem losowania ze zwracaniem. Liczba k-elementowych próbek bez zwracania róŜniących się tylko porządkiem elementów (wtedy nazywamy je permutacjami k-elementowego zbioru) wynosi k! = 1*2*...*k. Liczba sposobów wyboru próbek róŜniących się tylko składem (liczba kombinacji) wynosi k Vnk/k! = , n ≥ k ≥ 0. n Definicja 5 Rozkład hipergeometryczny Dana jest n-elementowa populacja generalna oraz jej n1-elementowy podzbiór C elementów posiadających pewną wyróŜnioną cechę. Liczba wszystkich kelementowych kombinacji posiadających dokładnie k1≥0 elementów ze zbioru C wynosi n1 n − n1 . k1 k − k1 Niech Ω = {k-elementowe kombinacje populacji generalnej}, ponadto niech dla dowolnego k1, k ≥ k1 ≥ 0, zbiór Gk1 kombinacji k-elementowych posiadających dokładnie k1 elementów zbioru C jest generatorem ciała przeliczalnie addytywnego S. Z określenia generatorów Gk1 wynika, Ŝe są one rozłączne, a więc kaŜdy element S jest zbiorem pustym lub sumą generatorów. Aby określić rozkład prawdopodobieństwa P wystarczy zastosować schemat klasyczny prawdopodobieństwa: P(A) = |A|/|Ω|, n k gdzie A∈S, |Ω| = , a dla generatorów Gk1 n n − n n 1 / . P(Gk1) =P n ,n (k1,k) = 1 − k k k 1 k 1 1 Wtedy Twierdzenie 4 Układ <Ω, S, P> jest przestrzenią probabilistyczną. Schemat Bernoulliego Przypuśćmy, Ŝe z populacji generalnej składającej się z dwóch elementów {0,1} pobieramy próbkę ze zwracaniem o liczebności r. Niech Ω jest zbiorem wszystkich takich próbek, S = P (Ω Ω), a p jest dowolną liczba z przedziału (0,1). Określmy funkcję P:S → <0,1> następująco: (1) jeŜeli w próbce ω∈Ω Ω jest dokładnie k jedynek, to P({ω}) = pk(1-p)r-k, (2) P(A) = ∑ P({ω}) ω∈A (3) jeŜeli A jest zbiorem do którego naleŜą tylko próbki zawierające dokładnie k r jedynek, to P(A) = P(k,r) = pk(1-p)r-k. k Wtedy Twierdzenie 5 Układ <Ω, S, P> jest przestrzenią probabilistyczną. Prawdopodobieństwo warunkowe Twierdzenie 6 JeŜeli B jest zdarzeniem losowym w klasycznej przestrzeni probabilistycznej < Ω, S, P> oraz P(B)≠0, a SB = {S∈S: S⊆B}. Określmy funkcję PB: S B→ <0,1> następująco: dla S∈SB PB(S) = |S|/|B|. Wtedy 1. Układ <B,SB, PB> jest przestrzenią probabilistyczną. Gdy oznaczmy dla dowolnego A∈S, PB(A∩B) = P(A|B), wtedy P(A|B) = P(A∩B)/P(B). 2. Układ < Ω, S, PB>, gdzie PB(A) =P(A∩B)/P(B), dla dowolnego A∈S, jest przestrzenią probabilistyczną . Twierdzenie 7 Niech B jest zdarzeniem losowym w przestrzeni probabilistycznej < Ω, S, P> oraz P(B)≠0. Oznaczmy przez SB rodzinę zbiorów {S∈S: S⊆B} oraz PB(S) = P(S)/P(B). 1. Układ <B,SB, PB> jest przestrzenią probabilistyczną. 2. Układ < Ω, S, PB>, gdzie dla A∈S, PB(A) =P(A∩B)/P(B), jest przestrzenią probabilistyczną . Definicja 6 Niech A i B są zdarzeniami losowymi w przestrzeni probabilistycznej < Ω, S, P> oraz P(B)≠0. Oznaczmy P(A|B) = P(A∩B)/P(B). Wtedy P(A|B) nazywamy prawdopodobieństwem zdarzenia A pod warunkiem zdarzenia B, a dla przestrzeni probabilistycznej < Ω, S, PB> funkcję PB określoną dla A∈S wzorem PB(A) =P(A∩B)/P(B),nazywamy warunkowym rozkładem prawdopodobieństwa. Zdarzenia niezaleŜne Definicja 7 Niech A i B są zdarzeniami losowymi w przestrzeni probabilistycznej < Ω, S, P> oraz P(B)≠0 oraz P(A|B) = P(A). Wtedy mówimy, Ŝe zdarzenie A niezaleŜny od zdarzenia B. Twierdzenie 8 JeŜeli zdarzenia A niezaleŜny od zdarzenia B. to P(A∩B) = P(A)P(B). Stąd wynika, Ŝe Twierdzenie 9 Jeśli P(A)≠0 i P(B)≠0, to zdarzenie A nie zaleŜy od zdarzenia B ⇔ zdarzenie B nie zaleŜy od zdarzenia A. Twierdzenie 10 Jeśli P(A)≠0 i P(B)≠0 oraz P(A∩B) = P(A)P(B) , to zdarzenie A nie zaleŜy od zdarzenia B. Definicja 8 Jeśli zdarzenia A i B spełniają warunek P(A∩B) = P(A)P(B) , to zdarzenia te nazywamy niezaleŜnymi. Twierdzenie 11 Jeśli zdarzenia A i B są niezaleŜne, to P(A∪B) = P(A) + P(B) + P(A)P(B). Twierdzenie o prawdopodobieństwie zupełnym (całkowitym) Definicja 9 Zdarzenia Ai, gdzie i przebiega przeliczalny zbiór, tworzą w przestrzeni probabilistycznej <Ω,, S, P> układ zupełny, gdy są parami rozłączne oraz U Ai = Ω.. i∈I Twierdzenie 12 Niech zdarzenia Ai, gdzie i przebiega przeliczalny zbiór I, tworzą w przestrzeni probabilistycznej <Ω,, S, P> układ zupełny oraz dla kaŜde z tych zdarzeń ma prawdopodobieństwo niezerowe. Wtedy dla dowolnego zdarzenia losowego B P(B) = ∑ P(Ai) P(B|Ai). i∈I Twierdzenie Bayesa Twierdzenie 13 Niech zdarzenia Ai, gdzie i przebiega przeliczalny zbiór I, tworzą w przestrzeni probabilistycznej <Ω,, S, P> układ zupełny oraz dla kaŜde z tych zdarzeń ma prawdopodobieństwo niezerowe. Wtedy dla dowolnego zdarzenia losowego Ai P(Ai) = P(Ai) P(B|Ai) / ∑ P(Ai) P(B|Ai). i∈I Prawdopodobieństwo P(B|Ai) nazywamy a posteriori, a prawdopodobieństwo P(Ai) – a priori. Przypomnienie niektórych definicji Definicja 10 (przestrzeni metrycznej) Układ < X, d>, gdzie X jest niepustym zbiorem, a funkcja d:X×X → R+∪{0} spełnia dla dowolnych x, y ∈ X warunki (1) d(x,y) ≥ 0 i d(x,y) = 0 ⇔ x=y, (2) d(x,y) = d(y,x), (3) d(x,y) + d(y,z) ≥ d(x,z), nazywamy przestrzenią metryczną. Dla dowolnego x0∈X oraz liczby r>0, zbiór K(x0, r) = {x∈X: d(x0, x)<x}, nazywamy kulą otwartą o środku x0 i promieniu r. Dowolny podzbiór F⊆X, taki Ŝe dla dowolnego x0∈A istnieje liczba r>0 spełniająca warunek K(x0, r) ⊆ A, nazywamy zbiorem otwartym w przestrzeni metrycznej <X,d>. Zbiory borelowskie i ciało zbiorów borelowskich Definicja 11 (ciało zbiorów borelowskich) Niech <X,d> jest dowolnie ustaloną przestrzenią metryczną. Rodzinę B(X) zbiorów, do której naleŜą wszystkie zbiory otwarte w tej przestrzeni metrycznej, spełniającą warunki B1. X∈B(X), B2. dla dowolnego ciągu A1, A2,...,An,... zbiorów naleŜących do B(X) A1 ∪ A2 ∪ ...∪ An ∪... ∈ B(X), B3. dla dowolnych zbiorów A, B ∈ B(X), A – B ∈ B(X), nazywamy ciałem zbiorów borelowskich. JeŜeli najmniejszą rodziną zbiorów borelowskich spełniającą warunki B1-B3 oraz zawierającą rodzinę zbiorów B0 jest B(X), to rodzinę B0 nazywamy zbiorem generatorów B(X), a o zbiorach borelowskich mówimy, Ŝe są generowane przez generatory. Twierdzenie 14 Niech <X,d> jest przestrzenią metryczna, gdzie X= Rn, d(x,y) = |x – y| (przestrzeń ta, rozwaŜana jako n-wymiarowa przestrzeń wektorowa, zwana jest przestrzenią euklidesową), dla x,y∈Rn. Wtedy ciało zbiorów borelowskich B(X) jest generowane, przez n-wymiarowe otwarte kostki postaci (a1,∞)× (a2,∞)×...× (an,∞) lub postaci (-∞,a1)× (-∞,a2)×...× (-∞,an) gdzie a1, a2, ..., an ∈ R. Uwaga: B(Rn) będziemy utoŜsamiali z ciałem zbiorów borelowskich określonym na nwymiarowej przestrzeni euklidesowej Zmienne losowe n-wymiarowe Definicja 12 ( jednowymiarowej zmiennej losowej) Dowolną funkcję X:Ω → R określoną dla jakiejś przestrzeni probabilistycznej <Ω, S, P> nazywamy jednowymiarową zmienna losową, gdy ∀x∈R {ω∈Ω Ω:: X(ω)<x} ∈ S. Jeśli nie będzie to prowadziło do nieporozumień, będzie moŜna, dla formuły Φ(X), takiej Ŝe A={ω∈Ω Ω : Φ(X(ω)) }∈ S , pisać zamiast P(A), P(ΦX)). Definicja 13 (n-wymiarowej zmiennej losowej) Dowolną funkcję X:Ω → Rn określoną dla jakiejś przestrzeni probabilistycznej <Ω, S, P> nazywamy n-wymiarową zmienna losową, lub wektorem losowym, gdy istnieje taki układ (X1,X2…,Xn) jednowymiarowych zmiennych losowych, Ŝe ∀(x1,x2,…,xn)∈Rn {ω∈Ω Ω:: X(ω) = (X1(ω),X2(ω),...,Xn(ω)), X1(ω)<x1, ..., Xn(ω)<xn } ∈ S. Rozkład prawdopodobieństwa zmiennej losowej i dystrybuanta zmiennej losowej Definicja 14 (rozkładu prawdopodobieństwa jednowymiarowej zmiennej losowej) Niech funkcja X:Ω → R określona na przestrzeni probabilistycznej <Ω, S, P> jest jednowymiarową zmienna losową. Funkcję PX: B(R)→ <0,1> nazywamy rozkładem prawdopodobieństwa jednowymiarowej zmiennej losowej, gdy dla dowolnego A∈ B(R), {ω∈Ω Ω:: X(ω) ∈A}∈S oraz Ω:: X(ω) ∈A}). PX(A) = P({ω∈Ω Twierdzenie 15 Układ <R, B(R),PX> jest przestrzenią probabilistyczną. Definicja 15 (rozkładu prawdopodobieństwa n-wymiarowej zmiennej losowej) Niech funkcja X:Ω → Rn określona na przestrzeni probabilistycznej <Ω, S, P> jest n-wymiarową zmienna losową (wektorem losowym). Funkcję PX: B(Rn)→ <0,1> nazywamy rozkładem prawdopodobieństwa n-wymiarowej zmiennej losowej, gdy dla dowolnego A∈ B(Rn), {ω∈Ω Ω:: X(ω) ∈A}∈S oraz PX(A) = P({ω∈Ω Ω:: X(ω) ∈A}). Twierdzenie 16 Układ <Rn, B(Rn),PX> jest przestrzenią probabilistyczną. Definicja 16 (dystrybuanty jednowymiarowej zmiennej losowej) Niech funkcja X:Ω → R określona na przestrzeni probabilistycznej <Ω, S, P> jest jednowymiarową zmienna losową. Funkcję FX: R → <0,1> określoną wzorem Ω : X(ω) < x} ), FX(x) =P({ω∈Ω nazywamy dystrybuantą jednowymiarowej zmiennej X. Twierdzenie 17 Dystrybuanta FX: R → <0,1> jednowymiarowej zmiennej X :Ω → R określonej na przestrzeni probabilistycznej <Ω, S, P> następujące własności: F1. Dla liczb a, b ∈ R, takich Ŝe a < b, FX(b) ≥ FX(a), F2. xlim FX(x) = 0 i lim FX(x) = 1, → −∞ x →∞ F3. Dla dowolnej liczby a : lim FX(x) = FX(a), (lewostronna ciągłość FX, x →a − “x→a “ oznacza, Ŝe liczby x dąŜą do a po wartościach x<a ). - Twierdzenie 18 Niech funkcja X:Ω → R określona na przestrzeni probabilistycznej <Ω, S, P> jest jednowymiarową zmienna losową, a funkcja PX: B(R)→ <0,1>, gdzie B(R) jest generowane przez wszystkie przedziały otwarte postaci (-∞,a), jest rozkładem prawdopodobieństwa zmiennej losowej X. Wtedy dystrybuanta FX: R → <0,1> dla dowolnego x∈R wyraŜa się wzorem F4. FX(x) =PX((-∞, x)), oraz dla liczb a, b ∈ R, takich Ŝe a < b, F5. PX(<a, b)) = FX(b) - FX(a). Twierdzenie 19 Niech funkcja F: R → <0,1> spełnia warunki F1-F3, a B(R) jest ciałem borelowskim generowanym przez wszystkie przedziały otwarte postaci (-∞,a). Istnieje funkcja P: B(R)→ <0,1> , taka, Ŝe P((-∞,x)) = F(x) oraz układ <R, B(R), P> jest przestrzenią probabilistyczną (zwany jest teŜ standardowym modelem przestrzeni probabilistycznej dla dystrybuanty F). Ponadto, funkcja toŜsamościowa X: R → R jest zmienną losową w tej przestrzeni, taką Ŝe rozkład jej prawdopodobieństwa FX = F. Krótko: kaŜda funkcja spełniająca warunki F1F3 jest dystrybuantą pewnej zmiennej losowej w jakiejś przestrzeni probabilistycznej. Istotą stosowania metod probabilistycznych w informatyce jest takie kodowanie danych opisujących przestrzeń probabilistyczną, aby reprezentacje danych opisywały pewien standardowy model przestrzeni probabilistycznej dla dobrze zbadanej przez matematyków funkcji o własnościach dystrybuanty F1-F3. Dobór tej funkcji powinien być przetestowany przez zastosowanie stosownych testów zgodności. Badane w eksperymencie losowym własności powinny być opisywane przez poprawnie zbudowane w języku analizy matematycznej formuły Φ takie, Ŝe {x∈R: Φ(x) } ∈ B(R) jest zdarzeniem losowym w standardowym modelu <R, B(R), P> - mówimy wtedy o prawdopodobieństwie zdarzenia, w którym formuła Φ(x) jest prawdziwa, a prawdopodobieństwo to oznaczamy: P(Φ(x)) ( w ogólności, {x∈Rn: Φ(x) } ∈B(Rn) jest zdarzeniem losowym w standardowym modelu <R,Zmienna B(Rn), P>).losowa dyskretna Definicja 17 Niech funkcja X:Ω → R określona na przestrzeni probabilistycznej <Ω, S, P> jest jednowymiarową zmienna losową, a funkcja PX: B(R)→ <0,1> jest rozkładem prawdopodobieństwa jednowymiarowej zmiennej losowej. Zmienną losową X nazywamy dyskretną (typu skokowego), gdy istnieje przeliczalny zbiór S∈ B(R) taki, Ŝe PX(S) = 1 oraz ∀x∈S {ω∈Ω Ω:: X(ω) = x} ∈ S. Ω:: X(ω) = x}) Oznaczenie: fX(x) = PX({ω∈Ω Twierdzenie 20 Niech X :Ω → R jest dyskretną zmienną losowa o rozkładzie prawdopodobieństwa PX: B(R)→ <0,1> oraz zbiór S∈ B(R) jest zbiorem przeliczalnym takim, Ŝe PX(S) = 1. Wtedy (1) dla kaŜdego przeliczalnego zbioru S1∈ B(R) takiego, Ŝe PX(S1) = 1 jest S=S1, (2) ∀x∈S {ω∈Ω Ω:: X(ω) = x} ∈ S, (3) jeŜeli A∈ B(R) i A≠∅ oraz A⊆S, to PX(A) = ∑ fX(x), (4) jeŜeli A∈ B(R), to PX(A) = PX(A ∩ S). x∈S Twierdzenie 21 JeŜeli FX: R → <0,1> jest dystrybuantą dyskretnej zmiennej losowej X :Ω → R o rozkładzie prawdopodobieństwa PX: B(R)→ <0,1>, określonej na przestrzeni probabilistycznej <Ω, S, P>, oraz S0 jest przeliczalnym zbiorem naleŜącym do B(R) takim, Ŝe PX(S0) = 1, to dla dowolnego x∈ R A. jeśli x ∉ S0, to fX(x) = 0, n B. FX(x) = ∑ i =1 fX(yi), dla S0 = {y1, y2, ... , yn} ∞ C. FX(x) = ∑ fX(yi), dla S0 = {y1, y2, ... , yn, ...}. i =1 Ćwiczenie poszerzające wiedzę Korzystając z definicji przestrzeni probabilistycznej ustal następujące składniki wiedzy: • warunki poprawności opisu zdarzenia elementarnego • warunki poprawności opisu zdarzenia losowego • komputerowa implementacja przeliczalnie addytywnego ciała zdarzeń losowych: implementacja w arkuszu kalkulacyjnym (ewentualnie w znanym studentom języku programowania) list danych jako zbiorów oraz implementacja działań na zbiorach • częstość występowania zdarzenia a prawdopodobieństwo • błędne rozumienie przypadkowości (losowości) - nieprzewidywalność, Paradoks Bertranda • ciało zbiorów borelowskich, zmienne losowe w przestrzeniach probabilistycznych Zmienna losowa ciągła Definicja 18 (zmiennej losowej ciągłej) Niech funkcja X:Ω → R określona na przestrzeni probabilistycznej <Ω, S, P> jest jednowymiarową zmienna losową, a funkcja F: R → <0,1> jej dystrybuantą. Zmienną X nazywamy ciągłą lub typu ciągłego, jeśli istnieje taka funkcja f: R → R, Ŝe dla kaŜdego x jest x F(x) = ∫ f (u )du . −∞ Funkcję f nazywamy gęstością prawdopodobieństwa zmiennej losowej X lub krótko: gęstością. Twierdzenie 22 Niech funkcja X:Ω → R określona na przestrzeni probabilistycznej <Ω, S, P> jest jednowymiarową zmienna losową typu ciągłego oraz posiada rozkład prawdopodobieństwa PX:B(R1) → <0,1>, a funkcja F: R → <0,1> jej dystrybuantą. Będziemy, dla formuły Φ(X), takiej Ŝe A={ω∈Ω Ω : Φ(X(ω)) }∈ S , pisać zamiast P(A), P(Φ(X)). Zachodzą następujące równości: (0) dla dowolnego zdarzenia losowego A∈ S, X(A)∈ B(R1) mamy P(A) = ∫ f (u )du , X ( A) dla obszaru całkowania P(a≤ X < b)= P(<a,b))= P((a,b)) =P(<a,b>) = (1) b P((a,b>) = F(b) – F(a) = ∫ f (u )du , uwaga: a moŜe a wynosić -∞ oraz b moŜe wynosić +∞, wtedy F(-∞)=0, a F(+∞)=1, F’(x) = f(x) = ∆lim P(x≤ X < x+∆x)/∆x , x →0 (2) +∞ ∫ f (u )du = 1, (3) −∞ (4) dla kaŜdej liczby rzeczywistej a P(X=a) = 0. Uwaga: w celu rozróŜnienia oznaczeń funkcji rozkładu prawdopodobieństwa danej zmiennej losowej X oraz funkcji gęstości tego rozkładu od oznaczeń tego typu funkcji dla innych zmiennych losowych, będziemy uŜywali oznaczeń, jak x we wzorze: FX(x) = ∫f X (u )du . −∞ Definicja 19 (funkcji dystrybuanty) Dowolna funkcję F: R → <0,1>, spełniającą następujące własności: F1. Dla liczb a, b ∈ R, takich Ŝe a < b, F(b) ≥ F(a) – funkcja F zwana jest wtedy niemalejącą, F2. xlim F (x) = 0 i lim F (x) = 1, → −∞ x →∞ F3. Dla dowolnej liczby a : lim F (x) = F (a), x→a − nazywamy funkcją dystrybuanty. Jeśli ponadto istnieje taka funkcja f: R → R+, Ŝe dla kaŜdego x jest x F(x) = ∫ f (u )du , −∞ to tę funkcję rozkładu nazywamy bezwzględnie ciągłą. Twierdzenie 23 (o przestrzeni probabilistycznej indukowanej przez bezwzględnie ciągłą funkcję rozkładu) x Dla dowolnej bezwzględnie ciągłej funkcji rozkładu F(x) = ∫ f (u )du oraz −∞ dowolnego ciała borelowskiego B(R ), jeśli funkcja P: B(R ) → <0,1>, dla 1 dowolnego A∈ B(R1), określona jest wzorem P(A) = 1 ∫ f (u)du , A <R, B(R), P> jest przestrzenią probabilistyczną. to układ Twierdzenie 24 Niech funkcje X:Ω → R, Y:Ω → R określone na przestrzeni probabilistycznej <Ω, S, P> są jednowymiarowymi zmiennymi losowymi typu ciągłego, a g:R→R jest dowolną róŜnowartościową funkcją róŜniczkowalną o ciągłej pierwszej pochodnej g’(x)≠ 0, dla kaŜdego x∈R. JeŜeli zmienna losowa Y=g(X), to jej gęstość fX(g-1(y))/|g’(g-1(y))| g ( x) < y < sup g ( x) , dla inf x∈R 0 w pozostałych przypadkach. x∈R fY(y) = Definicja 20 (kwantylu i mody) Liczbę xp spełniającą, dla funkcji rozkładu F i liczby p∈<0,1>, równość F(xp)=p, nazywamy kwantylem rzędu p (p-kwantem) funkcji rozkładu. Dla p=1/2 kwantyl nazywamy medianą funkcji rozkładu, a dla p=1/4: kwartylem. Jeśli gęstość f(x) funkcji rozkładu F(x) ma lokalne maksimum w punkcie x0, to x0 nazywamy modą f(x).