Pojęcie przestrzeni probabilistyczne

advertisement
Pojęcie przestrzeni probabilistycznej
Definicja 1 (przestrzeni probabilistycznej)
Uporządkowany układ < Ω, S, P> nazywamy przestrzenią probabilistyczną jeśli
(Ω )
Ω jest niepustym zbiorem zwanym przestrzenia zdarzeń elementarnych,
(S) rodzina zbiorów S⊆P(Ω) (P(X) jest rodziną wszystkich podzbiorów
zbioru X) spełnia warunki
S1. Ω∈S,
S2. dla dowolnego ciągu A1, A2,...,An,... zbiorów naleŜących do S
A1 ∪ A2 ∪ ...∪ An ∪... ∈ S,
S3. dla dowolnych zbiorów A, B ∈ S, A – B ∈ S,
(P) P:S → <0,1> jest funkcją zwaną rozkładem prawdopodobieństwa,
przyporządkowującą zbiory z rodziny S liczbom rzeczywistym, spełniającą
warunki;
P1. dla kaŜdego A∈Ω
Ω, P(A)≥0,
P2. P(Ω) = 1,
P3. dla dowolnego ciągu A1, A2,...,An,... zbiorów parami rozłącznych
naleŜących do S
P(A1 ∪ A2 ∪ ...∪ An ∪...) = P(A1 ) ∪ P(A2 ) ∪ ...∪ P(An ) ∪... .
Wtedy rodzinę S nazywamy ciałem przeliczalnie addytywnym zdarzeń lub
σ-ciałem (czyt.: sigma ciałem), elementy S nazywamy zdarzeniami losowymi, a
wartość rozkładu prawdopodobieństwa dla danego zdarzenia –
prawdopodobieństwem tego zdarzenia. Zdarzenia Ω, ∅, nazywamy
odpowiednio: pewnym, niemoŜliwym. JeŜeli A jest zdarzeniem losowym, to
A’=Ω−A jest zdarzeniem losowym, nazywamy je zdarzeniem przeciwnym do
zdarzenia A.
Eksperyment (obserwację) nazywamy losowym (losową) jeśli moŜemy opisać
go (ją) jako przestrzeń probabilistyczną, w której elementy przestrzeni
zdarzeń elementarnych interpretujemy jako rozłączne wyniki eksperymentu
(obserwacji), nazywając je zdarzeniami elementarnymi, a badane podczas
eksperymentu (obserwacji) dobrze określone zbiory wyników są interpretacją
zdarzeń losowych i dlatego nazywane są zdarzeniami losowymi lub
przypadkowymi.
Twierdzenie 1
W dowolnej przestrzeni probabilistycznej < Ω, S, P>, dla dowolnych zdarzeń
losowych A, B :
1) P(∅) = 0,
2) P(A’) = 1 − P(A),
3) JeŜeli A ⊆ B, to P(B) ≥ P(A),
4) P(A ∪ B) = P(A) + P(B) − P(A ∩ B),
5) P(A) + P(B) ≥ P(A ∪ B),
6) JeŜeli A ⊆ B, to P(A −B) = P(B) − P(A).
Twierdzenie 2
W dowolnej przestrzeni probabilistycznej < Ω, S, P>, dla dowolnego
stępującego ciągu zdarzeń losowych {Bn} (tj. Bn+1 ⊂ Bn), takiego Ŝe
∞
I
Bn = B ∈ S,
n =1
zachodzi równość
P3*
lim P(Bn) = P(B),
n →∞
ponadto warunki P3 i P3* są równowaŜne.
Dyskretne modele przestrzeni probabilistycznych
Definicja 2
Klasyczne prawdopodobieństwo
Niech Ω = {ω1, ω2, … , ωn}, S = P (Ω).Określmy funkcję P:S → <0,1>
następująco: dla dowolnego zbioru A∈ P (Ω)
P(A) = |A|/n,
gdzie |A| jest liczbą elementów w zbiorze A. Zachodzi wtedy
Twierdzenie 3
Układ <Ω, S, P> jest przestrzenią probabilistyczną.
Wartość P(A) = |A|/n nazywamy prawdopodobieństwem klasycznym zdarzenia
losowego A, mówimy, Ŝe: prawdopodobieństwo zdarzenia losowego A jest
ilorazem liczby zdarzeń elementarnych sprzyjających zajściu zdarzenia A i
liczby wszystkich zdarzeń. Opisaną w twierdzeniu przestrzeń probabilistyczną
nazywa się schematem klasycznym losowania lub klasycznym schematem
probabilistycznym, a przestrzeń probabilistyczną < Ω, S, P> - klasyczną
przestrzenią probabilistyczną
Definicja 3
Schemat losowania bez zwracania i ze zwracaniem
Niech będzie dany n-elementowy zbiór {a1, a2, … , an}, który nazywać będziemy
populacją generalną. Dowolny k-elemntowy ciąg elementów populacji
generalnej nazywać będziemy próbką o liczebności k. JeŜeli ten ciąg (próbkę)
tworzymy w ten sposób, Ŝe kaŜdy element ciągu wybieramy ze zbioru powstałego
z populacji generalnej przez usunięcie juŜ wcześniej wybranych elementów
ciągu, to nazywamy go próbką bez zwracania. Jest ona po prostu
róŜnowartościowym ciągiem. Liczba wszystkich k-wyrazowych próbek bez
zwracania, zwana jest w kombinatoryce liczbą k-wyrazowych wariacji bez
powtórzeń (Vnk), wynosi
Vnk = n(n-1)(n-2)…(n-k+1).
Dla k=n,
Vnn = 1*2*...*n = n!.
JeŜeli próbka powstaje w ten sposób, Ŝe kaŜdy element ciągu po wybraniu z
populacji generalnej zostaje zapamiętany i „zwrócony z powrotem”, co
oznacza, Ŝe następny element ciągu wybieramy z tego samego zbioru co
poprzedni element, to taką próbkę nazywamy próbka ze zwracaniem. Liczba
wszystkich k-wyrazowych próbek ze zwracaniem, zwana jest w kombinatoryce
liczbą k-wyrazowych wariacji z powtórzeniami (Wnk), wynosi
Wnk =nk.
Schemat klasyczny losowania dla Ω ={wszystkie próbki bez zwracania}
nazywamy schematem losowania bez zwracania.
Schemat klasyczny losowania dla Ω ={wszystkie próbki ze zwracaniem}
nazywamy schematem losowania ze zwracaniem.
Liczba k-elementowych próbek bez zwracania róŜniących się tylko porządkiem
elementów (wtedy nazywamy je permutacjami k-elementowego zbioru) wynosi
k! = 1*2*...*k. Liczba sposobów wyboru próbek róŜniących się tylko składem
(liczba kombinacji) wynosi
k 
Vnk/k! =   , n ≥ k ≥ 0.
n
 
Definicja 5
Rozkład hipergeometryczny
Dana jest n-elementowa populacja generalna oraz jej n1-elementowy podzbiór
C elementów posiadających pewną wyróŜnioną cechę. Liczba wszystkich kelementowych kombinacji posiadających dokładnie k1≥0 elementów ze zbioru C
wynosi
 n1  n − n1 
 
 .
 k1  k − k1 
Niech Ω = {k-elementowe kombinacje populacji generalnej}, ponadto niech dla
dowolnego k1, k ≥ k1 ≥ 0, zbiór Gk1 kombinacji k-elementowych posiadających
dokładnie k1 elementów zbioru C jest generatorem ciała przeliczalnie
addytywnego S. Z określenia generatorów Gk1 wynika, Ŝe są one rozłączne, a
więc kaŜdy element S jest zbiorem pustym lub sumą generatorów. Aby określić
rozkład prawdopodobieństwa P wystarczy zastosować schemat klasyczny
prawdopodobieństwa:
P(A) = |A|/|Ω|,
n
k 
gdzie A∈S, |Ω| =   , a dla generatorów Gk1
 n  n − n   n 
1
 /   .
P(Gk1) =P n ,n (k1,k) =  1 
−
k
k
k
1  k 
 1 
1
Wtedy
Twierdzenie 4
Układ <Ω, S, P> jest przestrzenią probabilistyczną.
Schemat Bernoulliego
Przypuśćmy, Ŝe z populacji generalnej składającej się z dwóch elementów {0,1}
pobieramy próbkę ze zwracaniem o liczebności r. Niech Ω jest zbiorem
wszystkich takich próbek, S = P (Ω
Ω), a p jest dowolną liczba z przedziału (0,1).
Określmy funkcję P:S → <0,1> następująco:
(1) jeŜeli w próbce ω∈Ω
Ω jest dokładnie k jedynek, to P({ω}) = pk(1-p)r-k,
(2) P(A) = ∑ P({ω})
ω∈A
(3) jeŜeli A jest zbiorem do którego naleŜą tylko próbki zawierające dokładnie k
r
jedynek, to P(A) = P(k,r) =   pk(1-p)r-k.
k
 
Wtedy
Twierdzenie 5
Układ <Ω, S, P> jest przestrzenią probabilistyczną.
Prawdopodobieństwo warunkowe
Twierdzenie 6
JeŜeli B jest zdarzeniem losowym w klasycznej przestrzeni probabilistycznej
< Ω, S, P> oraz P(B)≠0, a SB = {S∈S: S⊆B}.
Określmy funkcję PB: S B→ <0,1> następująco: dla S∈SB
PB(S) = |S|/|B|.
Wtedy
1. Układ <B,SB, PB> jest przestrzenią probabilistyczną. Gdy oznaczmy dla
dowolnego A∈S, PB(A∩B) = P(A|B), wtedy
P(A|B) = P(A∩B)/P(B).
2. Układ < Ω, S, PB>, gdzie PB(A) =P(A∩B)/P(B), dla dowolnego A∈S, jest
przestrzenią probabilistyczną .
Twierdzenie 7
Niech B jest zdarzeniem losowym w przestrzeni probabilistycznej < Ω, S, P>
oraz P(B)≠0. Oznaczmy przez SB rodzinę zbiorów {S∈S: S⊆B} oraz
PB(S) = P(S)/P(B).
1. Układ <B,SB, PB> jest przestrzenią probabilistyczną.
2. Układ < Ω, S, PB>, gdzie dla A∈S, PB(A) =P(A∩B)/P(B), jest
przestrzenią probabilistyczną .
Definicja 6
Niech A i B są zdarzeniami losowymi w przestrzeni probabilistycznej < Ω, S, P>
oraz P(B)≠0. Oznaczmy
P(A|B) = P(A∩B)/P(B).
Wtedy P(A|B) nazywamy prawdopodobieństwem zdarzenia A pod
warunkiem zdarzenia B, a dla przestrzeni probabilistycznej < Ω, S, PB>
funkcję PB określoną dla A∈S wzorem PB(A) =P(A∩B)/P(B),nazywamy
warunkowym rozkładem prawdopodobieństwa.
Zdarzenia niezaleŜne
Definicja 7
Niech A i B są zdarzeniami losowymi w przestrzeni probabilistycznej < Ω, S, P>
oraz P(B)≠0 oraz
P(A|B) = P(A).
Wtedy mówimy, Ŝe zdarzenie A niezaleŜny od zdarzenia B.
Twierdzenie 8
JeŜeli zdarzenia A niezaleŜny od zdarzenia B. to
P(A∩B) = P(A)P(B).
Stąd wynika, Ŝe
Twierdzenie 9
Jeśli P(A)≠0 i P(B)≠0, to
zdarzenie A nie zaleŜy od zdarzenia B ⇔ zdarzenie B nie zaleŜy od zdarzenia A.
Twierdzenie 10
Jeśli P(A)≠0 i P(B)≠0 oraz P(A∩B) = P(A)P(B) , to zdarzenie A nie zaleŜy od
zdarzenia B.
Definicja 8
Jeśli zdarzenia A i B spełniają warunek P(A∩B) = P(A)P(B) , to zdarzenia te
nazywamy niezaleŜnymi.
Twierdzenie 11
Jeśli zdarzenia A i B są niezaleŜne, to P(A∪B) = P(A) + P(B) + P(A)P(B).
Twierdzenie o prawdopodobieństwie zupełnym (całkowitym)
Definicja 9
Zdarzenia Ai, gdzie i przebiega przeliczalny zbiór, tworzą w przestrzeni
probabilistycznej <Ω,, S, P> układ zupełny, gdy są parami rozłączne oraz
U Ai = Ω..
i∈I
Twierdzenie 12
Niech zdarzenia Ai, gdzie i przebiega przeliczalny zbiór I, tworzą w przestrzeni
probabilistycznej <Ω,, S, P> układ zupełny oraz dla kaŜde z tych zdarzeń ma
prawdopodobieństwo niezerowe. Wtedy dla dowolnego zdarzenia losowego B
P(B) = ∑ P(Ai) P(B|Ai).
i∈I
Twierdzenie Bayesa
Twierdzenie 13
Niech zdarzenia Ai, gdzie i przebiega przeliczalny zbiór I, tworzą w przestrzeni
probabilistycznej <Ω,, S, P> układ zupełny oraz dla kaŜde z tych zdarzeń ma
prawdopodobieństwo niezerowe. Wtedy dla dowolnego zdarzenia losowego Ai
P(Ai) = P(Ai) P(B|Ai) /
∑
P(Ai) P(B|Ai).
i∈I
Prawdopodobieństwo P(B|Ai) nazywamy a posteriori, a prawdopodobieństwo
P(Ai) – a priori.
Przypomnienie niektórych definicji
Definicja 10 (przestrzeni metrycznej)
Układ < X, d>, gdzie X jest niepustym zbiorem, a funkcja d:X×X → R+∪{0}
spełnia dla dowolnych x, y ∈ X warunki
(1) d(x,y) ≥ 0 i d(x,y) = 0 ⇔ x=y,
(2) d(x,y) = d(y,x),
(3) d(x,y) + d(y,z) ≥ d(x,z),
nazywamy przestrzenią metryczną.
Dla dowolnego x0∈X oraz liczby r>0, zbiór
K(x0, r) = {x∈X: d(x0, x)<x},
nazywamy kulą otwartą o środku x0 i promieniu r.
Dowolny podzbiór F⊆X, taki Ŝe dla dowolnego x0∈A istnieje liczba r>0
spełniająca warunek K(x0, r) ⊆ A, nazywamy zbiorem otwartym w przestrzeni
metrycznej <X,d>.
Zbiory borelowskie i ciało zbiorów borelowskich
Definicja 11 (ciało zbiorów borelowskich)
Niech <X,d> jest dowolnie ustaloną przestrzenią metryczną. Rodzinę B(X)
zbiorów, do której naleŜą wszystkie zbiory otwarte w tej przestrzeni metrycznej,
spełniającą warunki
B1. X∈B(X),
B2. dla dowolnego ciągu A1, A2,...,An,... zbiorów naleŜących do B(X)
A1 ∪ A2 ∪ ...∪ An ∪... ∈ B(X),
B3. dla dowolnych zbiorów A, B ∈ B(X), A – B ∈ B(X),
nazywamy ciałem zbiorów borelowskich. JeŜeli najmniejszą rodziną zbiorów
borelowskich spełniającą warunki B1-B3 oraz zawierającą rodzinę zbiorów B0
jest B(X), to rodzinę B0 nazywamy zbiorem generatorów B(X), a o zbiorach
borelowskich mówimy, Ŝe są generowane przez generatory.
Twierdzenie 14
Niech <X,d> jest przestrzenią metryczna, gdzie X= Rn, d(x,y) = |x – y|
(przestrzeń ta, rozwaŜana jako n-wymiarowa przestrzeń wektorowa, zwana jest
przestrzenią euklidesową), dla x,y∈Rn. Wtedy ciało zbiorów borelowskich B(X)
jest generowane, przez n-wymiarowe otwarte kostki postaci (a1,∞)× (a2,∞)×...×
(an,∞) lub postaci (-∞,a1)× (-∞,a2)×...× (-∞,an) gdzie a1, a2, ..., an ∈ R. Uwaga:
B(Rn) będziemy utoŜsamiali z ciałem zbiorów borelowskich określonym na nwymiarowej przestrzeni euklidesowej
Zmienne losowe n-wymiarowe
Definicja 12 ( jednowymiarowej zmiennej losowej)
Dowolną funkcję X:Ω → R określoną dla jakiejś przestrzeni probabilistycznej
<Ω, S, P> nazywamy jednowymiarową zmienna losową, gdy
∀x∈R {ω∈Ω
Ω:: X(ω)<x} ∈ S.
Jeśli nie będzie to prowadziło do nieporozumień, będzie moŜna, dla formuły
Φ(X), takiej Ŝe A={ω∈Ω
Ω : Φ(X(ω)) }∈ S , pisać zamiast P(A), P(ΦX)).
Definicja 13 (n-wymiarowej zmiennej losowej)
Dowolną funkcję X:Ω → Rn określoną dla jakiejś przestrzeni probabilistycznej
<Ω, S, P> nazywamy n-wymiarową zmienna losową, lub wektorem losowym,
gdy istnieje taki układ (X1,X2…,Xn) jednowymiarowych zmiennych losowych, Ŝe
∀(x1,x2,…,xn)∈Rn {ω∈Ω
Ω:: X(ω) = (X1(ω),X2(ω),...,Xn(ω)),
X1(ω)<x1, ..., Xn(ω)<xn } ∈ S.
Rozkład prawdopodobieństwa zmiennej losowej i dystrybuanta
zmiennej losowej
Definicja 14 (rozkładu prawdopodobieństwa jednowymiarowej zmiennej
losowej)
Niech funkcja X:Ω → R określona na przestrzeni probabilistycznej <Ω, S, P>
jest jednowymiarową zmienna losową. Funkcję PX: B(R)→ <0,1> nazywamy
rozkładem prawdopodobieństwa jednowymiarowej zmiennej losowej, gdy dla
dowolnego A∈ B(R), {ω∈Ω
Ω:: X(ω) ∈A}∈S oraz
Ω:: X(ω) ∈A}).
PX(A) = P({ω∈Ω
Twierdzenie 15
Układ <R, B(R),PX> jest przestrzenią probabilistyczną.
Definicja 15 (rozkładu prawdopodobieństwa n-wymiarowej zmiennej losowej)
Niech funkcja X:Ω → Rn określona na przestrzeni probabilistycznej <Ω, S, P>
jest n-wymiarową zmienna losową (wektorem losowym). Funkcję PX: B(Rn)→
<0,1> nazywamy rozkładem prawdopodobieństwa n-wymiarowej zmiennej
losowej, gdy dla dowolnego A∈ B(Rn), {ω∈Ω
Ω:: X(ω) ∈A}∈S oraz
PX(A) = P({ω∈Ω
Ω:: X(ω) ∈A}).
Twierdzenie 16
Układ <Rn, B(Rn),PX> jest przestrzenią probabilistyczną.
Definicja 16 (dystrybuanty jednowymiarowej zmiennej losowej)
Niech funkcja X:Ω → R określona na przestrzeni probabilistycznej <Ω, S, P>
jest jednowymiarową zmienna losową. Funkcję FX: R → <0,1> określoną
wzorem
Ω : X(ω) < x} ),
FX(x) =P({ω∈Ω
nazywamy dystrybuantą jednowymiarowej zmiennej X.
Twierdzenie 17
Dystrybuanta FX: R → <0,1> jednowymiarowej zmiennej X :Ω → R określonej
na przestrzeni probabilistycznej <Ω, S, P> następujące własności:
F1. Dla liczb a, b ∈ R, takich Ŝe a < b, FX(b) ≥ FX(a),
F2. xlim
FX(x) = 0 i lim
FX(x) = 1,
→ −∞
x →∞
F3.
Dla dowolnej liczby a : lim FX(x) = FX(a), (lewostronna ciągłość FX,
x →a −
“x→a “ oznacza, Ŝe liczby x dąŜą do a po wartościach x<a ).
-
Twierdzenie 18
Niech funkcja X:Ω → R określona na przestrzeni probabilistycznej <Ω, S, P>
jest jednowymiarową zmienna losową, a funkcja PX: B(R)→ <0,1>, gdzie B(R)
jest generowane przez wszystkie przedziały otwarte postaci (-∞,a), jest
rozkładem prawdopodobieństwa zmiennej losowej X.
Wtedy dystrybuanta FX: R → <0,1> dla dowolnego x∈R wyraŜa się wzorem
F4.
FX(x) =PX((-∞, x)),
oraz dla liczb a, b ∈ R, takich Ŝe a < b,
F5.
PX(<a, b)) = FX(b) - FX(a).
Twierdzenie 19
Niech funkcja F: R → <0,1> spełnia warunki F1-F3, a B(R) jest ciałem
borelowskim generowanym przez wszystkie przedziały otwarte postaci (-∞,a).
Istnieje funkcja P: B(R)→ <0,1> , taka, Ŝe P((-∞,x)) = F(x) oraz układ
<R, B(R), P> jest przestrzenią probabilistyczną (zwany jest teŜ standardowym
modelem przestrzeni probabilistycznej dla dystrybuanty F). Ponadto, funkcja
toŜsamościowa X: R → R jest zmienną losową w tej przestrzeni, taką Ŝe rozkład
jej prawdopodobieństwa FX = F. Krótko: kaŜda funkcja spełniająca warunki F1F3 jest dystrybuantą pewnej zmiennej losowej w jakiejś przestrzeni
probabilistycznej.
Istotą stosowania metod probabilistycznych w informatyce jest takie kodowanie
danych opisujących przestrzeń probabilistyczną, aby reprezentacje danych opisywały
pewien standardowy model przestrzeni probabilistycznej dla dobrze zbadanej
przez matematyków funkcji o własnościach dystrybuanty F1-F3. Dobór tej
funkcji powinien być przetestowany przez zastosowanie stosownych testów
zgodności. Badane w eksperymencie losowym własności powinny być opisywane
przez poprawnie zbudowane w języku analizy matematycznej formuły Φ takie, Ŝe
{x∈R: Φ(x) } ∈ B(R) jest zdarzeniem losowym w standardowym modelu
<R, B(R), P> - mówimy wtedy o prawdopodobieństwie zdarzenia, w którym formuła
Φ(x) jest prawdziwa, a prawdopodobieństwo to oznaczamy: P(Φ(x)) ( w ogólności,
{x∈Rn: Φ(x) } ∈B(Rn) jest zdarzeniem losowym w standardowym modelu
<R,Zmienna
B(Rn), P>).losowa dyskretna
Definicja 17
Niech funkcja X:Ω → R określona na przestrzeni probabilistycznej <Ω, S, P>
jest jednowymiarową zmienna losową, a funkcja PX: B(R)→ <0,1> jest
rozkładem prawdopodobieństwa jednowymiarowej zmiennej losowej. Zmienną
losową X nazywamy dyskretną (typu skokowego), gdy istnieje przeliczalny zbiór
S∈ B(R) taki, Ŝe PX(S) = 1 oraz
∀x∈S {ω∈Ω
Ω:: X(ω) = x} ∈ S.
Ω:: X(ω) = x})
Oznaczenie: fX(x) = PX({ω∈Ω
Twierdzenie 20
Niech X :Ω → R jest dyskretną zmienną losowa o rozkładzie
prawdopodobieństwa PX: B(R)→ <0,1> oraz zbiór S∈ B(R) jest zbiorem
przeliczalnym takim, Ŝe PX(S) = 1. Wtedy
(1) dla kaŜdego przeliczalnego zbioru S1∈ B(R) takiego, Ŝe PX(S1) = 1 jest
S=S1,
(2) ∀x∈S {ω∈Ω
Ω:: X(ω) = x} ∈ S,
(3) jeŜeli A∈ B(R) i A≠∅ oraz A⊆S, to PX(A) = ∑ fX(x),
(4)
jeŜeli A∈ B(R), to PX(A) = PX(A ∩ S).
x∈S
Twierdzenie 21
JeŜeli FX: R → <0,1> jest dystrybuantą dyskretnej zmiennej losowej X :Ω → R
o rozkładzie prawdopodobieństwa PX: B(R)→ <0,1>, określonej na przestrzeni
probabilistycznej <Ω, S, P>, oraz S0 jest przeliczalnym zbiorem naleŜącym do
B(R) takim, Ŝe PX(S0) = 1, to dla dowolnego x∈ R
A.
jeśli x ∉ S0, to fX(x) = 0,
n
B.
FX(x) =
∑
i =1
fX(yi), dla S0 = {y1, y2, ... , yn}
∞
C.
FX(x) =
∑
fX(yi), dla S0 = {y1, y2, ... , yn, ...}.
i =1
Ćwiczenie poszerzające wiedzę
Korzystając z definicji przestrzeni probabilistycznej ustal następujące składniki wiedzy:
• warunki poprawności opisu zdarzenia elementarnego
• warunki poprawności opisu zdarzenia losowego
• komputerowa implementacja przeliczalnie addytywnego ciała zdarzeń losowych:
implementacja w arkuszu kalkulacyjnym (ewentualnie w znanym studentom
języku programowania) list danych jako zbiorów oraz implementacja działań na
zbiorach
• częstość występowania zdarzenia a prawdopodobieństwo
• błędne rozumienie przypadkowości (losowości) - nieprzewidywalność, Paradoks
Bertranda
• ciało zbiorów borelowskich, zmienne losowe w przestrzeniach probabilistycznych
Zmienna losowa ciągła
Definicja 18 (zmiennej losowej ciągłej)
Niech funkcja X:Ω → R określona na przestrzeni probabilistycznej <Ω, S, P>
jest jednowymiarową zmienna losową, a funkcja F: R → <0,1> jej
dystrybuantą. Zmienną X nazywamy ciągłą lub typu ciągłego, jeśli istnieje taka
funkcja f: R → R, Ŝe dla kaŜdego x jest
x
F(x) =
∫ f (u )du .
−∞
Funkcję f nazywamy gęstością prawdopodobieństwa zmiennej losowej X lub
krótko: gęstością.
Twierdzenie 22
Niech funkcja X:Ω → R określona na przestrzeni probabilistycznej <Ω, S, P>
jest jednowymiarową zmienna losową typu ciągłego oraz posiada rozkład
prawdopodobieństwa PX:B(R1) → <0,1>, a funkcja F: R → <0,1> jej
dystrybuantą.
Będziemy, dla formuły Φ(X), takiej Ŝe A={ω∈Ω
Ω : Φ(X(ω)) }∈ S , pisać
zamiast P(A), P(Φ(X)). Zachodzą następujące równości:
(0) dla dowolnego zdarzenia losowego A∈ S,
X(A)∈ B(R1) mamy
P(A) =
∫ f (u )du ,
X ( A)
dla obszaru całkowania
P(a≤ X < b)= P(<a,b))= P((a,b)) =P(<a,b>) =
(1)
b
P((a,b>) = F(b) – F(a) =
∫ f (u )du , uwaga: a moŜe
a
wynosić -∞ oraz b moŜe wynosić +∞, wtedy F(-∞)=0,
a F(+∞)=1,
F’(x) = f(x) = ∆lim
P(x≤ X < x+∆x)/∆x ,
x →0
(2)
+∞
∫ f (u )du = 1,
(3)
−∞
(4)
dla kaŜdej liczby rzeczywistej a P(X=a) = 0.
Uwaga: w celu rozróŜnienia oznaczeń funkcji rozkładu prawdopodobieństwa
danej zmiennej losowej X oraz funkcji gęstości tego rozkładu od oznaczeń tego
typu funkcji dla innych zmiennych losowych, będziemy uŜywali oznaczeń, jak
x
we wzorze: FX(x) =
∫f
X
(u )du .
−∞
Definicja 19 (funkcji dystrybuanty)
Dowolna funkcję F: R → <0,1>, spełniającą następujące własności:
F1. Dla liczb a, b ∈ R, takich Ŝe a < b, F(b) ≥ F(a) – funkcja F zwana jest
wtedy niemalejącą,
F2. xlim
F (x) = 0 i lim
F (x) = 1,
→ −∞
x →∞
F3.
Dla dowolnej liczby a : lim F (x) = F (a),
x→a −
nazywamy funkcją dystrybuanty.
Jeśli ponadto istnieje taka funkcja f: R → R+, Ŝe dla kaŜdego x jest
x
F(x) =
∫ f (u )du ,
−∞
to tę funkcję rozkładu nazywamy bezwzględnie ciągłą.
Twierdzenie 23 (o przestrzeni probabilistycznej indukowanej przez
bezwzględnie ciągłą funkcję rozkładu)
x
Dla dowolnej bezwzględnie ciągłej funkcji rozkładu F(x) =
∫ f (u )du
oraz
−∞
dowolnego ciała borelowskiego B(R ), jeśli funkcja P: B(R ) → <0,1>, dla
1
dowolnego A∈ B(R1), określona jest wzorem P(A) =
1
∫ f (u)du ,
A
<R, B(R), P> jest przestrzenią probabilistyczną.
to układ
Twierdzenie 24
Niech funkcje X:Ω → R, Y:Ω → R określone na przestrzeni probabilistycznej
<Ω, S, P> są jednowymiarowymi zmiennymi losowymi typu ciągłego, a g:R→R
jest dowolną róŜnowartościową funkcją róŜniczkowalną o ciągłej pierwszej
pochodnej g’(x)≠ 0, dla kaŜdego x∈R. JeŜeli zmienna losowa Y=g(X), to jej
gęstość
fX(g-1(y))/|g’(g-1(y))|
g ( x) < y < sup g ( x) ,
dla inf
x∈R
0
w pozostałych przypadkach.
x∈R
fY(y) =
Definicja 20 (kwantylu i mody)
Liczbę xp spełniającą, dla funkcji rozkładu F i liczby p∈<0,1>, równość
F(xp)=p, nazywamy kwantylem rzędu p (p-kwantem) funkcji rozkładu. Dla
p=1/2 kwantyl nazywamy medianą funkcji rozkładu, a dla p=1/4: kwartylem.
Jeśli gęstość f(x) funkcji rozkładu F(x) ma lokalne maksimum w punkcie x0, to x0
nazywamy modą f(x).
Download