Kalkulator prawdopodobieństwa i wybrane rozkłady zmiennych

advertisement
Kalkulator prawdopodobieństwa i wybrane rozkłady zmiennych losowych
typu skokowego i typu ciągłego
Rozkłady typu skokowego (dyskretnego)
Rozkład dwumianowy (Bernoulliego, binominalny) służy do wyznaczenia
prawdopodobieństwa, tego, że podczas realizacji n doświadczeń osiągniemy k sukcesów
(k ≤ n):
B(n, p, k )  P( X  k )  Cnk p k q nk
gdzie Cnk jest kombinacją: Cnk 
n!
.
k!n  k !
Dystrybuanta:
F ( x)  P( X  x)   Cnk p k q nk
0 k  x
Wartość oczekiwana:
E(X) = np
Wariancja:
V(X) = npq
Zmienna losowa o rozkładzie dwumianowym opisuje eksperyment noszący nazwę prób
Bernoulliego – dlatego rozkład ten nazywany jest także rozkładem Bernoulliego.
Eksperyment polega na przeprowadzeniu n (n ≥ 2) niezależnych doświadczeń, wynikiem
może być tylko jedno z dwóch możliwych stanów: sukces lub porażka:
 prawdopodobieństwo stanu, który został uznany za sukces jest takie samo w kolejnych
doświadczeniach (p), prawdopodobieństwo niepowodzenia q łączy się z p zależnością:
p + q = 1;
 doświadczenia są niezależne, tzn. wynik poprzedniego nie wpływa na wynik
następnego;
Funkcja rozkładu dwumianowego zależy od dwóch parametrów: liczby doświadczeń n i
prawdopodobieństwa sukcesu p;
 dla p = q = 1/2 rozkład dwumianowy jest symetryczny, dla p ≠ q rozkład jest
asymetryczny, jeżeli p < 1/2 – prawostronnie asymetryczny, dla p > 1/2 –
lewostronnie asymetryczny.
Ćwiczenie 1.
- Otworzyć plik rozkład_dwumianowy_1.sta
- Zapoznać się z treścią zadania umieszczoną w nagłówku pliku.
Celem analizy jest wyrównanie rozkładu empirycznego do rozkładu dwumianowego.
- Korzystając z Statystyka/Dopasowanie rozkładów/Rozkłady dyskretne wybrać typ
Dwumianowy.
Wykonać Wykres rozkładu obserw. i oczekiwanego.
Wykonać obliczenia na karcie: Podsum. Rozkład obserwowany i oczekiwany
(rozróżnić parametry obserwowane i oczekiwane).
- Obliczyć: wartość oczekiwaną, wariancję i odchylenie standardowe tej zmiennej losowej.
- Obliczyć prawdopodobieństwa wybranych realizacji zmiennej losowej, przyjmując stałą
wartość prawdopodobieństwa p dla tego typu rozkładu zgodnie z zależnością:
B( n, p, k )  P( X  k )  Cnk p k q n  k
n
n!
(Uwaga! p+q=1 , stąd q=1-p oraz Cnk    
)
 k  k!(n  k)!
- Obliczyć wartość teoretyczną (oczekiwaną) liczebności n̂k dla wybranej wartości k sprawdzić otrzymany wynik na wykresie rozkładu oczekiwanego.
- Dokonać interpretacji otrzymanych wyników.
Ćwiczenie 2.
Zadanie 1.
Pewna gra polega na 6-krotnym rzucaniu symetryczną monetą. Wygrywa ta osoba, która
uzyska w rzutach najwięcej orłów. W tabeli przedstawiony jest rozkład prawdopodobieństwa
pojawienia się w sześciu rzutach samych reszek (zero orłów), 1, 2, 3, 4, 5, 6 orłów. (X zmienna losowa - określająca liczbę orłów (liczbę sukcesów) w sześciu rzutach symetryczną
monetą).
k
P(X=k)
P(X<=k) F(x)=P(X<k)
P(X>k)
P(X>=k)
0 0,015625 0,015625
0 0,984375
1
1
0,09375 0,109375
0,015625 0,890625 0,984375
2 0,234375
0,34375
0,109375
0,65625 0,890625
3
0,3125
0,65625
0,34375
0,34375
0,65625
4 0,234375 0,890625
0,65625 0,109375
0,34375
5
0,09375 0,984375
0,890625 0,015625 0,109375
6 0,015625
1
0,984375
0 0,015625
Obliczyć prawdopodobieństwa otrzymania w sześciu rzutach:
1) co najmniej jednego orła,
2) więcej niż 3 orły.
Uwaga!
Zmienną losową jest liczba uzyskanych orłów w 6–krotnym rzucie monetą (liczba sukcesów).
Prawdopodobieństwo sukcesu (prawdopodobieństwo uzyskania orła w pojedynczym rzucie) i
prawdopodobieństwo porażki (prawdopodobieństwo uzyskania reszki w pojedynczym rzucie)
jest równe 0,5.
B( n, p, k )  P( X  k )  Cnk p k q n  k
Ćwiczenie 3.
Rozkład Poissona jest rozkładem granicznym rozkładu dwumianowego, zachodzącym wtedy,
gdy prawdopodobieństwo p sukcesu jest małe, a liczba realizacji n na tyle duża, że np = λ.
Rozkład Poissona stosuje się jako przybliżenie rozkładu dwumianowego, gdy
prawdopodobieństwo sukcesu jest mniejsze niż 0,2, a liczba doświadczeń jest równa co
najmniej 20 (W niektórych pozycjach literaturowych 30 lub nawet 100. Stawia się też
niekiedy warunek na np = λ, postulując by ten iloczyn nie przekraczał 5).
Funkcja rozkładu prawdopodobieństwa określona jest jako:
P( X  k ) 
k
e 
k!
Dystrybuanta rozkładu Poissona określona jest jako:
k
F ( x )   e 
k  x k!
Wartość oczekiwana:
E(X) =  = np
Wariancja:
2 = V(X) = 
Otworzyć plik rozkład_Poissona.sta
- Zapoznać się z treścią zadania umieszczoną w nagłówku pliku i danymi arkusza (rozkład
Poissona jest rozkładem zjawisk rzadkich)
- Korzystając z Statystyka/Dopasowanie rozkładów/Rozkłady dyskretne wybrać typ Poissona.
- Wykonać Wykres rozkładu obserw. i oczekiwanego.
- Wykonać obliczenia na karcie: Podsum. Rozkład obserwowany i oczekiwany
(rozróżnić parametry obserwowane i oczekiwane, czyli wartości rozkładu empirycznego
zmiennej losowej skokowej z wartościami rozkładu wyrównanego do postaci rozkładu
Poissona).
- Zwrócić uwagę na wartość parametru  (dla wartości oczekiwanych, a także obliczyć z
zależności  = np. liczbę p (p =/n))
- Ile wynosi prawdopodobieństwo tego, że wystąpią 3 awarie systemu
k
e   (przypomnienie e = 2,71828)
k!
- Oszacować zgodnie z rozkładem Poissona liczbę dni w roku z 3 awariami systemu.
Zgodnie z . P( X  k ) 
Rozkłady typu ciągłego
Rozkład wykładniczy
Zmienna losowa X ma rozkład wykładniczy z parametrem , jeśli jej funkcja gęstości jest
określona wzorem:
dla x  0
0
f ( x )    x
 λe
dla x  0
Dystrybuanta tej zmiennej jest:
0
F ( x)  
1  e  x
dla x  0
dla x  0
Wartość oczekiwana jest równa E(X)=1/ ; a wariancja wynosi: V(X)=1/2.
Ćwiczenie 4
Produkcja kondensatorów w pewnej fabryce jest całkowicie zautomatyzowana. W okresie
dwuletniej obserwacji zauważono, że rozkład czasu między zejściem z taśmy produkcyjnej
dwóch kolejnych kondensatorów można zapisać za pomocą zmiennej losowej X o rozkładzie
wykładniczym z wartością oczekiwaną równą 20 sekund (E(X)=20).
Obliczyć prawdopodobieństwo tego, że
1) czas między zejściem z taśmy dwóch kolejnych kondensatorów jest krótszy niż 10 sekund
2) czas między zejściem z taśmy dwóch kolejnych kondensatorów jest zawarty w przedziale
(15,20)
3) czas między zejściem z taśmy dwóch kolejnych kondensatorów jest nie krótszy niż 25
sekund.
Wykreślić wykres funkcji gęstości i dystrybuanty rozkładu wykładniczego.
Wartość oczekiwana rozkładu wykładniczego jest równa E(X) = 1/, stąd  = 1/E(X) = 1/20 =
0,05
Rozkład normalny (rozkład Gaussa)
Zmienna losowa X ma rozkład normalny z parametrami μ i σ, jeśli jej funkcja gęstości jest
określona wzorem:
( x )

1
2
f ( x) 
e 2
 2
2
dla : -  x  ;
 0
Dystrybuanta rozkładu normalnego wynosi:
x
1
F ( x )   f ( x ) dx 
 2

x 
e
( x   )2
2 2
dx

Kształt funkcji zależy od wartości parametrów: μ i σ. Parametr μ przesuwa krzywą wzdłuż osi
odciętych, natomiast parametr σ powoduje, że krzywa jest bardziej spłaszczona lub
wysmukła.
Wykres funkcji gęstości:
- jest symetryczny względem prostej x = μ, co oznacza, że spełniona jest zależność:
P(X > μ) = P(X < μ) = 0,5
- w punkcie x = μ osiąga wartość maksymalną, która wynosi
1
;
f   
 2
- prawdopodobieństwo, że zmienna losowa X przyjmuje wartości z przedziału:
[μ – 3σ; μ + 3σ], jest w przybliżeniu równe jedności (reguła trzech sigm);
- ramiona mają punkty przegięcia (μ  )
Reguła ta mówi, że praktycznie wszystkie wartości (realizacje) zmiennej losowej mieszczą się
w przedziale [μ – 3σ; μ + 3σ]).
Wartość oczekiwana zmiennej o rozkładzie normalnym wynosi: EX    , a wariancja jest
równa: VX    2 .
Uwaga!
Obliczanie prawdopodobieństw dla zmiennej o rozkładzie normalnym o dowolnej wartości μ i
 bez pomocy programu komputerowego jest trudne. Bardzo użyteczna jest możliwość
sprowadzenia rozkładu normalnego do postaci rozkładu normalnego standaryzowanego.
Do obliczania prawdopodobieństw dla rozkładu normalnego wykorzystywane są tablice
rozkładu normalnego i rozkładu normalnego standaryzowanego N(0,1) lub można w
programie STATISTICA wykorzystać kalkulator prawdopodobieństwa.
Ćwiczenie 5
W wyniku obserwacji stwierdzono, że waga pewnego towaru ma rozkład normalny
N(1000g, 50g).
Jakie jest prawdopodobieństwo, że :
a) waga losowo wybranego opakowania tego towaru jest mniejsza niż 950g,
b) waga losowo wybranego opakowania tego towaru przekroczy 1050g.
Narysować wykres funkcji gęstości prawdopodobieństwa i dystrybuanty rozkładu.
Zadanie rozwiązać na 2 sposoby.
- I sposób wykorzystanie narzędzia: Statystyka/Kalkulator prawdopodobieństwa/Rozkłady z
wyborem typu rozkładu: Z(Normalny)
- II sposób: wykorzystanie rozkładu normalnego standaryzowanego N(0,1).
Uwaga!
Znaczenie poszczególnych opcji w oknie Kalkulator prawdopodobieństwa/Z(Normalny):
- X – służy do wprowadzenia wartości zmiennej X lub gdy w polu p podana zostanie wartość
wówczas oblicza X (odpowiedni kwantyl rozkładu normalnego),
- p – wyświetla wartość dystrybuanty dowolnego rozkładu normalnego dla parametrów
ustawionych w polach: średnia i odch.std., jeżeli w polu średnia wpisana jest wartość 0, a w
polu odch.std wpisana jest wartość 1, wówczas w polu p wyświetlana jest wartość
dystrybuanty rozkładu normalnego standaryzowanego (np. X = 0, to p = 0,5),
- pola średnia i odch.std – to pola edycji parametrów rozkładu normalnego, oznaczanego jako
N(średnia, odch.std.),
- Stałe skalowanie - brak zaznaczonej opcji powoduje, że program sam automatycznie dobiera
skale na osiach wykresu,
- Wykresy: Funkcja gęstości i prawdopodobieństwo – wykres funkcji gęstości
prawdopodobieństwa
wraz
z
polem
obszaru
odpowiadającego
obliczanemu
prawdopodobieństwu. Wykres prawdopodobieństwa wyświetla dystrybuantę analizowanego
rozkładu normalnego i zaznacza linią przerywaną jej wartość.
- Oblicz X z p, Obustronne, (1-p) – pola wyboru do obliczania wartości prawdopodobieństwa
rozkładu normalnego i wartości dystrybuanty,
- Wyślij do raportu – wysyła wartość do pliku,
- Utwórz wykres – pozwala na wygenerowanie wykresu,
Rozkład t-Studenta
Przyjmujemy, że cecha X ma w populacji generalnej (w całej zbiorowości) rozkład normalny
(N(μ, )). Z populacji tej pobieramy n-elementową próbę losową (x1, x2,…, xn). Jeżeli
wartość odchylenia standardowego  w populacji jest nieznana, nie można wówczas
wyznaczyć parametrów wartości oczekiwanej μ . Do wnioskowania o μ wykorzystuje się
wówczas statystykę:
t
x
n
s
, x
1 n
X ,
n i 1
s
1 n
2
 ( xi  x )
n  1 i 1
Rozkład statystyki t jest niezależny od parametru  i nazywany jest rozkładem t-Studenta o
liczbie stopni swobody  = df= n-1. Krzywa funkcji gęstości rozkładu t-Studenta jest podobna
do krzywej rozkładu N(0,1).
Dla  > 30 rozkład t-Studenta jest zbieżny do rozkładu N(0,1).
Znaczenie poszczególnych opcji w oknie Kalkulator prawdopodobieństwa/t-Studenta:
- p – wyświetla wartość prawdopodobieństwa,
- df – (degree of freedom) – pole do deklaracji ilości stopni swobody w rozkładzie t-Studenta,
- t – pole to służy do wprowadzania wartości zmiennej t lub wyświetlania kwantyli rozkładu
t-Studenta (w zależności czy w polu p jest podana wartość czy nie ma podanej wartości),
- Stałe skalowanie - brak zaznaczonej opcji powoduje, że program sam automatycznie dobiera
skale na osiach wykresu, jeśli zaznaczone jest stałe skalowanie wówczas program będzie
używał stałej skali na wykresach
- Wykresy: Funkcja gęstości i prawdopodobieństwo – wykres funkcji gęstości
prawdopodobieństwa
wraz
z
polem
obszaru
odpowiadającego
obliczanemu
prawdopodobieństwu. Wykres prawdopodobieństwa wyświetla dystrybuantę analizowanego
rozkładu t-Studenta i zaznacza linią przerywaną jej wartość, kształt wykresu zależy także czy
w polu wyboru jest zaznaczone Obustronne czy nie jest zaznaczony ten wybór,
- Oblicz X z p – pole to jest automatycznie zaznaczane, jeżeli klikniemy w polu edycji pole p.
Jeżeli pole to jest wybrane, to należy podać w polu edycji p wartość dystrybuanty rozkładu, w
przeciwnym wypadku należy wprowadzić wartość zmiennej t i po naciśnięciu klawisza Oblicz
program oblicza i wyświetla wartość p.
- Obustronne – jeżeli to pole wyboru jest wybrane wówczas program oblicza wartość
prawdopodobieństwa P(|t|<p), jeżeli to pole wyboru nie jest wybrane wówczas program
oblicza wartość prawdopodobieństwa P(t<p),
- 1-p – jeżeli to pole wyboru jest wybrane wówczas program oblicza wartość
prawdopodobieństwa P(|t|>p) lub P(t>p), a to jest uzależnione od opcji wyboru w polu
Obustronne.
- Wyślij do raportu – wysyła wartość do pliku,
- Utwórz wykres – pozwala na wygenerowanie wykresu,
Ćwiczenie 6
Obliczyć wartości prawdopodobieństwa w rozkładzie t-Studenta dla 15 stopni swobody:
a) P(X > 0,256)
b) P(|X|  0,78)
c) P(X  0,78).
Rozkład chi-kwadrat 2
Zakładamy, że z populacji o rozkładzie (N(μ, )) pobieramy n-elementową próbę losową (x1,
x2,…, xn) – na podstawie której budujemy statystykę:
s2 
1 n
2
 ( xi  x )
n  1 i 1
, x - średnia arytmetyczna z próby.
Przy wnioskowaniu o wariancji stosowana jest statystyka:
2 
(n  1)s 2

Rozkład tej statystyki nazywany jest rozkładem chi-kwadrat o n-1 liczbie stopni swobody.
Rozkład chi-kwadrat jest rozkładem niesymetrycznym, przyjmującym tylko dodatnie
wartości. Dla ustalonej wartości  i liczby stopni swobody tablice rozkładu 2 podają
wartości spełniające relację P(2 > 2,df) = 
Znaczenie poszczególnych opcji w oknie Kalkulator prawdopodobieństwa/Chi^2:
- p – wyświetla wartość prawdopodobieństwa,
- df – (degree of freedom) – pole do deklaracji ilości stopni swobody w rozkładzie 2,
(w niektórych podręcznikach do statystyki stopnie swobody oznaczane są jako ),
- Chi^2 – pole to służy do wprowadzania wartości zmiennej Chi^2 (2) lub wyświetlania
kwantyli rozkładu 2 (w zależności czy w polu p jest podana wartość czy nie ma podanej
wartości),
- Stałe skalowanie - brak zaznaczonej opcji powoduje, że program sam automatycznie dobiera
skale na osiach wykresu, jeśli zaznaczone jest stałe skalowanie wówczas program będzie
używał stałej skali na wykresach
- Wykresy: Funkcja gęstości i prawdopodobieństwo – wykres funkcji gęstości
prawdopodobieństwa
wraz
z
polem
obszaru
odpowiadającego
obliczanemu
prawdopodobieństwu. Wykres prawdopodobieństwa wyświetla dystrybuantę analizowanego
rozkładu 2 i zaznacza linią przerywaną jej wartość,
- Oblicz X z p – pole to jest automatycznie zaznaczane, jeżeli klikniemy w polu edycji pole p.
Jeżeli pole to jest wybrane, to należy podać w polu edycji p wartość dystrybuanty rozkładu, w
przeciwnym wypadku należy wprowadzić wartość zmiennej t i po naciśnięciu klawisza Oblicz
program oblicza i wyświetla wartość p.
- Obustronne - dal rozkładu 2 opcja ta nie jest dostępna,
- 1-p – jeżeli to pole wyboru jest wybrane wówczas program oblicza wartość
prawdopodobieństwa P(|2|>p) lub P(2>p),
- Wyślij do raportu – wysyła wartość do pliku,
- Utwórz wykres – pozwala na wygenerowanie wykresu,
Ćwiczenie 7
Obliczyć P(X > 9,5) dla zmiennej losowej o rozkładzie 2 z 7 stopniami swobody.
Ćwiczenie 8
W niektórych zastosowaniach rozkładu 2 w statystyce matematycznej potrzeba znaleźć taką
wartość kwantyla rozkładu 2, aby przy znanych stopniach swobody spełniona była
zależność: P(X > x0) = p . Potrzebna jest wówczas znajomość wyznaczania wartości
granicznych dla zmiennych losowych o rozkładzie 2.
Znaleźć taką wartość x0 dla zmiennej losowej o rozkładzie 2 i 8 stopniach swobody wiedząc,
że:
a) P(X > x0) = 0,95
b) P(X > x0) = 0,05
Download