Kalkulator prawdopodobieństwa i wybrane rozkłady zmiennych losowych typu skokowego i typu ciągłego Rozkłady typu skokowego (dyskretnego) Rozkład dwumianowy (Bernoulliego, binominalny) służy do wyznaczenia prawdopodobieństwa, tego, że podczas realizacji n doświadczeń osiągniemy k sukcesów (k ≤ n): B(n, p, k ) P( X k ) Cnk p k q nk gdzie Cnk jest kombinacją: Cnk n! . k!n k ! Dystrybuanta: F ( x) P( X x) Cnk p k q nk 0 k x Wartość oczekiwana: E(X) = np Wariancja: V(X) = npq Zmienna losowa o rozkładzie dwumianowym opisuje eksperyment noszący nazwę prób Bernoulliego – dlatego rozkład ten nazywany jest także rozkładem Bernoulliego. Eksperyment polega na przeprowadzeniu n (n ≥ 2) niezależnych doświadczeń, wynikiem może być tylko jedno z dwóch możliwych stanów: sukces lub porażka: prawdopodobieństwo stanu, który został uznany za sukces jest takie samo w kolejnych doświadczeniach (p), prawdopodobieństwo niepowodzenia q łączy się z p zależnością: p + q = 1; doświadczenia są niezależne, tzn. wynik poprzedniego nie wpływa na wynik następnego; Funkcja rozkładu dwumianowego zależy od dwóch parametrów: liczby doświadczeń n i prawdopodobieństwa sukcesu p; dla p = q = 1/2 rozkład dwumianowy jest symetryczny, dla p ≠ q rozkład jest asymetryczny, jeżeli p < 1/2 – prawostronnie asymetryczny, dla p > 1/2 – lewostronnie asymetryczny. Ćwiczenie 1. - Otworzyć plik rozkład_dwumianowy_1.sta - Zapoznać się z treścią zadania umieszczoną w nagłówku pliku. Celem analizy jest wyrównanie rozkładu empirycznego do rozkładu dwumianowego. - Korzystając z Statystyka/Dopasowanie rozkładów/Rozkłady dyskretne wybrać typ Dwumianowy. Wykonać Wykres rozkładu obserw. i oczekiwanego. Wykonać obliczenia na karcie: Podsum. Rozkład obserwowany i oczekiwany (rozróżnić parametry obserwowane i oczekiwane). - Obliczyć: wartość oczekiwaną, wariancję i odchylenie standardowe tej zmiennej losowej. - Obliczyć prawdopodobieństwa wybranych realizacji zmiennej losowej, przyjmując stałą wartość prawdopodobieństwa p dla tego typu rozkładu zgodnie z zależnością: B( n, p, k ) P( X k ) Cnk p k q n k n n! (Uwaga! p+q=1 , stąd q=1-p oraz Cnk ) k k!(n k)! - Obliczyć wartość teoretyczną (oczekiwaną) liczebności n̂k dla wybranej wartości k sprawdzić otrzymany wynik na wykresie rozkładu oczekiwanego. - Dokonać interpretacji otrzymanych wyników. Ćwiczenie 2. Zadanie 1. Pewna gra polega na 6-krotnym rzucaniu symetryczną monetą. Wygrywa ta osoba, która uzyska w rzutach najwięcej orłów. W tabeli przedstawiony jest rozkład prawdopodobieństwa pojawienia się w sześciu rzutach samych reszek (zero orłów), 1, 2, 3, 4, 5, 6 orłów. (X zmienna losowa - określająca liczbę orłów (liczbę sukcesów) w sześciu rzutach symetryczną monetą). k P(X=k) P(X<=k) F(x)=P(X<k) P(X>k) P(X>=k) 0 0,015625 0,015625 0 0,984375 1 1 0,09375 0,109375 0,015625 0,890625 0,984375 2 0,234375 0,34375 0,109375 0,65625 0,890625 3 0,3125 0,65625 0,34375 0,34375 0,65625 4 0,234375 0,890625 0,65625 0,109375 0,34375 5 0,09375 0,984375 0,890625 0,015625 0,109375 6 0,015625 1 0,984375 0 0,015625 Obliczyć prawdopodobieństwa otrzymania w sześciu rzutach: 1) co najmniej jednego orła, 2) więcej niż 3 orły. Uwaga! Zmienną losową jest liczba uzyskanych orłów w 6–krotnym rzucie monetą (liczba sukcesów). Prawdopodobieństwo sukcesu (prawdopodobieństwo uzyskania orła w pojedynczym rzucie) i prawdopodobieństwo porażki (prawdopodobieństwo uzyskania reszki w pojedynczym rzucie) jest równe 0,5. B( n, p, k ) P( X k ) Cnk p k q n k Ćwiczenie 3. Rozkład Poissona jest rozkładem granicznym rozkładu dwumianowego, zachodzącym wtedy, gdy prawdopodobieństwo p sukcesu jest małe, a liczba realizacji n na tyle duża, że np = λ. Rozkład Poissona stosuje się jako przybliżenie rozkładu dwumianowego, gdy prawdopodobieństwo sukcesu jest mniejsze niż 0,2, a liczba doświadczeń jest równa co najmniej 20 (W niektórych pozycjach literaturowych 30 lub nawet 100. Stawia się też niekiedy warunek na np = λ, postulując by ten iloczyn nie przekraczał 5). Funkcja rozkładu prawdopodobieństwa określona jest jako: P( X k ) k e k! Dystrybuanta rozkładu Poissona określona jest jako: k F ( x ) e k x k! Wartość oczekiwana: E(X) = = np Wariancja: 2 = V(X) = Otworzyć plik rozkład_Poissona.sta - Zapoznać się z treścią zadania umieszczoną w nagłówku pliku i danymi arkusza (rozkład Poissona jest rozkładem zjawisk rzadkich) - Korzystając z Statystyka/Dopasowanie rozkładów/Rozkłady dyskretne wybrać typ Poissona. - Wykonać Wykres rozkładu obserw. i oczekiwanego. - Wykonać obliczenia na karcie: Podsum. Rozkład obserwowany i oczekiwany (rozróżnić parametry obserwowane i oczekiwane, czyli wartości rozkładu empirycznego zmiennej losowej skokowej z wartościami rozkładu wyrównanego do postaci rozkładu Poissona). - Zwrócić uwagę na wartość parametru (dla wartości oczekiwanych, a także obliczyć z zależności = np. liczbę p (p =/n)) - Ile wynosi prawdopodobieństwo tego, że wystąpią 3 awarie systemu k e (przypomnienie e = 2,71828) k! - Oszacować zgodnie z rozkładem Poissona liczbę dni w roku z 3 awariami systemu. Zgodnie z . P( X k ) Rozkłady typu ciągłego Rozkład wykładniczy Zmienna losowa X ma rozkład wykładniczy z parametrem , jeśli jej funkcja gęstości jest określona wzorem: dla x 0 0 f ( x ) x λe dla x 0 Dystrybuanta tej zmiennej jest: 0 F ( x) 1 e x dla x 0 dla x 0 Wartość oczekiwana jest równa E(X)=1/ ; a wariancja wynosi: V(X)=1/2. Ćwiczenie 4 Produkcja kondensatorów w pewnej fabryce jest całkowicie zautomatyzowana. W okresie dwuletniej obserwacji zauważono, że rozkład czasu między zejściem z taśmy produkcyjnej dwóch kolejnych kondensatorów można zapisać za pomocą zmiennej losowej X o rozkładzie wykładniczym z wartością oczekiwaną równą 20 sekund (E(X)=20). Obliczyć prawdopodobieństwo tego, że 1) czas między zejściem z taśmy dwóch kolejnych kondensatorów jest krótszy niż 10 sekund 2) czas między zejściem z taśmy dwóch kolejnych kondensatorów jest zawarty w przedziale (15,20) 3) czas między zejściem z taśmy dwóch kolejnych kondensatorów jest nie krótszy niż 25 sekund. Wykreślić wykres funkcji gęstości i dystrybuanty rozkładu wykładniczego. Wartość oczekiwana rozkładu wykładniczego jest równa E(X) = 1/, stąd = 1/E(X) = 1/20 = 0,05 Rozkład normalny (rozkład Gaussa) Zmienna losowa X ma rozkład normalny z parametrami μ i σ, jeśli jej funkcja gęstości jest określona wzorem: ( x ) 1 2 f ( x) e 2 2 2 dla : - x ; 0 Dystrybuanta rozkładu normalnego wynosi: x 1 F ( x ) f ( x ) dx 2 x e ( x )2 2 2 dx Kształt funkcji zależy od wartości parametrów: μ i σ. Parametr μ przesuwa krzywą wzdłuż osi odciętych, natomiast parametr σ powoduje, że krzywa jest bardziej spłaszczona lub wysmukła. Wykres funkcji gęstości: - jest symetryczny względem prostej x = μ, co oznacza, że spełniona jest zależność: P(X > μ) = P(X < μ) = 0,5 - w punkcie x = μ osiąga wartość maksymalną, która wynosi 1 ; f 2 - prawdopodobieństwo, że zmienna losowa X przyjmuje wartości z przedziału: [μ – 3σ; μ + 3σ], jest w przybliżeniu równe jedności (reguła trzech sigm); - ramiona mają punkty przegięcia (μ ) Reguła ta mówi, że praktycznie wszystkie wartości (realizacje) zmiennej losowej mieszczą się w przedziale [μ – 3σ; μ + 3σ]). Wartość oczekiwana zmiennej o rozkładzie normalnym wynosi: EX , a wariancja jest równa: VX 2 . Uwaga! Obliczanie prawdopodobieństw dla zmiennej o rozkładzie normalnym o dowolnej wartości μ i bez pomocy programu komputerowego jest trudne. Bardzo użyteczna jest możliwość sprowadzenia rozkładu normalnego do postaci rozkładu normalnego standaryzowanego. Do obliczania prawdopodobieństw dla rozkładu normalnego wykorzystywane są tablice rozkładu normalnego i rozkładu normalnego standaryzowanego N(0,1) lub można w programie STATISTICA wykorzystać kalkulator prawdopodobieństwa. Ćwiczenie 5 W wyniku obserwacji stwierdzono, że waga pewnego towaru ma rozkład normalny N(1000g, 50g). Jakie jest prawdopodobieństwo, że : a) waga losowo wybranego opakowania tego towaru jest mniejsza niż 950g, b) waga losowo wybranego opakowania tego towaru przekroczy 1050g. Narysować wykres funkcji gęstości prawdopodobieństwa i dystrybuanty rozkładu. Zadanie rozwiązać na 2 sposoby. - I sposób wykorzystanie narzędzia: Statystyka/Kalkulator prawdopodobieństwa/Rozkłady z wyborem typu rozkładu: Z(Normalny) - II sposób: wykorzystanie rozkładu normalnego standaryzowanego N(0,1). Uwaga! Znaczenie poszczególnych opcji w oknie Kalkulator prawdopodobieństwa/Z(Normalny): - X – służy do wprowadzenia wartości zmiennej X lub gdy w polu p podana zostanie wartość wówczas oblicza X (odpowiedni kwantyl rozkładu normalnego), - p – wyświetla wartość dystrybuanty dowolnego rozkładu normalnego dla parametrów ustawionych w polach: średnia i odch.std., jeżeli w polu średnia wpisana jest wartość 0, a w polu odch.std wpisana jest wartość 1, wówczas w polu p wyświetlana jest wartość dystrybuanty rozkładu normalnego standaryzowanego (np. X = 0, to p = 0,5), - pola średnia i odch.std – to pola edycji parametrów rozkładu normalnego, oznaczanego jako N(średnia, odch.std.), - Stałe skalowanie - brak zaznaczonej opcji powoduje, że program sam automatycznie dobiera skale na osiach wykresu, - Wykresy: Funkcja gęstości i prawdopodobieństwo – wykres funkcji gęstości prawdopodobieństwa wraz z polem obszaru odpowiadającego obliczanemu prawdopodobieństwu. Wykres prawdopodobieństwa wyświetla dystrybuantę analizowanego rozkładu normalnego i zaznacza linią przerywaną jej wartość. - Oblicz X z p, Obustronne, (1-p) – pola wyboru do obliczania wartości prawdopodobieństwa rozkładu normalnego i wartości dystrybuanty, - Wyślij do raportu – wysyła wartość do pliku, - Utwórz wykres – pozwala na wygenerowanie wykresu, Rozkład t-Studenta Przyjmujemy, że cecha X ma w populacji generalnej (w całej zbiorowości) rozkład normalny (N(μ, )). Z populacji tej pobieramy n-elementową próbę losową (x1, x2,…, xn). Jeżeli wartość odchylenia standardowego w populacji jest nieznana, nie można wówczas wyznaczyć parametrów wartości oczekiwanej μ . Do wnioskowania o μ wykorzystuje się wówczas statystykę: t x n s , x 1 n X , n i 1 s 1 n 2 ( xi x ) n 1 i 1 Rozkład statystyki t jest niezależny od parametru i nazywany jest rozkładem t-Studenta o liczbie stopni swobody = df= n-1. Krzywa funkcji gęstości rozkładu t-Studenta jest podobna do krzywej rozkładu N(0,1). Dla > 30 rozkład t-Studenta jest zbieżny do rozkładu N(0,1). Znaczenie poszczególnych opcji w oknie Kalkulator prawdopodobieństwa/t-Studenta: - p – wyświetla wartość prawdopodobieństwa, - df – (degree of freedom) – pole do deklaracji ilości stopni swobody w rozkładzie t-Studenta, - t – pole to służy do wprowadzania wartości zmiennej t lub wyświetlania kwantyli rozkładu t-Studenta (w zależności czy w polu p jest podana wartość czy nie ma podanej wartości), - Stałe skalowanie - brak zaznaczonej opcji powoduje, że program sam automatycznie dobiera skale na osiach wykresu, jeśli zaznaczone jest stałe skalowanie wówczas program będzie używał stałej skali na wykresach - Wykresy: Funkcja gęstości i prawdopodobieństwo – wykres funkcji gęstości prawdopodobieństwa wraz z polem obszaru odpowiadającego obliczanemu prawdopodobieństwu. Wykres prawdopodobieństwa wyświetla dystrybuantę analizowanego rozkładu t-Studenta i zaznacza linią przerywaną jej wartość, kształt wykresu zależy także czy w polu wyboru jest zaznaczone Obustronne czy nie jest zaznaczony ten wybór, - Oblicz X z p – pole to jest automatycznie zaznaczane, jeżeli klikniemy w polu edycji pole p. Jeżeli pole to jest wybrane, to należy podać w polu edycji p wartość dystrybuanty rozkładu, w przeciwnym wypadku należy wprowadzić wartość zmiennej t i po naciśnięciu klawisza Oblicz program oblicza i wyświetla wartość p. - Obustronne – jeżeli to pole wyboru jest wybrane wówczas program oblicza wartość prawdopodobieństwa P(|t|<p), jeżeli to pole wyboru nie jest wybrane wówczas program oblicza wartość prawdopodobieństwa P(t<p), - 1-p – jeżeli to pole wyboru jest wybrane wówczas program oblicza wartość prawdopodobieństwa P(|t|>p) lub P(t>p), a to jest uzależnione od opcji wyboru w polu Obustronne. - Wyślij do raportu – wysyła wartość do pliku, - Utwórz wykres – pozwala na wygenerowanie wykresu, Ćwiczenie 6 Obliczyć wartości prawdopodobieństwa w rozkładzie t-Studenta dla 15 stopni swobody: a) P(X > 0,256) b) P(|X| 0,78) c) P(X 0,78). Rozkład chi-kwadrat 2 Zakładamy, że z populacji o rozkładzie (N(μ, )) pobieramy n-elementową próbę losową (x1, x2,…, xn) – na podstawie której budujemy statystykę: s2 1 n 2 ( xi x ) n 1 i 1 , x - średnia arytmetyczna z próby. Przy wnioskowaniu o wariancji stosowana jest statystyka: 2 (n 1)s 2 Rozkład tej statystyki nazywany jest rozkładem chi-kwadrat o n-1 liczbie stopni swobody. Rozkład chi-kwadrat jest rozkładem niesymetrycznym, przyjmującym tylko dodatnie wartości. Dla ustalonej wartości i liczby stopni swobody tablice rozkładu 2 podają wartości spełniające relację P(2 > 2,df) = Znaczenie poszczególnych opcji w oknie Kalkulator prawdopodobieństwa/Chi^2: - p – wyświetla wartość prawdopodobieństwa, - df – (degree of freedom) – pole do deklaracji ilości stopni swobody w rozkładzie 2, (w niektórych podręcznikach do statystyki stopnie swobody oznaczane są jako ), - Chi^2 – pole to służy do wprowadzania wartości zmiennej Chi^2 (2) lub wyświetlania kwantyli rozkładu 2 (w zależności czy w polu p jest podana wartość czy nie ma podanej wartości), - Stałe skalowanie - brak zaznaczonej opcji powoduje, że program sam automatycznie dobiera skale na osiach wykresu, jeśli zaznaczone jest stałe skalowanie wówczas program będzie używał stałej skali na wykresach - Wykresy: Funkcja gęstości i prawdopodobieństwo – wykres funkcji gęstości prawdopodobieństwa wraz z polem obszaru odpowiadającego obliczanemu prawdopodobieństwu. Wykres prawdopodobieństwa wyświetla dystrybuantę analizowanego rozkładu 2 i zaznacza linią przerywaną jej wartość, - Oblicz X z p – pole to jest automatycznie zaznaczane, jeżeli klikniemy w polu edycji pole p. Jeżeli pole to jest wybrane, to należy podać w polu edycji p wartość dystrybuanty rozkładu, w przeciwnym wypadku należy wprowadzić wartość zmiennej t i po naciśnięciu klawisza Oblicz program oblicza i wyświetla wartość p. - Obustronne - dal rozkładu 2 opcja ta nie jest dostępna, - 1-p – jeżeli to pole wyboru jest wybrane wówczas program oblicza wartość prawdopodobieństwa P(|2|>p) lub P(2>p), - Wyślij do raportu – wysyła wartość do pliku, - Utwórz wykres – pozwala na wygenerowanie wykresu, Ćwiczenie 7 Obliczyć P(X > 9,5) dla zmiennej losowej o rozkładzie 2 z 7 stopniami swobody. Ćwiczenie 8 W niektórych zastosowaniach rozkładu 2 w statystyce matematycznej potrzeba znaleźć taką wartość kwantyla rozkładu 2, aby przy znanych stopniach swobody spełniona była zależność: P(X > x0) = p . Potrzebna jest wówczas znajomość wyznaczania wartości granicznych dla zmiennych losowych o rozkładzie 2. Znaleźć taką wartość x0 dla zmiennej losowej o rozkładzie 2 i 8 stopniach swobody wiedząc, że: a) P(X > x0) = 0,95 b) P(X > x0) = 0,05