Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkłady statystyczne Przemysław Juszczuk Instytut Informatyki Uniwersytetu Śląskiego 23 października 2008 Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Agenda 1 2 3 4 5 6 7 Kilka podstawowych pojęć związanych z rozkładami... Przegląd rozkładów ciągłych, Rozkłady skokowe, Rozkład beta, Rozkład wielowymiarowy. Powtórka z gnuplota. Ciekawostka... Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Agenda 1 2 3 4 5 6 7 Kilka podstawowych pojęć związanych z rozkładami... Przegląd rozkładów ciągłych, Rozkłady skokowe, Rozkład beta, Rozkład wielowymiarowy. Powtórka z gnuplota. Ciekawostka... Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Agenda 1 2 3 4 5 6 7 Kilka podstawowych pojęć związanych z rozkładami... Przegląd rozkładów ciągłych, Rozkłady skokowe, Rozkład beta, Rozkład wielowymiarowy. Powtórka z gnuplota. Ciekawostka... Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Agenda 1 2 3 4 5 6 7 Kilka podstawowych pojęć związanych z rozkładami... Przegląd rozkładów ciągłych, Rozkłady skokowe, Rozkład beta, Rozkład wielowymiarowy. Powtórka z gnuplota. Ciekawostka... Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Agenda 1 2 3 4 5 6 7 Kilka podstawowych pojęć związanych z rozkładami... Przegląd rozkładów ciągłych, Rozkłady skokowe, Rozkład beta, Rozkład wielowymiarowy. Powtórka z gnuplota. Ciekawostka... Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Agenda 1 2 3 4 5 6 7 Kilka podstawowych pojęć związanych z rozkładami... Przegląd rozkładów ciągłych, Rozkłady skokowe, Rozkład beta, Rozkład wielowymiarowy. Powtórka z gnuplota. Ciekawostka... Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Agenda 1 2 3 4 5 6 7 Kilka podstawowych pojęć związanych z rozkładami... Przegląd rozkładów ciągłych, Rozkłady skokowe, Rozkład beta, Rozkład wielowymiarowy. Powtórka z gnuplota. Ciekawostka... Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Podstawowe pojęcia... Nośnik miary Niech (X , T ) będzie przestrzenią topologiczną i niech µ będzie miarą borelowską na X̂ . Nośnikiem miary µ nazywamy zbiór wszystkich tych punktów z X̂ , których każde otoczenie otwarte ma dodatnią miarę: supp(µ) := {x ∈ X |∀x ∈ Nx ∈ T , µ(Nx ) > 0} Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Podstawowe pojęcia... Nośnik miary Niech (X , T ) będzie przestrzenią topologiczną i niech µ będzie miarą borelowską na X̂ . Nośnikiem miary µ nazywamy zbiór wszystkich tych punktów z X̂ , których każde otoczenie otwarte ma dodatnią miarę: supp(µ) := {x ∈ X |∀x ∈ Nx ∈ T , µ(Nx ) > 0} Nośnik miary jeszcze raz... Dla rozkładów prawdopodobieństwa nośnikiem miary jest zbiór wszystkich wartości, które może przyjąć zmienna losowa. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Zmienna losowa Funkcja X odwzorowująca zbiór Ω wyników pewnego doświadczenia losowego w zbiór liczb rzeczywistych. Przykłady zmiennych losowych to: 1 Funkcja opisująca wagę wylosowanego obiektu, 2 Funkcja opisująca wzrost, 3 Funkcja opisująca wiek, Z wartościami zmiennej losowej związane są określone prawdopodobieństwa, tak więc zmienna losowa przybiera różne wartości z różnym prawdopodobieństwem: P(X = xi ) = pi Przykład zmiennej losowej Niech Ω będzie zbiorem wszystkich możliwych wyników rzutu dwoma koścmi do gry. Składa się on z 36 możliwych wyników. Zmienna losowa może być opisana w następujący sposób: (i, j) ∈ R 2 , gdzie 1 ¬ i, j ¬ 6 Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Parametr położenia Wpływa na przesunięcie dystrybuanty i funkcji rozkładu prawdopodobieństwa danego rozkładu bez zmiany jego kształtu. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Parametr położenia Wpływa na przesunięcie dystrybuanty i funkcji rozkładu prawdopodobieństwa danego rozkładu bez zmiany jego kształtu. Parametr skali Zwiększenie tego parametru k razy spowoduje min. ”rozszerzenie” wykresu dystrybuanty i funkcji rozkładu prawdopodobieństwa na osi OX, oraz ”kurczenie” osi OY k razy względem początku układu współrzędnych. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Parametr położenia Wpływa na przesunięcie dystrybuanty i funkcji rozkładu prawdopodobieństwa danego rozkładu bez zmiany jego kształtu. Parametr skali Zwiększenie tego parametru k razy spowoduje min. ”rozszerzenie” wykresu dystrybuanty i funkcji rozkładu prawdopodobieństwa na osi OX, oraz ”kurczenie” osi OY k razy względem początku układu współrzędnych. Parametr kształtu Wpływa na kształt dystrybuanty i funkcji rozkładu prawdopodobieństwa. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Funkcja gęstości prawdopodobieństwa Gęstość prawdopodobieństwa to nieujemna funkcja p(x) ciągłej zmiennej losowej x, taka, że: R p(x) dx = 1 oraz prawdopodobieństwo, że zmienna losowa X należy do przedziału (a,b) dane jest wzorem: Rb P(a ¬ X < b) = a f (x) dx Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Dystrybuanta Pewna funkcja F(x) określająca prawdopodobieństwo tego, że zmienna losowa X przyjmuje jakąkolwiek wartość mniejszą od z góry przyjętej danej wartości x. F (x) = P(X < x) Dystrybuanta F(x) określona w przedziale (a,b) posiada następujące własności: 1 jest funkcją niemalejącą, 2 jest funkcją co najmniej lewostronnie ciągłą, 3 F(a) = 0 , oraz F(b) = 1. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Wartość oczekiwana Zwana także nadzieją matematyczną. Jest to wartość opisująca spodziewany wynik doświadczenia losowego. Wartość oczekiwana to inaczej pierwszy moment zwykły. Wartość oczekiwana skokowej zmiennej losowej EX = Σni=1 xi pi gdzie: x1 , x2 , ..., xn - to wartości dyskretnej zmiennej losowej, p1 , p2 , ..., pn - odpowiadające poszczególnym wartościom prawdopodobieństwa. Wartość oczekiwana ciągłej zmiennej losowej Wartość zmiennej losowej typu ciągłego R definiowana jest jako całka: E |X | = X dP Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Mediana Wartość cechy w szeregu uporządkowanym, powyżej i poniżej której znajduje się jednakowa liczba obserwacji. W celu obliczenia mediany ze zbioru n oberwacji, sortujemy je w kolejności od najmniejszej do największej i numerujemy od 1 do n. Jeśli n jest nieparzyste, to medianą jest wartość obserwacji w środku, czyli n+1 2 . Jeśli n jest parzyste, to medianą jest średnia arytmetyczna dwóch środkowych obserwacji: n2 , oraz n 2 + 1. Wariancja Utożsamiana jest ze zróżnicowaniem zbiorowości. Jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od wartości oczekiwanej. Y = (X − EX )2 Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Moda - dominanta Wskazuje na wartość o największym prawdopodobieństwie wystąpienia, lub wartość najczęściej występującą w próbie. Dla zmiennej losowej o rozkładzie ciągłym jest to wartość, dla której funkcja gęstości prawdopodobieństwa ma wartość największą. Wartość 1 2 3 4 5 Prawdopodobieństwo 0.15 0.35 0.2 0.2 0.1 Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Współczynnik skośności Współczynnik skośności rozkładu to miara asymetrii rozkładu wyznaczana według wzoru: A = m−d s gdzie: m - wartość średniej arytmetycznej, d - wartość mody, s - wartość odchylenia standardowego. Współczynnik skośności przyjmuje wartość zero dla rozkładu symetrycznego, wartości ujemne dla rozkładów o lewostronnej asymetrii (wydłużone lewe ramię rozkładu) i wartości dodatnie dla rozkładów o prawostronnej asymetrii (wydłużone prawe ramię rozkładu). Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Kurtoza Miara spłaszczenia rozkładu wartości cechy określana wzorem: Kurt = σµ44 − 3 gdzie: µ4 - jest czwartym momentem centralnym, σ 4 -σ to odchylenie standardowe. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Entropia Definiowana jako średnia ilość informacji, przypadająca na znak symbolizujący zajście zdarzenia z pewnego zbioru. Zdarzenia w tym zbiorze mają przypisane prawdopodobieństwa wystąpienia. 1 H(x) = Σni=1 p(i)logr p(i) gdzie: p(i) - prawdopodobieństwo zajścia zdarzenia i. Własności entropii jest nieujemna, jest maksymalna, gdy prawdopodobieństwa zajść zdarzeń są takie same, jest równa 0, gdy stany systemu przyjmują wartości 0 lub 1. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Funkcja tworząca momenty Pozwala na generowanie momentów kolejnych k rzędów zmiennej losowej, gdzie moment określany jest jako wartość oczekiwana k-tej potęgi tej zmiennej. Funkcja charakterystyczna Funkcją charakterystyczną zmiennej losowej X : Ω R nazywamy funkcję ϕx : R C . ϕx (t) = E (e itX ) dla t ∈ R Na funkcję charakterystyczną można patrzeć jako na transformatę Fouriera rozkładu zmiennej losowej, czyli transformację całkową z dziedziny czasu w dziedzinę czątotliwości. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rozkład normalny Zwany rozkładem Gaussa-Laplace’a jest najczęściej spotykanym rozkładem zmiennej losowej ciągłej. Rozkład ten ma największe znaczenie spośród różnych rozkładów ciągłych stosowanych w statystyce. jest to rozkład teoretyczny, charakteryzujący się określonymi właściwościami, jst on rozkładem symetrycznym (czyli liczebności odpowiadające wartościom zmiennej rozkładają się symetrycznie wokół liczebności największej), każdy rozkład normalny jest rozkładem symetrycznym, rozkład posiada jedno maksimum oraz ściśle określoną kurtozę, wykres rozkładu normalnego ma postać krzywej w kształcie dzwonu, w punkcie centralnym rozkładu znajduje się średnia arytmetyczna, a także dominanta i mediana, średnia arytmetyczna jest wartością cechy najczęściej spotykaną w badanej zbiorowości. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Nośnik : x ∈ R, gęstość prawdopodobieństwa σ√12π e (− R − x−µ √ dystrybuanta F (x) = σ√12π e σ 2 , wartość oczekiwana µ, mediana µ, moda µ, wariancja σ 2 skośność 0, kurtoza 0, √ entropia ln(σ 2πe), funkcja generująca momenty Mx (t) Przemysław Juszczuk (x−µ)2 2σ 2 ) , Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rysunek: Gęstość prawdopodobieństwa rozkładu normalnego. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rysunek: Dystrybuanta rozkładu normalnego. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rozkład wykładniczy Rozkład wykładniczy to rozkład zmiennej losowej opisujący sytuację, w której obiekt może przyjmować stany X i Y, przy czym obiekt w stanie X może ze stałym prawdopodobieństwem przejść w stan Y w jednostce czasu. dystrybuanta tego rozkładu to prawdopodobieństwo, że obiekt jest w stanie Y, jest on określony jednym parametrem λ - wartością oczekiwaną, posiada własność braku pamięci. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rozkład wykładniczy Rozkład wykładniczy to rozkład zmiennej losowej opisujący sytuację, w której obiekt może przyjmować stany X i Y, przy czym obiekt w stanie X może ze stałym prawdopodobieństwem przejść w stan Y w jednostce czasu. dystrybuanta tego rozkładu to prawdopodobieństwo, że obiekt jest w stanie Y, jest on określony jednym parametrem λ - wartością oczekiwaną, posiada własność braku pamięci. Przykład Niech zmienna losowa X oznacza czas pracy pewnej maszyny. Własność braku pamięci oznacza, że dalszy czas pracy maszyny nie zależy od dotychczasowego czasu jej trwania i ma rozkład taki sam, jak rozkład całkowitej pracy urządzenia. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Nośnik : [0, ∞], gęstość prawdopodobieństwa λe −λx , dystrybuanta F (x) = 1 − e −λx , wartość oczekiwana λ1 , mediana ln(2) λ , moda 0, wariancja λ−2 skośność 2, kurtoza 6, entropia 1 − ln(λ), −1 funkcja generująca momenty (1 − λt ) Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rysunek: Gęstość prawdopodobieństwa rozkładu wykładniczego. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rysunek: Dystrybuanta rozkładu wykładniczego. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rozkład gamma Rozkład gamma to ciągły rozkład prawdopodobieństwa, którego gęstość jest uogólnieniem rozkładu Erlanga na dziedzinę dodatnich liczb rzeczywistych. Rozkład Erlanga został opracowany przez A. K. Erlanga do szacowania liczby rozmów telefonicznych, łączonych jednocześnie przez operatora w ręcznej centrali telefonicznej. Parametry rozkładu: k - parametr kształtu ( k > 0 ) Θ - parametr skali, ( Θ > 0 ) Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Nośnik : [0, ∞], −x e Θ gęstość prawdopodobieństwa x k−1 Γ(k)Θ k , γ(k, x ) dystrybuanta Γ(k)Θ , wartość oczekiwana kΘ2 , moda (k − 1)Θ dla k ­ 1, wariancja kΘ2 skośność √2k , kurtoza k6 , entropia k + lnΘ = lnΓ(k) + (1 − k)ψ(k), funkcja generująca momenty (1 − Θt)−k , dla t < Przemysław Juszczuk Rozkłady statystyczne 1 Θ Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rysunek: Gęstość prawdopodobieństwa rozkładu gamma. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rysunek: dystrybuanta rozkładu gamma. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rozkład t-studenta Rozkład t-studenta (zwany rozkładem t) to rozkład często stosowany w statystyce podczas testowania hipotez i ocenie błędów. bardzo dobrze sprawdza się przy szacowaniu i weryfikacji parametrów w przypadku małych prób (n ¬ 30), stosowany przy weryfikacji niektórych hipotez dotycząych średniej, gdy dysponuje się małą próbą, czyli wtedy, gdy nie można wykorzystać rozkładu normalnego. Funkcja gamma — jedna z funkcji specjalnych, która rozszerza pojęcie silni na zbiór liczb rzeczywistych i zespolonych, Funkcja beta - Całka Eulera pierwszego rodzaju, Funkcja digamma. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Nośnik : x ∈ R, gęstość prawdopodobieństwa Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Γ( v +1 ) √ 2 v (1 v πΓ( 2 ) + x 2 −( v +1 2 ), v ) 2 F ( 1 ; v +1 ; 3 ;− x ) 2 1 2 √ 2 2v v , dystrybuanta 12 + xΓ( v +1 2 ) πv Γ( 2 ) wartość oczekiwana 0 dla v ¿ 1, w przciwnym wypadku nieokreślona, mediana 0, moda 0, v wariancja v −2 dla v ¿ 2, w przeciwnym wypadku nieokreślona, skośność 0 dla v ¿ 3, 6 kurtoza v −4 dla v ¿ 4, √ v +1 v v 1 entropia 2 [ψ( 1+v 2 ) − ψ( 2 )] + log [ v B( 2 , 2 )], funkcja generująca momenty nieokreślona Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rysunek: Gęstość prawdopodobieństwa rozkładu t-studenta. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rysunek: Dystrybuanta rozkładu t-studenta. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rozkład Cauchy’ego Rozkład Cauchy’ego zwany również w optyce rozkładem Lorentza a w fizyce jądrowej rozkładem Breita-Wignera. Momenty zwykłe i centralne rozkładu są niezdefiniowane -całki dla tych momentów rozbiegają się do nieskończoności. Dlatego min. kurtoza nie może zostać podana. Parametry x0 - położenie γ > 0 - skala. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Nośnik : x ∈ R, gęstość prawdopodobieństwa 1 , x−x πγ[1+( γ 0 )2 ] 1 + 2, 0 dystrybuanta π1 arc tg( x−x γ ) wartość oczekiwana nieokreślona, mediana x0 , moda x0 , wariancja nieokreślona, skośność nieokreślona, kurtoza nieokreślona, entropia ln4πγ, funkcja generująca momenty nieokreślona Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rysunek: Gęstość prawdopodobieństwa rozkładu Cauchy’ego. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład normalny Rozkład wykładniczy Rozkład gamma Rozklad t-studenta Rozkład Cauchy’ego Rysunek: Dystrybuanta rozkładu Cauchy’ego. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Rozkład Poissona Rozkład Poissona jest rozkładem zmiennej losowej skokowej, który stosuje się w przypadku określania prawdopodobieństwa zajścia zdarzeń stosunkowo rzadkich i niezależnych od siebie przy występowaniu dużej ilości doświadczeń. rozkład Poissona jest przybliżeniem rozkładu Bernoulliego dla dużych prób i przy małym prawdopodobieństwie zajścia zdarzenia sprzyjającego, jest to rozkład asymetryczny, Γ(x, y ) - niekompletna funkcja gamma, dla λ dążącego do nieskończoności rozkład Poissona może być przybliżony rozkładem normalnym o średniej λ i wariancji λ. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Nośnik : {0, 1, 2, ...}, −λ k Funkcja rozkładu prawdopodobieństwa e k!λ , , dystrybuanta Γ(bk+1c,λ) bkc! wartość oczekiwana λ, mediana ≈ bλ + 31 − 0.02 λ c, moda bλc, wariancja λ 1 skośność λ− 2 , kurtoza λ−1 , λk ln(k!) entropia λ[1 − ln(λ)] + e −λ Σ∞ , k=0 k! (λ(e t −1)) funkcja generująca momenty e Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Rysunek: Funkcja rozkładu prawdopodobieństwa - rozkład Poissona. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Rysunek: Dystrybuanta rozkładu Poissona. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Rozkład dwumianowy Dyskretny rozkład prawdopodobieństwa opisujący liczbę sukcesów k w ciągu N niezależnych prób, z których każda ma stałe prawdopodobieństwo sukcesu równe p. W Polsce określany też jako Rozkład Bernoulliego, chociaż termin ten odnosi się do rozkładu zero-jedynkowego. Innym rozkładem, który opisuje ilość sukcesów w ciągu N prób, jest rozkład hipergeometryczny. W tym przypadku jednak próby nie są niezależne (próba bez zwracania). Parametry n - liczba prób , n ­ 0, 0 ¬ p ¬ 1, prawdopodobieństwo sukcesu. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Nośnik :k ∈ {0, 1, 2, ..., n}, Funkcja rozkładu prawdopodobieństwa dystrybuanta I1−p (n − bkc, 1 + bkc), wartość oczekiwana np, mediana bnpc − 1, bnpc, bnpc + 1, moda b(n + 1) pc, wariancja np(1 − p) skośność √ 1−2p , Poissona dwumianowy geometryczny dzeta n k p k (1 − p)n−k, np(1−p) kurtoza 1−6p(1−p) np(1−p) , 1 entropia 2 ln (2πnep(1 − p)), funkcja generująca momenty (1 − p + pe t )n Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Rysunek: Funkcja rozkładu prawdopodobieństwa - rozkład dwumianowy. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Rysunek: Dystrybuanta rozkładu dwumianowego. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Rozkład geometryczny Rozkład geometryczny jest dyskretnym rozkładem prawdopodobieństwa opisującym prawdopodobieństwo zdarzenia, że proces Bernoulliego odniesie pierwszy sukces dokładnie w k-tej próbie. Niekiedy zamiast badać w której próbie odniesiemy pierwszy sukces, badamy ile prób z rzędu kończy się porażką. Wówczas tak zdefiniowane k jest o jeden mniejsze, więc we wszystkich wzorach należy dodać do niego 1. rozkład geometryczny to szczególny przypadek ujemnego rozkładu dwumianowego, ciągłym odpowiednikiem rozkładu geometrycznego jest rozkład wykładniczy, 0 ¬ p ¬ 1, prawdopodobieństwo sukcesu. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Nośnik :k ∈ {1, 2, 3, . . . }, Funkcja rozkładu prawdopodobieństwa (1 − p)k−1 p, dystrybuanta 1 − (1 − p)k, wartość oczekiwana p1, m l − log(2) , mediana log(1−p) moda 1, wariancja 1−p p2 2−p √ skośność 1−p, 2 p kurtoza 6 + 1−p , 1−p entropia − p log2 (1 − p) − log2 p, funkcja generująca momenty pe t 1−(1−p)e t Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Rysunek: Funkcja rozkładu prawdopodobieństwa - rozkład geometryczny. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Rysunek: Dystrybuanta rozkładu geometrycznego. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Rozkład dzeta Dyskretny rozkład prawdopodobieństwa, będący granicą rozkładu Zipfa (opierającego się na prawie Zipfa) dla parametru N dążącego do nieskończoności. Prawo Zipfa Częstotliwość występowania słów jest odwrotnie proporcjonalna do pozycji w rankingu. Parametry s ∈ (1, ∞), liczba rzeczywista, ζ(s) - to funkcja dzeta Riemanna. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Nośnik :k ∈ {1, 2, . . .}, Funkcja rozkładu prawdopodobieństwa dystrybuanta Poissona dwumianowy geometryczny dzeta 1/k s ζ(s) , Hk,s ζ(s) , wartość oczekiwana ζ(s−1) ζ(s) dla s > 2, moda 1, 2 wariancja ζ(s)ζ(s−2)−ζ(s−1) dla s > 3 ζ(s)2 P∞ 1/k s s entropia k=1 ζ(s) log(k ζ(s)), funkcja generująca momenty Lis (e t ) ζ(s) Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Rysunek: Funkcja rozkładu prawdopodobieństwa - rozkład dzeta. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład Rozkład Rozkład Rozkład Poissona dwumianowy geometryczny dzeta Rysunek: Dystrybuanta rozkładu dzeta. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Rozkład beta α > 0, parametr kształtu, β > 0, parametr kształtu, Γ - funkcja gamma, B - funkcja beta. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Nośnik :x ∈ [0; 1], Funkcja rozkładu prawdopodobieństwa dystrybuanta Ix (α, β), α , wartość oczekiwana α+β α−1 moda α+β−2, wariancja skośność αβ (α+β)2 (α+β+1) √ 2 (β−α) α+β+1 √ x α−1 (1−x)β−1 , B(α,β) , (α+β+2) αβ α3 −α2 (2β−1)+β 2 (β+1)−2αβ(β+2) ., αβ(α+β+2)(α+β+3) kurtoza 6 entropia ln B(α, β) − (α − 1)ψ(α)(β − 1)ψ(β) + (α + β − 2)ψ(α + β) , P∞ Qk−1 α+r t k funkcja generująca momenty 1 + k=1 r =0 α+β+r k! Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Rysunek: Gęstość prawdopodobieństwa rozkładu beta. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Rysunek: Dystrybuanta rozkładu beta. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Rozkład wielowymiarowy Wielowymiarowy rozkład normalny - rozkład wielowymiarowej zmiennej losowej, będący uogólnieniem rozkładu normalnego na n wymiarów. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Rysunek: Wielowymiarowy rozkład normalny. Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady set xrange[-5:5] set yrange[0:1] set xlabel " x " set ylabel " f(x) " f1(x) = (1.0/(sqrt(2*pi)))*exp(x*x/2) f2(x)= (1.0/(0.447213595*sqrt(2*pi)))*exp(-((x*x)/2*0.5)} plot f1(x) title ’rozklad normalny’, \ f2(x) title ’Rozklad normalny 2’ Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady n=5 set title " n= 5 " set xrange[-5:5] set xlabel " x " set ylabel " f(x) " f1(x)=gamma(0.5*(n+1))/(sqrt(n*pi)*gamma(0.5*n)), \ *(1.0+x**2/n)**(-0.5*(n+1.0)) plot f1(x) title ’ r. t-Studenta ’ Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Kurtoza rokładu normalnego, momenty Kurt = Przemysław Juszczuk µ4 σ4 Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Kurtoza rokładu normalnego, momenty Kurt = µ4 σ4 Moment centralny Moment centralny rzędu k zmiennej losowej X - wartość oczekiwana funkcji g (x) = E [X − E (X )]k . µ2 - drugi moment centralny, to wariancja. Moment zwykły Moment zwykły rzędu k - wartość oczekiwana k-tej potęgi tej zmiennej. Dla k=1 wartość oczekiwana - pierwszy moment zwykły m1 . m = EX = m1 (X ) Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Czwarty moment centralny µ4 = E ((X −EX )4 ) = E (X 4 −4(EX )1 X 3 +6(EX )2 X 2 −4(EX )3 X 1 +(EX )4 = E (X 4 ) − 4E (EX )1 X 3 + 6E (EX )2 X 2 − 4E (EX )3 X 1 + E (EX )4 = E (X 4 ) − 4Em(X 3 ) + 6m2 E (X 2 ) − 4m3 E (X 1 ) + E (EX )4 = E (X 4 ) − 4mE (X 3 ) + 6m2 E (X 2 ) − 4m4 + m4 = E (X 4 ) − 4mE (X 3 ) + 6m2 E (X 2 ) − 3m4 Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Momenty zwykłe E (X 2 ) = σ 2 + m2 E (X 3 ) = 3σ 2 m + m3 E (X 4 ) = 3σ 4 + 6σ 2 m2 + m4 Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Momenty zwykłe E (X 2 ) = σ 2 + m2 E (X 3 ) = 3σ 2 m + m3 E (X 4 ) = 3σ 4 + 6σ 2 m2 + m4 Wracamy do momentu centralnego µ4 (X ) = E (X 4 ) − 4mE (X 3 ) + 6m2 E (X 2 ) − 3m4 = (3σ 4 + 6σ 2 m2 + m4 ) − 4m(3σ 2 m + m3 ) + 6m2 (σ 2 + m2 ) − 3m4 = 3σ 4 + 6σ 2 m2 + m4 − 12σ 2 m2 − 4m4 + 6σ 2 m2 + 6m4 − 3m4 = 3σ 4 Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Momenty zwykłe E (X 2 ) = σ 2 + m2 E (X 3 ) = 3σ 2 m + m3 E (X 4 ) = 3σ 4 + 6σ 2 m2 + m4 Wracamy do momentu centralnego µ4 (X ) = E (X 4 ) − 4mE (X 3 ) + 6m2 E (X 2 ) − 3m4 = (3σ 4 + 6σ 2 m2 + m4 ) − 4m(3σ 2 m + m3 ) + 6m2 (σ 2 + m2 ) − 3m4 = 3σ 4 + 6σ 2 m2 + m4 − 12σ 2 m2 − 4m4 + 6σ 2 m2 + 6m4 − 3m4 = 3σ 4 Kurtoza rozkładu normalnego K= (µ4 (X )) σ4 −3= 3σ 4 σ4 −3=3−3=0 Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Inne rozkłady rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład arcusa sinusa, Arfwedsona, Arnolda, arytmetyczny, asymetryczny, asymptotyczny, beta Poissona, beta Whittle’a, beta-gamma, beta-pierwszy, Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Inne rozkłady rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład beta-Stacy’ego, Binghama, Birnbauma-Saundersa, Birnbauma-Tingeya, Borela-Tannera, Bosego, Bradforda, brzegowy, Cauchy’ego dwuwymiarowy, Charliera, Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Inne rozkłady rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład chi, Dimrotha-Watsona, Dirichleta, dwumianowy podwójny, dwumodalny, dwustronnie wykładniczy, Elfwinga, Engseta, F logarytmiczny, F podwójnie niecentralny, Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Inne rozkłady rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład Ferreriego, Frécheta, Gaussa odwrotny, Gaussa-Poissona, Gibrata, harmoniczny, Helmerta, hipergeometryczny odwrotny, Isinga-Stevensa, jednopunktowy, Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Inne rozkłady rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład Kapteyna, kwadratowo-normalny, logarytmicznie logistyczny, logarytmiczny Poissona z zerami, Lomaxa, Marshalla-Olkina, Maxwella, Millera, najmniej korzystny, nieosobliwy, Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Inne rozkłady rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład normalny ucięty Poissona, Pascala, Perka, Poissona-Lexisa, Poissona-Pascala, Pólyi, Rayleigha, Rhodesa, Riemanna, równowagi, Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Inne rozkłady rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład rozkład Shorta, skontaminowany, Smirnowa-Birnbauma-Tingeya, Stevensa-Craiga, Stirlinga, szeregu Dirichleta, Thomasa, w połowie Cauchy’ego, Walda, Yule’a... Przemysław Juszczuk Rozkłady statystyczne Parę słów wstępu Rozkłady ciągłe Rozkłady skokowe Inne Rozkład beta Rozkład normalny wielowymiarowy Trochę gnuplota... Ciekawostka... Inne rozkłady Dziękuję za uwagę Przemysław Juszczuk Rozkłady statystyczne