Rozkład normalny Marcin Zajenkowski Marcin Zajenkowski () Rozkład normalny 1 / 26 Rozkład normalny Krzywa normalna, krzywa Gaussa, rozkład normalny Rozkłady liczebności wielu pomiarów fizycznych, biologicznych i psychologicznych mają rozkład normalny Przy nieograniczonym wzroście liczby niezależnych doświadczeń statystycznych, wszystkie znane teoretyczne rozkłady zmiennych losowych dążą do rozkładu normalnego. Marcin Zajenkowski () Rozkład normalny 2 / 26 Rozkład normalny Rozkład normalny jest rodzajem rozkładu liczebności, czyli przyporządkowaniem kolejnym wartościom zmiennej odpowiadających im liczebności. Rozkład liczebności można traktować jako rozkład prawdopobieństwa. Czyli: możemy określić jakie jest prawdopodobieństwo wystąpienia danej wartości (np. wzrostu). Marcin Zajenkowski () Rozkład normalny 3 / 26 Marcin Zajenkowski () Rozkład normalny 4 / 26 Plansza Galtona Marcin Zajenkowski () Rozkład normalny 5 / 26 Zapis Opisując rozkład liczebności zmiennej losowej X należy podać jego liczebność (N), wartość oczekiwaną (czyli średnią, µ) oraz odchylenie standardowe (σ). Mówimy, że zmienna losowa X ma rozkład normalny o wartości oczekiwanej µ i odchyleniu standardowym σ, czyli: X : N(µ, σ) Marcin Zajenkowski () Rozkład normalny 6 / 26 Zapis Opisując rozkład liczebności zmiennej losowej X należy podać jego liczebność (N), wartość oczekiwaną (czyli średnią, µ) oraz odchylenie standardowe (σ). Mówimy, że zmienna losowa X ma rozkład normalny o wartości oczekiwanej µ i odchyleniu standardowym σ, czyli: X : N(µ, σ) Marcin Zajenkowski () Rozkład normalny 6 / 26 Równanie krzywej normalnej y - wysokość krzywej na konkretnych wartości X π - Stała = 3,14 e - podstawa logarytmów Napierana = 2,71 N - liczba przypadków µ - średnia rozkładu σ - odchylenie standardowe Marcin Zajenkowski () Rozkład normalny 7 / 26 Rozkład teoretyczny Rozkład normalny jest modelem teoretycznym Zakłada się, że zjawiska w przyrodzie mają rozkład normalny Gdy N, średnia i odchylenie standardowe są znane, to pod X można podstawiać różne wartości i otrzymywać wartości Y Marcin Zajenkowski () Rozkład normalny 8 / 26 Wynik standardowy Wyniki pod krzywą normalną zapisuje się zazwyczaj w jednostkach odchylenia standardowego - są to bowiem wyniki uniwersalne W tym celu używa się oblicza się tzw. wyniki standardowe, które mają średnią 0 i odchylenie standardowe 1. Powierzchnia pod krzywą traktowana jest jako 1. Marcin Zajenkowski () Rozkład normalny 9 / 26 Wynik standardowy Wyniki pod krzywą normalną zapisuje się zazwyczaj w jednostkach odchylenia standardowego - są to bowiem wyniki uniwersalne W tym celu używa się oblicza się tzw. wyniki standardowe, które mają średnią 0 i odchylenie standardowe 1. Powierzchnia pod krzywą traktowana jest jako 1. Marcin Zajenkowski () Rozkład normalny 9 / 26 Wynik standardowy z = X −X s z - wynik standardowy X - wynik otrzymany (surowy) X - średnia arytmetyczna s - odchylenie standardowe Marcin Zajenkowski () Rozkład normalny 10 / 26 Przykład Badamy wzrost w grupie studentów. Odchylenie = 5, średnia = 175 Jakie jest z dla wzrostu równego 180, 165, 175? Marcin Zajenkowski () Rozkład normalny 11 / 26 Zadanie Zamień na wyniki standardowe następujące wyniki surowe: 3, 6, 7, 9, 15, 20 Marcin Zajenkowski () Rozkład normalny 12 / 26 Rozwiązanie -1.11, -0.63, -0.47, -0.16, 0.79, 1.58 Marcin Zajenkowski () Rozkład normalny 13 / 26 Rozkład normalny dla wyników z Marcin Zajenkowski () Rozkład normalny 14 / 26 Rozkład normalny dla wyników z Rozkład normalny dla wyników z przyjmuje zawsze stałe wartości średniej i odchylenia standardowego X =0 s =1 Marcin Zajenkowski () Rozkład normalny 15 / 26 Wysokość krzywej Znając wartość z (lub X), można obliczyć wysokość krzywej (y) w dowolnym punkcie. Np. gdy z = 0, y = 0,3989 Wysokości rzędnych można odczytać z tablic statystycznych. Rzędne – rzadko używane Marcin Zajenkowski () Rozkład normalny 16 / 26 Obszar pod krzywą O wiele częściej określa się obszar pod krzywą normalną. Przyjmuje się, że całkowity obszar pod krzywą = 1 (lub 100 %) Można go określić jako prawdopodobieństwo wystąpienia wartości z przedziału Np. pomiędzy z = 0 a z = 1. Obszar ten wynosi 0.3413 Marcin Zajenkowski () Rozkład normalny 17 / 26 Obszar pod krzywą Marcin Zajenkowski () Rozkład normalny 18 / 26 Zadanie Jaki jest całkowity obszar pod krzywą normalną poniżej z = 1? Jaki jest całkowity obszar pod krzywą normalną powyżej z = 1? Marcin Zajenkowski () Rozkład normalny 19 / 26 Zadanie Jaki jest całkowity obszar pod krzywą normalną poniżej z = 1? Jaki jest całkowity obszar pod krzywą normalną powyżej z = 1? Marcin Zajenkowski () Rozkład normalny 19 / 26 Rozwiązanie Poniżej: 0.3413 + 0.5 = 0.8413 Powyżej: 1 – 0.8413 = 0.1587 Marcin Zajenkowski () Rozkład normalny 20 / 26 Zadanie 2 Jakim z odpowiada obszar powyżej i poniżej średniej obejmujący: ok 0.68 0.95 0.99 Marcin Zajenkowski () Rozkład normalny 21 / 26 Rozwiązanie 1 1.96 2.58 Marcin Zajenkowski () Rozkład normalny 22 / 26 Zadanie 3 Jaki procent populacji ma iloraz inteligencji = 120 lub wyższy? Średnia IQ = 100, s = 15. Marcin Zajenkowski () Rozkład normalny 23 / 26 Rozwiązanie z = (120 – 100)/15 = 1.33 z = 1.33 = 0.4082 obszaru 1 – 0.4082 = 0.0918 Wynik: Około 9.2% Marcin Zajenkowski () Rozkład normalny 24 / 26 Zadanie 4 Średnia wyników testu zdolności wynosi 500, odchylenie standardowe = 100. Jaki procent badanych osiąga wyniki: powyżej 700 poniżej 600 między 400 a 700 między 600 a 700 Marcin Zajenkowski () Rozkład normalny 25 / 26 Właściwości rozkładu normalnego Jest rozkładem symetrycznym (czyli liczebności odpowiadające wartościom zmiennej rozkładają się symetrycznie wokół liczebności największej) W punkcie centralnym rozkładu znajduje się średnia arytmetyczna, a także modalna i mediana. Z tego wynika, że średnia arytmetyczna jest wartością cechy najczęściej spotykaną w badanej zbiorowości Marcin Zajenkowski () Rozkład normalny 26 / 26 Właściwości rozkładu normalnego Najwyższa rzędna jest w punkcie z = 0. Krzywa normalna jest asymptotyczna Punkty zagięcia krzywej w +- 1 odchylenie standarowe Marcin Zajenkowski () Rozkład normalny 27 / 26