EKONOMIA MENEDŻERSKA dr Sylwia Machowska 1 OCENA POPYTU PROGNOZY ROZDZIAŁ 4 2 Skąd pochodzą równania popytu? • Konstruowaniem i estymacją równań popytu zajmują się ekonomiści. • Aby zbudować i oszacować równanie prognostyczne potrzeba danych statystycznych. • Równania popytu pozwalają sporządzić prognozy będące podstawą decyzji podejmowanych przez menedżerów. 3 Podstawowe i absolutnie obowiązkowe pytania przy ustalaniu prognozy 1. Jakie jest najlepsze równanie prognostyczne, które można oszacować na podstawie dostępnych danych? Czy równanie prawidłowo objaśnia zmiany interesującej nas zmiennej? 2. Jakie czynniki zostały pominięte w naszym równaniu? Jakie jest prawdopodobieństwo oraz wielkość możliwego błędu prognozy? 3. Jakie mogą być konsekwencje błędu dla wielkości wyniku ekonomicznego? 4 Źródła informacji z których pochodzą dane do prognoz popytu 1. Wywiady i badania ankietowe prowadzone wśród konsumentów. 2. Kontrolowane badania rynku. 3. Publikowane dane rynkowe. 5 Ankieta - dobrze zaprojektowana • Ankieta dla reprezentatywnej grupy konsumentów może dostarczyć informacji o wielkości przewidywanych zakupów przy różnych założeniach dotyczących ceny i jakości produktu. • Na podstawie tych informacji można zbudować odpowiednie równania popytu. 6 Linia lotnicza i przeloty na trasie Huston - Floryda • Linia lotnicza może przeprowadzić ankietę wśród mieszkańców Huston podróżujących prywatnie i służbowo, na temat planów wyjazdowych na Florydę. 7 • Poszczególne pytania dotyczyłyby takich kwestii, jak: ceny, zakres usług, preferencje co do rozkładu lotów, opinie o danej linii a także liniach konkurencyjnych. • Jeszcze inne pytania mogłyby służyć określeniu wpływu dochodów indywidualnych i koniunktury gospodarczej 8 na częstotliwość podróży lotniczych. Analiza regresji To metoda statystyczna, która pozwala określić ilościową zależność danej zmiennej ekonomicznej od jednej lub większej liczby zmiennych niezależnych. STR. 165 9 Analiza regresji W metodzie tej wykorzystuje się obserwacje wartości interesujących nas zmiennych, dokonane w przeszłości, do znalezienia i oszacowania równania, które najlepiej wyraża relacje między zmiennymi. STR. 165 10 Procedura regresji 1. Zbieranie danych o badanych zmiennych. 2. Wybór postaci równania opisującego zależność między zmiennymi. 3. Szacowanie współczynników występujących w równaniu (estymatorów). 4. Ocena dokładności (dopasowania) równania. 11 Pojęcie estymacji Estymacja – szacowanie wartości parametrów lub postaci rozkładu zmiennej na podstawie próby. Na podstawie wyników próby formułujemy wnioski dla całej populacji. 12 Regresja liniowa oparta na metodzie najmniejszych kwadratów • Za przykład posłuży nam znana linia lotnicza i przeloty na trasie Teksas-Floryda. • W jaki sposób za pomocą analizy regresji oszacować równanie popytu? 13 Interesuje nas przewidywana liczba sprzedawanych biletów przypadająca na jeden rejs, warto więc zebrać dane o liczbie sprzedanych miejsc z ostatniego okresu. 14 Rok i kwartał Przeciętna liczba sprzedanych biletów na jeden lot Przeciętna cena Rok 1 I 64,8 250 II 33,6 265 III 37,8 265 IV 83,3 240 Rok 2 I 111,7 230 II 137,5 225 III 109,5 225 IV 96,8 220 Rok 3 I 59,5 230 II 83,2 235 III 90,5 245 IV 105,5 240 Rok 4 I 75,7 250 II 91,6 240 III 112,7 240 IV 102,2 235 Średnia 87,2 239,7 Odchylenie 27,0 12,7 + trzy dodatkowe kolumny (będą nam później potrzebne 15 Rok i kwartał Przeciętna liczba sprzedanych biletów na jeden lot X Przeciętna cena Rok 1 I 64,8 250 II 33,6 265 III 37,8 265 IV 83,3 240 Rok 2 I 111,7 230 II 137,5 225 III 109,5 225 IV 96,8 220 Rok 3 I 59,5 230 II 83,2 235 III 90,5 245 IV 105,5 240 Rok 4 I 75,7 250 II 91,6 240 III 112,7 240 IV 102,2 235 Średnia 87,2 239,7 Odchyl. Stand. s 27,0 12,7 X*= 330-1P X*-X (X*-X)2 16 • Średnia z całej próby (87,2) jest pewną wskazówką co do prawdopodobnej wielkości sprzedaży w przyszłości. 17 • Równie ważną cechą jest dyspersja, czyli zmienność, rozproszenie liczby miejsc sprzedawanych w poszczególnych kwartałach. • Najczęściej stosowaną miarą dyspersji jest wariancja definiowana jako: UWAGA!!!n W naszym przykładzie podano taki 2 właśnie wzór, ale iwariancję liczono zi innej 2 1 postaci wzoru, który nie jest równoważny temu. s (X X ) n 1 Gdzie: X to wielkość sprzedaży w poszczególnych kwartałach X to średnia ze wszystkich obserwacji n to liczba wszystkich obserwacji Zawiera informacje o średnim odchyleniu zmiennej od wartości 18 średniej. Wariancja • Wariancja jest podstawową miarą zmienności obserwowanych wyników. • Informuje o tym, jak duże jest zróżnicowanie wyników w danym zbiorze wyników (zmiennej). 19 • Inaczej mówiąc, czy wyniki są bardziej skoncentrowane wokół średniej, czy są małe różnice pomiędzy średnią a poszczególnymi wynikami. • Wariancja przyjmuje wartości od 0 do plus nieskończoności. 20 n 1 2 s xi x n i 1 2 Inna postać wzoru na wariancję Wariancja - jest to średnia arytmetyczna kwadratów odchyleń poszczególnych wartości cechy od średniej arytmetycznej zbiorowości. • W naszym przykładzie wariancja z próby wynosi:.. 731,625625 21 Zatem dyspersja sprzedaży jest dość duża, będzie to skutkować dużym odchyleniem standardowym. Im bardziej wartości cechy jednostek (X) są skupione dookoła swej średniej, tym mniejsza jest dyspersja i odwrotnie – im bardziej są rozproszone, tym większa jest dyspersja. 22 Do zapamiętania Tak więc wariancja próby to suma kwadratów odchyleń rzeczywistych wielkości sprzedaży od wielkości średniej, wyrażona w postaci wartości średniej dzięki podzieleniu przez n. Wraz ze wzrostem dyspersji poszczególnych obserwacji wzrasta również wariancja. 23 Odchylenie standardowe (klasyczna miara zmienności) próby oznaczane jako S, to pierwiastek kwadratowy z wariancji. Wyciągając pierwiastek z odchyleń podniesionych do kwadratu sprowadzamy naszą miarę odchyleń do tych samych jednostek, w których wyrażone są obserwacje w próbie. 24 • Odchylenie standardowe mówi, jak szeroko wartości jakiejś wielkości (takiej jak np. wiek, inflacja, kurs akcji itp.) są rozrzucone wokół jej średniej. • Im mniejsza wartość odchylenia tym obserwacje są bardziej skupione wokół średniej. 25 • W naszym przykładzie odchylenie standardowe wynosi: pierwiastek kwadratowy z wariancji: 731,625625 = 27,04857898= 27 miejsc w samolocie 26 Sprawdzenie rachunku ŚREDNIA Z PRÓBY WARIANCJA 27 • Czy wiemy już na tyle dużo by móc przewidzieć wielkość sprzedaży biletów na następny kwartał? • 87,2 to wartość średnia powinna odzwierciedlać centralną tendencję w wyraźnie zróżnicowanej próbie. 28 • A co by się stało gdyby sumę kwadratów odchyleń (wariancja) liczyć nie względem średniej 87,2 a innej większej liczby np. 92? • Wówczas okazałoby się, że sumy kwadratów są większe!!!! A chodzi o to by sumy kwadratów były najmniejsze. 29 • Dlaczego sumy kwadratów mają być najmniejsze? • Nazwa „najmniejsze kwadraty” oznacza, że końcowe rozwiązanie tą metodą minimalizuje sumę kwadratów błędów przy rozwiązywaniu każdego z równań. 30 Minimalizacja sumy kwadratów odchyleń • Można wykazać, że zastosowanie wartości średniej zawsze minimalizuje sumę kwadratów odchyleń. • W tym sensie średnia z próby jest najbardziej dokładną miarą centralnej tendencji dla dotychczasowych obserwacji. To jednak nie wystarczy by móc prognozować popyt. 31 Zajmijmy się więc cenami biletów (kolumna 3 zestawienia) • Jak widać, linia lotnicza zaczęła od wysokich cen, w drugim roku obserwujemy wydatny spadek cen a w następnych latach ceny utrzymały się na poziomie zbliżonym do 240 dolarów. 32 Rok i kwartał Przeciętna liczba sprzedanych biletów na jeden lot X Przeciętna cena Rok 1 I 64,8 250 II 33,6 265 III 37,8 265 IV 83,3 240 Rok 2 I 111,7 230 II 137,5 225 III 109,5 225 IV 96,8 220 Rok 3 I 59,5 230 II 83,2 235 III 90,5 245 IV 105,5 240 Rok 4 I 75,7 250 II 91,6 240 III 112,7 240 IV 102,2 235 Średnia 87,2 239,7 Odchyl. Stand. s 27,0 12,7 X*= 330-1P X*-X (X*-X)2 33 • Zestawienie liczby sprzedanych biletów oraz poziomu cen w poszczególnych kwartałach wskazuje na istnienie zależności w postaci krzywej popytu o nachyleniu ujemnym. A skąd to wiadomo? • Przy wysokich cenach sprzedawano stosunkowo niewiele biletów, natomiast po obniżce cen sprzedaż wyraźnie wzrosła. 34 Ceny biletów i liczba sprzedanych miejsc - graficznie P Układ punktów wskazuje na zależność ujemną – wysoka cena to niska sprzedaż. Do tego żeby wiedzieć jak ma wyglądać krzywa popytu a ściślej jej parametry potrzeba analizy regresji Z wykresu punktowego i analizy danych wynika, że istnieje zależność charakterystyczna dla krzywej popytu. 35 Wyprowadzenie z wykresu punktowego równania popytu. • Wydaje się, że odpowiednie będzie równanie liniowe w postaci: Wyraz stały Współczynnik kierunkowy określa nachylenie X= a – bP Zmienna prognozowana lub objaśniana Zmienna zależna Zmienna niezależna Współczynniki, parametry równania 36 Jak znaleźć parametry „a” i „b” ? Do określenia wartości parametrów a i b zastosujemy analizę regresji – powinny być to wartości, które najlepiej pasują do naszych danych. 37 Regresja − metoda statystyczna pozwalająca na badanie związku pomiędzy wielkościami danych i przewidywanie na tej podstawie nieznanych wartości jednych wielkości na podstawie znanych wartości innych. 38 • Dział statystyki zajmujący się modelami i metodami regresji zwany jest analizą regresji. • Regresja, w której występuje więcej niż jedna zmienna objaśniająca, zwana jest regresją wieloraką. 39 • Do obliczania współczynników równania zastosujemy metodę najmniejszych kwadratów MNK. Co to jest MNK? Metoda najmniejszych kwadratów opiera się na koncepcji poszukiwania takich wartości b0 b1 … bk parametrów strukturalnych β0 , β1 … βk przy których suma kwadratów reszt osiąga minimum. 40 MNK • Najlepiej znaną i najczęściej stosowaną w praktyce metodą estymacji nieznanych parametrów strukturalnych modelu y = ax + b jest metoda najmniejszych kwadratów (MNK). WYMIĘKKAM ! 41 MNK inaczej • Mamy zbiór n punktów (xi, yi) dla których chcielibyśmy dopasować funkcję liniową y = ax + b. Należy znaleźć takie dwie liczby rzeczywiste „a” oraz „b” aby jak najwięcej punktów leżało blisko tej prostej. 42 • Na początek, założymy (abitralnie), że współczynnik a =330, natomiast współczynnik b=1. Zatem, równanie przyjmie następującą postać: Punkt wyjścia X= 330-1P 43 Jako wyjściową krzywą popytu wybieramy: X= 330-1P Linia popytu powinna w przybliżeniu odzwierciedlać rozkład obserwacji. Widać jednak, że wiele obserwacji leży dość daleko od linii popytu. Może można to poprawić tzn. lepiej oszacować równanie? 44 1. Najpierw uzupełnijmy sobie sprzedaż prognozowaną (X*) według równania X*= 330-1P (kolumna w tabeli). Wyliczmy. 45 2. Aby zmierzyć ogólne dopasowanie równania w metodzie najmniejszych kwadratów obliczamy błędy szacunku względem poszczególnych obserwacji. Błąd szacunku, czyli odchylenie od wartości empirycznej obliczamy: sprzedaż prognozowana minus sprzedaż rzeczywista X*-X. Wyliczmy. 46 3. Następnie błędy szacunku podnosimy do kwadratu i na końcu sumujemy (X*-X)2. Suma kwadratów błędów (odchyleń, reszt) oznaczana jest jako SSE. Wyliczmy. 47 Suma kwadratów odchyleń (reszt, błędów) SSE SSE • Suma kwadratów błędów SSE jest jedną z miar dopasowania równania i dokładności prognozy. 48 SSE suma kwadratów odchyleń • Im mniejsze SSE, tym dokładniejsze jest równanie regresji. • Gdyby wszystkie faktyczne obserwacje ceny i ilości odpowiadały dokładnie punktom położonym na linii równania, to błąd prognozy we wszystkich kwartałach byłby zerowy, a więc SSE byłaby równa zeru. 49 * SSE to suma kwadratów reszt; od funkcji tzw. zmienność przypadkowa (błędów, odchyleń) 50 Prognozowana i rzeczywista sprzedaż biletów według równania X*=330-1P Rok i kwartał Przeciętna liczba sprzedanych biletów na jeden lot (Xi) Przeciętna cena (yi) Sprzedaż prognozowa na (X*) Błąd szacunku X*-Xi Kwadraty błędów (X*-Xi)2 Rok 1 I 64,8 250 80 15,2 231,0 II 33,6 265 65 31,4 986,0 III 37,8 265 65 27,2 739,8 IV 83,3 240 90 6,7 44,9 Rok 2 I 111,7 230 100 -11,7 136,9 II 137,5 225 105 -32,5 1056,3 III 109,5 225 105 -4,5 20,3 IV 96,8 220 110 13,2 174,2 Rok 3 I 59,5 230 100 40,5 1640,3 II 83,2 235 95 11,8 139,2 III 90,5 245 85 -5,5 30,3 IV 105,5 240 90 -15,5 240,3 Rok 4 I 75,7 250 80 4,3 18,5 II 91,6 240 90 -1,6 2,6 III 112,7 240 90 -22,7 515,3 IV 102,2 235 95 -7,2 51,8 średnia 87,2 239,7 90,3 +3,1 376,7 Suma kwadratów błędów SSE 51 6 027,7 Prognozowana i rzeczywista sprzedaż biletów według równania X=330-1P Rok i kwartał Przeciętna liczba sprzedanych biletów na jeden lot (Xi) Przeciętna cena (yi) Sprzedaż prognozowa na (X*) Błąd szacunku X*-X Kwadraty błędów (X*-X)2 Rok 1 I 64,8 250 80 15,2 231,0 II 33,6 265 65 31,4 986,0 III 37,8 265 65 27,2 739,8 IV 83,3 240 90 6,7 44,9 Rok 2 I 111,7 230 100 -11,7 136,9 II 137,5 225 105 -32,5 1056,3 III 109,5 225 105 -4,5 20,3 IV 96,8 220 110 13,2 174,2 Rok 3 I 59,5 230 100 40,5 1640,3 II 83,2 235 95 11,8 139,2 III 90,5 245 85 -5,5 30,3 IV 105,5 240 90 -15,5 240,3 Rok 4 I 75,7 250 80 4,3 18,5 II 91,6 240 90 -1,6 2,6 III 112,7 240 90 -22,7 515,3 IV 102,2 235 95 -7,2 51,8 87,2 239,7 90,3 +3,1 376,7 Średnia sumy kwadratów błędów Suma kwadratów błędów SSE 52 6 027,7 Aby zmierzyć ogólne dopasowanie równania w metodzie najmniejszych kwadratów należy policzyć średni błąd kwadratowy. Średni błąd kwadratowy: , suma kwadratów odchyleń dzielona przez ilość obserwacji. Proszę wyliczyć. 6027,7 / 16 = 376,7 53 • Błędy prognozy (X*-X)2 podnosimy do kwadratu ponieważ: - Pozwala to jednakowo traktować odchylenia ujemne i dodatnie. 54 • METODA NAJMNIEJSZYCH KWADRATÓW pozwala wyznaczyć takie wartości parametrów, które minimalizują sumę kwadratów odchyleń wartości teoretycznych od wartości empirycznych. 55 • Mamy teraz wyznaczyć estymatory równania (współczynniki a i b) MNK. b( x ) n yixi yi xi i i i n yi yi i i 2 2 16 330378,5 3835 1395,9 b( x ) 1,63 2 16 921775 3835 56 x b y i a( x) ( x) i i i n 1395,9 (1,63) 3835 a( x) 477,93 16 57 Jak to policzyć w Excelu? Nanieść dane (X i Y). Pamiętać, że „nasz” X jest Y w Excelu. W zestawie standardowych funkcji znajduje się REGLINP za pomocą, której można obliczyć parametry liniowej funkcji regresji i jednocześnie miary dopasowania. 58 Sposób postępowania: 1. Zaznaczamy pole o wymiarach 5 wierszy na 2 kolumny (tam zobaczymy wyniki obliczeń). 2. Z paska narzędzi wybieramy wstaw, funkcja, REGLINP. Wpisujemy wartości X i Y oraz stała:1, statystyka:1 3. Naciskamy jednocześnie Ctrl+Shift+Enter 59 Parametry uzyskane w Excelu Uzyskamy taki widok. 60 Parametry uzyskane w EXCELU -1,63256 478,5471 b(y) a(y) współczynnik funkcji współczynnik funkcji Błąd średni oszacowania parametru 0,366794 88,03897 Błąd średni oszacowania parametru 0,585925 18,60713 R2(yx) Se(Y) współczynnik determinacji średni błąd szacunku Wartość statystyki F Liczba stopni swobody - 2 ∑(ŷ -y) ∑(y- ŷ)2 suma kwadratów odchyleń funkcji od średniej tzw. zmienność wyjaśniana regresją suma kwadratów odchyleń danych empirycznych od funkcji tzw. zmienność przypadkowa. 61 19,81031 14 6858,828 4847,152 • Wyznaczając estymatory równania według MNK otrzymujemy: a= 478,6 i b=-1,63 W związku z tym nasze równanie przyjmie teraz postać: X= 478,6 – 1,63P Ze wszystkich możliwych równań liniowych powyższe równanie daje najmniejszą sumę 62 kwadratów odchyleń. Jako wyjściową krzywą popytu wybraliśmy: X= 330-1P Nasza nowa (poprawiona) linia popytu X= 478,6 – 1,63P X= 478,6 – 1,63P Dla P= 200, x= 152,6 Dla P= 275, X= 30,35 Stara linia popytu Koniec 63 Regresja wieloraka • Jak wiadomo cena nie jest jedynym czynnikiem określającym wielkość sprzedaży. • Dlatego warto wprowadzić dodatkowe zmienne objaśniające (prawa strona równania). • Niech zmienne objaśniające reprezentują: cenę (P), cenę konkurenta (PK) oraz dochód (Y). 64 Regresja wieloraka • Ogólna postać równania popytu: X= a + bP + cPK + dY 65 Przeciętna liczba sprzedanych biletów na jeden lot (Xi) Przeciętna cena „naszego” biletu (yi) Przeciętna cena konkurenta Przeciętny dochód (wskaźnik) Pk Y Rok 1 I 64,8 250 250 104,0 II 33,6 265 250 101,5 III 37,8 265 240 103,0 IV 83,3 240 240 105,0 Rok 2 I 111,7 230 240 100,0 II 137,5 225 260 96,5 III 109,5 225 250 93,3 IV 96,8 220 240 95,0 Rok 3 I 59,5 230 240 97,0 II 83,2 235 250 99,0 III 90,5 245 250 102,5 IV 105,5 240 240 105,0 Rok 4 I 75,7 250 220 108,5 II 91,6 240 230 108,5 III 112,7 240 250 108,0 IV 102,2 235 240 109,0 Rok i kwartał średnia SSE 87,2 239,7 243,1 102,2 Sprzedaż prognozo wana (X*) Błąd szacunku X*-Xi Kwadraty błędów (X*-Xi)2 66 • Żeby uzupełnić tabelkę potrzebujemy równania a żeby je mieć trzeba oszacować parametry równania co zrobimy w Excelu. 67 parametry równania 68 • Wykorzystując MNK obliczamy cztery parametry: wyraz wolny oraz współczynniki przy zmiennych objaśniających (w Excelu zaznaczamy cztery kolumny i pięć wierszy i używamy funkcji REGLINP). d c b a 3,089366 1,034561 -2,1235 28,84377 0,998893 0,466527 0,34039 174,6653 0,776492 14,7659 #N/D! #N/D! 13,89645 12 #N/D! #N/D! 9089,599 2616,38 #N/D! #N/D! X= a + bP + cPK + dY Oszacowane równanie to: X= 28,84 – 2,12P + 1,03PK + 3,09Y 69 Y dochód PK cena konkurenta 1,034561 P cena „nasza” -2,1235 28,84377 Błąd standardowy parametru Y 0,998893 Błąd standardowy parametru PK 0,466527 Błąd standardowy parametru P 0,34039 Błąd standardowy R2 Błąd standardowy regresji 14,7659 3,089366 0,776492 Wartość statystyki F 13,89645 Stopnie swobody Suma kwadratów reszt SS 9089,599 Suma kwadratów błędów 2616,38 Stała 174,6653 12 70 • NASZE RÓWNANIE (prognostyczne) X= 28,84 – 2,12P + 1,03PK + 3,09Y • Uzupełniamy tabelkę 71 Rok i kwartał Przeciętna liczba sprzedanych biletów na jeden lot (X) Przeciętna cena „naszego” biletu Sprzedaż prognozo wana (X*) Błąd szacunku X*-X Kwadraty błędów (X*-X)2 Rok 1 I 64,8 250 250 104,0 77,7 12,9 166,41 II 33,6 265 250 101,5 38,175 4,575 20,93062 III 37,8 265 240 103,0 32,51 -5,29 27,9841 IV 83,3 240 240 105,0 91,69 8,39 70,3921 Rok 2 I 111,7 230 240 100,0 97,44 -14,26 203,3476 II 137,5 225 260 96,5 117,825 -19,675 387,1056 III 109,5 225 250 93,3 97,637 -11,863 140,7308 IV 96,8 220 240 95,0 103,19 6,39 40,8321 Rok 3 I 59,5 230 240 97,0 88,17 28,67 821,9689 II 83,2 235 250 99,0 94,05 10,85 117,7225 III 90,5 245 250 102,5 83,665 -6,835 46,71723 IV 105,5 240 240 105,0 91,69 -13,81 190,7161 Rok 4 I 75,7 250 220 108,5 60,705 -14,995 224,85 II 91,6 240 230 108,5 92,205 0,605 0,366025 III 112,7 240 250 108,0 111,26 -1,44 2,0736 IV 102,2 235 240 109,0 114,65 12,45 155,0025 suma SSE 1395,9 3835 Przeciętna cena konkurenta 3890 Przeciętny dochód (wskaźnik) 1635,8 72 2617,15 • Suma kwadratów błędów wynosi 2 617,15 i jest znacznie mniejsza niż dla równań szacowanych poprzednio (6 027,7) i (6 858,828). • • Uwzględnienie dodatkowych zmiennych zwiększyło dokładność równania regresji. 73 Symulacja problemu Dowiedzieliśmy się, że nasz konkurent planuje obniżkę biletów średnio o 10 dolarów na bilecie. Jak to wpłynie na sprzedaż „naszych” biletów X? X= 28,84 – 2,12P + 1,03PK + 3,09Y Żeby obliczyć sprzedaż „naszych” biletów trzeba znać przeciętną cenę konkurenta, to obliczmy: suma cen konkurenta (z tabelki) podzielić przez szesnaście obserwacji i odjąć 10 dolarów. Zatem, przeciętna cena konkurenta = 3890:16-10=233,125 74 Ile zatem wyniesie nasza sprzedaż przy obniżonej cenie konkurenta ? Proszę obliczyć. X= 28,84 – 2,12P + 1,03PK + 3,09Y X= 28,84 – 2,12•239,7 + 1,03•233,1 + 3,09•102,2 X= 76,57 tyle sprzedamy biletów jeśli konkurent obniży cenę o 10 dolarów X= 87,2 a tyle sprzedajemy do tej pory (1395,9 : 16) Stracimy więc około 10 pasażerów! 75 A co zrobić, żeby nie stracić pasażerów? Należy obniżyć cenę „naszych” biletów. O ile? Nasza obecna średnia cena to 239,7. Zatem: jaka powinna być nasza cena przy obniżonej cenie konkurenta, proszę obliczyć? 76 X= 28,84 – 2,12P + 1,03PK + 3,09Y 87,2= 28,84 – 2,12•P + 1,03•233,1 + 3,09•102,2 P= 234,7 Taka powinna być a jest 239,7 więc naszą cenę należy obniżyć o 5 dolarów, żeby nie stracić pasażerów. 77 INTERPRETACJA WYNIKÓW REGRESJI • Oprócz współczynników regresji, obliczonych metodą najmniejszych kwadratów, wyliczamy zestaw danych ukazujących jakość oszacowanego równania. • Chcąc ocenić w jakim stopniu równanie jest dopasowane do danych empirycznych należy zinterpretować wyniki. 78 Liczba stopni swobody Wartość średnia kwadratów TSS czyli odchylenie całkowite 79 Wyniki regresji wielorakiej popytu na bilety lotnicze Zmienna zależna X Suma kwadratów błędów Błąd standardowy regresji R2 Skorygowany R2 Statystyka F Liczba obserwacji Stopnie swobody PARAMETRY BŁĄD STANDARDOWY STATYSTYKA t 2617,10 (SSE) 14,77 0,78 0,72 14,2 16 12 STAŁA P 28,84 -2,12 7,21? 0,34 4,00 ? -6,24 PK Y 1,03 0,47 2,19 3,09 1,00 3,09 80 Współczynnik R2 zwany współczynnikiem determinacji lub miernikiem dobroci dopasowania Informuje, jaka część całkowitej zmienności zmiennej objaśnianej (zależnej) (X) stanowi zmienność wyjaśniona przez model. Pokazuje w jakim stopniu równanie regresji pasuje do danych empirycznych. 81 Żeby policzyć R kwadrat przyda się TSS Całkowitą zmienność zmiennej zależnej wyraża suma kwadratów odchyleń (TSS, inaczej odchylenie całkowite) zaobserwowanych wartości X od średniej X. 82 Żeby policzyć R kwadrat potrzeba również SSE Suma kwadratów odchyleń (reszt) (SSE, inaczej odchylenie niewyjaśnione regresją) wyraża część zmienności X nieuwzględnioną w równaniu regresji. SSE= 2621 (u mnie=2617,15). 83 W naszym przykładzie równanie regresji objaśnia 78% całej zmienności zmiennej zależnej. 84 Wartość R2 zawiera się w przedziale <0,1>. Gdyby równanie regresji dokładnie odzwierciedlało dane empiryczne, wówczas SSE=0, zatem R2=1. Gdyby natomiast równanie nie miało żadnej wartości objaśniającej to SSE=TSS a R2=0 85 Inny zapis wzoru: Odchylenie wyjaśnione regresją (SSR) Odchylenie całkowite (TSS) Odchylenie niewyjaśnione regresją (SSE) Odchylenie całkowite (TSS) 86 Od tego miejsca do tematu PROGNOZOWANIE student sam interpretuje wyniki regresji. 87 Skorygowany współczynnik „poprawia” stopień dopasowania. Uwzględnia liczbę stopni swobody w równaniu regresji. Liczba stopni swobody jest równa liczbie obserwacji (N) pomniejszonej o liczbę oszacowanych parametrów (k). W analizowanym równaniu mamy 16 obserwacji i 4 parametry (łącznie z wyrazem wolnym). Liczba stopni swobody wynosi więc N-k= 164=12. Zatem skorygowany współczynnik determinacji obliczamy według formuły: 88 Różnicę między R2 a skorygowanym stanowi poprawka uwzględniająca liczbę stopni swobody. skorygowany jest zawsze mniejszy od R2. W naszym, przykładzie . Wartość poprawki jest tym mniejsza im mniejsza jest liczba stopni swobody (N-k). W ten sposób skorygowany uwzględnia fakt, że wprowadzenie dodatkowych zmiennych objaśniających zawsze poprawia stopień dopasowania (zmniejsza SSE), ale następuje to kosztem zmniejszenia liczby stopni swobody. 89 Inny zapis wzoru: 90 Statystyka F • Wartość statystyki F służy do weryfikacji hipotezy o łącznej istotności zmiennych objaśniających. • W formule tej dzielimy objaśnioną część zmienności R2 przez część nie objaśnioną (1-R2), korygując każdą z nich o stopnie swobody. • Im bardziej dokładne są prognozy wyprowadzone z równania regresji, tym wyższa będzie wartość F. 91 • Statystyka F pozwala ocenić ogólną istotność statystyczną równania regresji. • Załóżmy, że wszystkie współczynniki przy zmiennych objaśniających w naszym równaniu regresji są zerowe: b=c=d=0. Gdyby ta hipoteza była prawdziwa, to równanie regresji nie miałoby żadnej wartości objaśniającej. Jednakże nawet w tym przypadku wartości R2 i F byłyby większe od zera ze względu na niewielkie i przypadkowe korelacje między zmiennymi. 92 • Bardzo niskie wartości F wskazują na duże prawdopodobieństwo, że równanie regresji nie ma wartości objaśniającej tzn. że nie można odrzucić hipotezy o zerowych wartościach parametrów. • Natomiast zerowe wartości parametrów wskazują na to, że statystyka F ma znany rozkład – odczytujemy go z tablic statystycznych. 93 • Aby zbadać, czy dane równanie regresji jest statystycznie istotne, szukamy krytycznej wartości statystyki F przy k-1 i N-k stopniach swobody. Wartości krytyczne F podawane są dla różnych poziomów ufności. Najczęściej posługujemy się współczynnikiem ufności 95% i 99%. • Jeżeli obliczona z równania wartość F jest większa od wartości krytycznej, to odrzucamy hipotezę o zerowych parametrach (przy założonym współczynniku ufności) i uznajemy, że równanie ma wartość objaśniającą. 94 • W naszym przykładzie statystyka F przyjmuje wartość: F=(0,78/3): (0,22/12)= 14,2 przy 3 i 12 stopniach swobody. W tablicy statystycznej rozkładu F znajdujemy dla współczynników ufności 95% i 99% wartości krytyczne F, wynoszące odpowiednio 3,49 i 5,95. Ponieważ obliczona wartość F jest większa niż 5,95, możemy odrzucić hipotezę zerową z prawdopodobieństwem 99%. Wniosek: Równanie regresji ma istotną wartość objaśniającą. 95 Liczba stopni swobody Liczba stopni swobody – liczba niezależnych wyników obserwacji pomniejszona o liczbę związków, które łączą te wyniki ze sobą. 1 2 3 10 + 5 = 15 n-1 stopni swobody 3-1=2 Liczbę stopni swobody można utożsamiać z liczbą niezależnych zmiennych losowych, które wpływają na wynik. 96 Inną interpretacją liczby stopni swobody może być: liczba obserwacji minus liczba parametrów estymowanych przy pomocy tych obserwacji. Liczba stopni swobody ogranicza liczbę parametrów które mogą być estymowane przy użyciu danej próby. 97 Stopnie swobody Suma kwadratów odchyleń, odch. całkowite Suma kwadratów odchyleń (reszt). Odchylenie wyjaśnione regresją Suma kwadratów odchyleń. Odchylenie nie wyjaśnione regresją • Ma n-1 stopni swobody, ponieważ mamy n obserwacji oraz jeden łączący je związek, mianowicie df (TSS) = n-1 • Ma k stopni swobody. Potrzeba k informacji uzyskanych na podstawie X1 , X2 , … , Xn , mianowicie: b1 , b2 , … , bk df (SSR) = k • ma n-k-1 stopni swobody, gdyż jest n obserwacji oraz k+1 związków określonych przez układ równań normalnych df (SSE) = n-k-1 98 Fraktyle Ξ kwantyle • Fraktyl xq (zwany również kwantylem) jest to taka wartość zmiennej losowej, że prawdopodobieństwo znalezienia mniejszych od niej wartości wynosi q: P(X< xq) Ξ F(xq)=q Najważniejsze fraktyle to: Dolny kwartyl: x0,25 Górny kwartyl: x0,75 Mediana: x=0,5 P to prawdopodobieństwo99 Inaczej: • Fraktyle (kwantyle) są pozycyjnymi miarami położenia. Ich wartości są wyznaczane na podstawie miejsca (pozycji) w uporządkowanym szeregu. Kwantyle są wartościami cechy występującymi u jednostek zbiorowości znajdujących się w określonym miejscu szeregu (np. w połowie, w jednej czwartej, jednej dziesiątej). • Najczęściej stosowane w analizie rozkładu cechy są następujące kwantyle: • Mediana (wartość środkowa) • Kwartyle (wartości ćwiartkowe) • Decyle (wartości dziesiętne) 100 Błędy standardowe współczynników • Otrzymane wartości współczynników równania (w wyniku MNK) należy poddać badaniu w celu zmierzenia stopnia ich dokładności. – dlaczego? • Ponieważ same dane empiryczne podlegają błędom losowym (zawsze pewna część SSE pozostaje nieobjaśniona), uzyskane oceny parametrów są również obciążone błędem. 101 • Poza tym, oceny wartości parametrów byłyby dokładnie równe ich wartościom rzeczywistym (których nie znamy) jedynie wówczas, gdyby liczba obserwacji była nieskończenie wielka. Należy przyjąć, że uzyskane oceny parametrów wykazują zawsze pewną dyspersję wokół wartości prawdziwej. 102 Miarą błędu standardowego współczynnika regresji jest odchylenie standardowe jego dyspersji. • Im niższy jest błąd standardowy, tym dokładniejsza jest ocena wartości parametru. Ogólnie, z prawdopodobieństwem 95% można oczekiwać, że prawdziwa wartość parametru odchyla się od wartości oszacowanej nie więcej niż o dwa błędy standardowe*. 103 n.p. Obliczona wartość współczynnika przy zmiennej cenowej wynosi – 2,12, a błąd standardowy ± 0,34. Podwojona wartość błędu standardowego = ± 0,68 Zatem, z prawdopodobieństwem 95% prawdziwa wartość współczynnika zawiera się w przedziale… -2,80; -1,44 -2,12-0,68= -2,80 -2,12+0,68= -1,44 104 Statystyka t • Statystyka t to obliczona wartość współczynnika równania regresji podzielona przez jego błąd standardowy. • Informuje ona o ile odchyleń standardowych oszacowana wartość współczynnika odchyla się od zera. Np.: t= 3 oznacza, że ocena parametru jest większa od zera o trzy błędy standardowe. t=-1,5 oznacza, że ocena parametru jest mniejsza od zera o półtora błędu standardowego. 105 • Statystykę tę stosujemy do zbadania, czy określona zmienna objaśniająca ma istotny wpływ na zmienną objaśnianą. Rozważmy tzw. hipotezę zerową, że cena konkurenta nie ma istotnego wpływu, oznaczało by to, że prawdziwa wartość interesującego nas parametru jest zerowa (c=0). Jednakże w naszym przykładzie otrzymana z regresji ocena tego parametru wynosi 1,03. Czy można, zatem powiedzieć, iż jest to wartość istotnie różna od zera? Ludzie, tu nic nie jest oczywiste. 106 Błąd standardowy oceny parametru jest równy 0,47. Gdyby prawdziwa wartość c równała się zeru, to z prawdopodobieństwem równym 95% ocena parametru byłaby zawarta w przedziale o wielkości dwóch błędów standardowych, czyli w przedziale (-0,94: +0,94). Obliczona zaś wartość parametru, wynosząca 1,03, leży poza tym przedziałem, a zatem różni się istotnie od zera. W naszym przykładzie wartość t=1, zaś współczynnik regresji / błąd standardowy= 03/0,47=2,19 . Wiadomo zatem, że obliczona wartość parametru odchyla się od zera o więcej niż podwojoną wartość błędu standardowego. 107 Odwołując się do rozkładu statystyki t, możemy określić poziom ufności, przy którym wolno nam odrzucić hipotezę c=0. Zauważmy, że obliczona wartość t ma N-k=16-4=12 stopni swobody. Korzystając z tablicy ilustrującej rozkład statystyki t (tablica 4A.2 na stronie 196) zauważamy, że przy hipotezie zerowej (z prawdopodobieństwem 95%) wartość t będzie zawarta w przedziale <-2,18; 2,18>. Ponieważ rzeczywista wartość t wynosi 2,19 i leży poza tym przedziałem, możemy odrzucić hipotezę c=0 z ufnością 95%. Gdyby jednak okazało się, że określony parametr nie różni się w sposób istotny od zera, wówczas należałoby usunąć daną zmienną z równania regresji. 108 Błąd standardowy regresji (odchylenie standardowe reszt) (standardowy błąd estymacji) • Błąd standardowy regresji jest miarą nieobjaśnionej zmienności zmiennej zależnej. • Informuje o ile średnio wartości obserwowane x odchylają się od wartości prognozowanych x* modelu. Dotychczas jako miarę nieobjaśnionej części wariancji przyjmowaliśmy sumę kwadratów reszt. Błąd standardowy regresji można obliczyć według wzoru: 109 • Uwaga: Przed wyciągnięciem pierwiastka dzielimy tutaj sumę kwadratów odchyleń przez liczbę stopni swobody a nie przez N. • Tak obliczony błąd standardowy jest przydatny przy wybieraniu przedziałów ufności w prognozach. N.p. w regresji opartej na dużej próbie przedział ufności 0,95 dla prognozowanych wartości zmiennej zależnej (X) jest wyznaczany przez wartości prognozowane według równania regresji (X*) plus/minus dwa odchylenia standardowe reszt. 110 Inny zapis wzoru: 111 Można jeszcze dodać i zinterpretować : • Poziom istotności • Współczynnik ufności 112 PROGNOZOWANIE 113 Rozdział 5 PROGNOZOWANIE Prognozowanie stanowi jeden z kluczowych elementów zarządzania organizacją. 114 MODELE PROGNOSTYCZNE Modele prognostyczne można podzielić na dwie grupy: modele strukturalne i niestrukturalne. • Modele strukturalne określają zależność interesującej nas zmiennej ekonomicznej od innych zmiennych. Przykład jednorównaniowego modelu strukturalnego: X=25+3Y+PK-2P 115 MODELE PROGNOSTYCZNE • Modele strukturalne opisujące funkcjonowanie gospodarki mogą składać się z setek równań i tysięcy zmiennych. 116 MODELE PROGNOSTYCZNE • Modele niestrukturalne koncentrują się na ustalaniu prawidłowości zmian określonych zmiennych ekonomicznych w czasie. • Przykładem takiego modelu jest analiza szeregów czasowych, czy metoda barometrów. 117 SZEREGI CZASOWE Zbiór wartości badanej cechy (zjawiska) uporządkowany chronologicznie nazywamy szeregiem czasowym lub chronologicznym. 118 SZEREGI CZASOWE • Szeregi czasowe są seriami obserwacji dokonywanymi w równych odstępach czasu. Miesięczna sprzedaż, koszt dnia pracy, produkcja tygodniowa są przykładami szeregów czasowych. 119 SZEREGI CZASOWE • Rozpatrując szeregi czasowe, należy mieć na uwadze główny trend i nakładające się na niego zakłócenia. Zakłócenia można oceniać na podstawie średnich błędów. 120 SZEREGI CZASOWE Najpopularniejsze szeregi czasowe: a) stały, b) o trendzie rosnącym, c) sezonowy 121 ANALIZA SZEREGÓW CZASOWYCH • Analiza szeregów czasowych polega na określeniu kształtowania się zmiennej ekonomicznej w czasie. 122 ANALIZA SZEREGÓW CZASOWYCH - ekstrapolacja • Na podstawie gruntownej analizy zachowania się danej zmiennej, zaobserwowanej w poprzednich okresach, metoda ta pozwala przewidzieć dalszą ewolucję tej zmiennej poprzez ekstrapolację dotychczasowych prawidłowości. 123 ekstrapolacja Ekstrapolacja – prognozowanie wartości pewnej zmiennej lub funkcji poza zakresem, dla którego mamy dane przez dopasowanie do istniejących danych pewnej funkcji, następnie wyliczenie jej wartości w szukanym punkcie. 124 DEKOMPOZYCJA SZEREGÓW CZASOWYCH W analizie szeregów czasowych możemy wyodrębnić następujące elementy dynamiki: • • • • TREND WAHANIA KONIUNKTURALNE ZMIANY SEZONOWE WAHANIA NIEREGULARNE Składniki typowego szeregu czasowego 125 DEKOMPOZYCJA SZEREGÓW CZASOWYCH - trend • TRENDEM (albo tendencją rozwojową) nazywamy stałą tendencję zmian danej zmiennej ekonomicznej, obserwowaną w dłuższym okresie. • Np. W okresie ostatnich lat tendencję wzrostową ujawnia popyt na dobra konsumpcyjne. 126 DEKOMPOZYCJA SZEREGÓW CZASOWYCH • WAHANIA KONIUNKTURALNE nakładają się na tendencję rozwojową. Są one obrazem okresów ekspansji lub recesji w procesie rozwoju gospodarczego. 127 DEKOMPOZYCJA SZEREGÓW CZASOWYCH • ZMIANY SEZONOWE to cykliczne wahania popytu o krótszym przebiegu, związane z porami roku, sezonowością zasiewów, itp. • WAHANIA NIEREGULARNE to proces w krótkim okresie kiedy zmienna ekonomiczna wykazuje zmiany nieregularne związane z nie dającymi się przewidzieć czynnikami 128 losowymi. Składowe szeregu czasowego 1. TREND 2. WAHANIA CYKLICZNE 3. ZMIANY SEZONOWE 4. WAHANIA NIEREGULARNE (SKŁADNIK LOSOWY) CZAS 129 WYZNACZANIE PROSTEGO TRENDU - metoda • Jedną z najprostszych metod prognozowania na podstawie szeregów czasowych jest wyznaczanie trendu pasującego do dotychczasowych danych i ekstrapolowanie go na lata przyszłe. 130 WYZNACZANIE TRENDU PRZY ZAŁOŻENIU, ŻE TERAŹNIEJSZOŚĆ WPŁYWA NA PRZYSZŁOŚĆ • W wielu procesach gospodarczych obecna wartość zmiennej ekonomicznej wpływa na jej wartość przyszłą. 131 Załóżmy, że wielkość sprzedaży przedsiębiorstwa w bieżącym okresie zależy od rozmiarów sprzedaży w okresie poprzednim: Xt= a + bXt-1 132 Takie równanie regresji można oszacować MNK, traktując wielkość sprzedaży w okresie poprzednim (czyli z opóźnieniem jednookresowym) jako zmienną objaśniającą. 133 RÓWNANIE REGRESJI Z UWZGLĘDNIENIEM ZMIENNEJ OPÓŹNIONEJ - PRZYKŁAD • Załóżmy, że spółka będąca operatorem sieci telewizji kablowej odnotowała w ostatnich 10 kwartałach ciągły wzrost liczby abonentów. Mając obecnie 500 000 abonentów, spółka chce wiedzieć ilu klientów może pozyskać w następnym roku, w ciągu dwóch i pięciu następnych lat. • Tendencja rozwojowa kształtuje się tak jak na rysunku: 134 Na podstawie kształtu krzywej wnioskujemy, że liczba abonentów wzrasta, ale w malejącym tempie. Nie wiadomo, czy malejące tempo utrzyma się w przyszłości. Należało by dokonać ekstrapolacji obserwowanej dotąd tendencji. W związku z tym trzeba zastanowić się nad postacią równania regresji. liczba abonentów 500 000 10 czas w kwartałach 135 Należy zbadać związek między „dzisiejszą” a „wczorajszą” liczbą abonentów. Mamy następujące informacje: • Około 98% klientów przedłuża abonament na następny kwartał. • Potencjalne rozmiary popytu ocenia się na 1 000 000 abonentów jednak cały rynek to 1 500 000 abonentów. • Liczba nowych abonentów zarejestrowanych w każdym kwartale stanowi około 8% ogólnej liczby nie pozyskanych jeszcze potencjalnych 136 klientów. Na tej podstawie można stwierdzić, że ogólną liczbę faktycznych abonentów w każdym kwartale opisuje równanie: Xt= a + bXt-1 Załóżmy teraz, że dokonaliśmy regresji opartej na danych z 10 ostatnich kwartałów i otrzymaliśmy następujące równanie: Xt= 113400 + 0,88Xt-1 Zapisać str 206 137 Możemy teraz obliczyć prognozowaną liczbę abonentów w następnych kwartałach (obecna liczba abonentów to 500 000 =dziesiąty kwartał). Prognoza na jedenasty kwartał wynosi X11=.. 553 400 Proszę obliczyć Xt= 113400 + 0,88Xt-1 X11= 113400 + 0,88 • 500 000 = 553 400 138 Prognoza na 12 kwartał X12=.. 600 392 t-1 podstawiam prognozę na 11 kwartał X12= 113400 + 0,88 • 553400 Zadanie dla Państwa Prognoza na 4 kwartał za następne 2 lata (licząc od X11 czyli dla X18) =.. 784 963 Prognoza na 4 kwartał za następne 3 lata (licząc od X11) =.. 849 026 139 • Jaka będzie maksymalna liczba naszych abonentów (ilu łącznie zdołamy pozyskać z rynku)? Obserwując nasze dotychczasowe obliczenia, widzimy, że liczba abonentów rośnie, ale przyrosty liczby abonentów (przyrosty Xt) z kwartału na kwartał są malejące, należy więc przypuszczać, że w końcu będą zerowe. Zatem, 140 Z tego wniosku wypływa następny: Xt przestanie rosnąć kiedy zrówna się z Xt-1 Xt= 113400 + 0,88Xt-1 Odpowiedź: X=113400+0,88X X-0,88X=113400 0,12X=113400 X= 945000 Jaka tu musi być liczba, żeby po wykonaniu działania dała nam tą i to właśnie będzie maksymalna liczba naszych abonentów 141 zadanie • W pewnym przedsiębiorstwie przeciętny koszt produkcji wynosi ATC = 2dolary. Oszacowano równanie regresji w postaci ATCt=0,3 + 0,6 ATCt-1. Na podstawie tego równania sporządź prognozę przeciętnych kosztów produkcji na następne pięć kwartałów. Wyznacz granicę zmian kosztów przeciętnych. 1. ATC=2 2. ATCt= 0,3+0,6*2=1,5 ATCt=ATCt-1 Koszty przestaną maleć kiedy obie wartości się zrównają 3. ATCt= 0,3+0,6*1,5=1,2 Odpowiedź: 4. ATCt= 0,3+0,6*1,2=1,02 ATCt=0,75 5. ATCt= 0,3+0,6*1,02=0,912 6. ATCt= 0,3+0,6*0,912=0,847 ponieważ 142 • • • • • ATCt= 2= ATCt-1 ATCt=0,3 + 0,6 ATCt-1 2ATCt = 0,3 + 0,6 *2 2ATC= 1,5 ATC = 0,75 143 Zmiany sezonowe a ekstrapolacja Jak skorygować wahania sezonowe? • Ekstrapolacja trendu pomija bardzo ważny czynnik: wahania sezonowe. • Jeśli np. rozpatrywać będziemy ekstrapolacje sprzedaży zabawek to okaże się, że w okresie przedświątecznym (jesień czyli kwartał czwarty) ekstrapolacja zaniża wolumen sprzedaży. 144 Zmiany sezonowe a ekstrapolacja • Można sporządzić poprawkę: obliczając średni błąd prognozy ex post tzn. sumujemy błędy prognozy (X*-X) dla wszystkich okresów przedświątecznych (z wszystkich lat) i dzielimy przez ich liczbę. 1 * ME X X n 145 • Następnie nową prognozę (ekstrapolowaną wartość trendu) na przyszły okres przedświąteczny korygujemy o wartość średniego błędu prognozy. 146 147 Zadanie Na podstawie danych zawartych w tabeli (str. 209) proszę obliczyć prognozowaną wartość sprzedaży na rok 2005 oraz skorygować wahania sezonowe dla każdego kwartału. Oszacowane równanie regresji ma postać: uwaga Xt=141,16 + 1,998t Zima 1995 to kwartał pierwszy. Wynika z tego, 148 że zima 2005 to kwartał 41. 149 1.Najpierw prognoza na zimę 2005: Xt=141,16 + 1,998t Xzima2005 =141,16 + 1,998 • 41= 223,08 2. Należy obliczyć korektę: sumujemy błędy prognozy z wszystkich zim i dzielimy przez ich liczbę (na podstawie tabeli str. 209). Suma błędów prognozy z wszystkich zim=170,28, podzielić to przez 10 zim= 17,03 150 3. Teraz należy odpowiedzieć na pytanie, czy wartości prognozowane zim były wyższe czy niższe od rzeczywistych? W przypadku zim wartości prognozowane były wyższe od rzeczywistych o +17,03. 151 Teraz możemy wyznaczyć prognozę skorygowaną: Skoro wartości prognozowane były wyższe od rzeczywistych to prognozę na zimę 2005 należy pomniejszyć o wartość o którą prognoza była wyższa, czyli 17,03. Jeśli tak to: 223,08-17,03= Prognoza na zimę 2005 206,05 Suma błędów prognozy podzielona przez liczbę zim Prognoza skorygowana 152 Teraz zróbmy prognozę oraz skorygowaną prognozę na jesień 2005 Xt=141,16 + 1,998t równanie wyjściowe uwaga Jesień 1995 to kwartał czwarty. Wynika z tego, że jesień 2005 to kwartał 44. Prognoza: ….proszę obliczyć Xjesień 2005 =141,16 + 1,998•44= 229,07 Sumujemy błędy prognozy z wszystkich jesieni i dzielimy przez ich liczbę=……. - 20,78 153 Zatem, prognoza była wyższa czy niższa od sprzedaży rzeczywistej? …….. Prognoza była zaniżona o (-20, 78). Co zatem należy zrobić ?............. Prognozę należy skorygować in plus. 229,07+20,78= 249,85 154 Prognozy do obliczenia Prognoza sprzedaży na rok 2005 Prognoza była wyższa/niższa od sprzedaży rzeczywistej Prognoza skorygowana zima 223,08 Wyższa 223,08-17,03= 206,05 wiosna 225,08 Wyższa 225,08-3,53= 221,55 lato 227,07 Wyższa 227,07-0,22= 226,85 jesień 229,07 Niższa 229,07+20,78= 249,85 155 Zmiany sezonowe – zmienne zero jedynkowe • Inną metoda uwzględniania czynnika sezonowego jest wprowadzenie do równania regresji zmiennych zero - jedynkowych dla poszczególnych kwartałów. • Równanie regresji zapisujemy wówczas następująco: 156 Zmiany sezonowe – zmienne zero jedynkowe zima wiosna lato jesień Xt= bt + cW + dS + eU + fF gdzie: b, c, d, e, f - to parametry, które chcemy oszacować Xt, t, W, S, U, F to zmienne objaśniające, dotyczą one kolejnych sezonów (kwartałów) 157 • Określenie: zmienne zero - jedynkowe oznacza, że mogą one przyjmować wyłącznie wartości 0 lub 1. wartość 1 nadaje się prognozowanemu sezonowi 158 • N.p. zmienna W oznaczająca sezon zimowy przyjmuje wartość 1 dla kwartału zimowego (pierwszego kwartału w każdym roku) a dla pozostałych kwartałów przyjmuje się 0. 159 • Następnie według równania wyznacza się prognozę sprzedaży na zimę następnego roku. • Podobnie postępuje się obliczając prognozę na pozostałe kwartały tzn., wartość 1 nadaje się prognozowanemu sezonowi. 160 • Jeśli oszacowanie równanie regresji ma postać: Xt= 1,89t + 126,24W + 139,85S + 143,26U + 164,38F a sporządzić chcemy prognozę na sezon zimowy 2005 wystarczy podstawić: t=41 (czterdziesty pierwszy kwartał) W=1 (prognoza na zimę) S=U=F=0 Obliczona w ten sposób wielkość sprzedaży wynosi:… Xt= 1,89*41 + 126,24*1 + 139,85*0 + 143,26*0 + 164,38*0 Xt= 203,73 161 Zmiany sezonowe – metoda barometrów – czyli barometry koniunktury • Barometrami koniunktury – określa się zestaw odpowiednio dobranych wskaźników statystycznych, czułych na wahania koniunktury. 162 • Inaczej: są to narzędzia, dzięki którym obserwować można bieżące wahania koniunktury, umożliwiające prognozowanie. 163 • W Polsce badaniem koniunktury zajmuje się m.in. Instytut Badań nad Gospodarką Rynkową, który szacuje, jak i prognozuje dane (m.in. dotyczące PKB, popytu krajowego, inwestycji, zatrudnienia i bezrobocia) wykorzystywane przy sporządzaniu barometru koniunktury dla polskiej gospodarki. 164 Najistotniejsze cechy barometrów: • Budowane na podstawie głównie danych statystycznych, a przesłanką prognozy są analogie historyczne (sekwencje zmian cyklicznych jakie występowały w przeszłości); 165 • Barometry służą dokonywaniu bieżącej oceny sytuacji gospodarczej oraz krótkookresowej prognozy (najwyżej kilkumiesięcznej); 166 ZALETY BAROMETRÓW KONIUNKTURY • Małe prawdopodobieństwo uzyskania błędnych informacji (dzięki zastosowaniu w ocenach i prognozach koncepcji wskaźników złożonych); • Duża częstotliwość i regularność uzyskiwania informacji; • Stosunkowo prosta metodologia (np. na tle modeli ekonometrycznych) 167 BAROMETR KONIUNKTURY IRG SGH http://www.sgh.waw.pl/instytuty/irg/aktualnosci/barometr • Syntetyczną miarą koniunktury jest barometr IRG SGH, tworzony na podstawie wskaźników koniunktury dla siedmiu obszarów gospodarki objętych badaniami. 168 Obszary badawcze • BADANIE KONIUNKTURY W PRZEMYŚLE Autorzy badania: prof. dr hab. Elżbieta Adamowicz, dr Konrad Walczyk wyniki badań... • BADANIE KONIUNKTURY W BUDOWNICTWIE Autor badania: prof. dr hab. Maria Podgórska wyniki badań... • BADANIE KONDYCJI GOSPODARSTW DOMOWYCH Autor badania: dr Sławomir Dudek wyniki badań... • BADANIE KONIUNKTURY W HANDLU Autor badania: dr Katarzyna Majchrzak wyniki badań... • BADANIE KONIUNKTURY W BANKOWOŚCI Autorzy badania: dr Piotr Białowolski, mgr Sebastian Stolorz wyniki badań... • BADANIE KONIUNKTURY W ROLNICTWIE Autor badania: prof. dr hab. Eugeniusz Gorzelak, mgr Zdzisław Zimny wyniki badań... • BADANIE KONIUNKTURY NA RYNKU CONSUMER FINANCE Projekt badawczy KPF oraz IRG SGH Autorzy badania: dr Piotr Białowolski, dr Sławomir Dudek wyniki badań... • BAROMETR KONIUNKTURY IRG SGH Autorzy badania: prof. dr hab. Elżbieta Adamowicz, dr Joanna Klimkowska wyniki badań... • http://www.sgh.waw.pl/instytuty/irg/wyniki_badan/ 169 Barometr koniunktury IRG SGH http://kolegia.sgh.waw.pl/pl/KAE/struktura/IRG/koniunktura/Strony/barometr.aspx • Wyniki badań IV kwartał 2012 • W IV kwartale 2012 miało miejsce pogorszenie aktywności gospodarczej w Polsce. Wartość barometru IRG SGH spadła pod wpływem oddziaływania czynników sezonowych. Pogłębia się pesymizm przedsiębiorców i konsumentów. 170 Barometr koniunktury IRG SGH http://kolegia.sgh.waw.pl/pl/KAE/struktura/IRG/koniunktura/Strony/barometr.aspx • Wyniki badań IV kwartał 2014 • W IV kwartale 2014 wartość barometru IRG SGH jest nadal ujemna. Przewidywania przedsiębiorców na kolejne miesiące nie są optymistyczne. Gospodarka jest pod silnym wpływem sytuacji politycznej, która blokuje pojawiające się tendencje wzrostowe. 171 • W IV kwartale 2015 wartość barometru IRG SGH zwiększyła się, ale nadal pozostaje ujemna. Ustało pozytywne oddziaływanie czynników sezonowych, co spowodowało pogorszenie koniunktury prawie we wszystkich sektorach, poza gospodarstwami domowymi i sektorem bankowym. Przewidywania przedsiębiorców na kolejne miesiące są mniej pesymistyczne niż w poprzednim 172 badaniu. http://kolegia.sgh.waw.pl/pl/KAE/struktura/IRG/koniunktura/Strony/barometr.aspx 173 Prognoza na IV kwartał 2016 http://kolegia.sgh.waw.pl/pl/KAE/struktura/I RG/koniunktura/Strony/barometr.aspx 174 Kwartalne prognozy makroekonomiczne pdf. 175 Prognozy wzrostu PKB w Polsce na lata 2012-2014 (dane w %) 176 • Wskaźniki makroekonomiczne http://www.bankier.pl/gospodarka/wskazniki-makroekonomiczne/polska 177 MODELE EKONOMETRYCZNE Modelem ekonometrycznym nazywamy układ oszacowanych równań, opisujących relacje między zmiennymi ekonomicznymi. 178 MODELE EKONOMETRYCZNE – zalety w porównaniu z innymi metodami prognozowania 1.Określają bezpośrednio ilościowe powiązania między zmiennymi w przeciwieństwie do metod opartych na analizie szeregów czasowych, które ekstrapolują na przyszłość tendencje zaobserwowane w poprzednich okresach. 179 2.Modele makroekonomiczne dają całościowy i spójny obraz gospodarki. Pozwalają one prognozować większość zmiennych makroekonomicznych określających ogólny stan gospodarki. 180 3.Modele ekonometryczne uwzględniają współzależności istniejące między różnymi zmiennymi ekonomicznymi np: Wielkość produkcji przedsiębiorstw zależy od popytu na produkowane towary. Popyt zaś zależy od poziomu dochodów konsumentów, które z kolei są zależne od poziomu płac i rozmiarów zatrudnienia, te natomiast zależą od ogólnej wielkości produkcji. 181 WNIOSEK: Modele ekonometryczne umożliwiają pełniejszy wgląd w funkcjonowanie gospodarki i bardziej dokładne prognozowanie sytuacji w poszczególnych gałęziach. 182 Model ekonometryczny: prosty model makroekonomiczny Yt - Wartość produkcji wytworzonej w całej gospodarce (PKB) • • • • • • Ct - Wydatki It - Prywatne konsumpcyjne wydatki ludności inwestycyjne Gt - Wydatki państwa Yt = Ct + It + Gt + Xt – Mt Ct = a + b ( Yt – Tt) + dPt-1 Tt = e + fYt It = h + jYt-1 + kRt Mt = n + qYt Pt = s + uYt + vPt-1 Xt - Eksport Mt- Import (1) (2) (3) (4) (5) (6) 183 prosty model makroekonomiczny Yt = Ct + It + Gt + Xt – Mt • Równanie (1) jest zwane tożsamością tzn. pokazuje zależność, która jest zawsze spełniona z definicji. Wzrost wydatków w każdej z czterech kategorii (C,I,G,X) powoduje zwiększenie produkcji w kraju. 184 prosty model makroekonomiczny Pozostałe równania wymagają oszacowania za pomocą metod regresji. Są to równania behawioralne, które opisują zachowanie się w przeszłości poszczególnych strumieni wydatków jako funkcji zmiennych objaśniających, uwidocznionych po prawej stronie równań. 185 Ct = a + b ( Yt – Tt) + dPt-1 • Równanie (2) opisuje funkcję konsumpcji. Planowane wydatki konsumpcyjne zależą od wysokości dochodu Y po potrąceniu podatków T. • Równanie to wskazuje również, że wielkość konsumpcji zależy od poziomu cen w poprzednim okresie Pt-1. 186 Tt = e + fYt • Równanie (3) opisuje jednokierunkową zależność podatków i dochodu. Suma podatków rośnie wraz ze wzrostem dochodu. 187 It = h + jYt-1 + kRt • Równanie (4) mówi nam, że planowane inwestycje zależą od łącznej wartości produkcji wytworzonej oraz od poziomu stóp procentowych R. 188 Mt = n + qYt • Z równania (5) wynika, że pewna część wartości produkcji wytworzonej (PKB) jest wydawana na zakup towarów importowanych. 189 Pt = s + uYt + vPt-1 • Zgodnie z równaniem (6) obecny poziom cen zależy od poziomu cen w poprzednim okresie oraz od obecnej wielkości produkcji. Na tym etapie można powiedzieć, że został sformułowany ogólny model gospodarki. 190 • Kolejnym krokiem w budowie modelu ekonometrycznego jest oszacowanie tego modelu za pomocą odpowiedniej metody regresji. 191 • W wyniku regresji otrzymujemy oceny parametrów oznaczone symbolami od a do v. • Otrzymamy również dodatkowe wskaźniki jakości regresji, czyli wartości statystyk F i t oraz wartość R2 dla każdego równania. 192 • Po dokonaniu estymacji wszystkich równań i porównaniu wartości odczytanych z modelu z wartościami rzeczywistymi należy stwierdzić, czy model dostatecznie dobrze odzwierciedla obserwowaną rzeczywistość i czy ma sens ekonomiczny. 193 • Następnym krokiem jest przekształcenie modelu do postaci nadającej się do prognozowania. • W tym celu należy rozwiązać układ równań równoczesnych i sprowadzić je do postaci zredukowanej. 194 • W naszym modelu szukamy rozwiązania dla Y tzn. wyznaczamy wolumen produkcji od którego zależą wszystkie inne zmienne. • Podstawiamy więc wszystkie równania behawioralne do równania (1), czyli równania tożsamości i otrzymujemy: 195 Y=a+b(Y-e-fY)+dP-1+h+jY-1+kR+G+X-n -qY Porządkujemy równanie przenosząc wszystkie zmienne z Y na lewą stronę i otrzymujemy: a – be + dP-1 + h + jY-1 + kR – n +G + X Y= 1-b(1-f)q 196 Dla jasności zapisu w równaniu pominięto subskrypt t. W jaki sposób wykorzystać to równanie w prognozie? • Załóżmy, że chcemy przewidzieć, jaki będzie wolumen produkcji w następnym okresie? • Do naszego równania należy postawić: otrzymane w wyniku regresji oceny parametrów a do q, oraz znane wartości P-1 i Y-1 czyli obecny poziom cen i obecną wielkość produkcji. 197 • Pozostaje jeszcze wprowadzenie do równania przyszłych wartości zmiennych R, G, X – są to zmienne egzogeniczne, czyli takie, których wartości określone są poza modelem (często wartości te są znane). 198 Na tym kończymy wątek związany z prognozowaniem 199